通过Excel获取数据源的⼏种⽅式
巧妇难为⽆⽶之炊,没有数据就没法进⾏数据分析,所以数据的获取很重要。
unicode文件格式内部数据的读⼊
Excel存储的格式有许多种,那么不同版本的Excel能否打开这些格式存储的⽂件呢?
这就要简单了解⼀下Excel⽂件的扩展名和兼容性了。
由于Excel版本不断更新,每个版本存储⽂件的扩展名也有⼀定的区别,通常接触到的数据表是以.xls、.xlsx和.csv为扩展名存储的⽂件:
.xls扩展名是Excel 2003及以前版本默认的格式;
.xlsx扩展名是Excel 2007及以上版本默认的格式;
.csv扩展名是以逗号等分隔存储的格式;
⼀般情况下,Excel都是可以向下兼容的,即Excel 2007版本可以正常打开且读⼊Excel 2003版本格式的数据,但Excel 2003版本不⼀定能正常读⼊Excel 2007版本格式的数据。这也很好理解,版本在不断更
新的过程中,功能也在不断变化。本书使⽤Excel 2016版本,所以默认
以.xlsx为扩展名存储。
如果是以.csv格式存储的⽂件,在使⽤记事本打开后,可以看到数据之间以半⾓逗号(即⽤英⽂状态下的逗号)进⾏分隔。.csv存储格式经常⽤在Python及数据库的读写中,因此,在⽤Excel进⾏数据分析时,常常会拿到.csv格式的数据。在使⽤该格式的数据时,可能会遇到以下问题:
(1)Excel打开.csv⽂件时出现乱码
.csv⽂件格式是⼀种存储数据的纯⽂本格式。Excel默认是采⽤ANSI编码,如果从数据库中导出的.csv⽂件的编码⽅式为UTF-8或Unicode等其他编码,⽤Excel打开.csv⽂件就可能会出现乱码的情况,这时只需要将⽂件另存,同时将编码⽅式改成ANSI,再⽤Excel打开就不会出现乱码了。
(2)Excel存储成.csv格式后丢失Sheet⼯作表
.csv格式只能保存当前⼯作表中的⽂本数值,也就是说,如果⼀个Excel⼯作簿有多个Sheet⼯作表,存储为.csv格式后只能保存当前显⽰的⼯作表,其他⼯作表会因为⽆法被存储⽽丢失。所以在处理.csv格式⽂件的时候,要注意避免新增Sheet⼯作表。
外部数据的获取
(1)从⽂本获取外部数据
除了获取内部数据外,还有从外部获取数据的情况。有时候,数据是以⽂本形式(.txt)来存储的。如果我们想要将其导⼊Excel中,可以单击【数据】→【获取外部数据】→【⾃⽂本】按钮来获取。
图(1):获取外部⽂本数据
⽂件类型选择默认的以分隔符号划分,分隔符号保持勾选默认的【Tab键】,即可完成导⼊。也可以直接使⽤复制和粘贴的⽅式。打开.txt⽂件,全选并复制,然后粘贴到Excel中,效果和外部⽂本相同。
(2)从⽹站获取外部数据
除了从⽂本获取数据外,还可以直接从⽹站获取数据。
Step1:单击【数据】→【获取外部数据】→【⾃⽹站】按钮;
Step2:选择⼀个想要获取数据的⽹站,将⽹址输⼊Excel内置的链接中,单击【转到】按钮,Excel会⾃动选取⽹页上的数据,选择想要的数据,单击【导⼊】按钮即可;
(3)从数据库获取外部数据
数据库,即⽤来存储和管理数据的库,常⽤的数据库有Access、SQL Server、MySQL、Oracle等。除了前⾯提到的⾃⽂本和⽹站获取外部数据的⽅法,还可以从数据库获取外部数据。
**从SQL Server获取数据:Microsoft SQL Server也是微软公司推出的关系型数据库管理系统。相⽐Access,SQL Server更适合存储海量数据,其在数据处理的性能上也优于Access。可以说,它是理想的⼤型数据库存储⼯具。向Excel中导⼊SQL Server数据的前提是计算机中安装了Microsoft SQL Server软件,导⼊SQL Server数据的具体操作如下。Step1:单击【数据】→【获取外部数据】→【⾃其他来源】→【来⾃SQL Server】按钮;
Step2:在弹出的【数据连接向导】对话框中输⼊服务器名称(服务器名称即此台计算机名,右击【我的电脑】,单击【属性】选项,在打开的对话框中可以看到),登录凭据选择【使⽤Windows验证】
选项,单击【下⼀步】按钮;
Step3:此时Excel已经和SQL Server连接上了,SQL Server⾥的数据可以被Excel导⼊。在弹出的下⼀个【数据连接向导】对话框中,可以选择要导⼊的数据库。这⾥选择要导⼊数据,单击【完成】按钮;
Step4:在弹出的【导⼊数据】对话框中选择以【表】的形式显⽰,单击【确定】按钮,。SQL Server中的数据就导⼊Excel⾥了;
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论