python读取sas数据集_利⽤Python获取SAS和R⾃带数据集图:北京-奥森公园-2018年4⽉
⽆论是SAS、R还是Python,本⾝都⾃带⼀些数据集,对于初学者来说,可以通过这些⾃带的⼩数据集进⾏编程练习,⽆疑是⾮常⽅便的。SAS、R作为统计分析软件,本⾝⾃带的数据集较为丰富,⽽Python⾃带的数据集则相对较少,只有6、7个,存在于机器学习sklearn.datasets模块中。
如何利⽤Python获取到SAS和R⾃带的数据集呢?
⽅法⼤概有下⾯这⼏种:
将SAS、R数据集导出为txt,csv,excel等格式,再通过Python读取;
python怎么读文件夹下的文件夹
利⽤ad_sas()直接读取SAS的数据集⽂件;
Python调⽤XXX,或者XXX调⽤Python?安装配置复杂,容易出问题;
使⽤SAS、R将⾃带数据集⼀次性写⼊MySQL,再通过Python读取;
从复⽤性和学习的⾓度,这⾥采⽤上⾯的第四种⽅法实现。
1、配置MySQL ODBC数据源
在“控制⾯板”-“管理⼯具”-“ODBC数据源”中添加,如下图所⽰:
配置MySQL的连接参数,配置好点击test测试⼀下是否成功。
2、将SAS⾃带数据集导⼊MySQL
将SAS数据集写⼊MySQL⽐较简单暴⼒,直接copy库即可,期间可能会报错,但这不影响proc copy的执⾏。导⼊完毕后,在MySQL客户端中,通过show tables可以查看所导⼊的全部表名称。当然,也可以通过在SAS中连接MySQL进⾏查看。
3、将R⾃带数据集导⼊MySQL
将R全部数据集写⼊MySQL的操作过程,通过循环来实现,并使⽤try函数跳过错误,同Python的try⽅法有异曲同⼯之处。
4、使⽤python读取MySQL数据
如下通过sqlalchemy模块的create_engine创建数据库连接,进⾏简单的数据库读写操作。
注:导⼊create_engine的过程中可能会报错:
1、如果提⽰No module named MYSQLdb,则需要安装mysqlclient模块(Windows);
2、如果安装过程中提⽰pyasn1-modules有问题,且pip uninstall pyasn1⽆法卸载时,可以⼿动删除pyasn1相关的⽂件和⽂件夹,然后重新安装:pip install pyasn1-modules。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。