python写抓取_⽤python抓取“3d”数据,怎么分析你
说了算!
快下班了,正好准备去买,就顺⼿写了2个脚本,⼀个⽤来下载最近的数据,⼀个⽤来统计数字,分享给⼤家!
数据获取并写⼊excel表格
数据来源⾃⼰看吧~⽤外链通不过。。。
所⽤库:xlwt,requests,lxml
python怎么读取excel的数据有⼏点需要注意的:
1、构建列表。因为存⼊excel⽂件的时候⽤的是列表,所以新建⼀个函数,分别取⽹页5个数据:时间、期数、开奖数123,然后每⼀页嵌套写⼊列表类似结构为[[时间、期数、开奖数1,2,3],[时间、期数、开奖数1,2,3]……],在循环页数,获取所有的数据!注意构建列表的形式和列表结果,这个在你写⼊表格的时候很重要!
2、写⼊数据。xlwt写⼊⽂件的⽅法为ws.write(⾏,列,数据),按⾏写⼊⽂件,所以新建⼀个变量line(代码第36⾏),每写⼊⼀⾏⾃增1。
其他⽅⾯都很简单,没有反爬,就是为了获取数据,好做分析!
最后excel表中的数据是这样的:
最后⼤概有4840⾏数据,⾜够我们分析的了!
数据处理
⽤xlrd库就可以~话说xlwt库和xlrd库好像就是⼀个写数据,⼀个读数据。。。
就写了⼀个抓热门数字的,也就是取频率最⾼的。如果您有更好的想法或者玩法,可以⾃⾏去实现哦!
先读取数据,然后取到每⼀⾏的2.3.4列,每⼀列写⼊⼀个列表(现在有些后悔,不该写那么多数据进来),然后3个列表合并⼀个总列表,这样我们就有了4个列表,取出每⼀个列表中出现次数最多的那个数字,代码如下:
第1个数字频率最⾼的是 [3]
第2个数字频率最⾼的是 [6]
第3个数字频率最⾼的是 [8]
单个数字频率最⾼的是 [3]
因为赶时间下班。。就全部⽤了列表推导式,也没有⽤pandas库或者可视化库做出很炫酷的图表,等我研究出完美的预测⽅案的时候在做【⼿动哭泣】,不过依现在的趋势,是没什么希望了。。。
最后要说的是,从开始研究分析各种数据到现在习惯性的买,没中过⼤奖(超过200的都算⼤奖)!果然童话都是骗⼈的……还是学python⽐较好玩!
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论