pycharm网络爬虫心得体会
python网络爬虫书籍推荐这书比较新,我平时所学习的python爬虫知识基本都是在知乎跟网上一些视频教学一点点拼凑起来,感觉就是什么都懂一部分却好像连贯不起来,因为编程风格都是因人而异的,在爬取库时候像有些人用urllib有些用requests,在获取页面信息有些用lxml也有些用beautifulsoup,后面还有cookies、表单、模拟登陆等,大家学习爬虫就是不连贯,范围广,对于我来说有时候就很容易混乱了。大家先看看这本书一些摘要,这书适合有一定python基础的阅读看完上面目录,这本书内容很连贯,而且关键是作者自己搭建了一个网站Example web scraping website,爬虫、数据收集、mongodb存储缓存数据、多线程多进程、动态网页、模拟注册登陆、验证码处理跟书本一应俱全,就是让学习的朋友能在一个稳定环境下去了解实践爬虫整个机制。总之这本书连贯性强,让我重新认识python爬虫!
好了,我后面把自己在学习过程中遇到的坑还有一些自己想法做个笔记,我也是新手,希望大家多多指教,有问题大家交流。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论