python简单爬⾍(spider)环境配置1、安装Python3.7:
注:安装完后,检查 python的两个环境变量:
C:\Users\Administrator\AppData\Local\Programs\Python\Python37
爬虫软件 appC:\Users\Administrator\AppData\Local\Programs\Python\Python37\Scripts
2、使⽤PIP安装Jupyter Notebook:
#### 使⽤阿⾥云作为python包下载的镜像地址,可以提⾼下载速度。
#### 使⽤阿⾥云作为python包下载的镜像地址,可以提⾼下载速度。
2.1 进⼊⽤户⽬录
2.2.创键 pip ⽂件夹
2.3.创建⽂件名为 pip.ini 的配置⽂件(注:⽂件后缀为.ini)
2.4.添加内容
>>>>>>>>###grep是一条什么命令
[global]
[install]
trusted-host=mirrors.aliyun
>>>>>>>>##
2.5.运⾏命令
pip install jupyter
3、使⽤PIP安装selenium:
java多线程教程pip install selenium
电脑软件editor4、使⽤PIP安装BS4:
pip install beautifulsoup4
5、使⽤PIP安装信赖项:
pip install tinydb urllib3 xlsxwriter lxml
6、下载geckodriver:
解压到firefox根⽬录,再将此⽬录添加到环境变量path:
( 没有这⼀步,运⾏firefox headless时,会报错)
7、启动 jupyter notebook:
CMD窗⼝下输⼊:jupyter notebook
git pull request8、配置 Jupyter notebook:
8.1 ⽣成jupyter配置⽂件:
jupyter notebook --generate-config
程序设计语言通常划分为高级语言和低级语言8.2 修改配置⽂件:
打开“.jupyter”⽂件夹下的配置⽂件 jupyter_notebook_config.py,到
“book_dir=……”,把路径改成⾃⼰的⼯作⽬录。
配置⽂件修改完成后, 以后在jupyter notebook中写的代码等都会保存在⾃⼰创建的⽬录中。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
面向网络爬虫的智能拦截系统
« 上一篇
网络爬虫技术滥用的刑事责任
下一篇 »
发表评论