centos7中配置python爬虫selenium+chromium+chromedri。。。

centos7中配置python爬⾍selenium+chromium+chromedri。。

。

今天为了爬取某异步加载⽹站的数据，开始⾃学了selenium，不得不说selenium还是很⽅便的⼯具，适合⽆脑爬取异步加载的⽹站。⾸先我在⾃⼰的windows电脑下配置了selenium和chromedriver的chrome浏览器内核，正常调试好程序后准备部署到centos7服务器上，但是遇到了很多问题，不停报错，在踩了很多雷以后终于可以完美部署selenium+chromium+chromedriver环境顺利爬⾍了！

接下来我就详细介绍下正确的配置⽅式

1. 安装selenium：这⼀步⽐较简单，直接pip安装就⾏：

pip install selenium

2. 安装chromium：由于⾕歌chrome并不⽀持linux，也就更不⽀持centos了，所以需要安装chromium，不过不⽤担⼼，chromium也是⾕

歌的开源项⽬，与chrome并没有太⼤的区别

yum install chromium

这⼀步也没什么问题，需要注意⼀下chromium安装的版本，因为要与下⼀步需要安装的chromedriver版本相适配，⼆者版本不同都会报错，这⾥我也是踩雷了，chromium默认安装的最新版为“79.0.3945.130-1.el7”，但是chromedriver已经更新到了81.0，第⼀次安装的时候我选择了最⾼版本的chromedriver，但是chromium还是79.0版本，执⾏python脚本的时候就报错版本不适配，所以我重新安装了对应版本的chromedriver。

如何查看安装的chromium版本？yum就可以看到

yum list installed

3. 安装chromedriver：这⾥我们从taobao镜像站点安装：

# 下载对应版本的chromedriver

wget /mirrors/chromedriver/79.0.3945.16/chromedriver_linux64.zip

# 解压

unzip chromedriver_linux64.zip

# 把chromedriver移动到系统⽬录

mv chromedriver /usr/bin

⽅法2：直接yum安装，这样其实更省事⼉⼀点

yum chromedriver

安装完成后确认⼀下版本与chromium保持⼀致：

到这⼀步已经配置好selenium+chromium+chromedriver的环境了，接下来我们写⼀个最简单的python脚本试⼀下！

from selenium import webdriver

from selenium.webdriver.chrome.options import Options # 导⼊浏览器内核设置，主要是为了设置⽆头（headless）模式

url = 'www.baidu'

chrome_options = Options()

chrome_options.add_argument('--headless') # 设置Chrome为⽆头模式

chrome直接下载

driver = webdriver.Chrome(options=chrome_options)

<(url)

driver.close()

诶，报错了：The process started from chrome location /usr/lib64/chromium-browser/chromium-browser is no longer running, so ChromeDriver is assuming that Chrome has crashed

在脚本上加上两句话：

option.add_argument('no-sandbox')

option.add_argument('disable-dev-shm-usage')

完美解决了！

688IT编程网

centos7中配置python爬虫selenium+chromium+chromedri。。。_百度文 ...

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

centos7中配置python爬虫selenium+chromium+chromedri。。。_百度文 ...

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行