如何使用Python和BeautifulSoup抓取任何网站(动态网页)--688IT编程网

如何使⽤Python和BeautifulSoup抓取任何⽹站（动态⽹页）我们现在将学习如何处理⽹页或有很多功能的⽹页，⽽不仅仅是 HTML/CSS。这些页⾯⽤beautifulsoup 爬取⽐较棘⼿，因为有时代码发⽣在服务器端，⽽beautifulsoup 需要让浏览器运⾏它。

如果有⼀种⽅法可以让我们编写代码并让我们的代码假装它是浏览器，那岂不是很好？……恰好，这正是本⽂要讨论的内容！

现在，我第⼀次在读到了这，并且我⼀直在这篇⽂章中更专注于确切的实现，因此有关更多详细信息，请务必查看！

1. 下载 Chrome 或 Firefox

⽬前我所知道的只有这两个具有此功能，因此请务必使⽤其中之⼀。在本⽂中，我们使⽤。

2. 下载⽹络驱动程序

我们将使⽤的⽹络驱动程序是，您可以在该链接的底部到所有下载。下载后，从下载中提取⽂件（只需双击 zip ⽂件）。

Web 驱动程序有点挑剔，并且在操作系统上运⾏

得不太好，因此我们需要：将 geckodriver 移动到可执⾏路径所在的位置。请查看以了解如何使⽤ Windows 进⾏操作。

我们可以通过运⾏来出我们的可执⾏路径在哪⾥：

selenium怎么使用

然后我们可以：

1. cp geckodriver ⽂件从 zip 到您的$PATH变量告诉您的位置之⼀（运⾏后echo $PATH）

2. $PATH向您的$PATH环境变量添加⼀个新位置，并将可执⾏⽂件 geckodriver 放⼊其中。项⽬地址：

然后重新启动终端以使更改⽣效。如果您使⽤的是 MacOS（我就是），您可能还需要对应⽤程序进⾏。你可以通过运⾏来做到这⼀点：

3.开始⽤python编码！

运⾏后：pip install selenium，您现在可以开始使⽤⽹络驱动程序了！⽽不是拉动动态⽹页⽹址，你会拉动它，像这样：

发表评论

688IT编程网

如何使用Python和BeautifulSoup抓取任何网站(动态网页)

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

如何使用Python和BeautifulSoup抓取任何网站(动态网页)

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式