林天宇用Python3学习编写网络爬虫(之一)--688IT编程网

林天宇用Python3学习编写网络爬虫

（之一：入门实践）

作者：***

一、写在前面

1、本文适应的读者范围

●会一点点Python的基本语法；

●已经安装好了Python3和PyCharm；

python网络爬虫书籍推荐●网络爬虫新手

2、本文所使用的开发环境

●Mac pro / iOS

●Python3

●PyCharm

3、本文不纠结以下内容

●为什么选择Python3而不是Python2？

答：没什么特别原因，个人喜好。

●如何安装Pyhon3？

请查阅其他文档。

●PyCharm是什么？为什么不用其他工具。

一个常用的Python开发工具，个人喜欢，可参阅其他文档。如果你不喜欢，你也可以用其他工具编码和调试。

二、快速开始

东北人有句话说：能动手，尽量不瞎叨叨。少些废话，快速开干。

1、新建项目和文件

启动PyCharm，“Create New Project”。

因为估计不需要到特别的框架，所以类型就默认地选择了“Pure Python”，名字就起成了“WebSpider”（我瞎命名的，就是觉得Spider比较帅气而已），然后“Create”如下图：

新建一个Python文件，命名为Spider001，毕竟也是我的第一只小爬虫嘛。

OK，到目前为止，已经新建一个名字叫做Spider001的Python空白文件了。

可以在项目等资源管理器中看到WebSpider项目下面，有一个Sider001.py的文件。我们接下来就对这个Sider001.py文件进行编辑和测试。

2、第一爬

先写代码，感受一下效果，成就感，然后再详细分析和思考。

代码如下：

quest

url = "www.baidu"

data = quest.urlopen(url).read()

data = data.decode('UTF-8')

print(data)

然后，Run，选择Spider001.py，运行结果如下：

由上图可以见，运行正常，而且已经将百度的HTML代码获取到了（见运行窗口的第二行HTML代码）。百度心想，我也不知道倒了什么霉，你们爬虫测试的HelloWorld都喜欢拿我测试，无谓增加我压力。

688IT编程网

林天宇用Python3学习编写网络爬虫(之一)

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

林天宇用Python3学习编写网络爬虫(之一)

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式