Python网络爬虫程序技术教案全套项目1--6 爬取外汇网站数据 ---爬取...--688IT编程网

Python网络爬虫程序技术（微课版）教案

项目1 爬取外汇网站数据

课时内容授课时间课时

Web网站与访问90分钟讲授4

实践4

教学目标

教学重点

学习编写一个爬虫程序，通过正则表达式匹配的方法爬取模拟外汇网站的汇率数据。

教学难点

认识爬虫程序，搭建爬虫程序开发环境。

认识Flask并使用Flask创建Web网站。

学习使用GET方法访问网页。

学习使用POST方法访问网页。

掌握正则表达式选取数据的规则。

教学设计

1.教学思路：（1）通过讲解Flask、GET方法、POST方法等相关知识，让学生了解爬虫程序的概况；（2）讲解制作模拟外汇网站的爬取，让学生掌握上述知识点的基本操作；（3）安排练习爬取实际外汇网站，巩固学生掌握的技能。

2. 教学手段：（1）通过讲解基础知识，讲解结束后开始实践并进行疑难解答；（2）通过实战项目，让学生掌握爬虫程序在实际工作中的相关应用。

3. 教学要求：可对实际外汇网站进行爬取，让学生了解爬虫爬取外汇网站应该掌握的技能。

教学内容

1.1 外汇网站项目任务

1.2.1理解爬虫程序

1.2.2搭建开发环境

1.3.1 安装Flask框架

1.3.2创建模拟外汇网站

1.3.3获取网站HTML代码

1.4.1客户端GET方式发送数据

1.4.2服务器获取GET发送的数据

1.5.1客户端POST发送数据

1.5.2服务器获取POST的数据

1.5.3 混合使用GET与POST

1.6.1 使用正则表达式匹配字符串

1.6.2 使用正则表达式爬取数据

1.7 综合项目——爬取模拟外汇网站数据

1.7.1 创建模拟外汇网站

1.7.2 解析网站HTML代码

1.7.3 设计存储数据库

1.7.4 编写爬虫程序

1.7.5 执行爬虫程序

1.8 实战项目——爬取实际外汇网站数据

1.8.1 解析网页HTML代码

1.8.2 爬取网页外汇数据

1.8.3 设计存储数据库

1.8.4 编写爬虫程序

1.8.5 执行爬虫程序

小结

掌握了使用正则表达式对网站的网页进行解析，得到所需数据，实现了爬取网站外汇汇率数据的爬虫程序。

课程安排

课程实践环境

Python3.6 + vsCode IDE

教材及参考书

教材《Python爬虫项目教程》（微课版），黄锐军编，人民邮电出版社，2021年

参考书《数据采集技术-Python网络爬虫项目化教程》，黄锐军编，高等教育出版社，2018年

Python网络爬虫程序技术（微课版）配套教案

项目2 爬取名言网站数据

课时内容授课时间课时

网页数据爬取方法90分钟讲授4

实践6

教学目标

教学重点

学习使用BeautifulSoup对网站的网页进行解析并得到所要的数据。

教学难点

学习使用BeautifulSoup装载文档。

学习从文档树中解析或者爬取所要的数据的方法。

学习使用BeautifulSoup遍历文档元素。

教学设计

1.教学思路：（1）通过讲解BeautifulSoup爬取数据等相关知识，让学生了解BeautifulSoup；（2）讲解制作模拟名言网站的爬取，让学生掌握上述知识点的基本操作；（3）安排练习爬取实际名言网站，巩固学生掌握的技能。

2. 教学手段：（1）讲解基础知识，讲解结束后开始实践并进行疑难解答；（2）通过实战项目，让学生掌握爬虫程序在实际工作中的相关应用。

3. 教学要求：可对实际名言网站进行爬取，让学生了解爬取名言网站应该掌握的技能。

python新建项目教程教学内容

1.1名言网站项目任务

1.2 BeautifulSoup装载HTML文档

1.2.1 创建模拟名言网站

1.2.2 安装BeautifulSoup库

1.2.3 BeautifulSoup装载HTML文档

1.3 BeautifulSoup查HTML元素

1.3.1 使用find函数查

1.3.2 查元素属性与文本

1.3.3 使用find_all函数查

1.3.4 使用高级查

1.4 BeautifulSoup遍历文档元素

1.4.1 获取元素节点的父节点

1.4.2 获取元素节点的直接子元素节点

1.4.3 获取元素节点的所有子孙元素节点

1.4.4 获取元素节点的兄弟节点

1.5 BeautifulSoup使用CSS语法查

1.5.1 使用CSS语法查

1.5.2 使用属性的语法规则

1.5.3 select查子孙节点

1.5.4 select查直接子节点

1.5.5 select查兄弟节点

1.5.6 select_one查单一元素

1.6综合项目爬取模拟名言网站数据

1.6.1 创建模拟名言网站

1.6.2 爬取名言数据

1.6.3 设计存储数据库

1.6.4 编写爬虫程序

1.6.5 执行爬虫程序

1.7实战项目爬取实际名言网站数据

1.7.1 解析网站HTML代码

1.7.2 爬取全部页面的数据

1.7.3 编写爬虫程序

1.7.4 执行爬虫程序

小结

掌握了使用BeautifulSoup对网站的网页进行解析并得到所要的数据，实现了爬取网站数据的爬虫程序。

课程安排

课程实践环境

Python3.6 + vsCode IDE

教材及参考书

教材《Python爬虫项目教程》（微课版），黄锐军编，人民邮电出版社，2021年

参考书《数据采集技术-Python网络爬虫项目化教程》，黄锐军编，高等教育出版社，2018年Python网络爬虫程序技术（微课版）配套教案

项目3 爬取电影网站数据

课时内容授课时间课时

网站数据爬取路径90分钟讲授4

实践4

教学目标

教学重点

学习使用递归、深度优先、广度优先等方法爬取各个网页的数据。

教学难点

设计爬虫程序，爬取图像等复杂数据。

688IT编程网

Python网络爬虫程序技术教案全套项目1--6 爬取外汇网站数据 ---爬取...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

Python网络爬虫程序技术 教案全套 项目1--6 爬取外汇网站数据 ---爬取...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

Python网络爬虫程序技术教案全套项目1--6 爬取外汇网站数据 ---爬取...

java正则表达式选择题

非零金额正则表达式

半小时正则表达式