Python网络爬虫程序技术(微课版)教案
项目1 爬取外汇网站数据
课时内容授课时间课时
Web网站与访问90分钟讲授4
实践4
教学目标
教学重点
学习编写一个爬虫程序,通过正则表达式匹配的方法爬取模拟外汇网站的汇率数据。
教学难点
认识爬虫程序,搭建爬虫程序开发环境。
认识Flask并使用Flask创建Web网站。
学习使用GET方法访问网页。
学习使用POST方法访问网页。
掌握正则表达式选取数据的规则。
教学设计
1.教学思路:(1)通过讲解Flask、GET方法、POST方法等相关知识,让学生了解爬虫程序的概况;(2)讲解制作模拟外汇网站的爬取,让学生掌握上述知识点的基本操作;(3)安排练习爬取实际外汇网站,巩固学生掌握的技能。
2. 教学手段:(1)通过讲解基础知识,讲解结束后开始实践并进行疑难解答;(2)通过实战项目,让学生掌握爬虫程序在实际工作中的相关应用。
3. 教学要求:可对实际外汇网站进行爬取,让学生了解爬虫爬取外汇网站应该掌握的技能。
教学内容
1.1 外汇网站项目任务
1.2.1理解爬虫程序
1.2.2搭建开发环境
1.3.1 安装Flask框架
1.3.2创建模拟外汇网站
1.3.3获取网站HTML代码
1.4.1客户端GET方式发送数据
1.4.2服务器获取GET发送的数据
1.5.1客户端POST发送数据
1.5.2服务器获取POST的数据
1.5.3 混合使用GET与POST
1.6.1 使用正则表达式匹配字符串
1.6.2 使用正则表达式爬取数据
1.7 综合项目——爬取模拟外汇网站数据
1.7.1 创建模拟外汇网站
1.7.2 解析网站HTML代码
1.7.3 设计存储数据库
1.7.4 编写爬虫程序
1.7.5 执行爬虫程序
1.8 实战项目——爬取实际外汇网站数据
1.8.1 解析网页HTML代码
1.8.2 爬取网页外汇数据
1.8.3 设计存储数据库
1.8.4 编写爬虫程序
1.8.5 执行爬虫程序
小结
掌握了使用正则表达式对网站的网页进行解析,得到所需数据,实现了爬取网站外汇汇率数据的爬虫程序。
课程安排
课程实践环境
Python3.6 + vsCode IDE
教材及参考书
教材《Python爬虫项目教程》(微课版),黄锐军编,人民邮电出版社,2021年
参考书《数据采集技术-Python网络爬虫项目化教程》,黄锐军编,高等教育出版社,2018年
Python网络爬虫程序技术(微课版)配套教案
项目2 爬取名言网站数据
课时内容授课时间课时
网页数据爬取方法90分钟讲授4
实践6
教学目标
教学重点
学习使用BeautifulSoup对网站的网页进行解析并得到所要的数据。
教学难点
学习使用BeautifulSoup装载文档。
学习从文档树中解析或者爬取所要的数据的方法。
学习使用BeautifulSoup遍历文档元素。
教学设计
1.教学思路:(1)通过讲解BeautifulSoup爬取数据等相关知识,让学生了解BeautifulSoup;(2)讲解制作模拟名言网站的爬取,让学生掌握上述知识点的基本操作;(3)安排练习爬取实际名言网站,巩固学生掌握的技能。
2. 教学手段:(1)讲解基础知识,讲解结束后开始实践并进行疑难解答;(2)通过实战项目,让学生掌握爬虫程序在实际工作中的相关应用。
3. 教学要求:可对实际名言网站进行爬取,让学生了解爬取名言网站应该掌握的技能。
python新建项目教程教学内容
1.1名言网站项目任务
1.2 BeautifulSoup装载HTML文档
1.2.1 创建模拟名言网站
1.2.2 安装BeautifulSoup库
1.2.3 BeautifulSoup装载HTML文档
1.3 BeautifulSoup查HTML元素
1.3.1 使用find函数查
1.3.2 查元素属性与文本
1.3.3 使用find_all函数查
1.3.4 使用高级查
1.4 BeautifulSoup遍历文档元素
1.4.1 获取元素节点的父节点
1.4.2 获取元素节点的直接子元素节点
1.4.3 获取元素节点的所有子孙元素节点
1.4.4 获取元素节点的兄弟节点
1.5 BeautifulSoup使用CSS语法查
1.5.1 使用CSS语法查
1.5.2 使用属性的语法规则
1.5.3 select查子孙节点
1.5.4 select查直接子节点
1.5.5 select查兄弟节点
1.5.6 select_one查单一元素
1.6综合项目爬取模拟名言网站数据
1.6.1 创建模拟名言网站
1.6.2 爬取名言数据
1.6.3 设计存储数据库
1.6.4 编写爬虫程序
1.6.5 执行爬虫程序
1.7实战项目爬取实际名言网站数据
1.7.1 解析网站HTML代码
1.7.2 爬取全部页面的数据
1.7.3 编写爬虫程序
1.7.4 执行爬虫程序
小结
掌握了使用BeautifulSoup对网站的网页进行解析并得到所要的数据,实现了爬取网站数据的爬虫程序。
课程安排
课程实践环境
Python3.6 + vsCode IDE
教材及参考书
教材《Python爬虫项目教程》(微课版),黄锐军编,人民邮电出版社,2021年
参考书《数据采集技术-Python网络爬虫项目化教程》,黄锐军编,高等教育出版社,2018年Python网络爬虫程序技术(微课版)配套教案
项目3 爬取电影网站数据
课时内容授课时间课时
网站数据爬取路径90分钟讲授4
实践4
教学目标
教学重点
学习使用递归、深度优先、广度优先等方法爬取各个网页的数据。
教学难点
设计爬虫程序,爬取图像等复杂数据。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论