课题 | 第20课二手房数据分析与房价预测需求分析 | |
课时 | 2 课时(90 min ) | |
教学目标 | 知识技能目标: (1)能够对案例进行需求分析 (2 )能根据需求对数据进行不同的预处理,选择合适的可视化图形进行分析和展示,并选择合适 的相关变量进行预测 (3)练习使用Pandas处理异常值、重复值、缺失值,离散化连续数据和编码字符型数据等 素质目标: (1)养成分析问题、事前规划的良好习惯 | |
教学重难点 | 教学重点:对案例进行需求分析 教学难点:使用Pandas处理异常值、重复值、缺失值,离散化连续数据和编码字符型数据 | |
教学方法 | 案例分析法、问答法、讨论法、讲授法 | |
教学用具 | 电脑、投影仪、多媒体课件、教材、APP | |
教学设计 | 第1节课:考勤(2 min )一问题导入(5 min )一传授新知c语言程序设计教程答案智慧树(28 min )一课堂实践(高性能mysql pdf下载10 min ) 第2节课:问题导入(8 min )一传授新知(20 min )一课堂实践(12 min )一课堂小结(3 min ) 一作业布直(2 min ) | |
教学过程 | 主要教学内容及步骤 | 设计意图 |
第一节课 | ||
考勤 (2 min ) | 【教师】使用APP进行签到 【学生】按照老师要求签到 | 培养学生的组 织纪律性,掌握学 生的出勤情况 |
问题导入 (5 min) | 【教师】提出问题 我们已经学习了 python数据处理的相关知识,那么关于一手房数据分析与 房价预测如何进行需求分析呢? 【学生】思考、举手回答 | 通过提问的方 法,了解学生对案 例的了解程度,进 而引出新知 |
传授新知 (28 min ) | 【教师】总结学生的回答,并引入新知,讲解案例需求分析的相关知识 7.1需求分析 7.1.1目标分析 A【教师】提出问题 本案例的目标是什么? >【学生】聆听、思考.主动回答问题 >【教师】总结学生的回答,并讲解新知 本章的目标是根据某房产网站中最新发布的北京_手房数据(共100页3 000 条数据,见图7-1),包拈区域、户型、面积、装修、房龄、总价、结构、朝向和 | |
单价等,分析各区二手房数量和均价、二手房面积和总价区间占比、二手房房龄和 均价的相关性、是否靠近地铁的不同装修二手房均价等,然后预测不同条件下二手 房的房价。
数据源>【教师】多媒体出示〃最新发布的北京二手房数据.xlsx〃文件的内容图片
通过教师讲解、 课堂讨论、多媒体 演示等方式,使学 生了解案例的需(详见教材),并详细讲解各部分表示的内容
数据源为通过网络爬虫爬取的某房产网站中最新发布的北京二手房数据,保存 在〃最新发布的北京二手房数据.Xlsx〃文件中。
求分析,数据解 析,重复值处理等 知识01 H
二£«•1
开的 ・A其面布扇公式 CrtKSVRfi
台丽银河湾 安华里社.区 卢卡特夫施所在所道或蚀所在区
通州R他 安贞 天通苑鲁能7号院水岸公肩马坡
南音知苑一期丰台箕他东亚印象台能啕升H他
塔蒙小区杜丹回通州 朝阳 局平 修义 丰台 逋州
中信邦城两限区亦庄开发区耳他亦庄开支区港城
华芳因 马连通中所 北分厂 红连哈包 福辣市园北区 括才园东里 龙期H小区 双兴北区 万榔园“、区 王安国 龙期唐宁one gog。新世代 走强网园 王桥北里卢海桥 成海寺 马连41
丰台 丰台西城
与流北郃新区海淀马连逗 定东庄 at水园 杜丹园 顺义城
£*8 草桥 五道口 方庄 小西天Shwtl
西城 丰台 朝阳 澹应 随义 丰力 丰台 心,龛 王台 正症 通州 朝阳户型 3室1厅 1室I厅 python入门教程app211 Jf 3室2厅 2室2厅 271 Jr 1S1JT 2至1厅 3室I厅 3室I厅 2至1厅 251 Jf 2室1厅 2I1JT 3室I厅 211 Jf 3室沂 2室1厅 1至1selected 优衣库万 1室1厅 2室1厅 2至1斤 1室1厅 2至1厅
面区79. 74平米
59. 06平米90. 03平米
142. X平米99. 43平米
65.12平米45. 5平米
72. 59平米123. 02平*
96. 57平米48. 29平米
53. 8平米77平米
87. 4平米118.89平米
61. 4平米137.25平米
54. 45平米51. 23平米
51.6平米57. 79平米
58平米43. 2平米
96. 04平米期南西东南两博两两四西南南两南西至陶南西南北南?尔
卷装葩情装城阳旭也装装炮装装装装装他信他装架他也 装精耳H精情HH苴柏筱R精筱楂趋苴稻HKH精精K具横隹年份 结构 总财 单价
中,,星(空18国)2018年诸板行550万68.975元/平顶层(共18层)1990年建塔柠 46275 78,226元/平
18@2014年建板塔结合492方5% 649元/平低档M(共15层)2014年建板楼520万36,456元/平
卬傍目(共6层)2003oppo发布会年建板柠283万28,的3元/平中楼名(”12昼)2015年并板樽 225万34,552元/不
低方国(共。层)1989年建嵌格”0万123,077元/平泯柠昼(拄21昼)2013名建板塔结合320万44,084元/平
中穆义(共23区)2008年建板塔结合489万39,750元/平质层⑴24层)2000年建塔柠430万44.528元/平
中横国(共5层)1976年建战柠670万138, 746元/平中件层("4层)I960年建板价368万68. 402元/平
低柠县(共22昼)2000年建tg1;820万106, 494元/平11K2007年建板柠 368万6% 989元/平
顶层(共18层)1州6年建塔桂8的万75,617元/平低柠M(尹16区)1994年建塔柠 634万103,258元/平
原由共6居)2005迂建板柠 460万33,516元/平卬横层(共6层)1992年建板接325万59,688元/平
中梏M(拄17M) 1998三碑塔移33。万6% 416元/年10R2011年建板塔结合350万67,830元/平
低方君(井23W〉2005年皆塔特40$万70, 255元/平喜楞M (共准)1984年速颗核5万94,138元/千
质居出6层)1990年评板价188方43,519元/平9层2007年建板株860万89,547元/平
房源标签
7.2数据预处理
数据解析
小【教师】提出问题
数据解析的步骤有哪些?
计【学生】聆听.思考、主动回答问题
计【教师】总结学生的回答,并讲解新知
(1 )定义dealYear()函数用于提取年份中的数值,转换为整型后计算房龄 (2022减去该数值)。
(2 )定义dealType()函数用于提取户型中室和厅的信息。在该函数中,首先 创建列标签为〃室〃和〃厅〃、值为0的DataFrame对象;然后循环使用正则表 达式获取每行的数值,将其转换为整型后赋值给DataFrame对象对应的列。
(3 )将户型中的〃房间〃替换为〃室〃,然后将调用dealType。函数返回的 DataFrame对象通过join。函数横向连接到原数据中。
(4 )将年份中的字符替换为空字符,并使用lambda表达式调用dealYear() 函数。
(5 )将面积、总价、单价等信息中的字符替换为空字符,仅保留数值部分,然 后转换为浮点型。
(6 )修改部分列标签,如〃面积〃修改为〃面积(平方米)〃、〃年份〃修改 为〃房龄〃、〃总价〃修改为〃总价(万元)〃、〃单价〃修改为〃单价(元/平方 米)"等。
(7 )输出面积、房龄、总价、单价、室和厅。
十【教师】按照教材步骤进行程序演示:
import pandas as pd
import numpy as np
import pandas as pd
import redf = pd.read_excel('最新发布的北京二手房数据.xlsx') pd.seVoptionCdisplay.unicode.easVasian.width', True) def dealYear(year):
num = yearif type(year) == str*:
num = 2022 - int(year) return num
def dealType(ser):
=np.zeros((len(ser)/)/json文本翻译器手机版 dtype='int') pd.DataFrame({室':data,厅:data})for i in ser.index:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论