课题
20课二手房数据分析与房价预测需求分析
课时
2 课时(90 min )
教学目标
知识技能目标
(1)能够对案例进行需求分析
(2 )能根据需求对数据进行不同的预处理,选择合适的可视化图形进行分析和展示,并选择合适 的相关变量进行预测
(3)练习使用Pandas处理异常值、重复值、缺失值,离散化连续数据和编码字符型数据等
素质目标
(1)养成分析问题、事前规划的良好习惯
教学重难点
教学重点:对案例进行需求分析
教学难点:使用Pandas处理异常值、重复值、缺失值,离散化连续数据和编码字符型数据
教学方法
案例分析法、问答法、讨论法、讲授法
教学用具
电脑、投影仪、多媒体课件、教材、APP
教学设计
1节课:考勤(2 min )一问题导入(5 min )一传授新知c语言程序设计教程答案智慧树28 min )一课堂实践高性能mysql pdf下载10 min )
2节课:问题导入8 min )一传授新知20 min )一课堂实践12 min )一课堂小结3 min ) 一作业布直2 min )
教学过程
主要教学内容及步骤
设计意图
第一节课
考勤
(2 min )
【教师】使用APP进行签到
【学生】按照老师要求签到
培养学生的组 织纪律性,掌握学 生的出勤情况
问题导入
(5 min)
【教师】提出问题
我们已经学习了 python数据处理的相关知识,那么关于一手房数据分析与 房价预测如何进行需求分析呢?
【学生】思考、举手回答
通过提问的方 法,了解学生对案 例的了解程度,进 而引出新知
传授新知
(28 min )
【教师】总结学生的回答,并引入新知,讲解案例需求分析的相关知识
7.1需求分析
7.1.1目标分析
A【教师】提出问题
本案例的目标是什么?
>【学生】聆听、思考.主动回答问题
>【教师】总结学生的回答,并讲解新知
本章的目标是根据某房产网站中最新发布的北京_手房数据(共1003 000 条数据,见图7-1),包拈区域、户型、面积、装修、房龄、总价、结构、朝向和

单价等,分析各区二手房数量和均价、二手房面积和总价区间占比、二手房房龄和 均价的相关性、是否靠近地铁的不同装修二手房均价等,然后预测不同条件下二手 房的房价。
数据源>【教师】多媒体出示〃最新发布的北京二手房数据.xlsx文件的内容图片
通过教师讲解、 课堂讨论、多媒体 演示等方式,使学 生了解案例的需(详见教材),并详细讲解各部分表示的内容
数据源为通过网络爬虫爬取的某房产网站中最新发布的北京二手房数据,保存 在〃最新发布的北京二手房数据.Xlsx文件中。
求分析,数据解 析,重复值处理等 知识01 H
£«•1
开的 A其面布扇公式 CrtKSVRfi
台丽银河湾 安华里社.区 卢卡特夫施所在所道或蚀所在区
通州R他 安贞 天通苑鲁能7号院水岸公肩马坡
南音知苑一期丰台箕他东亚印象台能啕升H
塔蒙小区杜丹回通州 朝阳 局平 修义 丰台 逋州
中信邦城两限区亦庄开发区耳他亦庄开支区港城
华芳因 马连通中所 北分厂 红连哈包 福辣市园北区 括才园东里 龙期H小区 双兴北区 万榔园“、区 王安国 龙期唐宁one gog。新世代 走强网园 王桥北里卢海桥 成海寺 马连41
丰台 丰台西城
与流北郃新区海淀马连逗 定东庄 at水园 杜丹园 顺义城
£*8 草桥 五道口 方庄 小西天Shwtl
西城 丰台 朝阳 澹应 随义 丰力 丰台 心,龛 王台 正症 通州 朝阳户型 311Ipython入门教程app211 Jf 3222271 Jr 1S1JT 213I3I21251 Jf 212I1JT 3I211 Jf 3室沂 2111selected 优衣库万 1121211121
面区79. 74平米
59. 06平米90. 03平米
142. X平米99. 43平米
65.12平米45. 5平米
72. 59平米123. 02平*
96. 57平米48. 29平米
53. 8平米77平米
87. 4平米118.89平米
61. 4平米137.25平米
54. 45平米51. 23平米
51.6平米57. 79平米
58平米43. 2平米
96. 04平米期南西东南两博两两四西南南两南西至陶南西南北南?尔
卷装葩情装城阳旭也装装炮装装装装装他信他装架他也 装精耳H精情HH苴柏筱R精筱楂趋苴稻HKH精精K具横隹年份 结构 总财 单价
中,,星(空18国)2018年诸板行55068.975元/平顶层(共18层)1990年建塔柠 46275 78,226元/平
18@2014年建板塔结合4925% 649元/平低档M(共15层)2014年建板楼520万36,456元/平
卬傍目(共6层)2003oppo发布会年建板柠28328,3元/平中楼名(”12昼)2015年并板樽 22534,552元/不
低方国(共。层)1989年建嵌格”0123,077元/平泯柠昼(拄212013名建板塔结合32044,084元/平
中穆义(共23区)2008年建板塔结合48939,750元/平质层⑴24层)2000年建塔柠43044.528元/平
中横国(共5层)1976年建战柠670138, 746元/平中件层"4层)I960年建板价36868. 402元/平
低柠县(共22昼)2000年建tg1820106, 494元/平11K2007年建板柠 3686% 989元/平
顶层(共18层)16年建塔桂8的万75,617元/平低柠M(尹16区)1994年建塔柠 634103,258元/平
原由共6居)2005迂建板柠 46033,516元/平卬横层(共6层)1992年建板接32559,688元/平
中梏M(拄17M) 1998三碑塔移33。万6% 416元/年10R2011年建板塔结合35067,830元/平
低方君(井23W2005年皆塔特40$70, 255元/平喜楞M (共准)1984年速颗核5万94,138元/千
质居出6层)1990年评板价18843,519元/平92007年建板株86089,547元/平
房源标签

7.2数据预处理
数据解析
小【教师】提出问题
数据解析的步骤有哪些?
计【学生】聆听.思考、主动回答问题
计【教师】总结学生的回答并讲解新知
1 )定义dealYear()函数用于提取年份中的数值,转换为整型后计算房龄 (2022减去该数值)。
2 )定义dealType()函数用于提取户型中室和厅的信息。在该函数中,首先 创建列标签为〃室〃和〃厅〃、值为0DataFrame对象;然后循环使用正则表 达式获取每行的数值,将其转换为整型后赋值给DataFrame对象对应的列。
3 )将户型中的〃房间〃替换为〃室〃,然后将调用dealType。函数返回的 DataFrame对象通过join。函数横向连接到原数据中。
(4 )将年份中的字符替换为空字符,并使用lambda表达式调用dealYear() 函数。
(5 )将面积、总价、单价等信息中的字符替换为空字符,仅保留数值部分,然 后转换为浮点型。
6 )修改部分列标签,如〃面积〃修改为〃面积(平方米)〃、〃年份〃修改 为〃房龄〃、〃总价〃修改为〃总价(万元)〃、〃单价〃修改为〃单价(元/平方 米)"等。
(7 )输出面积、房龄、总价、单价、室和厅。
十【教师】按照教材步骤进行程序演示:
import pandas as pd
import numpy as np
import pandas as pd
import redf = pd.read_excel('最新发布的北京二手房数据.xlsx') pd.seVoptionCdisplay.unicode.easVasian.width', True) def dealYear(year):
num = yearif type(year) == str*:
num = 2022 - int(year) return num
def dealType(ser):
=np.zeros((len(ser)/)/json文本翻译器手机版 dtype='int') pd.DataFrame({室':data,厅:data})for i in ser.index:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。