湖南工程学院 数据挖掘 实验报告
专业班级 | 姓名 | 学号 |
信息与计算科学1301 | 何勇刚 | 201310010113 |
实验日期 | 2016年6月6号 | 指导老师 | 刘劲光 | 评分 | |
实验名称 | 数据的质量探索及基本描述分析 | ||||
实验目的 | 1、离值与极端值的修正及缺失值的替补; 2、数据的基本描述性统计量; 3、变量的重要性分析 | ||||
1、离值与极端值的修正及缺失值的替补 离值与极端值的修正: 通过窗口Generate下的Outlier&Extreme Supernode子菜单实现的。首先对有离点和缺失值的变量选择恰当的修正方法,然后,选择需要修正的变量,并选择Generate中的Outlier&Extreme Supernode子菜单,选择Selected filelds only选项,表示仅对所选变量中的离点和极端值进行修改。 缺失值的替补:下拉Impute Missing和Mtthod列并选择其中的恰当选择。 2、数据的基本描述性统计量 3、变量的重要性分析 变量的重要性分析问题,应通过Moding卡中Feature Selection节点实现。 选择Moding卡中Feature Selection节点,并将其连接到数据流的恰当位置上,右击鼠标,选择弹出菜单中的Edit选项,参数设置窗口。 | |||||
指导教师评语: 签字: 年 月 日 | |||||
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论