湖南工程学院 数据挖掘 实验报告
专业班级
姓名
学号
信息与计算科学1301
何勇刚
201310010113
hue trunc函数
实验日期
201666
指导老师
刘劲光
评分
实验名称
数据的质量探索及基本描述分析
实验目的
1、离值与极端值的修正及缺失值的替补;
2、数据的基本描述性统计量;
3、变量的重要性分析
1、离值与极端值的修正及缺失值的替补
离值与极端值的修正: 通过窗口Generate下的Outlier&Extreme Supernode子菜单实现的。首先对有离点和缺失值的变量选择恰当的修正方法,然后,选择需要修正的变量,并选择Generate中的Outlier&Extreme Supernode子菜单,选择Selected filelds only选项,表示仅对所选变量中的离点和极端值进行修改
缺失值的替补:下拉Impute Missing和Mtthod列并选择其中的恰当选择。
2、数据的基本描述性统计量
3、变量的重要性分析
变量的重要性分析问题,应通过Moding卡中Feature Selection节点实现。
选择Moding卡中Feature Selection节点,并将其连接到数据流的恰当位置上,右击鼠标,选择弹出菜单中的Edit选项,参数设置窗口。
   
指导教师评语:
                                                  签字:
                                                           

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。