线性回归
背景和概要说明
利用前面用到的数据集预测新客户的燃油用量,使用数据挖掘来查看家庭属性和一直的过往消费量,以便预测并满足新客户的需求。
线性回归解释
利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
分析按照自变量和因变量之间的关系类型,可以分为线性回归分析和非线性回归分析
线性回归分析:回归分析中,只包括一个自变量和一个因变量,且二者的关系可以用一条直线近似表示,这种回归分析称为一元线性回归分析
如果回归分析中包括两个或者以上的自变量,且因变量和自变量之间的关系是线性关系,则称为多元线性回归分析。
业务理解
已经拥有数据,将使用线性回归进行预测。
新客户的的家庭在性质上与现有客户非常相似,一次现有客户的使用行为可用作预测新客户未来用量的可靠基准。
数据准备
一定要注意数据集中各种属性(字段)的属性值取值范围,训练集和数据集必须相同,这样才最准确
数据过滤
构建模型设置标签
建模
结果展现数据可视化分析工具
公式
应用模型
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论