统计学习⽅法-1
统计学习包括监督学习、⾮监督学习、半监督学习以及强化学习,主要学习监督学习问题。
监督学习的任务是学习⼀个模型,使模型能够对任意给定的输⼊,对其相应的输出做出⼀个好的预测(这⾥的输⼊、输出是指某个系统输⼊输出,与学习的输⼊输出不同),计算机的基本操作就是给定⼀个输⼊产⽣⼀个输出,所以监督学习是极其重要的统计学习分⽀,也是统计学习中内容最丰富、应⽤最⼴泛的部分。
知识点:
1、欧⽒空间:欧⼏⾥得空间就是对现实空间的规则抽象和推⼴(从n<=3推⼴到有限n维空间).
中学学的⼏何空间⼀般是2维、3维,如果将这些低维空间所总结的规律推⼴到有限的n维空间,那这些符合定义的空间则被统称为欧⽒空间。
2、输⼊变量为有限个离散变量的预测问题称为回归问题;输出变量为有限个离散变量的预测问题称为分类问题;输⼊变量与输出变量均为变量序列的预测问题称为标注问题。
3、统计学习⽅法由三要素构成,可以简单地表⽰为:
⽅法=模型+策略+算法
构建⼀种统计学习⽅法就是确定具体的统计学习三要素。
1、1:
监督学习的实现步骤:
1.得到⼀个有限的训练数据集合
2、确定模型的假设空间,也就是所有的备选模型
3、确定模型选择的准则,即学习的策略
4、实现求解最优模型的算法
5、通过学习⽅法选择最优模型
6、利⽤学习的最优模型对新数据进⾏预测或分析
1、3统计学习三要素:
⼀、模型(假设空间)
⼆、策略:(以什么样的标准来确定这个模型就是最优的模型)
策略体现在损失函数上(损失函数就是对于每⼀个实例,我们的预测值与他真实值之间⼀个差别的惩罚)
策略:
1、4模型评估与模型选择
训练误差:
正则化统计
测试误差:
1、5 正则化与交叉验证
1、6 泛化能⼒
1、7⽣成模型与判别模型

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。