特征提取与特征选择
1.特征提取
特征提取,通常称为特征工程,是指从数据集中提取有助于建模、分析过程和预测结果的特征,是机器学习和深度学习的基础,是实现有效机器学习和深度学习模型的关键环节。特征提取的主要目的是从原始数据中提取出有价值的特征,从而提升模型的精确度。
特征提取的方法主要有:
1)非监督学习:非监督学习通过聚类、主成分分析(PCA)、奇异值分解、独立成分分析(ICA)等方法从原始数据中提取出有价值的特征。
2)监督学习:监督学习可以通过特征选择,递归特征消除(RFE),基于权重的统计特征选择和基于函数的特征选择等方法从原始数据中提取出有价值的特征。
2.特征选择
特征选择是指从原始数据中选择具有预测性的特征,以便提高模型有效性。特征选择有助于减
正则化目的少过拟合,进而提高模型准确性。
特征选择的方法主要有:
1)特征选择:特征选择可以使用过滤法(Filter),包括单变量统计,相关性,卡方,信息增益等方法,也可以使用包裹法(Wrapper),包括递归特征消除(RFE),贪心,粒子优化等方法,还可以使用嵌入法(Embedded),包括 L1正则化,L2正则化等方法。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。