机器学习数据特征归⼀化的⽬的及⽅式
  ⼀直对数据特征归⼀化有点模糊,今天借复习算法的过程,总结了⼀下归⼀化的具体⽬的和⽅式。
正则化和归一化的关系  概念:归⼀化特征值,消除特征之间量级不同导致的影响。归⼀化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的⼀定范围内。⾸先归⼀化是为了后⾯数据处理的⽅便,其次是保正程序运⾏时收敛加快。
  ⽅式:
    1.线性函数转换
      y=(x-MinValue)/(MaxValue-MinValue)
      说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最⼤值和最⼩值。
    2.对数函数转换,表达式如下:
      y=log10(x),说明:以10为底的对数函数转换。
    3.反余切函数转换,表达式如下:
      y=arctan(x)*2/PI
  在统计学中,归⼀化的具体作⽤是归纳统⼀样本的统计分布性。归⼀化在0-1之间是统计的概率分布,归⼀化在-1--+1之间是统计的坐标分布。
  数据归⼀化是很有必要的,可以讲数据的不同特征归⼀到⼀个范围下,⽅便数据的处理。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。