numpy对矩阵中Nan的处理:采⽤平均值的⽅法
尽管我们可以将所有的NaN替换成0,但是由于并不知道这些值的意义,所以这样做是个下策。如果它们是开⽒温度,那么将它们置成0这种处理策略就太差劲了。
下⾯我们⽤平均值来代替缺失值,平均值根据那些⾮NaN得到。
numpy库运行速度from numpy import *
datMat = mat([[1,2,3],[4,Nan,6]])
numFeat = shape(datMat)[1]
for i in range(numFeat):
meanVal = mean(datMat[nonzero(~isnan(datMat[:,i].A))[0],i])
#values that are not NaN (a number)
datMat[nonzero(isnan(datMat[:,i].A))[0],i] = meanVal
#set NaN values to mean
以上这篇numpy 对矩阵中Nan的处理:采⽤平均值的⽅法就是⼩编分享给⼤家的全部内容了,希望能给⼤家⼀个参考,也希望⼤家多多⽀持。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论