matlab拟合⼯具箱cftool及其统计指标公式计算
matlab拟合⼯具箱cftool及其统计指标公式计算
在matlab命令窗⼝》cftool回车
3、进⼊曲线拟合⼯具箱界⾯“Curve Fitting tool”
(1)利⽤X data和Y data的下拉菜单读⼊数据x,y,
(2)然后通过下拉菜单“Type of fit”选择拟合曲线的类型,⼯具箱提供的拟合类型有:Custom Equations:⽤户⾃定义的函数类型Exponential:指数逼近,有2种类型,a*exp(b*x) 、a*exp(b*x) + c*exp(d*x)
Fourier:傅⽴叶逼近,有7种类型,基础型是a0 + a1*cos(x*w) + b1*sin(x*w)
Gaussian:⾼斯逼近,有8种类型,基础型是a1*exp(-((x-b1)/c1)^2)
Interpolant:插值逼近,有4种类型,linear、nearest neighbor、cubic spline、shape-preserving Polynomial:多形式逼近,有9种类型,linear ~、quadratic ~、cubic ~、4-9th degree ~
Power:幂逼近,有2种类型,a*x^b 、a*x^b + c
Rational:有理数逼近,分⼦、分母共有的类型是linear ~、quadratic ~、cubic ~、4-5th
degree ~;此外,分⼦还包括constant型
Smoothing Spline:平滑逼近
Sum of Sin Functions:正弦曲线逼近,有8种类型,基础型是a1*sin(b1*x + c1)
Weibull:只有⼀种,a*b*x^(b-1)*exp(-a*x^b)
选择好所需的拟合曲线类型及其⼦类型,并进⾏相关设置:
——如果是⾮⾃定义的类型,根据实际需要点击“Fit options”按钮,设置拟合算法、修改待估计参数的上下限等参数;
——如果选Custom Equations,点击“New”按钮,弹出⾃定义函数等式窗⼝,有“Linear Equations 线性等式”和“General Equations构造等式”两种标签。
在本例中选Custom Equations,点击“New”按钮,选择“General Equations”标签,输⼊函数类型y=a*x*x + b*x,设置参数a、b的上下限,然后点击OK。
(5)类型设置完成后,点击“Apply”按钮,就可以在Results框中得到拟合结果:
SSE: 6.146
R-square: 0.997
Adjusted R-square: 0.997
RMSE: 0.8263
同时,也会在⼯具箱窗⼝中显⽰拟合曲线。
tool工具箱这样,就完成⼀次曲线拟合啦,⼗分⽅便快捷。当然,如果你觉得拟合效果不好,还可以在“Fitting”窗⼝点击“New fit”按钮,按照步骤
(4)~(5)进⾏⼀次新的拟合。
不过,需要注意的是,cftool ⼯具箱只能进⾏单个变量的曲线拟合,即待拟合的公式中,变
量只能有⼀个。
注:统计特征
SSE(和⽅差、误差平⽅和):The sum of squares due to error
MSE(均⽅差、⽅差):Mean squared error
RMSE(均⽅根、标准差):Root mean squared error
R-square(确定系数):Coefficient of determination
Adjusted R-square:Degree-of-freedom adjusted coefficient of determination
⼀、SSE(和⽅差)
该统计参数计算的是拟合数据和原始数据对应点的误差的平⽅和,计算公式如下
SSE越接近于0,说明模型选择和拟合更好,数据预测也越成功。接下来的MSE和RMSE因为和SSE是同出⼀宗,所以效果⼀样
⼆、MSE(均⽅差)
该统计参数是预测数据和原始数据对应点误差的平⽅和的均值,也就是SSE/n,和SSE没有太⼤的区别,计算公式如下
三、RMSE(均⽅根)
该统计参数,也叫回归系统的拟合标准差,是MSE的平⽅根,就算公式如下
在这之前,我们所有的误差参数都是基于预测值(y_hat)和原始值(y)之间的误差(即点对点)。从下⾯开始是所有的误差都是相对原始数据平均值(y_ba)⽽展开的(即点对全)
四、R-square(确定系数)
在讲确定系数之前,我们需要介绍另外两个参数SSR和SST,因为确定系数就是由它们两个决定的
(1)SSR:Sum of squares of the regression,即预测数据与原始数据均值之差的平⽅和,公式如下
(2)SST:Total sum of squares,即原始数据和其均值之差的平⽅和,公式如下
细⼼的⽹友会发现,SST=SSE+SSR,呵呵只是⼀个有趣的问题。⽽我们的“确定系数”是定义为SSR和SST的⽐值,故
其实“确定系数”是通过数据的变化来表征⼀个拟合的好坏。由上⾯的表达式可以知道“确定系数”的正常取值范围为[0 1],越接近1,表明⽅程的变量对y的解释能⼒越强,这个模型对数据拟合的也较好
相关系数(相关系数r的值介于–1与+1之间,即–1≤r≤+1。其性质如下:当r>0时,表⽰两变量正相关,r<0时,两变量为负相关。当|r|=1时,表⽰两变量为完全线性相关,即为函数关系。当r=0时,表⽰两变量间⽆线性相关关系。当0<|r|<1时,表⽰两变量存在⼀定程度的线性相关。且|r|越接近1,两变量间线性关系越密切;|r|越接近于0,表⽰两变量的线性相关越弱。⼀般可按三级划分:|r|<0.4为低度线性相关;0.4≤|r|<0.7为显著性相关;0.7≤|r|<1为⾼度线性相关。);
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论