主要内容

残留分析

绘制和分析残差

拟合模型的残差定义为响应数据与在每个预测值处对响应数据的拟合之间的差异。

剩余数据- - - - - -适合

你可以通过点击在曲线拟合器应用程序中显示残差残差图可视化部分的曲线更健康选项卡。

数学上,特定预测值的残差是响应值之间的差y和预测的响应值ŷ

ry- - - - - -ŷ

假设拟合数据的模型是正确的,残差近似于随机误差。因此,如果残差表现为随机行为,则表明模型很好地拟合了数据。然而,如果残差显示一个系统的模式,这是一个明显的迹象,表明模型拟合数据差。永远记住,如果模型与数据极不合适,那么许多模型拟合的结果(如置信界限)将是无效的。

一阶多项式拟合的残差图形显示如下所示。上面的图显示残差是根据从数据点到拟合曲线的垂直距离计算的。底部的图显示了相对于拟合的残差,也就是零线。

一阶多项式拟合的残差图

残差在零附近随机分布,说明模型对数据的描述很好。

二次多项式拟合残差的图形显示如下所示。该模型只包含二次项,不包含线性项或常数项。

二次多项式拟合的残差图

残差在大部分数据范围内都是系统正的,这表明该模型对数据的拟合较差。

例子:残留分析

该示例将几个多项式模型拟合到生成的数据中,并评估这些模型拟合数据的效果以及它们的预测精度。数据是由三次曲线生成的,并且在范围上有很大的差距x变量,如果没有数据存在。

X = [1:0.1:3 9:0.1:10]';C = [2.5 -0.5 1.3 -0.1];Y = c(1) + c(2)*x + c(3)*x。(4) * x ^ 2 + c。^ 3 +(-0.5兰特(大小(x)));

拟合数据在曲线Fitter应用程序使用三次多项式和五次多项式。数据、拟合和残差如下所示。您可以通过单击在曲线拟合器应用程序中显示残差残差图可视化部分的曲线更健康选项卡。

三次多项式拟合图和五次多项式拟合图

两个模型似乎都很好地拟合了数据,残差似乎在零附近随机分布。因此,拟合的图形评估并没有显示出两个方程之间的任何明显差异。

看看数值拟合结果结果窗格和比较系数的置信界限。

结果表明,三次拟合系数准确可知(边界较小),五次拟合系数不准确可知。不出所料,适合的结果是poly3是合理的,因为生成的数据遵循三次曲线。拟合系数的95%置信界限表明它们是可接受的精度。然而,95%的置信范围poly5表示拟合系数不精确。

拟合优度统计数据显示在符合表窗格。缺省情况下,调整后的r方和RMSE统计信息显示在表格中。统计数据没有显示这两个方程之间有实质的差别。要选择要显示或隐藏的统计信息,请右键单击列标题。

新观测值的95%非同时预测边界如下所示。要在曲线拟合应用程序中显示预测边界,请选择95%预测范围列表中可视化部分的曲线更健康选项卡。

两个多项式拟合的预测边界拟合图

的预测边界poly3表明可以在整个数据范围内以很小的不确定性预测新的观测结果。不是这样的poly5.它在没有数据存在的区域有更宽的预测边界,显然是因为数据不包含足够的信息来准确估计更高次多项式项。换句话说,五次多项式过拟合数据。

拟合函数的95%预测界poly5如下所示。正如你所看到的,预测函数的不确定性在数据中心是很大的。因此,在使用五次多项式进行精确预测之前,必须收集更多的数据。

总之,在决定最适合您的目的的适合度之前,您应该检查所有可用的适合度度量。对拟合性和残差的图形检查应该始终是你的初始方法。然而,一些拟合特征只能通过数值拟合结果、统计数据和预测边界来揭示。

Baidu
map