主要内容

拟合优度评估

如何评价拟合优度

在用一个或多个模型拟合数据后,应该评估拟合优度。在曲线拟合器应用程序中显示的拟合曲线的视觉检查应该是你的第一步。除此之外,工具箱还提供了以下方法来评估线性和非线性参数拟合的拟合优度:

在统计文献中很常见,术语拟合优度good fit在这里有几种意思:A good fit可能是一个模型

  • 根据最小二乘拟合的假设,你的数据可能是合理的

  • 其中模型系数的估计不确定性小

  • 这解释了你的数据中很大比例的可变性,并能够以很高的确定性预测新的观测结果

特定的应用程序可能还要求模型拟合的其他方面,这些方面对于实现良好的拟合很重要,例如易于解释的简单模型。这里描述的方法可以帮助您确定所有这些意义上的拟合优度。

这些方法分为两种:图形方法和数值方法。绘制残差和预测界限是辅助视觉解释的图形方法,而计算拟合优度统计量和系数置信界限产生有助于统计推理的数值测量。

一般来说,图形化度量比数值度量更有益,因为图形化度量允许您一次查看整个数据集,并且图形化度量可以轻松地显示模型和数据之间的广泛关系。数值测量更狭隘地集中在数据的特定方面,并经常试图将信息压缩成一个单一的数字。在实践中,根据您的数据和分析需求,您可能需要使用这两种类型来确定最合适的。

请注意,基于这些方法,可能没有一个拟合可以被认为适合您的数据。在这种情况下,可能需要选择不同的模型。也有可能所有的拟合优度测量都表明某个特定的拟合是合适的。然而,如果你的目标是提取具有物理意义的拟合系数,但你的模型不能反映数据的物理特性,那么得到的系数就毫无用处。在这种情况下,理解您的数据代表什么以及如何测量它与评估拟合优度同样重要。

拟合优度统计

在使用图形方法评估拟合优度之后,您应该检查拟合优度统计数据。曲线拟合工具箱™软件支持这些参数模型的拟合优度统计数据:

  • 误差平方和(SSE)

  • r平方

  • 调整r平方

  • 均方根误差(RMSE)

对于当前拟合,这些统计信息显示在结果窗格中的曲线拟合应用程序。对于当前曲线拟合会话中的所有拟合,您可以在拟合表窗格。

要在命令行检查拟合优度统计数据,可以:

  • 在Curve Fitter应用程序中,导出你的适合度和适合度到工作区。在曲线更健康选项卡,在出口部分中,点击出口并选择导出到工作区

  • 指定gof参数的输出。适合函数。

误差平方和

该统计量测量响应值从拟合到响应值的总偏差。它也被称为残差的平方和,通常被标记为上交所

年代 年代 E 1 n w y y 2

接近于0的值表明模型具有较小的随机误差分量,并且拟合对预测更有用。

r平方

该统计量衡量拟合在解释数据变化方面的成功程度。换句话说,r平方是响应值与预测响应值之间相关性的平方。又称多重相关系数和多重决定系数的平方。

r平方定义为回归(苏维埃社会主义共和国)和总平方和(风场).苏维埃社会主义共和国定义为

年代 年代 R 1 n w y y ¯ 2

风场也称为关于平均值的平方和,并定义为

年代 年代 T 1 n w y y ¯ 2

在哪里风场苏维埃社会主义共和国+上交所.给定这些定义,r平方表示为

r平方 年代 年代 R 年代 年代 T 1 年代 年代 E 年代 年代 T

r平方可以取0到1之间的任何值,接近1的值表示模型考虑了更大比例的方差。例如,r平方值为0.8234意味着拟合解释了平均值数据中82.34%的总变化。

如果你增加模型中拟合系数的数量,r平方将会增加,尽管在实际意义上拟合可能不会改善。为了避免这种情况,你应该使用下面描述的自由度调整r平方统计量。

请注意,对于不包含常数项的方程,有可能得到负的r平方。因为r平方被定义为由拟合解释的方差的比例,如果拟合实际上比拟合一条水平线差,那么r平方为负。在这种情况下,r平方不能被解释为相关性的平方。这种情况表明,应该向模型中添加常数项。

自由度调整r平方

该统计量使用上面定义的r平方统计量,并根据剩余自由度对其进行调整。剩余自由度定义为响应值的数目n减去拟合系数的数目从响应值估计。

vn- - - - - -

v属性所涉及的独立信息条的数目n计算平方和所需的数据点。注意,如果参数是有界的,并且一个或多个估计值在它们的边界上,那么这些估计值被认为是固定的。自由度随这类参数的数目而增加。

当您比较两个模型时,调整后的r平方统计量通常是拟合质量的最佳指标嵌套的-也就是说,一系列模型,每个模型都在前一个模型的基础上增加额外的系数。

调整r平方 1 年代 年代 E n 1 年代 年代 T v

调整后的r平方统计值可以取任何小于或等于1的值,接近1的值表示更好的拟合。当模型包含不利于预测响应的项时,就会出现负值。

均方根误差

这个统计量也被称为拟合标准误差和回归的标准误差。它是对数据中随机分量的标准差的估计,定义为

R 年代 E 年代 年代 E

在哪里均方误差是均方误差还是残差均方

年代 E 年代 年代 E v

就像上交所,一个均方误差值接近0表示拟合值对预测更有用。

另请参阅

相关的话题

Baidu
map