什么是线性回归?

描述数学关系,并根据实验数据做出预测

线性回归是一种统计建模技术,用于将连续响应变量描述为一个或多个预测变量的函数。它可以帮助你理解和预测复杂系统的行为,或分析实验、金融和生物数据。

线性回归技术用于创建线性模型。该模型将因变量\(y\)(也称为响应)之间的关系描述为一个或多个自变量\(X_i\)(称为预测量)的函数。线性回归模型的一般方程为:

\[Y = \beta_0 + \sum \ \beta_i X_i + \epsilon_i\]

其中\(\beta\)表示要计算的线性参数估计,\(\epsilon\)表示误差项。

线性回归的类型

简单线性回归:仅使用一个预测器的模型。一般方程为:

\[Y = \beta_0 + \beta_i X+ \epsilon_i\]

简单的线性回归示例,显示如何预测一个州(响应变量,Y)的致命交通事故数量与该州的人口(预测变量,X)的比较。

简单的线性回归示例,显示如何预测一个状态(响应变量,\(Y\))中致命交通事故的数量与该状态的总体(预测变量,\(X\))的比较。(见MATLAB®代码示例以及如何使用mldivide运算符来估计简单线性回归的系数。)

多元线性回归:使用多个预测器的模型。这个回归有多个\(X_i\)来预测响应,\(Y\)。这个方程的一个例子是:

\ [Y = \ beta_0 + \ beta_1 X_1 + \ beta_2 X_2 + \ε\]

多元线性回归例子,根据重量和马力(预测变量Xj)预测不同汽车的每加仑英里数(MPG)(响应变量Y)。(参见MATLAB代码示例,如何使用回归函数,确定多重线性回归关系的显著性。)

多元线性回归示例,根据重量和马力(预测变量,\(X_j\))预测不同汽车的每加仑英里数(MPG)(响应变量,\(Y\))。(见MATLAB代码示例,如何使用回归函数,确定多元线性回归关系的显著性。)

多元线性回归:多个响应变量的模型。这个回归有多个来自相同数据\(X\)的\(Y_i\)。它们用不同的公式表示。这个方程组有两个方程的例子是:

\ [Y_1 = \ beta_ {01} + \ beta_ {11} X_1 + \ epsilon_1 \]

\ [Y_2 = \ beta_ {02} + \ beta_ {1 2} X_1 + \ epsilon_2 \]

多元线性回归示例,显示如何基于一年中的一周(预测变量X)预测9个地区的流感估计数(响应变量Yi)。

多元线性回归示例,显示如何基于一年中的一周(预测变量,\(X\))预测9个地区的流感估计(响应变量,\(Y_i\))。(见MATLAB代码示例以及如何使用mvregression函数来确定多元线性回归的估计系数。)

多元多元线性回归:使用多个预测器对多个响应变量进行建模。这个回归有多个\(X_i\)来预测多个响应\(Y_i\)。方程的概化是:

linear-regression-discovery-page-fig4-multivariate-mult-equation-graph

多元多元多元线性回归示例,从三个变量:轴距、路沿重量和燃料类型(预测变量,\(X_1\)、\(X_2\)和\(X_3\)中计算城市和公路MPG(作为响应变量,\(Y_1\)和\(Y_2\))。(见MATLAB代码示例以及如何使用mvregression函数估计系数。)

线性回归的应用

线性回归有一些特性,使得它们在以下应用中非常有趣:

  • 预测或预测——使用回归模型为特定的数据集建立预测模型。从模型中,你可以使用回归来预测只有预测因子知道的响应值。
  • 回归的强度——使用回归模型来确定一个变量和预测器之间是否存在关系,以及这种关系有多强。

用MATLAB进行线性回归

工程师通常创建简单的线性回归模型MATLAB。对于多元和多元线性回归,可以使用统计和机器学习工具箱™从MATLAB。它使逐步,鲁棒和多元回归:

  • 生成预测
  • 比较线性模型拟合
  • 情节残差
  • 评价拟合优度
  • 检测异常值

要创建符合数据的曲线和曲面的线性模型,请参见曲线拟合工具箱™

参见:时间序列回归

Baidu
map