什么是线性回归?

描述数学关系并根据实验数据做出预测

线性回归是一种统计建模技术,用于将连续响应变量描述为一个或多个预测变量的函数。它可以帮助你理解和预测复杂系统的行为,或者分析实验、财务和生物数据。

线性回归技术用于创建线性模型。该模型将因变量\(y\)(也称为响应)之间的关系描述为一个或多个自变量\(X_i\)(称为预测量)的函数。线性回归模型的一般方程为:

\[Y = \beta_0 + \sum \ \beta_i X_i + \epsilon_i\]

其中\(\beta\)表示要计算的线性参数估计,\(\epsilon\)表示误差项。

线性回归的类型

简单线性回归:只使用一个预测器的模型。一般公式为:

\[Y = \beta_0 + \beta_i X+ \epsilon_i\]

简单的线性回归示例,显示如何预测一个州(响应变量,Y)中致命交通事故的数量与该州的总体(预测变量,X)的比较。

简单的线性回归示例,显示如何预测一个状态(响应变量,\(Y\))中致命交通事故的数量与该状态(预测变量,\(X\))的总体数量的比较。(见MATLAB®代码示例以及如何使用mldivide算子来估计简单线性回归的系数。)

多元线性回归:使用多个预测器建模。这个回归有多个\(X_i\)来预测响应,\(Y\)。这个等式的一个例子是:

\ [Y = \ beta_0 + \ beta_1 X_1 + \ beta_2 X_2 + \ε\]

多元线性回归示例,根据重量和马力(预测变量Xj)预测不同汽车(响应变量Y)的每加仑英里(MPG)。(详见MATLAB代码示例,如何使用回归函数,确定多元线性回归关系的显著性)

多元线性回归示例,根据重量和马力(预测变量,\(X_j\))预测不同汽车(响应变量,\(Y\))的每加仑英里数(MPG)。(见MATLAB代码示例,如何使用回归函数,确定多元线性回归关系的显著性。)

多元线性回归:多个响应变量的模型。这个回归有多个来自相同数据\(X\)的\(Y_i\)。它们用不同的公式表示。这个方程组的一个例子有两个方程:

\ [Y_1 = \ beta_ {01} + \ beta_ {11} X_1 + \ epsilon_1 \]

\ [Y_2 = \ beta_ {02} + \ beta_ {1 2} X_1 + \ epsilon_2 \]

多元线性回归示例,显示如何基于一年中的一周(预测变量X)预测9个地区的流感估计数(响应变量Yi)。

多元线性回归示例,显示如何基于一年中的一周(预测变量,\(X\))预测9个地区的流感估计数(响应变量,\(Y_i\))。(见MATLAB代码示例以及如何使用mvregression函数确定多元线性回归的估计系数。)

多元多元线性回归:使用多个预测器对多个响应变量进行建模。这个回归有多个\(X_i\)来预测多个响应\(Y_i\)。方程的概括如下:

linear-regression-discovery-page-fig4-multivariate-mult-equation-graph

多元多元多元线性回归示例,计算城市和高速公路MPG(作为响应变量,\(Y_1\)和\(Y_2\))从三个变量:轴距,路沿重量和燃料类型(预测变量,\(X_1\), \(X_2\)和\(X_3\))。(见MATLAB代码示例以及如何使用mvregression函数估计系数。

线性回归的应用

线性回归的一些特性使得它们在以下应用中非常有趣:

  • 预测或预测——使用回归模型为特定的数据集建立预测模型。从模型中,您可以使用回归来预测只有预测器知道的响应值。
  • 回归的强度——使用回归模型来确定变量和预测因子之间是否存在关系,以及这种关系有多强。

用MATLAB实现线性回归

工程师通常创建简单的线性回归模型MATLAB.对于多元和多元线性回归,可以使用统计和机器学习工具箱™从MATLAB。它支持逐步、稳健和多元回归:

  • 生成预测
  • 比较线性模型拟合
  • 情节残差
  • 评价拟合优度
  • 检测异常值

若要创建适合曲线和曲面的线性模型,请参见曲线拟合工具箱™

参见:时间序列回归

Baidu
map