什么是面板数据?

分析多个时间点的截面数据

面板数据是长期收集的对多个主题的观察。面板数据的例子包括在同一时期内收集的个人、家庭、公司、市政当局、州或国家的数据。

面板数据有两种类型:

  • 平衡(完整)面板数据包括在同一时间点测量的每个个体的所有观察结果。例如:10年来每年收集的国家或州的经济数据。
  • 面板数据不平衡(不完整)包括某些时间点对某些个体的遗漏观察。例子:来自公司或个人的财务数据,有些公司或个人的年龄比其他公司或个人大。

大多数统计分析是根据所谓的截面数据进行的,这些数据是在某个时间点收集的。相比之下,面板数据分析通过拟合面板回归模型,扩展了多个时间点的截面数据的统计分析,该模型同时考虑了截面效应和时间效应。这些方法给出了更可靠的参数估计线性回归模型。

流行的面板数据分析方法包括多元回归和线性混合效应模型。面板回归模型在如何解释截面效应和时间效应方面有所不同。

  • 面板数据固定效应模型或带哑变量的最小二乘(LSDV)模型:截面效应使用哑变量建模
  • 单向随机效应模型:将横断面效应建模为随机效应,而不是时间效应
  • 双向随机效应模型:截面效应和时间效应都被建模为随机效应
  • 嵌套(分层)模型:横截面数据中的嵌套分组(例如,国家中的嵌套状态)被建模为随机效应

MATLAB®支持面板数据回归模型的常用估计方法,包括:

要点

  • 纵向数据在计量经济学、生物统计学(如药物开发)和社会学中很常见
  • 流行的面板数据分析方法包括多元回归和线性混合效应模型

有关如何拟合各种面板数据回归模型的更多信息,请参见统计和机器学习工具箱™金融工具箱™,计量经济学工具箱™使用MATLAB

参见:统计和机器学习工具箱计量经济学的工具箱金融工具箱线性模型线性回归预测建模

Baidu
map