分析多个时间点的截面数据
面板数据是在一段时间内收集的对多个主题的观察结果。面板数据的例子包括在同一时期内收集的个人、家庭、公司、市政当局、州或国家的数据。
面板数据有两种类型:
- 平衡(完整)面板数据包含在同一时间点测量的每个个体的所有观测值。例如:10年来每年收集的国家或州的经济数据。
- 面板数据不平衡(不完整)包含某些时间点对某些个体的缺失观察。例如:来自公司或个人的财务数据,其中一些公司或个人比其他公司或个人年龄大。
大多数统计分析是对所谓的横断面数据进行的,这些数据是在某个时间点收集的。相比之下,面板数据分析通过拟合面板回归模型扩展了多个时间点的横断面数据的统计分析,该模型同时考虑了横截面效应和时间效应。这些方法给出了更可靠的参数估计线性回归模型。
流行的面板数据分析方法包括多元回归和线性混合效应模型。面板回归模型在如何解释横截面效应和时间效应方面有所不同。
- 面板数据固定效应模型或最小二乘虚拟变量(LSDV)模型:截面效应使用虚拟变量建模
- 单向随机效应模型:截面效应,而不是时间效应被建模为随机效应
- 双向随机效应模型:截面效应和时间效应都被建模为随机效应
- 嵌套(层次结构)模型:横截面数据中的嵌套分组(例如,国家中的嵌套状态)被建模为随机效应
MATLAB®支持面板数据回归模型的常用估计方法,包括:
要点
- 纵向数据在计量经济学、生物统计学(如药物开发)和社会学中很常见
- 流行的面板数据分析方法包括多元回归和线性混合效应模型
有关如何拟合各种面板数据回归模型的更多信息,请参见统计和机器学习工具箱™,金融工具箱™,计量经济学工具箱™用于MATLAB.
例子和如何
软件参考
数据科学
使用MATLAB进行大数据、机器学习和生产分析系统。