分析多个时间点的截面数据
面板数据是长期收集的对多个主题的观察。面板数据的例子包括在同一时期内收集的个人、家庭、公司、市政当局、州或国家的数据。
面板数据有两种类型:
- 平衡(完整)面板数据包括在同一时间点测量的每个个体的所有观察结果。例如:10年来每年收集的国家或州的经济数据。
- 面板数据不平衡(不完整)包括某些时间点对某些个体的遗漏观察。例子:来自公司或个人的财务数据,有些公司或个人的年龄比其他公司或个人大。
大多数统计分析是根据所谓的截面数据进行的,这些数据是在某个时间点收集的。相比之下,面板数据分析通过拟合面板回归模型,扩展了多个时间点的截面数据的统计分析,该模型同时考虑了截面效应和时间效应。这些方法给出了更可靠的参数估计线性回归模型。
流行的面板数据分析方法包括多元回归和线性混合效应模型。面板回归模型在如何解释截面效应和时间效应方面有所不同。
- 面板数据固定效应模型或带哑变量的最小二乘(LSDV)模型:截面效应使用哑变量建模
- 单向随机效应模型:将横断面效应建模为随机效应,而不是时间效应
- 双向随机效应模型:截面效应和时间效应都被建模为随机效应
- 嵌套(分层)模型:横截面数据中的嵌套分组(例如,国家中的嵌套状态)被建模为随机效应
MATLAB®支持面板数据回归模型的常用估计方法,包括:
要点
- 纵向数据在计量经济学、生物统计学(如药物开发)和社会学中很常见
- 流行的面板数据分析方法包括多元回归和线性混合效应模型
有关如何拟合各种面板数据回归模型的更多信息,请参见统计和机器学习工具箱™,金融工具箱™,计量经济学工具箱™使用MATLAB.
例子和如何
软件参考
数据科学
使用MATLAB进行大数据,机器学习和生产分析系统。