近日,中国科学技术大学管理学院在时空面板数据模型的研究中取得重要进展,突破经典的广义极大似然估计和广义矩估计理论框架,提出了基于空间权重矩阵特征分解的估计和模型选择方法。相关论文在学术期刊《美国科学院院报》(Proceedings of the National Academy of Sciences, PNAS)发表,题为 “Estimation and model selection in general spatial dynamic panel data models”(2020 117 (10) pp5235-5241)。第一作者为管理学院金百锁副教授,合作作者包括加拿大约克大学Yuehua Wu教授,纽约州立大学C.R. Rao教授,管理学院博士生侯丽。
现在很多大数据(环境,疫情,犯罪,物流,区域经济等)呈现出时间和空间的复杂相依关系,由于时空的交互影响提高了对应的时空模型的估计难度。有别于已有的复杂估计方法,文章改变传统的估计思路,充分利用时空数据的空间结构特征,采用空间权重矩阵的特征分解,极大的简化了估计方法,提高了估计精度和运算速度,并提出了相应的模型选择方法。理论部分模型的示意图如下图所示:
文章以 2008 年 1 月到 2013 年 12 月(72 个月) 138 个美国匹兹堡行政地区的犯罪数据为例做了示范。在这个例子中,犯罪数据重罪(Part I)和轻罪(Par II)在138个行政区的平均犯罪个数分布如下图:
文章还选取了 15 个区域社会经济变量作为解释变量,包括区域总人口、收入、失业率、贫苦率、非裔比例、教育水平等。模型的拟合程度指标R平方(接近1时,拟合程度高)达到 0.98,表明选择的模型非常好的拟合了数据。数据分析结果可以用于以轻罪发生率预测重罪发生率,解释犯罪学的“破窗理论”,分析重罪发生率和总人口、收入和贫困等的量化关系。
该研究得到了国家自然基金委创新群体和重点项目等支持。
论文链接:https://doi.org/10.1073/pnas.1917411117
(管理学院、科研部)