空间计量模型学习笔记
讲空间计量模型之前我想说为啥会出现空间计量这个东东,它是干啥滴呢?且听我细细道来。。
实质:还是回归(我是门外汉,所以我会这么说。。。这里大神不要打我。。。
空间计量也叫做spatial econometrics,实际上就是把咱们平时用到的那些方法加入一些空间效应后做的系列回归。空间效应,实质上就是一种网络效应,证明了万事万物之间都有关联性,当然,越是靠得近的两个objects也更可能有强关联性。要不然,你真的会相信,一只拉丁美洲的蝴蝶振动几下翅膀,然后中国就必定发生地震或者洪灾了。再考虑下,当年美国准备attack North Korea,因为我们知道“唇亡齿寒”的道理,所以中国派遣了那么多的志愿军跨过鸭绿江去援助老金家。现在的物理距离可能还不如经济距离实在,比如,我们与韩国是那么近距离的邻居,可是在经济军事上韩国与美国可能反而走得更近(如果不是如此,请忽略该陈述)(这里我是别人那里抄来的)。总之一句话,就是邻居的二b行为,往往会对你产生影响,影响你的行为决策。
举两个例子来看看空间计量在经济事务中的运用。北京市的发展会通过neighbourhood效应影响河北和天津的发展,比如,导致河北和天津发展相对滞后一些(大众直觉)。如果想要研究政府出台的“限购政策”对房价的影响,那么,我们可以搜集全国出台限购政策的城市的几年面板数据,然后做一个普通的xtreg回归就行。然而,我们要晓得,各个城市出台的限购政策不仅会影响当地城市的房价,还会通过诸如“人口流动”等影响另一个城市的房价,而且,这个城市的房价还可能直接影响另一个城市的房价。所以,我们就需要考虑这样一种剪不断、理还乱的网状关系,让限购政策对房价的影响分成两部分:直接影响和间接影响。
空间计量经济学可以处理截面数据,也可以处理面板数数据,而且还可以处理变量内生性问题(目前,处理类型是受限的)。空间计量属于比较新发展起来的学科,很多计量理论和方法都还在探索中,因此,下面的部分主要集中于几个用得比较多的空间计量模型。
空间计量经济学研究领域涉及五个方面:
1.空间相互依存的设定
2.空间关系的非对称性
3.空间解释变量的重要性
4.过去的和将来的相互作用之间的区别
5.空间模拟。
这些领域强调计量经济学中空间变 量表述的重要性,例如距离衰减函数、空间的组织形式。
下面是一些大佬的定义,可能有助于帮助理解吧。。。==
Anselin(1988) 将空间计量经济学定义为: “在区域科学模型的统计分析中,研究由空间引起的各种特性的一系列方法。Anselin 所阐述的区域科学模型,是指在模型中综合了区域、位置及与空间相关的影响,并且模型的估计及确定也是具有地理参考意义的数据,这些数据可能来自于空间上的点,也可能来自于某些区域,前者对应于经纬坐标,后者对应于区域之间的相对位置。在模型研究中,应当注意 由于空间依存而产生的空间滞后与时间序列的空间滞后的本质区别。
与传统的计量经济学相比,空间计量经济学的定义更狭义。在空间计量经济学当中把空间效应分为空间依赖性与空间异质性。空间依赖性是指主体行为间的空间交互作用而产生的一种截面依赖性, 这意味着不同区位随机变量之间的相关性或者协方差结构主要来自于空间组织形式,这些空间组织形 式是由地理空间中主体之间空间相对位置( 距离、空间排序) 决定的。空间异质性是指空间结构的非均衡性,表现为主体行为之间存在明显的空间结构性差异。根据空间异质性表现形式的不同,空间异质性分为空间结构非均衡性和空间异方差。空间结构非均衡性通常需要设置空间变系数或空间结构; 空间异方差则通常需要对误差项进行异方差处理。空间异质性的处理方法可分为离散型异质性和连续型异质性(Anselin,2010) 。离散型异质性通过在模型中设置地区虚拟变量来表现空间异质性; 连续型异质性通过设定参数随机空间位移变动的函数形式来处理空间异质性。
最新的空间计量经济学研究对上述模型进行了扩展。其中 J.Paul Elhorst 认为,“空间计量经济学是处理地理单元空间关系的一门计量经济学分支,这些地理单元可以是邮政编码、城市、区域、国家等,并且认为传统计量经济学到空间计量经济学发展是符合从“特殊到“一般的进展,空间计量经济学不仅仅可以解释地理单元的关系,还可以解释个人、公司、政府之间的关系。
总之,空间计量经济学的研究领域可以概括为四个重要的方面: 模型的识别、模型的估计、模型的检验、空间预测。
其实每个实证的研究领域貌似都是这几个主要的方面吧。
使用到的R语言的包
目前我在学长的学习笔记中使用的函数主要是有:
splm:做空间自回归模型的,根据参数决定吧
spdep:空间矩阵:
plm:普通的回归模型
spml:极大似然估计
这几个函数都是包括在splm中:https://cran.r-project.org/web/packages/splm/index.html,还有个demo:https://wenku.baidu.com/view/6a3323d8f111f18582d05a7c.html
空间自回归模型SAR(空间滞后模型SLM)
定义:区域行为受到文化环境及与空间距离有关的迁移成本的影响,具有很强的地域性(Anselin et al.,1996)。由于SLM模型与时间序列中自回归模型相类似,因此SLM也被称作空间自回归模型(Spatial Autoregressive Model,SAR)
模型识别
给个公式吧:
w这个矩阵,有两种生成方式,包括,邻近矩阵和地理位置权重矩阵,一个对称方阵,也有不对称的(少)这个后面单独再说。。
空间误差模型(SEM)
若$$ heta=-delta eta$$ 则 $$lambda=delta$$
空间误差模型其实就是将回归项放到了误差里面,简单的来说,SLM是研究因变量自相关,而SEM是研究误差项自相关,看权重矩阵的位置(这么说,貌似不太专业奥)
空间杜宾模型(SDM)
空间杜宾模型是空间滞后模型和空间误差模型的扩展形式,同时考虑因变量和自变量的自相关性
含有两个空间权重矩阵
(因为我不是专门高计量,也不是研究模型理论的,我就是用它来写两篇论文,所以,怎么好理解怎么来)
这里面的两个矩阵可以相同,也可以不同,
W1是因变量也就是被解释变量的空间相关关系
W2是自变量也就是解释变量的空间相关关系。
以上是常用的三种模型的基本定义。。
主要涉及到参数选择的位置问题。。个人认为不妨给出一个图来的更加直观。。
这个是从一本经典著作《空间计量经济——从横截面数据到面板数据》上面找的,因为每个模型真的变动很小,具体问题具体分析吧
略懂一丢丢空间计量之后,我不得不多,回归模型太强大了,学经济的才是大佬。。
模型估计
模型的估计这里,我目前读到的估计主要是两种
1.极大似然估计ML
极大似然估计是一种统计学的方法,利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值。
原理:极大似然估计是建立在极大似然原理的基础上的一个统计方法,是概率论在统计学中的应用。极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。通过若干次试验,观察其结果,利用试验结果得到某个参数值能够使样本出现的概率为最大,则称为极大似然估计。
由于样本集中的样本都是独立同分布,可以只考虑一类样本集D,来估计参数向量θ。记已知的样本集为:
$$D=left{x_{1}, x_{2}, cdots, x_{N}
ight}$$
给出极大似然估计的密度函数和函数
极大似然函数
极大似然函数求解这个本科的高数课程上面学过,其中有一个求解的方法是,求连乘积,然后取对数,求导,找出最优解。。这个因该是底层的原理。。不够因为不是专门学这个的,我感觉大概了解一下就好,R语言里面做极大似然估计
1.加载的包是MaxLik,具体的参数设置见包的说明https://cran.r-project.org/web/packages/maxLik/index.html
2.或者把极大似然函数写出来,然后用optimal求极大值也行,反正方法多多的
2.广义矩阵估计GMM
这个我目前还没用过,等等后面再说
Reference
《空间计量经济——从横截面数据到面板数据》
https://www.douban.com/group/topic/138177265/?type=collect
http://www.ijiandao.com/2b/baijia/171559.html
https://blog.csdn.net/qq_39355550/article/details/81809467
http://maxlik.r-forge.r-project.org/