横截面数据 cross sectional data
横截面数据是在同一时间,不同统计单位相同统计指标组成的数据列。横截面数据是按照统计单位排列的。因此,横截面数据不要求统计对象及其范围相同,但要求统计的时间相同。也就是说必须是同一时间截面上的数据。
时间序列数据 time-series data
在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。
面板数据:
是截面数据与时间序列数据综合起来的一种数据类型。其有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板,所以把panel data译作“面板数据”。
举例:
如:城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。
如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。
如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为:
北京市分别为8、9、10、11、12;
上海市分别为9、10、11、12、13;
天津市分别为5、6、7、8、9;
重庆市分别为7、8、9、10、11(单位亿元)。
这就是面板数据。
方差分析主要有三种模型:即固定效应模型(fixed effects model),随机效应模型(random effects model),混合效应模型(mixed effects model)。
固定效应模型(fixed effects model),即固定效应回归模型,简称FEM,是一种面板数据分析方法。它是指实验结果只想比较每一自变项之特定类目或类别间的差异及其与其他自变项之特定类目或类别间交互作用效果,而不想依此推论到同一自变项未包含在内的其他类目或类别的实验设计。固定效应回归是一种空间面板数据中随个体变化但不随时间变化的一类变量方法。
固定效应模型可分为三类:
(1)个体固定效应模型:个体固定效应模型是对于不同的时间序列(个体)只有截距项不同的模型:
从时问和个体上看,面板数据回归模型的解释变量对被解释变量的边际影响均是相同的,而目除模型的解释变量之外,影响被解释变量的其他所有(未包括在回归模型或不可观测的)确定性变量的效应只是随个体变化而不随时间变化。
(2)时点固定效应模型:时点固定效应模型就是对于不同的截面(时点)有不同截距的模型。如果确知对于不同的截面,模型的截距显著不同,但是对于不同的时间序列(个体)截距是相同的,那么应该建立时点固定效应摸型:
(3)时点个体固定效应模型:时点个体固定效应模型就是对于不同的截面(时点)、不同的时间序列(个体)都有不同截距的模型。如果确知对于不同的截面、不同的时间序列(个体)模型的截距都显著不相同,那么应该建立时点个体固定效应模型:
与随机模型的比较
FEM:假设所有纳入的研究拥有共同的真实效应量,或者除了随机误差外,所观察效应量均为真实效应量。如比较对糖尿病黄斑水肿(DME)的抗血管内皮生长因子(Anti-VEGF)药物中aflibercept与bevacizumab疗效,除了药物自身疗效外,其他患者背景、药物使用情况及测量结局的工具等均“一致”,每个研究的观察效应量差别仅仅是由于抽样误差引起,也就是说,每个研究的观察效应量就“等于”其真实效应量。Cochrane Handbook已明确指出,当异质性小于40%,建议采用FEM进行Meta合并,因此,FEM对各研究背景较为苛刻,仅适用于“理想化”研究背景。
REM:如上所述,FEM中假设所有研究的真实效应量是相同的,但在大多数的系统评价和Meta分析中这是很难实现的。因为研究的对象很难保存同质性,所以在REM中的真实效应量会随着不同的研究所改变,例如一个研究的效应量可能比拥有不同年龄、教育背景、健康程度等参与者的研究的效应量更高或更低,所以真实效应量的大小不仅取决于样本的抽样误差,还取决于参与者或研究对象以及进行的干预措施等,也可称其为异质性。
判断面板数据是固定模型还是随机模型要用hausman检验。
再粘一个知乎的回答
固定效应相当于比如你有两组数据 组A和组B 分别是两组时间序列的数 然后固定效应就是要把组A和组B加一个名义变量 然后我们在考察影响的时候要利用这个名义变量减去各个组的影响。相当于把组间差距去掉 再进行分析
https://www.zhihu.com/question/47380734