问题:进行面板单位根和协整检验。请检验npr是否在前10个证券中存在单位根。请检验npr和li是在前3个证券中存在协整关系。
《Stata统计分析与行业应用案例详解(第二版)》第15章 时间序列
提前对数据进行简单回归,分析该数据是否适合用时间序列分析。
再进行时间序列分析基本操作,包括定义时间序列、绘制时间序列趋势图(迅速看出数据的变化特征,精确选择模型)etc.
// m s g t: 城乡人口净转移、城镇失业规模、城乡收入差距和制度 //本命令的含义是不考虑数据的时间序列性质,对数据进行多重线性回归 reg m s g t //把年份作为日期变量对数据进行时间序列定义 tsset year //绘制时间序列趋势图来描述变量城乡人口净转移随时间的变动趋势 twoway(line m year) //变量城乡人口净转移没有明显、稳定的长期变化方向。 //绘制时间序列趋势图来描述变量城镇失业规模随时间的变动趋势 twoway(line s year) /*变量城镇失业规模具有明显、稳定的向上增长趋势*/ //绘制时间序列趋势图来描述变量城乡收入差距随时间的变动趋势 twoway(line g year) /*城乡收入差距具有明显、稳定的向上增长趋势*/ //绘制时间序列趋势图来描述变量制度随时间的变动趋势 twoway(line t year) /*制度因素具有明显、稳定的向上增长趋势*/ /*4个变量的增量都没有明显、稳定的长期变化方向*/ //是绘制时间序列趋势图来描述变量城乡人口净转移的一阶差分(增量)随时间的变动趋势 twoway(line d.m year) //是绘制时间序列趋势图来描述变量城镇失业规模的一阶差分随时间的变动趋势 twoway(line d.s year) //是绘制时间序列趋势图来描述变量城乡收入差距的一阶差分随时间的变动趋势 twoway(line d.g year) //是绘制时间序列趋势图来描述变量制度的一阶差分随时间的变动趋势 twoway(line d.t year) //清除数据的时间序列格式 tsset,clear
延伸: 关于数据处理的一般说明
一般情况下,我们要消除变量的时间序列长期走势后或者说变量平稳后才能进行回归得出有效的结论,所以在给制变量序列图的时候,如果该变量存在趋势,就应该进行一阶差分后再进行查看。所谓变量的一阶差分指的是对变量的原始数据进行处理,用前面的数据减去后面的数据后得出的一个新的时间序列。如果变量的一阶差分还是存在趋势,就应该进行二阶差分后再进行查看,依次类推,直到数据平稳。所谓二阶差分指的是在把一阶差分得到的时间序列数据作为原始数据,并进行前项减后项处理后得出新的时间序列。一般情况下,如果数据的低阶差分是平稳的,那么高阶差分也是平稳的。
对于一个时间序列数据而言,数据的平稳性对于模型的构建是非常重要的。如果时间序列数据是不平稳的,可能会导致自回归系数的估计值向左 偏向于0,使传统的T检验失效,也有可能会使得两个相互独立的变量出现假相关关系或者回归关系,造成模型结果的失真。在时间序列数据不平稳的情况下,目前公认的能够有效解决假相关或者假回归,构建出合理模型的方法有两种:
一种是先对变量进行差分直到数据平稳,再把得到的数据进行回归的方式;
另一种就是进行协整检验并构建合理模型的处理方式。
那么如何判断数据是否平稳呢?
上节中提到的绘制时间序列图的方法可以作为初步推测或者辅助检验的一种方式。
但一种更精确的检验方式是:如果数据没有单位根,我们就认为它是平稳的,这时就需要用到本节介绍的单位根检验。
例子:试通过单位根检验的方式来判断相关变量包括城乡人口净转移、城镇失业规模、城乡收入差距等变量是否平稳。
我们通过绘制时间序列趋势图发现城乡人口净转移、城乡人口净转移的一阶差分、城镇失业规模的一阶差分、城乡收入差距的一阶差分是没有时间趋势的,而城镇失业规模和城乡收入差距是有时间趋势的。这些结论将会在后续的操作命令中被用到。
//进行单位根检验前必须声明时间序列 tsset year
// 单位根检验:上述发现m d.m d.s d.g没有时间趋势,但s g有时间趋势。 //ADF 检验:对有时间趋势的变量要包含时间趋势option,没有时间趋势的变量就不包含时间趋势option。 //使用ADF检验方法,对变量m进行单位根检验,不包含时间趋势 dfuller m,notrend
Dickey-Fuller test for unit root Number of obs = 26 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -1.617 -3.743 -2.997 -2.629 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.4745
ADF 检验的原假设是数据有单位根。从上面的结果中可以看出P 值( MacKinnonapproximate p-value for Z(t)) 为0.4745 ,接受了有单位根的原假设,这一点也可以通过观察Z(t)值得到。实际Z(t)值为-1. 617 ,在1%的置信水平(-3.743 )、5%的置信水平(-2.997) 、1 0%的置信水平上(-2.629 )都无法拒绝原假设,所以城乡人口净转移这一变量数据是存在单位根的,需要对其做一阶差分后再继续进行检验。
总结:p值不显著,变量存在单位根,需要做差分之后再继续检验。
dfuller d.m,notrend Dickey-Fuller test for unit root Number of obs = 25 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -8.085 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.0000
ADF 检验的原假设是数据有单位根。从上面的结果中可以看出P 值(MacKinnon approximate p-value for Z(t)) 为0.0000 ,拒绝了有单位根的原假设,这一点也可以通过观察Z(t)。值得到。实际Z(t)值为-8.085 ,在1%的置信水平(-3.750) 、5%的置信水平(-3.000) 、10%的置信水平上(-2.630) 都应拒绝原假设,所以城乡人口净转移这一变量的一阶差分数据是不存在单位根的。
//使用ADF检验方法,对变量d.s进行单位根检验,不包含时间趋势 dfuller d.s,notrend
ADF 检验的原假设是数据有单位根。从上面的结果中可以看出P 值(MacKinnon approximate p-value for Z(t)) 为0.2158 ,接受了有单位根的原假设,这一点也可以通过观察Z(t)值得到。实际Z(t)值为-2.1 74 ,在1%的置信水平(-3.743) 、5%的置信水平(-2.997) 、10%的置信水平上(-2.629) 都无法拒绝原假设,所以城镇失业规模这一变量的一阶差分数据是存在单位根的,需要对城镇失业规模做二阶差分后再继续进行检验。
当时间序列数据不平稳时,构建出合理模型的方法:协整检验。
协整的思想: 把存在一阶单整的变量放在一起进行分析,通过这些变量进行线性组合,从而消除它们的随机趋势,得到其长期联动趋势。
两种方法:
1.EG-ADF 检验(应用范围广);
2.迹检验(效果更好)
例子:试通过EG-ADF 检验、迹检验等两种协整检验的方式 来判断相关变量包括城乡人口净转移、城镇失业规模、城乡收入差距等变量是否在在长期协整关系。
,如果残差序列是平稳的,那么变量之间的长期协整关系就存在,如果残差序列是不平稳的,那么变量之间的长期协整关系就不存在。
reg m d.s g predict e,resid //得到上步回归产生的残差序列 twoway(line e year) //绘制残差序列的时间趋势图 //对残差序列进行ADF检验,观测其是否为平稳序列,其中不包括时间趋势项,不包括常数项,滞后1期。 dfuller e,notrend nocon lags(1) reg
总结:
1.回归
2.predict 残差
3.表层上绘制残差序列的时间趋势图(目的:判断时间序列检验命令中option是用"trend" or "notrend")
4.深层上对残差序列ADF检验,观测残差序列是否为平稳序列1)ADF检验结果显著→拒绝原假设(原假设是数据有单位根)→残差序列没有单位根→残差序列是平稳的。
2)残差序列是平稳的→因变量和所有自变量之间存在协整关系。
//根据信息准则确定变量的滞后阶数 varsoc m d.s g //确定协整秩 vecrank m d.s g,lags(4) //估计协整模型 vec m d.s g,lags(4) rank(1)