1. 面板数据要不要进行内生性检验、稳健性检验
面板数据回归后,稳健性检验一定要做。
稳健性检验的方法:从数据出发,根据不同的标准调整分类,检验结果是否依然显著;从变量出发,从其他的变量替换,如:公司size可以用totalassets衡量,也可以用totalsales衡量从计量方法出发,可以用OLS,FIXEFFECT,GMM等来回归,看结果是否依然robust。
稳健性检验
考察的是评价方法和指标解释能力的强壮性,也就是当改变某些参数时,评价方法和指标是否仍然对评价结果保持一个比较一致、稳定的解释。通俗些,就是改变某个特定的参数,进行重复的实验,来观察实证结果是否随着参数设定的改变而发生变化,如果改变参数设定以后,结果发现符号和显著性发生了改变,说明不是稳健性的,需要寻找问题的所在。
以上内容参考:网络-稳健性检验
2. 鍦ㄦ瘮绫荤洰鐨勯潰鏉夸笅鑳芥樉绀哄摢浜涙寚鏍
闈㈡澘鏁版嵁妯″瀷鐢ㄤ簬鍒嗘瀽闈㈡澘鏁版嵁涓鍚勮嚜鍙橀噺X瀵瑰洜鍙橀噺Y鐨勫奖鍝嶃
甯歌佺殑鏁版嵁褰㈠紡鏈夋椂闂村簭鍒楁暟鎹锛圱ime series data锛夛紝鎴闈㈡暟鎹锛圕ross-sectional data锛夊拰闈㈡澘鏁版嵁锛圥anel data锛夈備粠缁村害鏉ョ湅锛屾椂闂村簭鍒楁暟鎹鍜屾埅闈㈡暟鎹鍧囦负涓缁淬傞潰鏉挎暟鎹鍙浠ョ湅鍋氫负鏃堕棿搴忓垪涓庢埅闈㈡贩鍚堟暟鎹锛屾槸鎴闈涓婁釜浣撳湪涓嶅悓鏃剁偣閲嶅嶈傛祴鏁版嵁锛屽洜姝ゅ畠鏄浜岀淮鏁版嵁銆
鎴闈㈡暟鎹锛圕ross-sectional data锛夋寚鏌愪釜鍦扮悊鍗曞厓鍦ㄦ煇涓鏃堕棿鐐圭殑鏁版嵁锛屽傚箍宸炲競2020骞碐DP鏁版嵁銆
闈㈡澘鏁版嵁妯″瀷鍦ㄥ洖褰掑墠闇妫楠屾暟鎹鐨勫钩绋虫с備负浜嗛伩鍏嶄吉鍥炲綊锛岀‘淇濅及璁$粨鏋滅殑鏈夋晥鎬э紝鎴戜滑蹇呴』瀵瑰悇闈㈡澘搴忓垪鐨勫钩绋虫ц繘琛屾楠屻傝屾楠屾暟鎹骞崇ǔ鎬ф渶甯哥敤鐨勫姙娉曞氨鏄鍗曚綅鏍规楠屻
鍗曚綅鏍规楠岄氳繃鍒嗘瀽t鍊硷紝鍒嗘瀽鍏舵槸鍚﹀彲浠ユ樉钁楀湴鎷掔粷搴忓垪涓嶅钩绋崇殑鍘熷亣璁撅紙p<0.05锛夛紝鑻ュ憟鏄捐憲鎬э紝琛ㄦ槑鎷掔粷搴忓垪涓嶅钩绋崇殑鍘熷亣璁撅紝璇ュ簭鍒椾负涓涓骞崇ǔ鐨勬椂闂村簭鍒楋紱鑻ヤ笉鍛堟樉钁楁э紝鍒欏规暟鎹杩涜屼簩闃剁敋鑷抽珮闃跺樊鍒嗗悗妫楠岋紝鐩磋嚦搴忓垪骞崇ǔ涓烘锛屼竴鑸涓嶈秴杩囦簩闃跺樊鍒嗐
3. 什么叫面板数据分析
面板数据,即Panel Data,也叫“平行数据”,是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。或者说他是一个m*n的数据矩阵,记载的是n个时间节点上,m个对象的某一数据指标。
其有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板,所以把panel data译作“面板数据”。但是,如果从其内在含义上讲,把panel data译为“时间序列—截面数据” 更能揭示这类数据的本质上的特点。也有译作“平行数据”或“TS-CS数据(Time Series - Cross Section)”。
1如
城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。
如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。
2如
2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为:
北京市分别为8、9、10、11、12;
上海市分别为9、10、11、12、13;
天津市分别为5、6、7、8、9;
重庆市分别为7、8、9、10、11(单位亿元)。
这就是面板数据。
面板数据是按照英文的直译,也有人将Panel data翻译成综列数据、平行数据等。由于国内没有统一的说法,因此直接使用Panel data这种英文说法应该更准确一些。说面板数据也是比较通用的,但是面板数据并不能从名称上反映出该种数据的实际意义,故很多研究者不愿使用。
面板数据分析方法是最近几十年来发展起来的新的统计方法,面板数据可以克服时间序列分析受多重共线性的困扰,能够提供更多的信息、更多的变化、更少共线性、更多的自由度和更高的估计效率,而面板数据的单位根检验和协整分析是当前最前沿的领域之一。
面板数据的单位根检验的方法主要有 Levin,Lin and CHU(2002)提出的LLC检验方法[5]。Im,Pesearn,Shin(2003)提出的IPS检验[6] , Maddala和Wu(1999),Choi(2001)提出的ADF和PP检验[7]等。面板数据的协整检验的方法主要有Pedroni[8] (1999,2004)和Kao[9](1999)提出的检验方法,这两种检验方法的原假设均为不存在协整关系,从面板数据中得到残差统计量进行检验。Luciano(2003)中运用Monte Carlo模拟[10]对协整检验的几种方法进行比较,说明在T较小(大)时,Kao检验比Pedroni检验更高(低)的功效。
1.指标选取和数据来源
经济增长:本文使用地区生产总值 ,以1999年为基期,根据各地区生产总值指数折算成实际 ,单位:亿元。
能源消费:考虑到近年来我国能源消费总量中,煤炭和石油供需存在着明显低估,而电力消费数据相当准确。因此使用电力消费更能准确反映能源消费与经济增长之间的内在联系(林伯强,2003)。所以本文使用各地区电力消费量 作为能源消费量,单位:亿千瓦小时。
环境污染:污染物以气休、液体、固体形态存在,本文选取工业废水排放量作为环境污染的量化指标,单位:万吨。
本文采用1999-2006年全国30个省(直辖市,自治区)的地区生产总值 、电力消费量 和工业废水排放量 的数据构建面板数据集。30个省(直辖市,自治区)包括北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、山西、内蒙古、吉林、黑龙江、安徽、江西、河南、湖北、湖南、海南、广西、重庆、四川、贵州、云南、陕西、西藏、甘肃、青海、宁夏、新疆,由于西藏数据不全故不包括在内。数据来源于《中国统计年鉴2000-2007》。为了消除变量间可能存在的异方差,本文先对地区生产总值 、地区电力消费量和工业废水排放量进行自然对数变换。