❶ 控制變數最少幾個
30個。面板數據控制變數是指在時間序列上取多個截面,在這些截面上同時選取樣本觀測值所構成的樣本數據。面板數據在時間序列上不太好找,一般要有30個稍微少點也可以,但一定不要少於25個,少於25個就有可能會出現故障等情況,所以一定要注意。
❷ 面板數據96個可以嗎
可以。
一般來說面板數據大於30個以上就屬於大樣本了,所以96個面板數據是完全可以進行統計的。但是96個面板數據統計量是比較大的,統計起來也會有一定的難度,需要花費較長的時間。
面板數據也叫平行數據,是指在時間序列上取多個截面,在這些截面上同時選取樣本觀測值所構成的樣本數據。或者說是一個數據矩陣,記載的是n個時間節點上,m個對象的某一數據指標。
❸ 高級計量經濟學 16:短面板(上) (修正1)
在讀 paper 的時候,發現自己對短面板的框架邏輯有不全面的地方,在這里對各位讀者說聲對不起!
這是船新的版本,我將自己的理解融入其中,筆記順序與教材不同。
畢竟我也是現學現賣,敬請諒解!
此文內容為《高級計量經濟學及STATA應用》的筆記,陳強老師著,高等教育出版社出版。
我只將個人會用到的知識作了筆記,並對教材較難理解的部分做了進一步闡述。為了更易於理解,我還對教材上的一些部分( 包括證明和正文 )做了修改。
目錄
面板數據 ( panel data ),也譯為 平行數據 ( longitudinal data ),指的是在一段時間內跟蹤同一組個體( indivial )的數據。它既有橫截面的維度( 個個體 ),又有時間維度( 個時期 )。
通常的面板數據 較小,而 較大,在使用大樣本理論時讓 。這種面板數據被稱為 短面板 ( short panel )。反之,如果 較大而 較小,則被稱為 長面板 ( long panel )。
如果在面板數據中,每個時期的樣本中的個體完全一樣,則稱為 平衡面板數據 ( balanced panel );反之,則稱為 非平衡面板數據
在面板 模型 中,如果解釋變數包含被解釋變數的滯後值,則稱為 動態面板 ( dynamic panel );反之,稱為 靜態面板 ( static panel )
(1) 面板數據的優點
(2) 截面數據的缺點
當然,截面數據也會帶來一些問題:
估計面板數據的 一個極端策略 是將其看成橫截面數據而進行 混合回歸 ( pooled regression ),即要求樣本中每個個體都擁有完全相同的回歸方程( 在 15.3 討論 )。 另一個極端策略 是為每個個體估計一個單獨的回歸方程。
前者忽略了個體間不可觀測或被遺漏的異質性,而該異質性可能與解釋變數相關而導致估計不一致;後者則忽略了個體間的共性,也可能沒有足夠的的樣本容量。
因此,在實踐中常常採用折衷的估計策略:即假定個體的回歸方程擁有 相同的斜率 ,但可以擁有 不同的截距 ,以此來捕捉異質性,如 圖 15.1 所示:
這種模型被稱為 個體效應模型 ( indivial-specific effects model ),其模型形式為:
其中, 為不隨時間而變( time invariant )的個體特徵( 即 ),比如性別;而 則可以隨個體及時間而變( time-varying )。擾動項由 兩部分構成,成為 復合擾動項 ( composite erroe term ),而方程 也稱為 復合擾動項模型 ( error compoents model )。
較早的文獻有時將 視為 常數 ,但這也只是隨機變數的特例,即退化的隨機變數;而 為隨個體與時間而改變的擾動項。
我們主要關注 ,這是因為「個體效應模型」的 個體特徵 來源於 。 在 幾何上 代表個體異質性的截距;在 統計上 則代表一個擾動項:
在短面板,我們假設 為獨立同分布(長面板可以放鬆此假定),且與 不相關。另外,
顯然,與截面數據相比,面板數據提供了更為豐富的模型與估計方法。
如果所有個體都擁有完全一樣的回歸方程,也就是說每個個體 連截距項都相同 ,那麼方程 的 就都相等。我們記 為截距,即 ,那麼方程 就可以寫成:
其中, 不包含常數項。這樣,就可以把所有的數據放在一起,像對待橫截面數據那樣進行 OLS 回歸,故被稱為 混合回歸 ( polled regression )。混合回歸可以被稱為 總體平均估計量 ( Population-averaged estimator, PA),因為可以把它理解為 將個體效應都平均掉了 。
由於面板數據的特點,雖然通常可以假設不同個體之間的擾動項相互獨立,但同一個體在不同時間的擾動項之間往往存在自相關。此時,對標准誤的估計應該使用 聚類穩健的標准誤 ( cluster-robust standard error ),而所謂聚類( cluster ),就是由每個個體不同時期的所有觀測值所組成。同一聚類(個體)的觀測值允許存在相關性,而不同聚類(個體)的觀測值則不相關。
混合回歸的基本假設是 不存在個體效應 。 對於這個假設必須進行統計檢驗 。由於個體效應以兩種不同的形態存在:固定效應、隨機效應,故在下面會分別介紹其檢驗方法。
固定效應模型是指 與某個解釋變數 或 相關的個體效應模型。換句話說,由於存在一些遺漏變數,使得 與解釋變數產生內生性。所以,固定效應模型求解的關鍵就是 如何排除內生性的干擾 !
總的來看, 與某個解釋變數 或 相關分成兩種情況:
我們下面來探討如何對兩種固定效應模型進行處理。
如果 與某個解釋變數 或 相關,那麼此個體效應模型就變成了 固定效應模型 。這種情況下, OLS估計是不一致的 。為了得到一致的 估計量,解決的方法是將模型轉換,並將 消去。
給定個體 ,將方程 兩邊對時間取平均,可得:
用 則可以得到原模型的 離差形式 :
定義:
那麼 就變成了:
在公式 中, 已經被消去,故只要 與 不相關,就可以使用 OLS 一致地估計 ,稱為 固定效應估計量 ( Fixed Effects Estimator ),記為 。由於 使用了每個個體的組內離差信息,故也被稱為 組內估計量 ( within estimator )。即使個體特徵 與解釋變數 相關,只要使用組內估計量,就可以得到一致估計,這是面板數據的一大優勢。
然而,在作離差變換的過程中, 也被消掉了,於是無法估計 。也就是說固定效應模型無法估計不隨時間而變的變數的影響,這是 FE 的一大缺點。另外,為了保證 與 不相關,則要求第 個觀測值滿足嚴格外生性,即:
這是因為 中包含了 的所有信息。換言之,擾動項必須與各期的解釋變數均不相關,這是一個比較強的假定。
如果在原方程中引入 個虛擬變數(如果沒有截距,則引入 個虛擬變數)來代表不同的個體,則可以得到與上述離差模型同樣的結果,即:
其中,個體虛擬變數 如果 ;否則 。可以用 OLS 估計此方程,而且我們可以證明, LSDV 法與組內估計量 FE 完全一樣。因此,FE 也被稱為 最小二乘虛擬變數模型 ( Least Square Dummy Variable Model, LSDV)
不過,如果作完 LSDV 後發現某些個體的虛擬變數不顯著將其刪去,那麼 LSDV 的結果就不會與 FE 相同。使用 LSDV 的好處是可以得到對個體異質性 的估計(模型中的 ),但如果 很大,則需要在回歸方程中加入很多虛擬變數,可能超出一些計量軟體的最大解釋變數數量。
LSDV 法深受不少研究者的喜愛,因為它操作簡便,可解釋性也強。
考慮固定效應模型,可以對個體效應模型 進行差分處理:
於是,把兩個方程相減,就可以得到一階差分方程,從而消除個體效應:
對此差分模型使用 OLS 估計即得到 一階差分估計量 ( First Differencing Estimator ),記為 。由於 不再出現在差分方程中,只要擾動項的一階差分 與解釋變數的一階差分 不相關,則 就是一致的,這比 的嚴格外生性要求更弱,是 的優點。
不過,可以證明,在 下, 比 更有效率。因此,在實踐上,主要使用 而不是 。但對於動態面板,嚴格外生性無法滿足,則主要用 。
上面的個體固定效應解決了不隨時間而變但隨個體而變(time invariant)的遺漏變數問題。
類似地,引入時間固定效應,則可解決不隨個體而變但隨時間而變(indivial invariant)的遺漏變數問題。
假設模型為:
其中, 不可觀測,定義 ,則上式可以寫成:
在上式,可將 視為第 期獨有的截距項,並將其解釋為 第 期 對被解釋變數 的效應。於是,這些 稱為 時間固定效應 (time fixed effects)。
顯然,這個模型可以用 LSDV 法來估計,即對每時期定義一個虛擬變數,然後把 個時間虛擬變數包括在回歸方程中,比如:
其中,時間虛擬變數 如果 否則 。對於上面的式子,既考慮了個體固定效應( 的 )、又考慮了時間固定效應( 的 ),所以稱為 雙向固定效應 (Two-way FE)。相應的,如果僅考慮個體固定效應(如15.4.1 的模型)則稱為 單向固定效應 (One-way FE)。
有些情況,為了節省參數,可以引入時間趨勢項,以代替 個時間虛擬變數:
顯然,這個式子隱含著一個較強的假定:每個時期的時間效應應該增長, 隨時間 是均勻增長的。
如果此假定不大可能成立,那麼就應該使用 a. 的時間虛擬變數法;該方法可以獨立估計每一期的時間固定效應,也可以用於判斷每期的時間效應是否大致相等。
❹ 10年*11個樣本 總樣本110可以做面板數據么用SPSS
可以的,但是不太專業,因為SPSS做截面數據好一些。做一個DW檢驗(杜賓檢驗)會好一些。如果要求比較高的論文就,比如金融經濟什麼的,就要用eviews了。如果是畢業論文,和導師溝通一下,看他的要求。
❺ 面板數據11個樣本7年數據夠嗎
夠。數據是7年的,每一年都有15個數據,共105組觀測值。表11.1.11996-2002年中國東北、華北、華東15個省級地區的居民家庭人均消費數據。
❻ 面板數據模型的定義和操作方法
(第3組 宏現經濟增長與發展,6686個字元)
中國能源、環境與經濟增長基於面板數據的計量分析
王洲洋
(河北經貿大學數統學院,石家莊,050061)
摘 要
本文運用面板數據的分析方法對我國各地區的能源消費、環境污染與經濟增長進行了實證研究。研究表明:能源消費、環境污染與經濟增長變數均為不平穩變數,但它們之間存在著長期的協整關系。如果能源供應每增加1%,GDP就會增加0.269%;環境污染每減少1%,GDP就能增加0.043%。
關鍵詞 經濟增長 面板協整檢驗 Hausman檢驗
Abstract
This paper assesses the relationship among the energy consumption, environment pollution and economic growth in all the regions of China by the method of Panel Data. Research results indicate that the energy consumption, environment pollution and economic growth are not balanced variables,but they have the Co-integration relations in a long run.If the energy supply increases 1%,the economic growth will increase 0.269%;And if the environment pollution decreases 1%,the economic growth will increase 0.043%.
Key words : economical growth Panel data Co-integration Test Hausman-test
一、引言
自從進入工業化時期以來,世界上許多國家為了追求經濟的快速增長和物質產品的極大豐富,對能源進行了大規模的開發和利用,而能源的逐漸枯竭及能源帶來的生態環境問題,都將嚴重阻礙經濟的發展。環境作為經濟、社會發展的物質條件,作為經濟發展的基礎,既可以直接地促進經濟的發展,也可能成為經濟的發展的阻力,環境污染已成為危害人們健康、制約經濟和社會發展的重要因素之一。如今能源與環境問題已成為制約一個國家經濟增長的瓶頸,而這種現象在我國尤為突出。不斷開發新能源,開發可再生能源,提高能源利用效率,保護環境將對我國經濟發展起到重要作用。黨的十七大報告再次強調要加強能源資源節約和生態環境保護,並指出,加強能源資源節約和環境環境保護,增強可持續發展能力,堅持節約資源和保護環境的基本國策,關系人民群眾切身利益和中華民族生存發展。因此,對於我國能源消費、環境保護和經濟發展的關系研究具有十分重要的理論價值和現實意義。
近年來我國的能源、環境問題已成為被關注的熱點,許多學者從不同的角度進行了大量的分析,得出了許多有用的啟示。如林伯強[1](2003)通過協整分析考察了我國能源需求與經濟增長的關系;王逢寶[2]等(2006)運用線性回歸的方法對區域能源、環境與經濟增長進行了研究。馮秀[3](2006)則探討了我國能源利用現狀及能源、環境與經濟增之長的關系。林師模等[4](2006)研究了能源技術創新對我國經濟,環境與能源之間的關系。目前大多的文獻是用時間序列的數據,或是從總量的角度來分析全國或某個地區的能源消費、環境污染與經濟增長之間的關系,但由於我國幅員遼闊,各地區間的經濟、能源消費與環境方面都存在著巨大的差異,因而不能把各個地區的經濟、能源消費與環境污染視為一個同質的整體,且運用時間序列數據往往很難解釋它們間的內在聯系。
本文使用我國省級的面板數據,運用面板數據的分析方法對我國各地區的能源消費、環境污染與經濟增長進行實證分析,從而來揭示我國能源消費、環境污染與經濟增長之間的內在聯系。
二、研究方法
面板數據分析方法是最近幾十年來發展起來的新的統計方法,面板數據可以克服時間序列分析受多重共線性的困擾,能夠提供更多的信息、更多的變化、更少共線性、更多的自由度和更高的估計效率,而面板數據的單位根檢驗和協整分析是當前最前沿的領域之一。在本文的研究中,我們首先運用面板數據的單位根檢驗與協整檢驗來考察能源消費、環境污染與經濟增長之間的長期關系,然後建立計量模型來量化它們之間的內在聯系。
面板數據的單位根檢驗的方法主要有 Levin,Lin and CHU(2002)提出的LLC檢驗方法[5]。Im,Pesearn,Shin(2003)提出的IPS檢驗[6] , Maddala和Wu(1999),Choi(2001)提出的ADF和PP檢驗[7]等。面板數據的協整檢驗的方法主要有Pedroni[8] (1999,2004)和Kao[9](1999)提出的檢驗方法,這兩種檢驗方法的原假設均為不存在協整關系,從面板數據中得到殘差統計量進行檢驗。Luciano(2003)中運用Monte Carlo模擬[10]對協整檢驗的幾種方法進行比較,說明在T較小(大)時,Kao檢驗比Pedroni檢驗更高(低)的功效。具體面板數據單位根檢驗和協整檢驗的方法見參考文獻[5-10]。
三、實證分析
1.指標選取和數據來源
經濟增長:本文使用地區生產總值 ,以1999年為基期,根據各地區生產總值指數折算成實際 ,單位:億元。
能源消費:考慮到近年來我國能源消費總量中,煤炭和石油供需存在著明顯低估,而電力消費數據相當准確。因此使用電力消費更能准確反映能源消費與經濟增長之間的內在聯系(林伯強,2003)。所以本文使用各地區電力消費量 作為能源消費量,單位:億千瓦小時。
環境污染:污染物以氣休、液體、固體形態存在,本文選取工業廢水排放量 作為環境污染的量化指標,單位:萬噸。
本文採用1999-2006年全國30個省(直轄市,自治區)的地區生產總值 、電力消費量 和工業廢水排放量 的數據構建面板數據集。30個省(直轄市,自治區)包括北京、天津、河北、遼寧、上海、江蘇、浙江、福建、山東、廣東、山西、內蒙古、吉林、黑龍江、安徽、江西、河南、湖北、湖南、海南、廣西、重慶、四川、貴州、雲南、陝西、西藏、甘肅、青海、寧夏、新疆,由於西藏數據不全故不包括在內。數據來源於《中國統計年鑒2000-2007》。為了消除變數間可能存在的異方差,本文先對 、 和 進行自然對數變換。
記 , , .
2.面板數據的單位根檢驗
為了避免單一方法可能存在的缺陷,本文使用LLC檢驗、IPS檢驗、Fisher-ADF檢驗和Fisher-PP檢驗四種方法來進行面板數據的單位根檢驗。利用Eviews 6.0軟體(下同),檢驗結果見表1。
表1 , , 的面板單位根檢驗
變 量 LLC p值 IPS p值 Fisher-ADF p值 Fisher-PP p值
4.21 1.00 5.78 1.00 16.95 1.00 7.67 1.00
6.35 1.00 10.24 1.00 5.37 1.00 9.45 1.00
-2.91 0.0018 1.26 0.89 56.97 0.058 90,56 0.0066
-14.89 0.00 -3.17 0.0008 103.88 0.0004 86.42 0.0144
-21.99 0.00 -5.80 0.00 143.77 0.00 146.44 0.00
-12.21 0.00 -4.52 0.00 135.51 0.00 184.48 0.00
從表1可以看出, , 在5%水平不平穩,經一階差分後 , 均在5%水平拒絕原假設, 的LLC檢驗在5%水平不顯著,但其它三種檢驗方法均顯著, 的四種檢驗方法均在5%水平下拒絕原假,所以我們認為 , , 均為一階差分平穩變數。
3.面板數據的協整檢驗
對 , , 的協整關系進行Pedroni協整檢驗和Kao協整檢驗。其檢驗結果見表2和表3。
表2 Pedroni協整檢驗
統計量 p值
Panel v統計量 -1.145 0.0056
Panel rho統計量 2.588 0.0277
Panel PP統計量 -1.543 0.0013
Panel ADF統計量 -3.811 0.0000
Group rho統計量 5.088 0.0000
Group PP統計量 -2.559 0.0151
Group ADF統計量 -6.985 0.0000
表3 Kao協整檢驗
t統計量 p值
ADF -5.873 0.0000
由表2和表3的面板協整檢驗結果可知: Pedroni協整檢驗的七個統計量與Kao協整檢驗的ADF統計量均在5%顯著性水平下拒絕原假設,表明 , , 之間存在顯著的協整關系。
4.模型檢驗
(1) 固定效應模型顯著性檢驗
固定效應模型顯著性檢驗是檢驗模型中固定效應系數 是否有差異,即原假設為 。其檢驗結果如表4所示:
表4 固定效應模型的顯著性檢驗
固定效應顯著性檢驗 統計量 自由度 p值
Cross-section F 374.484 (29,208) 0.0000
Cross-section Chi-square 953.827 29 0.0000
由表4固定效應模型的顯著性檢驗結果可知,p值小於5%,因此拒絕固定效應系數 相同的原假設,所以我們選取固定效應模型比較合適。
(2)Hausman檢驗
Hausman檢驗的原假設是隨機效應模型的系數與固定效應模型的系數沒有差別,如果接受原假設,表明應選擇隨機效應模型,否則就應該選擇固定效應模型。檢驗結果在表4和表5中列出。
表5 Hausman檢驗
Chi-Sq. 統計量 Chi-Sq. Statistic自由度 p值
Cross-section random 117.766 2 0.000
表6 固定效應與隨機效應檢驗比較
變數 固定效應 隨機效應 兩種效應方差之差 p值
0.269 0.279 0.000002 0.0000
-0.0434 -0.017 0.000007 0.0000
從表5中Hausman檢驗結果與表6中固定效應與隨機效應檢驗比較可以看出,p值在5%水平下拒絕原假設,模型中被忽視的效應與模型中的兩個解釋變數相關,所以我們認為固定效應模型是更好的選擇。
5.模型的估計
根據上面的分析我們採用固定效應模型對模型進行估計,模型估計結果如下式所示:
(1)
(44.647) (20.341) (-3.097)
[0.0000] [0.0000] [0.0022]
小括弧中是t統計量,中括弧中是相應的p值。
模型調整後的 為0.996,F值為2484.3,殘差平方和為0.599,各個系數均通過t檢驗,模型擬合的相當不錯。
固定效應系數 見表7所示:
表7各地區的固定效應系數
地區
地區
地區
北京 0.207 浙江 0.792 海南 -1.044
天津 -0.268 安徽 0.283 重慶 -0.222
河北 0.582 福建 0.425 四川 0.440
山西 -0.351 江西 -0.00158 貴州 -0.808
內蒙古 -0.454 山東 1.034 雲南 -0.121
遼寧 0.473 河南 0.623 陝西 -0.228
吉林 -0.138 湖北 0.429 甘肅 -0.815
黑龍江 0.251 湖南 0.424 青海 -1.962
上海 0.555 廣東 1.139 寧夏 -1.908
江蘇 1.058 廣西 -0.0147 新疆 -0.380
式(1)表明,GDP與能源消費、環境污染之間存在著顯著的長期均衡關系,從全國的平均水平來看,能源消費的彈性系數是0.269,也就是能源供應每增加1%,GDP就會增加0.269%;環境污染的彈性系數是-0.043,即環境污染每減少1%,GDP就能增加0.043%,這說明GDP與環境污染存在著反向的關系,與我們普遍認為的保護環境能促進經濟健康快速發展的觀點相一致。
四、主要結論
本文通過採用比較前沿的面板單位根檢驗、面板協整檢驗等分析方法,對1999年到2006年我國能源消費、環境污染與經濟增長的省級面板數據進行了實證研究。研究表明:我國能源消費、環境污染與經濟增長均為不平穩過程,這主要是因為我國各地區由於政策、環境等多種原因,使得各地區間存在著很大的差異,所以不同的地區表現出非一致性,但不同地區的能源消費、環境污染與經濟增長之間都存在著顯著的協整關系。能源和環境作為經濟持續增長的要素,對我國經濟發展有著重大的影響作用。能源供應與經濟增長存在著正向的關系,經濟增長對能源有很強的信賴性,而環境污染與經濟增長存在著反向的關系,環境污染程度的加劇將會嚴重阻礙經濟的增長。從全國平均水平來看,能源供應每增加1%,GDP將增加0.269%;環境污染每減少1%,GDP將增加0.043%。因此堅持節約能源、提高能源使用效率和保護環境將對我國經濟的持續、快速、健康發展具有極其重要的意義。
需要指出的是,由於數據方面的原因,本文使用的面板數據時間跨度並不長(1999-2006),得到的長期關系有可能受到質疑 (DimitrisK.Christopoulos and Efthvmios G.Tsionas,2004) [11]。本文使用各地區電力消費量來代替能源消費總量,工業廢水排放量來反映環境污染程度,但它們都只反映了能源消費、環境污染程度的一個方面,所以指標的選取並不全面,應該將煤、石油等能源的消費以及大氣污染、固體廢棄物污染等全部納入指標體系,這樣指標體系才更加全面、更加合理,這有待我們今後更加深入的研究。
參考文獻:
[1]林伯強:《電力消費與中國經濟增長:基於生產函數的研究》[J],《管理世界》2003年第11期。
[2]王逢寶、張磊、秦貞蘭:《能源、環境與區域經濟增長的計量分析》[J],《天津財貿管理幹部學院學報》2006年第3期。
[3]馮秀、丁勇:《可持續發展下中國的能源、環境與經濟》[J],《北方經濟》2006年第2期。
[4]林師模、蘇漢邦、林幸樺:《能源技術創新對經濟、能源及環境》的影響[J]《東莞理工學院學報》2006年第4期。
[5]Levin.A.,C.F.Lin Unit Root Tests in Panel Data:Asymptotic and Finite Sample Properties[C].UC San Diego.Working Paper,1992.92-93.
[6]Im K.S.,M.H.Pesaran and Y.Shin.Testing for Unit Roots in Heterogeneous Panels[J].Journal of Econometrics 2003,115:53-74.
[7]Maddala G.S.,Wu Shaowen,1999.Acomparative Study of Unit Root Tests with Panel Data and a New Simple Test [J].Oxford Bulletin of Economics and Statistics,1999,61:631-652.
[8]Luciano,G..On the Power of Panel Cointegration Tests:A Monte Carlo Comparison[J].Economics Letters,2003,80:105-111.
[9]Pedroni,P.Critical Value for Cointegration Tests in Heterogeneous Panels with Multiple Regressors[J].Oxford Bulletin of Economics and Statistics,1999,61:653-678.
[10]Kao,C,Spurious Regression and Resial-based Tests for Cointetration in Panel Data[J].Journal of Econometrics,1999,90:1-44.
[11]Dimitris K. Christopoulos,Efthymios G.Tsionas,2004,Financial development and economic growth: evidence from panel.
❼ 面板數據要進行平穩性檢驗嗎 只有五年五個數據
數據量少的話一般無須做平穩性檢驗。
但同時還得考慮用這些數據做什麼,如果
是時間序列預測,則必須做該檢驗