2.4 Tính đồng nhất của các hệ số Các mô hình dữ liệu bảng truyền thống như FE, RE hay GMM đều giả định các hệ số đồng nhất hay không thay đổi giữa các đơn vị bảng. Tuy nhiên, điều này không phù hợp khi mô hình tồn tại các hệ số độ dốc thay đổi. Vậy làm thế nào để kiểm tra tính đồng nhất của các hệ số hay mô hình có hệ số thay đổi? Trên Stata, chúng ta có thể sử dụng câu lệnh xthst để kiểm tra tính đồng nhất của các hệ số độ dốc trong các mô hình dữ liệu bảng với N lớn tương đối so với T. Ghi chú Câu lệnh xthst thực hiện kiểm định Delta theo (Pesaran và Yamagata 2008). Giả thuyết H0 của kiểm định là các hệ số độ dốc là đồng nhất giữa các đơn vị bảng (slope coefficients are homogeneous across cross-sectional units). Giả thuyết thay thế là các hệ số độ dốc thay đổi (khác nhau hay không đồng nhất) giữa các đơn vị bảng. Việc thực hiện kiểm định Delta qua câu lệnh xthst phù hợp trong trường hợp mô hình tồn tại các vấn đề phương sai thay đổi và tự tương quan (HAC – heteroskedasticity auto-correlation) cũng như tồn tại vấn đề phụ thuộc chéo (cross-sectional dependence) giữa các phần dư trong dữ liệu bảng. Các mô hình hồi quy dữ liệu bảng truyền thống như FE và RE, tất cả đều giả định các tham số (hệ số) của các biến là đồng nhất giữa các đơn vị bảng (cross-sectional units). Tuy nhiên, theo Pesaran and Smith (1995) thì việc bỏ qua tính không đồng nhất của các hệ số có thể dẫn đến sự thiên chệch trong kết quả. Như vậy, chỉ khi giả định về tính đồng nhất của các hệ số được duy trì thì tính hợp lệ của các kết quả phân tích mới được đảm bảo. Phương pháp kiểm tra tính đồng nhất Có 3 phương pháp phổ biến để kiểm tra tính đồng nhất của các hệ số là sử dụng kiểm định được đề xuất bởi Swamey (1970), Pesaran et al. (1996) và Pesaran and Yamagata (2008). Phương pháp Swamey (1970) Theo Baltagi (2013, p. 64) thì một trong những cách kiểm tra giả định đồng nhất này là sử dụng kiểm định F (Swamey, 1970) về sự khác nhau của tổng bình phương phần dư (sum of squared residuals) giữa mô hình OLS gộp (pooled ordinary least squares) và mô hình hồi quy OLS cho mỗi đơn vị bảng cụ thể (cross-section unit specific OLS regression). Tuy nhiên, cách kiểm tra này lại dựa vào một giả định khác về tính đồng nhất của phương sai sai số. Ngoài ra, kiểm định F dựa trên N giả định cố định sẽ cho rất kết quả kém, trừ khi T > N (Bun, 2004). Dữ liệu bảng với T > N là không phổ biến trong các nghiên cứu thực nghiệm về dữ liệu bảng. Phương pháp Pesaran et al (1996) Pesaran et al. (1996) đề xuất một dạng kiểm định Hausman cho các dữ liệu có N > T bằng cách so sánh ước lượng FE với các ước lượng OLS riêng rẽ. Nhưng thủ tục này là không áp dụng với các mô hình dữ liệu bảng chỉ với các biến ngoại sinh ngặt (strictly exogenous) hoặc các mô hình tự hồi quy (Pesaran and Yamagata 2008). Phương pháp Pesaran and Yamagata (2008) Pesaran and Yamagata (2008) đề xuất kiểm định Delta, là một sự chuẩn hóa của kiểm định Swamey (1970) với giả thuyết H0 về sự đồng nhất giữa các hệ số trong trường hợp N lớn tương đối so với T. Điều này có nghĩa là tất cả các hệ số độ dốc là bằng nhau giữa các đơn vị chéo. Ý tưởng của kiểm định là so sánh sự khác nhau giữa các hệ số nhận được bởi ước lượng FE và các hồi quy OLS riêng với trọng số là các sai số chuẩn của các hồi quy OLS riêng. Giá trị kiểm định càng lớn cho thấy có sự khác biệt lớn giữa các ước lượng, do vậy, giả thuyết về tính đồng nhất của hệ số càng có khả năng bị bác bỏ. Bằng cách sử dụng các kiểm định Delta của Pesaran and Yamagata (2008) chúng ta có thể kiểm định giả thuyết không về tính đồng nhất của các hệ số. Sự bác bỏ của giả thuyết không cho thấy các phương trình riêng rẽ của các đơn vị bảng có thể khác nhau và các kiểm định cho dữ liệu bảng được sử dụng cho phép sự không đồng nhất này. Kiểm định thống kê Delta theo giả thuyết không được tính: Δ~=N(N–1S~–k2k) Trong đó: N là cỡ mẫu, k là số các biến giải thích và S~ là giá trị thống kê Swamy. Đối với các mẫu nhỏ thì có thể sử dụng thống kê Delta điều chỉnh sau: Δ~adj=N(N–1S~–k2k(T–k–1)/(T+1)) Vì vậy, theo đề xuất Pesaran và Yamagata (2008) thì kiểm định Delta cho phép xét đến tính không đồng nhất của phần dư (residual heteroskedasticity). Ngoài ra, vấn đề phương sai thay đổi và tự tương quan (HAC) được (Blomquist and Westerlund, 2016) hay vấn đề phụ thuộc chéo (Pesaran, 2006) cũng được (Chudik and Pesaran, 2015b) đề xuất bổ sung trong kiểm định. Tất cả đều thể hiện đầy đủ trong gói lệnh xthst của Bersvendsen and Ditzen (2020). Thông qua các kết quả mô phỏng, Bersvendsen and Ditzen (2020) cho rằng bằng cách thêm các thành phần trung bình chéo (cross sectional averages) vào mô hình sẽ giải quyết được vấn đề phụ thuộc chéo trong thành phần sai số và các biến. Mô hình hệ số độ dốc thay đổi Xét một mô hình dữ liệu bảng với hệ số độ dốc thay đổi: yit=μi+β1i,t/x1i,t+β2i,t/x2i,t+εi,t Trong đó: i = 1, …, N là các đơn vị chéo, t = 1, …, T là các mốc thời gian. β1i và β2i lần lượt là k1 và k2 vector tham số độ dốc chưa biết. x1i,t và x1i,t lần lượt là k1 và k2 vector các biến giải thích ngoại sinh. Giả thuyết H0 của kiểm định quan tâm: H0:β2i=β2 cho các i với giả thuyết thế H1: H1:β2i≠β2 Chỉ kiểm tra tính đồng nhất của các hệ số quan tâm trong β2i. Các hệ số còn lại trong β1i được giả định là không đồng nhất, hay β1i≠β1. Trường hợp đặc biệt, k1 = 0 thì tương đương với trường hợp kiểm tra tất cả các biến. Kiểm tra tính đồng nhất qua câu lệnh xthst Câu lệnh xthst sử dụng được trong cả trường hợp dữ liệu bảng cân bằng và không cân bằng. Nó cho phép ước lượng các mô hình chỉ với biến ngoại sinh ngặt hoặc các dạng mô hình tự hồi quy AR(p). Cú pháp lệnh xthst xthst depvar indepvars [if] [, partial(varlist_p) noconstant ar hac bw(integer) whitening kernel(qs|bartlett|truncated) crosssectional(varlist_cr [,cr_lags(numlist)]) nooutput comparehac ] Trong đó: depvar là biến phụ thuộc của mô hình, indepvar là danh sách các biến giải thích, varlist_p là các biến được loại (partialled out) khỏi các biến cần kiểm tra, varlist_cr là các biến trung bình (theo thời gian) được thêm vào như là các trung bình chéo để loại bỏ sự phụ thuộc chéo quan trọng (strong cross-sectional dependence) Tùy chọn lệnh xthst noconstant bỏ qua các hằng số riêng. partial(varlist_p) chỉ ra các biến ngoại sinh trong varlist_p không xét (nhóm biến x1i). Theo mô hình đã trình bày đây là các biến được giả định có độ dốc không đồng nhất (heterogeneous slopes). ar thiết bậc tự tương quan trong mô hình AR(p). hac chỉ định thực hiện kiểm định tính vững cho vấn đề HAC theo Blomquist and Westerlund (2013). crosssectional(varlist_cr [,cr_lags(numlist)]) xác định các biến được thêm vào dạng các trung bình chéo để kiểm soát vấn đề phụ thuộc chéo. Các biến trong varlist_cr là các biến được loại. cr_lags(numlist) thiết lập số độ trễ của thành phần trung bình chéo. nooutput bỏ qua phần kết quả. comparehac so sánh kết quả kiểm định Delta chuẩn (Pesaran and Yamagata, 2008) với dạng điều chỉnh HAC (Blomquist and Westerlund, 2013). Minh họa kiểm tra tính đồng nhất qua lệnh xthst Sử dụng dữ liệu từ Penn World Tables 8.0 (Feenstra et al., 2015) gồm 93 quốc gia trong 48 năm (từ 1960 – 2007). Mô hình xem xét là mô hình tăng trưởng Solow đơn giản (growth model) với biến phụ thuộc là tăng trưởng GDP bình quân đầu người (log_rgdpo) và các biến giải thích là vốn nhân lực (log_hc), vốn đầu tư (log_ck) và tốc độ gia tăng dân số cộng (log_ngd). Các chuỗi kinh tế vĩ mô thường có tính chất động thông qua sự tự tương quan của các chuỗi phần dư. Xét một mô hình động và kiểm tra xem có bất kỳ hệ số độ dốc nào là đồng nhất hay không không đồng nhất. . use pwt8.dta, clear . xthst d.log_rgdp log_hc log_ck log_ngd Testing for slope heterogeneity (Pesaran, Yamagata. 2008. Journal of Econometrics) H0: slope coefficients are homogenous ------------------------------------- Delta p-value 6.328 0.000 adj. 6.694 0.000 ------------------------------------- Variables partialled out: constant Lệnh xthst giả định thành phần hằng số là không đổi và loại khỏi kiểm định Kiểm tra với chuỗi log_rgdpo có dạng ar(1) . xthst d.log_rgdp L.d.log_rgdp Testing for slope heterogeneity (Pesaran, Yamagata. 2008. Journal of Econometrics) H0: slope coefficients are homogenous ------------------------------------- Delta p-value 4.050 0.000 adj. 4.189 0.000 ------------------------------------- Variables partialled out: constant Kiểm tra với với chuỗi log_rgdpo có dạng ARDL(1,0) . xthst d.log_rgdp L.d.log_rgdp log_hc log_ck log_ngd Testing for slope heterogeneity (Pesaran, Yamagata. 2008. Journal of Econometrics) H0: slope coefficients are homogenous ------------------------------------- Delta p-value 2.957 0.003 adj. 3.171 0.002 ------------------------------------- Variables partialled out: constant Trong trường hợp giả định rằng hệ số của tất cả các biến ngoại trừ GDP là không đồng nhất thì tùy chọn partial() có thể được sử dụng. Trong trường hợp này các biến được chỉ ra trong tùy chọn partial() được giả định là không đồng nhất và được loại ra khỏi kiểm định. Đây là một ví dụ của trường hợp kiểm định mẫu con. Giả sử chúng ta chỉ muốn kiểm tra tính không đồng nhất trong các độ trễ của biến phụ thuộc thì sử dụng tùy chọn partial() để loại những biến còn lại khỏi kiểm định: . xthst d.log_rgdp L.d.log_rgdp log_hc log_ck log_ngd, partial(log_hc log_ck log_ngd) Testing for slope heterogeneity (Pesaran, Yamagata. 2008. Journal of Econometrics) H0: slope coefficients are homogenous ------------------------------------- Delta p-value 2.324 0.020 adj. 2.409 0.016 ------------------------------------- Variables partialled out: log_hc log_ck log_ngd constant Kiểm định xác nhận rằng hệ số của biến trễ GDP là không đồng nhất. Giá trị kiểm định thống kê giảm trong sự so sánh với mô hình bên trên. Tùy chọn hac được sử dụng để thực hiện kiểm định Blomquist and Westerlund (2013) . xthst d.log_rgdp L.d.log_rgdp log_hc log_ck log_ngd, hac Testing for slope heterogeneity (Blomquist, Westerlund. 2013. Economic Letters) H0: slope coefficients are homogenous ------------------------------------- Delta p-value 12.203 0.000 adj. 13.086 0.000 ------------------------------------- HAC Kernel: bartlett with average bandwith 3 Variables partialled out: constant Câu lệnh xthst cũng có thể được sử dụng để lựa chọn mô hình hay so sánh các kết quả. Tùy chọn comparehac so sánh kết quả giữa kiểm định Delta chuẩn và kiểm định HAC. Câu lệnh xthst cũng được sử dụng để để kiểm tra mức độ phụ thuộc chéo tương tự như câu lệnh xtcd2 hoặc xtcse2 (Ditzen 2018, 2019). Ghi chú Nếu câu lệnh xtcd2 chưa được cài (không có sẵn) trên máy của bạn thì Stata sẽ thông báo: xtcd2 not installed. No tests for cross-sectional dependence will be performed. Please install from findit xtcd2. Khi đó, bạn có thể sử dụng lệnh ssc install để cài. ssc install xtcd2 . xthst d.log_rgdp L.d.log_rgdp log_hc log_ck log_ngd, comparehac Testing for slope heterogeneity H0: slope coefficients are homogenous ------------------------------------- Delta p-value 2.957 0.003 adj. 3.171 0.002 ------------------------------------- Delta (HAC) p-value -0.534 0.593 adj. -0.573 0.567 ------------------------------------- Tests disagree. Autocorrelation might occur. See helpfile for further info. HAC Settings: Kernel: quadratic spectral (QS) with average bandwith 45 Variables partialled out: constant Cross Sectional dependence in base variables detected: D.log_rgdpo LD.log_rgdpo log_hc log_ck log_ngd See helpfile for xthst and xtcd2 for further info. Kết quả cho thấy rằng tồn tại một sự phụ thuộc chéo quan trọng (strong cross-sectional dependence) cho tất cả các biến. Vì vậy, cần thiết bổ sung các thành phần trung bình chéo để giảm thiểu vấn đề phụ thuộc này. Cụ thể, chúng tôi đã thêm 2 độ trễ cho biến phụ thuộc (D.log_rgdpo) và 3 độ trễ cho các biến còn lại (biến log_ck, log_hc và log_ngd) . xthst d.log_rgdp L.d.log_rgdp log_hc log_ck log_ngd , cr(d.log_rgdp log_hc log_ck log_ngd, cr_lags(2 3)) Testing for slope heterogeneity (Pesaran, Yamagata. 2008. Journal of Econometrics) H0: slope coefficients are homogenous ------------------------------------- Delta p-value 5.755 0.000 adj. 6.492 0.000 ------------------------------------- Variables partialled out: constant Cross Sectional Averaged Variables: D.log_rgdpo(2) log_hc(3) log_ck(3)
hightlight toàn bộ