Đặc điểm kỹ thuật của dữ liệu bảng


8

Tôi đang cố gắng tìm ra các đặc điểm kỹ thuật tốt nhất cho bộ dữ liệu của tôi.

Tôi đang cố gắng thăm dò tính hiệu quả của các đặc khu kinh tế ở Ba Lan theo nghĩa tăng trưởng của nền kinh tế theo ba mô hình dữ liệu tương tự cho các biến được giải thích: a) tỷ lệ thất nghiệp đã đăng ký b) GDP bình quân đầu người c) hình thành vốn cố định bình quân đầu người . Dữ liệu dành cho các tiểu vùng NUTS3. Các biến giải thích là: 0-1 cho sự hiện diện của SEZ trong tiểu vùng trong năm và một vài biến số kinh tế; tần suất hàng năm, dữ liệu là 2004-2012 cho 66 tiểu vùng.t

Tôi đã thử các hiệu ứng cố định và ngẫu nhiên. Hiện tại, tôi đã chọn FE, vì ý nghĩa và các dấu hiệu chính xác về mặt lý thuyết. Nhưng có một số vấn đề khiến tôi không thể chấp nhận điều đó:

  1. Làm thế nào để kiểm tra tự tương quan và tương quan chéo?

  2. Tôi không biết làm thế nào để kiểm tra phân phối của cụm từ lỗi trong Stata và hơn nữa nếu nó không được phân phối bình thường, tôi có nên quan tâm đến nó nhiều không?

  3. Theo tôi hiểu từ các tài liệu, các giá trị của hệ số tương quan giữa các biến giải thích và thuật ngữ lỗi gần -1 hoặc 1 không phải là vấn đề thực tế; trong trường hợp của tôi, nó gần -1 như bạn có thể thấy.

  4. Là một mô hình hỗn hợp thích hợp cho dữ liệu của tôi?

Tôi đính kèm kết quả cho mô hình giải thích tỷ lệ thất nghiệp.

Mã số:

xtreg  st_bezr sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2, fe

Fixed-effects (within) regression               Number of obs      =       594
Group variable: id                              Number of groups   =        66

R-sq:  within  = 0.4427                         Obs per group: min =         9
       between = 0.3479                                        avg =       9.0
       overall = 0.2365                                        max =         9

                                                F(6,522)           =     69.10
corr(u_i, Xb)  = -0.9961                        Prob > F           =    0.0000

-------------------------------------------------------------------------------------------
                  st_bezr |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
                    sse01 |  -1.406066   .4631984    -3.04   0.003    -2.316028   -.4961045
wartosc_sr_trw_per_capita |  -.0000963   .0000166    -5.79   0.000    -.0001289   -.0000636
           zatr_przem_bud |  -26.11989   4.992198    -5.23   0.000    -35.92716   -16.31263
  podm_gosp_na_10tys_ludn |  -.0201788   .0030788    -6.55   0.000    -.0262273   -.0141304
      proc_ludn_wiek_prod |  -229.1996   16.92631   -13.54   0.000    -262.4516   -195.9475
           ludnosc_na_km2 |   .0790167   .0120865     6.54   0.000     .0552726    .1027609
                    _cons |   161.9786   10.76989    15.04   0.000      140.821    183.1363
--------------------------+----------------------------------------------------------------
                  sigma_u |  53.986519
                  sigma_e |  2.5446248
                      rho |  .99778327   (fraction of variance due to u_i)
-------------------------------------------------------------------------------------------
F test that all u_i=0:     F(65, 522) =    27.09             Prob > F = 0.0000

Câu trả lời:


12

Đối với các lệnh Stata trong câu trả lời này, hãy để tôi thu thập các biến của bạn trong một cục bộ:
local xlist sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2
Vì vậy, bây giờ bạn luôn có thể gọi tất cả các biến bằng 'xlist'

1) Có hai lệnh mà bạn có thể sử dụng sau khi hồi quy hiệu ứng cố định.

  • xttest2thực hiện thử nghiệm LM Breusch-Pagan với giả thuyết không có sự phụ thuộc giữa các phần dư. Đây là một thử nghiệm cho mối tương quan đương thời. Không từ chối null có nghĩa là thử nghiệm không phát hiện bất kỳ sự phụ thuộc cắt ngang nào trong phần dư của bạn.
  • xttest3thực hiện một phiên bản sửa đổi của bài kiểm tra Wald cho tính không đồng nhất theo nhóm. Giả thuyết khống là đồng đẳng.

Bạn có thể cài đặt cả hai lệnh bằng cách gõ ssc instal xttest2ssc instal xttest3. Nếu bạn phát hiện mối tương quan giữa số dư của mình, bạn có thể sửa lỗi này bằng tùy chọn mạnh mẽ:
xtreg st_bezr 'xlist', fe robust

Để kiểm tra tự động tương quan, bạn có thể áp dụng phép thử Lagrange Multiplier thông qua xtserial:
xtserial st_bezr 'xlist'
Giả thuyết null không có tương quan nối tiếp. Để sửa cho cả tương quan nối tiếp và độ không đồng nhất, bạn có thể sử dụng tùy chọn cụm với biến id:
xtreg st_bezr 'xlist', fe cluster(id)

2) Đối với phép thử tính quy tắc cho phần dư: bạn có thể lấy phần dư qua lệnh dự đoán predict res, esau khi hồi quy hiệu ứng cố định. Để kiểm tra trực quan, bạn có thể sử dụng:

  • kdensity res, normal (âm mưu phân phối phần dư và so sánh nó với bình thường)
  • pnorm res (vẽ sơ đồ xác suất chuẩn chuẩn)
  • qnorm res (vẽ đồ thị lượng tử của phần dư so với lượng tử của phân phối chuẩn)

Với pnorm, bạn có thể thấy nếu có sự không quy tắc ở giữa phân phối và qnorm cho bạn thấy bất kỳ sự không quy tắc nào ở đuôi. Một bài kiểm tra chính thức có thể được lấy bằng swilk res. Giả thuyết khống là phần dư được phân phối bình thường. Nói chung, phi quy tắc không phải là một mối quan tâm quá lớn nhưng nó quan trọng đối với suy luận. Bạn có thể một lần nữa sửa cho điều này với tùy chọn mạnh mẽ.

3) Có corr(u_i, Xb) = -0.9961nghĩa là các hiệu ứng cố định có tương quan mạnh với các biến giải thích của bạn, vì vậy bạn đã làm tốt bằng cách kiểm soát các hiệu ứng cố định này. Một mối tương quan mạnh mẽ của loại này thường chỉ ra rằng OLS gộp hoặc các hiệu ứng ngẫu nhiên sẽ không phù hợp với mục đích của bạn vì cả hai mô hình này đều cho rằng tương quan giữa và là bằng không.uiXβ

4) Nói chung là có nhưng nó phụ thuộc vào những gì bạn muốn ước tính hoặc cách bạn có thể xử lý dữ liệu của mình, tức là các biến của bạn có phải là biến ngẫu nhiên hay không. Dưới đây là một lời giải thích tuyệt vời cho sự khác biệt giữa các hiệu ứng hỗn hợp và mô hình dữ liệu bảng điều khiển của @mpiktas chắc chắn sẽ giúp bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.