Kinh tế lượng: Độ co giãn có ý nghĩa trong hồi quy của tôi hay bất kỳ?


13

Vài tháng trước tôi đã thực tập tại tổ chức này; và, như một món quà đi xa, tôi quyết định dành tuần trước của mình, với bất cứ thời gian nào tôi có, để điều tra các yếu tố ảnh hưởng đến lương giáo viên. Một vấn đề mà tôi gặp phải với mức lương của giáo viên là sự phân phối cho trạng thái đã cho bị sai lệch. Tôi đã có rất nhiều quan sát bám vào phần dưới của phổ lương. Tôi đã cố gắng giải quyết điều này bằng cách kết hợp Chỉ số tiền lương có thể so sánh vào biến phụ thuộc của tôi (tiền lương giáo viên), nhưng kết quả tôi tìm thấy đã hoàn toàn lỗi thời đối với phạm vi dự án của tôi. Tôi thay vì quyết định đăng nhập biến phụ thuộc của tôi. Điều này là tốt bởi vì bây giờ tiền lương của tôi đã có một phân phối bình thường và nó trông hoàn hảo trong biểu đồ. Khi tôi bắt đầu thử nghiệm, tôi đã đến điểm mà tôi bị bỏ lại với một biến độc lập cuối cùng, khai thuế tài sản. Vấn đề với tiền lương quy định của tôi cũng rõ ràng trong các quan sát khai thuế tài sản của tôi. Tôi đã có một số lượng lớn các tờ khai thuế tài sản ở phía dưới của quang phổ. Vì vậy, tôi cũng đã đăng nhập biến này và nó vẫn vượt qua bài kiểm tra giả thuyết null.

Tôi không chắc liệu điều này có chính xác hay không, nhưng bằng cách so sánh sự thay đổi của một biến được ghi lại với một biến được ghi lại khác đã cho tôi độ co giãn. Giả sử điều này là chính xác, phương trình hồi quy của tôi (một cái gì đó như LogWages = B0 + B1 (LogPropertyTaxReturns)) cho thấy độ co giãn giữa hai biến. Điều này có ý nghĩa không? Nếu mục tiêu của tôi là xem mức lương nào của giáo viên bị ảnh hưởng nhiều nhất ở bất kỳ quận nào trong tiểu bang của tôi, thì việc thể hiện độ co giãn giữa hai biến có hữu ích không? Chúng tôi muốn nâng các quận có mức lương giáo viên thấp nhất lên cao hơn để tăng mức sống của họ, nhưng tôi sợ rằng tôi đã ngoại suy cách xa các quan sát thực tế rằng phương trình hồi quy kết luận của tôi là vô nghĩa.

Chỉnh sửa: Một trong những nỗi sợ lớn hơn của tôi là tôi nên sử dụng mô hình phi tuyến tính để hiển thị mối quan hệ. Tôi cảm thấy rằng việc buộc cả biến phụ thuộc và biến độc lập phải hợp tác trong hồi quy tuyến tính này là sai lệch theo một cách nào đó.


1
Nó hoàn toàn có ý nghĩa. Nhìn vào định nghĩa của độ co giãn. Về cơ bản, bạn có thông tin về hướng của mối quan hệ giữa Tiền lương và PropertyTaxReturns. Hơn nữa, bạn có một thước đo ước tính của mối quan hệ đó. Vì là Log-Log, tiền lương sẽ thay đổi theo phần trăm B1 trên một phần trăm thay đổi của tờ khai thuế tài sản. Bạn có thể làm một phân tích chuỗi thời gian về điều đó để xác nhận nó. Trên thực tế, chỉ cần vẽ biểu đồ tiền lương và khai thuế tài sản theo thời gian là đủ để thấy mối quan hệ là gì. Đó là một cách cơ bản không tính đến các biến ẩn và vv
Koba

@Koba Cảm ơn đã bình luận nhanh chóng. Không phải là vấn đề mặc dù độ co giãn thay đổi dọc theo đường cong? Điều hối tiếc lớn nhất của tôi là tôi có thể đã buộc mô hình phải tuyến tính, buộc độ co giãn phải khá ổn định. Nghĩ lại, có lẽ thực sự tốt hơn khi có một mô hình phi tuyến tính để phản ánh sự sai lệch này mà tôi đang nói đến.
rosenjcb

Không có gì sai trong việc chuyển đổi các biến bằng cách sử dụng log, căn bậc hai, đối ứng hoặc các phương thức khác. Bạn không ép buộc bất cứ điều gì. Bạn sử dụng các phép biến đổi để tìm mối quan hệ tuyến tính giữa các biến. Đôi khi thật dễ dàng như bạn chỉ cần sử dụng y = b0 + b1 * x. Các biến thời gian khác có liên quan tuyến tính theo cách phức tạp hơn như ví dụ log (y) = b0 + b1 * (1 / x). Hàm cuối cùng có thể cung cấp cho bạn một mối quan hệ tuyến tính tốt, nhưng khó diễn giải hơn, do đó bạn càng ít sử dụng phép biến đổi càng tốt.
Koba

Hàm log-log khá đơn giản là log (y) = b0 + b1 * log (x). B1 chính xác là phần trăm thay đổi trong y trên một phần trăm thay đổi trong x trong phân tích mặt cắt ngang của bạn. Một lần nữa, nếu bạn có dữ liệu này trong một khoảng thời gian nhất định, bạn có thể chỉ cần vẽ biểu đồ để xem mối quan hệ.
Koba

Tôi đã đăng nhập các biến trước đó và thực hiện các phép biến đổi khác cho các mô hình hồi quy của mình. Tôi chỉ lo lắng rằng tính đàn hồi đã giả vờ gặp mặt. Mặc dù, nghĩ lại, mô hình là tuyến tính, nó chỉ có vấn đề là có các biến phụ thuộc và độc lập với các phân phối sai lệch.
rosenjcb

Câu trả lời:


12

Câu trả lời cho câu hỏi là có, nó thực sự có ý nghĩa (ít nhất là về mặt toán học). Nếu bạn ước tính phương trình tuyến tính

W=β0+β1PTR,

sau đó , có nghĩa làβ1đại diện cho sự thay đổi biên củaPTRtrênW. Bây giờ, nếu bạn ước tínhβ1=WPTRβ1PTRW

log(W)=β0+β1log(PTR),

sau đó β 1 = ∂ β1=WPTRPTRW

Nói chung, các phép biến đổi tuyến tính chỉ ảnh hưởng đến việc giải thích cho các hệ số, nhưng tính hợp lệ của chính hồi quy (theo thuật ngữ kinh tế rộng) được đưa ra bởi các giả định của mô hình và các hiện tượng kinh tế được phân tích.


8

Y=αXβlnY=lnα+βlnX

Tôi đoán câu hỏi của bạn là liệu sử dụng hình thức chức năng này có ý nghĩa trong mô hình cụ thể của bạn hay không. Khó mà nói ra được. Như với bất kỳ hồi quy tuyến tính thông thường nào, bạn đang đưa ra một giả định về hình thức chức năng. Ít nhất bạn có thể nghĩ về nó như một xấp xỉ tuyến tính có ý nghĩa hơn sau khi chuyển đổi log-log.


7

xαβF

logyi=α+βlogxi+j=2Sγjχj+λjχjlogxi
χjγλ

Lưu ý rằng với tư cách là đại diện cho quyết định cơ bản "đúng", làm cho tất cả các phép biến đổi dẫn đến hồi quy tuyến tính đều sai. Trong thực tế, tất cả các mô hình sẽ sai. Câu hỏi thực sự là: số liệu thống kê bạn nhận được từ mô hình này có hữu ích cho vấn đề của bạn không? Nếu nghiên cứu của bạn tập trung vào việc xác định một mô hình cơ bản, đây có phải là khoảnh khắc cho bạn biết điều gì đó thú vị về mô hình sâu hơn đó không? Nếu bạn định hướng chính sách nhiều hơn, liệu một xấp xỉ với độ co giãn không đổi có giúp bạn đủ gần với sự thật rằng những cải tiến tiếp theo là không liên quan? Hoặc là những câu hỏi cực kỳ khó trả lời như một người quan sát bên ngoài. Nhưng nếu lựa chọn duy nhất bạn lo lắng là độ co giãn thay đổi, loại thử nghiệm tôi nêu ở trên có thể giúp bạn yên tâm hơn.


4

Các câu trả lời khác bao gồm các vấn đề chính, tôi muốn trả lời "Chỉnh sửa" được thực hiện bởi OP trong câu hỏi:

Chỉnh sửa: Một trong những nỗi sợ lớn hơn của tôi là tôi nên sử dụng mô hình phi tuyến tính để hiển thị mối quan hệ. Tôi cảm thấy rằng việc buộc cả biến phụ thuộc và biến độc lập phải hợp tác trong hồi quy tuyến tính này là sai lệch theo một cách nào đó.

Chúng ta có xu hướng quên rằng "biến đổi một biến" dẫn đến một biến mới , hành vi của chúng có thể hoàn toàn khác với "biến ban đầu". Ví dụ đơn giản nhất là so sánh các đồ thị của một biến và bình phương của nó.

Vì vậy, bằng cách xem xét các logarit tự nhiên của các biến của bạn, bạn không còn xem xét các mối quan hệ giữa họ , nhưng một mối quan hệ giữa một số chức năng của chúng.
Điều may mắn là khái niệm toán học của "logarit" có thể được liên kết với khái niệm "độ co giãn", mô tả mối quan hệ giữa các thay đổi tỷ lệ, đó là điều chúng ta hiểu theo quan điểm kinh tế và chúng ta có thể hiểu và sử dụng một cách có ý nghĩa.

Nếu các biến có thể được nói một cách hợp lý để thể hiện một "mối quan hệ tuyến tính trong logarit", điều đó có nghĩa là các mức của chúng (tức là các biến thực tế) có mối quan hệ phi tuyến tính:

lnya+blnxyea+xb

Vậy tại sao không ước tính một mô hình phi tuyến tính?
Trong nguyên tắc (toán học), không có lý do tại sao không. Một số vấn đề thực tế là:

1) Có quá nhiều dạng quan hệ phi tuyến tính, chỉ có một mối quan hệ tuyến tính (nói theo cấu trúc). Đây là vấn đề "chi phí tìm kiếm" cho thông số kỹ thuật phù hợp nhất.

2) Mối quan hệ phi tuyến tính thu được có thể không có một lời giải thích kinh tế rõ ràng . Tại sao đây là một vấn đề? Bởi vì, chúng ta không khám phá "quy luật tự nhiên" ở đây, không thay đổi qua thời gian và không gian. Chúng tôi đang xấp xỉ một hiện tượng xã hội. Có một xấp xỉ, hơn nữa, chỉ có thể được trình bày như một công thức toán học, mà không có lý do kinh tế xác nhận và hỗ trợ nó, làm cho kết quả rất mỏng.

3) Ước lượng phi tuyến tính kém ổn định, liên quan đến các cơ chế của thuật toán ước tính.


3

Tôi sẽ nói rằng mô hình của bạn trong trường hợp này có vẻ không có ý nghĩa nếu " mục tiêu của bạn là xem mức lương nào của giáo viên bị ảnh hưởng nhiều nhất ở bất kỳ quận nào trong tiểu bang của tôi ". Bạn vừa chỉ ra mối tương quan giữa (nhật ký) tiền lương và tờ khai thuế tài sản là gì. Bạn ít nhất nên sử dụng một hồi quy bội.

Tất nhiên, bạn có thể tiếp tục và phát triển một chiến lược nhận dạng đầy đủ, đúng đắn với các công cụ phương pháp phù hợp để ước tính cường độ của từng hiệu ứng nhân quả và tìm ra lớn nhất ... Trong thực tế, rất có thể bạn sẽ không thể để làm điều đó với sự phức tạp của một nhiệm vụ như vậy. Đó chỉ là một sự tinh chỉnh liên tục và bạn đang ở gần mô hình thô sơ nhất có thể được sử dụng để giải thích tiền lương, rất xa so với những gì tôi sẽ xem xét các xấp xỉ chấp nhận được của một câu trả lời cho câu hỏi tiềm ẩn trong mục tiêu của bạn. Bạn nên cố gắng tranh thủ sự giúp đỡ của một nhà kinh tế lượng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.