Tỷ lệ hồi quy, còn gọi là Câu hỏi về Kronmal


14

Gần đây, các câu hỏi duyệt ngẫu nhiên đã kích hoạt một bộ nhớ nhận xét trái tay từ một trong những giáo sư của tôi một vài năm trước cảnh báo về việc sử dụng các tỷ lệ trong các mô hình hồi quy. Vì vậy, tôi bắt đầu đọc về điều này, cuối cùng dẫn đến Kronmal 1993.

Tôi muốn đảm bảo rằng tôi diễn giải chính xác các đề xuất của anh ấy về cách mô hình hóa những đề xuất này.


  1. Z-1Y= =Z-11nβ0+Z-1XβX+βZ+Z-1ε

    • Tỷ lệ phụ thuộc hồi quy vào biến số mẫu số (nghịch đảo) ngoài các tỷ lệ khác
    • Trọng số của biến mẫu số (nghịch đảo)

  2. Y= =β0+βXX+Z1nα0+ZXαX+Z-1ε

    • Hồi quy tử số theo các biến ban đầu, mẫu số và mẫu số nhân các biến ban đầu [còn các biến phân loại thì sao?]
    • Trọng lượng theo mẫu số (nghịch đảo)
  3. Y= =β0+XβX+Z-11nβZ-1+WβW+Z-1WβZ-1W+ε

    • Bao gồm tử số và mẫu số (nghịch đảo) làm hiệu ứng chính, tỷ lệ là thuật ngữ tương tác.

Là những diễn giải của tôi ở đây là chính xác?

Câu trả lời:


1

Bạn thực sự nên liên kết với bài báo Kronmal (và giải thích ký hiệu của bạn, được lấy trực tiếp từ tờ giấy.) Việc đọc bài viết của bạn quá đúng nghĩa đen. Cụ thể, ông không đưa ra lời khuyên về trọng lượng, thay vào đó nói rằng việc cân có thể được thực hiện theo những cách thông thường, vì vậy không cần phải thảo luận. Nó chỉ được đề cập như một khả năng. Đọc trường hợp của bạn giống như các ví dụ, đặc biệt là các ví dụ về cách phân tích các tình huống như vậy.

Trong phần 6, ông đưa ra một số lời khuyên chung, mà tôi sẽ trích dẫn ở đây:

Thông điệp của bài viết này là các biến tỷ lệ chỉ nên được sử dụng trong ngữ cảnh của một mô hình tuyến tính đầy đủ, trong đó các biến tạo nên tỷ lệ được bao gồm và thuật ngữ chặn cũng xuất hiện. Thực tiễn phổ biến của việc sử dụng các tỷ lệ cho biến phụ thuộc hoặc biến độc lập trong phân tích hồi quy có thể dẫn đến suy luận sai lệch, và hiếm khi dẫn đến bất kỳ lợi ích nào. Tuy nhiên, thực tế này là phổ biến và cố thủ, và có thể khó thuyết phục một số nhà nghiên cứu rằng họ nên từ bỏ tỷ lệ hoặc chỉ số được đánh giá cao nhất của họ.

Bài viết sử dụng ví dụ (hư cấu) của Neyman về sinh và cò. Để chơi với ví dụ đó, bạn có thể truy cập nó từ R

data(stork, package="TeachingDemos")

Tôi sẽ để lại niềm vui cho độc giả, nhưng một cốt truyện thú vị là coplot:

âm mưu điều hòa cho ví dụ con cò Neyman

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.