Tôi sẽ chủ yếu tập trung vào ba câu hỏi đầu tiên của bạn. Câu trả lời ngắn gọn là: (1) bạn cần so sánh ảnh hưởng của IV với DV trong từng khoảng thời gian nhưng (2) chỉ so sánh độ lớn có thể dẫn đến kết luận sai và (3) có nhiều cách để làm điều đó nhưng không có sự đồng thuận về cái nào là đúng
Dưới đây tôi mô tả lý do tại sao bạn không thể đơn giản so sánh cường độ hệ số và chỉ cho bạn một số giải pháp đã được nghĩ đến cho đến nay.
Theo Allison (1999), không giống như OLS, các hệ số hồi quy logistic bị ảnh hưởng bởi sự không đồng nhất không quan sát được ngay cả khi sự không đồng nhất như vậy không liên quan đến biến quan tâm.
Khi bạn phù hợp với hồi quy logistic như:
(1)
ln(11−pi)=β0+β1x1i
Thực tế, bạn đang điều chỉnh một phương trình dự đoán giá trị của biến tiềm ẩn đại diện cho xu hướng cơ bản của mỗi quan sát để giả sử giá trị trong biến phụ thuộc nhị phân, điều gì xảy ra nếu vượt quá ngưỡng nhất định. Phương trình cho điều đó là (Williams, 2009): 1 y *y∗1y*
(2)
y*= α0+ α1x1 tôi+ σε
Thuật ngữ được coi là độc lập với các thuật ngữ khác và tuân theo phân phối logistic - hoặc phân phối bình thường trong trường hợp probit và phân phối logistic trong trường hợp log-log bổ sung và phân phối cau chuốt trong trường hợp cauchit.ε
Theo Williams (2009), các hệ số trong phương trình 2 có liên quan đến các hệ số trong phương trình 1 đến:betaαβ
(3)
βj= αjσj = 1 , . . . , J.
Trong các phương trình 2 và 3, là hệ số tỷ lệ của biến thể không quan sát được và chúng ta có thể thấy rằng kích thước của các hệ số ước tính phụ thuộc vào , không được quan sát. Dựa vào đó, Allison (1999), Williams (2009) và Tâm trạng (2009), trong số những người khác, cho rằng bạn không thể so sánh một cách ngây thơ các hệ số giữa các mô hình logistic được ước tính cho các nhóm, quốc gia hoặc thời kỳ khác nhau.beta σσβσ
Điều này là do các so sánh có thể đưa ra kết luận không chính xác nếu sự khác biệt không quan sát được khác nhau giữa các nhóm, quốc gia hoặc thời kỳ. Cả hai so sánh sử dụng các mô hình khác nhau và sử dụng các thuật ngữ tương tác trong cùng một mô hình đều gặp phải vấn đề này. Bên cạnh logit, điều này cũng áp dụng cho probit anh em họ, clog-log, cauchit và, bằng cách mở rộng, cho các mô hình nguy hiểm thời gian riêng biệt được ước tính bằng cách sử dụng các chức năng liên kết này. Các mô hình logit được đặt hàng cũng bị ảnh hưởng bởi nó.
Williams (2009) lập luận rằng giải pháp là mô hình hóa biến thể không quan sát được thông qua mô hình lựa chọn không đồng nhất (hay còn gọi là mô hình quy mô vị trí) và cung cấp bổ sung Stata cho yêu oglm
cầu đó (Williams 2010). Trong R, các mô hình lựa chọn không đồng nhất có thể phù hợp với hetglm()
chức năng của glmx
gói, có sẵn thông qua CRAN. Cả hai chương trình đều rất dễ sử dụng. Cuối cùng, Williams (2009) đề cập đến PLUM
thói quen của SPSS để phù hợp với các mô hình này, nhưng tôi chưa bao giờ sử dụng nó và không thể nhận xét mức độ dễ sử dụng của nó.
Tuy nhiên, có ít nhất một bài báo làm việc cho thấy rằng so sánh sử dụng các mô hình lựa chọn không đồng nhất thậm chí có thể sai lệch hơn nếu phương trình phương sai bị sai hoặc có lỗi đo lường.
Tâm trạng (2010) liệt kê các giải pháp khác không liên quan đến việc mô hình hóa phương sai, nhưng sử dụng so sánh các thay đổi xác suất dự đoán.
Rõ ràng đó là một vấn đề không được giải quyết và tôi thường thấy các bài báo trong các hội nghị của lĩnh vực của tôi (Xã hội học) đưa ra các giải pháp khác nhau cho nó. Tôi sẽ khuyên bạn nên xem những người trong lĩnh vực của bạn làm gì và sau đó quyết định cách đối phó với nó.
Người giới thiệu
- Allison, PD (1999). So sánh các hệ số Logit và Probit giữa các nhóm. Phương pháp & nghiên cứu xã hội học, 28 (2), 186 Gian208.
- Tâm trạng, C. (2010). Hồi quy logistic: Tại sao chúng ta không thể làm những gì chúng ta nghĩ chúng ta có thể làm và những gì chúng ta có thể làm về nó. Tạp chí Xã hội học Châu Âu, 26 (1), 67 bóng82.
- Williams, R. (2009). Sử dụng các mô hình lựa chọn không đồng nhất để so sánh các hệ số logit và probit giữa các nhóm. Phương pháp & nghiên cứu xã hội học, 37 (4), 531 Hình559.
- Williams, R. (2010). Lắp mô hình lựa chọn không đồng nhất với oglm. Tạp chí Stata, 10 (4), 540 trừ567.