OLS so với hồi quy logistic để phân tích thăm dò với kết quả nhị phân


8

Trong mô hình logistic lý tưởng hóa, chúng ta thu được đường cong hình chữ S liên kết từng IV liên tục với DV. Nhưng trong thực tế, hình dạng S này không thường xuyên xảy ra, làm cho cách tiếp cận logistic có vẻ kém hơn một chút đối với các loại dữ liệu như vậy. Tất nhiên dự đoán xác suất rằng mỗi quan sát sẽ là "1" trên DV có thể sử dụng được trong logistic và không phải trong hồi quy OLS, vì sau này các xác suất này có thể vượt quá giới hạn của [0,1]. Nhưng, cho mục đích khám phá và nếu chúng ta không cần xác suất dự đoán, việc sử dụng OLS sẽ như thế nào để xem IV nào có mối quan hệ mạnh so với trung bình và yếu với DV? Đây có phải là số tiền của một loại phiên bản đa biến của mối tương quan điểm-biserial không? (Các hệ số hồi quy được tiêu chuẩn hóa, chưa kể đến thống kê cộng tuyến và các ô một phần,

Câu trả lời:


7

Nếu các biến giải thích có các giá trị trên toàn bộ dòng thực thì sẽ không có ý nghĩa gì để biểu thị một kỳ vọng có tỷ lệ trong như là một hàm tuyến tính của biến được xác định trên toàn bộ dòng thực. Nếu hình dạng sigmoid của phép biến đổi logit không mô tả hình dạng thì có lẽ tốt nhất là tìm kiếm một phép biến đổi khác ánh xạ thành .[0,1][0,1](,)


4
+1. Để thêm vào điều cuối cùng Michael nói, probit và log-log miễn phí là hai chức năng khác ánh xạ đến được triển khai trong nhiều gói phần mềm. (0,1)(,)
Macro

3
Cũng lưu ý rằng, bất kỳ chức năng nào tương ứng với CDF cho một số biến ngẫu nhiên có giá trị thực là một ứng cử viên. Logistic, Probit và C-log-log là ba hàm như vậy (hyperbolic secant, biến ngẫu nhiên và giá trị cực trị). Vì vậy, bạn cũng có thể "về nguyên tắc" sử dụng hàm liên kết lệch, hoặc hàm mũ đôi, hoặc t, v.v. Phân phối T rất hữu ích khi mức độ tự do được coi là không xác định, vì bạn có thể cân bằng giữa probit một liên kết logit chức năng.
xác suất

@probabilityislogic, bạn đã đưa ra một điểm quan trọng nhưng nitpick: Tôi nghĩ rằng hàm logistic là CDF (nghịch đảo) của phân phối logistic, không phải là phân phối secbol hyperbol.
Macro

Cảm ơn tất cả các bạn. Có phải nó xuất phát từ câu trả lời của bạn rằng bạn thực tế sẽ không bao giờ sử dụng mối tương quan điểm-biserial?
rolando2

Đã xảy ra như sau: "Hồi quy OLS. Khi được sử dụng với biến phản ứng nhị phân, mô hình này được gọi là mô hình xác suất tuyến tính và có thể được sử dụng như một cách để mô tả xác suất có điều kiện. [...] Để thảo luận kỹ hơn về [ ...] các vấn đề với mô hình xác suất tuyến tính, xem Long (1997, trang 38-40). Long, J. Scott (1997). Các mô hình hồi quy cho các biến phụ thuộc phân loại và giới hạn. Thousand Oaks, CA: Sage Publications. " ats.ucla.edu/stat/stata/dae/logit.htm
rolando2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.