Hồi quy chỉ với các biến phân loại


24

Có thể tiến hành hồi quy nếu tất cả các biến phụ thuộc và độc lập là biến phân loại?


3
Điều chắc chắn là có thể, ngay cả đối với hồi quy phổ biến hoặc làm vườn, miễn là biến phản ứng (phụ thuộc) được xử lý hoàn toàn bằng số. Tùy thuộc vào phần mềm của bạn, bạn có thể cần phải đẩy hoặc buộc điều đó xảy ra. Với một định nghĩa rộng về hồi quy phù hợp, bao gồm hồi quy logistic hoặc hồi quy, không chỉ có thể, nó là phổ biến.
Nick Cox

Câu trả lời:


31

Chúng ta cần phải rõ ràng về các điều khoản của chúng tôi ở đây, nhưng nói chung, :

  • Nếu biến phụ thuộc của bạn là liên tục (và phần được phân phối bình thường, hãy xem tại đây ), nhưng tất cả các biến độc lập của bạn là phân loại, đây chỉ là ANOVA .
  • Nếu biến phụ thuộc của bạn là phân loại và các biến độc lập của bạn là liên tục, thì đây sẽ là hồi quy logistic (có thể là nhị phân, thứ tự hoặc đa thức , tùy thuộc).
  • Nếu cả biến phụ thuộc và biến độc lập của bạn đều là biến phân loại, bạn vẫn có thể sử dụng hồi quy logistic, đó là loại phiên bản ANOVA-ish của LR.

Lưu ý rằng cả hồi quy logistic và hồi quy bình phương nhỏ nhất (tuyến tính) là các trường hợp đặc biệt của Mô hình tuyến tính tổng quát .


Đây là trường hợp thứ ba mà bạn đã đề cập, tôi đã thử dùng LR, không có hệ số nào được coi là có ý nghĩa. Tôi nghĩ rằng tôi có thể làm điều gì đó sai.
vị tha

2
Tôi không nghĩ ANOVA yêu cầu một biến phụ thuộc liên tục nhiều hơn yêu cầu số dư phân phối thông thường. Đây chỉ là những điều kiện theo đó ANOVA dự kiến ​​sẽ hoạt động tốt.
Nick Cox

1
@NickCox, bạn đúng, tất nhiên; chúng tôi ngụy biện về cách chúng tôi xác định và áp dụng các điều khoản này. Theo cách tôi muốn nói là mô hình bắt nguồn từ những giả định đó, nhưng ANOVA có thể được sử dụng ngay cả khi chúng không được đáp ứng, với câu hỏi liệu kết quả sẽ hữu ích hay không.
gung - Phục hồi Monica

1
@altruist, tôi đặt ra ba trường hợp vì mục đích rõ ràng; Tôi nhận ra rằng cuối cùng là những gì bạn muốn. Lưu ý rằng việc bạn có sử dụng phần mềm một cách chính xác để phù hợp với mô hình hay không và liệu hệ số của bạn có "đáng kể" hay không không liên quan đến việc liệu LR có phải là mô hình phù hợp với tình huống của bạn hay không.
gung - Phục hồi Monica

4
Lưu ý rằng việc phân loại đôi khi là vấn đề định nghĩa cho phần mềm và đôi khi trong suy nghĩ của người hành xử. Số trẻ em là gì, ví dụ?
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.