Hồi quy logistic với các biến độc lập và phụ thuộc nhị phân


14

Có thích hợp để thực hiện hồi quy logistic trong đó cả hai biến phụ thuộc và biến độc lập là nhị phân không? ví dụ biến phụ thuộc là 0 và 1 và các yếu tố dự đoán là biến tương phản được mã hóa -1 và 1?

Câu trả lời:


6

Không có lý do gì để không làm điều này, nhưng hai suy nghĩ cảnh báo:

  1. Theo dõi cẩn thận trong quá trình phân tích đó là. Trong các dự án lớn, nó có thể dễ dàng bị mất, và tạo ra kết quả sai lầm.

  2. Nếu bạn chọn báo cáo ước tính hồi quy, thay vì tỷ lệ chênh lệch, hãy làm rõ sơ đồ mã hóa trong báo cáo của bạn , để độc giả không tự tạo ra các OR không chính xác giả sử cả hai đều được mã hóa 0,1.

Có thể có vẻ cơ bản, nhưng tôi đã thấy cả hai vấn đề làm cho nó thành các bài báo được xuất bản.


Vì vậy, nó cũng thích hợp để tách một tệp dữ liệu thành 6 trường hợp riêng biệt và chạy các so sánh riêng lẻ trong mỗi tập dữ liệu với các yếu tố dự đoán được mã hóa?
upabove

Tôi thực sự không chắc chắn những gì bạn yêu cầu cho bit thứ hai này. Bạn có thể hiểu được những gì bạn đang hy vọng đạt được?
Fomite

Tôi có một bộ dữ liệu với 3 giữa và 4 trong các điều kiện chủ đề. Tôi muốn kiểm tra từng hiệu ứng, nhưng một hồi quy đơn với tất cả các tương tác sẽ bỏ lỡ rất nhiều thông tin mà tôi quan tâm. Thay vào đó tôi sẽ chia dữ liệu theo điều kiện thành các bộ dữ liệu riêng biệt và chạy hồi quy logistic tập trung trên mỗi bộ dữ liệu tương phản mã hóa cho sự khác biệt mà tôi quan tâm.
upabove

để biết thêm thông tin về cách tôi mã hóa các mã tương phản xem tại đây: stats.stackexchange.com/questions/14546/ mẹo
upabove

11

Để rõ ràng: thuật ngữ "nhị phân" thường chỉ dành riêng cho mã 1 vs 0. Từ tổng quát hơn phù hợp với bất kỳ mã hóa 2 giá trị nào là "nhị phân". Các yếu tố dự đoán lưỡng phân tất nhiên được hoan nghênh cho hồi quy logistic, như hồi quy tuyến tính và, vì chúng chỉ có 2 giá trị, không có sự khác biệt nào cho dù nhập chúng dưới dạng các yếu tố hay là đồng biến.


5

Thông thường, nó giúp giải thích nếu bạn viết mã dự đoán 0-1, nhưng ngoài điều đó (và lưu ý rằng nó không bắt buộc), không có gì sai với điều này. Có một số cách tiếp cận khác (dựa trên bảng dự phòng), nhưng nếu tôi nhớ lại một cách chính xác, thì những cách này tương đương với (một số dạng) hồi quy logistic.

Vì vậy, trong ngắn hạn: tôi thấy không có lý do để không làm điều này.


cảm ơn! Và nếu tôi có 3 dự đoán được mã hóa tương phản và tôi mã hóa tất cả 0-1 thì chúng sẽ không trực giao. Ví dụ: tôi có 4 danh mục và ba mã của tôi là L1: 1, -1,0,0 L2: 0,1, -1,0, L3: 0,0,1, -1. đó có phải là một vấn đề không?
upabove

Ma trận L ví dụ của bạn (L1, L2, L3) là sự tương phản lặp đi lặp lại theo đó mỗi loại được so sánh với loại sau. Cả hai yếu tố dự đoán tương phản này đều trực giao và chúng không phải là nhị phân (mã hóa là 0-1). Trên thực tế, các giá trị của chúng là 0,75 so với -.25 (biến thứ 1), 0,5 so với -5 (biến thứ 2), 0,25 so với -75 (biến thứ 3)
ttnphns

3

Ngoài ra, nếu bạn có nhiều hơn hai yếu tố dự đoán, thì nhiều khả năng sẽ có vấn đề về đa cộng tuyến ngay cả đối với logistic hoặc hồi quy bội. Tuy nhiên, không có hại khi sử dụng hồi quy logistic với tất cả các biến nhị phân (nghĩa là được mã hóa (0,1)).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.