Câu trả lời:
Không có lý do gì để không làm điều này, nhưng hai suy nghĩ cảnh báo:
Theo dõi cẩn thận trong quá trình phân tích đó là. Trong các dự án lớn, nó có thể dễ dàng bị mất, và tạo ra kết quả sai lầm.
Nếu bạn chọn báo cáo ước tính hồi quy, thay vì tỷ lệ chênh lệch, hãy làm rõ sơ đồ mã hóa trong báo cáo của bạn , để độc giả không tự tạo ra các OR không chính xác giả sử cả hai đều được mã hóa 0,1.
Có thể có vẻ cơ bản, nhưng tôi đã thấy cả hai vấn đề làm cho nó thành các bài báo được xuất bản.
Để rõ ràng: thuật ngữ "nhị phân" thường chỉ dành riêng cho mã 1 vs 0. Từ tổng quát hơn phù hợp với bất kỳ mã hóa 2 giá trị nào là "nhị phân". Các yếu tố dự đoán lưỡng phân tất nhiên được hoan nghênh cho hồi quy logistic, như hồi quy tuyến tính và, vì chúng chỉ có 2 giá trị, không có sự khác biệt nào cho dù nhập chúng dưới dạng các yếu tố hay là đồng biến.
Thông thường, nó giúp giải thích nếu bạn viết mã dự đoán 0-1, nhưng ngoài điều đó (và lưu ý rằng nó không bắt buộc), không có gì sai với điều này. Có một số cách tiếp cận khác (dựa trên bảng dự phòng), nhưng nếu tôi nhớ lại một cách chính xác, thì những cách này tương đương với (một số dạng) hồi quy logistic.
Vì vậy, trong ngắn hạn: tôi thấy không có lý do để không làm điều này.
Ngoài ra, nếu bạn có nhiều hơn hai yếu tố dự đoán, thì nhiều khả năng sẽ có vấn đề về đa cộng tuyến ngay cả đối với logistic hoặc hồi quy bội. Tuy nhiên, không có hại khi sử dụng hồi quy logistic với tất cả các biến nhị phân (nghĩa là được mã hóa (0,1)).