Tôi đang tiến hành hồi quy logistic với kết quả nhị phân (bắt đầu và không bắt đầu). Kết hợp các yếu tố dự đoán của tôi là tất cả các biến liên tục hoặc nhị phân.
Sử dụng phương pháp Box-Tidwell, một trong những dự đoán liên tục của tôi có khả năng vi phạm giả định về tính tuyến tính của logit. Không có dấu hiệu nào từ số liệu thống kê mức độ phù hợp phù hợp là vấn đề.
Sau đó, tôi đã chạy lại mô hình hồi quy, thay thế biến liên tục ban đầu bằng: thứ nhất, một phép biến đổi căn bậc hai và thứ hai, một phiên bản nhị phân của biến.
Khi kiểm tra đầu ra, có vẻ như mức độ phù hợp sẽ cải thiện đáng kể nhưng dư lượng trở nên có vấn đề. Ước tính tham số, lỗi tiêu chuẩn và vẫn tương đối giống nhau. Việc giải thích dữ liệu không thay đổi theo giả thuyết của tôi, trên cả 3 mô hình.
Do đó, về tính hữu ích của kết quả và ý thức giải thích dữ liệu của tôi, có vẻ phù hợp để báo cáo mô hình hồi quy bằng cách sử dụng biến liên tục ban đầu.
Tôi đang tự hỏi điều này:
- Khi nào hồi quy logistic mạnh mẽ chống lại sự vi phạm tiềm năng của tuyến tính của giả định logit?
- Cho ví dụ trên của tôi, có vẻ chấp nhận được việc bao gồm biến liên tục ban đầu trong mô hình không?
- Có bất kỳ tài liệu tham khảo hoặc hướng dẫn nào ngoài đó để đề xuất khi thỏa đáng để chấp nhận rằng mô hình đó mạnh mẽ chống lại sự vi phạm tiềm năng của tuyến tính của logit không?