Giả sử tôi đang xây dựng mô hình hồi quy logistic trong đó biến phụ thuộc là nhị phân và có thể lấy các giá trị hoặc . Đặt các biến độc lập là - có m biến độc lập. Giả sử với biến độc lập thứ k , phân tích bivariate cho thấy xu hướng hình chữ U - nghĩa là, nếu tôi nhóm x_k thành 20 thùng mỗi thùng chứa số lượng quan sát gần bằng nhau và tính 'tỷ lệ xấu' cho mỗi thùng - # quan sát trong đó y = 0 / tổng số quan sát trong mỗi thùng - sau đó tôi nhận được một đường cong hình chữ U.
Câu hỏi của tôi là:
- Tôi có thể trực tiếp sử dụng làm đầu vào trong khi ước tính các tham số beta không? Có bất kỳ giả định thống kê nào bị vi phạm có thể gây ra lỗi đáng kể trong việc ước tính các tham số không?
- Có nhất thiết phải 'tuyến tính hóa' biến này thông qua một phép biến đổi (log, vuông, sản phẩm với chính nó, v.v.) không?