Khi thêm một công cụ dự đoán số với các công cụ dự đoán phân loại và tương tác của chúng, thường được coi là cần thiết để căn giữa các biến ở mức 0 trước. Lý do là các hiệu ứng chính khó diễn giải khi chúng được đánh giá với bộ dự đoán số ở mức 0.
Câu hỏi của tôi bây giờ là làm thế nào để căn giữa nếu một không chỉ bao gồm biến số ban đầu (như một thuật ngữ tuyến tính) mà còn cả thuật ngữ bậc hai của biến này? Ở đây, hai cách tiếp cận khác nhau là cần thiết:
- Trung tâm cả hai biến tại trung bình cá nhân của họ. Điều này có nhược điểm đáng tiếc là 0 bây giờ ở vị trí khác nhau cho cả hai biến xem xét biến ban đầu.
- Căn giữa cả hai biến tại giá trị trung bình của biến ban đầu (nghĩa là trừ trung bình từ biến ban đầu cho thuật ngữ tuyến tính và trừ đi bình phương của giá trị trung bình của biến ban đầu từ thuật ngữ bậc hai). Với cách tiếp cận này, 0 sẽ đại diện cho cùng một giá trị của biến ban đầu, nhưng biến số bậc hai sẽ không được định tâm ở 0 (nghĩa là giá trị trung bình của biến sẽ là 0).
Tôi nghĩ rằng cách tiếp cận 2 có vẻ hợp lý đưa ra lý do cho việc định tâm sau tất cả. Tuy nhiên, tôi không thể tìm thấy bất cứ điều gì về nó (cũng không có trong các câu hỏi liên quan: a và b ).
Hay nói chung là một ý tưởng tồi để bao gồm các thuật ngữ tuyến tính và bậc hai và tương tác của chúng với các biến khác trong một mô hình?