Tôi phải thực hiện hồi quy logistic nhị phân với rất nhiều biến độc lập. Hầu hết trong số chúng là nhị phân, nhưng một vài trong số các biến phân loại có nhiều hơn hai cấp độ.
Cách tốt nhất để đối phó với các biến như vậy là gì?
Ví dụ, đối với một biến có ba giá trị có thể, tôi cho rằng hai biến giả phải được tạo. Sau đó, trong một quy trình hồi quy từng bước, tốt hơn là kiểm tra cả hai biến giả cùng một lúc, hoặc kiểm tra chúng một cách riêng biệt?
Tôi sẽ sử dụng SPSS, nhưng tôi không nhớ rõ lắm, vậy: SPSS giải quyết tình huống này như thế nào?
Hơn nữa, đối với một biến phân loại thứ tự, việc sử dụng các biến giả có thể tái tạo thang đo thứ tự là một điều tốt? (Ví dụ, sử dụng ba biến giả cho một biến thứ 4-nhà nước, đưa 0-0-0
cho cấp , cho cấp 2 , cho mức độ 3 và cho mức 4 , thay vì , , và cho 4 cấp.)1-0-0
1-1-0
1-1-1
0-0-0
1-0-0
0-1-0
0-0-1