Khi biến đổi các biến, bạn có phải sử dụng tất cả các biến đổi giống nhau không? Ví dụ: tôi có thể chọn và chọn các biến được chuyển đổi khác nhau, như trong:
Đặt là tuổi, thời gian làm việc, thời gian cư trú và thu nhập.
Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3)
Hoặc, bạn phải nhất quán với các biến đổi của bạn và sử dụng tất cả giống nhau? Như trong:
Y = B1*log(x1) + B2*log(x2) + B3*log(x3)
Hiểu biết của tôi là mục tiêu của chuyển đổi là để giải quyết vấn đề về tính quy tắc. Nhìn vào biểu đồ của từng biến chúng ta có thể thấy rằng chúng thể hiện các phân phối rất khác nhau, điều này sẽ khiến tôi tin rằng các phép biến đổi cần thiết là khác nhau trên một biến theo cơ sở biến.
## R Code
df <- read.spss(file="http://www.bertelsen.ca/R/logistic-regression.sav",
use.value.labels=T, to.data.frame=T)
hist(df[1:7])
Cuối cùng, làm thế nào là hợp lệ để biến đổi các biến bằng cách sử dụng trong đó có giá trị? Biến đổi này có cần nhất quán trên tất cả các biến không hoặc nó có được sử dụng adhoc ngay cả đối với các biến không bao gồm 'không?
## R Code
plot(df[1:7])