Tôi tương đối mới với R và tôi đang cố gắng điều chỉnh mô hình cho dữ liệu bao gồm cột phân loại và cột số (số nguyên). Biến phụ thuộc là một số liên tục.
Dữ liệu có định dạng sau:
preCarget, preIntNum, FeedbackVar
Dữ liệu trông giống như thế này:
ranking, age_in_years, wealth_indicator
category_A, 99, 1234.56
category_A, 21, 12.34
category_A, 42, 234.56
....
category_N, 105, 77.27
Làm thế nào tôi có thể mô hình hóa điều này (có lẽ, sử dụng GLM), trong R?
[[Biên tập]]
Nó vừa xảy ra với tôi (sau khi phân tích dữ liệu kỹ lưỡng hơn), rằng biến độc lập phân loại trên thực tế đã được đặt hàng. Do đó tôi đã sửa đổi câu trả lời được cung cấp trước đó như sau:
> fit2 <- glm(wealth_indicator ~ ordered(ranking) + age_in_years, data=amort2)
>
> fit2
Call: glm(formula = wealth_indicator ~ ordered(ranking) + age_in_years,
data = amort2)
Coefficients:
(Intercept) ordered(ranking).L ordered(ranking).Q ordered(ranking).C age_in_years
0.0578500 -0.0055454 -0.0013000 0.0007603 0.0036818
Degrees of Freedom: 39 Total (i.e. Null); 35 Residual
Null Deviance: 0.004924
Residual Deviance: 0.00012 AIC: -383.2
>
> fit3 <- glm(wealth_indicator ~ ordered(ranking) + age_in_years + ordered(ranking)*age_in_years, data=amort2)
> fit3
Call: glm(formula = wealth_indicator ~ ordered(ranking) + age_in_years +
ordered(ranking) * age_in_years, data = amort2)
Coefficients:
(Intercept) ordered(ranking).L ordered(ranking).Q
0.0578500 -0.0018932 -0.0039667
ordered(ranking).C age_in_years ordered(ranking).L:age_in_years
0.0021019 0.0036818 -0.0006640
ordered(ranking).Q:age_in_years ordered(ranking).C:age_in_years
0.0004848 -0.0002439
Degrees of Freedom: 39 Total (i.e. Null); 32 Residual
Null Deviance: 0.004924
Residual Deviance: 5.931e-05 AIC: -405.4
Tôi hơi bối rối bởi những gì ordered(ranking).C
, ordered(ranking).Q
và ordered(ranking).L
có nghĩa là trong đầu ra, và sẽ đánh giá cao một số trợ giúp trong việc hiểu đầu ra này và cách sử dụng nó để dự đoán biến phản ứng.
factor(ranking)
và khôngas.factor(ranking)
?