Giả sử tôi có dữ liệu sau và đang chạy mô hình hồi quy:
df=data.frame(income=c(5,3,47,8,6,5),
won=c(0,0,1,1,1,0),
age=c(18,18,23,50,19,39),
home=c(0,0,1,0,0,1))
Một mặt, tôi chạy một mô hình tuyến tính để dự đoán thu nhập:
md1 = lm(income ~ age + home + home, data=df)
Thứ hai, tôi chạy một mô hình logit để dự đoán về biến won:
md2 = glm(factor(won) ~ age + home, data=df, family=binomial(link="logit"))
Đối với cả hai mô hình, tôi tự hỏi làm thế nào tôi có thể tạo bảng hoặc khung dữ liệu với danh mục phản hồi dự đoán, giá trị được trang bị và giá trị dự đoán của mô hình.
Vì vậy, đối với mô hình tuyến tính, một cái gì đó như:
age fitted_income predicted_income
18 3 5
23 3 3
50 4 2
19 5 5
39 6 4
home fitted_income predicted_income
0 5 6
1 3 9
Hoặc có lẽ nó nên dành cho từng điểm dữ liệu. Vì vậy, đối với điểm dữ liệu x_i, các giá trị được trang bị và dự đoán là:
id age fitted_income predicted_income
1 18 3 5
2 23 3 3
3 50 4 2
4 19 5 5
5 39 6 4
Từ quan điểm thống kê, một cam kết như vậy có hữu ích không? Tại sao hay tại sao không?
Làm thế nào điều này có thể được thực hiện trong R? (nhìn vào tên (md1) và tìm thấy những gì tôi có thể lấy từ mô hình, nhưng vẫn chưa vượt qua điều đó)
Cảm ơn!
residualslệnh trong R. Sử dụng cbindđể nối chúng với khung dữ liệu gốc.