Giải thích đầu ra bước trong R


11

Trong R, steplệnh được cho là nhằm giúp bạn chọn các biến đầu vào cho mô hình của mình, phải không?

Sau đây đến từ example(step)#-> swiss& step(lm1)

> step(lm1)
Start:  AIC=190.69
Fertility ~ Agriculture + Examination + Education + Catholic + 
    Infant.Mortality

                   Df Sum of Sq    RSS    AIC
- Examination       1     53.03 2158.1 189.86
<none>                          2105.0 190.69
- Agriculture       1    307.72 2412.8 195.10
- Infant.Mortality  1    408.75 2513.8 197.03
- Catholic          1    447.71 2552.8 197.75
- Education         1   1162.56 3267.6 209.36

Step:  AIC=189.86
Fertility ~ Agriculture + Education + Catholic + Infant.Mortality

                   Df Sum of Sq    RSS    AIC
<none>                          2158.1 189.86
- Agriculture       1    264.18 2422.2 193.29
- Infant.Mortality  1    409.81 2567.9 196.03
- Catholic          1    956.57 3114.6 205.10
- Education         1   2249.97 4408.0 221.43

Call:
lm(formula = Fertility ~ Agriculture + Education + Catholic +     Infant.Mortality, data = swiss)

Coefficients:
     (Intercept)       Agriculture         Education  
         62.1013           -0.1546           -0.9803  
        Catholic  Infant.Mortality  
          0.1247            1.0784  

Bây giờ, khi tôi nhìn vào điều này, tôi đoán bảng Bước cuối cùng là mô hình mà chúng ta nên sử dụng? Một vài dòng cuối cùng bao gồm chức năng "Gọi", mô tả mô hình thực tế và các biến đầu vào mà nó bao gồm và "Hệ số" là ước tính tham số thực tế cho các giá trị này, phải không? Vì vậy, đây là mô hình tôi muốn, phải không? Tôi đang cố gắng ngoại suy điều này cho dự án của tôi, nơi có nhiều biến hơn.

Câu trả lời:


7

Bảng bước cuối cùng thực sự là kết quả cuối cùng của "hồi quy từng bước". Thông báo trước ở đây là thông thường bạn không muốn sử dụng phương pháp này khi có một cách nguyên tắc để tiếp cận đặc tả mô hình của bạn. Cuộc gọi là cuộc gọi lm sẽ tạo ra phương trình được sử dụng trong bước cuối cùng. Các hệ số là ước tính tham số thực tế. Đáng chú ý là vì bạn không xác định bước tham số phạm vi hoặc hướng được mặc định theo cách tiếp cận bước 'ngược', trong đó các thuật ngữ biến được đánh giá để giảm ở mỗi bước, tại mỗi bước nếu bỏ biến được chọn sẽ làm giảm AIC. từ mô hình và toàn bộ quá trình lặp lại cho đến khi nó trở thành trường hợp không có biến nào có thể được loại bỏ. Trong ví dụ của bạn ở bước cuối cùng Khả năng sinh sản ~ Nông nghiệp + Giáo dục + Công giáo + Trẻ sơ sinh.


2

Phần của bản in ở cuối là mô hình bạn còn lại. Bạn cũng có thể lấy nó nếu bạn nắm bắt giá trị của stephàm:

final.mod <- step(lm1)
final.mod
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.