Để bắt đầu với bạn phải xác định khái niệm tương đương . Người ta có thể nghĩ rằng hai mô hình tương đương nhau khi chúng tạo ra độ chính xác dự báo gần như nhau (mô hình này có liên quan đến chuỗi thời gian và dữ liệu bảng điều khiển), một mô hình khác có thể quan tâm nếu phù hợp với mô hình gần . Cái trước là đối tượng để xác thực chéo khác nhau (thường dùng dao hoặc một số thử nghiệm ngoài mẫu, Rob accuracy()
làm điều này một cách độc đáo), cái sau dùng để giảm thiểu một số tiêu chí thông tin.
B tôiCMột tôiC
Một cuộc thảo luận thú vị được đưa ra trong cuốn sách bắt buộc của Cameron và Trivingi (Chương 8.5 cung cấp đánh giá xuất sắc về các phương pháp), chi tiết lý thuyết cụ thể hơn được tìm thấy ở Hong và Preston tại đây .
Nói một cách đơn giản, lựa chọn từ hai mô hình càng kỹ lưỡng hơn (có ít tham số để ước tính, do đó, nhiều mức độ tự do hơn) sẽ được đề xuất là thích hợp hơn. Một tiêu chí thông tin giới thiệu một hàm hình phạt đặc biệt hạn chế việc đưa các biến giải thích bổ sung vào mô hình tuyến tính về mặt khái niệm tương tự như các hạn chế được đưa ra bởi R điều chỉnh2.
Tuy nhiên, bạn có thể không chỉ quan tâm đến việc chọn mô hình giảm thiểu tiêu chí thông tin đã chọn. Khái niệm tương đương ngụ ý rằng một số thống kê kiểm tra nên được xây dựng. Do đó, bạn có thể đi kiểm tra tỷ lệ khả năng hoặc Cox hoặc VoungL R thử nghiệm, Davidson-MacKinnon J kiểm tra.
Cuối cùng, theo các thẻ, bạn có thể chỉ quan tâm đến các R
chức năng:
library(lmtest)
coxtest(fit1, fit2)
jtest(fit1, fit2)
Trường hợp fit1
và fit2
là hai mô hình hồi quy tuyến tính được trang bị không lồng nhau, coxtest
là CoxL Rthử nghiệm và jtest
Davidson-MacKinnonJ kiểm tra.