Đọc cuốn "Để giải thích hay dự đoán" của Galit Shmueli (2010), tôi rất bối rối trước một mâu thuẫn rõ ràng. Có ba cơ sở,
- Lựa chọn mô hình dựa trên AIC so với BIC (cuối trang 300 - bắt đầu trang 301): chỉ cần đặt, AIC nên được sử dụng để chọn mô hình dự đoán trong khi BIC nên được sử dụng để chọn mô hình để giải thích . Ngoài ra (không phải trong bài viết trên), chúng tôi biết rằng trong một số điều kiện, BIC chọn mô hình thực sự trong số các mô hình ứng cử viên; mô hình thực sự là những gì chúng ta tìm kiếm trong mô hình giải thích (cuối trang 293).
- Các số liệu đơn giản: AIC sẽ chọn một mô hình lớn hơn BIC cho các mẫu có kích thước 8 hoặc lớn hơn (thỏa mãn do các hình phạt phức tạp khác nhau trong AIC so với BIC).
- Các "true" mô hình (tức là mô hình với các hồi quy chính xác và các hình thức chức năng đúng nhưng hệ số không hoàn hảo ước tính) có thể không phải là mô hình tốt nhất để dự đoán (p 307.): Một mô hình hồi quy với một yếu tố dự báo mất tích có thể là một mô hình dự báo tốt hơn - việc giới thiệu sai lệch do yếu tố dự đoán bị thiếu có thể bị vượt trội do giảm phương sai do ước lượng không chính xác.
Điểm 1. và 2. đề xuất rằng các mô hình lớn hơn có thể tốt hơn để dự đoán hơn các mô hình khác biệt hơn. Trong khi đó, điểm 3. đưa ra một ví dụ ngược lại trong đó một mô hình khác biệt hơn sẽ tốt hơn cho dự đoán so với mô hình lớn hơn. Tôi thấy khó hiểu.
Câu hỏi:
- Làm thế nào có thể mâu thuẫn rõ ràng giữa các điểm {1. và 2.} và 3. được giải thích / giải quyết?
- Theo quan điểm 3., bạn có thể đưa ra lời giải thích trực quan về lý do tại sao và làm thế nào một mô hình lớn hơn được AIC chọn thực sự tốt hơn để dự đoán hơn là một mô hình khác biệt hơn được BIC chọn?