Câu hỏi này tham khảo bài viết của Galit Shmueli "Để giải thích hoặc dự đoán" .
Cụ thể, trong phần 1.5, "Giải thích và Dự đoán là khác nhau", Giáo sư Shmueli viết:
Trong mô hình giải thích, trọng tâm là giảm thiểu sai lệch để có được biểu diễn chính xác nhất của lý thuyết cơ bản.
Điều này đã làm tôi bối rối mỗi lần tôi đọc bài báo. Theo nghĩa nào thì việc giảm thiểu sai lệch trong ước tính sẽ thể hiện chính xác nhất lý thuyết cơ bản?
Tôi cũng đã xem giáo sư Shmueli nói chuyện ở đây , được đưa ra tại JMP Discovery Summit 2017, và cô nói:
... những thứ giống như mô hình co rút, quần thể, bạn sẽ không bao giờ nhìn thấy chúng. Bởi vì những mô hình đó, theo thiết kế, giới thiệu sự thiên vị để giảm sự thiên vị / phương sai tổng thể. Đó là lý do tại sao họ sẽ không ở đó, nó không có ý nghĩa lý thuyết để làm điều đó. Tại sao bạn sẽ làm cho mô hình của bạn thiên vị về mục đích?
Điều này không thực sự làm sáng tỏ câu hỏi của tôi, chỉ đơn giản là khôi phục yêu cầu mà tôi không hiểu.
Nếu lý thuyết có nhiều tham số và chúng ta có dữ liệu ít ỏi để ước tính chúng, lỗi ước tính sẽ bị chi phối bởi phương sai. Tại sao nó không phù hợp để sử dụng thủ tục ước lượng sai lệch như hồi quy sườn (dẫn đến ước tính sai lệch của phương sai thấp hơn) trong tình huống này?