(Câu hỏi này có vẻ như phù hợp hơn với Triết lý SE. Tôi hy vọng rằng các nhà thống kê có thể làm rõ những quan niệm sai lầm của tôi về các tuyên bố của Box và Shmueli, vì vậy tôi sẽ đăng nó ở đây).
George Box (danh tiếng ARIMA) cho biết:
"Tất cả các mô hình đều sai, nhưng một số là hữu ích."
Galit Shmueli trong bài báo nổi tiếng của mình "Để giải thích hoặc dự đoán" , lập luận (và trích dẫn những người khác đồng ý với cô) rằng:
Giải thích và dự đoán không giống nhau, và một số mô hình làm tốt công việc giải thích, mặc dù họ làm công việc dự đoán kém.
Tôi cảm thấy rằng những nguyên tắc này bằng cách nào đó mâu thuẫn.
Nếu một mô hình không dự đoán tốt, nó có hữu ích không?
Quan trọng hơn, nếu một mô hình giải thích tốt (nhưng không nhất thiết phải dự đoán tốt), thì nó phải đúng (nghĩa là không sai) theo cách này hay cách khác. Vậy làm thế nào mà lưới với "tất cả các mô hình đều sai" của Box?
Cuối cùng, nếu một mô hình giải thích tốt, nhưng không dự đoán tốt, làm thế nào nó thậm chí còn khoa học? Hầu hết các tiêu chí phân định khoa học (xác minh, giả mạo, v.v ...) ngụ ý rằng một tuyên bố khoa học phải có sức mạnh dự đoán, hoặc thông tục: Một lý thuyết hoặc mô hình chỉ đúng nếu nó có thể được kiểm nghiệm bằng thực nghiệm (hoặc giả mạo), có nghĩa là nó phải dự đoán kết quả trong tương lai.
Những câu hỏi của tôi:
- Là tuyên bố của Box và ý tưởng của Shmueli thực sự trái ngược nhau, hay tôi đang thiếu một cái gì đó, ví dụ như một mô hình không có sức mạnh dự đoán mà vẫn hữu ích?
- Nếu các phát biểu của Box và Shmueli không mâu thuẫn, thì điều gì có nghĩa là một mô hình sai và không dự đoán tốt, nhưng vẫn có sức mạnh giải thích? Đặt nó khác đi: Nếu một người lấy đi cả tính chính xác và khả năng dự đoán, những gì còn lại của một mô hình?
Những giá trị thực nghiệm nào có thể có khi một mô hình có sức mạnh giải thích, nhưng không có khả năng dự đoán? Shmueli đề cập đến những điều như: sử dụng AIC để giải thích và BIC để dự đoán, v.v., nhưng tôi không thấy cách giải quyết vấn đề đó. Với các mô hình dự đoán, bạn có thể sử dụng AIC, hoặc BIC hoặc hoặc chính quy, v.v ... nhưng cuối cùng, ngoài kiểm tra mẫu và hiệu suất trong sản xuất là yếu tố quyết định chất lượng của mô hình. Nhưng đối với các mô hình giải thích tốt, tôi không thấy bất kỳ chức năng mất mát nào có thể thực sự đánh giá một mô hình. Trong triết học của khoa học, có khái niệm về sự không xác địnhL L p < 0,05 p < 0,1 p < 0,01có vẻ thích hợp ở đây: Đối với bất kỳ tập dữ liệu cụ thể nào, người ta luôn có thể chọn một cách thận trọng một số phân phối (hoặc hỗn hợp phân phối) và hàm mất theo cách chúng phù hợp với dữ liệu (và do đó có thể được yêu cầu giải thích nó). Hơn nữa, ngưỡng mà nên đặt ra cho ai đó để tuyên bố rằng mô hình giải thích đầy đủ dữ liệu là tùy ý (loại giống như giá trị p, tại sao lại là chứ không phải hoặc ?).
- Dựa trên những điều trên, làm thế nào người ta có thể xác nhận một cách khách quan một mô hình giải thích tốt, nhưng không dự đoán tốt, vì không thể kiểm tra mẫu?