Một trong những điều thú vị tôi tìm thấy trong thế giới "Mô hình không chắc chắn" là khái niệm về "mô hình thực sự". Điều này có nghĩa là "các đề xuất mô hình" của chúng ta có dạng:
M(1)i:The ith model is the true model
P(M(1)i|DI)M(1)i
Khả năng xả là rất quan trọng ở đây, bởi vì điều này đảm bảo xác suất thêm vào 1, có nghĩa là chúng ta có thể gạt ra khỏi mô hình.
Nhưng đây là tất cả ở cấp độ khái niệm - trung bình mô hình có hiệu suất tốt. Vì vậy, điều này có nghĩa là phải có một khái niệm tốt hơn.
Cá nhân, tôi xem các mô hình như các công cụ, như búa hay máy khoan. Mô hình là các cấu trúc tinh thần được sử dụng để đưa ra dự đoán về hoặc mô tả những thứ chúng ta có thể quan sát. Nghe có vẻ rất kỳ quặc khi nói về một "cây búa thực sự", và cũng không kém phần thú vị khi nói về một "cấu trúc tinh thần thực sự". Dựa trên điều này, khái niệm về một "người mẫu thực sự" có vẻ kỳ lạ đối với tôi. Có vẻ tự nhiên hơn nhiều khi nghĩ về mô hình "tốt" và mô hình "xấu", thay vì mô hình "đúng" và mô hình "sai".
Theo quan điểm này, chúng ta cũng có thể không chắc chắn về mô hình "tốt nhất" để sử dụng, từ một lựa chọn các mô hình. Vì vậy, giả sử chúng ta thay vì lý do về sự ủng hộ:
M(2)i:Out of all the models that have been specified,
the ith model is best model to use
M(2)iM(2)i
Tuy nhiên, trong phương pháp này, bạn cần một số mức độ tốt của thước đo phù hợp, để đánh giá mức độ tốt nhất của mô hình "tốt nhất" của bạn. Điều này có thể được thực hiện theo hai cách, bằng cách thử nghiệm các mô hình "điều chắc chắn", tương đương với số liệu thống kê GoF thông thường (phân kỳ KL, bình phương, v.v.). Một cách khác để đánh giá điều này là đưa một mô hình cực kỳ linh hoạt vào lớp mô hình của bạn - có lẽ là mô hình hỗn hợp thông thường với hàng trăm thành phần hoặc hỗn hợp quy trình Dirichlet. Nếu mô hình này xuất hiện là tốt nhất, thì có khả năng các mô hình khác của bạn không đầy đủ.
Bài viết này có một cuộc thảo luận lý thuyết tốt, và từng bước, một ví dụ về cách bạn thực sự lựa chọn mô hình.