Xác nhận chéo có lẽ sẽ tốt ở đây. Để làm điều này, bạn chia bộ dữ liệu của bạn thành 2 phần. Bạn sử dụng phần đầu tiên để phù hợp với cả hai mô hình, và sau đó sử dụng mô hình được trang bị để dự đoán phần thứ hai. Điều này có thể được coi là một xấp xỉ với cách tiếp cận Bayes hoàn toàn để lựa chọn mô hình. Chúng tôi có khả năng của một mô hìnhMTôi
p (d1d2. . .dN|MTôiTôi) = p (d1|MTôiTôi) × p (d2|d1MTôiTôi) × p (d3|d1d2MTôiTôi) × . .
. . × p (dN|d1d2. . .dN- 1MTôiTôi)
Có thể xem heuristur như một chuỗi các dự đoán, và sau đó học hỏi từ những sai lầm. Bạn dự đoán điểm dữ liệu đầu tiên mà không cần đào tạo. Sau đó, bạn dự đoán điểm dữ liệu thứ hai sau khi tìm hiểu về mô hình với điểm đầu tiên. Sau đó, bạn dự đoán điểm dữ liệu thứ 3 sau khi sử dụng hai điểm đầu tiên để tìm hiểu về mô hình, v.v. Bây giờ nếu bạn có một tập dữ liệu đủ lớn, thì các tham số của mô hình sẽ được xác định rõ ngoài một lượng dữ liệu nhất định và chúng tôi sẽ có một số giá trịk:
p (dk + 2|d1. . . .dkdk + 1MTôiTôi) ≈ p (dk + 2|d1. . . .dkMTôiTôi)
Mô hình không thể "tìm hiểu" thêm về các tham số và về cơ bản chỉ là dự đoán dựa trên thông số đầu tiên kquan sát. Vì vậy tôi sẽ chọnk (kích thước của nhóm đầu tiên) đủ lớn để bạn có thể điều chỉnh chính xác mô hình, 20-30điểm dữ liệu trên mỗi tham số có lẽ là đủ. Bạn cũng muốn chọnk đủ lớn để sự phụ thuộc trong dk + 1. . .dN mà đang bị bỏ qua không làm cho gần đúng vô dụng.
Sau đó, tôi chỉ đơn giản là đánh giá khả năng của từng dự đoán và lấy tỷ lệ của chúng, được hiểu là tỷ lệ khả năng. Nếu tỷ lệ là về1, sau đó không mô hình nào đặc biệt tốt hơn mô hình kia. Nếu nó ở xa1sau đó, điều này cho thấy một trong những mô hình đang vượt trội so với mô hình kia. tỷ lệ dưới 5 là yếu, 10 mạnh, 20 rất mạnh và 100, quyết định (đối ứng tương ứng cho số lượng nhỏ).