Một trong những bài đăng được liên kết ở trên ám chỉ việc sử dụng kiểm tra tỷ lệ khả năng, mặc dù các mô hình của bạn phải được lồng vào nhau để hoạt động này (tức là tất cả các tham số trong một trong các mô hình phải có trong mô hình mà bạn đang kiểm tra) .
RMSE rõ ràng là thước đo mức độ phù hợp của mô hình dữ liệu. Tuy nhiên, tỷ lệ khả năng cũng vậy. Khả năng cho một người nhất định, theo bà Chen, là khả năng một người có tất cả các thông số của cô có kết quả mà cô có. Khả năng chung của bộ dữ liệu là khả năng của bà Chen * Khả năng của bà Gundersen * Khả năng của bà Johnson * ... vv
Việc thêm một hiệp phương sai, hoặc bất kỳ số đồng biến nào, thực sự không thể làm cho tỷ lệ khả năng tồi tệ hơn, tôi không nghĩ vậy. Nhưng nó có thể cải thiện tỷ lệ khả năng bằng một lượng không đáng kể. Các mô hình phù hợp hơn sẽ có khả năng cao hơn. Bạn có thể chính thức kiểm tra xem mô hình A có phù hợp với mô hình B tốt hơn không. Bạn nên có sẵn một số loại chức năng kiểm tra LR trong bất kỳ phần mềm nào bạn sử dụng, nhưng về cơ bản, thống kê kiểm tra LR là -2 * sự khác biệt của các bản ghi khả năng và nó được phân phối vuông góc với df = sự khác biệt về số lượng của các tham số.
Ngoài ra, so sánh AIC hoặc BIC của hai mô hình và tìm ra mô hình thấp nhất cũng được chấp nhận. AIC và BIC về cơ bản là khả năng đăng nhập bị phạt vì số lượng tham số.
Tôi không chắc chắn về việc sử dụng thử nghiệm t cho RMSEs và tôi thực sự sẽ dựa vào nó trừ khi bạn có thể tìm thấy một số công việc lý thuyết đã được thực hiện trong khu vực. Về cơ bản, bạn có biết làm thế nào các giá trị của RMSE được phân phối không theo triệu chứng? Tôi không chắc. Một số thảo luận thêm ở đây:
http://www.stata.com/stirthist/archive/2012-11/index.html#01017