Từ những gì tôi có thể nói, không có nhiều khác biệt giữa AIC và BIC. Cả hai đều là xấp xỉ thuận tiện về mặt toán học mà người ta có thể thực hiện để so sánh hiệu quả các mô hình. Nếu họ cung cấp cho bạn các mô hình "tốt nhất" khác nhau, điều đó có thể có nghĩa là bạn có độ không chắc chắn của mô hình cao, điều quan trọng hơn là lo lắng về việc bạn nên sử dụng AIC hay BIC. Cá nhân tôi thích BIC hơn vì nó yêu cầu nhiều hơn (ít hơn) mô hình nếu nó có nhiều dữ liệu (ít hơn) để phù hợp với các tham số của nó - giống như một giáo viên yêu cầu tiêu chuẩn hiệu suất cao hơn (thấp hơn) nếu học sinh của họ có nhiều hơn (ít hơn) ) thời gian để tìm hiểu về chủ đề này. Đối với tôi điều này có vẻ như là điều trực quan để làm. Nhưng sau đó tôi chắc chắn cũng tồn tại những lý lẽ hấp dẫn và trực quan không kém đối với AIC, với hình thức đơn giản của nó.
Bây giờ bất cứ khi nào bạn thực hiện một xấp xỉ, chắc chắn sẽ có một số điều kiện khi những xấp xỉ đó là rác. Điều này có thể được nhìn thấy chắc chắn đối với AIC, nơi tồn tại nhiều "điều chỉnh" (AICc) để tính đến các điều kiện nhất định làm cho xấp xỉ ban đầu trở nên xấu. Điều này cũng có mặt cho BIC, bởi vì có nhiều phương pháp chính xác hơn (nhưng vẫn hiệu quả) khác, chẳng hạn như Xấp xỉ hoàn toàn cho các hỗn hợp của Zellner (BIC là một xấp xỉ với phương pháp xấp xỉ Laplace cho tích phân).
Một nơi mà cả hai đều tào lao là khi bạn có thông tin đáng kể trước về các tham số trong bất kỳ mô hình nào. AIC và BIC xử phạt các mô hình không cần thiết trong đó các tham số được biết một phần so với các mô hình yêu cầu các tham số được ước tính từ dữ liệu.
một điều tôi nghĩ rất quan trọng cần lưu ý là BIC không cho rằng mô hình "thật" a) tồn tại hoặc b) được chứa trong bộ mô hình. BIC chỉ đơn giản là một xấp xỉ với khả năng tích hợp (D = Dữ liệu, M = mô hình, A = giả định). Chỉ bằng cách nhân với một xác suất trước và sau đó bình thường hóa, bạn có thể nhận được . BIC chỉ đơn giản là đại diện cho khả năng của dữ liệu nếu mệnh đề ngụ ý của ký hiệu là đúng. Vì vậy, từ quan điểm logic, bất kỳ đề xuất nào dẫn đến BIC là một xấp xỉ đều được dữ liệu hỗ trợ như nhau. Vì vậy, nếu tôi nêu và là các mệnh đềP(D|M,A)P(M|D,A)MMA
Mi:the ith model is the best description of the dataA:out of the set of K models being considered, one of them is the best
Và sau đó tiếp tục gán các mô hình xác suất giống nhau (cùng tham số, cùng dữ liệu, cùng xấp xỉ, v.v.), tôi sẽ nhận được cùng một bộ các giá trị BIC. Chỉ bằng cách gắn một số ý nghĩa duy nhất vào chữ "M" mà người ta bị lôi kéo vào những câu hỏi không liên quan về "mô hình thực sự" (tiếng vang của "tôn giáo thực sự"). Điều duy nhất "định nghĩa" M là các phương trình toán học sử dụng nó trong các tính toán của họ - và điều này hầu như không bao giờ chỉ ra một và chỉ một định nghĩa. Tôi cũng có thể đưa ra một đề xuất dự đoán về M ("mô hình thứ i sẽ đưa ra dự đoán tốt nhất"). Cá nhân tôi không thể thấy điều này sẽ thay đổi bất kỳ khả năng nào, và do đó BIC sẽ tốt hay xấu (AIC cho vấn đề đó cũng vậy - mặc dù AIC dựa trên một dẫn xuất khác)
Và bên cạnh đó, những gì là sai với báo cáo kết quả Nếu mô hình đúng là trong tập Tôi đang xem xét, sau đó là một xác suất 57% rằng đó là mô hình B . Có vẻ đủ hợp lý với tôi, hoặc bạn có thể đi đến phiên bản "mềm" hơn, có xác suất 57% rằng mô hình B là tốt nhất trong số các bộ được xem xét
Một bình luận cuối cùng: Tôi nghĩ bạn sẽ tìm thấy nhiều ý kiến về AIC / BIC như có những người biết về họ.