Thật không may, đây sẽ là một câu trả lời khá không thỏa mãn ...
Trước hết, thông thường cho phép tính AIC, bạn sẽ sử dụng ước tính Khả năng tối đa của sẽ bị sai lệch. Vì vậy, điều đó sẽ giảm xuống và cuối cùng, phép tính bạn thực hiện sẽ giảm xuống . Thứ hai tôi sẽ giới thiệu cho bạn bài viết Wikipedia về AIC nói riêng trong phần các trường hợp tương đương . Như bạn thấy đó rõ ràng là hầu hết các Mục từ bỏ một hằng số . Hằng số này không liên quan cho mục đích so sánh mô hình nên nó bị bỏ qua. Việc thấy các dẫn xuất mâu thuẫn của AIC là điều hơi phổ biến vì chính xác vấn đề đó. Ví dụ: Phân tích thống kê đa biến ứng dụng của Johnson & Wicotta , phiên bản thứ 6 cung cấp cho AIC như sau:σ2σ2=RSSn1+2dnCnlog(RSSN)+2d (Chapt. 7.6), rõ ràng không đánh đồng định nghĩa của James et al. bạn đang sử dụng. Không có cuốn sách nào là sai mỗi se . Chỉ cần mọi người sử dụng các hằng số khác nhau. Trong trường hợp của James et al. cuốn sách có vẻ như họ không ám chỉ điểm này. Trong các cuốn sách khác, vd. Một khóa học đầu tiên về lý thuyết mô hình tuyến tính của Ravishanker và Dey, điều này thậm chí còn sâu sắc hơn khi các tác giả viết:
AIC(p)=−2l(y;X,β^ML,σ^2ML)+2p=−Nlog(σ^2ML)/2−N/2+2p(7.5.10)
Điều thú vị là nó cũng không thể đồng thời đúng. Như Burnham & Anderson (1998) Chapt 2.2 viết: " Trong trường hợp đặc biệt ước lượng bình phương nhỏ nhất (LS) với sai số phân phối bình thường và ngoài hằng số phụ gia tùy ý, AIC có thể được biểu diễn dưới dạng hàm đơn giản của tổng bình phương còn lại . "; B & A đề xuất biến thể AIC tương tự mà J & W sử dụng. Điều khiến bạn băn khoăn là hằng số đặc biệt đó (và thực tế là bạn không sử dụng ước tính ML cho phần dư.) Nhìn vào Nhận dạng mẫu và Học máy của M. Bishop (2006) tôi thấy một định nghĩa thậm chí còn mâu thuẫn hơn như:
AIC=l(D|wML)−M(1.73)
Điều này thật buồn cười bởi vì nó không chỉ bỏ qua hệ số nhân từ bài báo gốc mà còn đi trước để làm giảm các dấu hiệu để nó có thể sử dụng lựa chọn dựa trên AIC như một vấn đề tối đa hóa ...
Tôi khuyên bạn nên gắn bó với định nghĩa cũ nếu bạn muốn thực hiện các dẫn xuất lý thuyết. Đây là một trong những trạng thái Akaike trong bài báo gốc của mình. Tất cả các công thức trung gian khác có xu hướng lộn xộn và / hoặc đưa ra một số giả định ngầm định. Nếu đó là bất kỳ sự an ủi nào, bạn "không làm gì sai".−2log(L)+2p