Các định nghĩa AIC khác nhau


12

Từ Wikipedia có định nghĩa về Tiêu chí Thông tin (AIC) của Akaike là AIC=2k2logL , trong đó k là số lượng tham số và là khả năng đăng nhập của mô hình.logL

Tuy nhiên, Kinh tế lượng của chúng tôi lưu ý tại một trường đại học được kính trọng rằngAIC=log(σ^2)+2kT . Dưới đây σ 2là phương sai ước tính cho các lỗi trong một mô hình ARMA vàTlà số quan sát trong chuỗi thời gian tập dữ liệu.σ^2T

Là định nghĩa sau tương đương với định nghĩa đầu tiên, nhưng chỉ được điều chỉnh cho các mô hình ARMA? Hoặc có một số loại xung đột giữa hai định nghĩa?


3
Đối với hồ sơ: tiêu chí số ít, tiêu chí số nhiều. (Được chỉnh sửa phù hợp.)
Nick Cox

Câu trả lời:


15

Công thức bạn trích dẫn từ ghi chú của bạn không chính xác là AIC.

AIC là .2logL+2k

Ở đây tôi sẽ đưa ra một phác thảo về một dẫn xuất gần đúng để làm rõ đủ những gì đang diễn ra.

Nếu bạn có một mô hình với các lỗi bình thường độc lập với phương sai không đổi,

Lσne12σ2εi2

có thể được ước tính theo khả năng tối đa như

α(σ^2)-n/2e-12nσ^2/σ^2α(σ^2)-n/2e-12nα(σ^2)-n/2

(giả sử ước tính là ước tính ML)σ2

Vì vậy, (lên đến thay đổi bởi một hằng số)-2đăng nhậpL+2k= =nđăng nhậpσ^2+2k

Bây giờ trong mô hình ARMA, nếu thực sự lớn so với pq , thì khả năng có thể được xấp xỉ bằng khung Gaussian như vậy (ví dụ: bạn có thể viết ARMA xấp xỉ AR dài hơn và đủ điều kiện để viết AR đó như một mô hình hồi quy), vì vậy với T thay cho n :TpqTn

MộtTôiCTđăng nhậpσ^2+2k

vì thế

MộtTôiC/Tđăng nhậpσ^2+2k/T

Bây giờ nếu bạn chỉ đơn giản là so sánh AIC, thì sự phân chia đó qua hoàn toàn không thành vấn đề, vì nó không thay đổi thứ tự của các giá trị AIC.T

Tuy nhiên, nếu bạn đang sử dụng AIC cho một số mục đích khác dựa trên giá trị thực của sự khác biệt trong AIC (chẳng hạn như suy luận đa mô hình như mô tả của Burnham và Anderson), thì đó là vấn đề.

Nhiều văn bản kinh tế lượng dường như sử dụng mẫu AIC / T này. Điều kỳ lạ là một số cuốn sách dường như đề cập đến Hurvich và Tsai 1989 hoặc Findley 1985 cho hình thức đó, nhưng Hurvich & Tsai và Findley dường như đang thảo luận về hình thức ban đầu (mặc dù tôi chỉ có một dấu hiệu gián tiếp về những gì Findley làm ngay bây giờ, vì vậy có lẽ có một cái gì đó trong Findley trên đó).

Mở rộng quy mô như vậy có thể được thực hiện cho một loạt các lý do - ví dụ, chuỗi thời gian, đặc biệt là chuỗi thời gian tần số cao, có thể rất dài và AICS bình thường có thể có xu hướng trở nên cồng kềnh, đặc biệt là nếu là rất nhỏ. (Có một số lý do có thể khác, nhưng vì tôi thực sự không biết lý do này đã được thực hiện nên tôi sẽ không bắt đầu đi xuống một danh sách tất cả các lý do có thể.)σ2

Bạn có thể muốn xem danh sách Sự kiện và ngụy biện của AIC của Rob Hyndman , - đặc biệt là các mục từ 3 đến 7. Một số điểm có thể khiến bạn ít nhất phải thận trọng khi phụ thuộc quá nhiều vào khả năng xấp xỉ của Gaussian, nhưng có lẽ có một lời biện minh tốt hơn tôi cung cấp ở đây.

Tôi không chắc có lý do chính đáng để sử dụng xấp xỉ này cho khả năng ghi nhật ký thay vì AIC thực tế vì rất nhiều gói chuỗi thời gian ngày nay có xu hướng tính toán (/ tối đa hóa) khả năng đăng nhập thực tế cho các mô hình ARMA. Có vẻ như ít lý do để không sử dụng nó.


1
Sớm hay muộn, mọi cuộc thảo luận về bất kỳ * IC nào đều biến thành "Đây là tiêu chí bạn nên sử dụng, ngoại trừ việc nó thường đưa ra câu trả lời sai trong những trường hợp tương tự". Chỉ là mỉa mai, không hoàn toàn chỉ trích một câu trả lời thường hữu ích. Điều này cũng giống như cuộc sống thực, nơi một số câu châm ngôn chung chung như "yêu tất cả mọi người" thường bị ghi đè tạm thời bởi lời khuyên khác nếu ai đó đang cố gắng đánh bạn hoặc xé bạn ra.
Nick Cox

1
@Nick Tôi không bị làm phiền bởi các văn bản sử dụng AIC / thay vì AIC, nhưng điều làm tôi lo lắng là rất nhiều cuốn sách kinh tế lượng mà tôi đã xem chỉ gọi nó là "AIC" mà không có bất kỳ bình luận nào . Đối với tôi điều đó thật vô trách nhiệm. Bất cứ ai là người đầu tiên làm điều đó nhưng không nói như vậy đã được sao chép nhiều lần. n
Glen_b -Reinstate Monica

2

Tôi tin rằng điều này dựa trên giả định về các lỗi thông thường. Trong toán kinh tế lượng, bạn vận hành sử dụng tiệm cận, đặc biệt là trong các ứng dụng chuỗi thời gian sử dụng AIC. Kết quả là, giả định bình thường nên giữ một cách không có triệu chứng để biện minh cho sơ đồ lựa chọn mô hình (tiệm cận) này.

tôin(L)= =-(T/2)tôin(2π)-(T/2)tôin(σ2)-(1/2σ2)Σ(xTôi-μ)E(X)= =μVmộtr(X)= =σ2x1,...,xT

LTtôin(σ2)(1/σ2)(Tσ^2)σ^2= =T-1Σ(xTôi-x¯)σ2(1/σ2)(Tσ^2)= =(1/σ^2)(Tσ^2)

MộtTôiC= =2k+Ttôin(σ2)+11TTMộtTôiCMộtTôiC/T

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.