Nó được thiết lập tốt, ít nhất là trong số các nhà thống kê của một số tầm cỡ cao hơn, rằng các mô hình có giá trị của thống kê AIC trong một ngưỡng nhất định của giá trị tối thiểu phải được coi là phù hợp như mô hình giảm thiểu thống kê AIC. Ví dụ: trong [1, tr.221] chúng tôi tìm thấy
Sau đó, các mô hình với GCV hoặc AIC nhỏ sẽ được coi là tốt nhất. Tất nhiên người ta không nên chỉ tối thiểu hóa GCV hoặc AIC một cách mù quáng. Thay vào đó, tất cả các mô hình có giá trị GCV hoặc AIC nhỏ hợp lý nên được coi là có khả năng phù hợp và được đánh giá theo mức độ đơn giản và phù hợp khoa học của chúng.
Tương tự, trong [2, tr.144] chúng ta có
Người ta đã đề xuất (Duong, 1984) rằng các mô hình có giá trị AIC trong c có giá trị tối thiểu phải được coi là cạnh tranh (với c = 2 là giá trị tiêu biểu). Lựa chọn trong số các mô hình cạnh tranh sau đó có thể dựa trên các yếu tố như độ trắng của phần dư (Phần 5.3) và độ đơn giản của mô hình.
Người giới thiệu:
- Ruppert, Đ.; Wand, MP & Carrol, Hồi quy bán đảo RJ , Nhà xuất bản Đại học Cambridge, 2003
- Brockwell, PJ & Davis, RA Giới thiệu về chuỗi thời gian và dự báo , John Wiley & Sons, 1996
Vì vậy, đưa ra ở trên, mô hình nào trong hai mô hình dưới đây nên được ưu tiên?
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
Tổng quát hơn, khi nào thì phù hợp để chọn mô hình bằng cách tối thiểu hóa AIC hoặc thống kê liên quan?