Tôi sẽ lập luận rằng ít nhất là khi thảo luận về các mô hình tuyến tính (như các mô hình AR), và AIC được điều chỉnh không khác nhau.R2
Hãy xem xét câu hỏi có nên đưa vào
Điều này tương đương với việc so sánh các mô hình
trong đó . Chúng tôi nói rằng là mô hình thực sự nếu . Lưu ý rằng . Các mô hình được lồng nhau . Quy trình lựa chọn mô hình là quy tắc phụ thuộc vào dữ liệu, chọn một số mô hình hợp lý nhất. y = X 1 ( n × K 1 ) β 1 + X 2 ( n × K 2 ) β 2 + ε M 1X2
y=X1(n×K1)β1+X2(n×K2)β2+ϵ
E(u|X1,X2)=0M2β2≠0M1⊂M2 MM1M2::y=X1β1+uy=X1β1+X2β2+u,
E(u|X1,X2)=0M2β2≠0M1⊂M2Mˆ
Chúng tôi nói
là nhất quán nếu
Mˆ
limn→∞P(Mˆ=M1|M1)limn→∞P(Mˆ=M2|M2)==11
Xem xét điều chỉnh . Nghĩa là chọn if . Vì đang giảm đơn điệu trong , quy trình này tương đương với giảm thiểu . Đổi lại, điều này tương đương với việc giảm thiểu . Đối với đủ lớn , cái sau có thể được viết là
trong đóR2M1R¯21>R¯22R¯2s2s2log(s2)n
log(s2)==≈≈log(σˆ2nn−K)log(σˆ2)+log(1+Kn−K)log(σˆ2)+Kn−Klog(σˆ2)+Kn,
σˆ2là công cụ ước tính ML của phương sai lỗi. Do đó, lựa chọn mô hình dựa trên tương đương với việc chọn mô hình có nhỏ nhất
. Thủ tục này không nhất quán.
R¯2log(σˆ2)+K/n
Đề xuất :
limn→∞P(R¯21>R¯22|M1)<1
Bằng chứng :
trong đó dòng thứ 2 đến cuối cùng theo sau bởi vì thống kê là thống kê LR trong trường hợp hồi quy tuyến tính theo sau tiệm cận phân phối null. QED
P(R¯21>R¯22|M1)≈=≈=→<P(log(s21)<log(s22)|M1)P(nlog(s21)<nlog(s22)|M1)P(nlog(σˆ21)+K1<nlog(σˆ22)+K1+K2|M1)P(n[log(σˆ21)−log(σˆ22)]<K2|M1)P(χ2K2<K2)1,
χ2K2
Bây giờ hãy xem xét tiêu chí của Akaike,
Do đó, AIC cũng đánh đổi việc giảm SSR được ngụ ý bởi các biến hồi quy bổ sung chống lại "thời hạn phạt" , "Chỉ vào hướng ngược lại. Do đó, chọn nếu
, nếu không thì chọn .
AIC=log(σˆ2)+2Kn
M1AIC1<AIC2M2
Có thể thấy rằng cũng không nhất quán bằng cách tiếp tục bằng chứng trên trong dòng ba với . Do đó, và điều chỉnh chọn mô hình "lớn" với xác suất dương, ngay cả khi là mô hình thực.AICP(nlog(σˆ21)+2K1<nlog(σˆ22)+2(K1+K2)|M1)R2AICM2M1
Vì hình phạt cho sự phức tạp trong AIC lớn hơn một chút so với điều chỉnh , mặc dù vậy, nó có thể ít bị chọn quá mức. Và nó có các thuộc tính tốt đẹp khác (giảm thiểu phân kỳ KL thành mô hình thực nếu điều đó không nằm trong tập hợp các mô hình được xem xét) không được đề cập trong bài viết của tôi.R2