Kiểm tra sự khác biệt trong AIC của hai mô hình không lồng nhau


12

Toàn bộ quan điểm của AIC hoặc bất kỳ tiêu chí thông tin nào khác là ít hơn là tốt hơn. Vì vậy, nếu tôi có hai mô hình M1: y = a0 + XA + e và M2: y = b0 + ZB + u và nếu AIC của đầu tiên (A1) nhỏ hơn so với mô hình thứ hai (A2), thì M1 có phù hợp hơn từ quan điểm lý thuyết thông tin. Nhưng có điểm chuẩn nào cho sự khác biệt A1-A2 không? Ít hơn bao nhiêu là thực sự ít hơn? Nói cách khác, có thử nghiệm nào cho (A1-A2) ngoài việc chỉ đánh mắt không?

Chỉnh sửa: Peter / Dmitrij ... Cảm ơn bạn đã phản hồi. Trên thực tế, đây là một trường hợp mà chuyên môn thực sự của tôi mâu thuẫn với chuyên môn thống kê của tôi. Về cơ bản, vấn đề là KHÔNG chọn giữa hai mô hình, nhưng khi kiểm tra xem hai biến mà tôi biết có phần lớn tương đương có thêm lượng thông tin tương đương hay không (Trên thực tế, một biến trong mô hình thứ nhất và vectơ trong mô hình thứ hai. Hãy nghĩ về trường hợp một loạt các biến so với chỉ số của chúng.). Như Dmitrij đã chỉ ra, đặt cược tốt nhất dường như là Thử nghiệm Cox. Nhưng có cách nào thực sự kiểm tra sự khác biệt giữa nội dung thông tin của hai mô hình không?


Bạn cũng có thể quan tâm đến việc kiểm tra Wagonmakers et al. (2004). Đánh giá mô hình bắt chước bằng cách sử dụng bootstrap tham số. Tạp chí Tâm lý học toán học, 48 , 28-50. ( pdf ).
gung - Phục hồi Monica

Câu trả lời:


13

Là câu hỏi về sự tò mò, tức là bạn không hài lòng với câu trả lời của tôi ở đây ? Nếu không...

Nghiên cứu sâu hơn về câu hỏi khó này cho thấy có tồn tại một quy tắc ngón tay cái thường được sử dụng, nói rằng hai mô hình không thể phân biệt được theo tiêu chí nếu sự khác biệt | A I C 1 - A I C 2 | < 2 . Điều tương tự bạn thực sự sẽ đọc trong bài viết của wikipedia về A I C (lưu ý liên kết có thể nhấp được!). Chỉ dành cho những người không nhấp vào liên kết:AIC|AIC1AIC2|<2AIC

ước tính hỗ trợ tương đối cho một mô hình. Để áp dụng điều này trong thực tế, chúng tôi bắt đầu với một tập hợp các mô hình ứng viên và sau đó tìm cácgiá trị A I C tương ứng của các mô hình. Tiếp theo, xác địnhgiá trị A I C tối thiểu. Việc lựa chọn một mô hình sau đó có thể được thực hiện như sau.AICAICAIC

Theo nguyên tắc thông thường, các mô hình có của họ trong vòng 1 - 2 mức tối thiểu có sự hỗ trợ đáng kể và sẽ được xem xét khi đưa ra các kết luận. Các mô hình có A I C của họ trong khoảng 4 - 7 mức tối thiểu có mức hỗ trợ ít hơn đáng kể, trong khi các mô hình có A I C > 10 trên mức tối thiểu về cơ bản không có hỗ trợ và có thể bị bỏ qua khi xem xét thêm hoặc ít nhất là không giải thích được một số thay đổi cấu trúc đáng kể trong dữ liệu.AIC12AIC47AIC>10

Một cách tiếp cận tổng quát hơn như sau ...

Biểu thị giá trị của các mô hình ứng cử viên bởi Một Tôi C 1 , Một Tôi C 2 , Một Tôi C 3 , ... , Một Tôi C R . Đặt A I C m i n biểu thị mức tối thiểu của các giá trị đó. Khi đó e ( A I C m i n - A I C i ) / 2AICAIC1AIC2,AIC3,,AICRAICmine(AICminAICi)/2có thể được hiểu là xác suất tương đối mà mô hình thứ giảm thiểu việc mất thông tin (ước tính dự kiến).i

Ví dụ: giả sử có ba mô hình trong bộ ứng cử viên, với các giá trị 100 , 102110 . Sau đó, mô hình thứ hai là e ( 100 - 102 ) / 2 = 0,368 lần có thể xảy ra như mô hình đầu tiên để giảm thiểu mất thông tin và mô hình thứ ba là e ( 100 - 110 ) / 2 = 0,007AIC100102110e(100102)/2=0.368e(100110)/2=0.007lần có thể là mô hình đầu tiên để giảm thiểu mất thông tin. Trong trường hợp này, chúng tôi có thể bỏ qua mô hình thứ ba khỏi xem xét thêm và lấy trung bình có trọng số của hai mô hình đầu tiên, với trọng số lần lượt là 0,368 . Suy luận thống kê sau đó sẽ được dựa trên multimodel có trọng số.10.368

Giải thích tốt đẹp và đề xuất hữu ích, theo ý kiến ​​của tôi. Đừng sợ đọc những gì có thể nhấp!

Trong Ngoài ra , lưu ý một lần nữa, là ít thích hợp hơn cho các tập dữ liệu quy mô lớn. Ngoài B I C bạn có thể thấy hữu ích để áp dụng phiên bản thiên vị-chỉnh của Một Tôi C tiêu chuẩn Một Tôi C c (bạn có thể sử dụng này đang hoặc sử dụng công thức Một Tôi C c = Một Tôi C + 2 p ( p + 1 )AICBICAICAICcR , trong đóplà số lượng tham số ước tính). Quy tắc ngón tay cái sẽ giống nhau mặc dù. AICc=AIC+2p(p+1)np1p


Xin chào Dmitrij ... Tôi biết bạn sẽ phát hiện ra điều này. Trên thực tế, câu trả lời của bạn cho câu hỏi ban đầu đặt chuyến tàu này. Tôi nghĩ rằng điều này sẽ làm cho một câu hỏi độc lập thú vị. Vấn đề tôi đang vật lộn là các bài kiểm tra thống kê (bao gồm Bài kiểm tra của Cox) là thường xuyên và do đó bạn có thể kiểm tra sự khác biệt giữa hai mô hình ở một mức độ quan trọng được xác định trước. Nhưng AIC / BIC có khả năng dựa trên, và dường như với tôi rằng các con số không thể được so sánh trực tiếp ngoại trừ, như bạn chỉ ra, theo quy tắc ngón tay cái. Vì các biện pháp IC phụ thuộc vào quy mô, một giá trị tuyệt đối (2) có thể có vấn đề, phải không?
dùng3671

@user, Giá trị tuyệt đối của không có vấn đề. Bạn có thể đưa ra gợi ý xác suất tương đối, vì vậy bạn có thể sẽ tự tin hơn với điều này hơn một số giá trị tốt đẹp là 2 . Theo hiệu ứng quy mô, ý bạn là khi tiêu chí ít sai lệch trong các mẫu nhỏ và nhất quán trong lớn? Thay vào đó, hãy thử B I C nhất quán và A I C c cho các mẫu nhỏ cũng sẽ là một lựa chọn tốt. Quy tắc của ngón tay cái vẫn có thể sử dụng. 22BICAICc
Dmitrij Celov

1
@DmitrijCelov (+1 cách đây một thời gian) câu trả lời hay - cảm ơn vì đã dán văn bản, vì Wikipedia không còn có các điểm được đề cập trong hai đoạn đầu tiên. Đoạn văn bị loại bỏ được trích dẫn là p. 446: Burnham, K. P., and Anderson, D.R. (2002). Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach, 2nd ed. Springer-Verlag. ISBN 0-387-95364-7. và trang Wiki sửa đổi trước có ở đây
James Stanley

Tôi nên lưu ý rằng tôi chưa đọc cuốn sách Burnham và tài liệu tham khảo Wiki cũ đề xuất văn bản như được trích dẫn là một cách diễn đạt. FYI, trang Wiki đã được chỉnh sửa vào 16:51, ngày 15 tháng 4 năm 2011
James Stanley

Có lẽ bạn có thể giúp với câu hỏi tiếp theo này? stats.stackexchange.com/questions/349883/ Mạnh
Tripartio

8

Tôi nghĩ rằng đây có thể là một nỗ lực để có được những gì bạn không thực sự muốn.

Lựa chọn mô hình không phải là một khoa học. Ngoại trừ trong những trường hợp hiếm hoi, không có một mô hình hoàn hảo, hoặc thậm chí một mô hình "thật"; thậm chí hiếm khi có một mô hình "tốt nhất". Các cuộc thảo luận về AIC so với AICc so với BIC so với SBC so với bất cứ điều gì khiến tôi không bị làm phiền. Tôi nghĩ ý tưởng là để có được một số mô hình TỐT. Sau đó, bạn chọn trong số họ dựa trên sự kết hợp giữa chuyên môn thực tế và ý tưởng thống kê. Nếu bạn không có chuyên môn thực sự (hiếm khi như vậy; hiếm khi hơn nhiều so với hầu hết mọi người cho rằng) thì hãy chọn AIC thấp nhất (hoặc AICc hoặc bất cứ điều gì). Nhưng bạn thường có một số chuyên môn - khác tại sao bạn điều tra các biến cụ thể này?


2
+1 để nhấn mạnh sự cần thiết của cả chuyên môn thống kê và thực chất.
chl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.