Tại sao áp dụng lựa chọn mô hình bằng AIC mang lại cho tôi các giá trị p không đáng kể cho các biến


14

Tôi có một số câu hỏi về AIC và hy vọng bạn có thể giúp tôi. Tôi đã áp dụng lựa chọn mô hình (lùi hoặc tiến) dựa trên AIC trên dữ liệu của mình. Và một số biến được chọn kết thúc với giá trị p> 0,05. Tôi biết rằng mọi người đang nói rằng chúng ta nên chọn các mô hình dựa trên AIC thay vì giá trị p, vì vậy dường như AIC và giá trị p là hai khái niệm khác nhau. Ai đó có thể cho tôi biết sự khác biệt là gì? Những gì tôi hiểu cho đến nay là:

  1. Để chọn ngược bằng AIC, giả sử chúng ta có 3 biến (var1, var2, var3) và AIC của mô hình này là AIC *. Nếu loại trừ bất kỳ một trong ba biến này sẽ không kết thúc với AIC thấp hơn đáng kể so với AIC * (về phân phối ch-vuông với df = 1), thì chúng tôi sẽ nói ba biến này là kết quả cuối cùng.

  2. Giá trị p đáng kể cho một biến (ví dụ var1) trong mô hình ba biến có nghĩa là kích thước hiệu ứng được tiêu chuẩn hóa của biến đó khác biệt đáng kể so với 0 (theo Wald, hoặc kiểm tra t).

Sự khác biệt cơ bản giữa hai phương pháp này là gì? Làm cách nào để diễn giải nó nếu có một số biến có giá trị p không đáng kể trong mô hình tốt nhất của tôi (thu được qua AIC)?

Câu trả lời:


13

AIC và các biến thể của nó gần với các biến thể trên trên các giá trị p của từng biến hồi quy. Chính xác hơn, chúng là các phiên bản bị phạt của khả năng đăng nhập.R2

Bạn không muốn kiểm tra sự khác biệt của AIC bằng cách sử dụng bình phương. Bạn có thể kiểm tra sự khác biệt của khả năng đăng nhập bằng cách sử dụng bình phương (nếu các mô hình được lồng nhau). Đối với AIC, thấp hơn là tốt hơn (trong hầu hết các triển khai của nó, dù sao). Không cần điều chỉnh thêm.

Bạn thực sự muốn tránh các phương pháp lựa chọn mô hình tự động, nếu bạn có thể. Nếu bạn phải sử dụng một, hãy thử LASSO hoặc LAR.


2
Cảm ơn bạn đã trả lời. Vâng, bạn đúng. AIC không áp dụng bất kỳ thử nghiệm nào, thay vào đó, nó đưa ra một thước đo đơn giản về mức độ tốt của mô hình phù hợp với mẫu và liệu mô hình có thể được giữ đơn giản hay không, bằng cách thêm loglikabilities với 2 * number_of_parameter. Có lẽ điều này giải thích tại sao các biến có giá trị p không đáng kể được giữ trong mô hình đã chọn?
tiantianchen

Chúng ta nên chọn mô hình nào nếu chúng ta có hai mô hình có AIC gần giống nhau, nhưng trong một mô hình chúng ta có các điều khoản quan trọng hơn so với mô hình kia?
Agus Camacho

Bất cứ điều gì bạn muốn.
Peter Flom - Tái lập Monica

11

χ12

Vì vậy, hầu như không ngạc nhiên nếu bạn so sánh nó với việc sử dụng một số điểm cắt nhỏ hơn cho các giá trị p mà đôi khi nó bao gồm các biến có giá trị p cao hơn mức cắt đó.


bạn có thể chỉ cho tôi một url hoặc tham chiếu cho kết nối giữa AIC và giá trị p qua Wal chi-vuông không? Cảm ơn.
meh

Điều này tương đối dễ dàng để hiển thị bằng cách sử dụng giá trị 2 làm giá trị tới hạn, tương ứng với ngưỡng giá trị p là 15,73% (khi mức độ tự do của thử nghiệm là 1, như trường hợp lựa chọn từng bước sử dụng hồi quy tuyến tính mô hình và các biến liên tục). Điều này có thể được tính là 1-chi2cdf (2.1).
George

@aginensky Không thấy một tài liệu tham khảo thực tế, mặc dù kết nối rất đơn giản. Tôi tưởng tượng tôi có thể google một cái, treo lên.
Glen_b -Reinstate Monica

@aginensky Lindsey, JK & Jones, B. (1998) Lựa chọn trong số các mô hình tuyến tính tổng quát áp dụng cho dữ liệu y tế. Thống kê trong Y học , 17, 59-68. ... xem giữa trang 62. Sẽ có nhiều hơn nữa.
Glen_b -Reinstate Monica

@ Glen_b- cảm ơn, tôi chưa bao giờ thấy bất cứ điều gì như vậy trước đây.
meh

9

Lưu ý rằng không có giá trị p hoặc AIC nào được thiết kế để lựa chọn mô hình từng bước, trên thực tế, các giả định nằm dưới cả hai (nhưng các giả định khác nhau) đều bị vi phạm sau bước đầu tiên trong hồi quy từng bước. Như @PeterFlom đã đề cập, LASSO và / hoặc LAR là những lựa chọn thay thế tốt hơn nếu bạn cảm thấy cần lựa chọn mô hình tự động. Các phương pháp đó kéo các ước tính lớn bằng cơ hội (phần thưởng từng bước cho cơ hội) trở về 0 và do đó có xu hướng ít sai lệch hơn so với từng bước (và xu hướng còn lại có xu hướng bảo thủ hơn).

Một vấn đề lớn với AIC thường bị bỏ qua là kích thước của sự khác biệt trong các giá trị AIC, tất cả đều phổ biến để thấy "thấp hơn là tốt hơn" và dừng lại ở đó (và các thủ tục tự động chỉ nhấn mạnh điều này). Nếu bạn đang so sánh 2 mô hình và chúng có các giá trị AIC rất khác nhau, thì có một ưu tiên rõ ràng cho mô hình với AIC thấp hơn, nhưng thường chúng ta sẽ có 2 mô hình (hoặc nhiều hơn) với các giá trị AIC gần nhau, trong trường hợp này chỉ sử dụng mô hình có giá trị AIC thấp nhất sẽ bỏ lỡ thông tin có giá trị (và suy ra những điều về các thuật ngữ có trong hoặc không có trong mô hình này nhưng khác với các mô hình tương tự khác sẽ vô nghĩa hoặc tệ hơn). Thông tin từ bên ngoài dữ liệu (chẳng hạn như mức độ khó / tốn kém) để thu thập tập hợp các biến dự đoán) có thể làm cho một mô hình có AIC cao hơn một chút mong muốn sử dụng mà không làm giảm chất lượng. Một cách tiếp cận khác là sử dụng mức trung bình có trọng số của các mô hình tương tự (điều này có thể sẽ dẫn đến dự đoán cuối cùng tương tự với các phương pháp bị phạt như hồi quy sườn hoặc lasso, nhưng quá trình suy nghĩ dẫn đến mô hình có thể giúp hiểu được).


Cảm ơn bạn @GregSnow cho câu trả lời của bạn. Tôi có thể hỏi các giả định (khác nhau) cho lựa chọn mô hình dựa trên giá trị p và AIC là gì không? Việc áp dụng một hướng hai chiều (tiến / lùi) hay thử một tập hợp con đầy đủ ít nhiều sẽ giải quyết vấn đề tìm mô hình tối ưu cục bộ đơn giản bằng cách sử dụng lựa chọn tiến hoặc lùi theo từng bước? (mặc dù vấn đề quá mức luôn tồn tại trong phương pháp AIC / p-value và LASSO và / hoặc LAR là một lựa chọn tốt hơn)
tiantianchen

Vì không có giá trị p hoặc AIC nào được thiết kế để chọn mô hình, nên chúng không có giả định cho lựa chọn mô hình. Cả hai đều được thiết kế để thực hiện một so sánh duy nhất, suy nghĩ về việc có bao nhiêu so sánh diễn ra trong một hồi quy từng bước, bạn có thực sự nghĩ rằng bước "tốt nhất" được thực hiện mỗi lần không?
Greg Snow

@GregSnow. Tài liệu tham khảo của tôi để học AIC là thế này - stat.cmu.edu/~larry/=stat705/Lecture16.pdf dường như đưa AIC vào kinh doanh lựa chọn mô hình. Ngoài ra, khi tôi thấy AIC được sử dụng trong các mô hình arima theo chuỗi thời gian, nó luôn được sử dụng để lựa chọn mô hình.
meh

@aginensky, Có, AIC (và những người khác) được sử dụng để lựa chọn mô hình. Điều đó không hiểu rằng AIC đã được chỉ định cho lựa chọn mô hình, hoặc nó thậm chí phù hợp với lựa chọn mô hình hoặc lựa chọn mô hình tự động trả lời một câu hỏi có ý nghĩa. Tôi đã sử dụng một tuốc nơ vít như một cái búa trước đây, điều đó không có nghĩa là nó là một ý tưởng tốt nói chung.
Greg Snow

"Bài viết này mô tả cách xử lý vấn đề lựa chọn mô hình thống kê một cách có hệ thống bằng cách sử dụng tiêu chí thông tin (AIC) do tác giả giới thiệu năm 1971" từ Akaike, "Một cái nhìn mới về nhận dạng mô hình thống kê". Vì vậy, ngay cả khi AIC là một cái búa được sử dụng cho một vấn đề được giải quyết tốt nhất bằng tuốc nơ vít, thì đó là quan điểm của người thiết kế chiếc búa này, rằng một cái búa là cách chính xác để giải quyết vấn đề này. Chính xác hay không chính xác, AIC được thiết kế để lựa chọn mô hình. Tôi rất vui khi thấy một cái nhìn khác về AIC. Hãy trả lời, nhưng tôi đã làm xong.
meh

1

Kinh nghiệm của tôi với AIC là nếu các biến xuất hiện không đáng kể, nhưng vẫn xuất hiện trong mô hình có AIC nhỏ nhất, thì các biến đó có thể là các yếu tố gây nhiễu.

Tôi đề nghị bạn kiểm tra gây nhiễu. Loại bỏ các biến không quan trọng như vậy sẽ làm thay đổi từ tính của một số hệ số ước tính còn lại hơn 25%.


Vui lòng giải thích làm thế nào OP "có thể kiểm tra gây nhiễu."
Jim

0

Tôi nghĩ rằng lựa chọn mô hình tốt nhất là bằng cách sử dụng gói MuMIn. Đây sẽ là kết quả cuối cùng và bạn không phải tìm kiếm các giá trị AIC thấp nhất. Thí dụ:

d<-read.csv("datasource")
library(MuMIn)
fit<-glm(y~x1+x2+x3+x4,family=poisson,data=d)
get.models(dredge(fit,rank="AIC"))[1]

2
Nói mã nào bạn có thể sử dụng không thực sự trả lời câu hỏi trừ khi bạn có thể giải thích cách giải quyết câu hỏi đó theo thống kê. Trong mọi trường hợp, không có gì trong câu hỏi là dành riêng cho phần mềm cụ thể.
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.