Sự tương đương của AIC và giá trị p trong lựa chọn mô hình


9

Trong một bình luận cho câu trả lời của câu hỏi này , đã nói rằng sử dụng AIC trong lựa chọn mô hình tương đương với việc sử dụng giá trị p là 0,125.

Tôi đã thử nó trong R, nơi tôi đã sử dụng thuật toán lựa chọn tập hợp con "lạc hậu" để loại bỏ các biến từ một đặc điểm kỹ thuật đầy đủ. Đầu tiên, bằng cách loại bỏ tuần tự biến có giá trị p cao nhất và dừng khi tất cả các giá trị p nằm dưới 0,125 và thứ hai, bằng cách loại bỏ biến dẫn đến AIC thấp nhất khi loại bỏ cho đến khi không thể cải thiện.

Hóa ra họ cho kết quả gần như tương tự khi tôi sử dụng giá trị p là 0,125 làm ngưỡng.

Điều này có thực sự đúng không? Nếu vậy, có ai biết tại sao hoặc có thể tham khảo một nguồn giải thích nó không?

PS tôi không thể yêu cầu người bình luận hoặc viết bình luận, vì chỉ cần đăng ký. Tôi biết rằng đây không phải là cách tiếp cận phù hợp nhất để lựa chọn mô hình và suy luận, v.v.


(1) Mô hình tiên lượng với phân tích hồi quy logistic: so sánh các phương pháp lựa chọn và ước lượng trong các tập dữ liệu nhỏ. Thống kê trong Y học, 19, 1059-1079 (2) đúng với các biến có df1, dựa trên định nghĩa aic. Nhưng có thể thấp hơn nếu mức độ tự do của các biến cao hơn
charles

Câu trả lời:


13

Lựa chọn biến được thực hiện bằng kiểm tra thống kê hoặc AIC rất có vấn đề. Nếu sử dụng các thử nghiệm , AIC sử dụng mức cắt = 2.0 tương ứng với . AIC khi được sử dụng trên các biến riêng lẻ không có gì mới; nó chỉ sử dụng hợp lý hơn 0,05. Một mức hợp lý hơn (ít gây nhiễu hơn) là 0,5.χ 2 α = 0,157 α αχ2χ2α=0.157αα


+1 Tôi đã dành quá nhiều thời gian để xây dựng câu trả lời (hiện đã bị xóa) của mình, tôi thậm chí không thấy câu trả lời này đã được đăng trong thời gian đó. Thay vào đó tôi sẽ bỏ phiếu này.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.