Câu hỏi / chủ đề này xuất hiện trong một cuộc thảo luận với một đồng nghiệp và tôi đang tìm kiếm một số ý kiến về điều này:
Tôi đang mô hình hóa một số dữ liệu bằng cách sử dụng hồi quy logistic hiệu ứng ngẫu nhiên, chính xác hơn là hồi quy logistic chặn ngẫu nhiên. Đối với các hiệu ứng cố định, tôi có 9 biến được quan tâm và xem xét. Tôi muốn thực hiện một số loại lựa chọn mô hình để tìm ra các biến có ý nghĩa và đưa ra mô hình tốt nhất của 271 (chỉ các hiệu ứng chính).
Ý tưởng đầu tiên của tôi là sử dụng AIC để so sánh các mô hình khác nhau nhưng với 9 biến tôi không quá hứng thú để so sánh 2 ^ 9 = 512 mô hình khác nhau (từ khóa: nạo vét dữ liệu).
Tôi đã thảo luận điều này với một đồng nghiệp và anh ấy nói với tôi rằng anh ấy nhớ đọc về việc sử dụng lựa chọn mô hình từng bước (hoặc chuyển tiếp) với GLMM. Nhưng thay vì sử dụng giá trị p (ví dụ: dựa trên kiểm tra tỷ lệ khả năng cho GLMM), người ta nên sử dụng AIC làm tiêu chí xuất / nhập.
Tôi thấy ý tưởng này rất thú vị, nhưng tôi không tìm thấy bất kỳ tài liệu tham khảo nào thảo luận thêm về điều này và đồng nghiệp của tôi không nhớ anh ta đã đọc nó ở đâu. Nhiều cuốn sách đề nghị sử dụng AIC để so sánh các mô hình nhưng tôi không tìm thấy bất kỳ cuộc thảo luận nào về việc sử dụng mô hình này cùng với quy trình lựa chọn mô hình từng bước hoặc chuyển tiếp.
Vì vậy, về cơ bản tôi có hai câu hỏi:
Có điều gì sai khi sử dụng AIC trong quy trình lựa chọn mô hình từng bước làm tiêu chí xuất / nhập không? Nếu có, cái gì sẽ thay thế?
Bạn có một số tài liệu tham khảo thảo luận về quy trình trên mà (cũng như tài liệu tham khảo cho một báo cáo cuối cùng?
Tốt,
Emilia