Làm thế nào các mô hình hiệu ứng hỗn hợp nên được so sánh và hoặc xác nhận?


22

Làm thế nào các mô hình hiệu ứng hỗn hợp (tuyến tính) thường được so sánh với nhau? Tôi biết các phép thử tỷ lệ có thể được sử dụng, nhưng điều này không hoạt động nếu một mô hình không phải là 'tập hợp con' của mô hình kia đúng?

Là ước tính của các mô hình df luôn luôn đơn giản? Số hiệu ứng cố định + số lượng thành phần phương sai ước tính? Chúng ta có bỏ qua các ước tính hiệu ứng ngẫu nhiên?

Còn xác nhận thì sao? Suy nghĩ đầu tiên của tôi là xác nhận chéo, nhưng các nếp gấp ngẫu nhiên có thể không hoạt động dựa trên cấu trúc của dữ liệu. Phương pháp 'bỏ một chủ đề / cụm ra' có phù hợp không? Điều gì về việc để lại một quan sát ra?

Mallows Cp có thể được hiểu là ước tính của lỗi dự đoán mô hình. Lựa chọn mô hình thông qua AIC cố gắng giảm thiểu lỗi dự đoán (Vì vậy, Cp và AIC nên chọn cùng một mô hình nếu các lỗi là Gaussian tôi tin). Điều này có nghĩa là AIC hoặc Cp có thể được sử dụng để chọn mô hình hiệu ứng hỗn hợp tuyến tính 'tối ưu' từ bộ sưu tập một số mô hình không lồng nhau về lỗi dự đoán? (miễn là chúng phù hợp trên cùng một dữ liệu) BIC có còn có khả năng chọn mô hình 'đúng' trong số các ứng cử viên không?

Tôi cũng có ấn tượng rằng khi so sánh các mô hình hiệu ứng hỗn hợp thông qua AIC hoặc BIC, chúng tôi chỉ tính các hiệu ứng cố định là 'tham số' trong tính toán, không phải là mô hình thực tế df.

Có tài liệu tốt về các chủ đề này? Có đáng để điều tra cICIC hoặc mAIC không? Họ có ứng dụng cụ thể ngoài AIC không?


2
Bạn có ý nghĩa gì khi áp dụng cICIC hoặc mAIC "bên ngoài AIC"? DIC là thước đo được sử dụng rộng rãi về độ chính xác dự đoán mà bạn có thể điều tra, cố gắng xử phạt bằng số lượng tham số "hiệu quả" có trong mô hình đa cấp.
khách

@guest Ý tôi là, họ có sử dụng cụ thể không, nói cho các loại mô hình cụ thể? Tôi sẽ kiểm tra DIC. Cảm ơn bạn.
dcl

Câu trả lời:


12

Vấn đề chính về lựa chọn mô hình trong các mô hình hỗn hợp là xác định mức độ tự do (df) của một mô hình, thực sự. Để tính df của một mô hình hỗn hợp, người ta phải xác định số lượng tham số ước tính bao gồm các hiệu ứng cố định và ngẫu nhiên. Và điều này không đơn giản. Bài viết này của Jiming Jiang và những người khác (2008) có tên "Phương pháp hàng rào cho lựa chọn mô hình hỗn hợp" có thể được áp dụng trong các tình huống như vậy. Một tác phẩm có liên quan mới này là một bằng Greven, S. & Kneib, T. (2010) mang tên "Trên hành vi của AIC biên và điều kiện trong các mô hình hỗn hợp tuyến tính". Hy vọng điều này có thể hữu ích.


Tôi sẽ kiểm tra những giấy tờ đó. Chúc mừng.
dcl

6

Một cách để so sánh các mô hình (cho dù hỗn hợp hay cách khác) là vẽ kết quả. Giả sử bạn havae mô hình A và mô hình B; tạo ra các giá trị được trang bị từ mỗi và vẽ đồ thị cho nhau trong một biểu đồ phân tán. Nếu các giá trị rất giống nhau (sử dụng phán đoán của bạn về việc chúng có), hãy chọn mô hình đơn giản hơn. Một ý tưởng khác là tìm sự khác biệt giữa các giá trị được trang bị và biểu đồ này so với các giá trị độc lập; bạn cũng có thể tạo ra một âm mưu mật độ của sự khác biệt. Nói chung, tôi là người đề xuất không sử dụng các thử nghiệm thống kê để so sánh các mô hình (mặc dù AIC và các biến thể của nó chắc chắn có những ưu điểm) mà là sử dụng phán đoán. Tất nhiên, điều này có lợi thế (không) là không đưa ra câu trả lời chính xác.


Những gì bạn đang mô tả, chỉ là so sánh các mô hình khi mục đích chính là khả năng dự đoán của chúng. Ngoài ra, kết quả đồ họa có thể rất hữu ích để hướng dẫn một mô hình nào có thể hữu ích, nhưng nói chung, chúng không phải là kết quả khoa học chính thức hoàn toàn.
hbaghishani

2
Xin chào @hbaghishani; Tôi sẽ chỉ trích dẫn Tukey "Tốt hơn một câu trả lời gần đúng cho câu hỏi đúng, thường mơ hồ, hơn là một câu trả lời chính xác cho câu hỏi sai, luôn luôn có thể được đưa ra chính xác." :-). Nó không hoàn toàn là apropos ở đây, nhưng nó ít nhất là một phần trên mục tiêu
Peter Flom - Rebstate Monica

1
Tôi thường làm các lô như bạn mô tả trong khi xây dựng mô hình. Nhưng tôi thực sự đang tìm kiếm một phương pháp 'toán học' hơn. Cheers
dcl

Nếu so sánh các mô hình khác nhau dựa trên hiệu suất dự đoán, thì tôi hiểu rằng các giá trị dự đoán cho các mô hình hỗn hợp có và không có hiệu ứng ngẫu nhiên phải giống hệt nhau (nghĩa là các hệ số hồi quy sẽ không thiên vị trong các mô hình có và không có hiệu ứng ngẫu nhiên, chỉ có các lỗi tiêu chuẩn thay đổi).
RobertF
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.