Thiếu giá trị trong biến trả lời trong JAGS


10

Gelman & Hill (2006) nói:

Trong Bugs, các kết quả bị thiếu trong hồi quy có thể được xử lý dễ dàng bằng cách đơn giản bao gồm vectơ dữ liệu, NA và tất cả. Lỗi mô hình hóa rõ ràng biến kết quả và do đó, việc sử dụng mô hình này để, trong trường hợp, áp đặt các giá trị bị thiếu ở mỗi lần lặp là điều không quan trọng.

Điều này nghe có vẻ như một cách dễ dàng để sử dụng JAGS để dự đoán. Nhưng các quan sát với các kết quả còn thiếu cũng ảnh hưởng đến ước tính tham số? Nếu vậy, có một cách dễ dàng để giữ những quan sát này trong bộ dữ liệu mà JAGS nhìn thấy, nhưng để chúng không ảnh hưởng đến các ước tính tham số? Tôi đã suy nghĩ về chức năng cắt, nhưng điều đó chỉ có sẵn trong BUGS chứ không phải JAGS.

Câu trả lời:


11

Vâng, nó thực sự dễ sử dụng trong BUGS hoặc JAGS! Nó thực sự là một niềm vui để sử dụng nó!

Nhưng các quan sát với các kết quả còn thiếu cũng ảnh hưởng đến ước tính tham số?

Dĩ nhiên là không. Các thông số chỉ bị ảnh hưởng bởi các kết quả quan sát được. Các kết quả bị thiếu (NA) sẽ không ảnh hưởng đến bất cứ điều gì, thực ra nó là một cách khác: các kết quả bị thiếu sẽ được lấy từ các tham số. Lưu ý rằng các kết quả còn thiếu cũng sẽ có phân phối sau. Sau đó, rất dễ dàng để tính toán một số đại lượng có nguồn gốc, ví dụ như tổng các chỉ số của kết quả và các đại lượng dẫn xuất này không chỉ được xử lý cho các giá trị bị thiếu, mà còn có phân phối sau. Đó là những gì rất hấp dẫn trên BUGS & JAGS!

Chúc vui vẻ!


1
Xin lỗi, tôi không tin rằng kết quả bị thiếu không ảnh hưởng đến ước tính tham số. Jackman dường như nói ngược lại: jackman.stanford.edu/blog/?p=38
Jack Tanner

@JackTanner, hãy suy nghĩ về nó một lúc. Làm thế nào có thể thiếu giá trị ảnh hưởng đến một cái gì đó? Khi thuật toán bắt đầu, giá trị còn thiếu sẽ bắt đầu được xác định từ các ước tính tham số (chúng được lấy từ các kết quả quan sát được). Sau đó (có thể, tôi không chắc chắn), thông tin từ kết quả bị thiếu có thể bị trả lại có thể bị trả về các tham số, nhưng nó không thành vấn đề - đó chỉ là thông tin ban đầu, hiện diện trong các tham số, bị trả về cho chúng. Thông tin THỰC SỰ ảnh hưởng đến một cái gì đó chỉ đến từ kết quả THỰC SỰ. Nếu bạn không tin tưởng tôi, hãy tạo một mô phỏng, so sánh kết quả và đăng ở đây.
Tò mò

Về liên kết của bạn, anh ta rõ ràng không chắc chắn về điều đó, anh ta nói "vấn đề" - trong ngoặc kép, và anh ta nói "thật thú vị khi so sánh nó". Tôi nói sẽ không có sự khác biệt đáng kể. Nếu bạn muốn kiểm tra nó, hãy tiếp tục.
Tò mò

3
Tôi đồng ý; không có sự khác biệt đáng kể. Tôi sử dụng phương pháp này để xây dựng các bản phân phối dự báo sau; chỉ cần đặt các giá trị dự đoán của các biến bên phải cùng với các giá trị trong quá khứ và NA cho "mục tiêu" quan sát của biến mục tiêu tương ứng với các giá trị dự đoán.
jbowman

@jbowman, vâng, lưu ý tốt! Không phải là một ý tưởng rõ ràng để làm dự đoán theo cách này!
Tò mò
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.