Làm thế nào tôi có thể gộp các phương tiện sau và khoảng tin cậy sau nhiều lần cắt bỏ?


20

Tôi đã sử dụng nhiều lần cắt bỏ để có được một số bộ dữ liệu hoàn thành.

Tôi đã sử dụng các phương thức Bayes trên mỗi bộ dữ liệu đã hoàn thành để có được các bản phân phối sau cho một tham số (một hiệu ứng ngẫu nhiên).

Làm cách nào tôi có thể kết hợp / gộp kết quả cho tham số này?


Thêm ngữ cảnh:

Mô hình của tôi được phân cấp theo nghĩa của từng học sinh (một quan sát trên mỗi học sinh) được nhóm lại trong các trường học. Tôi đã thực hiện nhiều lần cắt ngang (sử dụng MICEtrong R) trên dữ liệu của mình, nơi tôi đưa vào schoollàm một trong những yếu tố dự báo cho dữ liệu bị thiếu - để cố gắng kết hợp hệ thống phân cấp dữ liệu vào các lần cắt.

Tôi đã trang bị một mô hình độ dốc ngẫu nhiên đơn giản cho mỗi bộ dữ liệu đã hoàn thành (sử dụng MCMCglmmtrong R). Kết quả là nhị phân.

Tôi đã thấy rằng mật độ sau của phương sai độ dốc ngẫu nhiên là "cư xử tốt" theo nghĩa là chúng trông giống như thế này: nhập mô tả hình ảnh ở đây

Làm cách nào tôi có thể kết hợp / gộp các phương tiện sau và khoảng tin cậy từ mỗi tập dữ liệu được liệt kê, cho hiệu ứng ngẫu nhiên này?


Cập nhật1 :

Từ những gì tôi hiểu cho đến nay, tôi có thể áp dụng các quy tắc của Rubin cho nghĩa sau, để đưa ra ý nghĩa sau được nhân lên gấp bội - có bất kỳ vấn đề nào khi thực hiện điều này không? Nhưng tôi không biết làm thế nào tôi có thể kết hợp khoảng tin cậy 95%. Ngoài ra, vì tôi có một mẫu mật độ sau thực tế cho mỗi lần cắt cụt - bằng cách nào đó tôi có thể kết hợp chúng không?


Cập nhật2 :

Theo đề xuất của @ @ cyan trong các bình luận, tôi rất thích ý tưởng đơn giản là kết hợp các mẫu từ các bản phân phối sau thu được từ mỗi bộ dữ liệu hoàn chỉnh từ nhiều lần cắt bỏ. Tuy nhiên, tôi muốn biết lý do biện minh cho việc làm này.


Nếu sự thiếu sót của bất kỳ mốc thời gian cụ thể nào không phụ thuộc vào giá trị kết quả liên quan, thì chỉ cần ném tất cả các mẫu sau từ các bộ dữ liệu được liệt kê khác nhau và lấy khoảng tin cậy trung bình và 95% của các mẫu sau kết hợp.
Cyan

@Cyan có giống như nói rằng cơ chế mất tích là "mất ngẫu nhiên" hoặc "mất hoàn toàn ngẫu nhiên" nhưng không "thiếu không ngẫu nhiên" (các giả định thông thường tôi đã học được khi thực hiện MI)? Bạn có biết bất kỳ tài liệu tham khảo nào mà việc "ném nhau" này là chính thức không?
Joe King

Đa nhiệm là một thủ tục Bayes tại trung tâm của nó. Nếu bạn sử dụng các phương pháp Bayes để ước tính (MCMC và tương tự), bạn chỉ nên đưa mô phỏng dữ liệu bị thiếu làm bước lấy mẫu MCMC bổ sung cho mô hình Bayes hoàn toàn và không bận tâm đến việc thử giao diện giữa các phương pháp này.
StasK

@StasK cảm ơn bạn đã bình luận của bạn. Tôi sẽ cố gắng sử dụng phương pháp đó trong dự án tiếp theo của mình nhưng tiếc là tôi không có thời gian để thay đổi mô hình bây giờ. Tôi đã chạy các phần mềm và mô hình Bayes trên mỗi tập dữ liệu được liệt kê - phải mất gần 3 tuần để chạy. Bạn có nghĩ rằng việc kết hợp các mẫu sau là không hợp lệ không?
Joe King

Quy tắc của Rubin chỉ áp dụng cho những khoảnh khắc. Tôi không biết nếu bạn có thể áp dụng chúng cho một bản phân phối một cách có ý nghĩa. Co le không. Đó có thể là điều tốt nhất bạn có thể làm là nói rằng việc chạy MCMC đã tạo ra các ước tính điểm (phương tiện sau) và lỗi tiêu chuẩn (phương sai sau), sau đó sử dụng quy tắc của Rubin để lấy ước tính tổng điểm và phương sai. Bạn biết mức độ tổn thất của các dfs trong mô hình phân cấp có thể nguy hiểm như thế nào và nguy hiểm như thế nào khi gộp dữ liệu: nếu bạn có 5 bộ dữ liệu hoàn chỉnh được liệt kê và mỗi mẫu MCMC 1M, điều đó có nghĩa là bạn có 5 cụm chứ không phải 5M iid MCMC điểm.
StasK

Câu trả lời:


4

Với các hậu thế đặc biệt tốt có thể được mô tả đầy đủ bằng mô tả tham số của phân phối, bạn có thể chỉ cần lấy trung bình và phương sai mô tả đúng nhất về hậu thế của bạn và đi từ đó. Tôi nghi ngờ điều này có thể phù hợp trong nhiều trường hợp khi bạn không nhận được các bản phân phối hậu kỳ kỳ lạ.


0

Nếu bạn sử dụng stata, có một quy trình gọi là "mim" gộp dữ liệu sau khi sử dụng cho các mô hình hiệu ứng hỗn hợp. Tôi không biết nếu nó có sẵn trong R.


Cảm ơn bạn. Tôi có thể không giải thích rõ - tôi đã có các mẫu sau, từ một số bộ dữ liệu được liệt kê và tôi muốn biết liệu tôi có thể kết hợp chúng một cách đơn giản và sau đó tạo thành một khoảng tin cậy được nhân lên không?
Joe King
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.