Làm cách nào tôi có thể gộp các giá trị p đã được khởi động trên nhiều tập dữ liệu được liệt kê?


12

Tôi lo ngại về vấn đề tôi muốn khởi động giá trị p để ước tính từ dữ liệu được nhân đôi (MI), nhưng tôi không rõ cách kết hợp các giá trị p trên các bộ MI.θ

Đối với các tập dữ liệu MI, cách tiếp cận tiêu chuẩn để có được tổng phương sai của các ước tính sử dụng quy tắc của Rubin. Xem ở đây để xem xét các tập hợp dữ liệu MI. Căn bậc hai của tổng phương sai đóng vai trò như một ước tính sai số chuẩn của . Tuy nhiên, đối với một số người ước tính, tổng phương sai không có dạng đóng đã biết hoặc phân phối lấy mẫu là không bình thường. Các số liệu thống kê θ / s e ( θ ) có thể sau đó không t-phân phối, thậm chí không tiệm.θθ/se(θ)

Do đó, trong trường hợp dữ liệu hoàn chỉnh, một tùy chọn thay thế là khởi động lại thống kê để tìm phương sai, giá trị p và khoảng tin cậy, ngay cả khi phân phối mẫu không bình thường và không xác định được dạng đóng. Trong trường hợp MI có hai tùy chọn:

  • Nhóm phương sai bootstrapping trên các tập dữ liệu MI
  • Tập hợp giá trị p hoặc giới hạn tin cậy trên các tập dữ liệu MI

θ

Vì vậy, câu hỏi của tôi là: làm thế nào tôi nên gộp nhiều giá trị p được khởi động (hoặc khoảng tin cậy) trên nhiều tập dữ liệu được liệt kê?

Tôi sẽ hoan nghênh mọi đề xuất về cách tiến hành, cảm ơn bạn.


Có lẽ hữu ích: Thiếu dữ liệu, sự đổ tội và Bootstrap (Efron 1992) statistics.stanford.edu/sites/default/files/BIO%2520153.pdf
DL Dahly

@DLDahly Hmm, tôi không quen thuộc với bài báo đó, nhưng ý tưởng dường như là để bootstrap trước , và sau đó thực hiện nhiều lần cắt bỏ. OP dường như là ước tính bootstrapping từ bộ dữ liệu MI.
tchakravarty

@fgnu Thật vậy, quy trình chuẩn để có được tổng phương sai của ước tính bằng bootstrap sẽ là bootstrap phương sai trong mỗi tập dữ liệu MI, sau đó áp dụng các quy tắc của Rubin để gộp phương sai bootstraoped trên các tập dữ liệu MI.
tomka

Câu trả lời:


6

Tôi nghĩ rằng cả hai lựa chọn đều dẫn đến câu trả lời đúng. Nói chung, tôi thích phương pháp 1 hơn vì nó bảo toàn toàn bộ phân phối.

kmmk×m

Đối với phương pháp 2, sử dụng thủ tục Licht-Rubin. Xem Làm thế nào để có được các giá trị p được gộp trong các thử nghiệm được thực hiện trong nhiều bộ dữ liệu được liệt kê?


+1 - NẾU mục tiêu là để hiểu được tính biến thiên của các ước tính trên các bộ dữ liệu MI, tôi sẽ bootstrap trong mỗi tập dữ liệu MI và xem xét các phân phối tổng và cụ thể của MI của tham số.
DL Dahly

@ Stef-van-Buuren Có vẻ như những gì DL Dahly gợi ý là tương đương với việc tạo ra phương sai tăng cường trên các bộ MI. Bạn có còn thích phương thức của mình không (nối thêm tất cả các tập dữ liệu đã khởi động) vào phương pháp 'gián tiếp' này?
tomka

@tomka. Tôi chắc chắn sẽ làm giống như DL Dahly, và nghiên cứu bên trong và giữa các bản phân phối. Để tích hợp cả hai loại phân phối, chúng ta cần kết hợp chúng theo một cách nào đó. Đề nghị của tôi là chỉ cần trộn chúng.
Stef van Buuren

6

Đây không phải là một tài liệu mà tôi quen thuộc, nhưng một cách để tiếp cận điều này có thể là bỏ qua thực tế rằng đây là các giá trị p được khởi động và xem xét tài liệu về việc kết hợp các giá trị p trên các tập dữ liệu được nhân rộng.

Trong trường hợp đó, Li, Meng, Raghunathan và Rubin (1991) được áp dụng. Quy trình này dựa trên số liệu thống kê từ mỗi bộ dữ liệu được liệt kê, được tính trọng số bằng cách sử dụng thước đo tổn thất thông tin do bị cắt bỏ. Họ gặp phải các vấn đề liên quan đến việc phân phối chung các số liệu thống kê qua các lần buộc tội và họ đưa ra một số giả định đơn giản hóa.

Quan tâm liên quan là Mạnh (1994) .

Cập nhật

Một thủ tục kết hợp các giá trị p trên các tập dữ liệu được nhân rộng được mô tả trong luận án của Christine Licht, Ch. 4 . Ý tưởng, mà cô gán cho Don Rubin, về cơ bản là để biến đổi các giá trị p được phân phối bình thường, sau đó có thể được kết hợp trên các bộ dữ liệu MI bằng cách sử dụng các quy tắc chuẩn để kết hợp thống kê z.


Nếu tôi hiểu Li et al. hoạt động chính xác, nó áp dụng cho số liệu thống kê bạn nhận được từ mỗi bộ MI. Ví dụ: nếu bạn nhận được Pearson Chi² trên mỗi bộ, thì các quy tắc của chúng có thể được áp dụng để kết hợp nó để suy luận giữa các bộ. Ngoài ra, một bài kiểm tra Wald có thể được tiến hành, ví dụ. Nhưng trong trường hợp bootstrap, bạn không có số liệu thống kê bạn sẽ gộp (nhưng chỉ có giá trị p). Vì vậy, tôi không chắc chắn nếu có một cái gì đó trong Li et al. có thể được áp dụng cho p bootstrapping.
tomka

1
@tomka Mình đã cập nhật câu trả lời.
tchakravarty
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.