Lô tổng hợp hiệu chuẩn sau nhiều lần cắt


15

Tôi muốn tư vấn về việc tổng hợp các lô / số liệu thống kê sau nhiều lần cắt bỏ. Trong quá trình phát triển các mô hình thống kê để dự đoán một sự kiện trong tương lai (ví dụ: sử dụng dữ liệu từ hồ sơ bệnh viện để dự đoán tỷ lệ sống sót sau khi xuất viện hoặc sự kiện), người ta có thể tưởng tượng có một số thông tin còn thiếu. Đa mục tiêu là một cách xử lý một tình huống như vậy, nhưng dẫn đến sự cần thiết phải tổng hợp các số liệu thống kê kiểm tra từ mỗi bộ dữ liệu về việc loại trừ có tính đến sự thay đổi bổ sung do sự không chắc chắn vốn có của việc buộc tội.

Tôi hiểu rằng có nhiều số liệu thống kê hiệu chuẩn (hosmer-lemeshow, Emell của Emell, chỉ số hiệu chuẩn ước tính, v.v.), theo đó các quy tắc 'thông thường' của Rubin có thể áp dụng.

Tuy nhiên, những thống kê này thường là các biện pháp hiệu chuẩn tổng thể không hiển thị các vùng hiệu chỉnh sai cụ thể của mô hình. Vì lý do này, tôi muốn nhìn vào một âm mưu hiệu chuẩn. Đáng tiếc, tôi không biết cách 'gộp' các lô hoặc dữ liệu đằng sau chúng (xác suất dự đoán cho mỗi cá nhân và kết quả quan sát được trên mỗi cá nhân), và không thể tìm thấy nhiều trong tài liệu y sinh (lĩnh vực tôi quen thuộc), hoặc ở đây, trên CrossValidated. Tất nhiên, nhìn vào âm mưu hiệu chuẩn của từng bộ dữ liệu có thể là một câu trả lời, nhưng có thể trở nên khá khó chịu (hiện tại) khi có rất nhiều bộ khử nhiễu được tạo ra.

Do đó, tôi muốn hỏi liệu có những kỹ thuật nào sẽ dẫn đến một âm mưu hiệu chuẩn, được gộp lại sau nhiều lần cắt bỏ (?)


Có thể trực tiếp gộp các mẫu đã khởi động và đánh giá hiệu chuẩn của mẫu đó không?
AdamO

@AdamO chính xác những gì bạn có nghĩa là bằng cách trực tiếp gộp? Và những mẫu bootstrap nào bạn tham khảo?
IWS

2
Xin lỗi hãy để tôi sao lưu, (tôi nghĩ về MI như một bootstrap). Tôi đang nói, nếu n của bạn là 1.000 và bạn có 5 bộ dữ liệu MI, tại sao không tạo một biểu đồ hiệu chuẩn duy nhất từ ​​5000 và so sánh quan sát / mong đợi trong bất kỳ điều gì mong muốn trong 5.000 đó?
AdamO

@AdamO Nghe có vẻ thú vị, nó sẽ yêu cầu điều chỉnh các chức năng cũng cung cấp khoảng tin cậy mặc dù. Bất kỳ tài liệu tham khảo hoặc lý thuyết để sao lưu ý tưởng này?
IWS

2
Không có tài liệu tham khảo, chúng tôi đã xuất bản một bài báo gần đây, nơi chúng tôi tuyên bố mà không có bằng chứng cho thấy chúng tôi đã suy luận về các lỗi tiêu chuẩn bootstrap và nhiều lần buộc tội bằng cách gộp chúng lại với nhau theo cách này. Tôi nghĩ rằng bạn có thể nói rằng mục đích của phân tích là thử nghiệm ở mức 0,05 rằng tỷ lệ kỳ vọng / chênh lệch nằm trong phạm vi phân phối bình thường và ước tính lượng tử là bất biến đối với kích thước mẫu, vì vậy thử nghiệm dựa trên CI 95% không bị ảnh hưởng bởi gộp.
AdamO

Câu trả lời:


1

[...] Nếu n của bạn là 1.000 và bạn có 5 bộ dữ liệu MI, tại sao không tạo một biểu đồ hiệu chuẩn duy nhất từ ​​5000 và so sánh quan sát / dự kiến ​​theo bất kỳ điều gì mong muốn trong 5.000 đó?

Về tài liệu tham khảo:

Không có tài liệu tham khảo, chúng tôi đã xuất bản một bài báo gần đây, nơi chúng tôi đã tuyên bố mà không có bằng chứng cho thấy chúng tôi đã suy luận về các lỗi tiêu chuẩn bootstrap và nhiều lần buộc tội bằng cách gộp chúng lại với nhau theo cách này. Tôi nghĩ rằng bạn có thể nói rằng mục đích của phân tích là kiểm tra ở mức 0,05 rằng tỷ lệ kỳ vọng / chênh lệch nằm trong phạm vi phân phối bình thường và ước tính lượng tử là bất biến đối với kích thước mẫu, do đó, kiểm tra dựa trên CI 95% không bị ảnh hưởng bởi gộp.


1
Tôi đã sao chép nhận xét này của @AdamO dưới dạng câu trả lời wiki cộng đồng vì nhận xét ít nhiều là câu trả lời cho câu hỏi này. Chúng tôi có một khoảng cách lớn giữa câu trả lời và câu hỏi. Ít nhất một phần của vấn đề là một số câu hỏi được trả lời trong các bình luận: nếu các bình luận trả lời câu hỏi là câu trả lời thay vào đó, chúng ta sẽ có ít câu hỏi chưa được trả lời hơn.
mkt - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.