Tôi muốn tư vấn về việc tổng hợp các lô / số liệu thống kê sau nhiều lần cắt bỏ. Trong quá trình phát triển các mô hình thống kê để dự đoán một sự kiện trong tương lai (ví dụ: sử dụng dữ liệu từ hồ sơ bệnh viện để dự đoán tỷ lệ sống sót sau khi xuất viện hoặc sự kiện), người ta có thể tưởng tượng có một số thông tin còn thiếu. Đa mục tiêu là một cách xử lý một tình huống như vậy, nhưng dẫn đến sự cần thiết phải tổng hợp các số liệu thống kê kiểm tra từ mỗi bộ dữ liệu về việc loại trừ có tính đến sự thay đổi bổ sung do sự không chắc chắn vốn có của việc buộc tội.
Tôi hiểu rằng có nhiều số liệu thống kê hiệu chuẩn (hosmer-lemeshow, Emell của Emell, chỉ số hiệu chuẩn ước tính, v.v.), theo đó các quy tắc 'thông thường' của Rubin có thể áp dụng.
Tuy nhiên, những thống kê này thường là các biện pháp hiệu chuẩn tổng thể không hiển thị các vùng hiệu chỉnh sai cụ thể của mô hình. Vì lý do này, tôi muốn nhìn vào một âm mưu hiệu chuẩn. Đáng tiếc, tôi không biết cách 'gộp' các lô hoặc dữ liệu đằng sau chúng (xác suất dự đoán cho mỗi cá nhân và kết quả quan sát được trên mỗi cá nhân), và không thể tìm thấy nhiều trong tài liệu y sinh (lĩnh vực tôi quen thuộc), hoặc ở đây, trên CrossValidated. Tất nhiên, nhìn vào âm mưu hiệu chuẩn của từng bộ dữ liệu có thể là một câu trả lời, nhưng có thể trở nên khá khó chịu (hiện tại) khi có rất nhiều bộ khử nhiễu được tạo ra.
Do đó, tôi muốn hỏi liệu có những kỹ thuật nào sẽ dẫn đến một âm mưu hiệu chuẩn, được gộp lại sau nhiều lần cắt bỏ (?)