Đa mục tiêu khá đơn giản khi bạn có một mô hình tuyến tính tiên nghiệm mà bạn muốn ước tính. Tuy nhiên, mọi thứ dường như phức tạp hơn một chút khi bạn thực sự muốn thực hiện một số lựa chọn mô hình (ví dụ: tìm tập hợp các biến dự đoán "tốt nhất" từ một tập hợp các biến số ứng cử viên lớn hơn - tôi nghĩ cụ thể về LASSO và đa thức phân số sử dụng R).
Một ý tưởng sẽ phù hợp với mô hình trong dữ liệu gốc với các giá trị bị thiếu và sau đó ước tính lại mô hình này trong bộ dữ liệu MI và kết hợp các ước tính như bạn thường làm. Tuy nhiên, điều này có vẻ có vấn đề vì bạn đang mong đợi sự thiên vị (hoặc nếu không thì tại sao MI lại ở vị trí đầu tiên?), Điều này có thể dẫn đến việc chọn một mô hình "sai" ngay từ đầu.
Một ý tưởng khác là trải qua bất kỳ quy trình lựa chọn mô hình nào bạn đang sử dụng trong mỗi tập dữ liệu MI - nhưng sau đó bạn sẽ kết hợp các kết quả như thế nào nếu chúng bao gồm các bộ biến khác nhau?
Tôi nghĩ rằng tôi đã xếp chồng một bộ dữ liệu MI và phân tích chúng thành một bộ dữ liệu lớn mà sau đó bạn sẽ sử dụng để phù hợp với một mô hình "tốt nhất" và bao gồm một hiệu ứng ngẫu nhiên để giải thích cho thực tế bạn đang sử dụng các biện pháp lặp đi lặp lại cho từng quan sát.
Điều này nghe có vẻ hợp lý? Hay có lẽ vô cùng ngây thơ? Bất kỳ con trỏ nào về vấn đề này (lựa chọn mô hình với nhiều lần cắt) sẽ được đánh giá rất cao.