Kỹ thuật mà bạn mô tả được gọi là cắt bỏ bằng các hồi quy tuần tự hoặc nhiều lần cắt ngang bằng các phương trình xích. Kỹ thuật này được Raghunathan (2001) tiên phong và thực hiện trong gói R hoạt động tốt có tên là mice
(van Buuren, 2012).
Một bài báo của Schafer và Graham (2002) giải thích rõ lý do tại sao có nghĩa là cắt bỏ và xóa theo cách nghe (cái mà bạn gọi là loại trừ dòng) thường không phải là lựa chọn thay thế tốt cho các kỹ thuật được đề cập ở trên. Nguyên tắc trung bình có nghĩa là không có điều kiện và do đó có thể sai lệch các phân phối bị hạn chế đối với giá trị trung bình quan sát được. Nó cũng sẽ thu hẹp phương sai, trong số các tác động không mong muốn khác đối với phân phối bị tranh chấp. Hơn nữa, việc xóa listwise thực sự sẽ chỉ hoạt động nếu dữ liệu bị mất hoàn toàn ngẫu nhiên, giống như việc lật một đồng xu. Ngoài ra, nó sẽ làm tăng lỗi lấy mẫu, vì kích thước mẫu giảm.
Các tác giả được trích dẫn ở trên thường khuyên nên bắt đầu với biến có các giá trị bị thiếu ít nhất. Ngoài ra, kỹ thuật này thường được áp dụng theo cách Bayes (nghĩa là mở rộng đề xuất của bạn). Các biến được truy cập thường xuyên hơn trong thủ tục cắt bỏ, không chỉ một lần. Cụ thể, mỗi biến được hoàn thành bằng cách rút ra từ phân phối dự báo sau có điều kiện, bắt đầu bằng biến có các giá trị thiếu ít nhất. Khi tất cả các biến trong một tập dữ liệu đã được hoàn thành, thuật toán lại bắt đầu ở biến đầu tiên và sau đó lặp lại cho đến khi hội tụ. Các tác giả đã chỉ ra rằng thuật toán này là Gibbs, do đó nó thường hội tụ đến phân phối đa biến chính xác của các biến.
Thông thường, vì có một số giả định không thể kiểm chứng được liên quan, đặc biệt là thiếu dữ liệu ngẫu nhiên (nghĩa là dữ liệu có được quan sát hay không chỉ phụ thuộc vào dữ liệu được quan sát chứ không phụ thuộc vào các giá trị không quan sát được). Ngoài ra các quy trình có thể không tương thích một phần, đó là lý do tại sao chúng được gọi là PIGS (bộ lấy mẫu Gibbs không tương thích một phần).
Trong thực tế Bayesian nhiều lần cắt bỏ vẫn là một cách tốt để đối phó với các vấn đề thiếu dữ liệu không đơn điệu đa biến. Ngoài ra, các phần mở rộng không tham số như kết hợp trung bình dự đoán giúp thư giãn các giả định mô hình hồi quy.
Raghunathan, TE, Lepkowski, J., van Hoewyk, J., & Solenberger, P. (2001). Một kỹ thuật đa biến để nhân lên các giá trị thiếu bằng cách sử dụng một chuỗi các mô hình hồi quy. Phương pháp khảo sát, 27 (1), 85 nên95.
Schafer, JL, & Graham, JW (2002). Thiếu dữ liệu: Quan điểm của chúng tôi về tình trạng của nghệ thuật. Phương pháp tâm lý, 7 (2), 147 Ảo177. https://doi.org/10.1037/1082-989X.7.2.147
van Buuren, S. (2012). Tính linh hoạt của dữ liệu bị thiếu. Boca Raton: Báo chí CRC.