Nếu dữ liệu của bạn chứa một ngoại lệ duy nhất, thì nó có thể được tìm thấy một cách đáng tin cậy bằng cách sử dụng phương pháp bạn đề xuất (mặc dù không có các lần lặp). Một cách tiếp cận chính thức cho điều này là
Nấu, R. Dennis (1979). Quan sát ảnh hưởng trong hồi quy tuyến tính . Tạp chí của Hiệp hội Thống kê Hoa Kỳ (Hiệp hội Thống kê Hoa Kỳ) 74 (365): 169 Hàng174.
MMMρ
- 11+pp
- hoặc nếu các ngoại lệ không xuất hiện trong không gian thiết kế (Ellis và Morgenthaler (1992)).
Ml1robustbase
quantreg
R
⌊np+1⌋Mρ
Trong 20 năm qua (và đặc biệt là 10 năm qua), một khối lượng lớn các thuật toán phát hiện ngoại lệ nhanh và đáng tin cậy đã được thiết kế để giải quyết xấp xỉ vấn đề tổ hợp này. Hiện tại chúng được triển khai rộng rãi trong các gói thống kê phổ biến nhất (R, Matlab, SAS, STATA, ...).
O(2p)pn
pp<20
Rousseeuw, PJ và van Zomeren BC (1990). Bộc lộ các ngoại lệ đa biến và các điểm đòn bẩy . Tạp chí của Hiệp hội Thống kê Hoa Kỳ , Tập. 85, số 411, trang 633-639.
Rousseeuw, PJ và Van Driessen, K. (2006). Tính toán hồi quy LTS cho các tập dữ liệu lớn . Khai thác dữ liệu và kho lưu trữ kiến thức khám phá Tập 12 Số 1, Trang 29 - 45.
Hubert, M., Rousseeuw, PJ và Van Aelst, S. (2008). Phương pháp đa biến mạnh mẽ phân tích cao . Khoa học thống kê , Tập. 23, số 1, 92
Ellis SP và Morgenthaler S. (1992). Đòn bẩy và sự cố trong hồi quy L1. Tạp chí của Hiệp hội Thống kê Hoa Kỳ , Tập. 87, số 417, trang 143-148
Một cuốn sách tham khảo gần đây về vấn đề nhận dạng ngoại lệ là:
Maronna RA, Martin RD và Yohai VJ (2006). Thống kê mạnh mẽ: Lý thuyết và phương pháp . Wiley, New York.
Các phương thức này (và nhiều biến thể khác của các phương thức này) được triển khai (trong số các phương thức khác) trong gói.robustbase
R