Robust PCA (được phát triển bởi Candes et al 2009 hoặc tốt hơn là Netrepalli et al 2014 ) là một phương pháp phổ biến để phát hiện ngoại lệ đa biến , nhưng khoảng cách Mahalanobis cũng có thể được sử dụng để phát hiện sớm hơn với ước tính mạnh mẽ, thường xuyên của ma trận hiệp phương sai . Tôi tò mò về (các) lợi ích của việc sử dụng một phương pháp so với phương pháp khác.
Trực giác của tôi cho tôi biết rằng sự khác biệt lớn nhất giữa hai loại là: Khi tập dữ liệu là "nhỏ" (theo nghĩa thống kê), PCA mạnh mẽ sẽ đưa ra một hiệp phương sai bậc thấp trong khi ước lượng ma trận hiệp phương sai mạnh sẽ thay vào đó hiệp phương sai thứ hạng do chính quy Ledoit-Wolf. Làm thế nào điều này lần lượt ảnh hưởng đến phát hiện ngoại lệ?