Tại sao RansAC không được sử dụng rộng rãi nhất trong thống kê?


26

Xuất phát từ lĩnh vực thị giác máy tính, tôi thường sử dụng phương pháp RANSAC (Đồng thuận mẫu ngẫu nhiên) để phù hợp với các mô hình với dữ liệu có nhiều ngoại lệ.

Tuy nhiên, tôi chưa bao giờ thấy nó được sử dụng bởi các nhà thống kê và tôi luôn có ấn tượng rằng nó không được coi là một phương pháp "thống kê âm thanh". Tại sao lại như vậy? Nó là ngẫu nhiên trong tự nhiên, làm cho nó khó phân tích hơn, nhưng các phương pháp bootstrapping cũng vậy.

Hay chỉ đơn giản là một trường hợp silo học thuật không nói chuyện với nhau?


1
Tôi tự hỏi một điều về phương pháp thị giác máy tính so với phương pháp thống kê: hiệu suất trong lần đầu tiên là phải. Có thể có sự đánh đổi giữa hiệu suất và "tính chính xác", và tầm nhìn và thống kê máy tính có các trọng số khác nhau cho các biến đó.
Lucas Reis

Câu trả lời:


10

Tôi nghĩ rằng chìa khóa ở đây là loại bỏ một phần lớn dữ liệu trong RANSAC.

Trong hầu hết các ứng dụng thống kê, một số phân phối có thể có đuôi nặng và do đó số lượng mẫu nhỏ có thể làm sai lệch ước tính thống kê. Công cụ ước tính mạnh mẽ giải quyết điều này bằng cách cân dữ liệu khác nhau. Mặt khác, RANSAC không cố gắng đáp ứng các ngoại lệ, nó được xây dựng cho các trường hợp các điểm dữ liệu thực sự không thuộc về, không chỉ phân phối không theo quy tắc.


1
Câu trả lời chính xác. Tôi đã thấy RANSAC được sử dụng nhiều nhất trong CV để ước tính đồng nhất. Điều này được sử dụng rộng rãi nhất khi chúng ta biết rằng một số phép đo tương ứng là không đáng tin cậy. Ngoài ra, hiệu suất thời gian thực và các cân nhắc khác đã làm cho kỹ thuật này trở nên khá phổ biến vì nó có thể dễ dàng song song.
Luca

7

Đối với chúng tôi, nó chỉ là một ví dụ về hồi quy mạnh mẽ - tôi tin rằng nó cũng được sử dụng bởi các nhà thống kê, nhưng có thể không quá rộng vì nó có một số lựa chọn thay thế được biết đến nhiều hơn.


1
Bạn có thể cho ví dụ về các lựa chọn thay thế? Tôi muốn xem xét điều đó.
Bossykena

5
Hầu hết được biết đến và đơn giản nhất là hồi quy Median-Median, nổi tiếng từ các máy tính thông minh (Sigh!). Tham khảo ý kiến cũng Wikipedia en.wikipedia.org/wiki/Robust_regression và có thể cran của xem nhiệm vụ mạnh mẽ cran.r-project.org/web/views/Robust.html

Có những lựa chọn thay thế cho RANSAC không chỉ cung cấp cho bạn hồi quy không thiên vị mà còn cả các điểm dữ liệu mà mô hình đã được ước tính? Cảm ơn
Valerio

2

Điều này nghe có vẻ giống như đóng bao là một kỹ thuật thường được sử dụng.


3
RANSAC rất khác biệt - trong việc đóng bao, tất cả các mẫu đều được tính đến theo một cách nào đó. RANSAC được sử dụng trong trường hợp tối đa 50% dữ liệu phải được loại bỏ hoàn toàn.
nbubis

1

Bạn vứt bỏ dữ liệu với RANSAC, có khả năng mà không cần chứng minh, nhưng dựa trên việc tăng mức độ phù hợp của mô hình. Vứt bỏ dữ liệu để tăng sự phù hợp thường là tránh xa vì bạn có thể mất dữ liệu quan trọng. Loại bỏ các ngoại lệ mà không biện minh luôn luôn là vấn đề.

Đó là lý do có thể để biện minh cho nó. Ví dụ: nếu bạn biết dữ liệu nên theo một mẫu nhất định, nhưng cũng có sự sai lệch trong dữ liệu so với mẫu do lỗi trong các phép đo.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.