Phát hiện ngoại lệ trong bản phân phối beta


8

Nói rằng tôi có một mẫu giá trị lớn trong . Tôi muốn ước tính phân phối . Phần lớn các mẫu đến từ phân phối giả định này , trong khi phần còn lại là các ngoại lệ mà tôi muốn bỏ qua trong ước tính và .[0,1]Beta(α,β)Beta(α,β)αβ

Một cách tốt để tiến hành về điều này là gì?

Tiêu chuẩn: được sử dụng trong các ô vuông xấp xỉ xấu?Inliers={x[Q11.5IQR,Q3+1.5IQR]}

Điều gì sẽ là một cách nguyên tắc hơn để giải quyết điều này? Có bất kỳ linh mục cụ thể nào trên và sẽ hoạt động tốt trong loại vấn đề này không?αβ

                    nhập mô tả hình ảnh ở đây


xem xét câu trả lời được đăng ở đây . Khi các ngoại lệ đã được gắn cờ, hãy xóa chúng và sử dụng phân phối MLE phù hợp với các quan sát còn lại. Nó sẽ chính xác hơn cho các lý do giải thích tại liên kết.
user603

Câu trả lời:


1

Một cách có hệ thống hơn để đối phó với vấn đề này sẽ là sử dụng một mô hình hỗn hợp rõ ràng, với một đặc điểm kỹ thuật của phân phối 'ngoại lệ'. Một hình thức đơn giản sẽ là sử dụng hỗn hợp phân phối beta (cho các điểm bạn quan tâm) và phân phối đồng đều (cho 'ngoại lệ'). Bằng cách mô hình hóa dữ liệu dưới dạng phân phối hỗn hợp, bạn có thể có được ước tính và tự động tính đến thực tế là một số điểm có thể là ngoại lệ.αβ

Để giải quyết vấn đề này bằng mô hình hỗn hợp, hãy coi là xác suất của 'ngoại lệ' và giả sử bạn có các giá trị IID . Hàm khả năng cho dữ liệu được quan sát là:ϕX1,...,XnϕU(0,1)+(1ϕ)Beta(α,β)

Lx(α,β,ϕ)=i=1n(ϕ+(1ϕ)Γ(α+β)Γ(α)Γ(β)xiα1(1xi)β1).

Bạn có thể tiến hành từ đây bằng cách sử dụng ước tính MLE hoặc Bayes cổ điển. Hoặc sẽ yêu cầu kỹ thuật số. Ước tính ba tham số trong mô hình, sau đó bạn sẽ có ước tính và tự động kết hợp khả năng của các ngoại lệ. Bạn cũng sẽ có một ước tính về tỷ lệ các ngoại lệ từ mô hình hỗn hợp.αβ

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.