Tỷ lệ xác suất so với tỷ lệ PDF


12

Tôi đang sử dụng Bayes để giải quyết vấn đề phân cụm. Sau khi thực hiện một số tính toán, tôi kết thúc với sự cần thiết phải đạt được tỷ lệ của hai xác suất:

P(A)/P(B)

để có thể có đượcP(H|D) . Những xác suất này có được bằng cách tích hợp hai KDE đa biến 2D khác nhau như được giải thích trong câu trả lời này :

P(A)=x,y:f^(x,y)<f^(ra,sa)f^(x,y)dxdy
P(B)=x,y:g^(x,y)<g^(rb,sb)g^(x,y)dxdy

trong đó và là các KDE và việc tích hợp được thực hiện cho tất cả các điểm dưới ngưỡng và . Cả hai KDE đều sử dụng nhân Gaussian . Có thể xem hình ảnh đại diện của KDE tương tự như hình ảnh tôi đang làm việc ở đây: Tích hợp công cụ ước tính mật độ hạt nhân trong 2D .f^(x,y)g^(x,y)f^(ra,sa)g^(rb,sb)

Tôi tính toán các KDE bằng một pythonhàm stats.gaussian_kde , vì vậy tôi giả sử dạng tổng quát sau cho nó:

KDE(x,y)=1ni=1n12h2e(xxi)2+(yyi)22h2

trong đó nđộ dài của mảng điểm của tôi và hlà băng thông được sử dụng.

Các tích phân ở trên được tính toán áp dụng quy trình Monte Carlo khá tốn kém về mặt tính toán. Tôi đã đọc ở đâu đó (quên ở đâu, xin lỗi) rằng trong những trường hợp như thế này, có thể thay thế tỷ lệ xác suất bằng tỷ lệ PDF (KDE) được đánh giá ở các điểm ngưỡng để có kết quả hợp lệ như nhau. Tôi quan tâm đến điều này bởi vì tính toán tỷ lệ KDEs là các đơn đặt hàng có cường độ nhanh hơn so với việc tính tỷ lệ của các tích phân với MC.

Vì vậy, câu hỏi được giảm xuống tính hợp lệ của biểu thức này:

P(A)P(B)=f^(ra,sa)g^(rb,sb)

Trong trường hợp nào, nếu có, tôi có thể nói rằng mối quan hệ này là đúng không?

[lỗi đánh máy (EDIT)]


Thêm :

Về cơ bản đây là cùng một câu hỏi nhưng được thực hiện dưới dạng toán học hơn .


1
Lưu ý rằng sự tồn tại của được đảm bảo bởi định lý có giá trị trung bình cho các tích phân. ra,b,sa,b
Dave

1
Tôi tin rằng Miller Ratio có thể có liên quan.
whuber

@whuber tỷ lệ đó rõ ràng yêu cầu tôi biết giá trị P(X)đó là những gì tôi đang cố gắng tránh tính toán. Bạn có thể mở rộng một chút về sự liên quan của tham số đó?
Gabriel

Câu trả lời:


3

KDE là một hỗn hợp của các bản phân phối bình thường. Hãy nhìn vào một trong số họ.

Các định nghĩa của P ( B ) cho thấy các giá trị của chúng là bất biến dưới các bản dịch và thay đổi kích thước trong mặt phẳng, do đó, đủ để xem xét phân phối chuẩn thông thường với PDF f . Bất đẳng thứcP(A)P(B)f

f(x,y)f(r,s)

tương đương với

x2+y2r2+s2.

Giới thiệu tọa độ cực cho phép người không thể thiếu được viết lạiρ,θ

P(r,s)=12π02πr2+s2ρexp(ρ2/2)dρdθ=exp((r2+s2)/2)=2πf(r,s).

Bây giờ hãy xem xét hỗn hợp. Bởi vì nó là tuyến tính,

P(r,s)=1ni2πf((rxi)/h,(syi)/h)=2πh2(1ni1h2f((rxi)/h,(syi)/h))=2πh2KDE(r,s).

Thật vậy, P là tỷ lệ thuận. fP Hằng số tỷ lệ là .2πh2


Rằng mối quan hệ tỷ lệ như vậy giữa f là đặc biệtPf có thể được đánh giá cao bằng cách xem xét một ví dụ đơn giản. Để có phân phối đồng đều trên tập có thể đo A 1 của diện tích đơn vị và f 2 có phân bố đồng đều trên tập có thể đo được A 2 tách rời khỏi A 1 và có diện tích μ > 1 . Sau đó, hỗn hợp với PDF f = f 1 / 2 + f 2 / 2 có giá trị không đổi 1f1A1f2A2A1μ>1f=f1/2+f2/2 trên Một 1 , 1 / ( 21/2A1 trên Một 2 , và là zero ở nơi khác. Có ba trường hợp để xem xét:1/(2μ)A2

  1. . Ở đây f ( r , s ) = 1 / 2 đạt tối đa của nó, từ đâu P ( r , s ) = 1 . Tỷ lệ f ( r , s ) / P ( r ,(r,s)A1f(r,s)=1/2P(r,s)=1 .f(r,s)/P(r,s)=1/2

  2. . Ở đây f ( r , s ) là đúng ít hơn 1 / 2 nhưng lớn hơn 0 . Do đó, khu vực hội nhập là phần bù của A 1 và kết quả phải không thể thiếu bằng 1 / 2 . Tỷ lệ f ( r , s ) / P ( r , s ) = ( 1 / ( 2 μ )(r,s)A2f(r,s)1/20A11/2 .f(r,s)/P(r,s)=(1/(2μ))/(1/2)=1/μ

  3. Ở những nơi khác, bằng 0 và tích phân P bằng 0.fP

Rõ ràng tỷ lệ (nơi nó được định nghĩa) là không đổi và khác nhau giữa 1 / L 1 . Mặc dù phân phối này là không liên tục, nó có thể được thực hiện bằng cách thêm một bình thường ( 0 , Σ ) phân phối với nó. Bằng cách làm cho cả hai giá trị riêng của Σ nhỏ, điều này sẽ thay đổi phân phối rất ít và tạo ra kết quả tương tự về mặt chất lượng - chỉ bây giờ các giá trị của tỷ lệ f / P sẽ bao gồm tất cả các số trong khoảng [11/μ1(0,Σ)Σf/P .[1,1/μ]


Kết quả này cũng không khái quát cho các kích thước khác. Về cơ bản, phép tính tương tự bắt đầu câu trả lời này cho thấy là một hàm Gamma chưa hoàn chỉnh và rõ ràng nó không giống với f . Đó là hai khía cạnh là đặc biệt có thể được đánh giá bằng cách ghi nhận rằng việc lồng ghép trong P chủ yếu liên quan đến khoảng cách và khi những người được phân phối Thông thường, hàm khoảng cách có χ 2 ( 2PfPphân phối ) - đó làphân phối theo cấp số nhân. Hàm số mũ là duy nhất tỷ lệ thuận với đạo hàm riêng của nó - từ đó tích phân f và tích phân Pχ2(2)fP phải tỷ lệ thuận.


Đây là một câu trả lời vô cùng tuyệt vời, cảm ơn bạn rất nhiều. Tôi sẽ mất một thời gian để xử lý đầy đủ mọi thứ bạn đã viết ở đây nhưng tôi hoàn toàn tin tưởng vào các tính toán của bạn, điều đó có nghĩa là tôi đã đánh dấu câu hỏi là đã giải quyết. Chúc mừng.
Gabriel
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.