Ước tính khả năng tối đa của phân phối chung chỉ đưa ra số lượng biên


12

Đặt là phân phối chung của hai biến phân loại , với . Giả sử mẫu được rút ra từ phân phối này, nhưng chúng tôi chỉ được tính tổng số biên, cụ thể là cho :px,yX,Yx,y{1,,K}nj=1,,K

Sj=i=1nδ(Xi=l),Tj=i=1nδ(Yi=j),

Công cụ ước tính khả năng tối đa cho , được đưa ra gì? Điều này có được biết không? Tính toán khả thi? Có cách tiếp cận hợp lý nào khác cho vấn đề này ngoài ML không? S j , T jpx,ySj,Tj


2
Các lề không thực sự chứa thông tin * về phân phối chung (thực sự đây là điểm của các công thức). * hoặc ít nhất là hầu như không có - rõ ràng là các lề có chứa ít nhất một số thông tin, vì số lượng bên trong không thể vượt quá mức lợi nhuận mà chúng xảy ra. Bạn có phân phối chung cụ thể không? Tại sao bạn sử dụng thẻ? Bạn có sau một giải pháp entropy tối đa? maximum-entropy
Glen_b -Reinstate Monica

Tôi không quen thuộc lắm với các công thức. Họ có giữ cho trường hợp phân loại là tốt? Điều đó có nghĩa là gì - rằng mọi phân phối chung có cùng tỷ suất lợi nhuận sẽ có cùng khả năng? (Tôi đã gắn thẻ entropy tối đa vì tôi nghĩ rằng nó có thể có liên quan.)
RS

Chúng tôi thậm chí chưa có một mô hình phân phối được chỉ định, vì vậy chúng tôi không thực sự ở vị trí để tính . Có rất nhiều khả năng ở đây. Các bản sao tồn tại cho trường hợp phân loại được đặt hàng (nếu không phải là duy nhất), nhưng mục đích của tôi trong việc nâng cao nó là để tạo động lực cho lý do tại sao nói chung các thông tin không có nhiều thông tin. Đối với trường hợp đếm phân loại, Fisher coi các lề là không chính xác về khớp, từ đó kiểm tra chính xác Fisher-Irwin. Nếu bạn muốn entropy tối đa, có lẽ bạn có thể nhận được một giải pháp entropy tối đa, nhưng tôi không biết rằng nó sẽ rất nhiều thông tin về ...P(x|θ)
Glen_b -Reinstate Monica

(ctd) ... cấu trúc. Trong cả hai trường hợp ME hoặc ML, tôi nghĩ trước tiên bạn sẽ cần một loại mô hình nào đó, cho dù đó là siêu phân tích đa biến, bivariate, hoặc một cái gì đó có cấu trúc nhiều hơn. Xem câu hỏi này , nơi tác giả đặt một tài liệu tham khảo vào một câu trả lời. Đó có thể là sự giúp đỡ.
Glen_b -Reinstate Monica

1
Tôi có nghĩa là một phân phối đa biến bivariate chung. Câu hỏi nói về trường hợp tổng của phân phối được đưa ra và chúng ta thấy các mẫu từ phân phối chung. Ở đây chúng tôi có các khoản tiền của mẫu. Tôi nghĩ vấn đề được xác định rõ trong trường hợp ML (giải pháp có thể không phải là duy nhất nhưng tôi không biết).
RS

Câu trả lời:


4

Loại vấn đề này đã được nghiên cứu trong bài báo "Tăng dữ liệu trong các bảng dự phòng đa chiều với tổng số biên cố định" của Dobra et al (2006). Hãy biểu thị các thông số của mô hình, chúng ta hãy n biểu thị bảng số nguyên không quan sát được của tính cho mỗi ( x , y ) cặp, và để cho C ( S , T ) là tập hợp các bảng số nguyên mà đếm biên bằng ( S , T ) . Khi đó xác suất quan sát tổng số biên ( S , T ) là: p (θn(x,y)C(S,T)(S,T)(S,T) θ nơi p ( n | θ ) là sự phân bố lấy mẫu đa thức. Điều này xác định hàm khả năng cho ML, nhưng đánh giá trực tiếp là không khả thi trừ các vấn đề nhỏ. Cách tiếp cận mà họ đề xuất là MCMC, trong đó bạn thay thế cập nhật n bằng cách lấy mẫu từ phân phối đề xuất và chấp nhận thay đổi theo tỷ lệ chấp nhận của Metropolis-Hastings. Điều này có thể được điều chỉnh để tìm một mức tối đa gần đúng hơn

p(S,T|θ)= =ΣnC(S,T)p(n|θ)
p(n|θ)nθbằng θ sử dụng Monte Carlo EM. θ

Một cách tiếp cận khác nhau sẽ sử dụng các phương pháp biến đổi để tính gần đúng tổng trên . Các ràng buộc biên có thể được mã hóa dưới dạng biểu đồ nhân tố và suy luận vền có thể được thực hiện bằng vọng Tuyên truyền.θ

Để xem tại sao vấn đề này khó khăn và không thừa nhận một giải pháp tầm thường, hãy xem xét trường hợp . Lấy S là tổng của hàng và T là tổng của cột, có hai bảng tổng số có thể có: [ 0 1 2 0 ]S= =(1,2),T= =(2,1)ST Do đó hàm likelihood là p(S,T | q)=3 p 12 p 2 21 +6 p 11 p 21 p 22 Các MLE cho vấn đề này là p x , y = [ 0 1 / 3 2 / 3 0

[0120][1011]
p(S,T|θ)=3p12p212+6p11p21p22
p^x,y=[01/32/30]
tương ứng với giả sử bảng bên trái. Ngược lại, ước tính rằng bạn sẽ nhận được bằng cách giả định độc lập là trong đó có một giá trị khả năng nhỏ hơn.
qx,y=[1/32/3][2/31/3]=[2/91/94/92/9]

Có phải là không thể có được một giải pháp phân tích?
Ben Kuhn

θθ={θx,y}(x,y)

Tôi sẽ không nghi ngờ rằng có một giải pháp phân tích. Tôi đã thêm một ví dụ để minh họa điều này.
Tom Minka

Cảm ơn. Có lẽ đó là sự thật không có triệu chứng? Sau đó, điều hòa trên tổng số ký quỹ giống như điều hòa trên phân phối lề (sau khi chuẩn hóa) và khả năng ghi nhật ký cho mỗi bảng số nguyên không quan sát được tỷ lệ thuận với entropy của nó. Có lẽ có chuyện gì với AEP rồi?
RS

1

Như đã được @Glen_b chỉ ra, điều này không được chỉ định đầy đủ. Tôi không nghĩ bạn có thể sử dụng khả năng tối đa trừ khi bạn có thể chỉ định đầy đủ khả năng.

Nếu bạn sẵn sàng đảm nhận sự độc lập, thì vấn đề khá đơn giản (tình cờ, tôi nghĩ giải pháp sẽ là giải pháp entropy tối đa đã được đề xuất). Nếu bạn không sẵn sàng hoặc không thể áp đặt cấu trúc bổ sung trong vấn đề của mình và bạn vẫn muốn một số loại gần đúng với các giá trị của các ô, có thể bạn có thể sử dụng giới hạn copula Fréchet Thẻ Hoeffding . Nếu không có giả định bổ sung, tôi không nghĩ bạn có thể tiến xa hơn.


Khả năng trong việc này có thể là đa quốc gia. Tại sao điều đó là không đủ?
RS

Theo tôi hiểu, khả năng là một chức năng của các tham số được cung cấp dữ liệu. Ở đây, bạn không có các giá trị cho mỗi ô, chỉ có các lề, do đó bạn không có một hàm duy nhất của các tham số mà bạn có thể tính toán, hãy để một mình tối đa hóa. Nhìn chung có nhiều cấu hình ô tương thích với lề và mỗi cấu hình sẽ cho một khả năng khác nhau.
F. Tusell

1
pp

1

px,ypx=ypx,ypy=xpx,y . Tôi vẫn đang suy nghĩ về nó.

Những thứ sai sau:

px,yX,YS1=S2=T1=T2=10

p=(120012),p=(14141414)

pxpy


p=(abcd)0<adp=(0b+ac+ada)


X,Y độc lập. Bạn có thể thấy điều này như sau:

H(p)=x,ypx,ylogpx,yxpx,y=pyypx,y=pxg(p)=0gx(p)=ypx,ypxgy(p)=xpx,ypy

H(p)=kXYλkgk(p)

gk

1logpx,y=λx+λypx,y=e1λxλy

xpx,y=pyypx,y=pxe1/2λx=pxe1/2λy=py

px,y=pxpy.

For the first example: What is given is the marginal counts, not the marginal probabilities. In the case you've described, the probability of S1=S2=T1=T2=10 for the left p is the probability of [[10,0],[0,10]] which is 220. For the right p, it is 0a10Pr[[a,10a],[10a,a]], which is 10420. Even if there is no unique solution, it doesn't mean we can't point to some solution. Maximum entropy gives a unique solution, but it might not be maximum likelihood.
R S

You've calculated the probabilities incorrectly; for instance, you forgot to include the binomial coefficients. But you're right in that the two matrices give different joint distributions of marginal counts even though they give the same marginal distribution of marginal counts. (Yikes!) I'll think about this more.
Ben Kuhn
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.