Thử nghiệm Bernoulli tương quan, phân phối Bernoulli đa biến?


14

Tôi đang đơn giản hóa một câu hỏi nghiên cứu mà tôi có trong công việc. Hãy tưởng tượng rằng tôi có 5 đồng tiền và hãy gọi người đứng đầu thành công. Đây là những đồng tiền RẤT thiên vị với xác suất thành công p = 0,1. Bây giờ, nếu những đồng xu đã được độc lập, sau đó nhận được xác suất ít nhất 1 đầu trở lên là rất đơn giản, 1(11/10)5 . Trong kịch bản của tôi, các thử nghiệm Bernoulli của tôi (tung đồng xu) không độc lập. Thông tin duy nhất tôi có quyền truy cập là xác suất thành công (mỗi cái là p = .1) và tương quan Pearson trên lý thuyết giữa các biến nhị phân.

Có cách nào để tính xác suất thành công hoặc nhiều hơn chỉ với thông tin này không? Tôi đang cố gắng tránh một cách tiếp cận dựa trên mô phỏng vì những kết quả lý thuyết này sẽ được sử dụng để hướng dẫn tính chính xác của nghiên cứu mô phỏng. Tôi đã xem xét phân phối Bernoulli đa biến nhưng tôi không nghĩ rằng tôi chỉ có thể chỉ định đầy đủ nó với các mối tương quan và xác suất cận biên của thành công. Một người bạn của tôi đã đề nghị xây dựng một copula Gaussian với các lề bernoulli (sử dụng gói R copula) và sau đó sử dụng pMvdc()hàm trên một mẫu lớn để có xác suất tôi muốn nhưng tôi không chắc chắn làm thế nào để đi với nó.


Phân phối đa biến Bernoulli đã được mô tả tại đây: arxiv.org/abs/1206.1874
Tim

Có một yếu tố tạm thời giữa các thử nghiệm hay tất cả chúng đều song song? Nếu trước đây, bạn có thể làm cho một giả định đơn giản hóa theo đó là chỉ phụ thuộc vào t r i một l i - n , nơi n mang đến cho bạn thứ tự của mô hình Markov của bạn? trialitrialinn
Zhubarb

Câu trả lời:


16

Không, điều này là không thể bất cứ khi nào bạn có từ ba đồng xu trở lên.

Trường hợp của hai đồng tiền

Trước tiên chúng ta hãy xem tại sao nó hoạt động cho hai đồng tiền vì điều này cung cấp một số trực giác về những gì bị phá vỡ trong trường hợp có nhiều tiền hơn.

Đặt Y lần lượt là các biến phân phối Bernoulli tương ứng với hai trường hợp,XY , Y B e r ( q ) . Đầu tiên, hãy nhớ rằng mối tương quan của X YXBer(p)YBer(q)XY

corr(X,Y)=E[XY]E[X]E[Y]Var(X)Var(Y),

và vì bạn biết các lề, bạn biết , E [ Y ] , V a r ( X )V a r ( Y ) , vì vậy bằng cách biết mối tương quan, bạn cũng biết E [ X Y ]E[X]E[Y]Var(X)Var(Y)E[XY] . Bây giờ, khi và chỉ khi cả X = 1Y = 1 , do đó E [ X Y ] = P (XY=1X=1Y=1

E[XY]=P(X=1,Y=1).

Khi biết các lề, bạn biết q = P ( X = 0 , Y = 1 ) + P ( X = 1 , Y = 1 ) . Vì chúng tôi chỉ thấy rằng bạn biết P ( X = 1 , Yp=P(X=1,Y=0)+P(X=1,Y=1)q=P(X=0,Y=1)+P(X=1,Y=1) , điều này có nghĩa là bạn cũng biết P ( X = 1 , Y = 0 ) P ( X = 0 , Y = 0 ) , nhưng bây giờ bạn đã hoàn thành, vì xác suất bạn đang tìm kiếm làP(X=1,Y=1)P(X=1,Y=0)P(X=0,Y=0)

P(X=1,Y=0)+P(X=0,Y=1)+P(X=1,Y=1).

Bây giờ, cá nhân tôi thấy tất cả những điều này dễ thấy hơn với một bức tranh. Đặt . Sau đó, chúng ta có thể hình dung các xác suất khác nhau như hình thành một hình vuông:Pij=P(X=i,Y=j)

Ở đây, chúng ta đã thấy rằng việc biết các mối tương quan có nghĩa là bạn có thể suy ra , được đánh dấu màu đỏ và biết rằng các lề, bạn biết tổng của mỗi cạnh (một trong số đó được chỉ định bằng một hình chữ nhật màu xanh).P11

Trường hợp của ba đồng tiền

Điều này sẽ không dễ dàng cho ba đồng tiền; Theo trực giác, không khó để hiểu tại sao: Bằng cách biết các lề và mối tương quan, bạn biết tổng cộng tham số, nhưng phân phối chung có 2 3 = 8 kết quả, nhưng bằng cách biết xác suất cho 7 trong số đó, bạn có thể tìm ra cái cuối cùng; bây giờ, 7 > 6 , vì vậy có vẻ hợp lý khi người ta có thể nấu hai phân phối chung khác nhau có biên độ và tương quan là như nhau, và người ta có thể hoán vị xác suất cho đến khi những cái bạn đang tìm kiếm sẽ khác nhau.6=3+323=877>6

Đặt , YZ là ba biến và choXYZ

Pijk=P(X=i,Y=j,Z=k).

Trong trường hợp này, hình ảnh từ trên trở thành như sau:

nhập mô tả hình ảnh ở đây

Các kích thước đã bị va chạm bởi một: Đỉnh màu đỏ đã trở thành một số cạnh màu và cạnh được bao phủ bởi một hình chữ nhật màu xanh đã trở thành toàn bộ khuôn mặt. Ở đây, mặt phẳng màu xanh biểu thị rằng bằng cách biết biên, bạn biết tổng xác suất bên trong; cho một trong hình

P(X=0)=P000+P010+P001+P011,

và tương tự cho tất cả các mặt khác trong khối. Các cạnh màu chỉ ra rằng bằng cách biết các mối tương quan, bạn biết tổng của hai xác suất được kết nối bởi cạnh. Ví dụ, bằng cách biết corr(X,Y)E[XY]

E[XY]=P(X=1,Y=1)=P110+P111.

Vì vậy, điều này đặt ra một số hạn chế đối với các phân phối chung có thể có, nhưng bây giờ chúng tôi đã giảm bài tập thành bài tập tổ hợp đặt số trên các đỉnh của khối lập phương. Nếu không có thêm rắc rối, chúng ta hãy cung cấp hai bản phân phối chung có biên và tương quan giống nhau:

nhập mô tả hình ảnh ở đây

1001/2Ber(1/2)

1P0001P000

P111

Ber(1/10)

Bốn đồng xu trở lên

Cuối cùng, khi chúng tôi có nhiều hơn ba đồng xu, không có gì đáng ngạc nhiên khi chúng tôi có thể nấu các ví dụ thất bại, vì bây giờ chúng tôi có sự khác biệt lớn hơn giữa số lượng tham số cần thiết để mô tả phân phối chung và các tham số được cung cấp cho chúng tôi bởi các biên và tương quan.

Cụ thể, đối với bất kỳ số lượng tiền lớn hơn ba, bạn có thể chỉ cần xem xét các ví dụ có ba đồng tiền đầu tiên hoạt động như trong hai ví dụ trên và kết quả của hai đồng tiền cuối cùng độc lập với tất cả các đồng tiền khác.


3

Các thử nghiệm Bernoulli tương quan dẫn đến phân phối nhị thức beta cho các kết quả được tính. Có thể tham số hóa phân phối này để đưa ra một giá trị tương quan đã chỉ định và sau đó tính xác suất bạn muốn.


Không phải là một nhị thức beta chỉ là một Binomial có tham số xác suất thành công là một biến ngẫu nhiên sau Beta? Điều đó áp dụng cho vấn đề của OP như thế nào?
AG

1
Vâng, đó là một đặc điểm của phân phối. Đây cũng là một trong những giải pháp của các thử nghiệm Bernoulli tương quan (xem ví dụ, Hisakado et al 2006 )
Tái lập lại

Nên nó là! Nâng cao.
AG

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.