Không có giải pháp duy nhất
Tôi không nghĩ rằng phân phối xác suất rời rạc thực sự có thể được phục hồi, trừ khi bạn đưa ra một số giả định bổ sung. Tình hình của bạn về cơ bản là một vấn đề phục hồi phân phối chung từ lề. Nó đôi khi được giải quyết bằng cách sử dụng copulas trong ngành công nghiệp, quản lý rủi ro tài chính ví dụ, nhưng thường cho các bản phân phối liên tục.
Hiện diện, độc lập, AS 205
Trong vấn đề hiện diện, không có nhiều hơn một quả bom được cho phép trong một tế bào. Một lần nữa, đối với trường hợp độc lập đặc biệt, có giải pháp tính toán tương đối hiệu quả.
Nếu bạn biết FORTRAN, bạn có thể sử dụng mã này thực hiện Thuật toán AS 205: Ian Saunders, Thuật toán AS 205: Bảng liệt kê các bảng R x C với Tổng số hàng lặp lại, Thống kê được áp dụng, Tập 33, Số 3, 1984, trang 340-352. Nó liên quan đến thuật toán của Panefield mà @Glen_B đã đề cập.
Thuật toán này liệt kê tất cả các bảng hiện diện, tức là đi qua tất cả các bảng có thể có chỉ một quả bom trên một cánh đồng. Nó cũng tính toán bội số, tức là nhiều bảng trông giống nhau và tính toán một số xác suất (không phải những bảng bạn quan tâm). Với thuật toán này, bạn có thể chạy bảng liệt kê đầy đủ nhanh hơn trước đây.
Hiện diện, không độc lập
Thuật toán AS 205 có thể được áp dụng cho trường hợp các hàng và cột không độc lập. Trong trường hợp này, bạn phải áp dụng các trọng số khác nhau cho mỗi bảng được tạo bởi logic liệt kê. Trọng lượng sẽ phụ thuộc vào quá trình đặt bom.
Đếm, độc lập
Tất nhiên, vấn đề đếm cho phép nhiều quả bom được đặt trong một tế bào. Trường hợp đặc biệt của các hàng và cột độc lập của bài toán đếm rất dễ: Pji=Pi×Pj
trong đó Pi và Pj là lề của các hàng và cột. Ví dụ, hàng P6=3/15=0.2 và cột P3=3/15=0.2 , do đó xác suất mà một quả bom ở hàng 6 và cột 3 làP36=0.04 . Bạn thực sự sản xuất phân phối này trong bảng đầu tiên của bạn.
Đếm, Không độc lập, Các bản sao rời rạc
Để giải quyết vấn đề đếm, trong đó các hàng và cột không độc lập, chúng tôi có thể áp dụng các công thức riêng biệt. Họ có vấn đề: chúng không phải là duy nhất. Nó không làm cho họ vô dụng mặc dù. Vì vậy, tôi sẽ thử áp dụng các công thức riêng biệt. Bạn có thể tìm thấy một cái nhìn tổng quan về chúng trong Genest, C. và J. Nešlehová (2007). Một mồi trên các công thức cho dữ liệu đếm. Bò đực giống. 37 (2), 475 Tua515.
Các bản sao có thể đặc biệt hữu ích, vì chúng thường cho phép gây ra sự phụ thuộc một cách rõ ràng hoặc để ước tính nó từ dữ liệu khi dữ liệu có sẵn. Ý tôi là sự phụ thuộc của hàng và cột khi đặt bom. Ví dụ, đó có thể là trường hợp nếu quả bom là một hàng đầu tiên, thì nhiều khả năng nó cũng sẽ là một cột đầu tiên.
Thí dụ
Hãy áp dụng copula Kimeldorf và Sampson vào dữ liệu của bạn, giả sử một lần nữa rằng có thể đặt nhiều quả bom trong một tế bào. Các copula cho một tham số phụ thuộc θ được định nghĩa là:
C(u,v)=(u−θ+u−θ−1)−1/θ
Bạn có thể nghĩ θ là một tương tự của hệ số tương quan.
Độc lập
θ=0.000001
Bạn có thể thấy làm thế nào trong cột 5, xác suất hàng thứ hai có xác suất cao hơn hai lần so với hàng đầu tiên. Điều này không sai trái với những gì bạn dường như ngụ ý trong câu hỏi của bạn. Tất cả các xác suất làm tăng thêm tới 100%, tất nhiên, cũng như các lề trên các bảng khớp với tần số. Chẳng hạn, cột 5 ở bảng dưới hiển thị 1/3 tương ứng với 5 quả bom đã nêu trong tổng số 15 quả như mong đợi.
Tương quan tích cực
θ=10
Tương quan phủ định
θ=−0.2
Tất nhiên, bạn có thể thấy rằng tất cả các xác suất đều tăng tới 100%. Ngoài ra, bạn có thể thấy mức độ phụ thuộc tác động đến hình dạng của PMF. Đối với sự phụ thuộc tích cực (tương quan), bạn có được PMF cao nhất tập trung vào đường chéo, trong khi đối với sự phụ thuộc tiêu cực thì nó nằm ngoài đường chéo