Sự phân bố của cardinality của giao điểm của các mẫu ngẫu nhiên độc lập mà không thay thế là gì?

$S$ là một số được đặt với các phần tử và là các số nguyên dương cố định nhỏ hơn hoặc bằng . $n\in\mathbb{N}$ $a_1,a_2,...,a_m$ $n$

Với các yếu tố của có khả năng như nhau, mẫu được vẽ riêng và độc lập với mà không thay thế, kích thước tương ứng là . $S$ $m$ $L_1, L_2,...,L_m$ $S$ $a_1,a_2,...,a_m$

Tính chính xác của giao điểm của các mẫunói chung, hỗ trợ bằng , nhưng phân phối nào theo sau? $\left|L_1\cap L_2\cap\ ...\ \cap L_m\right|$ $\{0,1,...,\min\{a_1,a_2,...,a_m\}\}$

combinatorics

— Nước lạnh
nguồn

Tôi có thể cung cấp cho bạn một công thức để tính toán đệ quy nhưng tôi không biết về một giải pháp dạng đóng. Điều đó có đủ hay bạn muốn có một biểu thức rõ ràng của hàm phân phối được cung cấp

a_{1}, \dots, a_{m}

$a_1, \dots, a_m$ và

n

$n$ ?

— Bridolturners

@Bridolturners Một công thức sẽ rất hay, ít nhất nó sẽ cung cấp một số phương pháp / cách thức để tấn công vấn đề này và có liên quan.

— llrs

Đây là một cách tiếp cận khác, một phương pháp không liên quan đến đệ quy. Mặc dù vậy, nó vẫn sử dụng tổng và các sản phẩm có độ dài phụ thuộc vào các tham số. Đầu tiên tôi sẽ đưa ra biểu thức, sau đó giải thích.

Chúng tôi có

\begin{aligned} P & (| L_{1} \cap L_{2} \cap \dots \cap L_{m} | = k) \\ = \frac{(\binom{n}{k})}{\prod_{i = 1}^{n} (\binom{n}{a_{i}})} \sum_{j = 0}^{min (a_{1}, \dots, a_{m}) - k} (- 1)^{j} (\binom{n - k}{j}) \prod_{l = 1}^{n} (\binom{n - j - k}{a_{l} - j - k}) . \end{aligned}

$\begin{align} P &\bigl( | L_{1} \cap L_{2} \cap \cdots \cap L_{m} | = k \bigr) \\ &= \frac{\binom{n}{k}}{\prod_{i = 1}^{n} \binom{n}{a_{i}}} \sum_{j = 0}^{\min(a_{1}, \ldots, a_{m}) - k} (-1)^{j} \binom{n - k}{j} \prod_{l = 1}^{n} \binom{n - j - k}{a_{l} -j - k}. \end{align}$

EDIT: Khi kết thúc việc viết tất cả những điều này, tôi nhận ra rằng chúng ta có thể hợp nhất biểu thức trên một chút bằng cách kết hợp các hệ số nhị thức thành xác suất siêu bội và hệ số ba. Đối với giá trị của nó, biểu thức được sửa đổi là Ở đây là một biến ngẫu nhiên siêu bội trong đó rút ra được lấy từ một quần thể có kích thước có trạng thái thành công .

\sum_{j = 0}^{min (a_{1}, \dots, a_{m}) - k} (- 1)^{j} (\binom{n}{j, k, n - j - k}) \prod_{l = 1}^{n} P (Hyp (n, j + k, a_{l}) = j + k) .

$\begin{equation} \sum_{j = 0}^{\min(a_{1}, \ldots, a_{m}) - k} (-1)^{j} \binom{n}{j, k, n - j - k} \prod_{l = 1}^{n} P( \text{Hyp}(n, j + k, a_{l}) = j + k). \end{equation}$

Hyp (n, j + k, a_{l})

$\text{Hyp}(n, j + k, a_{l})$

a_{l}

$a_{l}$

n

$n$

j + k

$j + k$

Đạo hàm

Chúng ta hãy lấy một số ký hiệu để làm cho các đối số tổ hợp dễ theo dõi hơn một chút (hy vọng). Trong suốt, chúng tôi xem xét và cố định. Chúng tôi sẽ sử dụng để biểu thị bộ sưu tập -tuples đã đặt hàng , trong đó mỗi , đáp ứng $S$ $a_{1}, \ldots, a_{m}$ $\mathcal{C}(I)$ $m$ $(L_{1}, \ldots, L_{m})$ $L_{i} \subseteq S$

$|L_{i}| = a_{i}$ ; và
$L_{1} \cap \cdots \cap L_{m} = I$ .

Chúng tôi cũng sẽ sử dụng cho một bộ sưu tập giống hệt nhau ngoại trừ việc chúng tôi yêu cầu thay vì bình đẳng. $\mathcal{C}'(I)$ $L_{1} \cap \cdots \cap L_{m} \supseteq I$

Một quan sát quan trọng là là tương đối dễ dàng để đếm. Điều này là do điều kiện tương đương với đối với tất cả , do đó, điều này sẽ loại bỏ sự tương tác giữa các giá trị khác nhau . Với mỗi , số lượng thỏa mãn yêu cầu là , vì chúng ta có thể xây dựng một như vậy bằng cách chọn một tập hợp con của có kích thướcvà sau đó kết hợp với . Nó theo đó $\mathcal{C}'(I)$ $L_{1} \cap \cdots \cap L_{m} \supseteq I$ $L_{i} \supseteq I$ $i$ $i$ $i$ $L_{i}$ $\binom{|S| - |I|}{a_{i} - |I|}$ $L_{i}$ $S \setminus I$ $a_{i} - |I|$ $I$

| C^{'} (I) | = \prod_{i = 1}^{n} (\binom{| S | - | I |}{a_{i} - | I |}) .

$\begin{equation} | \mathcal{C}'(I) | = \prod_{i = 1}^{n} \binom{|S| - |I|}{a_{i} - |I|}. \end{equation}$

Bây giờ xác suất ban đầu của chúng tôi có thể được biểu thị thông qua như sau: $\mathcal{C}$

P (| L_{1} \cap L_{2} \cap \dots \cap L_{m} | = k) = \frac{\sum_{I : | I | = k} | C (I) |}{\sum_{all I \subseteq S} | C (I) |} .

$\begin{equation} P \bigl( | L_{1} \cap L_{2} \cap \cdots \cap L_{m} | = k \bigr) = \frac{ \sum_{I : |I| = k} | \mathcal{C}(I) | } { \sum_{\text{all $I \subseteq S$}} | \mathcal{C}(I) | }. \end{equation}$

Chúng ta có thể thực hiện hai đơn giản hóa ở đây ngay lập tức. Đầu tiên, mẫu số giống như Thứ hai, một đối số hoán vị cho thấychỉ phụ thuộc vào thông qua cardinality. Vì có các tập con của có cardinality , nên theo sau trong đó là tập con cố định, tùy ý của có cardinality

| C^{'} (\emptyset) | = \prod_{i = 1}^{n} (\binom{| S |}{a_{i}}) = \prod_{i = 1}^{n} (\binom{n}{a_{i}}) .

$\begin{equation} | \mathcal{C}'(\emptyset) | = \prod_{i = 1}^{n} \binom{|S|}{a_{i}} = \prod_{i = 1}^{n} \binom{n}{a_{i}}. \end{equation}$

| C (I) |

$| \mathcal{C}(I) |$

I

$I$

| I |

$|I|$

(\binom{n}{k})

$\binom{n}{k}$

S

$S$

k

$k$

\sum_{I : | I | = k} | C (I) | = (\binom{n}{k}) | C (I_{0}) |,

$\begin{equation} \sum_{I : |I| = k} | \mathcal{C}(I) | = \binom{n}{k} | \mathcal{C}(I_{0}) |, \end{equation}$

I_{0}

$I_{0}$

S

$S$

k

$k$ .

Lùi lại một bước, giờ chúng ta đã giảm được vấn đề khi chỉ ra rằng

| C (I_{0}) | = \sum_{j = 0}^{min (a_{1}, \dots, a_{m}) - k} (- 1)^{j} (\binom{n - k}{j}) \prod_{l = 1}^{n} (\binom{n - j - k}{a_{l} - j - k}) .

$\begin{equation} | \mathcal{C}(I_{0}) | = \sum_{j = 0}^{\min(a_{1}, \ldots, a_{m}) - k} (-1)^{j} \binom{n - k}{j} \prod_{l = 1}^{n} \binom{n - j - k}{a_{l} - j - k}. \end{equation}$

Đặt là các tập con riêng biệt của được hình thành bằng cách thêm chính xác một phần tử vào . Sau đó (Điều này chỉ nói rằng nếu , thì chứa nhưng cũng không chứa bất kỳ phần tử bổ sung nào.) Hiện tại chúng tôi đã chuyển đổi vấn đề đếm sang vấn đề đếm , mà chúng tôi biết thêm cách xử lý. Cụ thể hơn, chúng tôi có $J_{1}, \ldots, J_{n - k}$ $S$ $I_{0}$

C (I_{0}) = C^{'} (I_{0}) ∖ (⋃_{i = 1}^{n - k} C^{'} (J_{i})) .

$\begin{equation} \mathcal{C}(I_{0}) = \mathcal{C}'(I_{0}) \setminus \biggl( \bigcup_{i = 1}^{n - k} \mathcal{C}'(J_{i}) \biggr). \end{equation}$

L_{1} \cap \dots \cap L_{m} = I_{0}

$L_{1} \cap \cdots \cap L_{m} = I_{0}$

L_{1} \cap \dots \cap L_{m}

$L_{1} \cap \cdots \cap L_{m}$

I_{0}

$I_{0}$

C

$\mathcal{C}$

C^{'}

$\mathcal{C}'$

| C (I_{0}) | = | C^{'} (I_{0}) | - | ⋃_{i = 1}^{n - k} C^{'} (J_{i}) | = \prod_{l = 1}^{n} (\binom{n - k}{a_{l} - k}) - | ⋃_{i = 1}^{n - k} C^{'} (J_{i}) | .

$\begin{equation} | \mathcal{C}(I_{0}) | = | \mathcal{C}'(I_{0}) | - \biggl| \bigcup_{i = 1}^{n - k} \mathcal{C}'(J_{i}) \biggr| = \prod_{l = 1}^{n} \binom{n - k}{a_{l} - k} - \biggl| \bigcup_{i = 1}^{n - k} \mathcal{C}'(J_{i}) \biggr|. \end{equation}$

Chúng tôi có thể áp dụng loại trừ bao gồm để xử lý kích thước của biểu thức kết hợp ở trên. Mối quan hệ quan trọng ở đây là, đối với mọi trường hợp không phải là , Điều này là do nếu chứa một số , thì nó cũng chứa liên kết của chúng. Chúng tôi cũng lưu ý rằng tập hợp có kích thước. vì thế $\mathcal{I} \subseteq \{ 1, \ldots, n - k \}$

⋂_{i \in I} C^{'} (J_{i}) = C^{'} (⋃_{i \in I} J_{i}) .

$\begin{equation} \bigcap_{i \in \mathcal{I}} \mathcal{C}'(J_{i}) = \mathcal{C}' \biggl( \bigcup_{i \in \mathcal{I}} J_{i} \biggr). \end{equation}$

L_{1} \cap \dots \cap L_{m}

$L_{1} \cap \cdots \cap L_{m}$

J_{i}

$J_{i}$

⋃_{i \in I} J_{i}

$\bigcup_{i \in \mathcal{I}} J_{i}$

| I_{0} | + | I | = k + | I |

$|I_{0}| + |\mathcal{I}| = k + |\mathcal{I}|$

\begin{aligned} | ⋃_{i = 1}^{n - k} C^{'} (J_{i}) | & = \sum_{\emptyset \neq I \subseteq {1, \dots, n - k}} (- 1)^{| I | - 1} | ⋂_{i \in I} C^{'} (J_{i}) | \\ = \sum_{j = 1}^{n - k} \sum_{I : | I | = j} (- 1)^{j - 1} \prod_{l = 1}^{n} (\binom{n - j - k}{a_{l} - j - k}) \\ = \sum_{j = 1}^{n - k} (- 1)^{j - 1} (\binom{n - k}{j}) \prod_{l = 1}^{n} (\binom{n - j - k}{a_{l} - j - k}) . \end{aligned}

$\begin{align} \biggl| \bigcup_{i = 1}^{n - k} \mathcal{C}'(J_{i}) \biggr| &= \sum_{\emptyset \neq \mathcal{I} \subseteq \{ 1, \ldots, n - k \}} (-1)^{| \mathcal{I} | - 1} \biggl| \bigcap_{i \in \mathcal{I}} \mathcal{C}'(J_{i}) \biggr| \\ &= \sum_{j = 1}^{n - k} \sum_{\mathcal{I} : |\mathcal{I}| = j} (-1)^{j - 1} \prod_{l = 1}^{n} \binom{n - j - k}{a_{l} - j - k} \\ &= \sum_{j = 1}^{n - k} (-1)^{j - 1} \binom{n - k}{j} \prod_{l = 1}^{n} \binom{n - j - k}{a_{l} - j - k}. \end{align}$ (Chúng tôi có thể hạn chế các giá trị ở đây vì tích của các hệ số nhị thức bằng 0 trừ khi với mọi , tức là .)

j

$j$

j \leq a_{l} - k

$j \leq a_{l} - k$

l

$l$

j \leq min (a_{1}, \dots, a_{m}) - k

$j \leq \min(a_{1}, \ldots, a_{m}) - k$

Cuối cùng, bằng cách thay thế biểu thức ở cuối vào phương trình choở trên và hợp nhất tổng, chúng ta thu được như đã tuyên bố. $| \mathcal{C}(I_{0}) |$

| C (I_{0}) | = \sum_{j = 0}^{min (a_{1}, \dots, a_{m}) - k} (- 1)^{j} (\binom{n - k}{j}) \prod_{l = 1}^{n} (\binom{n - j - k}{a_{l} - j - k})

$\begin{equation} | \mathcal{C}(I_{0}) | = \sum_{j = 0}^{\min(a_{1}, \ldots, a_{m}) - k} (-1)^{j} \binom{n - k}{j} \prod_{l = 1}^{n} \binom{n - j - k}{a_{l} - j - k} \end{equation}$

— Jason
nguồn

+1 cho tất cả nỗ lực và giải pháp, nhưng tôi sẽ cần đánh bóng toán học của mình để hiểu hầu hết điều này (và câu trả lời khác). Cảm ơn

— llrs

Tôi không biết một cách phân tích để giải quyết vấn đề này, nhưng đây là một cách đệ quy để tính kết quả.

Với bạn chọn phần tử trong số trong số đó đã được chọn trước đó. Xác suất chọn các phần tử giao với trong lần rút thứ hai của bạn được đưa ra bởi phân phối siêu bội: $m=2$ $a_2$ $n,$ $a_1$ $k \le \min\{a_1,a_2\}$ $L_1$

P (k ∣ n, a_{1}, a_{2}) = \frac{(\binom{a_{1}}{k}) (\binom{n - a_{1}}{a_{2} - k})}{(\binom{n}{a_{2}})} .

$P(k \mid n, a_1, a_2) = \frac{ {a_1 \choose k} {n - a_1 \choose a_2 - k} } {n \choose a_2}.$

Chúng ta có thể gọi kết quảChúng ta có thể sử dụng cùng một logic để tìm trong đó là giá trị chính của giao điểm của ba mẫu. Sau đó, $b_2.$ $P(b_3 = k \mid n, b_2, a_3),$ $b_3$

P (b_{3} = k) = \sum_{l = 0}^{min (a_{1}, a_{2})} P (b_{3} = k ∣ n, b_{2} = l, a_{3}) P (b_{2} = l ∣ n, a_{1}, a_{2}) .

$P(b_3=k) = \sum_{l=0}^{\min(a_1,a_2)} P(b_3=k \mid n, b_2=l, a_3) P(b_2 =l \mid n, a_1, a_2).$

Tìm phần này cho mỗi . Phép tính sau không khó về số, vì chỉ đơn giản là kết quả của phép tính trước và là một lời gọi của phân bố siêu bội. $k \in \{0, 1, 2, \dots, \min(a_1,a_2,a_3)\}$ $P(b_2 = l \mid n, a_1, a_2)$ $P(b_3 = k \mid n, b_2=l, a_3)$

Nói chung, để tìm bạn có thể áp dụng các công thức đệ quy sau: với và nghĩa là $P(b_m)$

P (b_{i} = k) = \sum_{l = 0}^{min (a_{1}, a_{2}, \dots, a_{i - 1})} P (b_{i} = k ∣ n, b_{i - 1} = l, a_{i}) P (b_{i - 1} = l),

$P(b_i=k) = \sum_{l=0}^{\min(a_1, a_2, \dots, a_{i-1})} P(b_i = k \mid n, b_{i-1}=l, a_i) P(b_{i-1}=l),$

P (b_{i} = k ∣ n, b_{i - 1} = l, a_{i}) = \frac{(\binom{l}{k}) (\binom{n - l}{a_{i} - k})}{(\binom{n}{a_{i}})},

$P(b_i = k \mid n, b_{i-1}=l, a_i) = \frac{{l \choose k} {n-l \choose a_i - k}} {n \choose a_i},$

i \in {2, 3, \dots, m},

$i \in \{2, 3, \dots, m\},$

P (b_{1}) = δ_{a_{1} b_{1}},

$P(b_1) = \delta_{a_1 b_1},$

b_{1} = a_{1} .

$b_1 = a_1.$

Đây là R:

hypergeom <- function(k, n, K, N) choose(K, k) * choose(N-K, n-k) / choose(N, n)

#recursive function for getting P(b_i) given P(b_{i-1})
PNext <- function(n, PPrev, ai, upperBound) {
  l <- seq(0, upperBound, by=1)
  newUpperBound <- min(ai, upperBound)
  kVals <- seq(0, newUpperBound, by=1)
  PConditional <- lapply(kVals, function(k) {
    hypergeom(k, ai, l, n)
  })
  PMarginal <- unlist(lapply(PConditional, function(p) sum(p * PPrev) ))
  PMarginal
}

#loop for solving P(b_m)
P <- function(n, A, m) {
  P1 <- c(rep(0, A[1]), 1)
  if (m==1) {
    return(P1)
  } else {
    upperBound <- A[1]
    P <- P1
    for (i in 2:m) {
      P <- PNext(n, P, A[i], upperBound)
      upperBound <- min(A[i], upperBound)
    }
    return(P)
  }
}

#Example
n <- 10
m <- 5
A <- sample(4:8, m, replace=TRUE)
#[1] 6 8 8 8 5

round(P(n, A, m), 4)
#[1] 0.1106 0.3865 0.3716 0.1191 0.0119 0.0003
#These are the probabilities ordered from 0 to 5, which is the minimum of A

— Cầu quay
nguồn

Cảm ơn giải pháp của bạn, và mã của bạn. Tôi chờ đợi các câu trả lời khác (nếu chúng đến) trước khi trao tiền thưởng.

— llrs