Sự phân bố của cardinality của giao điểm của các mẫu ngẫu nhiên độc lập mà không thay thế là gì?


10

n N a 1 , a 2 , . . . , một m nS là một số được đặt với các phần tử và là các số nguyên dương cố định nhỏ hơn hoặc bằng .nNa1,a2,...,amn

Với các yếu tố của có khả năng như nhau, mẫu được vẽ riêng và độc lập với mà không thay thế, kích thước tương ứng là .SmL1,L2,...,LmSa1,a2,...,am

Tính chính xác của giao điểm của các mẫunói chung, hỗ trợ bằng , nhưng phân phối nào theo sau?{0,1,. . . ,tối thiểu{ a 1 , a 2 ,. . . , một m }}|L1L2 ... Lm|{0,1,...,min{a1,a2,...,am}}


Tôi có thể cung cấp cho bạn một công thức để tính toán đệ quy nhưng tôi không biết về một giải pháp dạng đóng. Điều đó có đủ hay bạn muốn có một biểu thức rõ ràng của hàm phân phối được cung cấp a1,,amn ?
Bridolturners

@Bridolturners Một công thức sẽ rất hay, ít nhất nó sẽ cung cấp một số phương pháp / cách thức để tấn công vấn đề này và có liên quan.
llrs

Câu trả lời:


3

Đây là một cách tiếp cận khác, một phương pháp không liên quan đến đệ quy. Mặc dù vậy, nó vẫn sử dụng tổng và các sản phẩm có độ dài phụ thuộc vào các tham số. Đầu tiên tôi sẽ đưa ra biểu thức, sau đó giải thích.

Chúng tôi có

P(|L1L2Lm|=k)=(nk)i=1n(nai)j=0min(a1,,am)k(1)j(nkj)l=1n(njkaljk).

EDIT: Khi kết thúc việc viết tất cả những điều này, tôi nhận ra rằng chúng ta có thể hợp nhất biểu thức trên một chút bằng cách kết hợp các hệ số nhị thức thành xác suất siêu bội và hệ số ba. Đối với giá trị của nó, biểu thức được sửa đổi là Ở đây là một biến ngẫu nhiên siêu bội trong đó rút ra được lấy từ một quần thể có kích thước có trạng thái thành công .Hyp(n,j+k,al)alnj+k

j=0min(a1,,am)k(1)j(nj,k,njk)l=1nP(Hyp(n,j+k,al)=j+k).
Hyp(n,j+k,al)alnj+k

Đạo hàm

Chúng ta hãy lấy một số ký hiệu để làm cho các đối số tổ hợp dễ theo dõi hơn một chút (hy vọng). Trong suốt, chúng tôi xem xét và cố định. Chúng tôi sẽ sử dụng để biểu thị bộ sưu tập -tuples đã đặt hàng , trong đó mỗi , đáp ứnga 1 , Lọ , a mSa1,,amm ( L 1 , ... ,C(I)mL iS(L1,,Lm)LiS

  • |Li|=ai ; và
  • L1Lm=I .

Chúng tôi cũng sẽ sử dụng cho một bộ sưu tập giống hệt nhau ngoại trừ việc chúng tôi yêu cầu thay vì bình đẳng. LC(I)L1LmI

Một quan sát quan trọng là là tương đối dễ dàng để đếm. Điều này là do điều kiện tương đương với đối với tất cả , do đó, điều này sẽ loại bỏ sự tương tác giữa các giá trị khác nhau . Với mỗi , số lượng thỏa mãn yêu cầu là , vì chúng ta có thể xây dựng một như vậy bằng cách chọn một tập hợp con của có kích thướcvà sau đó kết hợp với . Nó theo đó L 1 L mTôi L itôiiii L i ( | S | - | Tôi |C(I)L1LmILiIiiiLiLiSIai-| Tôi| Tôi| C(I)| =ni=1(|S|-|I|(|S||I|ai|I|)LiSIai|I|I

|C(I)|=i=1n(|S||I|ai|I|).

Bây giờ xác suất ban đầu của chúng tôi có thể được biểu thị thông qua như sau: P ( | L 1L 2L mC

P(|L1L2Lm|=k)=I:|I|=k|C(I)|all IS|C(I)|.

Chúng ta có thể thực hiện hai đơn giản hóa ở đây ngay lập tức. Đầu tiên, mẫu số giống như Thứ hai, một đối số hoán vị cho thấychỉ phụ thuộc vào thông qua cardinality. Vì có các tập con của có cardinality , nên theo sau trong đó là tập con cố định, tùy ý của có cardinality

|C()|=i=1n(|S|ai)=i=1n(nai).
Tôi ||C(I)|I( n|I| SkΣtôi:| Tôi| =k| C((nk)Sk
I:|I|=k|C(I)|=(nk)|C(I0)|,
S kI0Sk .

Lùi lại một bước, giờ chúng ta đã giảm được vấn đề khi chỉ ra rằng

|C(I0)|=j=0min(a1,,am)k(1)j(nkj)l=1n(njkaljk).

Đặt là các tập con riêng biệt của được hình thành bằng cách thêm chính xác một phần tử vào . Sau đó (Điều này chỉ nói rằng nếu , thì chứa nhưng cũng không chứa bất kỳ phần tử bổ sung nào.) Hiện tại chúng tôi đã chuyển đổi vấn đề đếm sang vấn đề đếm , mà chúng tôi biết thêm cách xử lý. Cụ thể hơn, chúng tôi có J1,,JnkSI0

C(I0)=C(I0)(i=1nkC(Ji)).
L1Lm=I0L1LmI0CC
|C(I0)|=|C(I0)||i=1nkC(Ji)|=l=1n(nkalk)|i=1nkC(Ji)|.

Chúng tôi có thể áp dụng loại trừ bao gồm để xử lý kích thước của biểu thức kết hợp ở trên. Mối quan hệ quan trọng ở đây là, đối với mọi trường hợp không phải là , Điều này là do nếu chứa một số , thì nó cũng chứa liên kết của chúng. Chúng tôi cũng lưu ý rằng tập hợp có kích thước. vì thế I{1,,nk}

iIC(Ji)=C(iIJi).
L1LmJiiIJi|I0|+|I|=k+|I|
|i=1nkC(Ji)|=I{1,,nk}(1)|I|1|iIC(Ji)|=j=1nkI:|I|=j(1)j1l=1n(njkaljk)=j=1nk(1)j1(nkj)l=1n(njkaljk).
(Chúng tôi có thể hạn chế các giá trị ở đây vì tích của các hệ số nhị thức bằng 0 trừ khi với mọi , tức là .)jjalkljmin(a1,,am)k

Cuối cùng, bằng cách thay thế biểu thức ở cuối vào phương trình choở trên và hợp nhất tổng, chúng ta thu được như đã tuyên bố.|C(I0)|

|C(I0)|=j=0min(a1,,am)k(1)j(nkj)l=1n(njkaljk)

+1 cho tất cả nỗ lực và giải pháp, nhưng tôi sẽ cần đánh bóng toán học của mình để hiểu hầu hết điều này (và câu trả lời khác). Cảm ơn
llrs

4

Tôi không biết một cách phân tích để giải quyết vấn đề này, nhưng đây là một cách đệ quy để tính kết quả.

Với bạn chọn phần tử trong số trong số đó đã được chọn trước đó. Xác suất chọn các phần tử giao với trong lần rút thứ hai của bạn được đưa ra bởi phân phối siêu bội:m=2a2n, a1kmin{a1,a2}L1

P(kn,a1,a2)=(a1k)(na1a2k)(na2).

Chúng ta có thể gọi kết quảChúng ta có thể sử dụng cùng một logic để tìm trong đó là giá trị chính của giao điểm của ba mẫu. Sau đó,b2.P(b3=kn,b2,a3),b3

P(b3=k)=l=0min(a1,a2)P(b3=kn,b2=l,a3)P(b2=ln,a1,a2).

Tìm phần này cho mỗi . Phép tính sau không khó về số, vì chỉ đơn giản là kết quả của phép tính trước và là một lời gọi của phân bố siêu bội.k{0,1,2,,min(a1,a2,a3)}P(b2=ln,a1,a2)P(b3=kn,b2=l,a3)

Nói chung, để tìm bạn có thể áp dụng các công thức đệ quy sau: với và nghĩa làP(bm)

P(bi=k)=l=0min(a1,a2,,ai1)P(bi=kn,bi1=l,ai)P(bi1=l),
i{2,3,Mạnh,m},P(b1)=δa1b1,b1=a1.
P(bi=kn,bi1=l,ai)=(lk)(nlaik)(nai),
i{2,3,,m},
P(b1)=δa1b1,
b1=a1.

Đây là R:

hypergeom <- function(k, n, K, N) choose(K, k) * choose(N-K, n-k) / choose(N, n)

#recursive function for getting P(b_i) given P(b_{i-1})
PNext <- function(n, PPrev, ai, upperBound) {
  l <- seq(0, upperBound, by=1)
  newUpperBound <- min(ai, upperBound)
  kVals <- seq(0, newUpperBound, by=1)
  PConditional <- lapply(kVals, function(k) {
    hypergeom(k, ai, l, n)
  })
  PMarginal <- unlist(lapply(PConditional, function(p) sum(p * PPrev) ))
  PMarginal
}

#loop for solving P(b_m)
P <- function(n, A, m) {
  P1 <- c(rep(0, A[1]), 1)
  if (m==1) {
    return(P1)
  } else {
    upperBound <- A[1]
    P <- P1
    for (i in 2:m) {
      P <- PNext(n, P, A[i], upperBound)
      upperBound <- min(A[i], upperBound)
    }
    return(P)
  }
}

#Example
n <- 10
m <- 5
A <- sample(4:8, m, replace=TRUE)
#[1] 6 8 8 8 5

round(P(n, A, m), 4)
#[1] 0.1106 0.3865 0.3716 0.1191 0.0119 0.0003
#These are the probabilities ordered from 0 to 5, which is the minimum of A

Cảm ơn giải pháp của bạn, và mã của bạn. Tôi chờ đợi các câu trả lời khác (nếu chúng đến) trước khi trao tiền thưởng.
llrs
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.