Phân tích giải quyết lấy mẫu có hoặc không có thay thế sau nhị phân Poisson / âm tính


8

Phiên bản ngắn

Tôi đang cố gắng phân tích / giải quyết gần đúng khả năng tổng hợp kết quả từ các lần rút Poisson độc lập và lấy mẫu thêm có hoặc không có thay thế (tôi không thực sự quan tâm đến cái nào). Tôi muốn sử dụng khả năng với MCMC (Stan), vì vậy tôi chỉ cần giải pháp tối đa. Cuối cùng, tôi muốn mô hình hóa một quy trình trong đó các khoản rút ban đầu là từ phủ định. phân phối nhị thức, nhưng tôi nghĩ rằng tôi sẽ có thể đến đó với một giải pháp cho trường hợp Poisson.

Rất có thể giải pháp là không khả thi (tôi không hiểu toán học đủ để có thể biết liệu đây là một vấn đề đơn giản hay rất khó khăn). Do đó, tôi cũng quan tâm đến các xấp xỉ, kết quả âm tính hoặc trực giác tại sao vấn đề có thể khó hiểu (ví dụ so với một vấn đề khó khăn đã biết). Liên kết đến các bài viết / định lý / thủ thuật hữu ích sẽ giúp tôi tiến về phía trước là những câu trả lời tốt ngay cả khi kết nối của họ với vấn đề trong tay không được thực hiện đầy đủ.

Tuyên bố chính thức

Chính thức hơn, đầu tiên Y=(y1,...,yN),ynPois(λn) được rút ra một cách độc lập và sau đó tôi mẫu k mục một cách ngẫu nhiên từ tất cả các Y để get Z=(z1,...,zN) . Tức là tôi vẽ k quả bóng màu từ một cái bình trong đó số lượng bóng màu nđược rút ra từ Pois(λn) . Ở đây, k được giả định là đã biết và đã sửa và chúng ta điều kiện trên nynk . Về mặt kỹ thuật, việc lấy mẫu được thực hiện mà không cần thay thế, nhưng giả sử lấy mẫu bằng thay thế không phải là vấn đề lớn.

Tôi đã thử hai cách tiếp cận để giải quyết lấy mẫu mà không cần thay thế (vì đây có vẻ là trường hợp dễ dàng hơn do một số điều khoản hủy bỏ), nhưng bị mắc kẹt với cả hai. Khả năng khi lấy mẫu mà không thay thế là:

P(Z=(z1,...,zN)|Λ=(λ1,...,λN))=Y;n:ynzn(n=1N(ynzn)(n=1Nynk)n=1NPoisson(yn|λn))P(nynk|Λ)

EDIT: Phần "giải pháp đã thử đã bị xóa vì giải pháp trong câu trả lời không dựa trên chúng (và cách tốt hơn)

Câu trả lời:


3

Các trường hợp không thay thế

Nếu bạn có biến phân phối Poisson độc lậpn

YiPois(λi)

và điều kiện trên

j=inYj=K

sau đó

{Yi}Multinom(K,(λij=1nλj))

Vì vậy, bạn có thể lấp đầy chiếc bình của mình bằng lần bóng như lần đầu tiên vẽ giá trị cho tổng (được phân phối Poisson theo điều kiện ) và sau đó lấp đầy bình bằng theo phân phối đa cực.Y i K K k KnYiKKkK

Việc đổ đầy bình này với các quả bóng , theo phân phối đa cực, tương đương với việc vẽ cho mỗi quả bóng một cách độc lập màu sắc từ phân phối phân loại. Sau đó, bạn có thể xem xét các quả bóng đầu tiên đã được thêm vào bình như xác định mẫu ngẫu nhiên (khi mẫu này được vẽ mà không thay thế) và phân phối cho đây chỉ là một vectơ phân phối đa cực khác: k { Z i }Kk{Zi}

{Zi}Multinom(k,(λij=1nλj))

mô phỏng

##### simulating sample process for 3 variables #######


# settings
set.seed(1)
k = 10
lambda = c(4, 4, 4)
trials = 1000000

# observed counts table
Ocounts = array(0, dim = c(k+1, k+1, k+1))

for (i in c(1:trials)) {
  # draw poisson with limit sum(n) >= k
  repeat {
    Y = rpois(3,lambda)
    if (sum(Y) >= k) {break}
  }
  # setup urn
  urn <- c(rep(1, Y[1]), rep(2, Y[2]), rep(3, Y[3]))
  # draw from urn
  s <- sample(urn, k, replace=0)
  Z = c(sum(s==1),sum(s==2),sum(s==3))
  Ocounts[Z[1]+1, Z[2]+1, Z[3]+1] = Ocounts[Z[1]+1, Z[2]+1, Z[3]+1] + 1
}



# comparison
observed = rep(0, 0.5*k*(k+1))
expected = rep(0, 0.5*k*(k+1))   
t = 1

for (z1 in c(0:k)) {
  for (z2 in c(0:(k-z1))) {  
    z3 = k-z1-z2 
    observed[t] = Ocounts[z1+1, z2+1, z3+1]
    expected[t] = trials*dmultinom(c(z1, z2, z3), prob=lambda)
    t = t+1
  }
}

plot(observed,expected)
x2 <- sum((observed-expected)^2/expected)
pvalue <- 1-pchisq(x2, 66-1)

các kết quả

> # results from chi-sq test
> x2
[1] 75.49286
> pvalue
[1] 0.1754805

Nhị thức âm

Các đối số sẽ hoạt động tương tự đối với trường hợp phân phối nhị thức âm, kết quả ( trong một số điều kiện nhất định ) thành phân phối đa cực Dirichlet.

Dưới đây là một ví dụ mô phỏng

##### simulating sample process for 3 variables #######

# dirichlet multinomial for vectors of size 3
ddirmultinom =  function(x1,x2,x3,p1,p2,p3) {
  (factorial(x1+x2+x3)*gamma(p1+p2+p3)/gamma(x1+x2+x3+p1+p2+p3))/
  (factorial(x1)*gamma(p1)/gamma(x1+p1))/
  (factorial(x2)*gamma(p2)/gamma(x2+p2))/
  (factorial(x3)*gamma(p3)/gamma(x3+p3))
}

# settings
set.seed(1)
k = 10
theta = 1
lambda = c(4,4,4)
trials = 1000000

# calculating negative binomials pars
means = lambda
vars = lambda*(1+theta)

ps = (vars-means)/(vars)
rs = means^2/(vars-means)


# observed counts table
Ocounts = array(0, dim = c(k+1,k+1,k+1))

for (i in c(1:trials)) {
  # draw poisson with limit sum(n) >= k
  repeat {
    Y = rnbinom(3,rs,ps)
    if (sum(Y) >= k) {break}
  }
  # setup urn
  urn <- c(rep(1,Y[1]),rep(2,Y[2]),rep(3,Y[3]))
  # draw from urn
  s <- sample(urn,k,replace=0)
  Z = c(sum(s==1),sum(s==2),sum(s==3))
  Ocounts[Z[1]+1,Z[2]+1,Z[3]+1] = Ocounts[Z[1]+1,Z[2]+1,Z[3]+1] + 1
}



# comparison
observed = rep(0,0.5*k*(k+1))
expected = rep(0,0.5*k*(k+1))   
t = 1

for (z1 in c(0:k)) {
  for (z2 in c(0:(k-z1))) {  
    z3 = k-z1-z2 
    observed[t]=Ocounts[z1+1,z2+1,z3+1]
    expected[t]=trials*ddirmultinom(z1,z2,z3,lambda[1]/theta,lambda[2]/theta,lambda[3]/theta)
    t = t+1
  }
}

plot(observed,expected)
x2 <- sum((observed-expected)^2/expected)
pvalue <- 1-pchisq(x2,66-1)

# results from chi-sq test
x2
pvalue

1
Cảm ơn câu trả lời. Tôi đã thử phương pháp này rồi và tôi có hai vấn đề với phân phối đa thức. Bạn có thể giải thích thêm về lý do tại sao điều hòa và tái định hình sẽ giống nhau không?
Martin Modrák

Oh, khi đọc thêm, tôi nghĩ rằng tôi thấy quan điểm của bạn. Có lẽ tôi vừa mắc một lỗi ngu ngốc với các mô phỏng, sẽ đi kiểm tra.
Martin Modrák

Tôi sử dụng hai bước. 1) lấp đầy bình bằng các quả bóng màu bằng cách vẽ từ các bản phân phối Poisson độc lập, tương đương với việc đổ bình bằng cách rút tổng từ phân phối Poisson và sau đó là từ phân phối đa cực. 2) vẽ một tập hợp các quả bóng từ một chiếc bình chứa đầy những quả bóng màu có số lượng được xác định bởi một phân phối đa cực, tương đương với phân phối đa cực anoter (trực giác, bạn có thể thấy chiếc bình chứa đầy màu sắc của mỗi quả bóng được rút ra từ phân phối phân loại). Y iY i = K Y iYiYiYi=KYi
Sextus Empiricus

Có, có một lỗi trong mã mô phỏng của tôi :-) Cảm ơn bạn đã giúp đỡ! Bạn đúng và tôi cũng hiểu bước suy luận của bạn mà tôi không thấy trước đây. Tôi đang cố gắng để hiểu tại sao cùng một mối quan hệ không giữ cho phủ định. phân phối đa thức nhị thức và Dirichlet. . )
Martin Modrák

1
Hóa ra tôi cũng làm hỏng mô phỏng thứ hai. Nó dường như làm việc cho trường hợp DM là tốt.
Martin Modrák
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.