Phân phối mô tả sự khác biệt giữa các biến phân phối nhị thức âm?


18

Một Skellam phân phối mô tả sự khác biệt giữa hai biến có phân phối Poisson. Có một phân phối tương tự mô tả sự khác biệt giữa các biến theo phân phối nhị thức âm?

Dữ liệu của tôi được tạo ra bởi một quy trình Poisson, nhưng bao gồm một lượng nhiễu khá lớn, dẫn đến sự quá mức trong phân phối. Do đó, mô hình hóa dữ liệu với phân phối nhị thức âm (NB) hoạt động tốt. Nếu tôi muốn mô hình sự khác biệt giữa hai trong số các bộ dữ liệu NB này, các tùy chọn của tôi là gì? Nếu nó giúp, giả sử phương tiện và phương sai tương tự cho hai bộ.


Có nhiều bản phân phối dễ mô tả mà không có tên tiêu chuẩn.
Glen_b -Reinstate Monica

Câu trả lời:


22

Tôi không biết tên của phân phối này nhưng bạn chỉ có thể rút ra nó từ luật tổng xác suất. Giả sử mỗi có phân phối nhị thức âm với các tham số và , tương ứng. Tôi đang sử dụng tham số hóa trong đó tương ứng với số lần thành công trước các lần thất bại 'và '. Sau đó,( r 1 , p 1 ) ( r 2 , p 2 ) X , Y r 1 r 2X,Y(r1,p1)(r2,p2)X,Yr1r2

P(X-Y= =k)= =EY(P(X-Y= =k))= =EY(P(X= =k+Y))= =Σy= =0P(Y= =y)P(X= =k+y)

Chúng tôi biết

P(X= =k+y)= =(k+y+r1-1k+y)(1-p1)r1p1k+y

P(Y= =y)= =(y+r2-1y)(1-p2)r2p2y

vì thế

P(X-Y= =k)= =Σy= =0(y+r2-1y)(1-p2)r2p2y(k+y+r1-1k+y)(1-p1)r1p1k+y

Điều đó không đẹp (yike!). Đơn giản hóa duy nhất tôi thấy ngay là

p1k(1-p1)r1(1-p2)r2Σy= =0(p1p2)y(y+r2-1y)(k+y+r1-1k+y)

mà vẫn còn khá xấu xí Tôi không chắc điều này có hữu ích không nhưng điều này cũng có thể được viết lại thành

p1k(1-p1)r1(1-p2)r2(r1-1)!(r2-1)!Σy= =0(p1p2)y(y+r2-1)!(k+y+r1-1)!y!(k+y)!

Tôi không chắc chắn nếu có một biểu hiện đơn giản hóa để tổng hợp này, nhưng nó có thể được xấp xỉ bằng số nếu bạn chỉ cần nó để tính toán -valuesp

Tôi xác minh với mô phỏng rằng tính toán trên là chính xác. Dưới đây là hàm R thô để tính hàm khối lượng này và thực hiện một vài mô phỏng

  f = function(k,r1,r2,p1,p2,UB)  
  {

  S=0
  const = (p1^k) * ((1-p1)^r1) * ((1-p2)^r2)
  const = const/( factorial(r1-1) * factorial(r2-1) ) 

  for(y in 0:UB)
  {
     iy = ((p1*p2)^y) * factorial(y+r2-1)*factorial(k+y+r1-1)
     iy = iy/( factorial(y)*factorial(y+k) )
     S = S + iy
  }

  return(S*const)
  }

 ### Sims
 r1 = 6; r2 = 4; 
 p1 = .7; p2 = .53; 
 X = rnbinom(1e5,r1,p1)
 Y = rnbinom(1e5,r2,p2)
 mean( (X-Y) == 2 ) 
 [1] 0.08508
 f(2,r1,r2,1-p1,1-p2,20)
 [1] 0.08509068
 mean( (X-Y) == 1 ) 
 [1] 0.11581
 f(1,r1,r2,1-p1,1-p2,20)
 [1] 0.1162279
 mean( (X-Y) == 0 ) 
 [1] 0.13888
 f(0,r1,r2,1-p1,1-p2,20)
 [1] 0.1363209

Tôi đã tìm thấy tổng số hội tụ rất nhanh cho tất cả các giá trị tôi đã thử, do đó, việc đặt UB cao hơn 10 hoặc không cần thiết. Lưu ý rằng hàm rnbinom tích hợp của R tham số hóa nhị thức âm về số lần thất bại trước thành công của , trong trường hợp đó bạn cần thay thế tất cả các trong các công thức trên với để tương thích.rp1,p21-p1,1-p2


Cảm ơn. Tôi sẽ cần một chút thời gian để tiêu hóa điều này, nhưng sự giúp đỡ của bạn được đánh giá cao.
chrisamiller

-2

Đúng. phân phối Laplace rời rạc tổng quát là sự khác biệt của hai biến ngẫu nhiên phân phối nhị thức âm. Để làm rõ hơn, hãy tham khảo bài viết có sẵn trực tuyến "phân phối Laplace rời rạc tổng quát" của seetha Lekshmi.V. và simi sebastian


4
Bạn có thể cung cấp một trích dẫn đầy đủ và một bản tóm tắt thông tin trong bài báo để độc giả tương lai có thể quyết định xem đó có phải là thứ họ muốn theo đuổi không?
gung - Phục hồi Monica

Bài viết được đề cập bởi @ simi-sebastian (tác giả?) Là ijmsi.org/Papers/Volume.2.Issue.3/K0230950102.pdf . Tuy nhiên, trừ khi tôi nhầm, nó chỉ giải quyết trường hợp các biến nhị thức âm và đều có cùng tham số phân tán, chứ không phải là trường hợp tổng quát hơn được mô tả bởi người đăng ban đầu. XY
Constantinos
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.