Phân phối nhị thức âm so với phân phối nhị thức


22

Sự khác biệt giữa phân phối nhị thức âm và phân phối nhị thức là gì?

Tôi đã thử đọc trực tuyến và tôi thấy rằng phân phối nhị thức âm được sử dụng khi các điểm dữ liệu rời rạc, nhưng tôi nghĩ ngay cả phân phối nhị thức cũng có thể được sử dụng cho các điểm dữ liệu rời rạc.


5
Cả hai đều rời rạc.
Glen_b -Reinstate Monica

5
Minh họa đơn giản: Bạn đang bán kẹo cửa đến cửa. Tại mỗi cửa bạn gõ vào, bạn có xác suất 1/4 khi bán 1 thanh kẹo và xác suất 3/4 hoặc bán 0 thanh kẹo. Xác suất bán n thanh của bạn nếu bạn gõ 50 cửa là phân phối nhị thức trong n. Xác suất bạn phải gõ cửa m để bán 30 thanh là phân phối nhị thức âm tính trong m. Lưu ý rằng thanh thứ nhất bị cắt ở mức 50 vì bạn không thể bán hơn 50 thanh, trong khi thanh thứ hai có đuôi ở vô cực vì bạn có thể gặp may mắn khủng khiếp vào ngày hôm đó và không bao giờ bán thanh thứ 30.
Jerry Guern

Câu trả lời:


30

Sự khác biệt là những gì chúng tôi quan tâm. Cả hai bản phân phối được xây dựng từ các thử nghiệm Bernoulli độc lập với xác suất thành công cố định, p .

Với phân phối Binomial, biến ngẫu nhiên X là số lần thành công được quan sát thấy trong n thử nghiệm. Do có số lượng thử nghiệm cố định, các giá trị có thể có của X là 0, 1, ..., n .

Với phân phối nhị thức âm, biến ngẫu nhiên Y là số lượng thử nghiệm cho đến khi quan sát thấy thành công thứ r . Trong trường hợp này, chúng tôi tiếp tục tăng số lượng thử nghiệm cho đến khi chúng tôi đạt được thành công r . Các giá trị có thể có của Y là r , r + 1 , r + 2 , ... không có giới hạn trên. Binomial âm cũng có thể được định nghĩa theo số lần thất bại cho đến khi thành công thứ r , thay vì số lượng thử nghiệm cho đến khi thành công thứ r . Wikipedia định nghĩa phân phối nhị thức âm theo cách này.

Vì vậy, để tóm tắt:

Nhị thức :

  • Số lượng thử nghiệm cố định ( n )
  • Xác định thành công cố định ( p )
  • Biến ngẫu nhiên là X = Số lần thành công.
  • Các giá trị có thể là 0 Xn

Nhị thức âm tính :

  • Đã sửa số lần thành công ( r )
  • Xác định thành công cố định ( p )
  • Biến ngẫu nhiên là Y = Số lần thử cho đến khi thành công thứ r .
  • Giá trị có thể là rY

Cảm ơn Ben Bolker đã nhắc nhở tôi đề cập đến sự hỗ trợ của hai bản phân phối. Ông trả lời một câu hỏi liên quan ở đây .


4
thảo luận thêm về NB tại đây: stats.stackexchange.com/questions/6728/ . Có thể đáng chú ý rằng các phản hồi nhị thức bị giới hạn [0, N], các phản hồi NB không bị ràng buộc [0, ...]
Ben Bolker

Điểm hay, tôi đã cập nhật câu trả lời của mình để bao gồm điều này.
Jelsema 8/10/2015

cảm ơn jelsema đã trả lời chi tiết, bây giờ tôi có thể hiểu nó tốt hơn
vào

19

Phân phối nhị thức âm, mặc dù có mối quan hệ rõ ràng với nhị thức, nhưng thực sự tốt hơn so với phân phối Poisson. Cả ba đều rời rạc, btw.

λλ

Nếu dữ liệu của bạn cho thấy phương sai lớn hơn giá trị trung bình (quá mức), điều này loại trừ Poisson, thì nhị thức âm sẽ là phân phối tiếp theo để xem xét. Nó có nhiều hơn một tham số, vì vậy phương sai của nó có thể lớn hơn giá trị trung bình.

Mối quan hệ của NB với nhị thức xuất phát từ quá trình cơ bản, như được mô tả trong câu trả lời của @ Jelsema. Quá trình này có liên quan, vì vậy các bản phân phối cũng vậy, nhưng như tôi đã giải thích ở đây, liên kết đến phân phối Poisson gần hơn trong các ứng dụng thực tế.

CẬP NHẬT: Một khía cạnh khác là tham số hóa. Phân phối nhị thức có hai tham số: p và n. Tên miền trung thực của nó là 0 đến n. Trong đó, nó không chỉ rời rạc mà còn được xác định trên một bộ số hữu hạn.

λn


3
Tôi không hiểu ý của bạn là "tốt hơn so với phân phối Poisson." Câu hỏi ban đầu không nói loại mô hình nào là mong muốn. Nó thậm chí không ngụ ý rằng một người quan tâm đến mô hình.
heropup

@heropup, OP rõ ràng quan tâm đến các ứng dụng và so sánh trực tiếp NB với Binomial. Do đó, câu trả lời của tôi là về sự so sánh đó, và sự so sánh đó với Poisson có liên quan hơn trong các ứng dụng điển hình.
Aksakal

7

Chúng đều rời rạc và đại diện cho số lượng khi bạn lấy mẫu.

DNS= =(DDD,DDN,DND,DNN,NDD,NDN,NND,NNN)

S= =(D,ND,NND,NNND,...)

p

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.