Ước tính cho phân phối nhị thức


12

Làm thế nào để chúng ta xác định một công cụ ước tính cho dữ liệu đến từ phân phối nhị thức? Đối với bernoulli tôi có thể nghĩ về một công cụ ước tính ước tính một tham số p, nhưng đối với nhị thức tôi không thể thấy các tham số nào để ước tính khi chúng ta có n đặc trưng cho phân phối?

Cập nhật:

Theo một người ước tính tôi có nghĩa là một chức năng của dữ liệu được quan sát. Một công cụ ước tính được sử dụng để ước tính các tham số của phân phối tạo ra dữ liệu.


Sự hiểu biết của bạn về một "người ước tính" là gì? Tôi tự hỏi về điều đó, bởi vì các công cụ ước tính không có "tham số". Điều này khiến tôi lo ngại rằng bạn không truyền đạt rõ ràng câu hỏi của mình. Có lẽ bạn có thể đưa ra một ví dụ cụ thể về một tình huống thực tế mà bạn đang xem xét.
whuber

@whuber thêm thông tin. cho tôi biết nếu bạn muốn tôi thêm chi tiết hoặc nếu sự hiểu biết của tôi là thiếu sót.
Rohit Banga

Chỉnh sửa là chính xác, nhưng một ví dụ cụ thể vẫn sẽ giúp. Trong nhiều ứng dụng của phân phối Binomial, n không phải là tham số: nó được đưa ra và p là tham số duy nhất được ước tính. Ví dụ: tổng số k thành công trong n thử nghiệm Bernoulli phân phối độc lập có phân phối Binomial ( n , p ) và một ước lượng của tham số duy nhất pk/n .
whuber

2
Tôi rất thích xem một ví dụ, thậm chí là một ví dụ, ước tính cả p (trong một thiết lập thường xuyên). Hãy suy nghĩ về nó: bạn quan sát một số đếm duy nhất , k , nói k = 5 . Chúng tôi hy vọng k xấp xỉ bằng n p . Vậy chúng ta ước tính n = 10 , p = 0,5 ? Hoặc có thể n = 5000 , p = 0,001 ? Hay hầu hết mọi thứ khác? :-) Hoặc bạn đang đề nghị bạn có thể có một loạt các quan sát độc lập k 1 knpk=5knpn=10p=0.5n=5000p=0.001 tất cả từ một phổ biến nhị thức ( n , p ) phân phối với cả p n chưa biết? k1,k2,,km(n,p)pn
whuber

1
Tôi đề nghị cái sau - cả p và n đều không rõ. Tôi muốn một công cụ ước tính cho cả n và p là một hàm của N điểm dữ liệu được quan sát.
Rohit Banga

Câu trả lời:


12

Tôi đoán những gì bạn đang tìm kiếm là chức năng tạo xác suất. Một đạo hàm của hàm tạo xác suất của phân phối nhị thức có thể được tìm thấy trong

http: // ec economtheoryblog.com/2012/10/21/binomial-distribution/

Tuy nhiên, có một cái nhìn về Wikipedia ngày nay luôn là một ý tưởng tốt, mặc dù tôi phải nói rằng đặc điểm kỹ thuật của nhị thức có thể được cải thiện.

https://en.wikipedia.org/wiki/Binomial_distribution#Specification


1

Mỗi phân phối có một số tham số chưa biết (s). Ví dụ: trong phân phối Bernoulli có một xác suất tham số chưa biết (p). Tương tự như vậy trong phân phối Binomial có hai tham số n và p chưa biết. Nó phụ thuộc vào mục tiêu của bạn mà tham số chưa biết bạn muốn ước tính. bạn có thể sửa một tham số và ước lượng khác. Để biết thêm thông tin xem điều này


Nếu tôi muốn ước tính cả hai tham số thì sao?
Rohit Banga

1
Để ước tính khả năng tối đa, bạn phải lấy đạo hàm của hàm khả năng đối với (các) tham số quan tâm và đánh giá phương trình đó bằng 0 và giải phương trình. Ý tôi là nói quy trình này giống như bạn đã làm trong khi ước tính 'p'. Bạn phải làm tương tự với 'n'. kiểm tra cái này www.montana.edu/rotella/502/binom_like.pdf
số liệu thống kê tình yêu

@love Ước tính tham chiếu của bạn chỉ , lấy N là cố định. pN
whuber

-1 @ love-stats Để biết ví dụ về tình huống lấy đạo hàm của hàm khả năng, đánh giá nó bằng , v.v. không hoạt động , hãy xem nỗ lực nàygiải pháp chính xác0
Dilip Sarwate

1

Giả sử bạn có dữ liệu .k1,,kmiid binomial(n,p)

You could easily derive method-of-moment estimators by setting k¯=n^p^ and sk2=n^p^(1p^) and solving for n^ and p^.

Or you could calculate MLEs (perhaps just numerically), eg using optim in R.


It turns out the MLEs are really horrible for p<1/2--they are biased and hugely variable, even with large samples. I haven't studied the MM estimators, in part because they're frequently not even defined (whenever s2/k¯>1, which happens).
whuber

@whuber - he didn't ask for a good estimator. ;)
Karl

1
Why not just propose n^=17 and p^=1/2 no matter what, then? :-) But you have a point: the question doesn't even specify what is to be estimated. If we only need an estimator for np, then there's an obvious good one available.
whuber

@whuber - Indeed. And I wouldn't be surprised to find n^maxki for the MLE.
Karl

That's correct: especially when p is close to 1, the max of the counts is the MLE. It works pretty well in such cases, as you might imagine. For smaller p, even with lots of data it's hard to distinguish this from a Poisson distribution, for which n is effectively infinite, leading to an enormous uncertainty in the estimate of n.
whuber

0

I think we could use method of moments estimation to estimate the parameters of the Binomial distribution by the mean and the variance.


Using the method of moments estimation to estimate The parameters p and m. [{\hat{p}}_n=\frac{\overline{X}-S^2}{\overline{X}}][\hat{m}_n=\frac{\overline{X}^2}{\overline{X}-S^2}] Proof The estimators of the parameters m and p by the Method of Moments are the solutions of the system of equations

mp=X¯,mp(1p)=S2.
Hence our equations for the method of moments are: [\overline{X}=mp] [S^2=mp (1-p).]

Simple arithmetic shows: [S^2 = mp\left(1 - p\right) = \bar{X}\left(1 - p\right)] [S^2=\bar{X}-\bar{X} p] [\bar{X}p=\bar{X}-S^2, \mbox{ therefore } \hat{p}=\frac{\bar{X}-S^2}{\bar{X}}.] Then, [\bar{X} = mp, \mbox{ that is, } m \left(\frac{\bar{X}-S^2}{\bar{X}}\right)] [\bar{X}=m\left(\frac{\bar{X}-S^2}{\bar{X}}\right), \mbox{ or } \hat{m}=\frac{\bar{X}^2}{\bar{X}-S^2}. ]


1
It would be good if you could expand on this, for example, by writing the formula for the MoM estimator. Otherwise the answer is not self-contained; others (who don't already know the answer) will have to search online for "method of moments" etc. until they find the real answer.
jbowman
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.