Lỗi tiêu chuẩn cho giá trị trung bình của một mẫu các biến ngẫu nhiên nhị thức


44

Giả sử tôi đang chạy thử nghiệm có thể có 2 kết quả và tôi giả định rằng phân phối "đúng" cơ bản của 2 kết quả là phân phối nhị thức với tham số và : .npBinomial(n,p)

Tôi có thể tính toán lỗi tiêu chuẩn, , từ dạng phương sai của : trong đó . Vì vậy, . Đối với lỗi tiêu chuẩn tôi nhận được: , nhưng tôi đã thấy ở đâu đó rằng . Tôi đã làm gì sai?SEX=σXnBinomial(n,p)

σX2=npq
q=1pσX=npqSEX=pqSEX=pqn

Bài viết này rất hữu ích để hiểu lỗi tiêu chuẩn của tầm ảnh hưởng
bình.com / Giao dịch / từ

Từ googling của tôi, có vẻ như chủ đề liên quan chặt chẽ của việc có được khoảng tin cậy cho phân phối nhị thức là khá sắc thái và phức tạp. Cụ thể, có vẻ như khoảng tin cậy thu được từ công thức này, đó sẽ là "Khoảng thời gian Wald" (xem en.wikipedia.org/wiki/Binomial_proportion_confidence_interval ), nên hành xử khá kém và nên tránh. Xem jstor.org/urdy/2676784?seq=1#metadata_info_tab_contents để biết thêm thông tin.
aquirdturtle

Câu trả lời:


58

Có vẻ như bạn đang sử dụng hai lần theo hai cách khác nhau - cả về kích thước mẫu và số lượng thử nghiệm bernoulli bao gồm biến ngẫu nhiên Binomial; để loại bỏ bất kỳ sự mơ hồ nào, tôi sẽ sử dụng để chỉ cái sau.knk

Nếu bạn có mẫu độc lập từ phân phối , phương sai của trung bình mẫu của chúng làB i n o m i a l ( k , p )nBinomial(k,p)

var(1ni=1nXi)=1n2i=1nvar(Xi)=nvar(Xi)n2=var(Xi)n=kpqn

trong đó và là cùng một giá trị. Điều này sau¯ Xq=1pX¯

(1) , cho bất kỳ biến ngẫu nhiên, và bất kỳ hằng số .var(cX)=c2var(X)cXc

(2) phương sai của một tổng các biến ngẫu nhiên độc lập bằng tổng phương sai .

Lỗi tiêu chuẩn của là căn bậc hai của phương sai: . Vì thế,X¯kpqn

  • Khi , bạn nhận được công thức bạn đã chỉ ra:k=npq

  • Khi và các biến Binomial chỉ là thử nghiệm bernoulli , bạn sẽ nhận được công thức bạn đã thấy ở nơi khác:k=1pqn


3
Khi là biến ngẫu nhiên bernoulli , thì . Khi có biến ngẫu nhiên nhị thức dựa trên thử nghiệm với xác suất thành công , thìv a r ( X ) = p q X nXvar(X)=pqXnv a r ( X ) = n p qpvar(X)=npq
Macro

2
Cảm ơn! Bạn nâng sự bối rối của tôi. Xin lỗi vì nó quá sơ đẳng, tôi vẫn đang học :-)
Frank

6
Vậy Frank có rõ ràng rằng chúng ta đang sử dụng thực tế là với bất kỳ hằng số c Var (cX) = c Var (x) không? Vì ước tính mẫu của tỷ lệ là X / n, chúng ta có Var (X / n) = Var (X) / n = npq / n = pq / n và SEx là căn bậc hai của số đó. Tôi nghĩ mọi người sẽ rõ ràng hơn nếu chúng ta đánh vần tất cả các bước. 2 2222
Michael Chernick

1
@MichaelCécick, tôi đã làm rõ các chi tiết bạn đã đề cập. Dựa trên mô tả vấn đề, tôi đoán rằng Frank biết những sự thật này nhưng bạn nói đúng rằng nó sẽ mang tính giáo dục hơn cho những độc giả tương lai bao gồm các chi tiết.
Macro

2
Sol Lago - Trong trường hợp này k = 1. Nếu bạn lật một đồng xu 50 lần và tính số lần thành công và sau đó lặp lại thí nghiệm 50 lần, thì k = n = 50. Việc lật một đồng xu dẫn đến 1 hoặc 0. Đó là một Bernoulli rv
B_Miner

9

Thật dễ dàng để có hai phân phối nhị thức nhầm lẫn:

  • phân phối số lượng thành công
  • phân phối tỷ lệ thành công

npq là số lần thành công, trong khi npq / n = pq là tỷ lệ thành công. Điều này dẫn đến các công thức lỗi tiêu chuẩn khác nhau.


6

Chúng ta có thể xem xét điều này theo cách sau:

Giả sử chúng ta đang thực hiện một thử nghiệm trong đó chúng ta cần phải ném một đồng xu không thiên vị lần. Kết quả tổng thể của thí nghiệm là là tổng của các lần ném riêng lẻ (giả sử, đầu là 1 và đuôi là 0). Vì vậy, đối với thử nghiệm này, , trong đó là kết quả của các lần ném riêng lẻ.Y Y = n i = 1 X i X inYY=i=1nXiXi

Ở đây, kết quả của mỗi lần ném, , tuân theo phân phối Bernoulli và kết quả chung theo phân phối nhị thức. YXiY

Thí nghiệm hoàn chỉnh có thể được coi là một mẫu duy nhất. Do đó, nếu chúng ta lặp lại thí nghiệm, chúng ta có thể nhận được một giá trị khác của , sẽ tạo thành một mẫu khác. Tất cả các giá trị có thể có của sẽ tạo thành toàn bộ dân số.YYY

Quay trở lại với việc tung đồng xu duy nhất, theo phân phối Bernoulli, phương sai được đưa ra bởi , trong đó là xác suất của đầu (thành công) và .p q = 1 - ppqpq=1p

Bây giờ, nếu chúng ta nhìn vào Phương sai của , . Nhưng, đối với tất cả các thử nghiệm Bernoulli riêng lẻ, . Vì có thử nghiệm hoặc ném Bernoulli trong thử nghiệm, . Điều này ngụ ý rằng có phương sai .YV(Y)=V(Xi)=V(Xi)V(Xi)=pqnV(Y)=V(Xi)=npqYnpq

Bây giờ, tỷ lệ mẫu được đưa ra bởi , mang lại 'tỷ lệ thành công hoặc đứng đầu'. Ở đây, là một hằng số khi chúng ta dự định sẽ không ném đồng xu nào cho tất cả các thí nghiệm trong dân số.p^=Ynn

Vậy, .V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n

Vì vậy, lỗi tiêu chuẩn cho (một thống kê mẫu) làp^pq/n


Bạn có thể sử dụng sắp chữ latex bằng cách đặt đô la xung quanh toán học của mình, ví dụ: $x$cho . x
Cá bạc

Lưu ý rằng bước thực sự xứng đáng với một số biện minh! V(Xi)=V(Xi)
Cá bạc

Có lỗi đánh máy trong lần khấu trừ cuối cùng, V (Y / n) = (1 / n ^ 2) * V (Y) = (1 / n ^ 2) * npq = pq / n nên là suy luận chính xác.
Tarashankar

Xin lỗi, tôi đã giới thiệu rằng khi thực hiện sắp chữ. Hy vọng sắp xếp ngay bây giờ.
Cá bạc

1
Điều đó đúng nếu không tương thích - để biện minh cho điều này, chúng tôi sử dụng thực tế là các thử nghiệm được coi là độc lập. Xi
Cá bạc

2

Tôi nghĩ rằng cũng có một số nhầm lẫn trong bài viết ban đầu giữa lỗi tiêu chuẩn và độ lệch chuẩn. Độ lệch chuẩn là sqrt của phương sai của phân phối; sai số chuẩn là độ lệch chuẩn của giá trị trung bình ước tính của mẫu từ phân phối đó, nghĩa là độ lây lan của phương tiện bạn sẽ quan sát được nếu bạn thực hiện mẫu đó vô hạn nhiều lần. Cái trước là một tài sản nội tại của phân phối; cái sau là thước đo chất lượng ước tính của bạn về một tài sản (giá trị trung bình) của phân phối. Khi bạn thực hiện thử nghiệm N Bernouilli để ước tính xác suất thành công chưa biết, độ không chắc chắn của p = k / N ước tính của bạn sau khi thấy k thành công là lỗi tiêu chuẩn của tỷ lệ ước tính, sqrt (pq / N) trong đó q = 1 -p. Phân phối thực được đặc trưng bởi một tham số P, xác suất thành công thực sự.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.