Sai số chuẩn của độ lệch chuẩn mẫu của tỷ lệ


8

Gần đây tôi đã bắt đầu đọc Gelman và Hill, "Phân tích dữ liệu bằng cách sử dụng hồi quy và mô hình đa cấp / phân cấp" và câu hỏi dựa trên đó:

Mẫu chứa 6 quan sát về tỷ lệ: p1,p2,,p6

Mỗi pi có nghĩa là πi và phương sai πi(1πi)ni, Ở đâu ni là số lượng quan sát được sử dụng để tính tỷ lệ pi.

Thống kê kiểm tra là Ti= độ lệch chuẩn mẫu của các tỷ lệ này.

Cuốn sách nói rằng giá trị kỳ vọng của phương sai mẫu của sáu tỷ lệ, p1,p2,,p6, Là (1/6)i=16πi(1πi)/ni. Tôi hiểu tất cả điều này.

Những gì tôi muốn biết là phân phối Tivà phương sai của nó? Sẽ đánh giá cao nếu ai đó có thể cho tôi biết nó là gì, hoặc hướng dẫn tôi đến một cuốn sách hoặc bài viết có chứa thông tin này.

Cảm ơn rất nhiều.


Tôi không có cuốn sách để kiểm tra, nhưng tuyên bố về giá trị dự kiến ​​của phương sai mẫu gây cho tôi là lạ. Chắc chắn nó nên phụ thuộc vào sự thay đổi củaπicũng như vậy
Aniko

Thống kê kiểm tra là giá trị tra cứu cho phân phối như Student t, phân phối bình thường, phân phối F, v.v. Hãy tìm trong sách và tìm tên của phân phối cho thống kê đó. Phương sai tương tự nên liên quan đến điều đó.
Carl

Không ai muốn biết phân phối Tichính xác bởi vì nó rất khó chịu. Đó là vì bản thân tỷ lệ là rời rạc--pi chỉ có thể đảm nhận các giá trị 0/ni,1/ni,,ni/ni--và do đó T(không nên có chỉ mục trên đó) cũng rời rạc: nhưng các giá trị có thể của nó, rất nhiều, không nằm trong một chuỗi các khoảng cách đều nhau. Phương sai của nó không quá khó để giải quyết vì nó là một chức năng của bốn khoảnh khắc đầu tiên của mỗipivà những thứ tương đối đơn giản để viết.
whuber

@Carl đúng, và mặc dù không phải là câu trả lời trực tiếp cho câu hỏi của OP rất đáng để xem xét. Tuy nhiên, đôi khi các phân phối chính xác có thể được lấy từ thống kê kiểm tra và chúng có thể cung cấp các thuộc tính mẫu nhỏ tốt hơn của các thử nghiệm tương ứng. Tôi không mong đợi đây là một trường hợp như vậy.
AdamO

Câu trả lời:


1

Các phân phối chính xác cho tỷ lệ là pi ~ Bin(ni,πi)/nivà tỷ lệ có thể đảm nhận các giá trị pi=0,1ni,2ni,...,ni1ni,1. Phân phối kết quả của độ lệch chuẩn mẫuTlà một phân phối rời rạc phức tạp. Để , nó có thể được viết ở dạng tầm thường nhất như:p(p1,p2,...,p6)

FT(t)P(Tt)=pP(t)i=16Bin(nipi|ni,πi),

trong đó là tập hợp tất cả các vectơ tỷ lệ dẫn đến phương sai mẫu không lớn hơn . Thực sự không có cách nào để đơn giản hóa điều này trong trường hợp chung. Để có được xác suất chính xác từ phân phối này sẽ yêu cầu bạn liệt kê các vectơ tỷ lệ mang lại phương sai mẫu trong phạm vi quan tâm, sau đó tính tổng các sản phẩm nhị thức trong phạm vi liệt kê đó. Nó sẽ là một bài tập tính toán khó khăn cho các giá trị lớn vừa phải của .P(t){p|Tt}tn1,...,n6

Bây giờ, rõ ràng phân phối ở trên không phải là một hình thức rất hữu ích. Tất cả những gì nó thực sự nói với bạn là bạn cần liệt kê kết quả của sự quan tâm và sau đó tổng hợp xác suất của chúng. Đó là lý do tại sao việc tính toán xác suất chính xác trong trường hợp này là bất thường, và việc thu hút một dạng tiệm cận để phân phối phương sai mẫu sẽ dễ dàng hơn nhiều.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.