Tại sao chúng ta không sử dụng phân phối t để xây dựng khoảng tin cậy cho tỷ lệ?


18

Để tính khoảng tin cậy (CI) cho trung bình với độ lệch chuẩn dân số chưa biết (sd), chúng tôi ước tính độ lệch chuẩn dân số bằng cách sử dụng phân phối t. Đáng chú ý, trong đó . Nhưng bởi vì, chúng tôi không có ước tính điểm về độ lệch chuẩn của dân số, chúng tôi ước tính thông qua xấp xỉ trong đóCI=X¯±Z95%σX¯σX¯=σnCI=X¯±t95%(se)se=sn

Ngược lại, đối với tỷ lệ dân số, để tính CI, chúng tôi ước tính là trong đó đã cung cấp vàCI=p^±Z95%(se)se=p^(1p^)nnp^15n(1p^)15

Câu hỏi của tôi là, tại sao chúng ta tự mãn với phân phối tiêu chuẩn cho tỷ lệ dân số?


1
Trực giác của tôi nói rằng điều này là do để có được lỗi tiêu chuẩn có nghĩa là bạn không biết thứ hai, , được ước tính từ mẫu để hoàn thành tính toán. Các lỗi tiêu chuẩn cho tỷ lệ liên quan đến không có thêm ẩn số. σ
Phục hồi Monica - G. Simpson

@GavinSimpson Âm thanh thuyết phục. Trong thực tế, lý do chúng tôi giới thiệu phân phối t là để bù lỗi được đưa ra để bù cho xấp xỉ độ lệch chuẩn.
Abhijit

3
Tôi thấy điều này ít thuyết phục hơn một phần vì phân phối phát sinh từ sự độc lập của phương sai mẫu và trung bình mẫu trong các mẫu từ phân phối chuẩn, trong khi đối với các mẫu từ phân phối Binomial thì hai đại lượng không độc lập. t
whuber

@Abhijit Một số sách giáo khoa sử dụng phân phối t làm xấp xỉ cho thống kê này (trong một số điều kiện nhất định) - dường như chúng sử dụng n-1 làm df. Mặc dù tôi chưa thấy một lập luận chính thức tốt cho nó, nhưng phép tính gần đúng dường như thường hoạt động khá tốt; đối với các trường hợp tôi đã kiểm tra, nó thường tốt hơn một chút so với xấp xỉ bình thường (nhưng đối với đó có một đối số tiệm cận vững chắc thì thiếu gần đúng t). [Chỉnh sửa: séc của riêng tôi ít nhiều giống với các chương trình whuber; sự khác biệt giữa z và t nhỏ hơn nhiều so với sự khác biệt của chúng so với thống kê]
Glen_b -Reinstate Monica

1
Có thể là có một lý lẽ khả dĩ (có thể dựa trên các điều khoản ban đầu của việc mở rộng chuỗi chẳng hạn) có thể chứng minh rằng gần như luôn luôn được kỳ vọng sẽ tốt hơn, hoặc có lẽ nó sẽ tốt hơn trong một số điều kiện cụ thể, nhưng tôi Không thấy bất kỳ đối số của loại này. Cá nhân tôi thường bám vào z nhưng tôi không lo lắng nếu ai đó sử dụng t.
Glen_b -Reinstate Monica

Câu trả lời:


20

Cả hai bản phân phối chuẩn và Sinh viên chuẩn đều xấp xỉ kém với phân phối của

Z=p^pp^(1p^)/n

đối với nhỏ nghèo đến mức lỗi lùn sự khác biệt giữa hai phân phối này.n,

Dưới đây là so sánh của cả ba bản phân phối (bỏ qua các trường hợp hoặc bằng 0, trong đó tỷ lệ không xác định) chop^1p^n=10,p=1/2:

Hình 1

Phân phối "theo kinh nghiệm" là phân phối của phải rời rạc vì các ước tính được giới hạn trong tập hữu hạnZ,p { 0 , 1 / n , 2 / n , ... , n / n } .p^{0,1/n,2/n,,n/n}.

Các phân phối xuất hiện để làm một công việc tốt hơn xấp xỉ.t

Với và bạn có thể thấy sự khác biệt giữa phân phối chuẩn của Sinh viên và Sinh viên t là không đáng kể:n=30p=1/2,

Hình 2

Bởi vì phân phối Student t phức tạp hơn so với Chuẩn thông thường (thực sự là toàn bộ họ phân phối được lập chỉ mục bởi "bậc tự do", trước đây yêu cầu toàn bộ các chương của bảng thay vì một trang), nên tiêu chuẩn Bình thường được sử dụng cho hầu hết tất cả xấp xỉ.


2
Câu trả lời chất lượng. +1
Demetri Pananos

10

Việc biện minh cho việc sử dụng phân phối t trong khoảng tin cậy cho trung bình phụ thuộc vào giả định rằng dữ liệu cơ bản tuân theo phân phối bình thường, dẫn đến phân phối chi bình phương khi ước tính độ lệch chuẩn và do đó . Đây là kết quả chính xác theo giả định rằng dữ liệu hoàn toàn bình thường dẫn đến khoảng tin cậy với độ bao phủ chính xác 95% khi sử dụng và phạm vi bảo hiểm dưới 95% nếu sử dụng .x¯μs/ntn1tz

Trong trường hợp các khoảng Wald cho tỷ lệ, bạn chỉ nhận được tính quy tắc tiệm cận cho khi n là đủ lớn, phụ thuộc vào p. Xác suất bảo hiểm thực tế của thủ tục, vì số lượng thành công cơ bản là rời rạc, đôi khi ở dưới và đôi khi cao hơn xác suất bảo hiểm danh nghĩa là 95% tùy thuộc vào chưa biết . Vì vậy, không có lý do biện minh nào cho việc sử dụng , và không có gì đảm bảo rằng từ góc độ thực tế, việc sử dụng chỉ để làm cho các khoảng rộng hơn thực sự sẽ giúp đạt được tỷ lệ bao phủ danh nghĩa là 95%.p^pp^(1p^)/nptt

Xác suất bảo hiểm có thể được tính toán chính xác, mặc dù việc mô phỏng nó khá đơn giản. Ví dụ sau đây cho thấy xác suất bao phủ mô phỏng khi n = 35. Điều đó chứng tỏ rằng xác suất bảo hiểm cho việc sử dụng khoảng z thường nhỏ hơn một chút so với 0,95, trong khi đó xác suất bảo hiểm cho khoảng thời gian nói chung có thể thấp hơn gần trung bình 0,95 tùy thuộc vào niềm tin trước đó của bạn về các giá trị hợp lý của p .

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây


3
+1 Đây là những minh họa tuyệt vời về những tuyên bố mà tôi đã đưa ra (chỉ dựa trên việc kiểm tra biểu đồ của CDF, chứ không phải là các cuộc biểu tình nghiêm ngặt) về độ chính xác tương đối của Student t và CIs bình thường.
whuber

6

Cả AdamO và jsk đều đưa ra một câu trả lời tuyệt vời.

Tôi sẽ cố gắng lặp lại điểm của họ bằng tiếng Anh đơn giản:

Khi phân phối cơ bản là bình thường, bạn biết có hai tham số: giá trị trung bìnhphương sai . Phân phối T cung cấp một cách để suy luận về giá trị trung bình mà không biết giá trị chính xác của phương sai. Thay vì sử dụng chênh lệch thực tế, chỉ có mẫu phương tiện và mẫu chênh lệch là cần thiết. Bởi vì nó là một bản phân phối chính xác, bạn biết chính xác những gì bạn đang nhận được. Nói cách khác, xác suất bảo hiểm là chính xác. Việc sử dụng t chỉ đơn giản phản ánh mong muốn có được xung quanh phương sai dân số chưa biết.

Tuy nhiên, khi chúng ta suy luận về tỷ lệ, phân phối cơ bản là nhị thức. Để có được phân phối chính xác, bạn cần xem xét khoảng tin cậy của Clopper-Pearson. Công thức bạn cung cấp là công thức cho khoảng tin cậy Wald. Nó sử dụng phân phối chuẩn để xấp xỉ phân phối nhị thức, bởi vì phân phối bình thường là phân phối giới hạn của phân phối nhị thức. Trong trường hợp này, vì bạn chỉ xấp xỉ, mức độ chính xác cao hơn từ việc sử dụng thống kê t trở nên không cần thiết, tất cả đều phụ thuộc vào hiệu suất thực nghiệm. Như được đề xuất trong câu trả lời của BruceET, Agresti-Coull là công thức đơn giản và tiêu chuẩn hiện nay cho phép tính gần đúng như vậy.

Giáo sư của tôi, Tiến sĩ Longnecker của Texas A & M đã thực hiện một mô phỏng đơn giản để minh họa cách hoạt động của phép tính gần đúng khác nhau so với CI dựa trên nhị thức.

So sánh tỷ lệ CI 95% khác nhau cho tỷ lệ

Thông tin thêm có thể được tìm thấy trong bài viết Ước tính khoảng cho một tỷ lệ nhị thức trong khoa học thống kê , Vol. 16, tr.101-133, bởi L. Brown, T. Cai và A. DasGupta. Về cơ bản, AC CI được khuyến nghị cho n> = 40.

nhập mô tả hình ảnh ở đây


3

Khoảng tin cậy cho trung bình bình thường. Giả sử chúng ta có một mẫu ngẫu nhiên từ một dân số bình thường. Hãy nhìn vào khoảng tin cậy cho bình thường có nghĩa là về thử nghiệm giả thuyết. Nếu đã biết , thì thử nghiệm hai mặt của so với dựa trên thống kêKhi đúng, vì vậy chúng tôi từ chối ở mức 5% nếuX1,X2,XnμσH0:μ=μ0Ha:μμ0Z=X¯μ0σ/n.H0ZNorm(0,1),H0|Z|1.96.

Sau đó, 'đảo ngược thử nghiệm', chúng tôi nói rằng 95% CI cho bao gồm các giá trị không dẫn đến từ chối - giá trị 'đáng tin cậy' củaCI có dạng trong đó cắt xác suất 0,025 từ đuôi trên và dưới, tương ứng, của phân phối chuẩn thông thường.μμ0μ.X¯±1.96σ/n,±1.96

σS,T=X¯μ0S/n.TnSσ.

TT(ν=n1),n1σX¯±tS/n,±tT(n1).

n>30,t21.96.Sσσn>30,

Xnp^=X/np.H0:p=p0Ha:pp>0,Z=p^p0p0(1p0)/n.H0,ZaprxNorm(0,1).H0|Z|1.96.

p,p^±1.96p(1p)n.pn,p^p.p^±1.96p^(1p^)n.n

nˇ=n+4pˇ=(X+2)/nˇpˇ±1.96pˇ(1pˇ)nˇ.

μp

Sσσ

p^pp^p.pn.


2

σ

σ

σ

σ

Ngoài ra, cần lưu ý rằng câu hỏi này phản ánh câu trả lời của câu hỏi này .


2
Bút danh Gosset được xuất bản dưới đây là "Sinh viên" chứ không phải "Sinh viên-T". Anh ta cũng không thực sự đưa ra bản phân phối t tiêu chuẩn, cũng không phải là thống kê mà anh ta xử lý thực sự là thống kê t (anh ta đã làm những việc tương đương, về cơ bản là xử lý theo tỷ lệ t, nhưng hầu như tất cả các chủ nghĩa hình thức chúng ta hiện có từ công việc của Fisher). Fisher đã viết số liệu thống kê theo cách chúng tôi viết nó. Fisher gọi nó là t. Fisher chính thức bắt nguồn từ việc phân phối số liệu thống kê (cho thấy sự kết hợp giữa đại số, trực giác và lập luận mô phỏng đi kèm của Gosset về phiên bản thống kê của ông là đúng)
Glen_b -Reinstate Monica

1
Xem bài viết năm 1908 của Gosset tại đây: archive.org/details/biometrika619081909pear/page/n13 - cũng có một bản pdf dễ đọc của bài báo được làm lại trong LaTeX tại đây . Lưu ý rằng điều này không có bản quyền vì nó xuất hiện hơn một vài năm trước Steamboat Willie .
Glen_b -Reinstate Monica

@Glen_b Cảm ơn! Tôi đã xóa những giai thoại rõ ràng sai về lịch sử.
AdamO
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.