Tại sao sai số chuẩn của tỷ lệ, với n cho trước, lớn nhất là 0,5?


10

Sai số chuẩn của tỷ lệ sẽ là lớn nhất có thể xảy ra đối với N đã cho khi tỷ lệ trong câu hỏi là 0,5 và càng nhỏ thì tỷ lệ này càng tăng từ 0,5. Tôi có thể thấy lý do tại sao lại như vậy khi tôi xem xét phương trình cho sai số chuẩn của tỷ lệ, nhưng tôi không thể giải thích điều này thêm nữa.

Có một lời giải thích ngoài các tính chất toán học của công thức? Nếu vậy, tại sao có ít sự không chắc chắn hơn xung quanh tỷ lệ ước tính (đối với N đã cho) khi chúng tiến gần đến 0 hoặc 1?

Câu trả lời:


8

Bối cảnh và thuật ngữ

Để hoàn toàn rõ ràng những gì chúng ta đang thảo luận, hãy thiết lập một số khái niệm và thuật ngữ. Một mô hình đẹp cho tỷ lệ là bình nhị phân: nó chứa các quả bóng được tô màu bạc ("thành công") hoặc fuchsia ("thất bại"). Tỷ lệ của các quả bóng bạc trong chiếc bình là (nhưng đây không phải là "tỷ lệ" mà chúng ta sẽ nói đến). p

Chiếc bình này cung cấp một cách để mô hình hóa một Thử nghiệm Bernoulli . Để có được một nhận thức, trộn kỹ các quả bóng và rút ra một cách mù quáng, quan sát màu sắc của nó. Để có được nhận thức bổ sung, trước tiên hãy khôi phục hộp bằng cách trả lại bóng đã vẽ, sau đó lặp lại quy trình với số lần xác định trước. Trình tự của ngộ có thể được tóm tắt bởi số lượng của những thành công của mình, . Đây là một biến ngẫu nhiên có các thuộc tính được xác định hoàn toàn bởi và . Phân phối của được gọi là phân phối Binomial . Các (thử nghiệm, hay "mẫu") Tỷ lệ là tỷ lệX n p X ( n , p ) X / nnXnpX(n,p)X/n.

Nhân vật

Những số liệu này là các biểu đồ phân phối xác suất cho các tỷ lệ nhị thức khác nhau . Đáng chú ý nhất là một mẫu nhất quán, bất kể , trong đó các phân phối trở nên hẹp hơn (và các thanh tương ứng cao hơn) khi di chuyển từ trở xuống.n p 1 / 2X/nnp1/2

Độ lệch chuẩn của là sai số chuẩn của tỷ lệ được đề cập trong câu hỏi. Đối với bất kỳ cho trước , số lượng này chỉ có thể phụ thuộc vào . Hãy gọi nó là . Bằng cách chuyển đổi vai trò của những quả bóng - gọi những quả bạc là "thất bại" và những quả fuchsia là "thành công" - thật dễ dàng để thấy rằng . Do đó, tình huống trong đó - đó là, 1/2 - phải đặc biệt. Câu hỏi liên quan đến cách thay đổi khi di chuyển từ sang một giá trị cực đoan hơn, chẳng hạn nhưn p se ( p ) se ( p ) = se ( 1 - p ) p = 1 - p p = 1 / 2 se ( p ) p 1 / 2 0X/nnpse(p)se(p)=se(1p)p=1pp=1/2se(p)p1/20.

Kiến thức hiểu biết

Bởi vì tất cả mọi người đã được hiển thị những con số như thế này từ sớm trong giáo dục của họ, mọi người "biết" độ rộng của các ô - được đo bằng cần giảm khi di chuyển từ . Nhưng kiến ​​thức đó thực sự chỉ là kinh nghiệm, trong khi câu hỏi tìm kiếm sự hiểu biết sâu sắc hơn. Sự hiểu biết như vậy có sẵn từ một phân tích cẩn thận về các bản phân phối Binomial, chẳng hạn như Abraham de Moivre đã thực hiện khoảng 300 năm trước. (Chúng gần giống với những gì tôi đã trình bày trong một cuộc thảo luận về Định lý giới hạn trung tâm .) Tuy nhiên, tôi nghĩ rằng một số cân nhắc tương đối đơn giản có thể đủ để đưa ra quan điểm rằng độ rộng phải rộng nhất gần .se(p)p1/2p=1/2

Một phân tích trực quan đơn giản

Rõ ràng là chúng ta nên kỳ vọng tỷ lệ thành công trong thí nghiệm sẽ gần với . Lỗi tiêu chuẩn liên quan đến dự đoán đó bao xa chúng ta có thể cho rằng kết quả thực tế sẽ nằm. Giả sử, không có bất kỳ mất tính tổng quát nào, rằng nằm trong khoảng từ đến , cần phải tăng từ bao nhiêu? Thông thường, xung quanh của những quả bóng được vẽ trong một thí nghiệm là bạc và (do đó) xung quanh là fuchsia. Để có thêm quả bóng bạc, một sốpX/np01/2X/nppn(1p)npnkết quả fuchsia đã có khác nhau. Làm thế nào có khả năng cơ hội có thể hoạt động theo cách này? Câu trả lời rõ ràng là khi nhỏ, chúng ta sẽ không bao giờ vẽ một quả bóng bạc. Vì vậy, cơ hội của chúng tôi để vẽ những quả bóng bạc thay vì những quả bóng fuchsia luôn luôn thấp. Chúng ta có thể hy vọng một cách hợp lý rằng bằng may mắn thuần túy, một tỷ lệ của kết quả fuchsia có thể khác nhau, nhưng dường như nhiều điều không thể thay đổi. Do đó, điều hợp lý là sẽ không thay đổi nhiều hơn . Tương đương, sẽ không thay đổi nhiều hơn .ppXp×(1p)nX/np(1p)n/n=p(1p)

Sự từ chối

Do đó, sự kết hợp ma thuật xuất hiện. p(1p) Điều này hầu như giải quyết được câu hỏi: rõ ràng đại lượng này đạt cực đại tại và giảm xuống 0 tại hoặc . Nó cung cấp một bằng chứng trực quan nhưng định lượng cho các xác nhận rằng "một cực đoan này hạn chế hơn các cực đoan khác" hoặc các nỗ lực khác để mô tả những gì chúng ta biết.p=1/2p=0p=1

Tuy nhiên, không hẳn là giá trị đúng: nó chỉ đơn thuần là chỉ cách, nói với chúng tôi những gì số lượng nên quan trọng để ước lượng sự lây lan của . Chúng tôi đã bỏ qua thực tế rằng may mắn cũng có xu hướng hành động chống lại chúng tôi: giống như một số quả bóng fuchsia có thể là bạc, một số quả bóng bạc có thể là fuchsia. Chiếm tất cả các khả năng một cách nghiêm ngặt có thể bị phức tạp, nhưng Kết quả là thay vì sử dụng là một giới hạn hợp lý vào bao nhiêu có thể đi chệch khỏi sự mong đợi của nó , vào tài khoản cho tất cả các kết quả có thể đúng , chúng tôi có để lấy căn bậc haip(1p)Xp(1p)nXpn p(1p)n. (Để biết tài khoản cẩn thận hơn về lý do, vui lòng truy cập ( https://stats.stackexchange.com/a/3904 .) Chia cho , chúng tôi biết rằng các biến thể ngẫu nhiên của tỷ lệ nên theo thứ tự đây là lỗi tiêu chuẩn của .nX/nX/np(1p)n/n=p(1p)n,X/n


3

Xét hàm p (1-p) cho 0 <= p <= 1. Sử dụng phép tính bạn có thể thấy rằng tại p = 1/2, nó là 1/4, là giá trị tối đa. Nếu bạn có thể thấy rằng đây là nhị thức liên quan đến độ lệch chuẩn của ước tính tỷ lệ là sqrt (p (1-p) / n) thì p = 1/2 là mức tối đa. Khi p = 1 hoặc 0, lỗi tiêu chuẩn là 0 vì bạn sẽ luôn nhận được tất cả 1 hoặc tất cả 0 tương ứng. Vì vậy, khi bạn tiến gần đến 0 hoặc 1, một đối số liên tục nói rằng lỗi tiêu chuẩn tiến đến 0 khi p tiến đến 0 hoặc 1. Trên thực tế, nó giảm đơn điệu khi p tiến đến 0 hoặc 1. Đối với n lớn, tỷ lệ ước tính phải gần với thực tế tỷ lệ.


3
p(1p)p=1/2

1
@whuber Tôi đã trả lời theo cách tôi đã làm vì tôi thấy rằng công thức là nền tảng cho sự hiểu biết tại sao phương sai lớn nhất với p = 1/2 và rất nhỏ khi p gần 0 hoặc 1. Có lẽ tốt nhất là nói rằng có không có lời giải thích hoàn toàn không có công thức.
Michael R. Chernick

1

Các phân phối nhị thức có xu hướng được xấp xỉ đối xứng (đối lớn nó là xấp xỉ bình thường ).n

Vì tỷ lệ phải nằm trong khoảng từ 0 đến 1, nên độ không đảm bảo sẽ bị hạn chế bởi các giới hạn này. Trừ khi tỷ lệ trung bình chính xác ở giữa, một trong những giới hạn này sẽ hạn chế hơn so với tỷ lệ khác.

Để đường cong chuông không đối xứng đối xứng có tâm tại để khớp với khoảng đơn vị, nửa chiều rộng của nó phải nhỏ hơn . phút [pmin[p,1p]


Có - nhưng các ràng buộc khác sẽ ít hạn chế hơn! Tại sao hai hiệu ứng không hủy bỏ?
whuber

@whuber Tôi đã tranh luận từ tính đối xứng (nghĩa là trong trường hợp " lớn" đơn giản , đường cong chuông đối xứng phải vừa với khoảng, vì vậy nửa chiều rộng của nó bị hạn chế bởi phía chặt hơn, )phút [ p , 1 - p ]nmin[p,1p]
GeoMatt22
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.