Bối cảnh và thuật ngữ
Để hoàn toàn rõ ràng những gì chúng ta đang thảo luận, hãy thiết lập một số khái niệm và thuật ngữ. Một mô hình đẹp cho tỷ lệ là bình nhị phân: nó chứa các quả bóng được tô màu bạc ("thành công") hoặc fuchsia ("thất bại"). Tỷ lệ của các quả bóng bạc trong chiếc bình là (nhưng đây không phải là "tỷ lệ" mà chúng ta sẽ nói đến). p
Chiếc bình này cung cấp một cách để mô hình hóa một Thử nghiệm Bernoulli . Để có được một nhận thức, trộn kỹ các quả bóng và rút ra một cách mù quáng, quan sát màu sắc của nó. Để có được nhận thức bổ sung, trước tiên hãy khôi phục hộp bằng cách trả lại bóng đã vẽ, sau đó lặp lại quy trình với số lần xác định trước. Trình tự của ngộ có thể được tóm tắt bởi số lượng của những thành công của mình, . Đây là một biến ngẫu nhiên có các thuộc tính được xác định hoàn toàn bởi và . Phân phối của được gọi là phân phối Binomial . Các (thử nghiệm, hay "mẫu") Tỷ lệ là tỷ lệX n p X ( n , p ) X / nnXnpX( n , p )X/ n.
Những số liệu này là các biểu đồ phân phối xác suất cho các tỷ lệ nhị thức khác nhau . Đáng chú ý nhất là một mẫu nhất quán, bất kể , trong đó các phân phối trở nên hẹp hơn (và các thanh tương ứng cao hơn) khi di chuyển từ trở xuống.n p 1 / 2X/ nnp1 / 2
Độ lệch chuẩn của là sai số chuẩn của tỷ lệ được đề cập trong câu hỏi. Đối với bất kỳ cho trước , số lượng này chỉ có thể phụ thuộc vào . Hãy gọi nó là . Bằng cách chuyển đổi vai trò của những quả bóng - gọi những quả bạc là "thất bại" và những quả fuchsia là "thành công" - thật dễ dàng để thấy rằng . Do đó, tình huống trong đó - đó là, 1/2 - phải đặc biệt. Câu hỏi liên quan đến cách thay đổi khi di chuyển từ sang một giá trị cực đoan hơn, chẳng hạn nhưn p se ( p ) se ( p ) = se ( 1 - p ) p = 1 - p p = 1 / 2 se ( p ) p 1 / 2 0X/ nnpse(p)se(p)=se(1−p)p=1−pp=1/2se(p)p1/20.
Kiến thức và hiểu biết
Bởi vì tất cả mọi người đã được hiển thị những con số như thế này từ sớm trong giáo dục của họ, mọi người "biết" độ rộng của các ô - được đo bằng cần giảm khi di chuyển từ . Nhưng kiến thức đó thực sự chỉ là kinh nghiệm, trong khi câu hỏi tìm kiếm sự hiểu biết sâu sắc hơn. Sự hiểu biết như vậy có sẵn từ một phân tích cẩn thận về các bản phân phối Binomial, chẳng hạn như Abraham de Moivre đã thực hiện khoảng 300 năm trước. (Chúng gần giống với những gì tôi đã trình bày trong một cuộc thảo luận về Định lý giới hạn trung tâm .) Tuy nhiên, tôi nghĩ rằng một số cân nhắc tương đối đơn giản có thể đủ để đưa ra quan điểm rằng độ rộng phải rộng nhất gần .se(p)p1/2p=1/2
Một phân tích trực quan đơn giản
Rõ ràng là chúng ta nên kỳ vọng tỷ lệ thành công trong thí nghiệm sẽ gần với . Lỗi tiêu chuẩn liên quan đến dự đoán đó bao xa chúng ta có thể cho rằng kết quả thực tế sẽ nằm. Giả sử, không có bất kỳ mất tính tổng quát nào, rằng nằm trong khoảng từ đến , cần phải tăng từ bao nhiêu? Thông thường, xung quanh của những quả bóng được vẽ trong một thí nghiệm là bạc và (do đó) xung quanh là fuchsia. Để có thêm quả bóng bạc, một sốpX/np01/2X/nppn(1−p)npnkết quả fuchsia đã có khác nhau. Làm thế nào có khả năng cơ hội có thể hoạt động theo cách này? Câu trả lời rõ ràng là khi nhỏ, chúng ta sẽ không bao giờ vẽ một quả bóng bạc. Vì vậy, cơ hội của chúng tôi để vẽ những quả bóng bạc thay vì những quả bóng fuchsia luôn luôn thấp. Chúng ta có thể hy vọng một cách hợp lý rằng bằng may mắn thuần túy, một tỷ lệ của kết quả fuchsia có thể khác nhau, nhưng dường như nhiều điều không thể thay đổi. Do đó, điều hợp lý là sẽ không thay đổi nhiều hơn . Tương đương, sẽ không thay đổi nhiều hơn .ppXp×(1−p)nX/np(1−p)n/n=p(1−p)
Sự từ chối
Do đó, sự kết hợp ma thuật xuất hiện. p(1−p) Điều này hầu như giải quyết được câu hỏi: rõ ràng đại lượng này đạt cực đại tại và giảm xuống 0 tại hoặc . Nó cung cấp một bằng chứng trực quan nhưng định lượng cho các xác nhận rằng "một cực đoan này hạn chế hơn các cực đoan khác" hoặc các nỗ lực khác để mô tả những gì chúng ta biết.p=1/2p=0p=1
Tuy nhiên, không hẳn là giá trị đúng: nó chỉ đơn thuần là chỉ cách, nói với chúng tôi những gì số lượng nên quan trọng để ước lượng sự lây lan của . Chúng tôi đã bỏ qua thực tế rằng may mắn cũng có xu hướng hành động chống lại chúng tôi: giống như một số quả bóng fuchsia có thể là bạc, một số quả bóng bạc có thể là fuchsia. Chiếm tất cả các khả năng một cách nghiêm ngặt có thể bị phức tạp, nhưng Kết quả là thay vì sử dụng là một giới hạn hợp lý vào bao nhiêu có thể đi chệch khỏi sự mong đợi của nó , vào tài khoản cho tất cả các kết quả có thể đúng , chúng tôi có để lấy căn bậc haip(1−p)Xp(1−p)nXpn p(1−p)n−−−−−−−−√. (Để biết tài khoản cẩn thận hơn về lý do, vui lòng truy cập ( https://stats.stackexchange.com/a/3904 .) Chia cho , chúng tôi biết rằng các biến thể ngẫu nhiên của tỷ lệ nên theo thứ tự đây là lỗi tiêu chuẩn của .nX/nX/np(1−p)n−−−−−−−−√/n=p(1−p)n−−−−−√,X/n