So sánh 0/10 với 0/20


10

Khi thảo luận về tỷ lệ thành tích nhiệm vụ, có cách nào để chỉ ra rằng 0 trong số 20 lần thử là "tệ hơn" so với 0 trên 10 lần thử không?


1
Bạn có thể thử sử dụng en.wikipedia.org/wiki/Additive_smoothing nhưng sẽ vẫy tay hơn là bằng chứng vững chắc
abukaj

Làm thế nào để bạn biết nó là tồi tệ hơn? Ví dụ: nếu chỉ có 10 lần thử là có thể, thì bạn không biết đâu sẽ là điểm số với nhiều lần thử hơn.
Tim

4
Có lẽ một khoảng tin cậy cho tỷ lệ ước tính?
mdewey

5
Đây dường như là một câu hỏi hợp lý với tôi. Nó dựa trên một trực giác hoàn toàn bình thường có thể được thảo luận, và có những cách thống kê (ví dụ, Bayesian) để giải quyết vấn đề. Tôi đang bỏ phiếu để bỏ ngỏ.
gung - Tái lập Monica

1
Tôi đồng ý với @gung. Đây là một câu hỏi hay.
Alexis

Câu trả lời:


3

Giả sử chúng ta biết xác suất thành công trong một nỗ lực. Trong trường hợp này, chúng tôi tính xác suất 0 trên 10 và 0 trong số 20 trường hợp.

Tuy nhiên, trong trường hợp này, chúng tôi đi theo cách khác. Chúng tôi không biết xác suất, chúng tôi có dữ liệu và chúng tôi cố gắng ước tính xác suất.

Chúng ta càng có nhiều trường hợp, chúng ta càng chắc chắn về kết quả. Nếu tôi lật một đồng xu và nó sẽ đứng đầu, bạn sẽ không chắc chắn rằng đó là đầu kép. Nếu tôi ném nó 1.000 lần và tất cả sẽ là đầu, không chắc là nó cân bằng.

Có những phương pháp được thiết kế để xem xét số lượng đường mòn khi đưa ra ước tính. Một trong số đó là làm mịn phụ gia mà @abukaj bình luận ở trên. Trong làm mịn phụ gia, chúng tôi thêm các mẫu giả bổ sung vào xem xét. Trong trường hợp của chúng tôi, thay vì theo dấu vết, chúng tôi đã thấy chúng tôi thêm hai lần nữa - một thành công và một thất bại.

  • Trong trường hợp đầu tiên, xác suất được làm mịn sẽ là = ~ 8.3% 11+010+1+1112
  • Trong trường hợp thứ hai, chúng tôi sẽ nhận được = ~ 4.5% 11+020+1+1122

Lưu ý rằng làm mịn phụ gia chỉ là một phương pháp ước tính. Bạn sẽ nhận được kết quả khác nhau với các phương pháp khác nhau. Ngay cả với việc làm mịn phụ gia, bạn sẽ nhận được kết quả khác nhau nếu bạn thêm 4 mẫu giả.

Một phương pháp khác là sử dụng khoảng tin cậy như @mdewey đề xuất. Chúng ta càng có nhiều mẫu, khoảng tin cậy sẽ càng ngắn. Kích thước của khoảng tin cậy tỷ lệ thuận với căn bậc hai của các mẫu - . Do đó, nhân đôi số lượng mẫu sẽ dẫn đến khoảng tin cậy ngắn hơn .1n2

Giá trị trung bình trong cả hai trường hợp là 0. Chúng tôi lấy mức tin cậy là 90% (z = 1.645)

  • Trong trường hợp đầu tiên, chúng tôi sẽ nhận được 0 + ~ 52%1.64510
  • Trong trường hợp thứ hai, chúng tôi sẽ nhận được 0 + ~ 36%1.64520

Trong trường hợp thiếu dữ liệu, có sự không chắc chắn. Các giả định bạn đưa ra và dữ liệu ngoài bạn sẽ sử dụng sẽ thay đổi những gì bạn sẽ nhận được.


1
Cảm ơn bạn rất nhiều Dan Levin. Câu trả lời của bạn đủ rõ ràng để một người không phải là nhà toán học làm theo, và đủ mạnh mẽ để tôi chấp nhận trực giác lời giải thích của bạn. Cảm ơn tất cả các bình luận cho đầu vào của bạn.
vinne

1

Mở rộng ý tưởng về việc gọi các khoảng tin cậy, có một khái niệm về một khoảng nhị thức chính xác.

Phân phối nhị thức là tổng số thành công trong các thử nghiệm độc lập kết thúc bằng 0 (thất bại) hoặc 1 (thành công). Xác suất đạt được 1 (thành công) được ký hiệu theo truyền thống là và phần bù của nó là . Sau đó, kết quả xác suất chuẩn là xác suất của thành công chính xác trong thử nghiệm làq = 1 - p k npq=1pkn

pn,k=(nk)pkqnk=n!k!(nk)!pkqnk

Khái niệm về khoảng tin cậy là ràng buộc một tập hợp các giá trị có thể có của các tham số mô hình (ở đây, xác suất thành công ) để chúng ta có thể đưa ra các tuyên bố xác suất (tốt, thường xuyên ) về việc liệu giá trị tham số thực có nằm trong khoảng này không (cụ thể là , rằng nếu chúng ta lặp lại thí nghiệm xác suất thực hiện 10 hoặc 20 thử nghiệm và xây dựng khoảng tin cậy theo một cách cụ thể, chúng ta sẽ quan sát thấy giá trị thực của tham số nằm trong khoảng 95% thời gian).p

Trong trường hợp này, chúng ta có thể giải cho công thức đó: p

pn,0=(1p)n

Vì vậy, nếu chúng tôi muốn khoảng 95% một phía, chúng tôi sẽ đặt để giải quyết xác suất của số 0 được quan sát là tối đa 5%. Với , câu trả lời là (nghĩa là ở mức cực đoan, nếu xác suất thành công trong mỗi thử nghiệm là 13,9%, thì xác suất quan sát thành công bằng 0 là 5%). Với , câu trả lời là . Vì vậy, từ một mẫu , chúng tôi đã học được nhiều hơn từ mẫu , theo nghĩa là chúng tôi có thể `` loại trừ '' phạm vi rằng mẫu của vẫn lá như hợp lý.pn,0=5%n=20[0%,13.9%]n=10[0%,25.9%]n=20n=10[13.9%,25.9%]n=10


0

Cách tiếp cận Bayes

  • Đặt cho là một chuỗi các biến ngẫu nhiên IID Bernoulli với tham số .Xii=1,np
  • Hãy để chúng tôi đại diện cho sự không chắc chắn của chúng tôi về tham số bằng cách giả sử nó tuân theo phân phối Beta với siêu đường kính và .p αβ

Hàm khả năng là Bernoulli và phân phối Beta là liên hợp trước khi phân phối Bernoulli, do đó, hậu thế tuân theo phân phối Beta. Hơn nữa, hậu thế được tham số hóa bởi:

α^=α+i=1nXiβ^=β+ni=1nXi

Hậu quả là:

E[pX1,,Xn]=α^α^+β^=α+i=1nXiα+β+n

Do đó, nếu bạn thấy 10 lần thất bại, kỳ vọng của bạn về là và nếu bạn thấy 20 lần thất bại, thì kỳ vọng của bạn về là . Bạn càng thấy nhiều thất bại, kỳ vọng của bạn về .pαα+β+10pαα+β+20p

Đây có phải là một lý lẽ hợp lý? Nó phụ thuộc vào cách bạn cảm nhận về thống kê Bayes, cho dù bạn có sẵn sàng mô hình tính không chắc chắn đối với một số tham số bằng cách sử dụng cơ chế xác suất. Và nó phụ thuộc vào mức độ hợp lý của sự lựa chọn của bạn trước.p

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.