Một đồng xu được tung 900 lần và đầu xuất hiện 490 lần. Liệu kết quả có ủng hộ giả thuyết rằng đồng xu không thiên vị?
Một đồng xu được tung 900 lần và đầu xuất hiện 490 lần. Liệu kết quả có ủng hộ giả thuyết rằng đồng xu không thiên vị?
Câu trả lời:
Ở đây , giả thuyết null tự nhiên là đồng xu không thiên vị, nghĩa là xác suất của một cái đầu bằng . Giả thuyết thay thế hợp lý nhất là , mặc dù người ta có thể tạo ra một trường hợp cho giả thuyết thay thế một phía . p 1 / 2 H 1 p ≠ 1 / 2 p > 1 / 2
Chúng ta cần chọn mức ý nghĩa của bài kiểm tra. Tùy bạn. Hai số truyền thống là % và %.1
Giả sử rằng giả thuyết null giữ. Sau đó, số lượng đầu có * phân phối nhị thức với giá trị trung bình và độ lệch chuẩn .√
Xác suất để tung đồng xu công bằng, số lượng đầu khác nhau từ đến trở lên (theo một trong hai hướng) là, theo đối xứng, Điều này không thực tế để tính toán bằng tay, nhưng Wolfram Alpha đưa ra câu trả lời khoảng .40 2 900 ∑ k = 490 ( 900
Do đó, nếu đồng xu không thiên vị, thì một số đầu khác với từ trở lên sẽ rất khó xảy ra. Nó sẽ có xác suất ít hơn %. vì vậy ở mức ý nghĩa %, chúng tôi bác bỏ giả thuyết khống.
Chúng ta cũng có thể sử dụng xấp xỉ bình thường cho nhị thức để ước tính xác suất số lượng đầu là hoặc theo giả thuyết null . Bình thường của chúng ta có nghĩa là và phương sai là với xác suất xác suất chuẩn bình thường là . Từ bảng cho bình thường, đây là khoảng . Nhân đôi để đưa đuôi trái vào tài khoản. Chúng tôi nhận được khoảng , khá gần với giá trị được đưa ra bởi Wolfram Alpha và dưới \%. Vì vậy, nếu chúng ta sử dụng\% là mức ý nghĩa của chúng tôi, một lần nữa chúng tôi bác bỏ giả thuyết .
Bình luận: . Trong phép tính gần đúng bình thường với nhị thức, chúng ta có được xấp xỉ tốt hơn với xác suất nhị phân là bằng cách tính xác suất mà bình thường là . Nếu bạn muốn tìm kiếm nó, đây là sự điều chỉnh liên tục . Nếu chúng ta sử dụng xấp xỉ bình thường với sự điều chỉnh liên tục, chúng ta thấy rằng xác suất của trở lên hoặc hoặc ít hơn người đứng đầu là khoảng , khá gần với "chính xác" Câu trả lời được cung cấp bởi Wolfram Alpha. Do đó, chúng ta có thể tìm thấy một ước tính rất chính xác bằng cách, như trong những ngày xưa tồi tệ, sử dụng các bảng của tiêu chuẩn thông thường và thực hiện số học "bằng tay".
. Giả sử rằng chúng ta sử dụng giả thuyết thay thế ít tự nhiên hơn . Nếu , xác suất từ trở lên là khoảng . Do đó, một lần nữa ở mức ý nghĩa %, chúng tôi sẽ từ chối giả thuyết khống, thực sự chúng tôi sẽ từ chối ngay cả khi chúng tôi đang sử dụng mức ý nghĩa .
Việc thiết lập một mức ý nghĩa luôn luôn là cần thiết, vì có thể một đồng tiền công bằng có thể mang lại đầu trở lên trong tung, điều đó thật khó xảy ra.
40 or more
, nhưng không 40 or less
hoặc chỉ 40
?
Nếu đồng xu không thiên vị thì xác suất 'đầu' là . Do đó, số lượng đầu được ném trong 900 lần thử, , có phân phối theo giả thuyết null của một đồng tiền công bằng. Vì vậy, giá trị - xác suất nhìn thấy một kết quả cực đoan hoặc cực đoan hơn cho rằng đồng tiền ở xa, là XBinomial(900,1p
Nếu bạn tìm kiếm giá trị 2 mặt , đó sẽ là
Tôi sẽ để lại cho bạn để mô tả lý do tại sao.
Chúng tôi biết rằng hàm khối lượng cho , là
Tôi sẽ để nó cho bạn để tính giá trị bạn tìm kiếm.
Lưu ý: Cỡ mẫu ở đây đủ lớn để bạn có thể sử dụng xấp xỉ bình thường cho phân phối nhị thức. Tôi đã trình bày chi tiết ở trên cách tính giá trị chính xác .
Các ví dụ từ trang Wikipedia trên Bayes Yếu tố có vẻ khá phù hợp với câu hỏi này. Nếu chúng ta có hai mô hình, M1 trong đó đồng xu hoàn toàn không thiên vị (q = 0,5) và M2 không xác định được đầu, vì vậy chúng tôi sử dụng phân phối phẳng trước trên 1. Sau đó, chúng tôi tính toán hệ số vịnh
Ở đâu
và
Đưa ra hệ số Bayes của , theo quy mô giải thích thông thường là "hầu như không đáng nhắc đến".
Tuy nhiên, xin lưu ý (i) yếu tố Bayes có hình phạt thỉnh thoảng được xây dựng ưu tiên các mô hình đơn giản và M1 đơn giản hơn rất nhiều vì nó không có các tham số phiền toái, như M2 thực hiện; (ii) một căn hộ trước không hợp lý về mặt vật lý, trong thực tế, một đồng xu thiên vị sẽ gần với công bằng trừ khi đồng xu rõ ràng là đồng nhất; (Iii) đó là một ngày dài và tôi có thể dễ dàng mắc một số lỗi (bất kỳ) trong đó trong phân tích từ các giả định đến các tính toán.
Lưu ý rằng đồng xu bị sai lệch nếu nó là một đối tượng vật lý vì sự đồng nhất của nó có nghĩa là nó sẽ không chính xác như có thể rơi xuống đầu như đuôi.
Câu hỏi của bạn có thể được giải quyết theo một vài cách khác nhau.
Các thử nghiệm truyền thống của giả thuyết được thiết kế để loại trừ các khả năng, không nhất thiết phải chứng minh chúng. Trong trường hợp này, chúng ta có thể sử dụng làm giả thuyết null và xem liệu dữ liệu (49 trong số 900 đầu) có thể được sử dụng để từ chối giả thuyết null này bằng cách tính giá trị p. Nếu giá trị p nhỏ hơn thì chúng ta từ chối null, nhưng giá trị p không có nghĩa là chúng ta có thể nói dữ liệu hỗ trợ null, chỉ là nó phù hợp với giả định rằng null là đúng , nhưng trong thực tế null có thể là sai, chỉ sự thật là giá trị của rất gần với .
Cách tiếp cận "tương đương" sẽ là xác định không thiên vị không phải là mà là chọn một vùng nhỏ khoảng 0,5 để xem là không thiên vị . Sau đó, nếu khoảng tin cậy trên tỷ lệ thực nằm hoàn toàn trong khoảng tương đương của "không thiên vị" thì dữ liệu sẽ hỗ trợ cho giả thuyết "không thiên vị".
Một cách tiếp cận khác là sử dụng cách tiếp cận Bayes trong đó chúng ta bắt đầu với phân phối trước trên tỷ lệ bao gồm khối lượng điểm ở mức 0,5 và phần còn lại của xác suất lan truyền theo các giá trị có thể. Sau đó kết hợp điều đó với dữ liệu để có được một hậu thế. Nếu xác suất posterioun của đủ cao thì điều đó sẽ hỗ trợ cho tuyên bố không thiên vị.p = 0,5
Và một minh họa R:
Không bận tâm đến gần đúng bằng bình thường, chúng ta có thể xem xét một nhị thức phân phối biến ngẫu nhiên với n = 900 và p = 0,5 theo giả thuyết null (nghĩa là nếu đồng xu không thiên vị thì p = xác suất của đầu (hoặc đuôi) = 0,5).
Nếu chúng tôi muốn kiểm tra phương án thay thế Ha: p <> 0,5 tại alpha 0,05, chúng tôi có thể xem xét các đuôi của phân phối dưới giá trị null như sau và thấy rằng 490 nằm ngoài khoảng {421, 479} và do đó chúng tôi từ chối Ho .
n<-900
p<-0.5
qbinom(c(0.025,0.975),size=n,prob=p)
# 421 479
Để làm rõ cách tiếp cận Bayes:
Bạn bắt đầu bằng cách không biết gì, ngoại trừ đó P(Heads)
là trong [0,1]
. Vì vậy, bắt đầu với một entropy tối đa trước -> uniform(0,1)
. Điều này có thể được biểu diễn dưới dạng phân phối beta -> beta(1,1)
.
Mỗi lần bạn lật đồng xu, hãy cập nhật Bayesian của đồng xu P(Heads)
bằng cách nhân từng điểm trong phân phối với khả năng của nó (nhân với x
nếu bạn cuộn đầu, nhân với (1-x)
nếu bạn nhận được đuôi) và tái chuẩn hóa tổng xác suất thành 1 Đây là những gì bản phân phối beta thực hiện, vì vậy nếu cuộn đầu tiên là đầu bạn sẽ có beta(2,1)
. Trong trường hợp của bạn, bạn có beta(490,510)
.
Từ đó tôi sẽ tính khoảng xác suất 95% và nếu 0,5 không nằm trong khoảng đó, tôi sẽ bắt đầu nghi ngờ.
Lần đầu tiên tôi thực hiện bài tập này, tôi thực sự ngạc nhiên về việc mất bao lâu để hội tụ ... Tôi bắt đầu vì ai đó đã nói "nếu bạn lật một đồng xu 100 lần, bạn biết P(Heads)
là +/- 1%" điều này hóa ra là Hoàn toàn sai, bạn cần cường độ hơn 100 lần lật.
Giả thuyết không, Ho: P = 0,5 (P = Q = 0,5)
H1: P> 0,5
Trong đó P là đầu dò của đầu xảy ra.
chúng ta biết z = (pP) / sqrt (PQ / N)
trong đó p = 490/900 = 0,54
Bây giờ z = (0,54-0,5) / sqrt ((0,5 * 0,5) / 900)
z = 2
do đó ở mức 5% LOS (tức là 1,64 <2) Ho bị từ chối
do đó đồng xu bị sai lệch .....