Làm thế nào để đánh giá liệu một đồng xu tung 900 lần và ngẩng đầu lên tới 490 lần có bị sai lệch không?


9

Một đồng xu được tung 900 lần và đầu xuất hiện 490 lần. Liệu kết quả có ủng hộ giả thuyết rằng đồng xu không thiên vị?


3
Giả thuyết không: đồng tiền không thiên vị. Thay thế, khó biết, có thể xác suất đối xứng của một cái đầu là . Mức ý nghĩa: Bạn quyết định. Nếu giả thuyết null giữ, thì số lượng đầu có phân phối gần như bình thường, độ lệch chuẩn . Bây giờ, là khoảng đơn vị độ lệch chuẩn so với giá trị trung bình ( ) nếu giả thuyết null được giữ. Từ các bảng tiêu chuẩn thông thường hoặc khác, điều này có xác suất khoảng . Vì vậy, ở mức ý nghĩa %, chúng tôi bác bỏ giả thuyết khống. 1/2(900)(1/2)(1/2)=154902.664500.00781

1
Bạn có thể muốn xem thử nghiệm Hypothese

7
Để tham khảo trong tương lai: Crossposting các bản sao nguyên văn của câu hỏi của bạn cho nhiều trang SE được khuyến khích mạnh mẽ . Điều này xảy ra phổ biến với những người dùng mới không quen thuộc với chính sách này, vì vậy đừng cảm thấy tồi tệ. Chỉ cần, xin vui lòng, hãy ghi nhớ nó. Chào mừng đến với trang web.
Đức hồng y

Câu hỏi này, có thể chính xác là vấn đề bài tập về nhà của OP Sanu hoặc có thể là cách diễn đạt của câu hỏi của Sanu, "Kết quả có ủng hộ giả thuyết rằng đồng xu không thiên vị không?" Tất cả các câu trả lời đều đưa ra giả thuyết null là . Câu hỏi của tôi là: các quan sát có bao giờ ủng hộ giả thuyết không? Ngay cả khi đồng xu rơi xuống đầu lần trong số , điều đó không hỗ trợ cho giả thuyết khống; chỉ bằng chứng rất yếu hỗ trợ từ chối null. Bằng chứng luôn ủng hộ việc từ chối null, không bao giờ ủng hộ null. 450 900P(Heads)=0.5450900
Dilip Sarwate

@Dilip: Nếu bạn đọc lại câu trả lời của Greg, bạn sẽ thấy nhận xét của bạn ở trên không hoàn toàn đúng. Một thử nghiệm tương đương (hoặc, thường là tương đương sinh học) có một giải pháp thay thế là phiên bản hơi "mờ" của giả thuyết mong muốn mà người ta muốn có bằng chứng. Tôi nghĩ bạn sẽ thấy ngay tại sao chúng ta phải cho phép thêm một chút phòng ngọ nguậy hơn chúng ta thực sự muốn.
Đức hồng y

Câu trả lời:


16

Ở đây , giả thuyết null tự nhiên là đồng xu không thiên vị, nghĩa là xác suất của một cái đầu bằng . Giả thuyết thay thế hợp lý nhất là , mặc dù người ta có thể tạo ra một trường hợp cho giả thuyết thay thế một phía . p 1 / 2 H 1 p 1 / 2 p > 1 / 2H0p1/2H1p1/2p>1/2

Chúng ta cần chọn mức ý nghĩa của bài kiểm tra. Tùy bạn. Hai số truyền thống là % và %.151

Giả sử rằng giả thuyết null giữ. Sau đó, số lượng đầu có * phân phối nhị thức với giá trị trung bình và độ lệch chuẩn .(900)(1/2)=450(900)(1/2)(1/2)=15

Xác suất để tung đồng xu công bằng, số lượng đầu khác nhau từ đến trở lên (theo một trong hai hướng) là, theo đối xứng, Điều này không thực tế để tính toán bằng tay, nhưng Wolfram Alpha đưa ra câu trả lời khoảng .40 2 900 k = 490 ( 90045040

2k=490900(900k)(12)900.
0.008419

Do đó, nếu đồng xu không thiên vị, thì một số đầu khác với từ trở lên sẽ rất khó xảy ra. Nó sẽ có xác suất ít hơn %. vì vậy ở mức ý nghĩa %, chúng tôi bác bỏ giả thuyết khống.4504011

Chúng ta cũng có thể sử dụng xấp xỉ bình thường cho nhị thức để ước tính xác suất số lượng đầu là hoặc theo giả thuyết null . Bình thường của chúng ta có nghĩa là và phương sai là với xác suất xác suất chuẩn bình thường là . Từ bảng cho bình thường, đây là khoảng . Nhân đôi để đưa đuôi trái vào tài khoản. Chúng tôi nhận được khoảng , khá gần với giá trị được đưa ra bởi Wolfram Alpha và dưới \%. Vì vậy, nếu chúng ta sử dụng490410p=1/24501549040/150.00390.007811\% là mức ý nghĩa của chúng tôi, một lần nữa chúng tôi bác bỏ giả thuyết .H0

Bình luận: . Trong phép tính gần đúng bình thường với nhị thức, chúng ta có được xấp xỉ tốt hơn với xác suất nhị phân là bằng cách tính xác suất mà bình thường là . Nếu bạn muốn tìm kiếm nó, đây là sự điều chỉnh liên tục . Nếu chúng ta sử dụng xấp xỉ bình thường với sự điều chỉnh liên tục, chúng ta thấy rằng xác suất của trở lên hoặc hoặc ít hơn người đứng đầu là khoảng , khá gần với "chính xác" Câu trả lời được cung cấp bởi Wolfram Alpha. Do đó, chúng ta có thể tìm thấy một ước tính rất chính xác bằng cách, như trong những ngày xưa tồi tệ, sử dụng các bảng của tiêu chuẩn thông thường và thực hiện số học "bằng tay". 1490489.54904100.008468

2 . Giả sử rằng chúng ta sử dụng giả thuyết thay thế ít tự nhiên hơn . Nếu , xác suất từ trở lên là khoảng . Do đó, một lần nữa ở mức ý nghĩa %, chúng tôi sẽ từ chối giả thuyết khống, thực sự chúng tôi sẽ từ chối ngay cả khi chúng tôi đang sử dụng mức ý nghĩa .p>1/2p=1/24900.0042110.005

Việc thiết lập một mức ý nghĩa luôn luôn là cần thiết, vì có thể một đồng tiền công bằng có thể mang lại đầu trở lên trong tung, điều đó thật khó xảy ra. 550900


2
Câu hỏi này được đánh dấu là bài tập về nhà. Trong những trường hợp như vậy, không khuyến khích đưa ra một câu trả lời đầy đủ, khép kín mà không để lại việc cho người hỏi.
Macro

1
Đây là một câu trả lời từ math.SE đã hợp nhất cùng với câu hỏi và được tác giả bởi một người dùng đại diện rất cao trên math.SE. Câu hỏi không được gắn thẻ là bài tập về nhà vào thời điểm đó.
Đức hồng y

Tôi hoàn toàn không hiểu logic của "Do đó, nếu đồng xu không thiên vị, thì một số đầu khác với 450 từ 40 trở lên sẽ rất khó xảy ra." Tại sao chúng ta cần tính toán xác suất 40 or more, nhưng không 40 or lesshoặc chỉ 40?
một đề nghị không thể từ chối

và do đó, câu trả lời của @ Marco có ít lượt thích và nhiều bình luận phát sinh từ những nhầm lẫn: p
Evan Pu

8

Nếu đồng xu không thiên vị thì xác suất 'đầu' là . Do đó, số lượng đầu được ném trong 900 lần thử, , có phân phối theo giả thuyết null của một đồng tiền công bằng. Vì vậy, giá trị - xác suất nhìn thấy một kết quả cực đoan hoặc cực đoan hơn cho rằng đồng tiền ở xa, là XBinomial(900,112XpBinomial(900,12)p

P(X490)

Nếu bạn tìm kiếm giá trị 2 mặt , đó sẽ làp

1P(410<X<490)

Tôi sẽ để lại cho bạn để mô tả lý do tại sao.

Chúng tôi biết rằng hàm khối lượng cho , là YBinomial(n,p)

P(Y=y)=(ny)py(1p)ny

Tôi sẽ để nó cho bạn để tính giá trị bạn tìm kiếm. p

Lưu ý: Cỡ mẫu ở đây đủ lớn để bạn có thể sử dụng xấp xỉ bình thường cho phân phối nhị thức. Tôi đã trình bày chi tiết ở trên cách tính giá trị chính xác .p


Giá trị nên được tính cho thử nghiệm hai mặt hay thử nghiệm một phía? p
Dilip Sarwate

1
Tôi tưởng tượng hai mặt, vì câu hỏi chỉ tìm cách xác định liệu đồng xu có thiên vị hay không. Đó là, có vẻ như . Nhưng, không rõ liệu những gì được viết ở trên là câu hỏi nguyên văn hay một cách diễn đạt. Ha:p1/2
Macro

1
Vì vậy, trong trường hợp này, và có thể nhiều người khác, tính đối xứng ngụ ý rằng giá trị hai mặt chính xác gấp đôi giá trị một phía . Giá trị một mặt nhỏ hơn trong khi giá trị hai mặt lớn hơn. Vì vậy, nên loại bỏ null ở mức (tôi biết, không phải mức và được sử dụng phổ biến hơn ) nếu chúng tôi đang sử dụng thử nghiệm một phía và không bị từ chối nếu chúng tôi đang sử dụng thử nghiệm hai mặt kiểm tra. Điều này có đúng không? ppp0.005p0.5%5%1%
Dilip Sarwate

1
Có, nếu bạn đang thực hiện kiểm tra với mức , thì bạn sẽ từ chối kiểm tra một phía chứ không phải kiểm tra hai mặt. Dù người ta có nên chọn thử nghiệm 1 mặt hay 2 mặt hay không, nên dựa trên câu hỏi nghiên cứu, vì vậy vấn đề này không nên phát sinh trong thực tế. α=.005
Macro

"Có nên chọn thử nghiệm 1 mặt hay 2 mặt hay không nên chọn một ưu tiên" hay không, nhưng nếu lựa chọn chưa được thực hiện thì sao? OP Sanu có nên nói rằng dữ liệu thử nghiệm hỗ trợ cho giả thuyết rằng đồng xu không thiên vị ở mức (null không bị từ chối bởi thử nghiệm hai mặt) nhưng cũng ủng hộ giả thuyết rằng ở mức (null bị từ chối bởi kiểm tra một phía)? 0.5%P(Heads)>120.5%
Dilip Sarwate

4

Các ví dụ từ trang Wikipedia trên Bayes Yếu tố có vẻ khá phù hợp với câu hỏi này. Nếu chúng ta có hai mô hình, M1 trong đó đồng xu hoàn toàn không thiên vị (q = 0,5) và M2 không xác định được đầu, vì vậy chúng tôi sử dụng phân phối phẳng trước trên 1. Sau đó, chúng tôi tính toán hệ số vịnh

K=p(x=490|M0)p(x=490|M1)

Ở đâu

p(x=490|M1)=nchoosek(900,490)12900=7.5896×104

p(x=490|M2)=01nchoosek(900,490)q490(1q)410dq=1901

Đưa ra hệ số Bayes của , theo quy mô giải thích thông thường là "hầu như không đáng nhắc đến".K1.4624

Tuy nhiên, xin lưu ý (i) yếu tố Bayes có hình phạt thỉnh thoảng được xây dựng ưu tiên các mô hình đơn giản và M1 đơn giản hơn rất nhiều vì nó không có các tham số phiền toái, như M2 thực hiện; (ii) một căn hộ trước không hợp lý về mặt vật lý, trong thực tế, một đồng xu thiên vị sẽ gần với công bằng trừ khi đồng xu rõ ràng là đồng nhất; (Iii) đó là một ngày dài và tôi có thể dễ dàng mắc một số lỗi (bất kỳ) trong đó trong phân tích từ các giả định đến các tính toán.q

Lưu ý rằng đồng xu bị sai lệch nếu nó là một đối tượng vật lý vì sự đồng nhất của nó có nghĩa là nó sẽ không chính xác như có thể rơi xuống đầu như đuôi.


3

Câu hỏi của bạn có thể được giải quyết theo một vài cách khác nhau.

Các thử nghiệm truyền thống của giả thuyết được thiết kế để loại trừ các khả năng, không nhất thiết phải chứng minh chúng. Trong trường hợp này, chúng ta có thể sử dụng làm giả thuyết null và xem liệu dữ liệu (49 trong số 900 đầu) có thể được sử dụng để từ chối giả thuyết null này bằng cách tính giá trị p. Nếu giá trị p nhỏ hơn thì chúng ta từ chối null, nhưng giá trị p không có nghĩa là chúng ta có thể nói dữ liệu hỗ trợ null, chỉ là nó phù hợp với giả định rằng null là đúng , nhưng trong thực tế null có thể là sai, chỉ sự thật là giá trị của rất gần với .H0:p=0.5α>αp0.5

Cách tiếp cận "tương đương" sẽ là xác định không thiên vị không phải là mà là chọn một vùng nhỏ khoảng 0,5 để xem là không thiên vị . Sau đó, nếu khoảng tin cậy trên tỷ lệ thực nằm hoàn toàn trong khoảng tương đương của "không thiên vị" thì dữ liệu sẽ hỗ trợ cho giả thuyết "không thiên vị".p=0.50.5ϵ<p<0.5+ϵ

Một cách tiếp cận khác là sử dụng cách tiếp cận Bayes trong đó chúng ta bắt đầu với phân phối trước trên tỷ lệ bao gồm khối lượng điểm ở mức 0,5 và phần còn lại của xác suất lan truyền theo các giá trị có thể. Sau đó kết hợp điều đó với dữ liệu để có được một hậu thế. Nếu xác suất posterioun của đủ cao thì điều đó sẽ hỗ trợ cho tuyên bố không thiên vị.p = 0,5pp=0.5


Lưu ý rằng thông thường, cách tiếp cận Bayes sẽ dẫn đến hậu thế liên tục, và do đó xác suất sau chính xác thường là 0. Câu hỏi thú vị hơn là ước tính sau của chúng ta khác nhau đáng kể như thế nào .5. p=0.5
Michael McGowan

2
@MichaelMcGowan: nếu bắt đầu với khối lượng điểm trước tại thì cũng sẽ có khối lượng điểm sau. Việc điều này có hợp lý hay không phụ thuộc vào vấn đề ...p=0.5
Xi'an

2

Và một minh họa R:

Không bận tâm đến gần đúng bằng bình thường, chúng ta có thể xem xét một nhị thức phân phối biến ngẫu nhiên với n = 900 và p = 0,5 theo giả thuyết null (nghĩa là nếu đồng xu không thiên vị thì p = xác suất của đầu (hoặc đuôi) = 0,5).

Nếu chúng tôi muốn kiểm tra phương án thay thế Ha: p <> 0,5 tại alpha 0,05, chúng tôi có thể xem xét các đuôi của phân phối dưới giá trị null như sau và thấy rằng 490 nằm ngoài khoảng {421, 479} và do đó chúng tôi từ chối Ho .

n<-900
p<-0.5
qbinom(c(0.025,0.975),size=n,prob=p)
# 421 479

1

Để làm rõ cách tiếp cận Bayes:

Bạn bắt đầu bằng cách không biết gì, ngoại trừ đó P(Heads)là trong [0,1]. Vì vậy, bắt đầu với một entropy tối đa trước -> uniform(0,1). Điều này có thể được biểu diễn dưới dạng phân phối beta -> beta(1,1).

Mỗi lần bạn lật đồng xu, hãy cập nhật Bayesian của đồng xu P(Heads)bằng cách nhân từng điểm trong phân phối với khả năng của nó (nhân với xnếu bạn cuộn đầu, nhân với (1-x)nếu bạn nhận được đuôi) và tái chuẩn hóa tổng xác suất thành 1 Đây là những gì bản phân phối beta thực hiện, vì vậy nếu cuộn đầu tiên là đầu bạn sẽ có beta(2,1). Trong trường hợp của bạn, bạn có beta(490,510).

Từ đó tôi sẽ tính khoảng xác suất 95% và nếu 0,5 không nằm trong khoảng đó, tôi sẽ bắt đầu nghi ngờ.

Lần đầu tiên tôi thực hiện bài tập này, tôi thực sự ngạc nhiên về việc mất bao lâu để hội tụ ... Tôi bắt đầu vì ai đó đã nói "nếu bạn lật một đồng xu 100 lần, bạn biết P(Heads)là +/- 1%" điều này hóa ra là Hoàn toàn sai, bạn cần cường độ hơn 100 lần lật.


0

Giả thuyết không, Ho: P = 0,5 (P = Q = 0,5)

H1: P> 0,5

Trong đó P là đầu dò của đầu xảy ra.

chúng ta biết z = (pP) / sqrt (PQ / N)

trong đó p = 490/900 = 0,54

Bây giờ z = (0,54-0,5) / sqrt ((0,5 * 0,5) / 900)

z = 2

do đó ở mức 5% LOS (tức là 1,64 <2) Ho bị từ chối

do đó đồng xu bị sai lệch .....


1
Chào mừng đến với trang web của chúng tôi! Bạn đã đọc qua các câu trả lời khác trước khi trả lời? Bạn có thể thích những phân tích chu đáo có trong một vài trong số chúng. Chúng bao gồm các phép tính giống nhau, vì vậy tôi tự hỏi phần nào trong câu trả lời của bạn hoặc hình thức trình bày của nó đại diện cho một cái gì đó mới hơn hoặc tốt hơn những gì đã được đăng.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.