Biện minh cho thử nghiệm giả thuyết một đầu


35

Tôi hiểu thử nghiệm giả thuyết hai đuôi. Bạn có (so với H 1 = ¬ H 0 : θ θ 0 ). Các p -giá trị là xác suất mà θH0:θ=θ0H1=¬H0:θθ0pθ tạo ra dữ liệu ít nhất là cực như những gì đã được quan sát.

Tôi không hiểu thử nghiệm giả thuyết một đầu. Ở đây, (so với H 1 = ¬ H 0 : θ > θ 0 ). Định nghĩa về giá trị p không nên đã thay đổi với phần trên: nó vẫn cần được xác suất mà θ tạo ra dữ liệu ít nhất là cực như những gì đã được quan sát. Nhưng chúng ta không biết θ , duy nhất mà nó trên bên giáp θ 0 .H0:θθ0H1=¬H0:θ>θ0θ θθ0

Vì vậy, thay vào đó, tôi thấy văn bản nói cho chúng ta giả định rằng (không θ θ 0 theo H 0 ) và tính toán xác suất mà này tạo ra dữ liệu ít nhất là cực như những gì đã được quan sát, nhưng chỉ trên một đầu. Điều này dường như không liên quan gì đến các giả thuyết, về mặt kỹ thuật.θ=θ0θθ0H0

Bây giờ, tôi hiểu rằng đây là thử nghiệm giả thuyết frequentist, và rằng frequentists đặt không priors trên họ s. Nhưng không phải điều đó chỉ có nghĩa là các giả thuyết sau đó không thể chấp nhận hay bác bỏ, thay vì đánh bóng tính toán trên vào bức tranh?θ


Một câu hỏi tương tự đã được hỏi về số liệu thống kê sau đó.stackexchange.com/questions / 81996 / Giả
robin girard

1
Định nghĩa của bạn về giá trị là không đầy đủ. Nó nên đọc (nhấn mạnh thêm): Các p -giá trị là xác suất mà θ tạo ra dữ liệu ít nhất là cực như những gì đã được quan sát, giả định giả thuyết là đúng . ppθ
Alexis

Câu trả lời:


34

Đó là một câu hỏi chu đáo. Nhiều văn bản (có lẽ vì lý do sư phạm) viết về vấn đề này. Điều thực sự xảy ra là là một "giả thuyết" tổng hợp trong tình huống một chiều của bạn: nó thực sự là một tập hợp các giả thuyết, không phải là một giả thuyết duy nhất. Điều cần thiết là với mọi giả thuyết có thể có trong H 0H0 H0, cơ hội thống kê thử nghiệm rơi vào khu vực quan trọng phải nhỏ hơn hoặc bằng kích thước thử nghiệm. Hơn nữa, nếu thử nghiệm thực sự là để đạt được kích thước danh nghĩa của nó (đó là một điều tốt để đạt được công suất cao), thì tối cao của những cơ hội này (chiếm lấy tất cả các giả thuyết null) sẽ bằng kích thước danh nghĩa. Trong thực tế, đối với các thử nghiệm một tham số đơn giản về vị trí liên quan đến các họ phân phối "đẹp" nhất định, tối cao này đạt được cho giả thuyết với tham số . Vì vậy, như một vấn đề thực tế, tất cả các tính toán tập trung vào một phân phối này. Nhưng chúng ta không được quên phần còn lại của tập H 0θ0H0: đó là một sự khác biệt quan trọng giữa các thử nghiệm hai mặt và một mặt (và giữa các thử nghiệm "đơn giản" và "tổng hợp" nói chung).

Điều này ảnh hưởng tinh tế đến việc giải thích kết quả của các bài kiểm tra một phía. Khi null bị từ chối, chúng ta có thể nói các điểm bằng chứng chống lại trạng thái tự nhiên thực sự là bất kỳ phân phối nào trong . Khi null không bị từ chối, chúng ta chỉ có thể nói có tồn tại phân phối trong H 0 "phù hợp" với dữ liệu được quan sát. Chúng tôi không nói rằng tất cả các bản phân phối trong H 0 đều phù hợp với dữ liệu: cách xa nó! Nhiều người trong số họ có thể mang lại khả năng rất thấp.H0H0H0


Tất cả những gì bạn nói là hợp lệ và quan trọng. Một khía cạnh quan trọng khác tôi nghĩ là thường thì giả thuyết null được xem là giả thuyết không thú vị. Sự thay thế được xem là giả thuyết khoa học. Đó là một trong những người thí nghiệm muốn chứng minh. Tôi nói thường bởi vì nó khác nhau trong các bài kiểm tra tương đương và không thua kém. Bây giờ liên quan đến vấn đề kiểm tra một phía, người ta chỉ nói rằng bên có tham số lớn hơn giá trị null đó là điều thú vị. Vì vậy, tất cả các giá trị ở phía nhỏ hơn được kết hợp trong null.
Michael R. Chernick

stats.stackexchange.com/questions/333301/ Từ Nếu bạn cảm thấy muốn đưa ra câu trả lời cho câu hỏi này, hoặc chỉ cho tôi một số thư mục ...;)
Một ông già ở biển.


2

Bạn sẽ sử dụng một bài kiểm tra giả thuyết một phía nếu chỉ kết quả theo một hướng là ủng hộ kết luận mà bạn đang cố gắng đạt được.

Hãy nghĩ về điều này trong điều khoản của câu hỏi bạn đang hỏi. Giả sử, ví dụ, bạn muốn xem liệu béo phì có dẫn đến tăng nguy cơ đau tim hay không. Bạn thu thập dữ liệu của mình, có thể bao gồm 10 người béo phì và 10 người không béo phì. Bây giờ hãy nói rằng, do các yếu tố gây nhiễu không được đánh giá cao, thiết kế thử nghiệm kém hoặc chỉ là sự xui xẻo, bạn quan sát rằng chỉ có 2 trong số 10 người béo phì bị đau tim, so với 8 người không béo phì.

Bây giờ nếu bạn tiến hành kiểm tra giả thuyết 2 mặt trên dữ liệu này, bạn sẽ kết luận rằng có mối liên quan có ý nghĩa thống kê (p ~ 0,02) giữa béo phì và nguy cơ đau tim. Tuy nhiên, hiệp hội sẽ theo hướng ngược lại với điều mà bạn thực sự mong đợi để thấy, do đó kết quả kiểm tra sẽ gây hiểu nhầm.

(Trong cuộc sống thực, một thử nghiệm tạo ra kết quả trái ngược như vậy có thể dẫn đến những câu hỏi thú vị hơn: ví dụ, quy trình thu thập dữ liệu có thể cần phải được cải thiện hoặc có thể có các yếu tố rủi ro chưa biết trước đó hoặc có lẽ sự khôn ngoan thông thường chỉ đơn giản là nhầm lẫn. Nhưng những vấn đề này không thực sự liên quan đến câu hỏi hẹp về loại thử nghiệm giả thuyết nào sẽ sử dụng.)


2

pH0H00.5H10,5

H0H00.75H10.25

H1H0H0

Bạn có thể tự mình thử nghiệm ví dụ đồ chơi này trong R, bạn cũng nên thử các số và kết hợp đầu và đuôi tuyệt đối khác nhau:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1 
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.