Giả thuyết không tương đương


11

Giả sử là một mẫu ngẫu nhiên đơn giản từ phân phối Bình thường .X1,X2,...,Xn(μ,σ2)

Tôi thích làm bài kiểm tra giả thuyết sau: với hằng số đã cho .

H0:|μ|cH1:|μ|>c,
c>0

Tôi đã nghĩ đến việc thực hiện hai một chiều -tests (TOST) một cách tương tự như tình hình thử nghiệm tương đương sinh học thông thường, nơi mà các giá trị và là thay vào đó, nhưng tôi không biết nếu điều này làm cho tinh thần hoặc là đúng.t|μ|c

Ý tưởng của tôi là thực hiện các thử nghiệm một phía và và từ chối giả thuyết null toàn cầu nếu một trong các giá trị nhỏ hơn mức ý nghĩa .

H01:μcH11:μ>c
H02:μcH12:μ<c,
pα

Cảm ơn trước!

BIÊN TẬP:

Tôi đã suy nghĩ một chút về điều này và tôi nghĩ rằng cách tiếp cận tôi đề xuất không có mức ý nghĩa .α

Giả sử giá trị thực của là và biết.μμ0σ2

Xác suất từ ​​chối null trong thử nghiệm đầu tiên là trong đó nếu cdf tiêu chuẩn của phân phối chuẩn và là một giá trị sao cho .

Pμ0(Rej.H01)=1Φ(z1α+cμ0σ/n),
Φz1αΦ(z1α)=1α

Nếu , . Sau đó, nếu , . Ngoài ra, nếu , .μ0=cPμ0(Rej.H01)=αμ0>cPμ0(Rej.H01)>αμ0<cPμ0(Rej.H01)<α

Xác suất từ ​​chối null trong thử nghiệm thứ hai là

Pμ0(Rej.H02)=Φ(z1αμ0+cσ/n).

Một lần nữa, nếu chúng ta có . Tương tự, nếu , . Cuối cùng, nếu , .μ0=cPμ0(Rej.H02)=αμ0>cPμ0(Rej.H02)<αμ0<cPμ0(Rej.H02)>α

Do các vùng loại bỏ của hai thử nghiệm không nhau nên xác suất từ ​​chối là: H0

Pμ0(Rej.H0)=1Φ(z1α+cμ0σ/n)+Φ(z1αμ0+cσ/n)

Vì vậy, nếu , là giới hạn trên của xác suất bác bỏ giả thuyết null (toàn cầu). Do đó, cách tiếp cận tôi đề xuất là quá tự do.μ[c,c]2α

Nếu tôi không sai, chúng ta có thể đạt được mức ý nghĩa của bằng cách thực hiện hai phép thử giống nhau và từ chối null nếu giá trị của một trong số chúng nhỏ hơn . Một đối số tương tự giữ khi phương sai không xác định và chúng ta cần áp dụng -test.αpα/2t


Chỉnh sửa là đúng hướng :-).
whuber

Câu trả lời:


3

Câu hỏi rất thú vị !!

Bạn đang sử dụng hệ quả logic, nghĩa là điều kiện đòi hỏi. Điều kiện đòi hỏi này tạo thành nền tảng cơ bản của logic cổ điển, nó đảm bảo suy luận hoặc suy luận về kết quả từ tiền đề.

Lý do đằng sau đề xuất của bạn như sau:

Nếu đòi hỏi , sau đó các dữ liệu quan sát được nên vẽ thêm bằng chứng chống lại hơn .H0H0H0H0

Xét về các giả thuyết phụ trợ của bạn và , chúng tôi có , nghĩa là, đòi hỏi và cả đòi hỏi . Do đó, theo điều kiện yêu cầu, chúng ta nên quan sát nhiều bằng chứng chống lại hơn hoặc . Sau đó, bạn đã kết luận rằng nếu một trong các giá trị p được tính theo hoặc là đủ nhỏ, giá trị p được tính theo sẽ còn nhỏ hơn nữa.H01H02H0H01H02H0H01H0H02H0H01H02H01H02H0

Tuy nhiên, lý luận logic này không hợp lệ đối với giá trị p, nghĩa là giá trị p không tôn trọng hệ quả logic. Mỗi giá trị p được xây dựng theo một giả thuyết null cụ thể, do đó, giá trị p cho các giả thuyết null khác nhau được tính theo các số liệu khác nhau. Vì lý do này, giá trị p không thể tôn trọng lý luận logic trên không gian tham số (hoặc không gian của các giả thuyết null).

Các ví dụ trong đó giá trị p vi phạm điều kiện yêu cầu được trình bày trong Schervish (1996) và Patriota (2013). Bài viết sau cho thấy các ví dụ từ phân phối chuẩn bivariate và từ mô hình hồi quy (xem ví dụ 1.1 và 1.2 trên trang 5 và 6, tương ứng). Eran Raviv cung cấp một thuật toán trong mã R cho trường hợp bivariate. Việc học hỏi từ các ví dụ này là: bạn phải tính trực tiếp giá trị p cho giả thuyết quan tâm null. Schervish (1996) cung cấp công thức giá trị p cho ví dụ của bạn khi và , xem Công thức (2) trên trang 204. Nếu bạn muốn tính giá trị p, bạn phải cung cấp công thức đó cho trường hợp của bạn.n=1σ2=1

Patriota (2013) đề xuất một biện pháp chứng cứ mới để kiểm tra các giả thuyết null chung (giả thuyết null tổng hợp hoặc đơn giản) tôn trọng hệ quả logic. Biện pháp này được gọi là giá trị s trong bài báo. Thủ tục tương đối đơn giản cho ví dụ của bạn:

  1. Tìm khoảng tin cậy (1- ) cho (một tiệm cận): , trong đó là trung bình mẫu, là phương sai mẫu , là định lượng của phân phối chuẩn thông thường và là kích thước mẫu.αμI(μ,α)=[x¯zα/2s2n ; x¯+zα/2s2n]x¯s2zα/2α/2n

  2. Tìm giá trị trong đó biên độ của là tối thiểu và có ít nhất một phần tử chung với (nghĩa là đường viền của ). Đây là giá trị.αI(μ,α){c,c}[c,c]αs

  3. Một mặt, nếu , thì mẫu quan sát được chứng thực bằng Giả thuyết null ; nếu giá trị đủ nhỏ thì bạn có thể chấp nhận null. Mặt khác, nếu , thì mẫu được quan sát đang cung cấp thông tin chống lại Giả thuyết null ; nếu giá trị đủ nhỏ thì bạn có thể từ chối null. Nếu không, bạn không nên từ chối hoặc chấp nhận null.x¯[c,c]H0:|μ|csx¯[c,c]H0s

Lưu ý rằng, nếu và giá trị tương ứng là cực kỳ nhỏ, điều này có nghĩa là giả thuyết thay thế nằm rất xa so với giá trị hợp lý tối đa, . Nếu và giá trị tương ứng là cực kỳ nhỏ, điều này có nghĩa là giả thuyết null nằm rất xa giá trị hợp lý tối đa, . Cố gắng vẽ một bức tranh đại diện cho khoảng tin cậy và giả thuyết không quan tâm để hiểu rõ hơn về kết luận. Để biết thêm thông tin xin vui lòng đọc bài báo gốc Patriota (2013).x¯[c,c]sx¯x¯[c,c]sx¯

Làm thế nào để tìm ngưỡng khách quan để chấp nhận hoặc từ chối null bằng cách sử dụng giá trị này vẫn là một vấn đề mở. Cách tiếp cận này là tốt bởi vì bây giờ chúng ta có thể chấp nhận một giả thuyết không. Điều này có ý nghĩa bất cứ khi nào mẫu quan sát chứng thực bằng null và nó cách xa sự thay thế. Trong ví dụ của bạn, có thể thấy , , và . Khá đơn giản để thấy rằng mật độ dữ liệu cực kỳ tập trung vào (gấp mười lần lỗi tiêu chuẩn). Để có giao lộ không trống với , cần phải có 99900 lỗi tiêu chuẩn. Vì vậy, nó sẽ đủ công bằng để chấp nhậnsc=1000x¯=1s2=1n=10000[0.9, 1.1][1000, 1000]H0:|μ|c trong trường hợp này.

Người giới thiệu:

Yêu nước, AG (2013). Một thước đo cổ điển của bằng chứng cho các giả thuyết null nói chung, Bộ mờ và Hệ thống, 233, 74.

Schervish, MJ (1996). Giá trị P: Chúng là gì và không phải là gì, Nhà thống kê người Mỹ, 50, 203 Ném206.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.