Chúng tôi có thể chấp nhận null trong các bài kiểm tra không thua kém?


11

Trong một thử nghiệm t thông thường về phương tiện, sử dụng các phương pháp kiểm tra giả thuyết thông thường, chúng tôi sẽ từ chối null hoặc không từ chối null nhưng chúng tôi không bao giờ chấp nhận null. Một lý do cho điều này là nếu chúng ta có thêm bằng chứng, kích thước hiệu ứng tương tự sẽ trở nên đáng kể.

Nhưng những gì xảy ra trong một bài kiểm tra không thua kém?

Đó là:

H0:μ1μ0x

so với

H1:μ1μ0>x

trong đó là một số lượng mà chúng ta coi là cơ bản giống nhau. Vì vậy, nếu chúng ta từ chối null, chúng ta nói rằng μ 1 lớn hơn μ 0 ít nhất là x . Chúng tôi không từ chối null nếu không có đủ bằng chứng. xμ1μ0x

Nếu kích thước hiệu ứng là hoặc lớn hơn, thì điều này tương tự với thử nghiệm t thông thường. Nhưng nếu kích thước hiệu ứng nhỏ hơn x trong mẫu chúng ta có thì sao? Sau đó, nếu chúng ta tăng kích thước mẫu và giữ nguyên hiệu ứng, nó sẽ không có ý nghĩa. Do đó, chúng ta có thể chấp nhận null trong trường hợp này không?xx


1
Là giả thuyết của bạn trộn lẫn? Thông thường, đối với thử nghiệm NI, giả thuyết null là sự khác biệt lớn hơn x, trong khi phương án thay thế là les hoặc bằng x. Tôi đoán nó phụ thuộc vào thứ tự thang điểm khác biệt của bạn.
Bjorn

Hi @ Bjorn nó sẽ phụ thuộc vào việc cao hơn là xấu hơn hay cao hơn là tốt hơn.
Peter Flom

1
Có giống như hỏi xem người ta có thể chấp nhận null trong các thử nghiệm một phía không? Có một số cuộc thảo luận về nó trong các bình luận cho thống kê.stackexchange.com/a/85914 .
amip

2
@amoeba Tôi nghĩ Peter đưa ra một lập luận hấp dẫn (+1), có lẽ gần giống với một nghịch lý. Một cách giải thích thông thường về lý do tại sao chúng ta không "chấp nhận H0" đôi khi nghe là "nếu chúng ta có thêm bằng chứng, kích thước hiệu ứng tương tự sẽ trở nên quan trọng". Nhưng theo logic đó như Peter làm, chúng ta sẽ đi đến kết luận rằng trong một số tình huống chúng ta nên "chấp nhận H0", hoặc nếu chúng ta không, "lý do" đó thực sự sai, và tại sao chúng ta không làm điều đó. Tôi tin rằng bạn đã đúng - lập luận của anh ấy cũng sẽ áp dụng cho các thử nghiệm t một phía, vì kích thước hiệu ứng âm vẫn không đáng kể khi n tăng
Silverfish

1
Có, tôi đồng ý: câu trả lời được liên kết không trả lời câu hỏi của bạn. Tôi chỉ cung cấp các liên kết vì có một cuộc thảo luận liên quan trong các ý kiến ​​ở đó.
amip

Câu trả lời:


7

x=0H0:μ0μμ

H0:μ0

  1. (1α)100%μ

  2. H1

  3. H0H1

Vì vậy, tôi sẽ nói rằng trong các tình huống một chiều, người ta có thể chấp nhận null, vâng. Nhưng chúng tôi không thể chấp nhận nó đơn giản vì chúng tôi đã không từ chối nó; Có ba khả năng chứ không phải hai.

(Chính xác là áp dụng tương tự cho các thử nghiệm tương đương hay còn gọi là "hai thử nghiệm một phía" (TOST), các thử nghiệm không kém, v.v. Người ta có thể từ chối null, chấp nhận null hoặc có được kết quả không xác định.)

H0H0:μ=0H1:μ0

μH0:μ=0H1:μZ,μ0


Vấn đề này đã được thảo luận cách đây một thời gian trong các bình luận dưới câu trả lời của @ gung tại đây: Tại sao các nhà thống kê nói rằng một kết quả không quan trọng có nghĩa là "bạn không thể từ chối null" trái ngược với việc chấp nhận giả thuyết null?

Xem thêm một chủ đề thú vị (và được bình chọn thấp) Không từ chối null trong cách tiếp cận Neyman-Pearson có nghĩa là người ta nên "chấp nhận" nó? , trong đó @Scortchi giải thích rằng trong khuôn khổ Neyman-Pearson, một số tác giả không có vấn đề gì khi nói về việc "chấp nhận null". Đó cũng là ý nghĩa của @Alexis trong đoạn cuối câu trả lời của cô ấy ở đây.


(1α)μ0α2(1α)μ>0α2α2

αμ=0

Cảm ơn @Scortchi. Bằng cách nào đó tôi không hoàn toàn chắc chắn nếu bạn đồng ý hay không đồng ý với câu trả lời của tôi.
amip

μ0

@Scortchi Cú pháp của câu cuối cùng của bạn khá phức tạp: chính xác những gì có thể (hoặc không thể) được kết hợp và chính xác sự khác biệt là gì? Tôi không chắc chắn tôi hiểu bạn chính xác, xin lỗi.
amip

6

H0H0H0HAHAHAH0

HA

H0H0HAH0+H0

Đối với tôi, dường như không có lý do nào khiến bạn không thể kết hợp suy luận từ thử nghiệm một phía về sự thấp kém với thử nghiệm một phía để không thua kém để cung cấp bằng chứng (hoặc thiếu bằng chứng) theo cả hai hướng.

H0δH0


1
Câu hỏi của Peter có một điểm đặc biệt thú vị mà câu trả lời này dường như xoay quanh: rằng một trong những giải thích thông thường được đưa ra về thuật ngữ "không từ chối H0" là ví dụ trong bài kiểm tra t, nếu chúng tôi có thêm bằng chứng, thì hiệu quả tương tự kích thước sẽ trở nên quan trọng. Nhưng nếu đây là lý do "thực sự" mà chúng tôi "không từ chối", thì lập luận của anh ấy rằng chúng tôi có thể "chấp nhận H0" trong trường hợp anh ấy vạch ra (ít nhất là với tôi) là một người mạnh mẽ - mặc dù tôi không chắc là tôi Tôi đã thấy nó được thực hiện khác hơn là tình cờ, như một loại tiếng lóng thống kê, thay vì có chủ ý và có chủ ý.
Cá bạc

1
Câu trả lời này khôi phục vị trí thông thường về "chấp nhận H0" theo cách tốt đẹp, rõ ràng, cô đọng nhưng dường như không trực tiếp giải quyết tranh luận (hoặc có lẽ là nghịch lý) ở trung tâm câu hỏi của Peter. Bạn nghĩ gì về "chúng tôi không thể chấp nhận H0 bởi vì nếu chúng tôi có thêm bằng chứng, kích thước hiệu ứng tương tự sẽ trở nên quan trọng" đối với thuật ngữ thông thường - có một số lỗ hổng trong cách trình bày hoặc mở rộng của Peter, hoặc là logic của đối số ban đầu không hợp lệ ở vị trí đầu tiên?
Cá bạc

1
@Silverfish theo liên kết trong câu trả lời của tôi với "các thử nghiệm liên quan" để khuếch đại thêm độ phân giải quan trọng của tôi đối với vấn đề "chúng tôi không thể chấp nhận H0 vì nếu chúng tôi có thêm bằng chứng, kích thước hiệu ứng tương tự sẽ trở nên quan trọng"
Alexis

1
@Alexis Tôi phải đồng ý với Silverfish. Tôi đánh giá cao câu trả lời của bạn, nhưng nó không giải quyết được điểm trung tâm của tôi, vì lý do Silverfish được nêu ra. Nếu chúng ta có N = 1.000.000 thì khá nhiều sự khác biệt sẽ có ý nghĩa trong cài đặt tiêu chuẩn. Nhưng trong trường hợp không xấu, điều đó không phải vậy. Và ngay cả trong TOST hai mặt, nó không phải như vậy. Nếu chênh lệch nhỏ hơn số tiền chúng tôi cho là quan trọng, thì không có N sẽ làm cho nó sig.
Peter Flom

1
Lời xin lỗi - bình luận đầu tiên của tôi chỉ nhằm mục đích mở đầu cho lần thứ 2 (hay chính xác hơn, lần thứ 2 là tràn phần 1!) Và không có ý định đưa ra quan điểm tự do của riêng mình. Các liên kết là hữu ích, cảm ơn. Điểm trung tâm của bạn (mà bạn đặt rất độc đáo, cả trong câu trả lời và sự nghỉ ngơi của bạn) giải thích rõ ràng lý do tại sao bạn không đồng ý với kết luận của Peter . Nhưng tôi tò mò nơi bạn cảm thấy lỗ hổng nằm trong logic của anh ấy - hoặc có lẽ là tiền đề của nó . Đây là một chút mà tôi cảm thấy không được giải quyết trực tiếp.
Cá bạc
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.