Trong khi học cho khóa học thống kê của mình, tôi đã cố gắng tìm hiểu sự khác biệt giữa các bài kiểm tra giả thuyết một đuôi và hai đuôi. Cụ thể, tại sao thử nghiệm một đuôi lại từ chối null trong khi thử nghiệm hai đuôi thì không?
Một ví dụ:
Trong khi học cho khóa học thống kê của mình, tôi đã cố gắng tìm hiểu sự khác biệt giữa các bài kiểm tra giả thuyết một đuôi và hai đuôi. Cụ thể, tại sao thử nghiệm một đuôi lại từ chối null trong khi thử nghiệm hai đuôi thì không?
Một ví dụ:
Câu trả lời:
Một thử nghiệm hai đuôi kiểm tra sự khác biệt theo một trong hai hướng. Do đó, giá trị P sẽ là khu vực dưới phân phối t ở bên phải của t = 1,92 PLUS khu vực dưới phân phối ở bên trái của t = -1,92. Đó là diện tích gấp đôi so với thử nghiệm một đầu và vì vậy giá trị P lớn gấp đôi.
Nếu bạn sử dụng thử nghiệm một đuôi, bạn có được sức mạnh, nhưng với chi phí tiềm năng là phải bỏ qua một sự khác biệt theo hướng ngược lại với giả thuyết đó trước khi có được dữ liệu. Nếu bạn có được dữ liệu trước khi chính thức hóa và ghi lại giả thuyết, bạn thực sự nên sử dụng thử nghiệm hai đuôi. Tương tự, nếu bạn quan tâm đến hiệu ứng theo một trong hai hướng bạn sử dụng thử nghiệm hai đuôi. Trên thực tế, bạn có thể muốn sử dụng thử nghiệm hai đuôi làm phương pháp mặc định của mình và chỉ sử dụng thử nghiệm một đầu trong trường hợp bất thường khi hiệu ứng chỉ có thể tồn tại theo một hướng.
Vùng bên dưới đường cong không lớn gấp đôi đối với thử nghiệm hai đuôi: Đối với thử nghiệm hai đuôi có p = 0,05 quan trọng, bạn đang kiểm tra tần suất dữ liệu quan sát có thể được rút ra từ mức thấp hơn hoặc trên 2,5% của phân phối null ( 0,05 trong tổng số). Với thử nghiệm 1 đuôi, bạn đang kiểm tra tần suất dữ liệu đến từ đuôi 5% cực đoan của một đuôi (được chỉ định trước).
Một phần câu trả lời cho câu hỏi của bạn là một trong những thực tiễn: Hầu hết các nhà nghiên cứu xem các thí nghiệm báo cáo các thử nghiệm 1 đuôi là không thể sao chép (nghĩa là, họ cho rằng nhà nghiên cứu đã chọn điều này để làm cho số liệu thống kê của họ là "đáng kể").
Tuy nhiên, có những trường hợp sử dụng hợp lệ. Nếu bạn biết rằng bất kỳ kết quả nào theo hướng ngược lại là không thể theo lý thuyết đang được thử nghiệm, thì, như một nhận xét trước đó đã lưu ý, bạn có thể chỉ định điều này trước thời hạn và tiến hành kiểm tra 1 đuôi. Hầu hết mọi người, một lần nữa, vẫn sẽ xem xét chu vi này.
Điều này dẫn đến câu hỏi: tại sao sử dụng số liệu thống kê kiểm tra khác nhau? Lý do là các lựa chọn thay thế là khác nhau và do đó sức mạnh của mỗi thống kê kiểm tra là khác nhau. Cụ thể, sức mạnh của mỗi thử nghiệm bị giảm (miễn là chúng tôi sử dụng cùng một ý nghĩa) nếu chúng tôi sử dụng vùng thống kê và loại bỏ thử nghiệm từ thử nghiệm khác.