Tại sao lỗi Loại II trong kiểm tra giả thuyết được coi là lỗi?


8

Tôi đang đọc về lỗi quyết định trong kiểm tra giả thuyết. Câu hỏi của tôi là tại sao một "lỗi loại II" được coi là một lỗi ở tất cả? Từ những gì tôi hiểu, nó phát sinh khi chúng ta không từ chối một giả thuyết null sai. Khi chúng ta không từ chối giả thuyết khống, điều đó chỉ có nghĩa là chúng ta không có bằng chứng mạnh mẽ để từ chối nó. Chúng tôi không đưa ra bất kỳ bình luận nào về giả thuyết nào trong hai giả thuyết là đúng (hoặc sai) có thể đúng. Chúng tôi không nói rằng giả thuyết null là đúng. Vì vậy, tại sao một kết luận như vậy được gọi là một lỗi?

Câu trả lời:


5

Đó là bởi vì chúng tôi không làm những gì chúng tôi phải làm khi giả thuyết thay thế là đúng. Ví dụ, chúng tôi không sử dụng loại thuốc mới thực sự tốt hơn loại thuốc hiện có nhưng chúng tôi không thể chứng minh được.


Theo logic này, việc không từ chối một giả thuyết null thực sự không nên là một tích cực thực sự. Nó sẽ là một lỗi vì chúng ta không làm những gì chúng ta phải làm khi giả thuyết null là đúng.
Sanket Kedia

1
Tại sao bạn lại nói vậy? Tất nhiên chúng tôi đang làm những gì chúng tôi phải làm khi giả thuyết null là đúng - chúng tôi đang tuân theo hành vi hiện tại, đó là điều đúng đắn để làm theo giả định của bạn rằng giả thuyết null là đúng.
Zahava Kor

Kết nối NHST với các hành động thường xảy ra, như Zahava Kor làm ở đây, dường như là cách đơn giản và trực tiếp nhất để đánh giá cao lỗi Loại II là "lỗi". Trong một số bối cảnh, chẳng hạn như phát triển thuốc mà Zahava Kor trích dẫn cụ thể, NHST được đưa vào trong một kế hoạch hành động sao cho kết quả epistemia của xét nghiệm xác định hành động. Liên quan đến y học nói chung, nó giúp đánh giá cao JAMA Sáu chữ nguy hiểm
David C. Norris

4

Cách chúng tôi muốn sử dụng từ "lỗi" cuối cùng là một vấn đề ngữ nghĩa và những người hợp lý có thể không đồng ý về việc, và theo nghĩa nào, chúng ta nên coi một phủ định sai là lỗi .

  • Một mặt, tôi nghĩ bạn đúng rằng một kết quả không đáng kể thực sự chỉ có nghĩa là chúng ta không có đủ thông tin để tin rằng giả thuyết null là sai và điều này không ngụ ý một cách hợp lý rằng giả thuyết null là đúng ( cf, Tại sao các nhà thống kê nói rằng một kết quả không đáng kể có nghĩa là bạn không thể từ chối null null trái ngược với việc chấp nhận giả thuyết null? ). Vì vậy, với mức độ tin cậy mà bạn yêu cầu trong tình huống và mức độ mơ hồ trong dữ liệu của mình, bạn đã đưa ra quyết định đúng theo nghĩa là đã áp dụng đúng quy tắc mà bạn đã quyết định.
  • Mặt khác, nếu bạn đặt mình vào vị trí của một người đang lên kế hoạch học tập. Họ muốn biết nếu null là sai. Nếu nó thực sự là sai, họ muốn bỏ đi sau khi nghiên cứu hoàn tất đã bác bỏ giả thuyết khống. Thay vào đó, họ sẽ vẫn chưa rõ về vấn đề này và có lẽ phải thiết kế và thực hiện một nghiên cứu khác. Từ quan điểm này, không từ chối một null sai chắc chắn là một kết quả tối ưu.

3
+1. Nhưng nó có thể thích hợp để đưa ra vấn đề của Fisher vs Neyman-Pearson tại đây (tôi sẽ liên kết với câu trả lời hay của riêng bạn về nó: stats.stackexchange.com/questions/23142 ). OP đang đặt câu hỏi trong mô hình Ngư dân. Nhưng lỗi Loại II là một khái niệm từ mô hình Neyman-Pearson. Do đó, tôi tin rằng, sự nhầm lẫn của OP.
amip

1

Từ 'thất bại' gần với 'lỗi'.

Đối với tôi, thuật ngữ lỗi có ý nghĩa vì bạn có thể tính xác suất xảy ra (với điều kiện bạn đặt kích thước hiệu ứng tối thiểu nhất định có thể mong muốn phát hiện). Và bạn muốn tính xác suất này trong các tình huống mà bạn muốn nó nhỏ. Trong những tình huống đó, sự thất bại sẽ được coi là một lỗi.

Đối với tôi nó rất đối xứng với lỗi loại I.

Giống như giá trị p, liên quan đến lỗi loại I, bạn cũng có thể tính xác suất để (giả mạo) không từ chối giả thuyết null. Đối với kích thước hiệu ứng nhất định và thử nghiệm đã cho (ví dụ: số lượng phép đo), bạn có thể tính toán với xác suất 'thất bại' này có thể xảy ra.

Những suy nghĩ này đòi hỏi bạn phải đặt ra một ranh giới cho giả thuyết khống.

Xu hướng không xem xét các lỗi loại II, hoặc ít nhất là cung cấp các giới hạn về kích thước hiệu ứng có thể được phát hiện với xác suất đủ, là lớn trong một thế giới khoa học bị ám ảnh bởi giá trị p, ý nghĩa và kiểm tra giả thuyết (nghịch đảo cũng xảy ra bằng cách nhấn mạnh vào các hiệu ứng nhỏ xảy ra là đáng kể, chỉ bằng một số lượng lớn các phép đo). Nếu lớn hơn một số thì hiệu ứng được nói / coi là không có mặt (hoặc thanh lịch hơn không được hiển thị để hiện diện). Bằng cách nào đó chắc chắn ảnh hưởng đến hành động trong tương lai của chúng tôi như thể chúng tôi chấp nhận các .α H 0pαH0


1
Trên thực tế, lỗi thực sự là làm kiểm tra giả thuyết.
Sextus Empiricus
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.