Tại sao các lỗi loại II không được nhấn mạnh nhiều trong tài liệu thống kê?


10

Tôi đã thấy nhiều trường hợp lỗi loại I được tính (biểu thị bằng giá trị alpha) trong các bài viết nghiên cứu khác nhau. Tôi đã thấy hiếm khi một nhà nghiên cứu sẽ xem xét sức mạnh, hoặc lỗi loại II.

Lỗi loại II có thể là một vấn đề lớn phải không? Chúng tôi đã vô tình bác bỏ giả thuyết thay thế khi nó thực sự sai. Tại sao các giá trị alpha được nhấn mạnh rất nhiều thay vì các giá trị beta?

Khi tôi lấy số liệu thống kê năm đầu tiên, tôi chưa bao giờ được dạy beta beta. Tôi cảm thấy rằng hai lỗi này nên được đối xử như nhau. Tuy nhiên, chỉ có alpha dường như được nhấn mạnh.


1
1 Nguyên nhân là do truyền thống, những sai lầm loại I (aka, hoặc mức ý nghĩa ) là cố định đầu tiên, và sau đó kiểm tra được xây dựng như để giảm thiểu các sai lầm loại II (tương đương, chẳng hạn như để phát huy tối đa sức mạnh). Một bài viết hữu ích trên wikipedia để hiểu vấn đề này là bài viết về các bài kiểm tra mạnh nhất (UMP), en.wikipedia.org/wiki/Uniformly_ ultra_powerful_testα
Jeremias K

3
Bạn đã sai về "chúng tôi đã chấp nhận giả thuyết khống" - chúng tôi không bao giờ chấp nhận nó. Chúng tôi hoặc "từ chối null hyp" hoặc "không từ chối null hyp", nhưng không bao giờ chấp nhận null hyp!
thượng cổ

nổ tung - lướt qua tôi. Cảm ơn đã chỉ ra rằng.

1
Hãy cẩn thận đừng nhầm lẫn kinh nghiệm của bạn với toàn bộ lĩnh vực tài liệu thống kê; bạn khó có thể suy ra nội dung của tài liệu bạn chưa đọc.
Glen_b -Reinstate Monica

@glen ngay. Một tiêu đề man rợ nhận được nhiều phản hồi.

Câu trả lời:


5

Đây là một câu hỏi hay. Hãy để tôi bắt đầu với một vài làm rõ:


Tôi nghĩ rằng bạn (không may) đúng rằng ít chú ý đến lỗi điện và loại II. Trong khi tôi nghĩ rằng tình hình đang được cải thiện trong nghiên cứu y sinh học (ví dụ, các cơ quan tài trợ và IRB thường yêu cầu phân tích sức mạnh bây giờ), tôi nghĩ có một vài lý do cho việc này:

  1. Tôi nghĩ sức mạnh của mọi người khó hiểu hơn ý nghĩa đơn giản. (Điều này một phần vì nó phụ thuộc vào rất nhiều ẩn số, đáng chú ý là kích thước hiệu ứng, nhưng cũng có những thứ khác).
  2. 0
  3. Theo truyền thống, các nhà khoa học cho rằng lỗi loại I tồi tệ hơn lỗi loại II.

1
Như mọi khi, khai sáng - đặc biệt là đối với người không bị toán học :-) ... Tôi thích cách diễn đạt này ... Tôi tự hỏi liệu bạn có thể mở rộng một chút về điểm thứ ba không ... Có cơ sở nào cho sự thiên vị này không. Tôi biết đó là sự thật, nhưng tại sao bạn nghĩ rằng đây là trường hợp ... Có phải vì đó là về chiếc cúp của giá trị p, và không có gì khác quan trọng?
Antoni Parellada

Cảm ơn, @AntoniParellada. Tôi sẽ suy nghĩ về những gì tôi có thể thêm.
gung - Phục hồi Monica

2
Tôi sẽ làm rõ điểm 3) tại sao các nhà khoa học nghĩ rằng lỗi loại I là tồi tệ hơn. Giả thuyết khống thường là một số loại "hiện trạng", ví dụ như tác dụng của loại thuốc hoàn toàn mới này là 0. Chúng tôi thích hiện trạng này và trách nhiệm chứng minh thuộc về nhà nghiên cứu để chứng minh điều khác. Vì vậy, chúng tôi muốn hạn chế lỗi Loại I, tức là chúng tôi từ chối sai hiện trạng. IMO, sự gắn bó với hiện trạng này chỉ là triết lý. Nếu bạn muốn thay đổi ý kiến ​​của tôi, bạn sẽ phải chứng minh điều đó.
Heisenberg

1
Trong thực tế, người ta có thể dễ dàng nghĩ đến các trường hợp lỗi loại II quan trọng hơn rất nhiều, tức là chi phí không từ chối null là cao. Ví dụ, nếu nhân loại đối mặt với đại dịch zombie, tôi chắc chắn thái độ sẽ là "thử bất kỳ loại thuốc nào ngay cả khi nó không hoạt động" thay vì "bạn phải chứng minh rằng nó hoạt động trước khi chúng ta sử dụng nó".
Heisenberg

Thêm vào @Heisenberg: Trong trường hợp lỗi loại II quan trọng nhất, người ta nên xem xét chuyển đổi giữa kiểm tra giả thuyết điểm và kiểm tra tương đương. Trong ví dụ của bạn, người ta sẽ phải chứng minh rằng nước sốt worcester được đề xuất ít nhất là không làm dịch bệnh zombie trở nên tồi tệ hơn. Sau đó, tỷ lệ lỗi thay đổi vai trò của họ và tỷ lệ lỗi quan trọng nhất được sửa lại bằng thiết kế. Ngoài ra, nếu bạn có một số ước tính chi phí cho các quyết định sai, bạn nên xem xét một quy tắc quyết định nhằm giảm thiểu rủi ro và không (nhất thiết) sửa một tỷ lệ lỗi loại I cụ thể.
Horst Grünbusch 17/03/2016

2

Lý do là đơn giản là chúng tôi không biết tỷ lệ lỗi loại II thực tế và chúng tôi sẽ không bao giờ làm thế. Nó phụ thuộc vào một tham số mà chúng ta thường không biết. Đổi lại, nếu chúng ta biết thông số này, chúng ta sẽ không cần thực hiện kiểm tra thống kê.

Tuy nhiên, chúng tôi có thể lập kế hoạch cho một thử nghiệm sao cho tỷ lệ lỗi loại II cụ thể được đáp ứng với một số thay thế là đúng. Bằng cách này, chúng tôi sẽ chọn kích thước mẫu không lãng phí tài nguyên: Cuối cùng vì thử nghiệm không từ chối hoặc vì kích thước mẫu nhỏ hơn nhiều sẽ đủ để từ chối giả thuyết.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.