Tại sao tên Loại 1, 2 bị lỗi?


21

Động lực của việc giới thiệu một mức độ bổ sung bổ sung từ mô tả 'dương tính giả' sang số nguyên '1' là gì? Là "dương tính giả" thực sự quá dài?


10
Tôi với bạn, đó là một cái tên khủng khiếp. Tôi tận dụng mọi cơ hội để không sử dụng nó.
Matthew Drury

5
Tương tự. Tôi không bao giờ có thể nhớ được là đó, cho đến khi tôi nghe theo cách này vô cùng hữu ích để phân biệt chúng ... Trong những câu chuyện The Boy Who Cried Wolf , dân làng đầu tiên tạo ra một loại 1 lỗi, và thứ hai thời gian làm cho một tuýp 2 lỗi.
Sam

1
@Sam Tôi nhớ chúng như trong "Điều đầu tiên một nhà nghiên cứu làm sau khi phát hiện ra một hiệu ứng được công bố." Nhưng trên khung bên phải có một liên kết đến một câu hỏi với 84 câu hỏi về cách ghi nhớ chúng.
Vorac

Tôi luôn thấy "dương tính giả" và "âm tính giả" rất khó hiểu. Trong y học, 'dương tính' đề cập đến 'có tình trạng' (vốn đã gây nhầm lẫn và là nguồn gốc của nhiều câu chuyện cười) nhưng loại thử nghiệm (thống kê) nào được sử dụng để xác định bạn mắc bệnh? Kết quả dương tính, có điều kiện, bằng với xét nghiệm bị từ chối về sức khỏe (ví dụ: xét nghiệm mức độ khỏe mạnh của một số thành phần, ví dụ như sắt trong máu) hoặc bằng với xét nghiệm không bị từ chối về bệnh (ví dụ: xét nghiệm đánh dấu Điều đó chỉ ra bệnh, tình trạng, hoặc một cái gì khác như mang thai)? H0H0
Sextus Empiricus

Câu trả lời:


21

Câu hỏi tuyệt vời, đã thúc đẩy tôi đến Google nó :) Mỗi ​​Wikipedia (với các chỉnh sửa định dạng nhỏ):

Một lỗi loại I (hoặc lỗi của loại thứ nhất) là sự từ chối không chính xác của một giả thuyết null thực sự.

Một lỗi loại II (hoặc lỗi của loại thứ hai) là không từ chối một giả thuyết null sai.

Hơn nữa xuống trang nó thảo luận về từ nguyên:

Năm 1928, Jerzy Neyman (1894 Vang1981) và Egon Pearson (1895 Hóa1980), cả hai nhà thống kê nổi tiếng, đã thảo luận về các vấn đề liên quan đến "quyết định liệu một mẫu cụ thể có thể được đánh giá là có thể được rút ngẫu nhiên từ một dân số nhất định không "...

"... trong các giả thuyết thử nghiệm phải xem xét hai điều cần cân nhắc, (1) chúng ta phải có khả năng giảm cơ hội bác bỏ một giả thuyết thực sự xuống một giá trị thấp như mong muốn; sẽ bác bỏ giả thuyết được kiểm tra khi nó có khả năng là sai. "

Họ cũng lưu ý rằng, khi quyết định không từ chối hay từ chối một giả thuyết cụ thể nào trong số "các giả thuyết thay thế", , ,. . ., thật dễ dàng để gây ra lỗi:H1H2

"... [Và] những lỗi này sẽ có hai loại:

  • (I) chúng tôi từ chối [tức là giả thuyết cần kiểm tra] khi đó là sự thật H0
  • (II) chúng tôi không từ chối khi một số giả thuyết thay thế hoặc là đúng. "H0HAH1

    Trong cùng một bài báo họ gọi hai nguồn lỗi này, lỗi loại I và lỗi loại II tương ứng.

  • Vì vậy, có vẻ như loại lỗi đầu tiên được dựa trên công việc ban đầu của Fisher về thử nghiệm quan trọng. Loại lỗi thứ hai dựa trên công trình mở rộng của Fisher của Neyman và Pearson, cụ thể là giới thiệu giả thuyết thay thế và từ đó kiểm tra giả thuyết. Xem ở đây để biết thêm chi tiết.

    Dường như thứ tự các loại lỗi này được xác định tương ứng với số lượng của chúng, như được đưa ra bởi Neyman và Pearson.


    1
    Lý do lịch sử - không ngạc nhiên. Giống như <-các macro thay thế văn bản của R và C ++. Cảm ơn bạn đã trả lời câu hỏi nghiên cứu kém của tôi. Và cảm ơn @gung vì đã chỉnh sửa câu hỏi hay.
    Vorac

    3
    Không phải "thứ tự mà họ nghĩ về nó" bị ảnh hưởng mạnh mẽ bởi công việc trước đây của Fisher sao? tức là cho đến khi Neyman và Pearson đưa ra ý tưởng về một giả thuyết thay thế, chỉ có một "loại" lỗi (từ chối H_0 khi đó là sự thật). Cùng với H_A có khả năng xảy ra lỗi "loại thứ hai".
    Steeldo

    Tôi chắc chắn đó là.
    ilanman

    Một điểm nhỏ có thể tốt để thêm vào là bài viết năm 1928 "Về việc sử dụng và giải thích các tiêu chí kiểm tra nhất định cho mục đích suy luận thống kê" chưa xác định các nguồn lỗi khác nhau là lỗi 'loại I' và 'loại II' (thay vào đó là nói về loại được đặt hàng khi liên quan đến phân phối Pearson). Đó là vào năm 1933, Neyman và Pearson định nghĩa nó là loại I và loại II.
    Sextus Empiricus

    Nó cũng sẽ là tốt để làm thẳng trích dẫn với các tài liệu tham khảo chính xác. Hoặc ít nhất là trích dẫn đầu tiên "... trong thử nghiệm đưa ra giả thuyết hai điều cần cân nhắc ..." không có nghĩa đen từ bài báo năm 1928.
    Sextus Empiricus
    Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
    Licensed under cc by-sa 3.0 with attribution required.