Các xác suất của lỗi loại I và II có tương quan nghịch không?


11

Trong một lớp thống kê cơ bản mà tôi là TA, giáo sư nói rằng xác suất của lỗi loại I tăng , xác suất xảy ra lỗi loại II giảm và điều ngược lại cũng đúng. Vì vậy, điều này gợi ý cho tôi rằng .β ρ alpha , β < 0αβρα,β<0

Nhưng làm thế nào người ta sẽ chứng minh điều này cho một bài kiểm tra giả thuyết chung? Là tuyên bố thậm chí đúng nói chung?

Tôi có thể thử một trường hợp cụ thể (giả sử và ) nhưng rõ ràng, điều đó không đủ chung để xử lý câu hỏi này.H 1 : μ < μ 0H0:μ=μ0H1:μ<μ0

Câu trả lời:


13

Các đại lượng này ( và ) không phải là các biến ngẫu nhiên, vì vậy tôi ngần ngại nói về mối tương quan Pearson của chúng; Tôi không chắc theo nghĩa nào sẽ áp dụng.betaαβ

Hai cái này có liên quan tiêu cực theo nghĩa, nói một cách hợp lý (nhưng xem bên dưới *) - và giữ những thứ khác (như cỡ mẫu và kích thước hiệu ứng mà bạn tính ) bằng nhau - nếu bạn thay đổi , thì sẽ di chuyển theo hướng ngược lại (cụ thể, trong các tình huống điển hình, là một hàm của ; chỉ định đủ số lượng để xác định và nó sẽ phụ thuộc vào - và trong mối quan hệ hợp lý nhất - loại bạn sẽ 'Muốn sử dụng trong một thử nghiệm thực tế - bị phụ thuộc tiêu cực).alpha beta beta alpha beta alphaβαββαβα

Hãy xem xét, ví dụ, một số đường cong sức mạnh. Di chuyển sẽ đẩy đường cong công suất ( ) lên hoặc xuống với nó, vì vậy tại một số điểm trên đường cong (là khoảng cách giữa đường cong và 1) giảm khi tăng. Đây là một ví dụ với bài kiểm tra hai đuôi (giả sử bài kiểm tra t).1 - beta beta αα1ββα

nhập mô tả hình ảnh ở đây

Trường hợp một đuôi cũng tương tự, nhưng bạn tập trung vào nửa bên phải của hình trên (hai đường cong ở nửa bên trái của hình sẽ kéo xuống 0)


* có một số tình huống trong đó không phải là trường hợp này. Xem xét thử nghiệm cho đồng phục (0,1) thông qua thử nghiệm Kolmogorov-Smirnov.

Chúng ta hãy xem xét khả năng thay vì chúng ta có một bộ đồng phục trên (hoặc thực tế, bất kỳ phân phối nào có xác suất nằm ngoài khoảng đơn vị).(0,1+ϵ)

Nếu tôi quan sát một giá trị không nằm trong (0,1), thử nghiệm Kolmogorov-Smirnov không nhất thiết phải từ chối null. Nhưng tôi có thể thực hiện thử nghiệm thứ hai, (hãy gọi nó là thử nghiệm KS *), giống như Kolmogorov-Smirnov, ngoại trừ khi chúng tôi quan sát một giá trị bên ngoài (0,1), chúng tôi cũng từ chối null cho dù thống kê thông thường hay không đạt đến giá trị tới hạn

Sau đó, đối với bất kỳ giải pháp thay thế nào có xác suất bên ngoài (0,1), chúng tôi đã giảm tỷ lệ lỗi Loại II (từ đó đối với thử nghiệm KS thông thường) mà không thay đổi .α

(thường không phải là một ý tưởng tuyệt vời để sử dụng một KS trong trường hợp đó, vì vậy nếu bạn biết đó là một khả năng, bạn cần suy nghĩ cẩn thận về các lựa chọn thay thế)


3

Đặt biểu thị quan sát với mật độ hoặc theo Giả thuyết hoặc là đúng. Đặt và biểu thị các vùng quyết định . Do đó, , và quyết định là là đúng iff . Sau đó, xác suất lỗi Loại I và Loại II là Xf0(x)f1(x)H0H1Γ0Γ1Γ0Γ1=Γ0Γ1=RHiXΓi

(1)P(Type I error)=Γ1f0(x)dx(2)P(Type II error)=Γ0f1(x)dx.
Hãy xem xét hai khác vùng quyết định và như vậy và . Bây giờ, vì tích phân nằm trên một tập lớn hơn, có nghĩa là quy tắc quyết định mới có xác suất lỗi Loại I lớn hơn. Nhưng cũng lưu ý rằng vì tích phân nằm trên một tập nhỏ hơn và vì vậy quy tắc quyết định mới có xác suất lỗi Loại II nhỏ hơn.Γ0Γ1Γ1Γ1Γ0Γ0
Γ1f0(x)dxΓ1f0(x)dx
Γ0f1(x)dxΓ0f1(x)dx

1

Mối quan hệ bạn đang xem xét giữa và là đúng đối với hoạt động mà họ dự định nghĩ đến lúc đó: điều chỉnh giá trị quan trọng bạn sử dụng để chấp nhận hoặc từ chối giả thuyết. Nếu bạn làm cho việc đạt được kết quả dương tính giả trở nên khó khăn hơn, thì tự nhiên bạn phải làm cho việc đạt được kết quả âm tính giả dễ dàng hơn. Trang web này hiển thị mối quan hệ giữa và bằng đồ họa.αβαβ

Mối quan hệ không đúng với mọi hoạt động. Một ví dụ rõ ràng, nếu bạn tăng số lượng mẫu trong thử nghiệm của mình, bạn có thể giảm đồng thời và . Mối quan hệ chỉ được đảm bảo khi bạn điều chỉnh các giá trị quan trọngbetaαβ


1
"Mối quan hệ là duy nhất" - có vẻ như phần cuối câu trả lời của bạn đã bị cắt đứt?
Cá bạc
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.