Các kết nối giữa (d-Prime) và AUC (Vùng bên dưới đường cong ROC); các giả định cơ bản


13

Trong học máy, chúng ta có thể sử dụng vùng bên dưới đường cong ROC (thường được viết tắt là AUC hoặc AUROC) để tóm tắt mức độ mà một hệ thống có thể phân biệt giữa hai loại. Trong lý thuyết phát hiện tín hiệu thường, (chỉ số độ nhạy) được sử dụng cho mục đích tương tự. Hai người có mối liên hệ chặt chẽ và tôi tin rằng họ tương đương với nhau nếu những giả định nhất định được thỏa mãn .d

Tính toán thường được trình bày dựa trên giả định các phân phối bình thường cho các phân phối tín hiệu (ví dụ, xem liên kết wikipedia ở trên). Tính toán đường cong ROC không đưa ra giả định này: nó có thể áp dụng cho bất kỳ phân loại nào đưa ra tiêu chí quyết định có giá trị liên tục có thể được ngưỡng.d

Wikipedia nói rằng tương đương với . Điều này có vẻ đúng nếu các giả định của cả hai đều hài lòng; nhưng nếu các giả định không giống nhau thì đó không phải là một sự thật phổ quát.d2AUC1

Có công bằng khi mô tả sự khác biệt trong các giả định vì "AUC tạo ra ít giả định hơn về các phân phối cơ bản" không? Hoặc là thực sự chỉ được áp dụng rộng rãi như AUC, nhưng đó chỉ là thực tế phổ biến mà mọi người sử dụng có xu hướng sử dụng phép tính giả định các phân phối bình thường? Có sự khác biệt nào khác trong các giả định cơ bản mà tôi đã bỏ lỡ không?dd

Câu trả lời:


7

Không. Giá trị tối đa của AUC là 1. d 'không có giá trị tối đa.

Tôi tin rằng d 'bằng với qnorm (AUC) * sqrt (2) (bộ nhớ của tôi về một cuốn sách thống kê cũ mà tôi không thể tìm thấy ngay bây giờ nhưng dường như kiểm tra một số dữ liệu tôi tìm thấy trên web). Ở đây qnorm (x) là "hàm lượng tử cho phân phối chuẩn" (R-speak). Nghĩa là, nó trả về giá trị của phân phối bình thường mà x tỷ lệ phân phối nằm dưới nó.


2
Cảm ơn, điều này nghe có vẻ đúng với tôi - tuy nhiên, chỉ khi chúng tôi giả sử các bản phân phối là bình thường (vì sử dụng qnorm ()). Tôi đã sửa từ ngữ wikipedia.
Dan Stowell
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.