AUC trong hồi quy logistic thường


9

Tôi đang sử dụng 2 loại hồi quy logistic - một là loại đơn giản, để phân loại nhị phân và loại còn lại là hồi quy logistic thông thường. Để tính toán độ chính xác của lần đầu tiên, tôi đã sử dụng xác nhận chéo, trong đó tôi đã tính AUC cho mỗi lần gấp và hơn là tính AUC trung bình. Làm thế nào tôi có thể làm điều đó cho hồi quy logistic thường? Tôi đã nghe nói về ROC tổng quát cho các dự đoán đa lớp, nhưng tôi không chắc cách tính nó.

Cảm ơn!


1
không phải AUC nhưng có liên quan: trên các đường cong thu hồi chính xác vi mô / vĩ mô tại stats.stackexchange.com/questions/21551/iêu
Yevgeny

Câu trả lời:


4

Tôi chỉ thích khu vực dưới đường cong ROC ( -index) bởi vì nó là một xác suất phù hợp. là một khối xây dựng của các hệ số tương quan xếp hạng. Ví dụ: Bolog ' . Đối với thứ tự , là một thước đo tuyệt vời của phân biệt dự đoán và gói R cung cấp các cách dễ dàng để có được các ước tính sửa lỗi quá mức của bootstrap của . Bạn có thể sao lưu cho một -index tổng quát (AUROC tổng quát). Có nhiều lý do không phải xem xét từng cấp riêng vì đây không khai thác bản chất thứ tự của .ccDxy=2×(c12)YDxyrmsDxycYY

Trong rmsđó có hai hàm cho hồi quy thứ tự: lrmorm, hàm sau xử lý liên tục và cung cấp nhiều họ phân phối (hàm liên kết) hơn tỷ lệ cược tỷ lệ.Y


Vấn đề chính sẽ là làm thế nào để rms tính toán được sử dụng trong của Sommer ? cindexDxy
Chamberlain Foncha

1
Nó được đánh vần là của Somer . -index tổng quát được tính đơn giản bằng cách đảo ngược phương trình tôi liệt kê ở trên. Nội bộ, tất cả các kết hợp quan sát có thể có các giá trị khác nhau đều được kiểm tra và tỷ lệ các cặp như vậy có dự đoán theo cùng một thứ tự là ước tính xác suất phù hợp. Tôi đã nói sai một điều: Hàm sử dụng của Spearman thay vì . cYormρDxy
Frank Harrell

Cảm ơn đã sửa lỗi chính tả. Trong hồi quy thứ tự, sẽ thú vị hơn nhiều khi không chỉ nhìn vào thứ tự cặp như được thực hiện trong hàm orm mà bạn đã đề cập, mà còn xem xét thứ tự nhất quán (với các toán tử ternary hoặc cao hơn) tùy thuộc vào số lượng lớp bạn có. Tóm lại những gì tôi đang nói là: với một hồi quy logistic tích lũy được trang bị chẳng hạn, việc sắp xếp các lớp được quan tâm trong mô hình. Một biện pháp dự đoán cũng không thể thực hiện so sánh cặp mà so sánh mẫu $ P (pre_1 <pre_2 <pre_3 | obs_1 <obs_2 <oP(pred1<pred2|obs1<obs2)
Chamberlain Foncha

Không biết về các biện pháp như vậy, phản ứng đầu tiên của tôi là họ đang đặt một thanh cao để vượt rào.
Frank Harrell

1

AUC cho hồi quy thứ tự là một cái gì đó khó khăn. Bạn có thể muốn tính AUC cho mỗi lớp bằng cách tạo các giá trị giả để lấy giá trị 1 cho lớp bạn đang tính AUC và 0 cho các lớp còn lại. Nếu bạn có 4 lớp thì bạn sẽ tạo 4 AUC và vẽ chúng trên cùng một biểu đồ. Vấn đề chính của phương pháp này là thực tế là nó phạt phân loại sai như nhau. Trực giác hơn nhiều - việc phân loại một lớp 1 vào lớp 3 sẽ tệ hơn so với việc bỏ lỡ lớp 1 vào lớp 2.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.