Liệu một hồi quy logistic tối đa hóa khả năng cũng nhất thiết phải tối đa hóa AUC trên các mô hình tuyến tính?


13

Cho một tập dữ liệu với kết quả nhị phân y{0,1}n và một số ma trận dự đoán XRn×p , mô hình hồi quy logistic tiêu chuẩn ước tính các hệ số βMLE để tối đa hóa khả năng nhị thức. Khi X đầy đủ thứ hạng βMLE là duy nhất; khi sự tách biệt hoàn hảo không có mặt, nó là hữu hạn.

Liệu mô hình khả năng tối đa này cũng tối đa hóa Trung Hoa Dân Quốc AUC (aka c -statistic), hoặc không có tồn tại một số ước tính hệ số βAUCβMLE mà sẽ có được một cao hơn ROC AUC? Nếu đúng là MLE không nhất thiết phải tối đa hóa ROC AUC, thì một cách khác để xem xét câu hỏi này là "Có cách nào khác để tối đa hóa khả năng sẽ luôn tối đa hóa ROC AUC của hồi quy logistic không?"

Tôi giả sử rằng các mô hình giống nhau: chúng tôi không thêm hoặc xóa các yếu tố dự đoán trong X hoặc thay đổi đặc điểm kỹ thuật mô hình và tôi giả định rằng các mô hình tối đa hóa và tối đa hóa AUC đang sử dụng cùng một chức năng liên kết.


2
Chắc chắn nếu, ví dụ, một số chức năng liên kết tạo ra một sự phù hợp tốt hơn so với một logit? Ngoài ra, câu hỏi hay, nếu quá trình tạo dữ liệu có thể được coi là logit. βAUCβMLE
Nutle

Câu hỏi hay nhưng hãy xem xét điều này. ROC và AUC được sử dụng để so sánh hai mô hình khác nhau, vì vậy nếu một giải pháp cho ước tính MLE của bất kỳ mô hình nào là duy nhất, điều này có nghĩa là bạn chỉ có thể nhận được AUC khác nhau nếu bạn thay đổi đặc điểm kỹ thuật của mô hình hiện tại và bạn ước tính một mô hình mới khác mô hình thông qua MLE. Vì vậy, tại thời điểm này, một câu hỏi khác sẽ là: có phương pháp ước tính nào khác tốt hơn (thuật toán tối đa hóa ecc) khác với MLE đơn giản áp dụng cho cùng một mô hình để tôi có được các ước tính khác nhau về các hệ số dẫn đến betas mới tốt hơn với AUC cao hơn?
Fr1

@Nutle chính xác, đó sẽ là một đặc điểm kỹ thuật khác
Fr1

@ Fr1 Vâng, đó là những gì độc đáo có nghĩa. Điều tôi ngụ ý trong câu hỏi của mình là một cái gì đó như "nếu có một sự thay thế nào đó cho MLE đạt được AUC cao hơn thì sao?" Nếu đúng là có một mô hình tuyến tính khác (một mô hình khác với MLE) đạt được AUC cao hơn, thì đó sẽ là điều thú vị để biết.
Sycorax nói Phục hồi lại

1
@Sycorax chúng ta giả định điều gì khác? :) Giả định rất quan trọng, vì nếu chúng ta biết DGP thực sự với liên kết và các biến được sử dụng, MLE là thống kê không thiên vị mạnh mẽ nhất.
Nutle

Câu trả lời:


11

Nó không phải là trường hợp đó βMLE=βAUC .

Để minh họa điều này, hãy xem xét rằng AUC có thể được viết là

P(y^1>y^0|y1=1,y0=0)

Nói cách khác, thứ tự của các dự đoán là điều duy nhất ảnh hưởng đến AUC . Đây không phải là trường hợp với chức năng khả năng. Vì vậy, như một bài tập tinh thần, giả sử chúng ta có một dự đoán duy nhất và trong tập dữ liệu của chúng ta, chúng ta không thấy sự tách biệt hoàn hảo (nghĩa là βMLE là hữu hạn). Bây giờ, nếu chúng ta chỉ cần lấy giá trị của công cụ dự đoán lớn nhất và tăng nó lên một lượng nhỏ, chúng ta sẽ thay đổi khả năng của giải pháp này, nhưng nó sẽ không thay đổi AUC, vì thứ tự sẽ giữ nguyên. Do đó, nếu MLE cũ tối đa hóa AUC, nó vẫn sẽ tối đa hóa AUC sau khi thay đổi bộ dự đoán, nhưng sẽ không còn tối đa hóa khả năng.

Như vậy, ít nhất, nó không phải là trường hợp đó βAUC không phải là độc đáo; bất kỳ β rằng bảo tồn thứ tự của các ước tính đạt cùng AUC chính xác. Nói chung, kể từ khi AUC là nhạy cảm với các khía cạnh khác nhau của dữ liệu, tôi sẽ tin rằng chúng ta sẽ có thể tìm thấy một trường hợp βMLE không tối đa hóa βAUC . Trên thực tế, tôi mạo hiểm đoán rằng điều này xảy ra với xác suất cao.

EDIT (chuyển bình luận thành câu trả lời)

Bước tiếp theo là chứng minh rằng MLE không nhất thiết phải tối đa hóa AUC (chưa được chứng minh). Người ta có thể làm điều này bằng cách lấy một cái gì đó giống như dự đoán 1, 2, 3, 4, 5, 6, x (với x>6 ) với kết quả 0, 0, 0, 1, 1, 1, 0. Bất kỳ giá trị tích cực của β sẽ tối đa hóa AUC (bất kể giá trị của x ), nhưng chúng ta có thể chọn một x đủ lớn để βMLE<0 .


1
(+1) À! Tất nhiên - vì đó là về việc đặt hàng, chúng tôi có thể tùy ý thay đổi phần chặn mà rõ ràng phải thay đổi giá trị khả năng, nhưng thứ tự phải giống nhau vì không có hệ số tính năng nào thay đổi, vì vậy AUC sẽ vẫn cố định.
Sycorax nói phục hồi Monica

+1. Liệu các chỉnh sửa ví dụ làm việc với , mặc dù? Nếu chúng ta cần lấy x đủ lớn để làm việc với n lớn , thì xác suất của các giá trị đó tồn tại có nhanh chóng hội tụ về 0 không, đối với một số logit cố định? nxn
Nutle

nnn

xn
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.