Tại sao hồi quy logistic tạo ra các mô hình hiệu chuẩn tốt?


13

Tôi hiểu rằng một trong những lý do hồi quy logistic thường được sử dụng để dự đoán tỷ lệ nhấp trên web là vì nó tạo ra các mô hình được hiệu chỉnh tốt. Có một lời giải thích toán học tốt cho điều này?


2
hồi quy logistic được thực hiện để dự đoán xác suất -> dẫn đến dự đoán được hiệu chỉnh nếu không phù hợp. trong khi hầu hết các mô hình học máy không dự đoán xác suất, mà là một lớp học - và có một số mâu thuẫn với các xác suất giả xuất phát từ các dự đoán này -> do đó lưu ý hiệu chỉnh tốt
charles

2
Tôi nên đã làm rõ trong câu hỏi, nhưng câu hỏi của tôi là về lý do tại sao đó là trường hợp mà LR rất hữu ích để dự đoán xác suất.
lsankar4033

Điều đáng chú ý là bạn có thể chỉ cần phù hợp với hồi quy logistic với đầu ra của bộ phân loại hiệu chuẩn kém để có được một mô hình hiệu chuẩn. Đây được gọi là Platt
Scaleing

Câu trả lời:


14

Đúng.

Vectơ xác suất dự đoán từ hồi quy logistic thỏa mãn phương trình ma trậnp

Xt(py)=0

Trong đó là ma trận thiết kế và là vectơ đáp ứng. Điều này có thể được xem như là một tập hợp các phương trình tuyến tính, một phát sinh từ mỗi cột của ma trận thiết kế .y XXyX

Chuyên về cột chặn (là một hàng trong ma trận chuyển vị), phương trình tuyến tính liên quan là

i(piyi)=0

do đó xác suất dự đoán trung bình tổng thể bằng trung bình của phản hồi.

Tổng quát hơn, đối với cột tính năng nhị phân , phương trình tuyến tính liên quan làxij

ixij(piyi)=ixij=1(piyi)=0

do đó tổng (và do đó trung bình) của các xác suất dự đoán bằng tổng của phản hồi, ngay cả khi chuyên về các bản ghi mà .xij=1


1
@MatthewDrury làm thế nào tôi có thể giải thích phương trình đầu tiên của bạn? là có dạng ? Tuy nhiên mối quan hệ tuyến tính này nắm giữ? Cảm ơn bạn! 1 / ( 1 + exp ( - x ) )p1/(1+exp(x))
Ric

1
Có, p là hình thức đó. Phương trình đầu tiên xuất phát từ việc thiết lập đạo hàm của hàm mất thành không.
Matthew Drury

1
Điều này chỉ giải quyết hiệu chuẩn trong phạm vi lớn mà không phải là điều chúng ta muốn: hiệu chuẩn trong nhỏ.
Frank Harrell

1
@FrankHarrell Chăm sóc công phu? Tôi chưa từng nghe những điều khoản đó trước đây.
Matthew Drury

3
Có một lịch sử lâu dài trong các tài liệu dự báo xác suất có niên đại từ Dịch vụ thời tiết Hoa Kỳ 1950 - đó là điểm số Brier được sử dụng lần đầu tiên. Hiệu chuẩn nhỏ có nghĩa là nếu nhìn vào các rủi ro dự đoán là 0,01, 0,02, ..., 0,99, thì mỗi trường hợp này là chính xác, nghĩa là trong tất cả các lần khi rủi ro dự đoán là 0,4, kết quả xảy ra khoảng 0,4 thời gian. Tôi gọi "hiệu chuẩn trong nhỏ" là bước tiếp theo: đối với nam giới trong đó dự đoán là 0,4 là kết quả hiện tại 0,4 của thời gian, sau đó đối với nữ.
Frank Harrell

2

Tôi nghĩ rằng tôi có thể cung cấp cho bạn một lời giải thích dễ hiểu như sau:

Chúng ta biết rằng hàm mất của nó có thể được biểu thị dưới dạng hàm sau: Trong đó biểu thị số lượng của tất cả các mẫu đào tạo, nhãn của mẫu thứ i, xác suất dự đoán của mẫu thứ i: . (chú ý sự thiên vị ở đây)

J(θ)=1mi=1m[y(i)log(hθ(x(i)))+(1y(i))log(1hθ(x(i)))]

my(i)hθ(x(i))11+exp[αjθjxj(i)]α

Vì mục tiêu của đào tạo là để giảm thiểu chức năng mất, chúng ta hãy đánh giá đạo hàm riêng của nó đối với từng tham số (có thể tìm thấy đạo hàm chi tiết ở đây ): Và đặt nó thành 0 yeils:θj

J(θ)θj=1mi=1m[hθ(x(i))y(i)]xj(i)


i=1mhθ(x(i))xj(i)=i=1my(i)xj(i)

Điều đó có nghĩa là nếu mô hình được đào tạo đầy đủ, các xác suất dự đoán mà chúng tôi nhận được cho tập huấn sẽ tự trải rộng sao cho mỗi tính năng tổng của các giá trị trọng số (tất cả) của tính năng đó bằng tổng giá trị của tính năng đó của các mẫu dương tính.

Ở trên phù hợp với mọi tính năng để thiên vị . Đặt là 1 và là yeilds: Sau đó, chúng tôi nhận được: Trong đó là xác suất dự đoán của mô hình được đào tạo đầy đủ cho mẫu thứ i. Và chúng ta có thể viết hàm theo cách rút gọn: αx0αθ0

i=1mhθ(x(i))x0(i)=i=1my(i)x0(i)
i=1mhθ(x(i))=i=1my(i)
hθ(x(i))
i=1mp(i)=i=1my(i)

Rõ ràng chúng ta có thể thấy rằng hồi quy logistic được hiệu chỉnh tốt.

Tham khảo: Mô hình log-linear và Trường ngẫu nhiên có điều kiện của Charles Elkan

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.