Tại sao giả thuyết hồi quy logistic được xem như là một hàm xác suất?
Tôi hiểu rằng chúng ta sử dụng nó để dự đoán 0 hoặc 1, nhưng tại sao một hàm (giả thuyết) đưa ra các số từ 0 đến 1 có thể được coi là hàm xác suất?
Đây có phải là một heuristic?
Tại sao giả thuyết hồi quy logistic được xem như là một hàm xác suất?
Tôi hiểu rằng chúng ta sử dụng nó để dự đoán 0 hoặc 1, nhưng tại sao một hàm (giả thuyết) đưa ra các số từ 0 đến 1 có thể được coi là hàm xác suất?
Đây có phải là một heuristic?
Câu trả lời:
Không, nó không chỉ đơn thuần là một heuristic.
Hồi quy logistic là một trường hợp cụ thể của mô hình tuyến tính tổng quát (GLM), trong trường hợp này là một quá trình trong đó biến phản ứng có điều kiện Bernoulli (hay nói chung hơn là nhị thức ).
GLM bao gồm một đặc điểm kỹ thuật của một mô hình cho giá trị trung bình có điều kiện của đáp ứng. Trong trường hợp biến Bernoulli, giá trị trung bình có điều kiện của nó là tham số, đó rõ ràng là xác suất mà phản ứng, Là . Nó được mô hình hóa theo một hoặc nhiều dự đoán. Đây là mô hình có nghĩa là trung bình cho một người dự đoán,:
Vì vậy, nó (cố ý) là một mô hình cho xác suất phản hồi là, đưa ra giá trị của các yếu tố dự đoán.
Hình thức của chức năng liên kết (và nghịch đảo của nó ) cũng không phải là ngẫu nhiên - liên kết logit (chính là yếu tố làm cho nó hồi quy logistic) là chức năng liên kết tự nhiên (hoặc chính tắc ) cho phản hồi nhị thức. Các lựa chọn khác của chức năng liên kết là có thể (và chúng cũng sẽ là mô hình cho xác suất 1). Các lựa chọn phổ biến khác cho đáp ứng nhị thức là probit và log-log bổ sung nhưng cho đến nay logistic là phổ biến nhất.