Hành vi bạn đang quan sát là trường hợp "điển hình" trong hồi quy logistic, nhưng không phải lúc nào cũng đúng. Nó cũng giữ trong tính tổng quát hơn nhiều (xem bên dưới). Đó là hệ quả của sự hợp lưu của ba sự kiện riêng biệt.
- Sự lựa chọn mô hình hóa tỷ lệ cược log như là một hàm tuyến tính của các yếu tố dự đoán,
- Việc sử dụng khả năng tối đa để có được ước tính của các hệ số trong mô hình hồi quy logistic và
- Việc đưa vào một thuật ngữ chặn trong mô hình.
Nếu bất kỳ một trong những điều trên không có mặt, thì nói chung, xác suất trung bình ước tính sẽ không khớp với tỷ lệ của những cái trong mẫu.
Tuy nhiên, (gần như) tất cả các phần mềm thống kê sử dụng ước tính khả năng tối đa cho các mô hình như vậy, vì vậy, trong thực tế, các mục 1 và 2 về cơ bản luôn luôn có mặt và mục 3 thường có mặt, trừ trường hợp đặc biệt.
Một số chi tiết
Trong khuôn khổ hồi quy logistic điển hình, chúng tôi quan sát kết quả của các thử nghiệm nhị thức độc lập với xác suất . Hãy để y i là phản ứng quan sát được. Sau đó, tổng khả năng là
L = n Π i = 1 p y i i ( 1 - p i ) 1 - y i = n Π i = 1 exp ( y i log ( p i / ( 1 - p ipTôiyTôi
Và do đó loga là
ℓ = n Σ i = 1 y i log ( p i / ( 1 - p i ) ) + n Σ i = 1 log ( 1 - p i )
L = Πi = 1npyTôiTôi( 1 - pTôi)1 - yTôi= ∏i = 1nđiểm kinh nghiệm( yTôiđăng nhập( pTôi/ ( 1 - pTôi) ) + nhật ký( 1 - pTôi) ),
ℓ = ∑i = 1nyTôiđăng nhập( pTôi/ ( 1 - pTôi) ) + ΣTôi= 1nđăng nhập( 1 - pTôi).
Bây giờ, chúng ta có một vectơ dự đoán cho mỗi quan sát và từ Fact 1 ở trên, mô hình hồi quy logistic đưa ra
log p ixTôi
đăng nhậppTôi1 - pTôi= βTxTôi,
βpTôi= 1 / ( 1 + e- βTxTôi)
Sử dụng khả năng tối đa để phù hợp với mô hình (Fact 2) mang lại một bộ phương trình để giải quyết từ việc xem xét . Quan sát rằng
bằng cách sử dụng mối quan hệ tuyến tính giả định giữa tỷ lệ cược log và các yếu tố dự đoán. Điều này có nghĩa là, MLE thỏa mãn
vì MLE là bất biến dưới các biến đổi, do đó trong trường hợp này.∂ℓ / ∂β= 0
∂ℓ∂β= ∑TôiyTôixTôi- ΣTôixTôi1 + điểm kinh nghiệm( - βTxTôi)= ∑TôiyTôixTôi- ΣTôipTôixTôi,
ΣTôiyTôixTôi= ∑Tôip^TôixTôi,
p^Tôi= ( 1 + điểm kinh nghiệm( - β^TxTôi) )- 1
Sử dụng Fact 3, nếu có thành phần luôn là 1 cho mọi , thì và do đó, tỷ lệ thực nghiệm của các phản hồi tích cực khớp với trung bình của xác suất được trang bị.xTôijTôiΣTôiyTôixtôi j= ∑TôiyTôi= ∑Tôip^Tôi
Một mô phỏng
Việc bao gồm một đánh chặn là quan trọng. Dưới đây là một ví dụ trong để chứng minh rằng hành vi được quan sát có thể không xảy ra khi không có sự can thiệp nào trong mô hình.R
x <- rnorm(100)
p <- 1/(1+exp(-3*x))
y <- runif(100) <= p
mean(y)
# Should be identical to mean(y)
mean( predict( glm(y~x, family="binomial"), type="response" ) )
# Won't be identical (usually) to mean(y)
mean( predict( glm(y~x+0, family="binomial"), type="response") )
Trường hợp chung : Như đã nói ở trên, thuộc tính mà đáp ứng trung bình bằng với trung bình dự đoán trung bình có tính tổng quát cao hơn nhiều đối với lớp mô hình tuyến tính tổng quát phù hợp với khả năng tối đa, sử dụng hàm liên kết chính tắc và bao gồm cả chức năng chặn trong mô hình.
Người giới thiệu
Một số tài liệu tham khảo tốt cho lý thuyết liên quan là sau đây.
- A. Agresti (2002), Phân tích dữ liệu phân loại , tái bản lần 2, Wiley.
- P. McCullagh và JA Nelder (1989), Mô hình tuyến tính tổng quát , tái bản lần 2, Chapman & Hall. (Văn bản từ các tác giả gốc của các phương pháp chung.)