Khi nào hồi quy logistic được giải quyết ở dạng đóng?


31

Lấy x{0,1}d và và giả sử chúng ta mô hình hóa nhiệm vụ dự đoán y đã cho x bằng cách sử dụng hồi quy logistic. Khi nào hệ số hồi quy logistic có thể được viết ở dạng đóng?y{0,1}

Một ví dụ là khi chúng ta sử dụng mô hình bão hòa.

Nghĩa là, xác định , trong đó lập chỉ mục cho tập hợp sức mạnh của và trả về 1 nếu tất cả các biến trong tập thứ là 1 và 0 khác. Sau đó, bạn có thể biểu thị mỗi trong mô hình hồi quy logistic này dưới dạng logarit của hàm thống kê thống kê dữ liệu.P(y|x)exp(iwifi(xi))i{x1,,xd}fiiwi

Có những ví dụ thú vị khác khi hình thức đóng tồn tại?


4
Tôi giả sử bạn có nghĩa là "khi nào các MLE của các tham số ở dạng đóng?"
Glen_b -Reinstate Monica

Bạn có thể cho biết thêm chi tiết những gì bạn đã làm? Câu hỏi của bạn đọc như thể bạn đã cố gắng rút ra công cụ ước lượng bình phương nhỏ nhất cho một vấn đề hồi quy logistic?
Momo

1
Cảm ơn cho bài viết / câu hỏi thú vị, Yar Tư. Bạn có một tài liệu tham khảo cho ví dụ mà bạn hiển thị?
Bitwise

1
Đã được một thời gian, nhưng có lẽ đó là trong cuốn sách "Mô hình đồ họa" của Lauritzen. Các nền tảng rộng hơn của câu trả lời cho câu hỏi này là ở đó - bạn có được giải pháp dạng đóng khi biểu đồ (siêu) được hình thành bởi số liệu thống kê đầy đủ là hợp âm
Yaroslav Bulatov

Đây có thể là điều thú vị tandfonline.com/doi/abs/10.1080/ Từ Tôi tin rằng đây là trường hợp đặc biệt của giải pháp phân tích khi bạn chỉ có một bảng 2x2
Austin

Câu trả lời:


33

Như kjetil b halvorsen đã chỉ ra, theo cách riêng của nó, một phép lạ mà hồi quy tuyến tính thừa nhận một giải pháp phân tích. Và điều này là như vậy chỉ nhờ vào tính tuyến tính của vấn đề (đối với các tham số). Trong OLS, bạn có trong đó có các điều kiện đặt hàng đầu tiên - 2 Σ i ( y i - x ' i β ) x i = 0 Đối với một vấn đề với p

Σtôi(ytôi-xtôi'β)2tối thiểuβ,
-2Σtôi(ytôi-xtôi'β)xtôi= =0
pbiến (bao gồm cả cố định, nếu cần thiết, có một số hồi quy thông qua những vấn đề nguồn gốc, quá), đây là một hệ thống với phương trình và p ẩn số. Quan trọng nhất, nó là một hệ thống tuyến tính, vì vậy bạn có thể tìm ra giải pháp bằng cách sử dụng lý thuyết và thực hành đại số tuyến tính tiêu chuẩn . Hệ thống này sẽ có giải pháp với xác suất 1 trừ khi bạn có các biến cộng tuyến hoàn hảo.pp

Bây giờ, với hồi quy logistic, mọi thứ không còn dễ dàng nữa. Viết hàm khả năng đăng nhập, và lấy đạo hàm của nó để tìm ra MLE, chúng tôi nhận l

l(y;x,β)=iyilnpi+(1yi)ln(1pi),pi=(1+exp(θi))1,θi=xiβ,
Các tham sốβnhập giá trị này theo cách rất phi tuyến: với mỗii, có một hàm phi tuyến và chúng được thêm vào với nhau. Không có giải pháp phân tích (trừ có lẽ trong một tình huống không đáng kể với hai quan sát, hoặc một cái gì đó như thế), và bạn phải sử dụngcác phương pháp tối ưu hóa phi tuyếnđể tìm ra ước tính beta .
lβ=idpidθ(yipi1yi1pi)xi=i[yi11+điểm kinh nghiệm(xtôi'β)]xtôi
βtôiβ^

Prob[Ytôi= =1|xtôi'β>c]= =1c, tức là bạn có một dự đoán hoàn hảo. Đây là một tạo tác khá khó chịu: bạn sẽ nghĩ rằng khi bạn có một dự đoán hoàn hảo, mô hình hoạt động hoàn hảo, nhưng đủ tò mò, đó là cách khác.


Câu hỏi là tại sao phương trình cuối cùng của bạn không thể giải được. có phải là do hàm nghịch đảo của hàm logistic ở 0 và 1, hay đây là do tính phi tuyến nói chung?
kẻ mắt

5
(1) Về đoạn cuối cùng của bạn: Từ góc độ toán học nó không làm việc "một cách hoàn hảo" theo nghĩa là một MLE sẽ mang lại một siêu phẳng phân cách hoàn hảo. Liệu thuật toán số của bạn có hoạt động hợp lý trong tình huống đó hay không là một vấn đề riêng biệt. Làm mịn Laplace thường được sử dụng trong các tình huống như vậy.
Đức hồng y

@eyaler, tôi sẽ nói điều này là do tính phi tuyến nói chung. Hiểu biết của tôi là có một tập hợp hạn chế khi điều này có thể được giải quyết, mặc dù tôi không biết những tình huống này là gì.
StasK

1
Tôi không hiểu, điều kiện toán học nào hiện diện khiến hệ thống không có giải pháp dạng đóng? Có một điều kiện chung mà mọi thứ nói chung không có giải pháp dạng đóng?
Charlie Parker

Có phải thực tế là hồi quy logistic không có dạng đóng nào đó mà người ta có thể chứng minh bằng cách nhìn vào phép lặp giảm dần độ dốc cho nó?
Charlie Parker

8

Bài viết này ban đầu được dự định là một bình luận dài hơn là một câu trả lời hoàn chỉnh cho câu hỏi trong tầm tay.

Từ câu hỏi, có một chút không rõ ràng nếu lợi ích chỉ nằm trong trường hợp nhị phân hoặc, có lẽ, trong các trường hợp tổng quát hơn khi chúng có thể liên tục hoặc đảm nhận các giá trị rời rạc khác.

tôiogtôit(Pr(Ytôij= =1))= =αtôi-αj,
αtôitôiYtôij= =1tôij

(tôi,j)α^tôiStôi= =ΣjtôiYtôij

Để giải thích điều này, hãy tưởng tượng một giải đấu vòng tròn đầy đủ trong môn thể thao cạnh tranh yêu thích của bạn. Sau đó, kết quả này nói rằng mô hình Bradley trinh Terry xếp hạng các cầu thủ / đội theo tỷ lệ chiến thắng của họ. Cho dù đây là một kết quả đáng khích lệ hay đáng thất vọng tùy thuộc vào quan điểm của bạn, tôi cho rằng.

NB Kết quả sắp xếp thứ hạng này không giữ được, nói chung, khi một vòng tròn đầy đủ không được chơi.


2
Tôi quan tâm đến nhị phân vì nó dễ phân tích nhất. Tôi đã tìm thấy một điều kiện đủ rộng trong các tác phẩm của Lauritzen - bạn có được dạng đóng nếu một mô hình log-linear tương ứng có thể phân tách được
Yaroslav Bulatov
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.