Hồi quy logistic cho đa lớp


10

Tôi đã nhận được mô hình cho hồi quy logistic cho đa lớp được đưa ra bởi

P(Y=j|X(i))=exp(θjTX(i))1+m=1kexp(θmTX(i))

Trong đó k là số lớp theta là tham số được ước tính j là lớp thứ j Xi là dữ liệu đào tạo

Vâng, một điều tôi không nhận được là làm thế nào mà mẫu số bình thường hóa mô hình. Tôi có nghĩa là nó làm cho xác suất ở giữa 0 và 1.

1+m=1kexp(θmTX(i))

Ý tôi là tôi đã quen với hồi quy logistic

P(Y=1|X(i))=1/(1+exp(θTX(i)))

Trên thực tế, tôi bối rối với điều đề cử. Trong trường hợp này vì nó là hàm sigmoid, nó không bao giờ cho phép giá trị nhỏ hơn 0 hoặc lớn hơn 1. Nhưng tôi bị nhầm lẫn trong trường hợp đa lớp. Tại sao nó như vậy?

Đây là tài liệu tham khảo của tôi https://list.scms.waikato.ac.nz/pipermail/wekalist/2005-F/2/029738.html . Tôi nghĩ rằng nó đã được bình thường hóa

P(Y=j|X(i))=exp(θjTX(i))m=1kexp(θmTX(i))

2
Gợi ý: Trong hồi quy logistic, có hai xác suất để xử lý: xác suất và xác suất . Những xác suất phải tổng hợp thành . Y=1Y=01
whuber

1
Dựa trên một số bài viết khác của bạn, bạn biết cách đánh dấu các phương trình. Các phương trình văn bản ở đây rất khó đọc và (các mục con?) Khó hiểu - bạn có thể đánh dấu chúng bằng không? LATEX
Macro

2
Vì bạn đang đăng rất nhiều câu hỏi ở đây, vui lòng tạm dừng và đọc Câu hỏi thường gặp của chúng tôi về cách đặt câu hỏi hay. Đọc trợ giúp cho đánh dấu để bạn có thể đọc phương trình của mình. TEX
whuber

Tôi đã chỉnh sửa phương trình. @ Whuber Trên thực tế, tôi bối rối liên quan đến hồi quy logistic đa giác chứ không phải nhị phân. Tôi lo ngại làm thế nào khi tôi thêm tất cả các yếu tố trong bộ điều khiển đã bình thường hóa xác suất
user34790

@ user34790, khi bạn chia mỗi số hạng cho tổng, thì xác suất của từng lớp sẽ bằng 1. Nhân tiện là gì? X(i)
Macro

Câu trả lời:


13

Công thức của bạn sai (giới hạn trên của tổng). Trong hồi quy logistic với các lớp ( ) về cơ bản bạn tạo các mô hình hồi quy logistic nhị phân trong đó bạn chọn một lớp làm tham chiếu hoặc trục. Thông thường, lớp cuối cùng được chọn làm tài liệu tham khảo. Do đó, xác suất của lớp tham chiếu có thể được tính bằngDạng tổng quát của xác suất làVì là tham chiếu của bạn và do đóKK>2K1K

P(yi=K|xi)=1k=1K1P(yi=k|xi).
P(yi=k|xi)=exp(θiTxi)i=1Kexp(θiTxi).
KθK=(0,,0)T
i=1Kexp(θiTxi)=exp(0)+i=1K1exp(θiTxi)=1+i=1K1exp(θiTxi).
Cuối cùng, bạn nhận được công thức sau cho tất cả : k<K
P(yi=k|xi)=exp(θiTxi)1+i=1K1exp(θiTxi)

4
lưu ý rằng việc lựa chọn lớp tham chiếu không quan trọng, nếu bạn đang làm khả năng tối đa. Nhưng nếu bạn đang thực hiện khả năng bị phạt tối đa, hoặc suy luận bayes, thường có thể hữu ích hơn khi để các xác suất vượt quá tham số hóa và để hình phạt chọn cách xử lý tham số hóa quá mức. Điều này là do hầu hết các chức năng hình phạt / linh mục không phải là bất biến đối với sự lựa chọn của lớp tham chiếu
xác suất

@sebp, có vẻ như hơi khó hiểu; nó sẽ tốt hơn để sử dụng để quan sát, và một số chữ cái khác cho việc lặp lại thể loại . iik
garej

4

Tôi nghĩ rằng bạn đang bị nhầm lẫn bởi một lỗi đánh máy: của bạn nên là trong phương trình đầu tiên. Số 1 bạn thấy trong trường hợp logistic thực sự là s, ví dụ: khi có th . kk1exp(0)kθ=0

Giả sử rằng . Bây giờ lưu ý rằng bạn có thể nhận được từ công thức cuối cùng đến phiên bản hồi quy logistic như Đối với nhiều lớp, chỉ cần thay mẫu số trong hai đại lượng đầu tiên bằng một tổng số trên các công cụ dự báo tuyến tính lũy thừa. θ1X=b

exp(b)exp(0)+exp(b)=exp(0)exp(0)+exp(b)=11+exp(b)
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.