Gradient-log-normalizer là gì?


9

Trong wiki, hàm softmax được định nghĩa là trình chuẩn hóa log-log của phân phối xác suất phân loại . Một lời giải thích một phần cho trình chuẩn hóa log được tìm thấy ở đây , nhưng gradient-log-normalizer dùng để làm gì?

Câu trả lời:


5

Sử dụng ký hiệu từ trang wikipedia ( https://en.wikipedia.org/wiki/Exponential_f Family), một gia đình hàm mũ là một họ các phân phối xác suất có các pmfs / pdf có thể được viết là (lưu ý rằng , x có thể là vector có giá trị): f θ ( x ) = h ( x ) exp [ η ( θ ) T t ( x ) - A ( θ ) ] trong đó η ( θ ) = η là các tham số tự nhiên,θx

fθ(x)= =h(x)điểm kinh nghiệm[η(θ)Tt(x)-Một(θ)]
η(θ)= =η là số liệu thống kê đầy đủ, và Một ( θ ) là normalizer log (đôi khi được gọi là phân vùng chức năng log). Lý do A ( θ )t(x)Một(θ)Một(θ) được gọi là normalizer log, vì nó có thể được xác nhận rằng, trong trường hợp liên tục, cho đây là một pdf hợp lệ, chúng ta phải có
Một(θ)= =đăng nhập[h(x)điểm kinh nghiệm[η(θ)Tt(x)]dx],
và trong trường hợp riêng biệt, để đây là một pmf hợp lệ, chúng ta phải có Trong mỗi trường hợp, chúng tôi nhận thấy rằng h ( x ) exp [ η ( θ ) T t ( x ) ] d xΣ x h (
Một(θ)= =đăng nhập[Σxh(x)điểm kinh nghiệm[η(θ)Tt(x)]].
h(x)điểm kinh nghiệm[η(θ)Tt(x)]dx là các hằng số chuẩn hóa của các bản phân phối, do đó bộ chuẩn hóa nhật ký tên.Σxh(x)điểm kinh nghiệm[η(θ)Tt(x)]

kθ1,,θk-10<θ1,,θk-1ΣTôi= =1k-1θTôi<1θk= =1-ΣTôi= =1k-1θTôiθ= =(θ1,,θk)x= =(x1,,xk)xTôi= =1xj= =0Tôij

fθ(x)= =ΠTôi= =1kθTôixTôi.
h(x)= =1η(θ)= =(đăng nhập[θ1/θk],,đăng nhập[θk-1/θk],0)t(x)= =(x1,,xk)Một(θ)= =-đăng nhập[θk]
fθ(x)= =điểm kinh nghiệm[(đăng nhập[θ1/θk],,đăng nhập[θk-1/θk],0)T(x1,,xk)-(-đăng nhập[θk])].

η(θTôi)= =đăng nhập[θTôi/θk]= =ηTôiθTôi= =eηTôiΣj= =1keηj

Một(η)= =-đăng nhập[eηkΣj= =1keηj]= =-đăng nhập[1Σj= =1keηj]= =đăng nhập[Σj= =1keηj].
ηTôi
ηTôiMột(η)= =eηTôiΣj= =1keηj,
Một(η)= =[eη1Σj= =1keηj,,eηkΣj= =1keηj].

Chà !! Đó là một lời giải thích tuyệt vời và hoàn toàn có ý nghĩa. Cảm ơn bạn :)
tashuhka

Tôi đã tìm kiếm sự phát sinh này trong một thời gian dài! Tôi đang tự hỏi, trong bối cảnh nào bạn phải phát triển kiến ​​thức này? Bạn có thấy đây là một phần của khóa học hay sách giáo khoa không? Tôi tiếp tục tìm tài liệu tham khảo về mối quan hệ này trên internet nhưng không ai thực sự đưa ra chi tiết.
zipzapboing

1
@zipzapboing Tôi thực sự không biết thuộc tính này của softmax cho đến khi tôi thấy câu hỏi của OP! Tuy nhiên, tôi đã có một khóa học thống kê cấp độ casella và berger (nơi giới thiệu theo cấp số nhân và một số thuộc tính khác của họ), cho phép tôi biết rằng việc chứng minh tài sản sẽ không khó với tham số đúng.
aleshing
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.