Tại sao chúng ta lại gây ồn ào về việc sử dụng tính điểm của Fisher khi chúng ta lắp GLM?


16

Tôi tò mò về lý do tại sao chúng tôi coi GLMS phù hợp như thể chúng là một số vấn đề tối ưu hóa đặc biệt. Có phải họ không? Dường như với tôi rằng họ chỉ là khả năng tối đa, và chúng tôi viết ra khả năng và sau đó ... chúng tôi tối đa hóa nó! Vậy tại sao chúng ta sử dụng tính điểm của Fisher thay vì bất kỳ vô số các sơ đồ tối ưu hóa đã được phát triển trong tài liệu toán học ứng dụng?

Câu trả lời:


13

Ghi điểm của Fisher chỉ là một phiên bản của phương pháp Newton được xác định bằng GLM, không có gì đặc biệt về nó, ngoài thực tế là ma trận thông tin của Fisher xảy ra khá dễ tìm thấy các biến ngẫu nhiên trong họ hàm mũ. Nó cũng liên kết với rất nhiều tài liệu toán học khác có xu hướng xuất hiện cùng thời điểm và đưa ra một trực giác hình học tốt đẹp về ý nghĩa chính xác của thông tin Fisher.

Hoàn toàn không có lý do gì tôi có thể nghĩ đến việc không sử dụng một số trình tối ưu hóa khác nếu bạn thích, ngoài việc bạn có thể phải viết mã bằng tay thay vì sử dụng gói có sẵn. Tôi nghi ngờ rằng bất kỳ sự nhấn mạnh nào vào việc chấm điểm của Fisher là sự kết hợp của (theo thứ tự giảm trọng lượng) sư phạm, dễ dãi, sai lệch lịch sử và hội chứng "không phát minh ra ở đây".


1
Tôi không nghĩ điều này hoàn toàn chính xác - thuật toán IRLS sử dụng Hessian dự kiến, trong khi Newton-Raphson sử dụng Hessian được quan sát - xem gen.lib.rus.ec/ để so sánh chi tiết về 2 thuật toán ...
Tom Wenseleers

9

Đó là lịch sử và thực dụng; Các GLM được thiết kế ngược của Nelder và Wedderburn, là tập hợp các mô hình mà bạn có thể tìm thấy MLE bằng cách sử dụng tính năng ghi điểm của Fisher (tức là Iterively Reweighted Least Squares). Thuật toán xuất hiện trước các mô hình, ít nhất là trong trường hợp chung.

Cũng đáng nhớ rằng IWLS là những gì họ đã có từ đầu những năm 70, vì vậy GLM là một lớp mô hình quan trọng cần biết. Thực tế là bạn có thể tối đa hóa khả năng GLM một cách đáng tin cậy bằng thuật toán loại Newton (chúng thường có MLE duy nhất) cũng có nghĩa là các chương trình như GLIM có thể được sử dụng bởi những người không có kỹ năng tối ưu hóa số.


Tôi không nghĩ điều này hoàn toàn chính xác - thuật toán IRLS sử dụng Hessian dự kiến, trong khi Newton-Raphson sử dụng Hessian được quan sát - xem gen.lib.rus.ec/ để so sánh chi tiết về 2 thuật toán ...
Tom Wenseleers
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.