Có thể đánh giá GLM trong Python / scikit-learn bằng cách sử dụng các bản phân phối Poisson, Gamma hoặc Tweedie làm gia đình cho phân phối lỗi?


12

Cố gắng học một số Python và Sklearn, nhưng đối với công việc của tôi, tôi cần chạy hồi quy sử dụng các phân phối lỗi từ các gia đình Poisson, Gamma và đặc biệt là Tweedie.

Tôi không thấy bất cứ điều gì trong tài liệu về chúng, nhưng chúng nằm trong một số phần của bản phân phối R, vì vậy tôi đã tự hỏi liệu có ai đã thấy các triển khai ở bất cứ đâu cho Python không. Sẽ thật tuyệt nếu bạn có thể chỉ cho tôi về việc triển khai SGD của bản phân phối Tweedie!


Các triển khai GLM mạnh mẽ nhất trong Python là trong [statsmodels] statsmodels.sourceforge.net, mặc dù tôi không chắc có triển khai SGD không.
Trey

Cảm ơn Trey. Có vẻ như không có hỗ trợ nào cho Tweedie, nhưng họ có một số cuộc thảo luận về phân phối Poisson và Gamma.
joe

Câu trả lời:


12

sự chuyển động để thực hiện các mô hình tuyến tính tổng quát với các phân phối lỗi Poisson, gamma và Tweedie trong scikit-learn.

Statsmodels có triển khai các mô hình tuyến tính tổng quát với các phân phối lỗi Poisson, Tweedie và gamma.

Trong khi tôi đang cập nhật câu trả lời này, Spark ML cũng (về mặt thực nghiệm) hỗ trợ các bản phân phối Poisson, Tweedie và gamma.


5
Tôi đang làm việc với nó: github.com/madrury/py-glm
Matthew Drury

@MatthewDrury Tuyệt vời!
Neal

@MatthewDrury tốt đẹp! Tôi mới bắt đầu sử dụng GLM và số liệu thống kê có một số hạn chế. Không chắc chắn tôi hiểu toán học đầy đủ, nhưng giải quyết bên trong của bạn có thể được thay thế bằng một bộ giải loại bình phương nhỏ nhất tùy ý không? Tôi đã nghĩ rằng điều này sẽ thêm tính linh hoạt (ví dụ: vượt qua trong sklearn.ElasticNet để có được khả năng mở rộng / chính quy hóa / v.v. "miễn phí"?).
GeoMatt22

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.