Chức năng liên kết danh tính không tôn trọng miền của gia đình Gamma?


9

Tôi đang sử dụng mô hình tuyến tính tổng quát gamma (GLM) với một liên kết nhận dạng. Biến độc lập là mức bù của một nhóm cụ thể.

Tóm tắt thống kê mô hình thống kê của Python đưa ra cảnh báo cho tôi về chức năng liên kết danh tính ( "DomainWarning: Chức năng liên kết danh tính không tôn trọng miền của gia đình Gamma." ) Mà tôi không hiểu và rất thích giúp đỡ. Bối cảnh: Chỉ có giáo dục chính thức cơ bản về thống kê và hầu như không có kinh nghiệm với GLM ngoài hồi quy logistic.

Đây là mã Python có liên quan:

model=statsmodels.genmod.generalized_linear_model.GLM(target, reducedFeatures, family=sm.families.Gamma(link=sm.families.links.identity)) results=model.fit() print(results.summary())

Đây là đầu ra: nhập mô tả hình ảnh ở đây

Câu hỏi của tôi là: Theo cách nào thì một liên kết danh tính không tôn trọng miền của gia đình Gamma? Miền của họ gamma là 0 đến vô cùng? Tôi cũng có ấn tượng rằng liên kết danh tính không làm được gì nhiều, tức là nó giữ các biến độc lập như hiện tại và không biến đổi chúng / mối quan hệ của chúng với biến phụ thuộc. Nghe có vẻ như một chức năng liên kết tôn trọng;)

Xin hãy sửa cho tôi


Liên kết nhận dạng có nghĩa là giá trị mong đợi của biến phụ thuộc chỉ là bộ dự báo tuyến tính, như trong mô hình hồi quy tuyến tính. Không có gì để giữ giá trị mong đợi tích cực; đối với một số giá trị của các yếu tố dự đoán, giá trị mong đợi có thể bằng 0 hoặc âm. Do đó "chức năng liên kết danh tính không tôn trọng miền của gia đình Gamma".
The Laconic

Câu trả lời:


8

Mô hình Gamma GLM là:

yXGamma(μ=f(Xβ),ϕ)

Ở đâu μ là tham số kỳ vọng và ϕ là một tham số phân tán (tham số phân tán không được ước tính trong khung GLM tiêu chuẩn), Xβ là yếu tố dự báo tuyến tính, β là các tham số được học bởi mô hình, và f được gọi là hàm liên kết.

Lưu ý rằng, trong khi Xβ được phép lấy bất kỳ giá trị thực nào, f(Xβ)đang mô hình hóa kỳ vọng của một phân phối Gamma, phải là một số thực dương . Đây là những gì Python đang nói với bạn, chức năng nhận dạng không được đảm bảo để ánh xạXβ đến một số thực dương, do đó không phải lúc nào cũng dẫn đến một tham số trung bình hợp lệ.

Mát mẻ. Cảm ơn bạn! Tất cả các biến độc lập của tôi đều là số dương, số thực nên tôi rất tốt, phải không?

Không nhất thiết, một trong các hệ số ước tính của bạn có thể âm (đánh chặn của bạn rất âm).

Bạn có phiền đi sâu vào chi tiết hơn một chút về ý của bạn không? Tại sao dấu hiệu của đánh chặn có bất kỳ tác động nào đến các hệ số? Điều đó không có ý nghĩa với tôi.

Nó có ảnh hưởng đến tham số trung bình của phân phối Gamma có điều kiện của bạn. Hãy nhớ rằng, phương trình cấu trúc của bạn cho mô hình là:

μ=f(Xβ)

μ phải tích cực . Giả sử rằng tất cả các giá trị của các biến dự đoán của bạn đều bằng 0 (tôi không biết liệu đây có phải là trường hợp trong dữ liệu của bạn không, vì tôi thiếu ngữ cảnh cho các tính năng của bạn). Sau đó, dự đoán của bạn cho điểm dữ liệu này sẽ là:

μ(x)=f((1,0,0,,0)β)=f(Intercept)

Nếu bạn đang sử dụng chức năng liên kết danh tính, điều này có nghĩa là

μ(x)=Intercept

đó là một giá trị không hợp lệ của μ khi đánh chặn là âm.

Một lần nữa, do các ràng buộc theo ngữ cảnh của dữ liệu của bạn, bạn có thể tránh được tình huống này, nhưng nó có thể về mặt toán học.


Mát mẻ. Cảm ơn bạn! Tất cả các biến độc lập của tôi đều là số dương, số thực nên tôi rất tốt, phải không?
kalidurge

Không nhất thiết, một trong các hệ số ước tính của bạn có thể âm (đánh chặn của bạn rất âm).
Matthew Drury

Bạn có phiền đi sâu vào chi tiết hơn một chút về ý của bạn không? Tại sao dấu hiệu của đánh chặn có bất kỳ tác động nào đến các hệ số? Điều đó không có ý nghĩa với tôi.
kalidurge

@kalidurge Tôi đã chỉnh sửa trong câu trả lời cho theo dõi của bạn.
Matthew Drury

Thực sự hữu ích. Tôi đánh giá rất cao nó!
kalidurge

1

Vì tôi đã đăng câu hỏi này hơn một năm trước, tôi đã tham gia một lớp học về các mô hình tuyến tính tổng quát và học được rất nhiều. Vì bài đăng này được xem hơi thường xuyên, tôi nghĩ rằng tôi sẽ thêm một số hướng dẫn mà tôi muốn tôi có vào thời điểm đó.

Liên kết các chức năng để xem xét cho mô hình Gamma:

  • Nhật ký - Buộc dự đoán / đầu ra "tôn trọng tên miền" bằng cách đảm bảo tất cả các giá trị dự đoán là dương
  • Đối ứng - Không bắt buộc các giá trị phải tôn trọng tên miền nhưng thường hoạt động tốt. (Nó được sử dụng vì đó là tham số tự nhiên của dạng chính tắc của mô hình Gamma.) Đây là chức năng liên kết mặc định trong R.

Theo nguyên tắc chung, tránh chức năng liên kết danh tính.

Điều đó nói rằng, có lẽ bạn có thể và nên tránh sử dụng mô hình Gamma trong hầu hết các tình huống. Nếu bạn có dữ liệu với độ lệch đáng kể, hãy chuyển đổi biến mục tiêu của bạn và chạy mô hình hồi quy tuyến tính tiêu chuẩn. Các kết quả thường sẽ dễ hiểu hơn và tốt hơn hoặc tốt hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.