Sự khác biệt giữa chức năng liên kết của Tiếng vang là gì và chức năng liên kết chính thức của người Viking cho GLM


65

Sự khác biệt giữa các thuật ngữ 'chức năng liên kết' và 'chức năng liên kết chính tắc' là gì? Ngoài ra, có bất kỳ lợi thế (lý thuyết) của việc sử dụng cái này hơn cái kia không?

Ví dụ, một biến phản ứng nhị phân có thể được mô hình hóa bằng nhiều hàm liên kết như logit , probit , v.v. Nhưng, logit ở đây được coi là hàm liên kết "chính tắc".


10
Tôi thảo luận về các hàm liên kết rộng rãi ở đây: Sự khác biệt giữa mô hình logit và probit , tập trung vào hồi quy cho biến phản ứng nhị phân. Mặc dù chỉ có một chút trong cuộc thảo luận đó tập trung vào ý nghĩa của chức năng liên kết là 'chính tắc', nhưng dù sao cũng có thể hữu ích để đọc. Lưu ý rằng để hiểu sự khác biệt b / t & lợi thế của chức năng liên kết chính tắc và không chính tắc đòi hỏi phải đi sâu vào toán học bên dưới GLiM.
gung - Phục hồi Monica

Câu trả lời:


68

Các câu trả lời trên là trực quan hơn, vì vậy tôi cố gắng nghiêm ngặt hơn.

GLM là gì?

Đặt biểu thị một tập hợp một vectơ yp -dimensional vectơ x = ( x 1 , Lỗi , x p ) với giá trị mong đợi E ( y ) = μ . Đối với i = 1 , ... , n quan sát độc lập, sự phân bố của mỗi y i là một gia đình theo cấp số nhân với mật độ f ( y i ;Y=(y,x)ypx=(x1,,xp)E(y)=μi=1,,nyi Ở đây, tham số quan tâm (tự nhiên hay kinh điển parameter) là θ i , φ là một tham số quy mô (được biết đến hoặc được coi là một mối phiền toái) và γ τ là chức năng được biết đến. Cácvectơ n chiều của các giá trị đầu vào cố định cho p

f(yi;θi,ϕ)=exp{[yiθiγ(θi)]/ϕ+τ(yi,ϕ)}
θiϕγτnpbiến giải thích được biểu thị bằng . Chúng tôi giả định rằng các đầu vào vector ảnh hưởng (1) chỉ qua một hàm tuyến tính, các dự đoán tuyến tính, η i = β 0 + β 1 x i 1 + + β p x i p trên đó q i phụ thuộc. Vì nó có thể được hiển thị mà θ = ( γ ' ) - 1 ( μ )x1,,xp
ηi=β0+β1xi1++βpxip
θiθ=(γ)1(μ), sự phụ thuộc này được thiết lập bằng cách kết nối bộ dự báo tuyến tính θ thông qua giá trị trung bình. Cụ thể hơn, giá trị trung bình μ được xem như là một chức năng nghịch và trơn tru của các dự đoán tuyến tính, tức là g ( μ ) = η hoặc μ = g - 1 ( η ) Bây giờ để trả lời câu hỏi của bạn:ηθμ
g(μ)=η or μ=g1(η)

g()μηθηθg=(γ)1

Xyixijyij=1,,pμ

Do đó chúng có xu hướng được sử dụng theo mặc định. Tuy nhiên, lưu ý rằng không có lý do tiên nghiệm tại sao các hiệu ứng trong mô hình phải là phụ gia theo thang đo được đưa ra bởi liên kết này hoặc bất kỳ liên kết nào khác.


5
+1, đây là một câu trả lời thực sự hay, @Momo. Tôi đã tìm thấy một số phương trình khó đọc hơn khi chúng bị chôn vùi trong các đoạn văn, vì vậy tôi đã 'chặn' chúng bằng cách sử dụng các ký hiệu đô la kép (ví dụ $ $). Tôi hy vọng điều đó ổn (nếu không, bạn có thể quay lại, xin lỗi tôi).
gung - Phục hồi Monica

1
@Momo câu hỏi ban đầu ở đây, tuy nhiên, bao gồm những gì Wei hỏi về, vì vậy thật đáng để chỉ ra rằng chưa được trả lời rõ ràng.
Glen_b

1
θη=θg(μ)=θθ=(γ)1(μ)θθμg(.)=(γ)1(.)

1
γ(θ)=π=exp(θ)1+exp(θ)(γ)1(.)=logit(.)η=θg(.)θ=logit(π)=ηθηchỉ tồn tại, nếu chúng ta sử dụng chức năng liên kết chính tắc.
Druss2k

2
μθηθ

16

gung's trích dẫn một lời giải thích tốt: liên kết kinh điển sở hữu các tính chất lý thuyết đặc biệt của sự đầy đủ tối thiểu. Điều này có nghĩa là bạn có thể xác định mô hình logit có điều kiện (mà các nhà kinh tế gọi là mô hình hiệu ứng cố định) bằng cách điều chỉnh số lượng kết quả, nhưng bạn không thể xác định mô hình probit có điều kiện, vì không có số liệu thống kê đủ để sử dụng với liên kết probit.


Bạn có thể xây dựng một chút về sự đầy đủ tối thiểu? Bằng cách giải thích ở trên, chúng ta vẫn có thể định nghĩa một mô hình probit, phải không? Chắc chắn đó không phải là chức năng liên kết chính tắc nhưng có hại gì khi sử dụng chức năng liên kết không chính tắc.
pikachuchameleon

9

Đây là một sơ đồ nhỏ lấy cảm hứng từ lớp 18.650 của MIT mà tôi thấy khá hữu ích vì nó giúp hình dung các mối quan hệ giữa các chức năng này. Tôi đã sử dụng ký hiệu tương tự như trong bài đăng của @ momo:

nhập mô tả hình ảnh ở đây

  • γ(θ)
  • g(μ)

g

Sơ đồ cho phép dễ dàng đi từ hướng này sang hướng khác, ví dụ:

η= =g(γ(θ))
θ= =γ'-1(g-1(η))

Chức năng liên kết Canonical

g

γ-1g-1= =(gγ')-1= =Tôi
θ= =η

1

Các câu trả lời ở trên đã bao gồm những gì tôi muốn nói. Chỉ cần làm rõ một vài điểm như một nhà nghiên cứu về học máy:

  1. chức năng liên kết không là gì ngoài nghịch đảo của chức năng kích hoạt. Ví dụ, logit là nghịch đảo của sigmoid, probit là nghịch đảo của hàm phân phối tích lũy của Gaussian.

  2. wTxwx

Cuộc thảo luận ở trên không liên quan gì đến gia đình theo cấp số nhân, nhưng một cuộc thảo luận tốt đẹp có thể được tìm thấy trong cuốn sách PRML của Christopher Bishop Chương 4.3.6.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.