Mô hình tuyến tính phi tuyến so với tổng quát: Làm thế nào để bạn đề cập đến hồi quy logistic, Poisson, v.v.


23

Tôi có một câu hỏi về ngữ nghĩa mà tôi muốn ý kiến ​​của các nhà thống kê đồng nghiệp.

Chúng ta biết các mô hình như logistic, Poisson, v.v ... nằm dưới sự bảo trợ của các mô hình tuyến tính tổng quát. Mô hình bao gồm các hàm phi tuyến của các tham số, lần lượt có thể được mô hình hóa bằng khung mô hình tuyến tính bằng cách sử dụng hàm liên kết thích hợp.

Tôi tự hỏi nếu bạn xem xét (dạy?) Các tình huống như hồi quy logistic như sau:

  1. Mô hình phi tuyến, được đưa ra dạng của các tham số
  2. Mô hình tuyến tính, vì liên kết biến chúng ta thành khung mô hình tuyến tính
  3. Đồng thời (1) và (2): Nó "bắt đầu" như một mô hình phi tuyến, nhưng có thể được làm việc theo cách cho phép chúng ta nghĩ về nó như một mô hình tuyến tính

Ước gì tôi có thể thiết lập một cuộc thăm dò thực tế ...

Câu trả lời:


24

Đâ là một câu hỏi tuyệt vời.

Chúng ta biết các mô hình như logistic, Poisson, v.v ... nằm dưới sự bảo trợ của các mô hình tuyến tính tổng quát.

Vâng, có và không. Với bối cảnh của câu hỏi, chúng tôi phải khá cẩn thận để chỉ định những gì chúng ta đang nói về - và "logistic" và "Poisson" không đủ để mô tả những gì được dự định.

(i) "Poisson" là một bản phân phối. Như một mô tả về phân phối có điều kiện, nó không phải là tuyến tính (và do đó không phải là GLM) trừ khi bạn chỉ định mô hình tuyến tính (trong tham số) để mô tả giá trị trung bình có điều kiện (nghĩa là không đủ để nói "Poisson"). Khi mọi người chỉ định "hồi quy Poisson", họ gần như luôn có ý định cho một mô hình đó tuyến tính trong các tham số, và do đó là một GLM. Nhưng "Poisson" một mình có thể là bất kỳ số lượng *.

(ii) Mặt khác, "Logistic" dùng để chỉ mô tả về một giá trị trung bình (nghĩa là trung bình là logistic trong các yếu tố dự đoán). Đó không phải là GLM trừ khi bạn kết hợp nó với phân phối có điều kiện trong gia đình hàm mũ. Mặt khác, khi mọi người nói " hồi quy logistic ", họ hầu như luôn có nghĩa là một mô hình nhị thức với liên kết logit - điều đó có nghĩa là logistic trong các yếu tố dự đoán, mô hình này là tuyến tính trong các tham số và thuộc họ hàm mũ, GLM cũng vậy.

Mô hình bao gồm các hàm phi tuyến của các tham số,

Vâng, một lần nữa, có và không.

η= =g(μ)η= =Xβ

lần lượt có thể được mô hình hóa bằng khung mô hình tuyến tính bằng cách sử dụng chức năng liên kết thích hợp.

Chính xác

Tôi tự hỏi nếu bạn xem xét (dạy?) Các tình huống như hồi quy logistic như sau:

(Tôi đang thay đổi thứ tự câu hỏi của bạn ở đây)

Mô hình tuyến tính, vì liên kết biến chúng ta thành khung mô hình tuyến tính

Đó là thông thường để gọi GLM là "tuyến tính", vì lý do chính xác này. Thật vậy, khá rõ ràng rằng đây là quy ước, bởi vì nó ở ngay trong tên .

Mô hình phi tuyến, được đưa ra dạng của các tham số

Chúng ta phải rất cẩn thận ở đây, vì "phi tuyến" thường đề cập đến một mô hình phi tuyến trong các tham số. Tương phản hồi quy phi tuyến với các mô hình tuyến tính tổng quát.

Vì vậy, nếu bạn muốn sử dụng thuật ngữ "phi tuyến" để mô tả GLM, điều quan trọng là phải xác định cẩn thận ý nghĩa của bạn - nói chung, ý nghĩa đó không liên quan tuyến tính với các yếu tố dự đoán.

Thật vậy, nếu bạn sử dụng "phi tuyến" để chỉ GLM, bạn sẽ gặp khó khăn không chỉ với quy ước (và do đó có thể bị hiểu nhầm), mà cả khi cố gắng nói về các mô hình phi tuyến tổng quát . Thật khó để giải thích sự khác biệt nếu bạn đã mô tả GLM là "mô hình phi tuyến"!

g(μ)

YPoisson(μx)

xYxμxx

μx=α+exp(βx).

xα hạn, nhưng chúng ta có thể thừa nhận một tình huống mà chúng ta quan sát một tiếp xúc thường xuyên. Lưu ý rằng cả hai Poisson và các mô hình nhị thức được sử dụng để mô hình hóa tỷ lệ tử vong.)

Ở đây, thuật ngữ đầu tiên biểu thị tỷ lệ tử vong liên tục do (nói) tai nạn (hoặc các tác động khác không liên quan nhiều đến tuổi tác) trong khi thuật ngữ thứ hai có tỷ lệ tử vong tăng do tuổi tác. Một mô hình như vậy đôi khi có thể khả thi trong các khoảng thời gian ngắn của người trưởng thành sau này nhưng không phải là người già; về cơ bản đó là luật của Makeham (được trình bày dưới dạng hàm nguy hiểm, nhưng với tỷ lệ hàng năm sẽ là một xấp xỉ hợp lý).

Đó là một mô hình phi tuyến tổng quát.


Cảm ơn vì đầu vào của bạn. Đây là những gì tôi đang cố gắng để có được. Rõ ràng "tuyến tính" là tên của GLM. Tôi đang cố gắng phân loại các mô hình vốn là phi tuyến (chúng phi tuyến trong các tham số), nhưng "tuyến tính biến đổi", và do đó nằm trong khung GLM. Tôi đoán có lẽ tôi vừa trả lời câu hỏi của riêng mình - cách tốt nhất để đề cập đến chúng là "biến đổi phi tuyến".
Meg

1
Cách phổ biến hơn để chỉ một mô hình có thể được hiển thị tuyến tính trong các tham số bằng cách chuyển đổi là "tuyến tính hóa" (ngược lại với "phi tuyến tính"). Tôi nghĩ rằng chúng ta cần phải rõ ràng đó là gì tuyến tính (so với những gì phi tuyến tính) khi thảo luận về mô hình, và có lẽ cũng phải rõ ràng những điều đó được quy ước như thế nào, vì mọi người cần có thể định vị thông tin và cũng được hiểu khi thảo luận về họ. Một số người nói về GLM là "phi tuyến" có thể bị hiểu nhầm, trừ khi họ thêm các vòng loại chính xác làm cho ý nghĩa của chúng rõ ràng.
Glen_b -Reinstate Monica

Tôi đồng ý. Tôi chỉ thấy nó được phân loại là hồi quy phi tuyến trong các văn bản và cũng đã được các giáo sư của tôi dạy rằng nó phi tuyến. Cá nhân tôi thấy khó hiểu vì chúng tôi xử lý nó trong khung GLM, nhưng tôi có thể (ít nhất là, ít nhất) đồng cảm với việc gọi nó. Tôi nghĩ rằng tôi đang đi với tuyến tính hóa / biến đổi tuyến tính và một cuộc thảo luận về cách chúng ta đi từ điểm A đến điểm B (nghĩa là cách chúng ta bắt đầu với một hàm phi tuyến và biến nó thành khung tuyến tính).
Meg

Vâng, tôi hoàn toàn hiểu. Mặc dù tôi cũng đồng cảm với sự thúc đẩy của họ để làm như vậy, nhưng nếu tôi có đôi tai của họ, tôi sẽ cảnh báo họ chống lại việc thực hành gọi chúng là mô hình phi tuyến (ít nhất là không phải luôn luôn đủ điều kiện), vì những lý do tôi đã nêu ở trên. Đó là một phần lớn lý do tại sao tôi nghĩ rằng đây là một câu hỏi quan trọng - đôi khi mọi người gọi chúng là phi tuyến, mà tôi nghĩ là tốt miễn là chúng ta hiểu rõ về những gì chúng ta gọi là phi tuyến, vì đó không phải là cách thông thường nhất tham khảo các mô hình - khi chúng ta bất chấp quy ước, chúng ta nên làm điều đó một cách cẩn thận và có chủ ý.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.