Có phải mọi mô hình log-linear đều có hồi quy logistic tương đương hoàn hảo?


8

Tôi đang cố gắng để phù hợp với một mô hình log-linear với một số lượng lớn các biến từ dữ liệu khảo sát. Thay vào đó, có một số lý do có thể phù hợp hơn với hồi quy logistic cho dữ liệu đó. Một số cơ quan chức năng cho rằng đây là tương đương. Tuy nhiên, tôi có một số lý do để nghi ngờ điều này.

  1. Các mô hình log-linear xử lý tất cả các biến tương đương, trong khi hồi quy logistic yêu cầu một biến được xác định là biến trả lời.
  2. Trong bối cảnh bình phương nhỏ nhất, thông thường không phải là trường hợp của Y = a + bX + so với X = c + dY + tham số d thậm chí xấp xỉ bằng 1 / b. Điều này là do phương trình thứ nhất giảm thiểu sai số dọc, trong khi phương trình thứ hai giảm thiểu lỗi ngang. Chúng sẽ chỉ bằng nhau nếu các lỗi đối xứng xung quanh đường ước tính. Vì vậy, tôi lo lắng rằng điều này cũng có thể đúng với hồi quy logistic. (2) thực sự chỉ là một dạng cụ thể của (1), tức là sự bất đối xứng có thể có trong định dạng hồi quy từ sự lựa chọn của một biến cụ thể là phản hồi.

  3. Nếu tất cả các biến trong mô hình log-linear có liên quan đến một hoặc nhiều thuật ngữ tương tác, tôi không thấy cách hồi quy logistic có thể tương đương. Làm thế nào một người sẽ thể hiện các tương tác trong đó biến phản ứng có liên quan trong bối cảnh của hồi quy logistic?

Đáp lại Bill Huber, tôi đang sử dụng mô hình log-linear theo nghĩa hạn chế hơn đáng kể so với Wikipedia. Tôi đang đề cập đến các mô hình dữ liệu đếm phân loại hoặc thứ tự, được sắp xếp trong các bảng, trong đó các hệ số là tổng số bảng, tổng số biên cho mỗi yếu tố chia cho tổng số bảng (đóng vai trò là proxy cho xác suất) và các thuật ngữ tương tác khác nhau. Đây là ý nghĩa được sử dụng trong Agresti, Phân tích dữ liệu phân loại của Google, trong số những người khác.


Sự hiểu biết của tôi về "mô hình loglinear" - tương đối phù hợp với định nghĩa Wikipedia , mặc dù tổng quát hơn một chút - không cho phép tôi hiểu được câu hỏi này. Bạn có thể vui lòng cho chúng tôi biết thuật ngữ này có ý nghĩa gì với bạn?
whuber

2
Wikipedia gọi đó là phân tích loglinear: en.wikipedia.org/wiki/Loglinear_analysis
Jeremy Miles

1
Có một số hình thức phân tích loglinear - chung, logit, vv Phân tích loglinear logit dành cho tình huống khi bạn có một biến phụ thuộc và một số yếu tố dự đoán. Theo như tôi biết, nó cho kết quả tương tự (ước tính tham số) như hồi quy logistic danh nghĩa.
ttnphns

Câu trả lời:


4

Câu trả lời là không'. Mô hình loglinear tổng quát hơn mô hình hồi quy logistic. Xem Fienberg, 1980, Phân tích dữ liệu phân loại chéo, phần 6.2 về cách chỉ định mô hình loglinear sao cho tương ứng với hồi quy logistic.

Trên thực tế điều ngược lại là đúng: Nếu tất cả các biến là phân loại, thì mọi mô hình hồi quy logistic tương ứng với một số mô hình loglinear.


Vì vậy, đây là những gì tôi nghĩ, nhưng không phải là những gì tôi đã hy vọng. Trong R, là công cụ chính mà tôi sử dụng, có một số gói đóng góp hoặc các thói quen có sẵn để điều chỉnh cho thiết kế lấy mẫu khảo sát phức tạp cho các mô hình lm và GLM. Tôi đã không tìm thấy bất cứ điều gì tương đương cho các mô hình log-linear.
andrewH

Tôi không biết liệu nó có hữu ích cho mục đích của bạn không, nhưng hàm loglm () từ MASS có thể phù hợp với các mô hình tuyến tính log. Ngoài ra, bạn có thể muốn kiểm tra gói ACD.
Stef van Buuren

Ngoài ra, với Poisson GLM, bạn có thể phù hợp với các mô hình log-linear. Xem Agresti: Phân tích dữ liệu phân loại Phần 8.6.7.
Momo
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.