Tôi đang cố gắng để phù hợp với một mô hình log-linear với một số lượng lớn các biến từ dữ liệu khảo sát. Thay vào đó, có một số lý do có thể phù hợp hơn với hồi quy logistic cho dữ liệu đó. Một số cơ quan chức năng cho rằng đây là tương đương. Tuy nhiên, tôi có một số lý do để nghi ngờ điều này.
- Các mô hình log-linear xử lý tất cả các biến tương đương, trong khi hồi quy logistic yêu cầu một biến được xác định là biến trả lời.
Trong bối cảnh bình phương nhỏ nhất, thông thường không phải là trường hợp của Y = a + bX + so với X = c + dY + tham số d thậm chí xấp xỉ bằng 1 / b. Điều này là do phương trình thứ nhất giảm thiểu sai số dọc, trong khi phương trình thứ hai giảm thiểu lỗi ngang. Chúng sẽ chỉ bằng nhau nếu các lỗi đối xứng xung quanh đường ước tính. Vì vậy, tôi lo lắng rằng điều này cũng có thể đúng với hồi quy logistic. (2) thực sự chỉ là một dạng cụ thể của (1), tức là sự bất đối xứng có thể có trong định dạng hồi quy từ sự lựa chọn của một biến cụ thể là phản hồi.
Nếu tất cả các biến trong mô hình log-linear có liên quan đến một hoặc nhiều thuật ngữ tương tác, tôi không thấy cách hồi quy logistic có thể tương đương. Làm thế nào một người sẽ thể hiện các tương tác trong đó biến phản ứng có liên quan trong bối cảnh của hồi quy logistic?
Đáp lại Bill Huber, tôi đang sử dụng mô hình log-linear theo nghĩa hạn chế hơn đáng kể so với Wikipedia. Tôi đang đề cập đến các mô hình dữ liệu đếm phân loại hoặc thứ tự, được sắp xếp trong các bảng, trong đó các hệ số là tổng số bảng, tổng số biên cho mỗi yếu tố chia cho tổng số bảng (đóng vai trò là proxy cho xác suất) và các thuật ngữ tương tác khác nhau. Đây là ý nghĩa được sử dụng trong Agresti, Phân tích dữ liệu phân loại của Google, trong số những người khác.