Đối với hồi quy tuyến tính có nhiều nhóm (các nhóm tự nhiên được xác định trước) có thể chấp nhận chạy hai mô hình khác nhau trên cùng một tập dữ liệu để trả lời hai câu hỏi sau không?
Có phải mỗi nhóm có độ dốc khác không và đánh chặn khác không và các tham số cho mỗi nhóm trong hồi quy nhóm là gì?
Có, bất kể thành viên nhóm, xu hướng khác không và đánh chặn khác không và các tham số cho điều này qua hồi quy nhóm là gì?
Trong R, mô hình đầu tiên sẽ là lm(y ~ group + x:group - 1)
, do đó các hệ số ước tính có thể được hiểu trực tiếp là giao thoa và độ dốc cho mỗi nhóm. Mô hình thứ hai sẽ là lm(y ~ x + 1)
.
Giải pháp thay thế sẽ là lm(y ~ x + group + x:group + 1)
, dẫn đến một bảng tóm tắt các hệ số phức tạp, với độ dốc trong nhóm và các phần chặn phải được tính toán từ sự khác biệt về độ dốc và phần chặn từ một số tham chiếu. Ngoài ra, bạn phải sắp xếp lại các nhóm và chạy mô hình lần thứ hai để có được giá trị p cho chênh lệch nhóm cuối cùng (đôi khi).
Điều này sử dụng hai mô hình riêng biệt có ảnh hưởng tiêu cực đến suy luận theo bất kỳ cách nào hoặc thực hành tiêu chuẩn này?
Để đặt điều này vào bối cảnh, coi x là một liều thuốc và các nhóm là các chủng tộc khác nhau. Có thể rất thú vị khi biết mối quan hệ liều đáp ứng cho một chủng tộc cụ thể đối với một bác sĩ, hoặc chủng tộc nào có tác dụng, nhưng đôi khi cũng có thể thú vị khi biết mối quan hệ đáp ứng liều cho toàn bộ dân số (con người) Bất kể cuộc đua cho một quan chức y tế công cộng. Đây chỉ là một ví dụ về cách người ta có thể quan tâm đến cả hồi quy trong nhóm và trên toàn nhóm. Liệu một mối quan hệ đáp ứng liều nên là tuyến tính không quan trọng.