Đầu tiên, tôi sẽ giới thiệu một mô hình thứ tư cho cuộc thảo luận trong câu trả lời của tôi:
phù hợp1,5 <- lm (y_2 ~ x_1 + x_2 + y_1)
Phần 0
Sự khác biệt giữa fit1 và fit1.5 được tóm tắt tốt nhất là sự khác biệt giữa chênh lệch ràng buộc so với chênh lệch tối ưu.
Tôi sẽ sử dụng một ví dụ đơn giản hơn để giải thích điều này hơn ví dụ được cung cấp ở trên. Hãy bắt đầu với fit1.5. Phiên bản đơn giản hơn của mô hình sẽ là
Tất nhiên, khi chúng tôi có được ước tính OLS, nó sẽ tìm thấy lựa chọn "tối ưu" cho . Và, mặc dù có vẻ lạ khi viết như vậy, chúng ta có thể viết lại công thức thành
Chúng ta có thể coi đây là sự khác biệt "tối ưu" giữa hai biến .
y2=b0+b1⋅x+b2⋅y1
b2y2−b2⋅y1=b0+b1⋅x
y
Bây giờ, nếu chúng tôi quyết định ràng buộc , thì công thức / mô hình trở thành
chỉ là sự khác biệt (bị ràng buộc).b2=1
y2−y1=b0+b1⋅x
Lưu ý, trong phần trình diễn ở trên, nếu bạn để là biến nhị phân và là thử nghiệm trước và ghép nối điểm kiểm tra bài, thì mô hình khác biệt bị ràng buộc sẽ chỉ là các mẫu độc lập -test để đạt được điểm số , trong khi mô hình khác biệt tối ưu sẽ là thử nghiệm ANCOVA với điểm số trước thử nghiệm được sử dụng làm đồng biến.xy1y2t
Phần 1
Mô hình cho fit2 tốt nhất có thể được nghĩ theo kiểu tương tự như cách tiếp cận khác biệt được sử dụng ở trên. Mặc dù đây là một sự đơn giản hóa (vì tôi cố tình bỏ qua các điều khoản lỗi), mô hình có thể được trình bày dưới dạng
trong đó cho các giá trị và cho các giá trị . Đây là sự đơn giản hóa ... điều này chúng ta hãy viết
Viết theo cách khác, . Trong khi đó mô hình fit1.5 có giá trị để tạo sự khác biệt tối ưu cho phân tích OLS, ở đây
y=b0+b1⋅x+b2⋅t
t=0y1t=1y2y1y2=b0+b1⋅x=b0+b1⋅x+b2
y2−y1=b2b2b2về cơ bản chỉ là sự khác biệt trung bình giữa các giá trị (sau khi kiểm soát các hiệp phương sai khác).
y
Phần 2
Vì vậy, sự khác biệt giữa các mô hình fit2 và fit3 ... thực sự, rất ít. Mô hình fit3 tính đến sự tương quan trong các điều khoản lỗi, nhưng điều này chỉ thay đổi quá trình ước tính, và do đó, sự khác biệt giữa hai đầu ra mô hình sẽ là tối thiểu (ngoài thực tế là fit3 ước tính hệ số tự phát).
Phần 2.5
Và tôi sẽ đưa thêm một mô hình nữa vào cuộc thảo luận này
fit4 <- lmer (y ~ time + x1 + x2 + (1 | id), data = df.long)
Mô hình hiệu ứng hỗn hợp này thực hiện một phiên bản hơi khác của cách tiếp cận tự động. Nếu chúng ta bao gồm hệ số thời gian trong các hiệu ứng ngẫu nhiên, thì điều này sẽ tương đương với việc tính toán sự khác biệt giữa các cho mỗi đối tượng. (Nhưng, điều này sẽ không hoạt động ... và mô hình sẽ không chạy.)y
Holland, Paul & Donald Rubin. 1983. On Lord’s Paradox. In Principles of modern psychological measurement: A festchrift for Frederic M. Lord edited by Wainer, Howard & Samuel Messick pgs:3-25. Lawrence Erlbaum Associates. Hillsdale, NJ.