Chúng ta có thể hình dung một "tương tác" giữa các biến hồi quy và như một sự khởi đầu từ một mối quan hệ tuyến tính hoàn hảox1x2 trong đó mối quan hệ giữa một biến hồi quy và đáp ứng là khác nhau đối với các giá trị khác nhau của các biến hồi quy khác. "Thuật ngữ tương tác" thông thường, theo nghĩa được giải thích dưới đây, là một "khởi hành" đơn giản nhất như vậy.
Định nghĩa và khái niệm
"Mối quan hệ tuyến tính" đơn giản có nghĩa là mô hình thông thường trong đó chúng tôi cho rằng phản hồi khác với kết hợp tuyến tính của (và hằng số) bởi các lỗi độc lập, không có nghĩa làYxTôiε :
Y= β0+ β1x1+ β2x2+ ε .(*)
"Tương tác", theo nghĩa chung nhất, có nghĩa là các tham số có thể phụ thuộc vào các biến khác.βTôi
Cụ thể, trong ví dụ này chỉ có hai biến hồi quy, chúng ta có thể viết chung chung
β1= β1( x2) Và β2= β2( x1) .
Phân tích
Bây giờ, trong thực tế, không ai ngoại trừ một nhà vật lý lý thuyết thực sự tin rằng mô hình là hoàn toàn chính xác: đó là một sự gần đúng với sự thật và, chúng tôi hy vọng, một mô hình gần gũi. Theo đuổi ý tưởng này hơn nữa, chúng tôi có thể hỏi liệu chúng tôi có thể xấp xỉ tương tự các hàm với các hàm tuyến tính trong trường hợp chúng tôi cần mô hình hóa một số loại tương tác. Cụ thể, chúng tôi có thể cố gắng viết( ∗ )Β iβTôi
β1( x2) = γ0+ γ1x2+ lỗi nhỏ1;
β2( x1) = δ0+ δ1x1+ lỗi nhỏ2.
Chúng ta hãy xem nơi dẫn đến. Việc cắm các xấp xỉ tuyến tính này vào ( ∗ ) sẽ cho
Y= β0+ β1( x2) x1+ β2( x1) x2+ ε= β0+ ( γ0+ γ1x2+ lỗi nhỏ1) x1+ ( δ0+ δ1x1+ lỗi nhỏ2) x2+ ε= β0+ γ0x1+ δ0x2+ ( γ1+ δ1) x1x2+ ...
trong đó " " biểu thị tổng lỗi,Giáo dục
Cẩu = ( lỗi nhỏ1) x1+ ( lỗi nhỏ2) x2+ ε .
Với bất kỳ may mắn nào, nhân hai "lỗi nhỏ" đó với các giá trị điển hình của sẽ (a) không tương xứng so với hoặc (b) có thể được coi là thuật ngữ ngẫu nhiên, khi được thêm vào (và có thể điều chỉnh thuật ngữ không đổi để phù hợp với bất kỳ sai lệch hệ thống nào) có thể được coi là một thuật ngữ lỗi ngẫu nhiên. xTôiεεβ0
Trong cả hai trường hợp, với một sự thay đổi ký hiệu, chúng ta thấy rằng mô hình tương tác gần đúng tuyến tính này có dạng
Y= β0+ β1x1+ β2x2+ β12x1x2+ Ε ,(**)
đó chính xác là mô hình hồi quy "tương tác" thông thường. (Lưu ý rằng không có tham số mới nào, cũng không phải , có cùng số lượng ban đầu được biểu thị bằng các thuật ngữ đó trong )ε( ∗ ) .
Quan sát cách phát sinh thông qua sự thay đổi trong cả hai tham số ban đầu. Nó ghi lại sự kết hợp của (i) cách hệ số của phụ thuộc vào (cụ thể là thông qua ) và (ii) hệ số của phụ thuộc vào (thông qua ).β12x1x2γ1x2x1δ1
Một số hậu quả
Một kết quả của phân tích này là nếu chúng ta sửa tất cả trừ một trong các biến hồi quy, thì (theo điều kiện ), đáp ứng vẫn là một hàm tuyến tính của biến hồi quy còn lại. Y Chẳng hạn, nếu chúng tôi sửa giá trị của thì chúng tôi có thể viết lại mô hình tương tác thànhx2,( ∗ ∗ )
Y= ( β0+ β2x2) + ( β1+ β12x2) x1+ Ε ,
trong đó phần chặn là và độ dốc (nghĩa là hệ số ) là Điều này cho phép mô tả dễ dàng và cái nhìn sâu sắc. Về mặt hình học, bề mặt được cho bởi hàmβ0+ β2x2x1β1+ β2x2.
f( x1, x2) = β0+ β1x1+ β2x2+ β12x1x2
được cai trị: khi chúng ta cắt nó song song với một trong hai trục tọa độ, kết quả luôn luôn là một đường thẳng. (Tuy nhiên, bản thân bề mặt không phải là mặt phẳng trừ khi Thật vậy, nó ở khắp mọi nơi có độ cong Gaussian âm.)β12= 0.
Cuối cùng, nếu hy vọng của chúng tôi về (a) hoặc (b) không được triển khai, chúng tôi có thể mở rộng thêm hành vi chức năng của ban đầu để bao gồm các điều khoản của đơn hàng thứ hai trở lên. Thực hiện phân tích tương tự cho thấy điều này sẽ đưa ra các điều khoản có dạng v.v. Theo nghĩa này, bao gồm một thuật ngữ tương tác (sản phẩm) chỉ là bước đầu tiên - và đơn giản nhất - hướng tới việc mô hình hóa các mối quan hệ phi tuyến giữa phản hồi và các biến hồi quy bằng các hàm đa thức.βTôix21, x22, x1x22, x21x2,
Cuối cùng, trong sách giáo khoa EDA (Addison-Wesley 1977), John Tukey đã chỉ ra cách tiếp cận này có thể được thực hiện rộng rãi hơn nhiều. Sau lần đầu tiên "diễn đạt lại" (nghĩa là áp dụng các phép biến đổi phi tuyến tính phù hợp cho) các biến hồi quy và đáp ứng, thường là trường hợp mô hình áp dụng cho các biến được chuyển đổi hoặc, nếu không, mô hình có thể dễ dàng phù hợp (sử dụng phân tích mạnh mẽ của phần dư). Điều này cho phép rất nhiều mối quan hệ phi tuyến tính được thể hiện và diễn giải như các phản ứng tuyến tính có điều kiện.( ∗ )( ∗ ∗ )