Làm thế nào để giải thích thuật ngữ tương tác trong công thức lm trong R?


9

Trong R, nếu tôi gọi lm()hàm theo cách sau:

lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)

Điều này sẽ cho tôi một mô hình tuyến tính của biến phản ứng với var1, var2và sự tương tác giữa chúng. Tuy nhiên, làm thế nào chính xác để chúng ta giải thích số lượng thuật ngữ tương tác?

Tài liệu nói rằng đây là "chữ thập" giữa var1var2, nhưng nó không đưa ra lời giải thích về chính xác "chữ thập" là gì.

Nó sẽ hữu ích cho tôi để biết những con số R chính xác đang tính toán để kết hợp sự tương tác giữa hai biến.


Bạn có muốn biết cụ thể R tạo ma trận thiết kế cho công thức này như thế nào không, hay bạn quan tâm rộng rãi hơn đến cách diễn giải thuật ngữ nhân ("tương tác") như vậy theo mô hình được trang bị?
Momo

Tôi quan tâm nhiều hơn đến cách diễn giải thuật ngữ nhân này. Ví dụ, nếu tôi muốn viết ra một công thức tuyến tính (một công thức toán học, không phải là R ...), tôi nên đặt gì cho thuật ngữ nhân?
Enzo

Để giải thích ý nghĩa của chữ thập, hãy xem tính toán var3 <- var 1 * var2sau đó xây dựnglm.2 <- lm(response ~ var1 + var2 + var3)
James Stanley

1
Vì vậy, nó chỉ đơn giản là phép nhân nhập cảnh?
Enzo

1
@Enzo, vâng, thánh giá là thật sự là hai nhiệm kỳ nhân - giải thích phần lớn sẽ phụ thuộc vào việc var1var2cả hai đều liên tục (khá khó để giải thích, theo ý kiến của tôi) hay một trong số này là ví dụ nhị phân phân loại (. Dễ dàng hơn để xem xét) Xem câu trả lời này cho một số ví dụ giải thích của Peter Flom: stats.stackexchange.com/a/45512/16974
James Stanley

Câu trả lời:


8

Cách tiêu chuẩn để viết phương trình dự đoán cho mô hình của bạn là:

y^=b0+b1x1+b2x2+b12x1x2

Nhưng hiểu được sự tương tác sẽ dễ dàng hơn một chút nếu chúng ta yếu tố này khác nhau:

y^=(b0+b2x2)+(b1+b12x2)x1

Với bao thanh toán này, chúng ta có thể thấy rằng với giá trị đã cho là phần chặn y cho là và độ dốc trên là . Vì vậy, mối quan hệ giữa và phụ thuộc vào .x 1 b 0 + b 2x 2 x 1 ( b 1 + b 12x 2 ) yx2x1b0+b2x2x1(b1+b12x2)yx 2x1x2

Một cách khác để hiểu điều này là bằng cách vẽ các đường dự đoán giữa và cho các giá trị khác nhau của (hoặc ngược lại). Các chức năng và chức năng trong gói Dạy học dành cho R được thiết kế để trợ giúp với các loại ô này.x 1 x 2yx1x2Predict.PlotTkPredict


3

Giả sử bạn nhận được ước tính điểm là 4 cho , 2 cho và 1,5 cho tương tác. Sau đó, phương trình nói rằng sự phù hợp làx 2x1x2lm

y=4x1+2x2+1.5x1x2

Là những gì bạn muốn?


3

Dễ nhất là nghĩ về các tương tác về các biến rời rạc. Có lẽ bạn có thể đã nghiên cứu ANOVAs hai chiều, trong đó chúng tôi có hai biến nhóm (ví dụ: giới tính và độ tuổi, với ba cấp độ tuổi) và đang xem xét cách chúng liên quan đến một số đo liên tục (biến phụ thuộc của chúng tôi, ví dụ IQ).

Thuật ngữ x1 * x2, nếu có ý nghĩa, có thể được hiểu (trong ví dụ tầm thường, trang điểm này) khi IQ hành xử khác nhau theo các độ tuổi đối với các giới tính khác nhau. Ví dụ, có thể IQ ổn định đối với nam ở ba nhóm tuổi, nhưng nữ trẻ bắt đầu dưới nam trẻ và có quỹ đạo đi lên (với nhóm tuổi già có ý nghĩa cao hơn so với nhóm tuổi đối với nam). Trong một âm mưu có nghĩa, điều này sẽ ngụ ý một đường ngang cho nam ở giữa biểu đồ và có lẽ là một đường 45 độ cho nữ bắt đầu bên dưới nam nhưng kết thúc ở trên nam.

Ý chính là khi bạn di chuyển dọc theo các cấp của một biến (hoặc "giữ hằng số X1"), những gì đang diễn ra trong các biến khác sẽ thay đổi. Giải thích này cũng hoạt động với các biến dự đoán liên tục, nhưng không dễ để minh họa cụ thể. Trong trường hợp đó, bạn có thể muốn lấy các giá trị cụ thể của X1 và X2 và xem điều gì xảy ra với Y.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.