Tất cả các biến của tôi là liên tục. Không có cấp độ. Có thể thậm chí có tương tác giữa các biến?
Tất cả các biến của tôi là liên tục. Không có cấp độ. Có thể thậm chí có tương tác giữa các biến?
Câu trả lời:
Vâng, tại sao không? Việc xem xét tương tự như đối với các biến phân loại sẽ được áp dụng trong trường hợp này: Ảnh hưởng của đến kết quả Y không giống nhau tùy thuộc vào giá trị của X 2 . Để giúp trực quan hóa nó, bạn có thể nghĩ về các giá trị được lấy bởi X 1 khi X 2 lấy giá trị cao hoặc thấp. Trái ngược với các biến phân loại, ở đây tương tác chỉ được biểu thị bằng sản phẩm của X 1 và X 2 . Lưu ý, tốt hơn hết là tập trung vào hai biến của bạn trước (để hệ số cho X 1 đọc là hiệu ứng của X 1 khi X là ở ý nghĩa mẫu của nó).
Như vui lòng đề xuất bởi @whuber, một cách dễ dàng để xem làm thế nào biến đổi với Y là một hàm của X 2 khi một thuật ngữ tương tác được bao gồm, là để ghi lại những mô hình E ( Y | X ) = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 1 X 2 .
Sau đó, có thể thấy rằng hiệu ứng tăng một đơn vị trong khi X 2 được giữ không đổi có thể được biểu thị bằng:
Bạn có thể xem qua hồi quy bội: thử nghiệm và diễn giải các tương tác , của Leona S. Aiken, Stephen G. West và Raymond R. Reno (Sage Publications, 1996), để biết tổng quan về các loại hiệu ứng tương tác khác nhau trong hồi quy bội . (Đây có lẽ không phải là cuốn sách hay nhất, nhưng nó có sẵn thông qua Google)
Dưới đây là một ví dụ đồ chơi trong R:
library(mvtnorm)
set.seed(101)
n <- 300 # sample size
S <- matrix(c(1,.2,.8,0,.2,1,.6,0,.8,.6,1,-.2,0,0,-.2,1),
nr=4, byrow=TRUE) # cor matrix
X <- as.data.frame(rmvnorm(n, mean=rep(0, 4), sigma=S))
colnames(X) <- c("x1","x2","y","x1x2")
summary(lm(y~x1+x2+x1x2, data=X))
pairs(X)
nơi đầu ra thực sự đọc:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.01050 0.01860 -0.565 0.573
x1 0.71498 0.01999 35.758 <2e-16 ***
x2 0.43706 0.01969 22.201 <2e-16 ***
x1x2 -0.17626 0.01801 -9.789 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.3206 on 296 degrees of freedom
Multiple R-squared: 0.8828, Adjusted R-squared: 0.8816
F-statistic: 743.2 on 3 and 296 DF, p-value: < 2.2e-16
Và đây là cách dữ liệu mô phỏng trông như thế nào:
library(Hmisc)
X$x1b <- cut2(X$x1, g=5) # consider 5 quantiles (60 obs. per group)
coplot(y~x2|x1b, data=X, panel = panel.smooth)
n
(11K) lớn và đang sử dụng MiniTab để thực hiện một Âm mưu tương tác và phải mất mãi để tính toán nhưng không hiển thị gì cả. Tôi chỉ không chắc chắn làm thế nào tôi thấy nếu có tương tác với bộ dữ liệu này.