Hồi quy kiểm duyệt: Tại sao chúng ta tính một thuật ngữ * sản phẩm * giữa các yếu tố dự đoán?


12

Các phân tích hồi quy được kiểm duyệt thường được sử dụng trong các ngành khoa học xã hội để đánh giá sự tương tác giữa hai hoặc nhiều yếu tố dự đoán / hiệp phương sai.

Thông thường, với hai biến dự đoán, mô hình sau được áp dụng:

Y = β 0 + β 1 * X + β 2 * M + β 3 * X M + eY=β0+β1X+β2M+β3XM+e

Lưu ý rằng kiểm tra kiểm duyệt được vận hành bởi thuật ngữ sản phẩm X MXM (phép nhân giữa biến độc lập XX và biến điều hành MM ). Câu hỏi rất cơ bản của tôi là: tại sao chúng ta thực sự tính một thuật ngữ sản phẩm giữa XXMM ? Tại sao không, ví dụ, sự khác biệt tuyệt đối | M - X ||MX|hay chỉ là tổng X + MX+M ?

Thật thú vị, Kenny ám chỉ vấn đề này tại đây http://davidakenny.net/cm/modutions.htmlm bằng cách nói: "Như sẽ thấy, thử nghiệm kiểm duyệt không phải lúc nào cũng được vận hành bởi thuật ngữ sản phẩm XM" nhưng không có lời giải thích nào thêm . Một minh họa chính thức hoặc bằng chứng sẽ được khai sáng, tôi đoán / hy vọng.

Câu trả lời:


12

"Người điều hành" ảnh hưởng đến các hệ số hồi quy của YY so với XX : chúng có thể thay đổi khi giá trị của người điều hành thay đổi. Do đó, trong tổng quát, mô hình hồi quy đơn giản của kiểm duyệt là

E ( Y ) = α ( M ) + β ( M ) X

E(Y)=α(M)+β(M)X

nơi ααββcác chức năng của người điều hành MM chứ không phải là hằng số không bị ảnh hưởng bởi giá trị của MM .

Với tinh thần tương tự, trong đó hồi quy được xây dựng trên một xấp xỉ tuyến tính của mối quan hệ giữa XXYY , chúng ta có thể hy vọng rằng cả ααββ là - ít nhất là khoảng - hàm tuyến tính của MM trong suốt loạt các giá trị của MM trong dữ liệu:

E ( Y ) = α 0 + α 1 M + O ( M 2 ) + ( β 0 + β 1 M + O ( M 2 ) ) X= Α 0 + β 0 X + α 1 M + β 1 M X + O ( M 2 ) + O ( M 2 ) X .

E(Y)=α0+α1M+O(M2)+(β0+β1M+O(M2))X=α0+β0X+α1M+β1MX+O(M2)+O(M2)X.

Việc bỏ các thuật ngữ phi tuyến ("big-O"), với hy vọng chúng quá nhỏ để tạo ra mô hình tương tác nhân (song tuyến tính)

E ( Y ) = α 0 + β 0 X + α 1 M + β 1 M X .

E(Y)=α0+β0X+α1M+β1MX.(1)

Đạo hàm này gợi ý một cách giải thích thú vị về các hệ số: α 1 là tốc độ M thay đổi giao thoa trong khi β 1 là tốc độ M thay đổi độ dốc . ( Α 0β 0 là độ dốc và đánh chặn khi M là (chính thức) thiết lập để không.) Β 1 là hệ số của "hạn sản phẩm" M X . Nó trả lời câu hỏi theo cách này:α1Mβ1Mα0β0Mβ1MX

Chúng tôi mô hình điều độ với một thuật ngữ sản phẩm M XMX khi chúng ta mong đợi người điều hành MM sẽ (xấp xỉ trung bình) có mối quan hệ tuyến tính với độ dốc của YY vs XX .


Điều đáng quan tâm là sự phát sinh này chỉ ra cách mở rộng tự nhiên của mô hình, điều này có thể gợi ý các cách để kiểm tra mức độ phù hợp. Nếu bạn không quan tâm đến tính phi tuyến tính trong X -X bạn có thể biết hoặc cho rằng mô hình ( 1 )(1) là chính xác - thì bạn sẽ muốn mở rộng mô hình để phù hợp với các điều khoản đã bị loại bỏ:

E ( Y ) = α 0 + β 0 X + α 1 M + β 1 M X + α 2 M 2 + β 2 M 2 X .

E(Y)=α0+β0X+α1M+β1MX+α2M2+β2M2X.

Kiểm tra giả thuyết α 2 = β 2 = 0 đánh giá lại sự tốt lành của sự phù hợp. Ước tính α 2β 2 có thể chỉ ra những gì mô hình cách ( 1 ) có thể cần phải được mở rộng: kết hợp phi tuyến trong M (khi α 20 ) hoặc một mối quan hệ cách kiểm duyệt phức tạp hơn (khi β 20 ) hoặc có thể là cả hai. (Lưu ý rằng thử nghiệm này sẽ không được đề xuất bởi việc mở rộng chuỗi lũy thừa của hàm chung f ( X ,α2=β2=0α2β2(1)Mα20β20M ) .)f(X,M)


Cuối cùng, nếu bạn phát hiện ra rằng hệ số tương tác β 1 không khác biệt đáng kể so với 0, nhưng sự phù hợp là không tuyến tính (bằng chứng là giá trị đáng kể của β 2 ), thì bạn sẽ kết luận (a) có kiểm duyệt nhưng ( b) nó không được mô hình hóa bởi một M X hạn, nhưng thay vào đó bằng một số thuật ngữ bậc cao bắt đầu với M 2 X . Đây có thể là loại hiện tượng mà Kenny đang đề cập.β1β2MXM2X


8

Nếu bạn sử dụng tổng số các yếu tố dự đoán để mô hình hóa sự tương tác của chúng, phương trình của bạn sẽ là:

Y= Β 0 + β 1 X + β 2 M + β 3 ( X + M ) + e= Β 0 + β 1 X + β 2 M + β 3 X + β 3 M + e= β 0 + ( β 1 + β 3 ) X + ( β 2 + β 3 ) M + e= Β 0 + β ' 1 X + β ' 2 M + e

Y====β0+β1X+β2M+β3(X+M)+eβ0+β1X+β2M+β3X+β3M+eβ0+(β1+β3)X+(β2+β3)M+eβ0+β1X+β2M+e

nơi β ' 1 = β 1 + β 3β ' 2 = β 2 + β 3 . Do đó, mô hình của bạn sẽ không có tương tác nào cả. Rõ ràng, đây không phải là trường hợp với sản phẩm.β1=β1+β3β2=β2+β3

Recall the definition of the absolute value:

|XM|={XM,XMMX,X<M

|XM|={XM,MX,XMX<M

Although you can reduce the model β0+β1X+β2M+β3|XM|+eβ0+β1X+β2M+β3|XM|+e to the one with only XX and MM terms, using the def. of |XM||XM|, the absolute value is a "specialized form of moderation that is unlikely to be realistic in many situations", as pointed out in the comment below.


1
Actually, including an |XM||XM| term is demonstrably a form of moderation: the value of MM changes β2β2. It is, however, a limited, specialized form of moderation that is unlikely to be realistic in many situations. It is not correct to say that such a model has "only main effects."
whuber

1
Yes, you are right, |XM||XM| is a form of moderation, I got carried away by transformation and will edit the answer accordingly. Thanks for pointing this out.
Milos

@Milos: Your example about the sum of predictors was an eye-opener, a somewhat embarrassing one, I must say because I should have already realized the mathematical implications ;) whuber: As far as I understand it, the absolute value is only useful when both predictor variables are measured in same units (e.g. two psychometric tests, using the same metric, such as z-scores or T-scores). The absolute difference between X and M is a useful metric, although not the only possible one (i.e. the prodcut term could also be used).
denominator

6

You won't find a formal proof for using multiplicative moderator. You can support this approach by other means. For instance, look at the Taylor-MacLaurin expansion of a function f(X,M)f(X,M):

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

If you plug a function of this form f(X,M)=β0+βXX+βMM+βXMXMf(X,M)=β0+βXX+βMM+βXMXM into the Taylor equation, you get this:

f(X,M)=β0+βXX+βMM+βXMXM

f(X,M)=β0+βXX+βMM+βXMXM

So, the rationale here is that this particular multiplicative form of the moderation is basically a second order Taylor approximation of a generic moderation relationship f(X,M)f(X,M)

UPDATE: if you include quadratic terms, as @whuber suggested then this will happen: g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
plug this into Taylor: g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

This shows that our new model g(X,M)g(X,M) with quadratic terms corresponds to a full second order Taylor approximation, unlike the original moderation model f(X,M)f(X,M).


Since the basis of your argument is the Taylor expansion, why did you not also include the other two quadratic terms X2X2 and M2M2? True, they are not forms of moderation, but their inclusion in the model usually will affect βXMβXM.
whuber

@whuber, I decided to keep the post short - that's the main reason. Otherwise, I started writing about my preference to include second order terms whenever you have a cross term, then cut it out.
Aksakal
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.