Bao gồm các tương tác nhưng không phải là các hiệu ứng chính trong một mô hình


85

Có bao giờ hợp lệ để bao gồm một tương tác hai chiều trong một mô hình mà không bao gồm các hiệu ứng chính? Điều gì sẽ xảy ra nếu giả thuyết của bạn chỉ liên quan đến sự tương tác, bạn vẫn cần bao gồm các hiệu ứng chính?


3
Triết lý của tôi là chạy rất nhiều mô hình, kiểm tra dự đoán của họ, so sánh, giải thích, chạy nhiều mô hình hơn.
Michael Giám mục

11
Nếu các tương tác chỉ có ý nghĩa khi các hiệu ứng chính có trong mô hình, thì có thể các hiệu ứng chính là đáng kể và các tương tác thì không. Xem xét một hiệu ứng chính có ý nghĩa cao với phương sai theo thứ tự 100 và một hiệu ứng chính không đáng kể khác mà tất cả các giá trị xấp xỉ một giá trị có phương sai rất thấp. Tương tác của chúng không đáng kể, nhưng hiệu ứng tương tác sẽ có vẻ đáng kể nếu loại bỏ các hiệu ứng chính khỏi mô hình.
Thomas Levine

4
@Thomas dòng đầu tiên của bạn có nên đọc 'nếu các tương tác chỉ có ý nghĩa khi các hiệu ứng chính KHÔNG có trong mô hình, ...'?
Glen

2
Ồ vâng, nó nên!
Thomas Levine

Câu trả lời:


55

Theo kinh nghiệm của tôi, không chỉ cần có tất cả các hiệu ứng bậc thấp hơn trong mô hình khi chúng được kết nối với các hiệu ứng bậc cao hơn, mà điều quan trọng là phải tạo mô hình đúng (ví dụ, cho phép phi tuyến) các hiệu ứng chính dường như không liên quan đến các yếu tố trong các tương tác quan tâm. Đó là bởi vì các tương tác giữa x 2 có thể là điểm độc lập cho các hiệu ứng chính của x 3x 4 . Các tương tác đôi khi dường như là cần thiết bởi vì chúng được cộng tuyến với các biến bị bỏ qua hoặc các thuật ngữ phi tuyến (ví dụ: spline) bị bỏ qua.x1x2x3x4


1
Điều này có nghĩa là chúng ta nên bắt đầu xóa các điều khoản từ y ~ x1 * x2 * x3 * x4, bắt đầu xóa các điều khoản theo thứ tự cao nhất, tức là phương thức xóa thông thường, phải không?
Tò mò

9
Việc xóa các thuật ngữ không được khuyến khích trừ khi bạn có thể kiểm tra toàn bộ các lớp thuật ngữ dưới dạng "chunk". Ví dụ, có thể hợp lý để giữ hoặc xóa tất cả các điều khoản tương tác hoặc giữ hoặc xóa tất cả các tương tác là thứ 3 hoặc thứ 4.
Frank Harrell

Có gì sai khi chỉ xóa một số tương tác theo một thứ tự cụ thể?
dùng1205901

3
Nếu bạn có một đơn đặt hàng hoàn toàn được chỉ định trước mà không được xác định bằng cách xem dữ liệu, thì bạn có thể ổn để làm điều đó. Nói chung, bạn sẽ có các vấn đề đồng tuyến tính và đa bội khi đưa ra nhiều quyết định sử dụng nhiều giá trị P.
Frank Harrell

2
Tôi cảm thấy câu trả lời này không rõ ràng, và chỉ trả lời một phần câu hỏi. Thật vậy, câu trả lời này nói rằng cần phải mô hình hóa hiệu ứng chính, nhưng không trả lời liệu có hợp lệ để hồi quy nó chỉ tập trung vào tương tác, mà nó được sử dụng trong một số mô hình như gPPI (xem câu trả lời của tôi phía dưới).
gabious

37

Bạn hỏi liệu nó có bao giờ hợp lệ không. Hãy để tôi cung cấp một ví dụ phổ biến, mà việc làm sáng tỏ có thể gợi ý các phương pháp phân tích bổ sung cho bạn.

Ví dụ đơn giản nhất về tương tác là một mô hình với một biến phụ thuộc và hai biến độc lập X , Y ở dạngZXY

Z=α+βX+γY+δXY+ε,

với một biến ngẫu nhiên hạn có không kỳ vọng, và sử dụng các thông số α , β ' , γ ' ,δ ' . Nó thường có giá trị kiểm tra xem δ ' xấp xỉ β ' γ ' , bởi vì một biểu thức đại số tương đương với cùng một mô hình làεα,β,γ,δδβγ

Z=α(1+βX+γY+δXY)+ε

=α(1+βX)(1+γY)+α(δβγ)XY+ε

(nơi , vv).β=αβ

Từ đâu, nếu có một lý do để giả định , chúng ta có thể hấp thụ nó trong tương lai lỗi ε . Điều này không chỉ mang lại một "tương tác thuần túy", nó còn làm như vậy mà không có một thuật ngữ không đổi. Điều này lần lượt mạnh mẽ đề nghị dùng logarit. Một số độ không đồng nhất trong phần dư - nghĩa là xu hướng phần dư liên quan đến giá trị Z lớn hơn sẽ có giá trị tuyệt đối lớn hơn giá trị trung bình - cũng sẽ chỉ theo hướng này. Sau đó chúng tôi muốn khám phá một công thức thay thế(δβγ)0εZ

log(Z)=log(α)+log(1+βX)+log(1+γY)+τ

với lỗi ngẫu nhiên iid . Hơn nữa, nếu chúng ta mong đợi β Xgamma Y là lớn so với 1 , chúng tôi sẽ thay vì chỉ đưa ra các mô hìnhτβXγY1

log(Z)=(log(α)+log(β)+log(γ))+log(X)+log(Y)+τ

=η+log(X)+log(Y)+τ.

Mô hình mới này có chỉ là một tham số duy nhất thay vì bốn thông số ( α , β ' , vv) tùy thuộc vào một mối quan hệ bậc hai ( δ ' = β ' γ ' ), một đơn giản hóa đáng kể.ηαβδ=βγ

Tôi không nói rằng đây là một bước cần thiết hoặc thậm chí là duy nhất để thực hiện, nhưng tôi đề nghị rằng sự sắp xếp lại đại số của mô hình này thường đáng để xem xét mỗi khi tương tác đơn lẻ xuất hiện có ý nghĩa.

Một số cách tuyệt vời để khám phá các mô hình có tương tác, đặc biệt là chỉ với hai và ba biến độc lập, xuất hiện trong chương 10 - 13 của EDA của Tukey .


Bạn có thể cung cấp một ví dụ khi bạn sẽ có thể giả định sẽ xấp xỉ bằng không? Thật khó cho tôi khi nghĩ về những điều khoản đó liên quan đến các điều khoản ban đầu và ý nghĩa của chúng. δβγ
djhocking

@djhocking Bất kỳ tình huống trong đó việc xây dựng thay thế là một mô hình tốt nhất thiết sẽ bao hàm trong mô hình đầu tiên. Một trường hợp đặc biệt là mô hình cuối cùng, là mối quan hệ tuyến tính đơn giản giữa log ( Z ) và log của XY , tương đương với mối quan hệ nhân Z X Y trên thang đo ban đầu. Các mối quan hệ như vậy rất nhiều trong tự nhiên - nó chỉ đơn giản nói Z là trực tiếp và riêng tương ứng với cả XY .α(δβγ)0log(Z)XYZXYZXY
whuber

30

Mặc dù thường được nêu trong sách giáo khoa rằng người ta không bao giờ nên bao gồm một tương tác trong một mô hình mà không có các hiệu ứng chính tương ứng, chắc chắn có những ví dụ mà điều này sẽ có ý nghĩa hoàn hảo. Tôi sẽ cho bạn ví dụ đơn giản nhất mà tôi có thể tưởng tượng.

Giả sử các đối tượng được phân ngẫu nhiên vào hai nhóm được đo hai lần, một lần tại đường cơ sở (nghĩa là ngay sau khi ngẫu nhiên hóa) và một lần sau khi nhóm T được điều trị một số loại, trong khi nhóm C thì không. Sau đó, một mô hình đo lặp lại cho các dữ liệu này sẽ bao gồm hiệu ứng chính cho dịp đo lường (biến giả là 0 cho đường cơ sở và 1 cho theo dõi) và thuật ngữ tương tác giữa nhóm giả (0 cho C, 1 cho T ) và thời gian giả.

Mô hình chặn sau đó ước tính điểm trung bình của các đối tượng ở mức cơ bản (bất kể họ thuộc nhóm nào). Hệ số cho hình nộm nhân dịp đo lường cho thấy sự thay đổi trong nhóm kiểm soát giữa đường cơ sở và theo dõi. Và hệ số cho thuật ngữ tương tác cho biết mức độ thay đổi lớn hơn / nhỏ hơn trong nhóm điều trị so với nhóm đối chứng.

Ở đây, không cần thiết phải bao gồm hiệu ứng chính cho nhóm, bởi vì tại đường cơ sở, các nhóm tương đương theo định nghĩa do ngẫu nhiên.

Tất nhiên người ta có thể lập luận rằng hiệu ứng chính cho nhóm vẫn nên được đưa vào, do đó, trong trường hợp ngẫu nhiên thất bại, điều này sẽ được tiết lộ bởi phân tích. Tuy nhiên, điều đó tương đương với việc kiểm tra các phương tiện cơ bản của hai nhóm đối với nhau. Và có rất nhiều người cau mày khi thử nghiệm về sự khác biệt cơ bản trong các nghiên cứu ngẫu nhiên (tất nhiên, cũng có nhiều người thấy nó hữu ích, nhưng đây là một vấn đề khác).


4
Các vấn đề phát sinh khi phép đo thời gian bằng không (đường cơ sở) được sử dụng làm biến phản ứng đầu tiên. Đường cơ sở thường được sử dụng làm tiêu chí đầu vào cho nghiên cứu. Ví dụ, một nghiên cứu có thể ghi nhận bệnh nhân có huyết áp tâm thu (bp)> 140, sau đó chọn ngẫu nhiên 2 lần điều trị và theo dõi bps. Ban đầu, bp có phân phối cắt ngắn và các phép đo sau sẽ đối xứng hơn. Thật lộn xộn khi mô hình 2 hình dạng phân phối trong cùng một mô hình. Có nhiều lý do hơn để coi đường cơ sở là hiệp phương sai.
Frank Harrell

3
Đó là một điểm tốt, nhưng các nghiên cứu gần đây cho thấy rằng đây không phải là một vấn đề. Trên thực tế, dường như có nhiều bất lợi hơn khi sử dụng điểm số cơ bản như là một đồng biến. Xem: Liu, GF, et al. (2009). Đường cơ sở nên là biến số đồng biến hay phụ thuộc trong phân tích thay đổi so với đường cơ sở trong các thử nghiệm lâm sàng? Thống kê trong Y học, 28, 2509-2530.
Wolfgang

3
Tôi đã đọc bài báo đó. Điều đó không thuyết phục và Liu đã không nghiên cứu nhiều loại tình huống thử nghiệm lâm sàng mà tôi mô tả. Nhiều đối số hơn có tại biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/c thuyết2.pdf trong chương về phân tích dữ liệu nối tiếp (theo chiều dọc).
Frank Harrell

1
Cảm ơn các liên kết. Tôi giả sử bạn đang đề cập đến cuộc thảo luận theo 8.2.3. Đó là một số điểm thú vị, nhưng tôi không nghĩ rằng điều này mang lại một câu trả lời chắc chắn. Tôi chắc chắn rằng bài báo của Liu et al. cũng không phải là câu trả lời cuối cùng, nhưng nó gợi ý ví dụ rằng tính phi quy tắc của các giá trị cơ bản không phải là vấn đề cốt yếu. Có lẽ đây là một cái gì đó cho một mục thảo luận riêng biệt, vì nó không liên quan trực tiếp đến câu hỏi của OP.
Wolfgang

2
Vâng, nó phụ thuộc vào số lượng không bình thường. Tại sao phụ thuộc vào vận may khi xây dựng mô hình? Ngoài ra còn có nhiều lý do triết học thuần túy để coi các phép đo thời gian bằng 0 là các phép đo cơ bản (xem trích dẫn từ Senn và Rochon trong ghi chú của tôi).
Frank Harrell

19

Lý do để giữ các hiệu ứng chính trong mô hình là để nhận dạng. Do đó, nếu mục đích là suy luận thống kê về từng hiệu ứng, bạn nên giữ các hiệu ứng chính trong mô hình. Tuy nhiên, nếu mục đích lập mô hình của bạn chỉ để dự đoán các giá trị mới, thì việc bao gồm chỉ tương tác là điều hoàn toàn hợp lý nếu điều đó cải thiện độ chính xác dự đoán.


5
Bạn có thể vui lòng nói rõ hơn một chút về vấn đề nhận dạng không?
ocram

6
Tôi không tin rằng một mô hình bỏ qua các hiệu ứng chính nhất thiết không được xác định. Có lẽ bạn có nghĩa là "khả năng diễn giải" chứ không phải là "nhận dạng" (là một thuật ngữ kỹ thuật với định nghĩa chính xác)
JMS

6
@JMS: Vâng, nó giết chết khả năng diễn giải. Tuy nhiên, thuật ngữ "nhận dạng" được sử dụng khác nhau bởi các nhà thống kê và các nhà khoa học xã hội. Tôi có nghĩa là cái sau, trong đó (nói một cách lỏng lẻo) bạn muốn xác định từng tham số thống kê với một cấu trúc cụ thể. Bằng cách loại bỏ hiệu ứng chính, bạn không còn có thể kết hợp cấu trúc với tham số.
Galit Shmueli

13

điều này tiềm ẩn trong nhiều câu trả lời mà người khác đã đưa ra nhưng điểm đơn giản là các mô hình w / một thuật ngữ sản phẩm nhưng w / & w / o người điều hành & dự đoán chỉ là các mô hình khác nhau. Chỉ ra những gì mỗi phương tiện đưa ra cho quá trình bạn đang lập mô hình và liệu một mô hình không có người điều hành & dự đoán có ý nghĩa hơn với lý thuyết hoặc giả thuyết của bạn hay không. Quan sát rằng thuật ngữ sản phẩm có ý nghĩa nhưng chỉ khi người điều hành và người dự đoán không được đưa vào thì không cho bạn biết bất cứ điều gì (ngoại trừ có thể bạn đang câu cá vì "ý nghĩa") sẽ giải thích rõ ràng về lý do tại sao nên bỏ qua chúng .


Tôi đến đây để điều tra giải thích về các tác động chính với sự hiện diện của một thuật ngữ tương tác quan trọng và câu trả lời này thực sự giúp ích rất nhiều. Cảm ơn!
Patrick Williams

9

Có thể cho rằng, nó phụ thuộc vào việc bạn đang sử dụng mô hình của mình để làm gì. Nhưng tôi chưa bao giờ thấy một lý do để không chạy và mô tả các mô hình với các hiệu ứng chính, ngay cả trong trường hợp giả thuyết chỉ là về sự tương tác.


Điều gì xảy ra nếu sự tương tác chỉ có ý nghĩa khi các hiệu ứng chính không có trong mô hình?
Glen

3
@Glen - Có nhiều điều cần suy nghĩ ngoài ý nghĩa thống kê. Xem này . Tốt hơn để kiểm tra mức độ phù hợp của mô hình tổng thể của bạn (vẽ số dư của bạn theo dự đoán của bạn cho từng mô hình bạn phù hợp), lý thuyết và động lực của bạn để lập mô hình.
Michael Giám mục

7

Tôi sẽ mượn một đoạn trong cuốn sách Giới thiệu về phân tích sinh tồn bằng Stata của M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko do Stata ấn chỉnh để trả lời câu hỏi của bạn.

Người ta thường đọc rằng các hiệu ứng tương tác chỉ nên được đưa vào mô hình khi các hiệu ứng chính tương ứng cũng được đưa vào, nhưng không có gì sai khi bao gồm cả các hiệu ứng tương tác. [...] Mục tiêu của một nhà nghiên cứu là tham số hóa những gì có khả năng là đúng đối với dữ liệu đang xem xét vấn đề trong tay và không chỉ đơn thuần là tuân theo đơn thuốc.


3
Lời khuyên hoàn toàn khủng khiếp.
Frank Harrell

3
@Frank, bạn có phiền mở rộng nhận xét của mình không? Về mặt này, "tham số hóa những gì có khả năng là đúng với dữ liệu" có ý nghĩa rất lớn.
whuber

6
Xem số liệu thống kê.stackexchange.com/questions / 11009 / . Dữ liệu không có khả năng cho bạn biết điều gì là đúng và cách tiếp cận như vậy phụ thuộc rất nhiều vào nguồn gốc đo lường cho các biến được nhân lên. Đánh giá hiệu ứng tương tác biệt lập của nhiệt độ ở Fahrenheit sẽ cho một bức tranh khác so với khi sử dụng Celsius.
Frank Harrell

@Frank: Cảm ơn, tôi đã tìm thấy nó :-). Bây giờ nó là một phần của chủ đề này.
whuber

7

Cả xy sẽ tương quan với xy (trừ khi bạn đã thực hiện một biện pháp cụ thể để ngăn chặn điều này bằng cách sử dụng định tâm). Do đó, nếu bạn có được hiệu ứng tương tác đáng kể với cách tiếp cận của mình, nó có thể sẽ lên tới một hoặc nhiều hiệu ứng chính giả dạng như một tương tác. Điều này sẽ không tạo ra kết quả rõ ràng, có thể giải thích. Điều mong muốn là thay vào đó để xem mức độ tương tác có thể giải thích nhiều hơn và trên những gì các hiệu ứng chính làm, bằng cách bao gồm x , y và (tốt nhất là trong bước tiếp theo) xy .

Theo thuật ngữ: có, β 0 được gọi là "hằng số." Mặt khác, "một phần" có ý nghĩa cụ thể trong hồi quy và vì vậy tôi sẽ không sử dụng thuật ngữ đó để mô tả chiến lược của bạn ở đây.

Một số ví dụ thú vị sẽ xuất hiện một lần trong một mặt trăng màu xanh được mô tả tại chủ đề này .


7

Tôi muốn đề nghị nó chỉ đơn giản là một trường hợp đặc biệt của sự không chắc chắn của mô hình. Từ quan điểm của người Bayes, bạn chỉ cần đối xử với điều này theo cách chính xác giống như cách bạn đối xử với bất kỳ loại không chắc chắn nào khác, bằng cách:

  1. Tính xác suất của nó, nếu nó là đối tượng quan tâm
  2. Tích hợp hoặc tính trung bình cho nó, nếu nó không được quan tâm, nhưng vẫn có thể ảnh hưởng đến kết luận của bạn

Hint:The interaction between A and B is significant
DI
P(Hint|DI)=P(Hint|I)P(D|HintI)P(D|I)
P(D|HintI)
P(D|HintI)=m=1NMP(DMm|HintI)=m=1NMP(Mm|HintI)P(D|MmHintI)
MmNM
P(Hint|DI)=P(Hint|I)P(D|I)m=1NMP(Mm|HintI)P(D|MmHintI)
=1P(D|I)m=1NMP(DMm|I)P(MmHintD|I)P(DMm|I)=m=1NMP(Mm|DI)P(Hint|DMmI)

P(Hint|DMmI)P(Mm|DI)1P(Hint|DMjI)P(Hint|DMkI)


5

Rất hiếm khi nên bao gồm một thuật ngữ tương tác mà không có các tác động chính liên quan đến nó. David Rindskopf của CCNY đã viết một số bài báo về những trường hợp hiếm hoi đó.


5

Có nhiều quy trình khác nhau trong tự nhiên chỉ liên quan đến hiệu ứng tương tác và luật pháp giải mã chúng. Ví dụ luật Ohm. Trong tâm lý học, bạn có ví dụ mô hình hiệu suất của Vroom (1964): Hiệu suất = Khả năng x Động lực. Bây giờ, bạn có thể mong đợi tìm thấy một hiệu ứng tương tác đáng kể khi luật này là đúng. Đáng tiếc, đây không phải là trường hợp. Bạn có thể dễ dàng kết thúc bằng việc tìm ra hai hiệu ứng chính và hiệu ứng tương tác không đáng kể (để trình diễn và giải thích thêm, xem Landsheer, van den Wittenboer và Maassen (2006), Nghiên cứu Khoa học Xã hội 35, 274-294). Mô hình tuyến tính không phù hợp lắm để phát hiện các hiệu ứng tương tác; Ohm có thể không bao giờ tìm thấy luật của mình khi anh ta đã sử dụng các mô hình tuyến tính.

Kết quả là, việc giải thích các hiệu ứng tương tác trong các mô hình tuyến tính là khó khăn. Nếu bạn có một lý thuyết dự đoán hiệu ứng tương tác, bạn nên đưa nó vào ngay cả khi không đáng kể. Bạn có thể muốn bỏ qua các hiệu ứng chính nếu lý thuyết của bạn loại trừ các hiệu ứng đó, nhưng bạn sẽ thấy khó khăn, vì các hiệu ứng chính đáng kể thường được tìm thấy trong trường hợp cơ chế tạo dữ liệu thực sự chỉ có hiệu ứng nhân.

Câu trả lời của tôi là: Có, có thể hợp lệ để bao gồm tương tác hai chiều trong một mô hình mà không bao gồm các hiệu ứng chính. Các mô hình tuyến tính là các công cụ tuyệt vời để ước tính kết quả của một lượng lớn các cơ chế tạo dữ liệu, nhưng công thức của chúng không thể dễ dàng được hiểu là một mô tả hợp lệ của cơ chế tạo dữ liệu.


4

Điều này là khó khăn và đã xảy ra với tôi trong dự án cuối cùng của tôi. Tôi sẽ giải thích nó theo cách này: giả sử bạn có các biến A và B xuất hiện độc lập đáng kể và theo ý nghĩa kinh doanh, bạn nghĩ rằng sự tương tác của A và B có vẻ tốt. Bạn đã bao gồm các tương tác xuất hiện có ý nghĩa nhưng B mất đi ý nghĩa của nó. Bạn sẽ giải thích mô hình của bạn ban đầu bằng cách hiển thị hai kết quả. Kết quả sẽ cho thấy ban đầu B rất có ý nghĩa nhưng khi nhìn thấy ánh sáng của A, nó đã mất đi ánh sáng. Vì vậy, B là một biến tốt nhưng chỉ khi được nhìn thấy dưới nhiều cấp độ khác nhau của A (nếu A là biến phân loại). Nó giống như nói Obama là một nhà lãnh đạo giỏi khi được nhìn thấy dưới ánh sáng của quân đội SEAL. Vì vậy, con dấu Obama * sẽ là một biến số quan trọng. Nhưng Obama khi được nhìn thấy một mình có thể không quan trọng. (Không xúc phạm Obama, chỉ là một ví dụ.)


1
Đây là loại ngược lại. Sự tương tác (quan tâm) chỉ có ý nghĩa khi các hiệu ứng chính không có trong mô hình.
Glen

3

F = m * a, lực bằng gia tốc khối lượng lần.

Nó không được biểu diễn dưới dạng F = m + a + ma hoặc một số tổ hợp tuyến tính khác của các tham số đó. Thật vậy, chỉ có sự tương tác giữa khối lượng và gia tốc mới có ý nghĩa về mặt vật lý.


2
Những gì áp dụng cho một phương trình vật lý không thể chuyển đổi không có chỗ cho tính biến thiên không nhất thiết phải áp dụng hoặc không nhất thiết là đúng hay chính xác hoặc hiệu quả khi mô hình hóa dữ liệu được đặc trưng bởi tính biến thiên.
rolando2

2

Tương tác có và không có tác dụng chính.  Màu xanh là một điều kiện.  Đỏ khác.  Hiệu ứng tương ứng của chúng được thử nghiệm qua ba lần đo liên tiếp.

Có bao giờ hợp lệ để bao gồm một tương tác hai chiều mà không có tác dụng chính?

Có nó có thể hợp lệ và thậm chí cần thiết. Nếu ví dụ trong 2. bạn sẽ bao gồm một yếu tố cho hiệu ứng chính (sự khác biệt trung bình của điều kiện màu xanh so với màu đỏ) thì điều này sẽ làm cho mô hình tồi tệ hơn.

Điều gì sẽ xảy ra nếu giả thuyết của bạn chỉ liên quan đến sự tương tác, bạn vẫn cần bao gồm các hiệu ứng chính?

Giả thuyết của bạn có thể là độc lập thực sự với việc có một hiệu ứng chính. Nhưng mô hình có thể cần nó để mô tả tốt nhất quá trình cơ bản. Vì vậy, có, bạn nên thử có và không có.

Lưu ý: Bạn cần căn giữa mã cho biến độc lập "liên tục" (đo trong ví dụ). Mặt khác, các hệ số tương tác trong mô hình sẽ không được phân phối đối xứng (không có hệ số cho phép đo đầu tiên trong ví dụ).


1

Nếu các biến trong câu hỏi là phân loại, thì bao gồm các tương tác không có tác động chính chỉ là một tham số lại của mô hình và việc lựa chọn tham số hóa phụ thuộc vào những gì bạn đang cố gắng thực hiện với mô hình của mình. Tương tác các biến liên tục với quặng biến liên tục khác với các biến phân loại là một câu chuyện hoàn toàn khác. Xem: xem faq này từ Viện Nghiên cứu và Giáo dục Kỹ thuật số của UCLA


1

Vâng, điều này có thể hợp lệ, mặc dù nó rất hiếm. Nhưng trong trường hợp này, bạn vẫn cần mô hình hóa các hiệu ứng chính, sau đó bạn sẽ thoái lui.

Thật vậy, trong một số mô hình, chỉ có sự tương tác là thú vị, chẳng hạn như thử nghiệm thuốc / mô hình lâm sàng. Đây là ví dụ cơ sở của mô hình Tương tác sinh lý học tổng quát (gPPI): y = ax + bxh + chnơi x/ycác voxels / vùng quan tâm và hcác thiết kế khối / sự kiện.

Trong mô hình này, cả hai acsẽ được hồi quy, chỉ bđược giữ nguyên để suy luận (hệ số beta). Thật vậy, cả hai acđại diện cho hoạt động giả trong trường hợp của chúng tôi và chỉ bđại diện cho những gì không thể giải thích bằng hoạt động giả, sự tương tác với nhiệm vụ.


1

Câu trả lời ngắn: Nếu bạn bao gồm sự tương tác trong các hiệu ứng cố định, thì các hiệu ứng chính sẽ tự động được bao gồm cho dù bạn có đưa chúng vào mã của mình hay không . Sự khác biệt duy nhất là tham số hóa của bạn, nghĩa là các tham số trong mô hình của bạn có ý nghĩa gì (ví dụ: chúng có nghĩa là nhóm hay chúng khác biệt so với các mức tham chiếu).

ABA+B+ABAB

YN(ξ,σ2In)XAXBXABξ{XA,XB,XAB}ξ{XAB}{XAB}={XA,XB,XAB}

Tôi chỉ thấy rằng David Beede cung cấp một câu trả lời rất giống nhau (xin lỗi), nhưng tôi nghĩ rằng tôi sẽ để lại điều này cho những người phản ứng tốt với quan điểm đại số tuyến tính.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.