Có bao giờ hợp lệ để bao gồm một tương tác hai chiều trong một mô hình mà không bao gồm các hiệu ứng chính? Điều gì sẽ xảy ra nếu giả thuyết của bạn chỉ liên quan đến sự tương tác, bạn vẫn cần bao gồm các hiệu ứng chính?
Có bao giờ hợp lệ để bao gồm một tương tác hai chiều trong một mô hình mà không bao gồm các hiệu ứng chính? Điều gì sẽ xảy ra nếu giả thuyết của bạn chỉ liên quan đến sự tương tác, bạn vẫn cần bao gồm các hiệu ứng chính?
Câu trả lời:
Theo kinh nghiệm của tôi, không chỉ cần có tất cả các hiệu ứng bậc thấp hơn trong mô hình khi chúng được kết nối với các hiệu ứng bậc cao hơn, mà điều quan trọng là phải tạo mô hình đúng (ví dụ, cho phép phi tuyến) các hiệu ứng chính dường như không liên quan đến các yếu tố trong các tương tác quan tâm. Đó là bởi vì các tương tác giữa và x 2 có thể là điểm độc lập cho các hiệu ứng chính của x 3 và x 4 . Các tương tác đôi khi dường như là cần thiết bởi vì chúng được cộng tuyến với các biến bị bỏ qua hoặc các thuật ngữ phi tuyến (ví dụ: spline) bị bỏ qua.
Bạn hỏi liệu nó có bao giờ hợp lệ không. Hãy để tôi cung cấp một ví dụ phổ biến, mà việc làm sáng tỏ có thể gợi ý các phương pháp phân tích bổ sung cho bạn.
Ví dụ đơn giản nhất về tương tác là một mô hình với một biến phụ thuộc và hai biến độc lập X , Y ở dạng
với một biến ngẫu nhiên hạn có không kỳ vọng, và sử dụng các thông số α , β ' , γ ' , và δ ' . Nó thường có giá trị kiểm tra xem δ ' xấp xỉ β ' γ ' , bởi vì một biểu thức đại số tương đương với cùng một mô hình là
(nơi , vv).
Từ đâu, nếu có một lý do để giả định , chúng ta có thể hấp thụ nó trong tương lai lỗi ε . Điều này không chỉ mang lại một "tương tác thuần túy", nó còn làm như vậy mà không có một thuật ngữ không đổi. Điều này lần lượt mạnh mẽ đề nghị dùng logarit. Một số độ không đồng nhất trong phần dư - nghĩa là xu hướng phần dư liên quan đến giá trị Z lớn hơn sẽ có giá trị tuyệt đối lớn hơn giá trị trung bình - cũng sẽ chỉ theo hướng này. Sau đó chúng tôi muốn khám phá một công thức thay thế
với lỗi ngẫu nhiên iid . Hơn nữa, nếu chúng ta mong đợi β X và gamma Y là lớn so với 1 , chúng tôi sẽ thay vì chỉ đưa ra các mô hình
Mô hình mới này có chỉ là một tham số duy nhất thay vì bốn thông số ( α , β ' , vv) tùy thuộc vào một mối quan hệ bậc hai ( δ ' = β ' γ ' ), một đơn giản hóa đáng kể.
Tôi không nói rằng đây là một bước cần thiết hoặc thậm chí là duy nhất để thực hiện, nhưng tôi đề nghị rằng sự sắp xếp lại đại số của mô hình này thường đáng để xem xét mỗi khi tương tác đơn lẻ xuất hiện có ý nghĩa.
Một số cách tuyệt vời để khám phá các mô hình có tương tác, đặc biệt là chỉ với hai và ba biến độc lập, xuất hiện trong chương 10 - 13 của EDA của Tukey .
Mặc dù thường được nêu trong sách giáo khoa rằng người ta không bao giờ nên bao gồm một tương tác trong một mô hình mà không có các hiệu ứng chính tương ứng, chắc chắn có những ví dụ mà điều này sẽ có ý nghĩa hoàn hảo. Tôi sẽ cho bạn ví dụ đơn giản nhất mà tôi có thể tưởng tượng.
Giả sử các đối tượng được phân ngẫu nhiên vào hai nhóm được đo hai lần, một lần tại đường cơ sở (nghĩa là ngay sau khi ngẫu nhiên hóa) và một lần sau khi nhóm T được điều trị một số loại, trong khi nhóm C thì không. Sau đó, một mô hình đo lặp lại cho các dữ liệu này sẽ bao gồm hiệu ứng chính cho dịp đo lường (biến giả là 0 cho đường cơ sở và 1 cho theo dõi) và thuật ngữ tương tác giữa nhóm giả (0 cho C, 1 cho T ) và thời gian giả.
Mô hình chặn sau đó ước tính điểm trung bình của các đối tượng ở mức cơ bản (bất kể họ thuộc nhóm nào). Hệ số cho hình nộm nhân dịp đo lường cho thấy sự thay đổi trong nhóm kiểm soát giữa đường cơ sở và theo dõi. Và hệ số cho thuật ngữ tương tác cho biết mức độ thay đổi lớn hơn / nhỏ hơn trong nhóm điều trị so với nhóm đối chứng.
Ở đây, không cần thiết phải bao gồm hiệu ứng chính cho nhóm, bởi vì tại đường cơ sở, các nhóm tương đương theo định nghĩa do ngẫu nhiên.
Tất nhiên người ta có thể lập luận rằng hiệu ứng chính cho nhóm vẫn nên được đưa vào, do đó, trong trường hợp ngẫu nhiên thất bại, điều này sẽ được tiết lộ bởi phân tích. Tuy nhiên, điều đó tương đương với việc kiểm tra các phương tiện cơ bản của hai nhóm đối với nhau. Và có rất nhiều người cau mày khi thử nghiệm về sự khác biệt cơ bản trong các nghiên cứu ngẫu nhiên (tất nhiên, cũng có nhiều người thấy nó hữu ích, nhưng đây là một vấn đề khác).
Lý do để giữ các hiệu ứng chính trong mô hình là để nhận dạng. Do đó, nếu mục đích là suy luận thống kê về từng hiệu ứng, bạn nên giữ các hiệu ứng chính trong mô hình. Tuy nhiên, nếu mục đích lập mô hình của bạn chỉ để dự đoán các giá trị mới, thì việc bao gồm chỉ tương tác là điều hoàn toàn hợp lý nếu điều đó cải thiện độ chính xác dự đoán.
điều này tiềm ẩn trong nhiều câu trả lời mà người khác đã đưa ra nhưng điểm đơn giản là các mô hình w / một thuật ngữ sản phẩm nhưng w / & w / o người điều hành & dự đoán chỉ là các mô hình khác nhau. Chỉ ra những gì mỗi phương tiện đưa ra cho quá trình bạn đang lập mô hình và liệu một mô hình không có người điều hành & dự đoán có ý nghĩa hơn với lý thuyết hoặc giả thuyết của bạn hay không. Quan sát rằng thuật ngữ sản phẩm có ý nghĩa nhưng chỉ khi người điều hành và người dự đoán không được đưa vào thì không cho bạn biết bất cứ điều gì (ngoại trừ có thể bạn đang câu cá vì "ý nghĩa") sẽ giải thích rõ ràng về lý do tại sao nên bỏ qua chúng .
Có thể cho rằng, nó phụ thuộc vào việc bạn đang sử dụng mô hình của mình để làm gì. Nhưng tôi chưa bao giờ thấy một lý do để không chạy và mô tả các mô hình với các hiệu ứng chính, ngay cả trong trường hợp giả thuyết chỉ là về sự tương tác.
Tôi sẽ mượn một đoạn trong cuốn sách Giới thiệu về phân tích sinh tồn bằng Stata của M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko do Stata ấn chỉnh để trả lời câu hỏi của bạn.
Người ta thường đọc rằng các hiệu ứng tương tác chỉ nên được đưa vào mô hình khi các hiệu ứng chính tương ứng cũng được đưa vào, nhưng không có gì sai khi bao gồm cả các hiệu ứng tương tác. [...] Mục tiêu của một nhà nghiên cứu là tham số hóa những gì có khả năng là đúng đối với dữ liệu đang xem xét vấn đề trong tay và không chỉ đơn thuần là tuân theo đơn thuốc.
Cả x và y sẽ tương quan với xy (trừ khi bạn đã thực hiện một biện pháp cụ thể để ngăn chặn điều này bằng cách sử dụng định tâm). Do đó, nếu bạn có được hiệu ứng tương tác đáng kể với cách tiếp cận của mình, nó có thể sẽ lên tới một hoặc nhiều hiệu ứng chính giả dạng như một tương tác. Điều này sẽ không tạo ra kết quả rõ ràng, có thể giải thích. Điều mong muốn là thay vào đó để xem mức độ tương tác có thể giải thích nhiều hơn và trên những gì các hiệu ứng chính làm, bằng cách bao gồm x , y và (tốt nhất là trong bước tiếp theo) xy .
Theo thuật ngữ: có, β 0 được gọi là "hằng số." Mặt khác, "một phần" có ý nghĩa cụ thể trong hồi quy và vì vậy tôi sẽ không sử dụng thuật ngữ đó để mô tả chiến lược của bạn ở đây.
Một số ví dụ thú vị sẽ xuất hiện một lần trong một mặt trăng màu xanh được mô tả tại chủ đề này .
Tôi muốn đề nghị nó chỉ đơn giản là một trường hợp đặc biệt của sự không chắc chắn của mô hình. Từ quan điểm của người Bayes, bạn chỉ cần đối xử với điều này theo cách chính xác giống như cách bạn đối xử với bất kỳ loại không chắc chắn nào khác, bằng cách:
Rất hiếm khi nên bao gồm một thuật ngữ tương tác mà không có các tác động chính liên quan đến nó. David Rindskopf của CCNY đã viết một số bài báo về những trường hợp hiếm hoi đó.
Có nhiều quy trình khác nhau trong tự nhiên chỉ liên quan đến hiệu ứng tương tác và luật pháp giải mã chúng. Ví dụ luật Ohm. Trong tâm lý học, bạn có ví dụ mô hình hiệu suất của Vroom (1964): Hiệu suất = Khả năng x Động lực. Bây giờ, bạn có thể mong đợi tìm thấy một hiệu ứng tương tác đáng kể khi luật này là đúng. Đáng tiếc, đây không phải là trường hợp. Bạn có thể dễ dàng kết thúc bằng việc tìm ra hai hiệu ứng chính và hiệu ứng tương tác không đáng kể (để trình diễn và giải thích thêm, xem Landsheer, van den Wittenboer và Maassen (2006), Nghiên cứu Khoa học Xã hội 35, 274-294). Mô hình tuyến tính không phù hợp lắm để phát hiện các hiệu ứng tương tác; Ohm có thể không bao giờ tìm thấy luật của mình khi anh ta đã sử dụng các mô hình tuyến tính.
Kết quả là, việc giải thích các hiệu ứng tương tác trong các mô hình tuyến tính là khó khăn. Nếu bạn có một lý thuyết dự đoán hiệu ứng tương tác, bạn nên đưa nó vào ngay cả khi không đáng kể. Bạn có thể muốn bỏ qua các hiệu ứng chính nếu lý thuyết của bạn loại trừ các hiệu ứng đó, nhưng bạn sẽ thấy khó khăn, vì các hiệu ứng chính đáng kể thường được tìm thấy trong trường hợp cơ chế tạo dữ liệu thực sự chỉ có hiệu ứng nhân.
Câu trả lời của tôi là: Có, có thể hợp lệ để bao gồm tương tác hai chiều trong một mô hình mà không bao gồm các hiệu ứng chính. Các mô hình tuyến tính là các công cụ tuyệt vời để ước tính kết quả của một lượng lớn các cơ chế tạo dữ liệu, nhưng công thức của chúng không thể dễ dàng được hiểu là một mô tả hợp lệ của cơ chế tạo dữ liệu.
Điều này là khó khăn và đã xảy ra với tôi trong dự án cuối cùng của tôi. Tôi sẽ giải thích nó theo cách này: giả sử bạn có các biến A và B xuất hiện độc lập đáng kể và theo ý nghĩa kinh doanh, bạn nghĩ rằng sự tương tác của A và B có vẻ tốt. Bạn đã bao gồm các tương tác xuất hiện có ý nghĩa nhưng B mất đi ý nghĩa của nó. Bạn sẽ giải thích mô hình của bạn ban đầu bằng cách hiển thị hai kết quả. Kết quả sẽ cho thấy ban đầu B rất có ý nghĩa nhưng khi nhìn thấy ánh sáng của A, nó đã mất đi ánh sáng. Vì vậy, B là một biến tốt nhưng chỉ khi được nhìn thấy dưới nhiều cấp độ khác nhau của A (nếu A là biến phân loại). Nó giống như nói Obama là một nhà lãnh đạo giỏi khi được nhìn thấy dưới ánh sáng của quân đội SEAL. Vì vậy, con dấu Obama * sẽ là một biến số quan trọng. Nhưng Obama khi được nhìn thấy một mình có thể không quan trọng. (Không xúc phạm Obama, chỉ là một ví dụ.)
F = m * a, lực bằng gia tốc khối lượng lần.
Nó không được biểu diễn dưới dạng F = m + a + ma hoặc một số tổ hợp tuyến tính khác của các tham số đó. Thật vậy, chỉ có sự tương tác giữa khối lượng và gia tốc mới có ý nghĩa về mặt vật lý.
Có bao giờ hợp lệ để bao gồm một tương tác hai chiều mà không có tác dụng chính?
Có nó có thể hợp lệ và thậm chí cần thiết. Nếu ví dụ trong 2. bạn sẽ bao gồm một yếu tố cho hiệu ứng chính (sự khác biệt trung bình của điều kiện màu xanh so với màu đỏ) thì điều này sẽ làm cho mô hình tồi tệ hơn.
Điều gì sẽ xảy ra nếu giả thuyết của bạn chỉ liên quan đến sự tương tác, bạn vẫn cần bao gồm các hiệu ứng chính?
Giả thuyết của bạn có thể là độc lập thực sự với việc có một hiệu ứng chính. Nhưng mô hình có thể cần nó để mô tả tốt nhất quá trình cơ bản. Vì vậy, có, bạn nên thử có và không có.
Lưu ý: Bạn cần căn giữa mã cho biến độc lập "liên tục" (đo trong ví dụ). Mặt khác, các hệ số tương tác trong mô hình sẽ không được phân phối đối xứng (không có hệ số cho phép đo đầu tiên trong ví dụ).
Nếu các biến trong câu hỏi là phân loại, thì bao gồm các tương tác không có tác động chính chỉ là một tham số lại của mô hình và việc lựa chọn tham số hóa phụ thuộc vào những gì bạn đang cố gắng thực hiện với mô hình của mình. Tương tác các biến liên tục với quặng biến liên tục khác với các biến phân loại là một câu chuyện hoàn toàn khác. Xem: xem faq này từ Viện Nghiên cứu và Giáo dục Kỹ thuật số của UCLA
Vâng, điều này có thể hợp lệ, mặc dù nó rất hiếm. Nhưng trong trường hợp này, bạn vẫn cần mô hình hóa các hiệu ứng chính, sau đó bạn sẽ thoái lui.
Thật vậy, trong một số mô hình, chỉ có sự tương tác là thú vị, chẳng hạn như thử nghiệm thuốc / mô hình lâm sàng. Đây là ví dụ cơ sở của mô hình Tương tác sinh lý học tổng quát (gPPI): y = ax + bxh + ch
nơi x/y
các voxels / vùng quan tâm và h
các thiết kế khối / sự kiện.
Trong mô hình này, cả hai a
và c
sẽ được hồi quy, chỉ b
được giữ nguyên để suy luận (hệ số beta). Thật vậy, cả hai a
và c
đại diện cho hoạt động giả trong trường hợp của chúng tôi và chỉ b
đại diện cho những gì không thể giải thích bằng hoạt động giả, sự tương tác với nhiệm vụ.
Câu trả lời ngắn: Nếu bạn bao gồm sự tương tác trong các hiệu ứng cố định, thì các hiệu ứng chính sẽ tự động được bao gồm cho dù bạn có đưa chúng vào mã của mình hay không . Sự khác biệt duy nhất là tham số hóa của bạn, nghĩa là các tham số trong mô hình của bạn có ý nghĩa gì (ví dụ: chúng có nghĩa là nhóm hay chúng khác biệt so với các mức tham chiếu).
Tôi chỉ thấy rằng David Beede cung cấp một câu trả lời rất giống nhau (xin lỗi), nhưng tôi nghĩ rằng tôi sẽ để lại điều này cho những người phản ứng tốt với quan điểm đại số tuyến tính.