Luận cứ về tương tác trong cuốn sách Tại sao


7

Có một đoạn về các tương tác trong Cuốn sách tại sao (Pearl & Mackenzie, 2018), Chương 9 (Tôi không thể chia sẻ số trang vì tôi có cuốn sách ở định dạng epub), trong đó các tác giả cho rằng:

Tuy nhiên, phương trình 9.4 giữ tự động trong một tình huống, không cần phải gọi các phản ứng rõ ràng. Đó là trường hợp của một mô hình nhân quả tuyến tính, thuộc loại mà chúng ta đã thấy trong Chương 8. Như đã thảo luận ở đó, các mô hình tuyến tính không cho phép các tương tác , có thể là một ưu điểm và nhược điểm. Đó là một đức tính theo nghĩa nó làm cho phân tích hòa giải dễ dàng hơn nhiều, nhưng đó là một nhược điểm nếu chúng ta muốn mô tả một quá trình nhân quả trong thế giới thực có liên quan đến các tương tác. [Nhấn mạnh của tôi]

Phương trình 9,4 là

Total Effect = Direct Effect + Indirect Effect

Họ đã lặp lại một lập luận tương tự trước đó trong Chương 8:

Mặt khác, các mô hình tuyến tính không thể biểu diễn các đường cong phản ứng liều không phải là các đường thẳng. Chúng không thể đại diện cho các hiệu ứng ngưỡng, chẳng hạn như một loại thuốc có tác dụng tăng lên đến một liều lượng nhất định và sau đó không có tác dụng nữa. Chúng cũng không thể biểu diễn các tương tác giữa các biến . Chẳng hạn, một mô hình tuyến tính không thể mô tả một tình huống trong đó một biến tăng cường hoặc ức chế ảnh hưởng của biến khác. (Ví dụ: Giáo dục có thể nâng cao hiệu quả của Trải nghiệm bằng cách đưa cá nhân vào một công việc theo dõi nhanh hơn, được tăng lương hàng năm lớn hơn.) [Nhấn mạnh mỏ]

Và trong Chương 7:

Cũng nên nhớ rằng điều chỉnh dựa trên hồi quy * chỉ hoạt động cho các mô hình tuyến tính, liên quan đến một giả định mô hình chính. Với các mô hình tuyến tính, chúng ta mất khả năng mô hình các tương tác phi tuyến, chẳng hạn như khi hiệu ứng của X trên Y phụ thuộc vào mức độ Z. Mặt khác, điều chỉnh cửa sau vẫn hoạt động tốt ngay cả khi chúng ta không biết gì các chức năng là đằng sau các mũi tên trong sơ đồ. Nhưng trong trường hợp được gọi là trường hợp không tham số này, chúng ta cần sử dụng các phương pháp ngoại suy khác để đối phó với lời nguyền của chiều. [Nhấn mạnh của tôi]

Tại sao Pearl & Mackenzie lập luận rằng các mô hình tuyến tính không cho phép tương tác? Tôi có bỏ qua một chi tiết quan trọng và thông tin cụ thể theo ngữ cảnh không?


* Bằng cách điều chỉnh dựa trên hồi quy, các tác giả tham khảo (trong các đoạn trước), cái mà đôi khi chúng ta gọi là "điều khiển" các biến khác: "Tương tự của đường hồi quy là mặt phẳng hồi quy, có phương trình trông giống ... Hệ số cho chúng ta hệ số hồi quy của trên đã được điều chỉnh cho (Nó được gọi là hệ số hồi quy từng phần và được viết .) "Y=aX+bZ+caYXZrYX.Z


trích dẫn của bạn chỉ làm nổi bật câu hỏi, bạn có thể cung cấp thông tin về ví dụ điều chỉnh dựa trên hồi quy là gì.
seanv507

Bằng cách điều chỉnh dựa trên hồi quy, các tác giả tham khảo (trong các đoạn trước), đôi khi chúng ta gọi là "điều khiển" các biến khác: "Tương tự của đường hồi quy là mặt phẳng hồi quy, có phương trình trông giống ... Hệ số cung cấp cho chúng tôi hệ số hồi quy của trên đã được điều chỉnh cho (Nó được gọi là hệ số hồi quy từng phần và được viết .) "Y=aX+bZ+caYXZrYX.Z
TEG

vì vậy có thể thêm điều này vào câu hỏi ... afaik điều này vẫn có thể được thực hiện trên lý thuyết cho các thuật ngữ tương tác, nhưng thường không được thực hiện trong thực tế
seanv507

Câu trả lời:


5

Bạn đang kết hợp tuyến tính trong các tham số với tuyến tính trong các biến. Tuyến tính ở đây đề cập đến mối quan hệ giữa các biến.

Quan điểm của họ trong cuốn sách là, nếu mô hình không tuyến tính trong các biến , thì cả phương trình đều không

Total Effect=Direct Effect+Indirect Effect

giữ, cũng không phải là hệ số hồi quy cung cấp cho bạn điều chỉnh cửa sau thích hợp trực tiếp.

Về trường hợp cuối cùng, ví dụ, hãy xem xét kỳ vọng có điều kiện , đó là tuyến tính đối với với và .E[Y|x,z]=βx+γzXZ

Nếu thỏa mãn tiêu chí cửa sau cho tác động nhân quả của đối với , thìZXY

E[Y|do(x)]x=E[E[Y|x,Z]]x=β

Nghĩa là, hệ số hồi quy bằng hiệu ứng nhân quả cận biên trung bình. Đây là ý nghĩa của "điều chỉnh dựa trên hồi quy" trong trường hợp này, bạn không cần thêm bất kỳ bước nào ở đây --- tất cả các trung bình cần thiết cho điều chỉnh cửa sau được tự động thực hiện bằng hồi quy.β

Bây giờ hãy xem xét kỳ vọng có điều kiện . Lưu ý đây không phải là tuyến tính đối với và (mặc dù nó là tuyến tính trong các tham số).E[Y|x,z]=βx+γz+δ(x×z)xz

Lưu ý trong trường hợp này nếu thỏa mãn tiêu chí cửa sau cho tác động nhân quả của đối với , thìZXY

E[Y|do(x)]x=E[E[Y|x,Z]]x=β+δE[z]

Đó là, việc điều chỉnh backdoor đúng là không được đưa ra bởi các hệ số hồi quy trên chỉ. X

Tổng quát hơn, Pearl đang nói rằng nếu bão hòa tiêu chí cửa sau, bạn có thể sử dụng bất kỳ công cụ ước tính không tham số nào bạn muốn tính toán phân phối sau can thiệp .ZE[Y|do(x)]=E[E[Y|x,Z]]


Cảm ơn bạn, @CarlosCinelli. Tôi biết sự quan tâm của bạn đối với công việc của Pearl từ chủ đề này ( stats.stackexchange.com/a/376925/109647 ) và tôi rất vui vì bạn đã có thời gian để viết câu trả lời ở đây. Nó chi tiết hơn so với câu trả lời trước đó, nhưng về cơ bản là đồng ý với nó. Vì vậy, theo mô hình tuyến tính, Pearl có nghĩa là tuyến tính trong các biến , nhưng không phải trong các tham số . Nhưng, đây là vấn đề của tôi: thuật ngữ tuyến tính trực tuyến trong mô hình tuyến tính không đề cập đến việc tuyến tính trong các biến. Theo như tôi biết, nó không bao giờ làm được
TEG

Như đã nêu trong câu trả lời này ( stats.stackexchange.com/a/8706/109647 ), tuyến tính đề cập đến mối quan hệ giữa các tham số mà bạn đang ước tính và kết quả. Đó là một trong những điều đầu tiên tôi học được trong khóa học hồi quy; bạn có thể mô hình các quan hệ phi tuyến (ví dụ: các số hạng đa thức) trong hồi quy tuyến tính. Chúng tôi duy trì thuật ngữ phi tuyến cho các mô hình không tuyến tính trong các tham số (ví dụ: )y=eβ+ε
TEG

Dường như với tôi rằng tôi không nhầm lẫn bất cứ điều gì, chỉ yêu cầu làm rõ. Cả hai câu trả lời đều sôi nổi về điều này: Pearl có nghĩa là một cái gì đó khác theo mô hình tuyến tính. Nhưng tôi không có lý do gì để chấp nhận sử dụng thuật ngữ Pearl thích. Và các mô hình tuyến tính (như trong tuyến tính trong tham số ) không cho phép tương tác. Nếu những gì tôi bỏ qua chỉ là cách khác nhau của mô hình tuyến tính, sử dụng ở đây, thì tôi sẽ chấp nhận câu trả lời này.
TEG

Xin chào @TEG câu trả lời bạn trích dẫn là nói về mô hình hồi quy. Ở đây chúng ta đang nói về mô hình nhân quả (cấu trúc). Phương trình cấu trúc y = f (x, z) là tuyến tính nếu f (x, z) là hàm tuyến tính của x và z. Bạn có thể ước tính f (x, z) với OLS và các phép biến đổi, nhưng f (x, z) vẫn không tuyến tính. Một mô hình cấu trúc được gọi là tuyến tính nếu tất cả các chức năng là tuyến tính. Đây không chỉ là một sự khác biệt về ngữ nghĩa - nếu mô hình cấu trúc không phải là tuyến tính, như Pearl nói: (1) điều chỉnh cửa sau khác với điều chỉnh hồi quy; và (2) phân tách TE = DE + IE không giữ được
Carlos Cinelli

"Một mô hình cấu trúc được gọi là tuyến tính nếu tất cả các hàm là tuyến tính" trong các biến, phải không? Vì vậy, một mô hình như không phải là tuyến tính trong khung mô hình nguyên nhân. Y=β0+β1X1+β2X2+β3(X1×X2)+ε
TEG

2

Các mô hình "Hoàn toàn tuyến tính" không cho phép điều đó. Nếu bạn muốn mô hình hóa một tương tác bằng cách sử dụng một trường hợp cụ thể của Mô hình tuyến tính chung (đừng nhầm điều này với Mô hình tuyến tính tổng quát), bạn phải giới thiệu một biến phụ nhân tạo giống như sản phẩm của hai mô hình tương tác.

Mô hình mới này vẫn tuyến tính liên quan đến các tham số của nó (đây là vấn đề quan trọng để có được các công cụ ước tính), nhưng nó không còn tuyến tính liên quan đến các biến của nó (bạn không còn có thể nói về mối quan hệ tuyến tính giữa các biến hồi quy và mục tiêu)


1
Cảm ơn bạn. Mô hình "hoàn toàn tuyến tính" là gì? Ngoài ra, các tác giả đã không sử dụng một thuật ngữ như vậy trong cuốn sách.
TEG

1
Họ đã không làm thế. Tôi chỉ làm cho nó lên. Tôi đề cập đến các mô hình tuyến tính liên quan đến cả hai biến và tham số
David
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.