Tôi tin rằng câu trả lời nhanh một câu cho câu hỏi của bạn,
Khi nào thì thích hợp để điều khiển biến Y và khi nào thì không?
là "tiêu chí cửa sau".
Mô hình nguyên nhân cấu trúc của Judea Pearl có thể cho bạn biết chắc chắn biến nào là đủ (và khi cần thiết) để điều hòa, để suy ra tác động nhân quả của biến này đến biến khác. Cụ thể, điều này được trả lời bằng tiêu chí cửa sau, được mô tả trong trang 19 của bài đánh giá này của Pearl.
Nhắc nhở chính là nó đòi hỏi bạn phải biết mối quan hệ nhân quả giữa các biến (dưới dạng mũi tên định hướng trong biểu đồ). Không có cách nào khác. Đây là nơi mà sự khó khăn và chủ quan có thể xảy ra. Mô hình nguyên nhân cấu trúc của Pearl chỉ cho phép bạn biết cách trả lời đúng câu hỏi được đưa ra cho mô hình nguyên nhân (nghĩa là đồ thị có hướng), tập hợp các mô hình nhân quả có thể được phân phối dữ liệu hoặc cách tìm cấu trúc nguyên nhân bằng cách thực hiện đúng thí nghiệm. Nó không cho bạn biết cách tìm cấu trúc nhân quả đúng chỉ được phân phối dữ liệu. Trong thực tế, nó tuyên bố rằng điều này là không thể nếu không sử dụng kiến thức / trực giác bên ngoài về ý nghĩa của các biến.
Các tiêu chí cửa sau có thể được nêu ra như sau:
Để tìm tác động nhân quả của đến Y , một tập hợp các nút biến S là đủ để được điều hòa miễn là nó thỏa mãn cả hai tiêu chí sau:XY,S
1) Không có phần tử nào trong là hậu duệ của XSX
2) chặn tất cả các đường dẫn "cửa sau" giữa X và YSXY
Ở đây, một "back-door" con đường đơn giản chỉ là một con đường của mũi tên bắt đầu tại và kết thúc với một mũi tên trỏ vào X . (Hướng mà tất cả các mũi tên khác không quan trọng.) Và "chặn", chính nó, là một tiêu chí có ý nghĩa cụ thể, được đưa ra trong trang 11 của liên kết trên. Đây là tiêu chí tương tự mà bạn sẽ đọc khi tìm hiểu về "Phân tách D". Cá nhân tôi thấy rằng chương 8 của Nhận dạng mẫu và Học máy của Giám mục mô tả khái niệm chặn trong phân tách D tốt hơn nhiều so với nguồn Ngọc tôi liên kết ở trên. Nhưng nó như thế này:YX.
Một tập hợp các nút, chặn một đường dẫn giữa X và Y nếu nó thỏa mãn ít nhất một trong các tiêu chí sau:S,XY
1) Một trong các nút trong đường dẫn, cũng ở phát ra ít nhất một mũi tên trên đường dẫn (tức là mũi tên đang chỉ ra khỏi nút)S,
2) Một nút không thuộc cũng không phải là tổ tiên của một nút trong S có hai mũi tên trong đường dẫn "va chạm" với nó (tức là gặp trực tiếp)SS
Đây là một hoặc một tiêu chí, không giống như tiêu chí chung cửa sau là một và tiêu chí.
Để rõ ràng về tiêu chí cửa sau, điều nó nói với bạn là, đối với một mô hình nguyên nhân nhất định, khi điều chỉnh một biến đủ, bạn có thể tìm hiểu tác động nhân quả từ phân phối xác suất của dữ liệu. (Như chúng ta biết, phân phối chung không đủ để tìm hành vi nguyên nhân vì nhiều cấu trúc nhân quả có thể chịu trách nhiệm cho cùng một phân phối. Đây là lý do tại sao mô hình nhân quả cũng được yêu cầu.) Phân phối có thể được ước tính bằng cách sử dụng thống kê thông thường / phương pháp học máy trên dữ liệu quan sát. Miễn là bạn biết rằng cấu trúc nhân quả cho phép điều chỉnh một biến (hoặc tập hợp các biến), ước tính của bạn về tác động nhân quả của một biến này cũng giống như ước tính của bạn về phân phối dữ liệu mà bạn có được thông qua các phương pháp thống kê.
Dưới đây là những gì chúng tôi tìm thấy khi chúng tôi áp dụng tiêu chí cửa sau cho hai sơ đồ của bạn:
Trong trường hợp không thực hiện có tồn tại một con đường trở lại cửa từ đến X . Vì vậy, đúng là Y chặn "tất cả" đường dẫn cửa sau, bởi vì không có đường nào. Tuy nhiên, trong sơ đồ bên trái, Y là hậu duệ trực tiếp của X , trong khi ở sơ đồ bên phải thì không. Do đó, Y tuân theo tiêu chí cửa sau trong sơ đồ bên phải, nhưng không tuân theo bên trái. Đây là những kết quả không đáng ngạc nhiên.ZX.YYX,Y
Có gì là ngạc nhiên, tuy nhiên, đó là trong sơ đồ đúng, miễn là nó là bức tranh hoàn chỉnh, bạn không cần điều kiện về để có được những tác động nhân quả đầy đủ của X trên Z . (Nói một cách khác, các rỗng bộ đáp ứng các tiêu chí back-door, và vì thế, đủ để điều hòa.) Trực giác này là đúng bởi vì giá trị của X là không liên quan đến của Y như vậy cho đủ dữ liệu, bạn có thể chỉ đơn giản là trung bình trong giá trị của Y để cách ly ảnh hưởng của Y trên Z . Một sự phản đối cho đến thời điểm này có thể là dữ liệu bị hạn chế, do đó bạn không có phân phối đại diện củaYXZXYYYZ.Giá trị Y. Nhưng nhớ lại rằng tiêu chí cửa sau giả định rằng bạn có phân phối xác suất của dữ liệu. Trong trường hợp đó bạn phân tích có thể cách ly Y . Đặt lề trên một tập dữ liệu hữu hạn chỉ là ước tính. Ngoài ra, lưu ý rằngrấtkhócókhả năng đây là bức tranh hoàn chỉnh. Có nhiều yếu tố có khả năng tác động bên ngoài mà X . Nếu những yếu tố đó cũng được liên kết với Y theo bất kỳ cách nào, thì phải thực hiện thêm nhiều việc nữa để xem Y có phải được điều hòa hay không, hoặc thậm chí là đủ. Nếu bạn vẽ một mũi tên khác chỉ từ Y đến X thì Y trở nên cần thiết để kiểm soát.YY.X.YYYXY
Tất nhiên, đó là những ví dụ rất đơn giản trong đó trực giác đủ để biết khi nào có thể hoặc không thể kiểm soát được. Nhưng đây là một vài ví dụ nữa khi không rõ ràng bằng cách nhìn vào sơ đồ và bạn có thể sử dụng tiêu chí cửa sau. Đối với sơ đồ sau, chúng tôi hỏi liệu có đủ để kiểm soát Y khi xác định tác động nhân quả của X đến Z không .YYXZ.
Điều đầu tiên cần lưu ý là, trong cả hai trường hợp, không phải là một hậu duệ của X . Vì vậy, nó vượt qua tiêu chí đó. Điều tiếp theo cần lưu ý là, trong cả hai trường hợp, có một số con đường backdoor từ Z đến X . Hai ở sơ đồ bên trái và ba ở bên phải.YX.ZX.
Z←Y→XZ←W→B←A→X. chặn đường dẫn đầu tiên vì đây là nút phát ra mũi tên trực tiếp trong đường dẫn. YYY B,B,YZ←Y→X
Z←W→B→Y→X. khôngchặn đường dẫn này, bởi vì nó là một nút mũi tên phát ra trong đường dẫn. Nó cũng chặn đường dẫn Z ← Y → XY Z←Y→XZ←W→B←A→X,B.
YAWXZB.XZB,BAWBAWXZ
Như tôi đã đề cập trước khi sử dụng tiêu chí cửa sau yêu cầu bạn phải biết mô hình nhân quả (tức là sơ đồ "chính xác" của các mũi tên giữa các biến). Nhưng theo tôi, Mô hình nguyên nhân cấu trúc cũng đưa ra cách tốt nhất và chính thức nhất để tìm kiếm một mô hình như vậy hoặc để biết khi nào việc tìm kiếm là vô ích. Nó cũng có tác dụng phụ tuyệt vời của các thuật ngữ kết xuất như "gây nhiễu", "hòa giải" và "giả mạo" (tất cả đều làm tôi bối rối) lỗi thời. Chỉ cần cho tôi xem hình ảnh và tôi sẽ cho bạn biết những vòng tròn nào nên được kiểm soát.