Những lý thuyết nhân quả nào tôi nên biết?


16

Những cách tiếp cận lý thuyết nào về quan hệ nhân quả mà tôi nên biết với tư cách là một nhà thống kê / kinh tế lượng học ứng dụng?

Tôi biết (một chút ít)

Những khái niệm nào tôi bỏ lỡ hoặc tôi nên nhận thức về?

Liên quan: Những lý thuyết nào là nền tảng cho quan hệ nhân quả trong học máy?

Tôi đã đọc những câu hỏi thú vị này và câu trả lời ( 1 , 2 , 3 ) nhưng tôi nghĩ đó là một câu hỏi khác. Và tôi đã rất ngạc nhiên khi thấy rằng "nhân quả", chẳng hạn, không được đề cập trong Các yếu tố của học thống kê .


2
Kiểm tra đánh giá của Andrew Gelman về một số tác phẩm về quan hệ nhân quả trong AJS: Gelman, A. (2011). Nhân quả và học thống kê. Tạp chí Xã hội học Hoa Kỳ, 117 (3), 955-966. doi: 10.1086 / 662659 . Đây là một tổng quan ngắn về tính nhân quả trong khoa học xã hội với các tài liệu tham khảo cụ thể về các tác phẩm của Rubin và Pearl, cũng như một số tác phẩm khác. Một nơi tốt để truy quét các tài liệu tham khảo.
paqmo

1
Để bắt đầu, phương pháp của Mill (John Stuart). vi.wikipedia.org/wiki/Mill's_Methods
noumenal

Xem bình luận của tôi dưới câu trả lời được chấp nhận liên quan đến việc giải thích sai có thể có quan hệ nhân quả Granger ở đó.
Richard Hardy

Câu trả lời:


17

B

Mặc dù gần như không có gì phải bàn cãi rằng một nguyên nhân phải đi trước tác dụng của nó kịp thời, để đưa ra kết luận nguyên nhân theo thời gian trước đó, bạn vẫn cần phải tuyên bố không có sự nhầm lẫn, trong số các nguồn liên kết giả khác.

Bây giờ liên quan đến các kết quả tiềm năng (Neyman-Rubin) so với đồ thị nhân quả / Mô hình phương trình cấu trúc (Pearl), tôi sẽ nói rằng đây là một vấn đề nan giải giả và bạn nên tìm hiểu cả hai.

Đầu tiên, điều quan trọng cần lưu ý là đây không phải là những quan điểm trái ngược về quan hệ nhân quả . Như Pearl nói, có một hệ thống phân cấp liên quan đến các nhiệm vụ suy luận (nhân quả):

  1. Dự đoán quan sát
  2. Dự đoán dưới sự can thiệp
  3. Phản tác dụng

Đối với nhiệm vụ đầu tiên, bạn chỉ cần biết phân phối chung của các biến quan sát. Đối với nhiệm vụ thứ hai, bạn cần biết phân phối chung và cấu trúc nhân quả. Đối với nhiệm vụ cuối cùng, đối với các tác dụng phụ, bạn sẽ cần thêm một số thông tin về các dạng chức năng của mô hình phương trình cấu trúc của bạn.

Vì vậy, khi nói về các tác dụng phụ, có sự tương đương chính thức giữa cả hai quan điểm . Sự khác biệt là các kết quả tiềm năng có các tuyên bố phản tác dụng là nguyên thủy và trong các DAG phản tác dụng dường như xuất phát từ các phương trình cấu trúc. Tuy nhiên, bạn có thể hỏi, nếu chúng "tương đương", tại sao phải học cả hai? Bởi vì có sự khác biệt về "tính dễ dàng" để diễn đạt và rút ra mọi thứ.

Ví dụ: cố gắng diễn đạt khái niệm về M-Bias chỉ bằng các kết quả tiềm năng --- Tôi chưa bao giờ thấy một kết quả tốt. Trên thực tế, kinh nghiệm của tôi cho đến nay là các nhà nghiên cứu chưa bao giờ nghiên cứu đồ thị thậm chí không biết về nó. Ngoài ra, việc đưa ra các giả định thực tế của mô hình của bạn bằng ngôn ngữ đồ họa sẽ giúp việc tính toán có thể kiểm tra theo kinh nghiệm của nó dễ dàng hơn và trả lời các câu hỏi về nhận dạng. Mặt khác, đôi khi mọi người sẽ thấy dễ dàng hơn khi lần đầu tiên nghĩ trực tiếp về chính các phản ứng và kết hợp điều này với các giả định tham số để trả lời các truy vấn rất cụ thể.

Có nhiều điều người ta có thể nói, nhưng vấn đề ở đây là bạn nên học cách "nói cả hai ngôn ngữ". Để tham khảo, bạn có thể kiểm tra làm thế nào để bắt đầu ở đây.


1
Bạn có thể cung cấp một ví dụ về một cái gì đó dễ thể hiện dưới dạng PO, nhưng không phải trong DAG không?
Guilherme Duarte

Chẳng hạn như số lượng hòa giải của @GuilhermeDuarte liên quan đến các phản ứng lồng nhau
Carlos Cinelli

3
AGrangerBABB

@RichardHardy Tôi nghĩ bạn đúng, có thể một con gà trống hoàn hảo luôn gáy một giờ trước khi mặt trời mọc có thể có sức mạnh dự đoán vượt ra ngoài mô hình tuyến tính của chuỗi thời gian mặt trời mọc (vì mặt trời mọc không hoàn toàn giống nhau mỗi ngày), nhưng với một mô hình hoàn hảo nó có lẽ không thêm gì.
Carlos Cinelli

Tôi nghĩ rằng quan hệ nhân quả Granger không đề xuất sử dụng các mô hình dự đoán kém hơn chỉ có lịch sử của B để chứng minh sự cần thiết của một biến A bổ sung và do đó là nhân quả Granger. Thay vào đó, người ta lý tưởng nhắm đến một mô hình tốt nhất có thể bằng cách sử dụng lịch sử B của riêng mình và sau đó xem liệu việc thêm A (dưới một hình thức nào đó) có giúp dự đoán B. Và tất nhiên, "một con gà trống hoàn hảo" là một khái niệm khá không tưởng. Với điều này, tôi nghĩ rằng chỉnh sửa câu trả lời để phản ánh điều này có thể là một ý tưởng tốt.
Richard Hardy
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.