Thống kê và suy luận nhân quả?


51

Trong bài viết "Thống kê và suy luận nhân quả" năm 1984 , Paul Holland đã đưa ra một trong những câu hỏi cơ bản nhất trong thống kê:

Một mô hình thống kê có thể nói gì về quan hệ nhân quả?

Điều này dẫn đến phương châm của ông:

KHÔNG CÓ NGUYÊN NHÂN KHÔNG CÓ HƯỚNG DẪN

trong đó nhấn mạnh tầm quan trọng của các hạn chế xung quanh các thí nghiệm xem xét quan hệ nhân quả. Andrew Gelman đưa ra quan điểm tương tự :

"Để tìm hiểu điều gì xảy ra khi bạn thay đổi thứ gì đó, cần phải thay đổi nó." ... Có những điều bạn học được từ việc làm xáo trộn một hệ thống mà bạn sẽ không bao giờ phát hiện ra từ bất kỳ quan sát thụ động nào.

Ý tưởng của ông được tóm tắt trong bài viết này .

Cần cân nhắc những gì khi đưa ra suy luận nguyên nhân từ mô hình thống kê?


2
câu hỏi tuyệt vời: xem thêm câu hỏi liên quan này về số liệu thống kê tương quan và nguyên nhân.stackexchange.com/questions/534/ ích
Jeromy Anglim


5
Để nhiều điều để nói. Nhưng bạn có thể đọc cuốn sách "Nhân quả" của Pearl (2002, nhưng phiên bản thứ 2 mới hơn), hoặc cuốn sách "Suy luận nhân quả" của Hernan và Robins (2015, bản nháp điện tử miễn phí trực tuyến nếu bạn tìm kiếm).

Câu trả lời:


28

Đây là một câu hỏi rộng, nhưng với trích dẫn của Box, Hunter và Hunter là đúng, tôi nghĩ những gì nó được đưa ra là

  1. Chất lượng của thiết kế thí nghiệm:

    • ngẫu nhiên, cỡ mẫu, kiểm soát các yếu tố gây nhiễu, ...
  2. Chất lượng thực hiện của thiết kế:

    • Tuân thủ giao thức, lỗi đo lường, xử lý dữ liệu, ...
  3. Chất lượng của mô hình để phản ánh chính xác thiết kế:

    • cấu trúc chặn được trình bày chính xác, mức độ tự do thích hợp được liên kết với các hiệu ứng, các công cụ ước tính không thiên vị, ...

Có nguy cơ nêu rõ ràng tôi sẽ cố gắng nhấn vào các điểm chính của mỗi điểm:

  1. là một lĩnh vực thống kê lớn, nhưng ở dạng cơ bản nhất, tôi nghĩ rằng thực tế là khi suy luận nguyên nhân, chúng ta lý tưởng bắt đầu với các đơn vị giống hệt nhau được theo dõi trong các môi trường giống hệt nhau ngoài việc được chỉ định điều trị. Bất kỳ sự khác biệt có hệ thống giữa các nhóm sau khi bị ám sát đều được quy cho một cách hợp lý cho việc điều trị (chúng ta có thể suy ra nguyên nhân). Nhưng, thế giới không tốt đẹp và các đơn vị khác nhau trước khi điều trị và thoát khỏi các thí nghiệm không được kiểm soát hoàn hảo. Vì vậy, chúng tôi "kiểm soát những gì chúng tôi có thể và ngẫu nhiên hóa những gì chúng tôi không thể", điều này giúp đảm bảo rằng sẽ không có sự thiên vị có hệ thống do các yếu tố gây nhiễu mà chúng tôi kiểm soát hoặc ngẫu nhiên. Một vấn đề là các thí nghiệm có xu hướng khó (không thể) và đắt tiền và một loạt các thiết kế lớn đã được phát triển để trích xuất hiệu quả càng nhiều thông tin càng tốt trong một thiết lập được kiểm soát cẩn thận nhất có thể, với chi phí. Một số trong số này khá nghiêm ngặt (ví dụ trong y học, thử nghiệm mù đôi, ngẫu nhiên, có đối chứng giả dược) và một số khác thì ít hơn (ví dụ như nhiều dạng 'thí nghiệm gần đúng').

  2. cũng là một vấn đề lớn và một vấn đề mà các nhà thống kê thường không nghĩ tới ... mặc dù chúng ta nên làm vậy. Trong công việc thống kê được áp dụng, tôi có thể nhớ lại các sự cố trong đó "hiệu ứng" được tìm thấy trong dữ liệu là kết quả không nhất quán của việc thu thập hoặc xử lý dữ liệu. Tôi cũng tự hỏi mức độ thường xuyên thông tin về các tác động quan tâm nhân quả thực sự bị mất do những vấn đề này (tôi tin rằng sinh viên trong các ngành khoa học ứng dụng thường không được đào tạo về những cách mà dữ liệu có thể bị hỏng - nhưng tôi đang lạc đề ở đây ...)

  3. là một chủ đề kỹ thuật lớn khác, và một bước cần thiết khác trong suy luận nguyên nhân khách quan. Ở một mức độ nhất định, điều này được quan tâm bởi vì đám đông thiết kế cùng nhau phát triển các thiết kế và mô hình (vì suy luận từ một mô hình là mục tiêu, các thuộc tính của thiết kế ổ đĩa ước tính). Nhưng điều này chỉ đưa chúng ta đến nay bởi vì trong 'thế giới thực', chúng ta kết thúc việc phân tích dữ liệu thử nghiệm từ các thiết kế không phải trong sách giáo khoa và sau đó chúng ta phải suy nghĩ kỹ về những thứ như các điều khiển thích hợp và cách chúng nên nhập vào mô hình và mức độ liên quan của nên tự do và liệu các giả định có được đáp ứng hay không nếu không làm thế nào để điều chỉnh các vi phạm và mức độ mạnh mẽ của các công cụ ước tính đối với bất kỳ vi phạm nào còn lại và ...

Dù sao, hy vọng một số điều trên giúp suy nghĩ về những cân nhắc trong việc đưa ra suy luận nguyên nhân từ một mô hình. Tôi đã quên bất cứ điều gì lớn?


3
Một điểm cộng rất lớn cho điểm 2. Khác với việc trải qua khóa đào tạo bảo vệ đối tượng của con người, tôi chưa bao giờ nhận được một khóa đào tạo nhỏ nhất về thu thập và lưu trữ dữ liệu. Làm cho việc thu thập dữ liệu đúng là rất quan trọng hơn nhiều so với phân tích.
Matt Parker

Tôi cũng muốn trả lời, nhưng tôi sợ không còn gì để thêm vào những gì Kingsford nói.
Joris Meys

7

Ngoài câu trả lời xuất sắc ở trên, có một phương pháp thống kê có thể giúp bạn tiến gần hơn đến việc chứng minh nhân quả. Đó là Nhân quả Granger chứng minh rằng một biến độc lập xảy ra trước một biến phụ thuộc có ảnh hưởng nhân quả hay không. Tôi giới thiệu phương pháp này một cách dễ dàng để trình bày theo liên kết sau:

http://www.sl slideshoware.net/gaetanlion/granger-causality-presentation

Tôi cũng áp dụng phương pháp này để kiểm tra các lý thuyết kinh tế vĩ mô cạnh tranh: http://www.sl slideshoware.net/gaetanlion/ecusiness-theory-testing-presentation

Hãy lưu ý rằng phương pháp này không hoàn hảo. Nó chỉ xác nhận rằng một số sự kiện nhất định xảy ra trước những sự kiện khác và những sự kiện đó dường như có mối quan hệ định hướng nhất quán. Điều này dường như đòi hỏi nhân quả thực sự nhưng không phải lúc nào cũng như vậy. Cuộc gọi buổi sáng của gà trống không làm cho mặt trời mọc.


4

Một mô hình thống kê có thể nói gì về quan hệ nhân quả? Cần cân nhắc những gì khi đưa ra suy luận nguyên nhân từ mô hình thống kê?

Điều đầu tiên cần làm rõ là bạn không thể suy luận nguyên nhân từ một mô hình thống kê thuần túy. Không có mô hình thống kê nào có thể nói bất cứ điều gì về quan hệ nhân quả mà không có giả định nguyên nhân. Đó là, để làm cho suy luận nhân quả, bạn cần một mô hình nhân quả .

Ngay cả trong một cái gì đó được coi là tiêu chuẩn vàng, chẳng hạn như Thử nghiệm ngẫu nhiên (RCTs), bạn cần đưa ra các giả định nguyên nhân để tiến hành. Hãy để tôi làm rõ điều này. Ví dụ: giả sử là thủ tục ngẫu nhiên, xử lý lãi và kết quả quan tâm. Khi giả định một RCT hoàn hảo, đây là những gì bạn đang giả định:ZXY

nhập mô tả hình ảnh ở đây

Trong trường hợp này để mọi thứ hoạt động tốt. Tuy nhiên, giả sử bạn có tuân thủ không hoàn hảo dẫn đến một mối quan hệ xấu hổ giữa và . Sau đó, bây giờ, RCT của bạn trông như thế này:P(Y|do(X))=P(Y|X)XY

nhập mô tả hình ảnh ở đây

Bạn vẫn có thể thực hiện một ý định để điều trị phân tích. Nhưng nếu bạn muốn ước tính hiệu quả thực tế của mọi thứ không còn đơn giản nữa. Đây là một cài đặt biến công cụ và bạn có thể xác định hoặc thậm chí xác định hiệu ứng nếu bạn thực hiện một số giả định tham số .X

Điều này có thể thậm chí còn phức tạp hơn. Bạn có thể có các vấn đề lỗi đo lường, các đối tượng có thể bỏ nghiên cứu hoặc không làm theo hướng dẫn, trong số các vấn đề khác. Bạn sẽ cần phải đưa ra các giả định về cách những điều đó có liên quan đến thủ tục với suy luận. Với dữ liệu quan sát "thuần túy", điều này có thể gây ra nhiều vấn đề hơn, bởi vì thông thường các nhà nghiên cứu sẽ không có ý tưởng tốt về quy trình tạo dữ liệu.

Do đó, để rút ra các kết luận nguyên nhân từ các mô hình, bạn cần đánh giá không chỉ các giả định thống kê của nó, mà quan trọng nhất là các giả định nguyên nhân của nó. Dưới đây là một số mối đe dọa phổ biến để phân tích nguyên nhân:

  • Dữ liệu không đầy đủ / không chính xác
  • Số lượng quan tâm nhân quả mục tiêu không được xác định rõ (Hiệu ứng nhân quả mà bạn muốn xác định là gì? Dân số mục tiêu là gì?)
  • Bối rối (gây nhiễu không quan sát)
  • Lựa chọn thiên vị (tự chọn, mẫu cắt ngắn)
  • Lỗi đo lường (có thể gây nhiễu, không chỉ nhiễu)
  • Saipecification (ví dụ, hình thức chức năng sai)
  • Vấn đề giá trị bên ngoài (suy luận sai về dân số mục tiêu)

Đôi khi, yêu cầu vắng mặt của những vấn đề này (hoặc yêu cầu giải quyết những vấn đề này) có thể được hỗ trợ bởi chính thiết kế của nghiên cứu. Đó là lý do tại sao dữ liệu thử nghiệm thường đáng tin cậy hơn. Tuy nhiên, đôi khi, mọi người sẽ bỏ qua những vấn đề này bằng lý thuyết hoặc để thuận tiện. Nếu lý thuyết là mềm (như trong khoa học xã hội), sẽ khó hơn để đưa ra kết luận theo mệnh giá.

Bất cứ khi nào bạn nghĩ rằng có một giả định không thể sao lưu, bạn nên đánh giá mức độ nhạy cảm của kết luận đối với các vi phạm hợp lý của các giả định đó --- điều này thường được gọi là phân tích độ nhạy.


Nó sẽ tương đương với việc thay thế mũi tên hai chiều đứt nét bằng hai mũi tên rắn một hướng từ một nút bổ sung?
Taylor

@Taylor có, một nút bổ sung tiềm ẩn (không quan sát).
Carlos Cinelli
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.