Cuốn sách Tại sao của Judea Pearl: Tại sao anh ta bash số liệu thống kê?


79

Tôi đang đọc cuốn sách Tại sao của Judea Pearl, và nó đang nằm dưới da tôi 1 . Cụ thể, tôi nhận ra rằng anh ta đang bẻ khóa các số liệu thống kê "cổ điển" một cách vô điều kiện bằng cách đưa ra một lập luận người rơm rằng thống kê là không bao giờ, có thể điều tra các mối quan hệ nhân quả, rằng nó không bao giờ quan tâm đến quan hệ nhân quả, và số liệu thống kê "đã trở thành một mô hình doanh nghiệp giảm dữ liệu bị mù ". Thống kê trở thành một từ xấu xí trong cuốn sách của mình.

Ví dụ:

Các nhà thống kê đã vô cùng bối rối về những biến nào nên và không nên kiểm soát, vì vậy thực tế mặc định là kiểm soát mọi thứ người ta có thể đo lường. [...] Đây là một thủ tục đơn giản, thuận tiện để làm theo, nhưng nó vừa lãng phí vừa bị lỗi. Một thành tựu quan trọng của Cách mạng nhân quả là chấm dứt sự nhầm lẫn này.

Đồng thời, các nhà thống kê đánh giá thấp việc kiểm soát theo nghĩa là họ không thích nói về quan hệ nhân quả cả [...]

Tuy nhiên, mô hình nhân quả đã được thống kê như thế, mãi mãi. Ý tôi là, mô hình hồi quy có thể được sử dụng về cơ bản là mô hình nguyên nhân, vì về cơ bản chúng ta giả định rằng một biến là nguyên nhân và một biến khác là hiệu ứng (do đó mối tương quan là cách tiếp cận khác với mô hình hồi quy) và kiểm tra xem mối quan hệ nhân quả này có giải thích các mô hình quan sát được không .

Một trích dẫn khác:

Không có gì ngạc nhiên khi các nhà thống kê đặc biệt tìm thấy câu đố này [Vấn đề Monty Hall] khó hiểu. Họ đã quen với, như RA Fisher (1922) đã nói, "việc giảm dữ liệu" và bỏ qua quá trình tạo dữ liệu.

Điều này làm tôi nhớ đến câu trả lời mà Andrew Gelman đã viết cho phim hoạt hình xkcd nổi tiếng về người Bayes và những người thường xuyên: "Tuy nhiên, tôi nghĩ rằng toàn bộ phim hoạt hình là không công bằng khi nó so sánh một Bayesian nhạy cảm với một nhà thống kê thường xuyên nghe theo lời khuyên của sách giáo khoa nông cạn . "

Số lượng diễn đạt sai của s-word, như tôi nhận thấy, tồn tại trong cuốn sách Judea Pearls khiến tôi tự hỏi liệu suy luận nguyên nhân (mà đến nay tôi nhận thấy là một cách hữu ích và thú vị để tổ chức và kiểm tra giả thuyết khoa học 2 ) có đáng nghi ngờ không.

Câu hỏi: bạn có nghĩ rằng Judea Pearl đang trình bày sai số liệu thống kê, và nếu có, tại sao? Chỉ để làm cho suy luận nhân quả âm thanh lớn hơn nó là? Bạn có nghĩ rằng suy luận nhân quả là một cuộc cách mạng với một chữ R lớn thực sự thay đổi tất cả suy nghĩ của chúng ta?

Biên tập:

Các câu hỏi trên là vấn đề chính của tôi, nhưng vì chúng được thừa nhận, có ý kiến, xin vui lòng trả lời những câu hỏi cụ thể này (1) ý nghĩa của "Cách mạng nguyên nhân" là gì? (2) nó khác với thống kê "chính thống" như thế nào?

1. Cũng bởi vì anh ta là một chàng trai khiêm tốn như vậy .
2. Ý tôi là theo nghĩa khoa học, không thống kê.

EDIT : Andrew Gelman đã viết bài đăng trên blog này trên cuốn sách Judea Pearls và tôi nghĩ anh ấy đã làm một công việc tốt hơn nhiều để giải thích những vấn đề của tôi với cuốn sách này hơn tôi đã làm. Đây là hai trích dẫn:

Trên trang 66 của cuốn sách, Pearl và Mackenzie viết rằng số liệu thống kê đã trở thành một doanh nghiệp giảm dữ liệu mù mô hình. Mày đang nói cái quái gì vậy?? Tôi là một nhà thống kê, tôi đã làm thống kê trong 30 năm, làm việc trong các lĩnh vực từ chính trị đến độc học. Mô hình giảm dữ liệu mù Đó chỉ là nhảm nhí. Chúng tôi sử dụng các mô hình tất cả các thời gian.

Và một số khác:

Nhìn. Tôi biết về tình huống khó xử của người đa nguyên. Một mặt, Pearl tin rằng phương pháp của mình tốt hơn mọi thứ trước đây. Khỏe. Đối với anh ta, và đối với nhiều người khác, chúng là những công cụ tốt nhất hiện có để nghiên cứu suy luận nguyên nhân. Đồng thời, là một người đa nguyên, hoặc một sinh viên của lịch sử khoa học, chúng tôi nhận ra rằng có nhiều cách để nướng bánh. Thật khó để thể hiện sự tôn trọng đối với các phương pháp mà bạn không thực sự làm việc cho mình và đến một lúc nào đó, cách duy nhất để làm điều đó là lùi lại và nhận ra rằng những người thực sự sử dụng những phương pháp này để giải quyết các vấn đề thực sự. Ví dụ, tôi nghĩ rằng việc đưa ra quyết định sử dụng giá trị p là một ý tưởng tồi tệ và thiếu logic về mặt logic dẫn đến nhiều thảm họa khoa học; đồng thời, nhiều nhà khoa học quản lý để sử dụng giá trị p làm công cụ học tập. Tôi nhận ra điều đó. Tương tự như vậy, Tôi muốn Pearl nhận ra rằng bộ máy thống kê, mô hình hồi quy phân cấp, tương tác, hậu phân tầng, học máy, v.v., giải quyết các vấn đề thực sự trong suy luận nguyên nhân. Các phương pháp của chúng tôi, như của Pearl, cũng có thể làm rối tung cả GIG GIGO! Có thể nói đúng là Pearl sẽ tốt hơn khi chuyển sang cách tiếp cận của anh ấy. Nhưng tôi không nghĩ nó giúp được gì khi anh ấy đưa ra những tuyên bố không chính xác về những gì chúng tôi làm.


41
Hồi quy tuyến tính không phải là một mô hình nguyên nhân. Hồi quy tuyến tính đơn giản giống như tương quan cặp, sự khác biệt duy nhất là chuẩn hóa . Vì vậy, nếu bạn nói rằng hồi quy là nguyên nhân, thì điều tương tự cũng đúng với mối tương quan. Là mối quan hệ nhân quả? Bạn có thể sử dụng hồi quy để dự đoán bất cứ điều gì, mối quan hệ vô nghĩa giữa bất kỳ biến tùy ý nào (với nhiều kết quả "có ý nghĩa" một cách tình cờ).
Tim

8
Những bất đồng về cách tiếp cận lý luận về quan hệ nhân quả trong thống kê có nhiều giá trị nhất giữa Pearl, Rubin, Heckman và những người khác dường như đã ăn mừng, và tôi nghĩ rằng giai điệu của Pearl ngày càng trở nên khó hiểu hơn. Đừng để điều đó làm bạn mất tập trung vào cái nhìn sâu sắc thực sự mà anh ấy cung cấp. Đọc cuốn sách Nhân quả trước đây của anh ấy, nó sẽ nhận được dưới da của bạn ít hơn.
CloseToC

7
@CloseToC Tôi sẽ thêm rằng Pearl, Rubin và Heckman theo cách tất cả đều hoạt động trong cùng một khung (nghĩa là các khung tương đương logic, xem tại đây stats.stackexchange.com/questions/249767/ ,) vì vậy các tranh chấp của họ là khác nhau mức độ từ những tranh luận như "hồi quy tuyến tính là một mô hình nguyên nhân".
Carlos Cinelli

9
Tôi đã bị kích thích bởi cuốn sách. Có một số tuyên bố thống kê sai đơn giản ở đó (không thể trích dẫn bây giờ, cuốn sách có ghi chú của tôi ở lề) khiến tôi tự hỏi liệu chỉ có nhà báo đã giúp Pearl viết cuốn sách hay chính Pearl cũng là một nhà thống kê nghèo. (Không cần phải nói, tôi đã rất ngạc nhiên khi phát hiện ra những sai lầm trắng trợn như vậy trong một tác phẩm của một nhà khoa học đáng kính như vậy.) Các bài viết của anh ấy tốt hơn nhiều, mặc dù thậm chí không ai sẽ buộc tội Pearl vì sự khiêm tốn ...
Richard Hardy

15
Tôi có một số lo ngại rằng chủ đề này đã kết hợp với nhau (a) một cuốn sách cụ thể từ một người rất thông minh (b) rằng tính cách và phong cách tranh luận của người thông minh (c) liệu một quan điểm cụ thể là chính xác, phóng đại hay bất cứ điều gì.
Nick Cox

Câu trả lời:


59

Tôi hoàn toàn đồng ý rằng giọng điệu của Pearl là kiêu ngạo, và đặc điểm của anh ấy về "thống kê" là đơn giản và nguyên khối. Ngoài ra, tôi không tìm thấy văn bản của ông đặc biệt rõ ràng.

Tuy nhiên, tôi nghĩ anh ấy có một điểm.

Lý do nhân quả không phải là một phần trong khóa đào tạo chính thức của tôi (ThS): gần nhất tôi có được chủ đề là một khóa học tự chọn trong thiết kế thử nghiệm, tức là bất kỳ tuyên bố nhân quả nào cũng yêu cầu tôi kiểm soát môi trường. Cuốn sách Nhân quả của Pearl là lần đầu tiên tôi tiếp xúc với sự bác bỏ ý tưởng này. Rõ ràng tôi không thể nói cho tất cả các nhà thống kê và chương trình giảng dạy, nhưng theo quan điểm của riêng tôi, tôi đăng ký quan sát của Pearl rằng lý luận nhân quả không phải là ưu tiên trong thống kê.

Đúng là các nhà thống kê đôi khi kiểm soát nhiều biến hơn là rất cần thiết, nhưng điều này hiếm khi dẫn đến lỗi (ít nhất là theo kinh nghiệm của tôi).

Đây cũng là niềm tin mà tôi nắm giữ sau khi tốt nghiệp bằng thạc sĩ thống kê năm 2010.

Tuy nhiên, nó là không chính xác sâu sắc. Khi bạn kiểm soát một hiệu ứng chung (được gọi là "máy va chạm" trong sách), bạn có thể đưa ra lựa chọn sai lệch. Nhận thức này khá đáng kinh ngạc đối với tôi và thực sự thuyết phục tôi về sự hữu ích của việc thể hiện các giả thuyết nhân quả của tôi dưới dạng biểu đồ.

EDIT: Tôi đã được yêu cầu giải thích về sự lựa chọn thiên vị. Chủ đề này khá tinh tế, tôi đặc biệt khuyên bạn nên lướt qua MOOC edX trên Sơ đồ nguyên nhân , một giới thiệu rất hay về các biểu đồ có một chương dành riêng cho xu hướng lựa chọn.

Đối với một ví dụ về đồ chơi, để diễn giải bài báo này được trích dẫn trong cuốn sách: Hãy xem xét các biến A = độ hấp dẫn, B = vẻ đẹp, C = thẩm quyền. Giả sử rằng B và C không liên quan đến nhân quả trong dân số nói chung (nghĩa là cái đẹp không gây ra năng lực, năng lực không gây ra cái đẹp, và cái đẹp và năng lực không chia sẻ một nguyên nhân chung). Giả sử cũng có bất kỳ một trong B hoặc C nào là đủ để trở nên hấp dẫn, tức là A là một máy va chạm. Điều hòa trên A tạo ra mối liên hệ giả giữa B và C.

Một ví dụ nghiêm trọng hơn là "nghịch lý cân nặng khi sinh", theo đó người mẹ hút thuốc (S) khi mang thai dường như làm giảm tỷ lệ tử vong (M) của em bé, nếu em bé bị thiếu cân (U). Giải thích được đề xuất là dị tật bẩm sinh (D) cũng gây ra cân nặng khi sinh thấp, và cũng góp phần gây tử vong. Sơ đồ nhân quả tương ứng là {S -> U, D -> U, U -> M, S -> M, D -> M} trong đó U là máy va chạm; điều kiện trên nó giới thiệu các hiệp hội giả. Trực giác đằng sau điều này là nếu người mẹ là người hút thuốc, cân nặng khi sinh thấp sẽ ít có khả năng là do khiếm khuyết.


8
+1. Bạn có thể giải thích thêm một chút về cách giới thiệu lựa chọn thiên vị không? Có lẽ một ví dụ cụ thể sẽ làm cho nó rõ ràng cho hầu hết các độc giả.
amip

2
Cảm ơn đã chỉnh sửa. Đây là những ví dụ rất rõ ràng.
amip

Vì vậy, trực giác cho Cân nặng khi sinh của những người hút thuốc là đúng, đúng không?
Malady

@Malandy: mô hình này phù hợp với dữ liệu và có ý nghĩa trực quan. Tôi không biết liệu nó có đúng không.
mitchus


71

Câu hỏi của bạn phản ánh những gì Pearl đang nói!

hồi quy tuyến tính đơn giản về cơ bản là một mô hình nhân quả

Không, hồi quy tuyến tính là mô hình thống kê, không phải mô hình nguyên nhân. Giả sử là các biến ngẫu nhiên có phân phối chuẩn nhiều biến. Sau đó, bạn có thể ước tính chính xác các kỳ vọng tuyến tính , , , vv bằng cách sử dụng hồi quy tuyến tính, nhưng có không có gì ở đây nói rằng bất kỳ số lượng nào trong số đó là nhân quả.Y,X,ZE[YX]E[XY]E[YX,Z]E[ZY,X]

Một phương trình cấu trúc tuyến tính, mặt khác, là một mô hình nguyên nhân. Nhưng bước đầu tiên là tìm hiểu sự khác biệt giữa các giả định thống kê (các ràng buộc về phân phối xác suất chung được quan sát) và các giả định nguyên nhân (các ràng buộc trên mô hình nguyên nhân).

Bạn có nghĩ rằng Judea Pearl thống kê sai, và nếu có, tại sao?

Không, tôi không nghĩ vậy, bởi vì chúng ta thấy những quan niệm sai lầm này hàng ngày. Tất nhiên, Pearl đang đưa ra một số khái quát, vì một số nhà thống kê làm việc với suy luận nguyên nhân (Don Rubin là người tiên phong trong việc thúc đẩy kết quả tiềm năng ... đồng thời, tôi là một nhà thống kê!). Nhưng ông đã đúng khi nói rằng phần lớn giáo dục thống kê truyền thống trốn tránh quan hệ nhân quả, thậm chí để xác định chính thức ảnh hưởng nhân quả là gì.

Để làm rõ điều này, nếu chúng ta yêu cầu một nhà thống kê / kinh tế lượng chỉ cần đào tạo thường xuyên để xác định về mặt toán học giá trị kỳ vọng của gì nếu chúng ta can thiệp vào , anh ta có thể sẽ viết (xem ví dụ ở đây) ! Nhưng đó là một đại lượng quan sát, đó không phải là cách bạn xác định một hiệu ứng nhân quả! Nói cách khác, hiện tại, một sinh viên chỉ có khóa học thống kê truyền thống thậm chí không có khả năng xác định đúng số lượng này về mặt toán học ( hoặc ) nếu bạn không quen với lý thuyết cấu trúc / phản tác dụng của quan hệ nhân quả !YXE[Y|X] E [ Y x ] E [ Y | d o ( x ) ]E[Yx]E[Y|do(x)]

Câu nói bạn mang từ cuốn sách cũng là một ví dụ tuyệt vời. Bạn sẽ không tìm thấy trong các cuốn sách thống kê truyền thống một định nghĩa chính xác về thế nào là một kẻ gây nhiễu, cũng như hướng dẫn về thời điểm bạn nên (hoặc không nên) điều chỉnh cho một hiệp phương sai trong các nghiên cứu quan sát. Nói chung, bạn thấy các tiêu chí tương quan của người Viking, chẳng hạn như nếu điều trị đồng biến có liên quan đến việc điều trị và với kết quả, bạn nên điều chỉnh cho nó. Một trong những ví dụ đáng chú ý nhất về sự nhầm lẫn này xuất hiện trong Paradox, của Simpson khi phải đối mặt với hai ước tính về các dấu hiệu trái ngược nhau, bạn nên sử dụng loại nào, điều chỉnh hay không điều chỉnh? Câu trả lời, tất nhiên, phụ thuộc vào mô hình nhân quả.

Và Pearl có nghĩa là gì khi anh ta nói rằng câu hỏi này đã kết thúc? Trong trường hợp điều chỉnh đơn giản thông qua hồi quy, ông đang đề cập đến tiêu chí cửa sau (xem thêm tại đây) . Và để nhận dạng nói chung --- ngoài việc điều chỉnh đơn giản --- anh ta có nghĩa là chúng ta hiện có các thuật toán hoàn chỉnh để xác định các hiệu ứng nhân quả cho bất kỳ DAG bán markovian nào.

Một nhận xét khác ở đây là đáng làm. Ngay cả trong các nghiên cứu thực nghiệm - nơi thống kê truyền thống chắc chắn đã thực hiện rất nhiều công việc quan trọng với việc thiết kế các thí nghiệm! - vào cuối ngày bạn vẫn cần một mô hình nhân quả . Các thử nghiệm có thể bị thiếu tuân thủ, mất theo dõi, do sai lệch lựa chọn ... ngoài ra, hầu hết thời gian bạn không muốn giới hạn kết quả thử nghiệm của mình với dân số cụ thể mà bạn đã phân tích, bạn muốn khái quát hóa kết quả thử nghiệm cho một dân số rộng hơn / khác nhau. Ở đây, một lần nữa, người ta có thể hỏi: bạn nên điều chỉnh để làm gì? Là dữ liệu và kiến ​​thức thực tế bạn có đủ để cho phép ngoại suy như vậy không? Tất cả những điều này là các khái niệm nhân quả, do đó bạn cần một ngôn ngữ để chính thức diễn đạt các giả định nguyên nhân và kiểm tra xem chúng có đủ để cho phép bạn làm những gì bạn muốn không!

Tóm lại, những quan niệm sai lầm này phổ biến rộng rãi trong thống kê và kinh tế lượng, có một số ví dụ ở đây trong Xác thực chéo, chẳng hạn như:

Và nhiều cái khác.

Bạn có nghĩ rằng suy luận nhân quả là một cuộc cách mạng với một chữ R lớn thực sự thay đổi tất cả suy nghĩ của chúng ta?

Xem xét tình trạng hiện tại trong nhiều ngành khoa học, chúng ta đã tiến bộ bao nhiêu và mọi thứ thay đổi nhanh như thế nào, và chúng ta vẫn có thể làm được bao nhiêu, tôi sẽ nói đây thực sự là một cuộc cách mạng.

PS : Pearl đề xuất hai bài đăng của anh ấy trên blog quan hệ nhân quả của UCLA sẽ được quan tâm trong cuộc thảo luận này, bạn có thể tìm thấy các bài đăng ở đây đây .

PS 2 : Như tháng 1 đã đề cập trong bản chỉnh sửa mới của mình, Andrew Gelman có một bài đăng mới trong blog của mình. Ngoài cuộc tranh luận trên blog của Gelman, Pearl cũng đã trả lời trên twitter (bên dưới):

Đánh giá của Gelman về #Bookofwhy nên được quan tâm vì nó thể hiện thái độ làm tê liệt các nhóm nghiên cứu thống kê. Phản ứng ban đầu của tôi hiện được đăng trên https://t.co/mRyDcgQtEc Bài viết liên quan:https://t.co/xUwR6eCGrZhttps://t.co/qwqV3oyGUY

- Ngọc trai Judea (@yudapearl) ngày 9 tháng 1 năm 2019


4
Cảm ơn bạn. Nhưng - tốt, viết đơn giản, tôi có thể tính E [X | Y] cũng như E [Y | X], nhưng tôi có thể viết X ← Y cũng như X → Y trong DAG. Bằng cách này hay cách khác, tôi phải bắt đầu với một giả thuyết khoa học hoặc một mô hình. Giả thuyết của tôi, mô hình của tôi - sự lựa chọn của tôi. Thực tế là tôi có thể làm một cái gì đó không có nghĩa là tôi nên làm nó, làm nó.
tháng 1

3
@ Tháng một không có nghĩa là bạn nên, vấn đề ở đây chỉ là có thể nói rõ chính xác những gì bạn muốn ước tính (ước tính nguyên nhân), đưa ra chính xác các giả định nguyên nhân của bạn (làm rõ sự khác biệt của các giả định nguyên nhân và thống kê), kiểm tra ý nghĩa logic của các giả định nguyên nhân đó và có thể hiểu liệu các giả định nguyên nhân + dữ liệu của bạn có đủ để trả lời truy vấn của bạn không.
Carlos Cinelli

3
@January nói rằng bạn có một nghiên cứu quan sát và muốn ước tính tác động nhân quả của trên . Làm thế nào để bạn quyết định đồng biến nào để đưa vào hồi quy của bạn? YXY
Carlos Cinelli

4
Tôi nghĩ vậy: có vẻ như không hoàn toàn không công bằng khi cho rằng nhà thống kê trung bình của bạn, trong khi có khả năng thành thạo suy luận nguyên nhân từ các thí nghiệm được kiểm soát, và chắc chắn không có nguy cơ nhầm lẫn tương quan với quan hệ nhân quả, có thể hơi run khi suy luận nguyên nhân từ quan sát dữ liệu. Tôi lấy phần cuối cùng làm bối cảnh của trích dẫn (Tôi chưa đọc cuốn sách) & đó là điều mà một số độc giả của bài đăng này có thể không chọn.
Scortchi

5
@Janemony Tóm lại, "điều chỉnh cho hiệp phương sai" không nhất thiết có nghĩa là bạn đã loại bỏ sự thiên vị trong ước tính hiệu ứng nhân quả từ các biến đó.
Alexis

31

Tôi là người hâm mộ văn bản của Judea và tôi đã đọc Nhân quả (tình yêu) và Cuốn sách Tại sao (như).

Tôi không cảm thấy rằng Judea đang đánh bại số liệu thống kê. Thật khó để nghe những lời chỉ trích. Nhưng chúng ta có thể nói gì về bất kỳ người nào hoặc lĩnh vực nào không bị chỉ trích? Họ có xu hướng từ sự vĩ đại đến sự tự mãn. Bạn phải hỏi: những lời chỉ trích có đúng, cần thiết, hữu ích không, và nó có đề xuất lựa chọn thay thế không? Câu trả lời cho tất cả những người đó là một câu "Có".

Chính xác? Tôi đã xem xét và cộng tác trên một vài chục bài báo, chủ yếu là phân tích dữ liệu quan sát và tôi hiếm khi cảm thấy có một cuộc thảo luận đầy đủ về quan hệ nhân quả. Cách tiếp cận "điều chỉnh" liên quan đến việc chọn các biến vì chúng được chọn thủ công từ DD là "hữu ích" "có liên quan" "quan trọng" hoặc vô nghĩa khác. 1

Cần thiết? Các phương tiện truyền thông đang tràn ngập những tuyên bố dường như mâu thuẫn về ảnh hưởng sức khỏe của các phơi nhiễm lớn. Sự không nhất quán với phân tích dữ liệu đã làm trì trệ bằng chứng khiến chúng ta thiếu chính sách hữu ích, quy trình chăm sóc sức khỏe và các khuyến nghị để có cuộc sống tốt hơn.

Hữu ích? Nhận xét của Judea là thích hợp và đủ cụ thể để tạm dừng. Nó liên quan trực tiếp đến bất kỳ phân tích dữ liệu mà bất kỳ chuyên gia thống kê hoặc dữ liệu nào cũng có thể gặp phải.

Liệu nó có đề xuất lựa chọn thay thế? Đúng, trên thực tế, Judea thảo luận về khả năng của các phương pháp thống kê tiên tiến và thậm chí cách chúng giảm xuống các khung thống kê đã biết (như Mô hình phương trình cấu trúc) và mối liên hệ của chúng với các mô hình hồi quy). Tất cả tập trung vào việc yêu cầu một tuyên bố rõ ràng về kiến ​​thức nội dung đã hướng dẫn phương pháp mô hình hóa.

Judea không chỉ đơn giản đề nghị chúng tôi giảm thiểu tất cả các phương pháp thống kê (ví dụ hồi quy). Thay vào đó, ông đang nói rằng chúng ta cần nắm lấy một số lý thuyết nhân quả để biện minh cho các mô hình.

1 khiếu nại ở đây là về việc sử dụng ngôn ngữ thuyết phục và thiếu chính xác để biện minh cho những gì cuối cùng là cách tiếp cận sai đối với mô hình hóa. Có thể có sự trùng lặp, ngẫu nhiên, nhưng Pearl rõ ràng về mục đích của sơ đồ nhân quả (DAG) và cách các biến có thể được phân loại là "các yếu tố gây nhiễu".


3
Câu trả lời tốt đẹp. Lưu ý rằng không phải là một nhà thống kê nhưng đã phục vụ như một giao diện giữa thống kê và sinh học trong nhiều năm, đối với tôi, mọi lời chỉ trích của các nhà thống kê thực sự không quá khó nghe ;-) Tuy nhiên, bạn có thực sự nghĩ rằng "thống kê chính thống" không thể xử lý quan hệ nhân quả tất cả, như Pearl nói rõ ràng?
tháng 1

4
@Janemony au contraire . Tôi nghĩ rằng sự thiếu hụt giữa các nhà thống kê trong việc chấp nhận suy luận nguyên nhân trong các phân tích của họ có liên quan trực tiếp đến sự thiếu hụt của họ trong việc hiểu suy luận thường xuyên. Đó là lý do trái ngược mà thiếu.
AdamO

4
+1 "Cách tiếp cận" điều chỉnh "liên quan đến việc chọn các biến vì chúng được chọn thủ công từ DD là" hữu ích "" có liên quan "hoặc vô nghĩa khác mà không thực sự kết hợp các giả thuyết chính thức về mối quan hệ nhân quả cụ thể giữa chúng ( a la the sử dụng chính thức DAGs) . " Chỉnh sửa thêm. :)
Alexis

Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
Scortchi

23

Tôi chưa đọc cuốn sách này, vì vậy tôi chỉ có thể đánh giá câu trích dẫn cụ thể mà bạn đưa ra. Tuy nhiên, ngay cả trên cơ sở này, tôi đồng ý với bạn rằng điều này có vẻ cực kỳ không công bằng đối với nghề thống kê. Tôi thực sự nghĩ rằng các nhà thống kê luôn làm tốt công việc đáng chú ý khi nhấn mạnh sự khác biệt giữa các hiệp hội thống kê (tương quan, v.v.) và quan hệ nhân quả, và cảnh báo chống lại sự kết hợp của cả hai. Thật vậy, theo kinh nghiệm của tôi, các nhà thống kê nói chung là lực lượng chuyên nghiệp chính chống lại sự nhầm lẫn phổ biến giữa nguyên nhân và mối tương quan. Thật sai lầm (và hầu như vu khống) khi cho rằng các nhà thống kê là "... ghê tởm khi nói về quan hệ nhân quả cả." Tôi có thể thấy lý do tại sao bạn khó chịu khi đọc kỵ sĩ kiêu ngạo như thế này.

Tôi muốn nói rằng nó là hợp lý phổ biến cho những người không thống kêngười sử dụng các mô hình thống kê để có sự hiểu biết kém về mối quan hệ giữa hiệp hội thống kê và quan hệ nhân quả. Một số người được đào tạo khoa học tốt từ các lĩnh vực khác, trong trường hợp đó họ cũng có thể nhận thức rõ về vấn đề này, nhưng chắc chắn có một số người sử dụng các mô hình thống kê có hiểu biết kém về các vấn đề này. Điều này đúng trong nhiều lĩnh vực khoa học ứng dụng nơi các học viên được đào tạo cơ bản về thống kê, nhưng không học nó ở mức độ sâu. Trong những trường hợp này, thường là các nhà thống kê chuyên nghiệp cảnh báo các nhà nghiên cứu khác về sự khác biệt giữa các khái niệm này và mối quan hệ đúng đắn của họ. Các nhà thống kê thường là người thiết kế chính của RCT và các thí nghiệm khác liên quan đến các biện pháp kiểm soát được sử dụng để cô lập quan hệ nhân quả. Chúng thường được gọi để giải thích các giao thức như ngẫu nhiên, giả dược, và các giao thức khác được sử dụng để cố gắng cắt đứt các mối quan hệ với các biến gây nhiễu tiềm ẩn. Đúng là các nhà thống kê đôi khi kiểm soát nhiều biến hơn là rất cần thiết, nhưng điều này hiếm khi dẫn đến lỗi (ít nhất là theo kinh nghiệm của tôi). Tôi nghĩ rằng hầu hết các nhà thống kê đều nhận thức được sự khác biệt giữacác biến gây nhiễubiến collider khi chúng thực hiện phân tích hồi quy nhằm xem xét các kết luận nguyên nhân và ngay cả khi chúng không phải luôn luôn xây dựng các mô hình hoàn hảo, khái niệm rằng bằng cách nào đó chúng tránh sự xem xét về quan hệ nhân quả chỉ đơn giản là vô lý.

Tôi nghĩ rằng Judea Pearl đã đóng góp rất nhiều vào việc thống kê với công trình của ông về nhân quả và tôi biết ơn ông vì sự đóng góp tuyệt vời này. Ông đã xây dựng và kiểm tra một số hình thức rất hữu ích giúp cô lập các mối quan hệ nhân quả, và công việc của ông đã trở thành một yếu tố chính của một nền giáo dục thống kê tốt. Tôi đọc cuốn sách Nhân quả của anh ấytrong khi tôi là một học sinh tốt nghiệp, và nó ở trên kệ của tôi, và trên kệ của nhiều nhà thống kê khác. Phần lớn chủ nghĩa hình thức này lặp lại những điều đã được các nhà thống kê biết đến một cách trực giác từ trước khi chúng được chính thức hóa thành một hệ thống đại số, nhưng nó rất có giá trị trong mọi trường hợp, và vượt xa những điều hiển nhiên. (Tôi thực sự nghĩ rằng trong tương lai chúng ta sẽ thấy sự hợp nhất của phép toán "làm" với đại số xác suất xảy ra ở cấp độ tiên đề, và điều này cuối cùng có thể sẽ trở thành cốt lõi của lý thuyết xác suất. Tôi rất thích thấy điều này được xây dựng trực tiếp trong giáo dục thống kê , để bạn tìm hiểu về các mô hình nguyên nhân và thao tác "làm" khi bạn tìm hiểu về các biện pháp xác suất.)

Một điều cuối cùng cần lưu ý ở đây là có nhiều ứng dụng thống kê trong đó mục tiêu là dự đoán , trong đó người hành nghề không tìm cách suy ra quan hệ nhân quả. Những loại ứng dụng này cực kỳ phổ biến trong thống kê và trong những trường hợp như vậy, điều quan trọng là không giới hạn bản thân trong các mối quan hệ nhân quả. Điều này đúng trong hầu hết các ứng dụng thống kê trong tài chính, nhân sự, mô hình hóa lực lượng lao động và nhiều lĩnh vực khác. Người ta không nên đánh giá thấp số lượng bối cảnh mà người ta không thể hoặc không nên tìm cách kiểm soát các biến.


Cập nhật: Tôi nhận thấy rằng câu trả lời của tôi không đồng ý với câu trả lời của Carlos . Có lẽ chúng tôi không đồng ý về những gì cấu thành "một nhà thống kê / kinh tế lượng chỉ với một khóa đào tạo thông thường". Bất cứ ai mà tôi gọi là "nhà thống kê" thường có ít nhất một nền giáo dục sau đại học và thường được đào tạo / kinh nghiệm chuyên môn đáng kể. (Ví dụ, tại Úc, yêu cầu trở thành "Thống kê được công nhận" với cơ quan chuyên môn quốc gia của chúng tôi yêu cầu tối thiểu bốn năm kinh nghiệm sau khi có bằng danh dự, hoặc sáu năm kinh nghiệm sau khi có bằng cử nhân thông thường.) Trong mọi trường hợp, một sinh viên nghiên cứu thống kê không phải là một thống kê .

Tôi nhận thấy rằng bằng chứng về sự thiếu hiểu biết về quan hệ nhân quả của các nhà thống kê, câu trả lời của Carlos chỉ ra một số câu hỏi trên CV.SE hỏi về quan hệ nhân quả trong hồi quy. Trong mỗi một trường hợp, câu hỏi được đặt ra bởi một người rõ ràng là người mới (không phải là thống kê) và câu trả lời được đưa ra bởi Carlos và những người khác (phản ánh lời giải thích chính xác) là những câu trả lời được đánh giá cao. Thật vậy, trong một số trường hợp, Carlos đã đưa ra một tài khoản chi tiết về mối quan hệ nhân quả và câu trả lời của anh ta được đánh giá cao nhất. Điều này chắc chắn chứng minh rằng các nhà thống kê thực sự hiểu nhân quả .

Một số áp phích khác đã chỉ ra rằng phân tích quan hệ nhân quả thường không được đưa vào chương trình thống kê. Đó là sự thật, và đó là một sự xấu hổ lớn, nhưng hầu hết các nhà thống kê chuyên nghiệp không phải là sinh viên tốt nghiệp gần đây, và họ đã học được vượt xa những gì được đưa vào một chương trình thạc sĩ tiêu chuẩn. Một lần nữa, về mặt này, dường như tôi có cái nhìn cao hơn về trình độ hiểu biết trung bình của các nhà thống kê so với các áp phích khác.


12
Tôi là một người không thống kê, được đào tạo chính thức về thống kê là bởi những người không thống kê trong cùng lĩnh vực, và tôi dạy và nghiên cứu với những người không thống kê áp dụng số liệu thống kê. Tôi có thể đảm bảo với bạn rằng nguyên tắc (ví dụ) tương quan không phải là nhân quả là, và là một câu thần chú tái diễn trong lĩnh vực của tôi. Thật vậy, tôi không bắt gặp những người không thể thấy rằng mối tương quan giữa lượng mưa và năng suất lúa mì không phải là tất cả những gì cần nói về mối quan hệ giữa họ và các quá trình cơ bản. Thông thường, theo kinh nghiệm của tôi, những người không thống kê cũng đã nghĩ điều này từ lâu.
Nick Cox

8
Là một nhà dịch tễ học, tôi càng ngày càng khó chịu hơn với câu thần chú này. Như @NickCox nói, đây là điều mà ngay cả những người không phải là nhà khoa học cũng hiểu. Vấn đề tôi gặp phải là khi tất cả mọi người nhảy vào nhóm "tương quan không có nghĩa là nhân quả!" Bất cứ khi nào một nghiên cứu quan sát (một nghiên cứu kiểm soát trường hợp, nói) được công bố. Đúng, mối tương quan không có nghĩa là nhân quả nhưng các nhà nghiên cứu thường nhận thức được điều đó và sẽ làm mọi thứ để thiết kế và phân tích một nghiên cứu theo cách mà một cách giải thích nguyên nhân ít nhất là hợp lý.
COOLSerdash

5
@Nick Cox: Tôi đã chỉnh sửa để nói chính xác hơn rằng có nhiều người không thống kê hiểu rõ điều này. Đó không phải là ý định của tôi để cast phân tán qua các ngành nghề khác - chỉ để nhấn mạnh rằng vấn đề này là vô cùng hiểu rõ bởi nhà thống kê.
Bến

7
@NickCox Có rất nhiều đóng góp của Pearl về quan hệ nhân quả hơn là "tương quan không phải là nhân quả". Tôi với Carlos ở đây. Có đủ để tìm hiểu về quan hệ nhân quả rằng nó phải là một khóa học. Theo tôi biết, hầu hết các bộ phận thống kê không cung cấp một khóa học như vậy.
Neil G

12
@Ben: Pearl không cáo buộc các nhà thống kê về mối tương quan và mối quan hệ khó hiểu. Ông buộc tội họ chủ yếu chỉ đạo lý do nguyên nhân. Tôi đồng ý với bạn rằng giọng điệu của anh ấy kiêu ngạo, nhưng tôi nghĩ anh ấy có một điểm.
mitchus

11

hồi quy tuyến tính đơn giản về cơ bản là một mô hình nhân quả

Đây là một ví dụ tôi đã đưa ra khi mô hình hồi quy tuyến tính không thành nguyên nhân. Giả sử một tiên nghiệm rằng một loại thuốc đã được sử dụng tại thời điểm 0 ( t = 0 ) và nó không có tác dụng đối với tỷ lệ đau tim ở t = 1 . Các cơn đau tim ở t = 1 ảnh hưởng đến các cơn đau tim ở t = 2 (tức là tổn thương trước đó khiến tim dễ bị tổn thương hơn). Sống sót ở t = 3 chỉ phụ thuộc vào việc mọi người có bị đau tim ở t = 2 hay không - đau tim ở t = 1 thực tế sẽ ảnh hưởng đến sự sống sót ở t = 3 , nhưng chúng ta sẽ không có mũi tên, vì lợi ích của sự đơn giản.

Đây là huyền thoại:

Huyền thoại DAG

Đây là biểu đồ nhân quả thực sự: thiên vị va chạm

Chúng ta hãy giả vờ rằng chúng ta không biết rằng các cơn đau tim ở t = 1 độc lập với việc dùng thuốc ở t = 0 nên chúng ta xây dựng mô hình hồi quy tuyến tính đơn giản để ước tính tác dụng của thuốc đối với cơn đau tim ở t = 0 . Ở đây, người dự đoán của chúng tôi sẽ là Thuốc t = 0 và biến kết cục của chúng tôi sẽ là Heart Attack t = 1 . Dữ liệu duy nhất chúng tôi có là những người sống sót ở t = 3 , vì vậy chúng tôi sẽ chạy hồi quy trên dữ liệu đó.

Đây là khoảng tin cậy 95% Bayes cho hệ số của thuốc t = 0 : Khoảng tin cậy 95%, độ lệch collider

Phần lớn xác suất như chúng ta có thể thấy là lớn hơn 0, vì vậy có vẻ như có hiệu lực! Tuy nhiên, chúng tôi biết một tiên nghiệm rằng có 0 hiệu ứng. Toán học về quan hệ nhân quả được phát triển bởi Judea Pearl và những người khác làm cho dễ dàng hơn nhiều để thấy rằng sẽ có sự thiên vị trong ví dụ này (do điều kiện trên một hậu duệ của máy va chạm). Công việc của Judea ngụ ý rằng trong tình huống này, chúng ta nên sử dụng bộ dữ liệu đầy đủ (nghĩa là không nhìn vào những người chỉ sống sót), điều này sẽ xóa các đường dẫn sai lệch:

không thiên vị

Đây là Khoảng tin cậy 95% khi xem tập dữ liệu đầy đủ (nghĩa là không dựa trên những người sống sót).

Khoảng tin cậy 95%, không sai lệch.

Nó tập trung dày đặc ở 0, về cơ bản cho thấy không có sự liên kết nào cả.

Trong các ví dụ thực tế, mọi thứ có thể không đơn giản như vậy. Có thể có nhiều biến số có thể gây ra sai lệch hệ thống (gây nhiễu, sai lệch lựa chọn, v.v.). Những gì cần điều chỉnh trong các phân tích đã được Pearl toán hóa; các thuật toán có thể đề xuất biến nào cần điều chỉnh hoặc thậm chí cho chúng tôi biết khi điều chỉnh là không đủ để loại bỏ sai lệch hệ thống. Với lý thuyết chính thức này được đặt ra, chúng ta không cần phải dành quá nhiều thời gian để tranh luận về việc điều chỉnh cái gì và không nên điều chỉnh cho cái gì; chúng ta có thể nhanh chóng đưa ra kết luận về việc liệu kết quả của chúng ta có hợp lý hay không. Chúng ta có thể thiết kế các thí nghiệm của mình tốt hơn, chúng ta có thể phân tích dữ liệu quan sát dễ dàng hơn.

Đây là một khóa học trực tuyến miễn phí về DAGs nhân quả của Miguel Hernàn. Nó có một loạt các nghiên cứu trường hợp thực tế trong đó các giáo sư / nhà khoa học / nhà thống kê đã đưa ra kết luận trái ngược về câu hỏi trong tầm tay. Một số trong số họ có vẻ như nghịch lý. Tuy nhiên, bạn có thể dễ dàng giải quyết chúng thông qua tiêu chí phân táchcửa hậu của Judea Pearl .

Để tham khảo, đây là mã cho quy trình tạo dữ liệu và mã cho các khoảng đáng tin cậy được hiển thị ở trên:

import numpy as np
import pandas as pd
import statsmodels as sm
import pymc3 as pm
from sklearn.linear_model import LinearRegression

%matplotlib inline

# notice that taking the drug is independent of heart attack at time 1.
# heart_attack_time_1 doesn't "listen" to take_drug_t_0
take_drug_t_0 = np.random.binomial(n=1, p=0.7, size=10000)
heart_attack_time_1 = np.random.binomial(n=1, p=0.4, size=10000)

proba_heart_attack_time_2 = []

# heart_attack_time_1 increases the probability of heart_attack_time_2. Let's say
# it's because it weakens the heart and makes it more susceptible to further
# injuries
# 
# Yet, take_drug_t_0 decreases the probability of heart attacks happening at
# time 2
for drug_t_0, heart_attack_t_1 in zip(take_drug_t_0, heart_attack_time_1):
    if drug_t_0 == 0 and heart_attack_t_1 == 0:
        proba_heart_attack_time_2.append(0.1)
    elif drug_t_0 == 1 and heart_attack_t_1 == 0:
        proba_heart_attack_time_2.append(0.1)
    elif drug_t_0 == 0 and heart_attack_t_1 == 1:
        proba_heart_attack_time_2.append(0.5)
    elif drug_t_0 == 1 and heart_attack_t_1 == 1:
        proba_heart_attack_time_2.append(0.05)

heart_attack_time_2 = np.random.binomial(
    n=2, p=proba_heart_attack_time_2, size=10000
)

# people who've had a heart attack at time 2 are more likely to die by time 3

proba_survive_t_3 = []
for heart_attack_t_2 in heart_attack_time_2:
    if heart_attack_t_2 == 0:
        proba_survive_t_3.append(0.95)
    else:
        proba_survive_t_3.append(0.6)

survive_t_3 = np.random.binomial(
    n=1, p=proba_survive_t_3, size=10000
)

df = pd.DataFrame(
    {
        'survive_t_3': survive_t_3,
        'take_drug_t_0': take_drug_t_0,
        'heart_attack_time_1': heart_attack_time_1,
        'heart_attack_time_2': heart_attack_time_2
    }
)

# we only have access to data of the people who survived
survive_t_3_data = df[
    df['survive_t_3'] == 1
]

survive_t_3_X = survive_t_3_data[['take_drug_t_0']]

lr = LinearRegression()
lr.fit(survive_t_3_X, survive_t_3_data['heart_attack_time_1'])
lr.coef_

with pm.Model() as collider_bias_model_normal:
    alpha = pm.Normal(name='alpha', mu=0, sd=1)
    take_drug_t_0 = pm.Normal(name='take_drug_t_0', mu=0, sd=1)
    summation = alpha + take_drug_t_0 * survive_t_3_data['take_drug_t_0']
    sigma = pm.Exponential('sigma', lam=1)           

    pm.Normal(
        name='observed', 
        mu=summation,
        sd=sigma,
        observed=survive_t_3_data['heart_attack_time_1']
    )

    collider_bias_normal_trace = pm.sample(2000, tune=1000)

pm.plot_posterior(collider_bias_normal_trace['take_drug_t_0'])

with pm.Model() as no_collider_bias_model_normal:
    alpha = pm.Normal(name='alpha', mu=0, sd=1)
    take_drug_t_0 = pm.Normal(name='take_drug_t_0', mu=0, sd=1)
    summation = alpha + take_drug_t_0 * df['take_drug_t_0']
    sigma = pm.Exponential('sigma', lam=1)           

    pm.Normal(
        name='observed', 
        mu=summation,
        sd=sigma,
        observed=df['heart_attack_time_1']
    )

    no_collider_bias_normal_trace = pm.sample(2000, tune=2000)

pm.plot_posterior(no_collider_bias_normal_trace['take_drug_t_0'])

4

Hai bài báo, thứ hai là một tác phẩm kinh điển, giúp tôi (tôi nghĩ) làm sáng tỏ thêm về các điểm của Judea và chủ đề này nói chung hơn. Điều này xuất phát từ một người đã sử dụng SEM (tương quan và hồi quy) nhiều lần và cộng hưởng với các phê bình của anh ta:

https://www.scTHERirect.com/science/article/pii/S0022103111001466

http://psycnet.apa.org/record/1973-20037-001

Về cơ bản các bài báo mô tả tại sao các mô hình tương quan (hồi quy) thường không thể được coi là ngụ ý bất kỳ suy luận nguyên nhân mạnh mẽ nào. Bất kỳ mô hình liên kết nào cũng có thể phù hợp với ma trận hiệp phương sai nhất định (nghĩa là không đặc tả hướng và mối quan hệ giữa các biến). Do đó, cần có những thứ như một thiết kế thử nghiệm, các đề xuất không chính xác, v.v. Điều này thậm chí áp dụng khi người ta có cấu trúc tạm thời cho dữ liệu của họ trong đó nguyên nhân giả định xảy ra kịp thời trước khi có hiệu lực giả định.


1

"... vì về cơ bản chúng ta giả định rằng một biến là nguyên nhân và một biến khác là hiệu ứng (do đó tương quan là cách tiếp cận khác với mô hình hồi quy) ..."

Mô hình hồi quy chắc chắn nhất KHÔNG đưa ra giả định này.

"... và kiểm tra xem mối quan hệ nhân quả này có giải thích các mô hình quan sát được không."

Nếu bạn đang giả định quan hệ nhân quả và xác nhận nó chống lại các quan sát, thì bạn đang thực hiện mô hình SEM, hoặc điều mà Pearl sẽ gọi là mô hình SCM. Việc bạn có muốn gọi phần đó của miền thống kê hay không là điều gây tranh cãi. Nhưng tôi nghĩ hầu hết sẽ không gọi nó là số liệu thống kê cổ điển.

Thay vì bỏ qua các số liệu thống kê nói chung, tôi tin rằng Pearl chỉ phê phán sự thận trọng của nhà thống kê để giải quyết các ngữ nghĩa nhân quả. Ông coi đây là một vấn đề nghiêm trọng vì cái mà Carl Sagan gọi là hiện tượng "vào và ra", trong đó bạn bỏ một nghiên cứu nói rằng "tiêu thụ thịt" liên quan mạnh mẽ "với tăng ham muốn, p <0,05" và sau đó biết đầy đủ hai kết quả sẽ được liên kết nhân quả trong tâm trí của công chúng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.