Tôi đang đọc cuốn sách Tại sao của Judea Pearl, và nó đang nằm dưới da tôi 1 . Cụ thể, tôi nhận ra rằng anh ta đang bẻ khóa các số liệu thống kê "cổ điển" một cách vô điều kiện bằng cách đưa ra một lập luận người rơm rằng thống kê là không bao giờ, có thể điều tra các mối quan hệ nhân quả, rằng nó không bao giờ quan tâm đến quan hệ nhân quả, và số liệu thống kê "đã trở thành một mô hình doanh nghiệp giảm dữ liệu bị mù ". Thống kê trở thành một từ xấu xí trong cuốn sách của mình.
Ví dụ:
Các nhà thống kê đã vô cùng bối rối về những biến nào nên và không nên kiểm soát, vì vậy thực tế mặc định là kiểm soát mọi thứ người ta có thể đo lường. [...] Đây là một thủ tục đơn giản, thuận tiện để làm theo, nhưng nó vừa lãng phí vừa bị lỗi. Một thành tựu quan trọng của Cách mạng nhân quả là chấm dứt sự nhầm lẫn này.
Đồng thời, các nhà thống kê đánh giá thấp việc kiểm soát theo nghĩa là họ không thích nói về quan hệ nhân quả cả [...]
Tuy nhiên, mô hình nhân quả đã được thống kê như thế, mãi mãi. Ý tôi là, mô hình hồi quy có thể được sử dụng về cơ bản là mô hình nguyên nhân, vì về cơ bản chúng ta giả định rằng một biến là nguyên nhân và một biến khác là hiệu ứng (do đó mối tương quan là cách tiếp cận khác với mô hình hồi quy) và kiểm tra xem mối quan hệ nhân quả này có giải thích các mô hình quan sát được không .
Một trích dẫn khác:
Không có gì ngạc nhiên khi các nhà thống kê đặc biệt tìm thấy câu đố này [Vấn đề Monty Hall] khó hiểu. Họ đã quen với, như RA Fisher (1922) đã nói, "việc giảm dữ liệu" và bỏ qua quá trình tạo dữ liệu.
Điều này làm tôi nhớ đến câu trả lời mà Andrew Gelman đã viết cho phim hoạt hình xkcd nổi tiếng về người Bayes và những người thường xuyên: "Tuy nhiên, tôi nghĩ rằng toàn bộ phim hoạt hình là không công bằng khi nó so sánh một Bayesian nhạy cảm với một nhà thống kê thường xuyên nghe theo lời khuyên của sách giáo khoa nông cạn . "
Số lượng diễn đạt sai của s-word, như tôi nhận thấy, tồn tại trong cuốn sách Judea Pearls khiến tôi tự hỏi liệu suy luận nguyên nhân (mà đến nay tôi nhận thấy là một cách hữu ích và thú vị để tổ chức và kiểm tra giả thuyết khoa học 2 ) có đáng nghi ngờ không.
Câu hỏi: bạn có nghĩ rằng Judea Pearl đang trình bày sai số liệu thống kê, và nếu có, tại sao? Chỉ để làm cho suy luận nhân quả âm thanh lớn hơn nó là? Bạn có nghĩ rằng suy luận nhân quả là một cuộc cách mạng với một chữ R lớn thực sự thay đổi tất cả suy nghĩ của chúng ta?
Biên tập:
Các câu hỏi trên là vấn đề chính của tôi, nhưng vì chúng được thừa nhận, có ý kiến, xin vui lòng trả lời những câu hỏi cụ thể này (1) ý nghĩa của "Cách mạng nguyên nhân" là gì? (2) nó khác với thống kê "chính thống" như thế nào?
1. Cũng bởi vì anh ta là một chàng trai khiêm tốn như vậy .
2. Ý tôi là theo nghĩa khoa học, không thống kê.
EDIT : Andrew Gelman đã viết bài đăng trên blog này trên cuốn sách Judea Pearls và tôi nghĩ anh ấy đã làm một công việc tốt hơn nhiều để giải thích những vấn đề của tôi với cuốn sách này hơn tôi đã làm. Đây là hai trích dẫn:
Trên trang 66 của cuốn sách, Pearl và Mackenzie viết rằng số liệu thống kê đã trở thành một doanh nghiệp giảm dữ liệu mù mô hình. Mày đang nói cái quái gì vậy?? Tôi là một nhà thống kê, tôi đã làm thống kê trong 30 năm, làm việc trong các lĩnh vực từ chính trị đến độc học. Mô hình giảm dữ liệu mù Đó chỉ là nhảm nhí. Chúng tôi sử dụng các mô hình tất cả các thời gian.
Và một số khác:
Nhìn. Tôi biết về tình huống khó xử của người đa nguyên. Một mặt, Pearl tin rằng phương pháp của mình tốt hơn mọi thứ trước đây. Khỏe. Đối với anh ta, và đối với nhiều người khác, chúng là những công cụ tốt nhất hiện có để nghiên cứu suy luận nguyên nhân. Đồng thời, là một người đa nguyên, hoặc một sinh viên của lịch sử khoa học, chúng tôi nhận ra rằng có nhiều cách để nướng bánh. Thật khó để thể hiện sự tôn trọng đối với các phương pháp mà bạn không thực sự làm việc cho mình và đến một lúc nào đó, cách duy nhất để làm điều đó là lùi lại và nhận ra rằng những người thực sự sử dụng những phương pháp này để giải quyết các vấn đề thực sự. Ví dụ, tôi nghĩ rằng việc đưa ra quyết định sử dụng giá trị p là một ý tưởng tồi tệ và thiếu logic về mặt logic dẫn đến nhiều thảm họa khoa học; đồng thời, nhiều nhà khoa học quản lý để sử dụng giá trị p làm công cụ học tập. Tôi nhận ra điều đó. Tương tự như vậy, Tôi muốn Pearl nhận ra rằng bộ máy thống kê, mô hình hồi quy phân cấp, tương tác, hậu phân tầng, học máy, v.v., giải quyết các vấn đề thực sự trong suy luận nguyên nhân. Các phương pháp của chúng tôi, như của Pearl, cũng có thể làm rối tung cả GIG GIGO! Có thể nói đúng là Pearl sẽ tốt hơn khi chuyển sang cách tiếp cận của anh ấy. Nhưng tôi không nghĩ nó giúp được gì khi anh ấy đưa ra những tuyên bố không chính xác về những gì chúng tôi làm.