Các vấn đề về quan hệ nhân quả từ Judea Pearl Book


11

Tôi đang bắt đầu đọc suy luận nguyên nhân trong thống kê, A Primer của Judea Pearl et. al. Tôi có bằng thạc sĩ toán, nhưng tôi chưa bao giờ tham gia khóa học thống kê. Tôi hơi bối rối bởi một trong những câu hỏi nghiên cứu ban đầu và không có ai tôi có thể hỏi về nó, vì vậy tôi hy vọng rằng ai đó trên trang web này sẽ phê bình câu trả lời của tôi cho tôi. (Đây không phải là vấn đề bài tập về nhà. Tôi là một người nghỉ hưu, chỉ cần giữ cho tâm trí của tôi hoạt động.) Lưu ý rằng không có dữ liệu cụ thể được đưa ra trong các vấn đề.

a) Có hai phương pháp điều trị sỏi thận, Điều trị A và Điều trị B. Các bác sĩ có nhiều khả năng kê đơn Điều trị A trên sỏi lớn (và do đó nghiêm trọng hơn) và có nhiều khả năng kê đơn Điều trị B trên sỏi nhỏ. Một bệnh nhân không biết kích thước viên đá của mình sẽ kiểm tra dữ liệu dân số chung, hoặc dữ liệu cụ thể về kích thước khi xác định phương pháp điều trị nào sẽ hiệu quả hơn?

b) Có hai bác sĩ trong một thị trấn nhỏ. Mỗi người đã thực hiện 100 ca phẫu thuật trong sự nghiệp của mình, có hai loại: một phẫu thuật rất dễ và một phẫu thuật rất khó. Bác sĩ đầu tiên thực hiện phẫu thuật dễ dàng thường xuyên hơn nhiều so với phẫu thuật khó khăn và lần thứ hai thực hiện phẫu thuật khó khăn thường xuyên hơn so với phẫu thuật dễ dàng. Bạn cần phẫu thuật, nhưng bạn không biết liệu trường hợp của bạn dễ hay khó. Bạn nên tham khảo tỷ lệ thành công của mỗi bác sĩ trong tất cả các trường hợp, hay bạn nên tham khảo tỷ lệ thành công cho các trường hợp dễ và khó riêng biệt, để tối đa hóa cơ hội phẫu thuật thành công?

Về phần a) thật hợp lý khi cho rằng có những hạn chế đối với Điều trị A so với Điều trị B, hoặc tại sao nó không được quy định mọi lúc? Vì vậy, dường như tôi không thể đưa ra quyết định thông minh mà không biết kích thước của sỏi thận. Tôi hy vọng dữ liệu cho thấy Điều trị A sẽ hiệu quả hơn trên những viên đá lớn và ít nhất là hiệu quả đối với những viên đá nhỏ, nhưng tôi không muốn cho rằng những rủi ro được cho là của Điều trị A nếu viên đá của tôi nhỏ. Giả sử rằng những viên sỏi nhỏ hầu như luôn có thể được điều trị thành công, tôi mong muốn Điều trị B sẽ cho thấy tỷ lệ thành công cao hơn trong dân số, nhưng tôi sẽ không muốn áp dụng Điều trị B nếu tôi có một viên đá lớn.

Dường như với tôi rằng dữ liệu là vô dụng trừ khi tôi biết kích thước viên đá của mình. Đây có phải là câu trả lời cho câu hỏi, có lẽ? Toàn bộ điều này có vẻ khá vô nghĩa, bởi vì tôi không thể vào hiệu thuốc và mua thuốc điều trị tại quầy. Bác sĩ của tôi sẽ kê toa, và nếu anh ta không thể (hoặc sẽ không) cho tôi biết kích thước của viên đá, tôi sẽ thay đổi bác sĩ.

Về phần b) rõ ràng là bạn muốn xem xét các mức giá cho các thủ tục một cách riêng biệt, nhưng chỉ riêng mức giá là không đủ. Giả sử bác sĩ đầu tiên đã thực hiện ca phẫu thuật khó khăn chỉ một lần, với kết quả thành công và bác sĩ thứ hai đã thực hiện nó 37 lần, với 35 lần thành công. Tôi sẽ rất có khuynh hướng đi với bác sĩ thứ hai, nhưng tôi muốn làm thế nào 35 trong số 37 so sánh với các tiêu chuẩn quốc gia, và nếu 2 thất bại xảy ra sớm trong sự nghiệp của anh ấy (trong khi anh ấy vẫn còn học) hoặc gần đây hơn ( sau khi anh bắt đầu uống nhiều).

Đây có phải là loại thảo luận được gọi là do các vấn đề, hoặc là một câu trả lời khô khan hơn dự kiến? Nếu tôi đủ may mắn để có một người hướng dẫn đọc nó, làm thế nào bạn chấm điểm câu trả lời của tôi?

Câu trả lời:


9

Đầu tiên hãy để tôi nói rằng nếu tôi chấm điểm các câu hỏi của bạn, tôi sẽ cho bạn một điểm xuất sắc. Đây là những câu hỏi giới thiệu của cuốn sách, vì vậy bạn vẫn chưa có tất cả các công cụ để suy nghĩ vấn đề, nhưng bạn đã cho thấy rằng bạn cần xem xét thông tin nhân quả để trả lời.

Bây giờ để trả lời, hãy chú ý câu hỏi hỏi bạn xem bạn muốn xem dữ liệu tổng hợp hay dữ liệu tách biệt. Hóa ra trong cả hai trường hợp bạn muốn xem xét dữ liệu tách biệt.

Trong câu hỏi A, kích thước của viên đá ảnh hưởng đến cả sự lựa chọn phương pháp điều trị và tình trạng sức khỏe. Do đó, bạn cần dữ liệu tách biệt để loại bỏ sự thiên vị này và xác định phương pháp điều trị nào hiệu quả hơn, theo điều kiện hoặc vô điều kiện. Để biết cách xử lý nào tốt hơn vô điều kiện, bạn cần dữ liệu được tách riêng để có được hiệu ứng nhân quả trung bình có trọng số bằng xác suất kích thước đá , trong đó là tình trạng sức khỏe, lựa chọn điều trị và kích thước đáNếu bạn muốn biết phương pháp điều trị nào tốt hơn về mặt điều kiện, thì rõ ràng bạn cũng cần có bảng tách riêng. P(Y= =1|do(T))= =ΣSP(Y= =1|T,S)P(S)P(Y= =1|T)YTS

Nếu thật lạ khi nghĩ đến việc chọn một điều trị cho chính mình mà không biết kích thước đá, có thể sẽ dễ hiểu hơn câu hỏi tương tự là chỉ chọn một điều trị cho toàn bộ dân số (vì lý do kỹ thuật / ngân sách bạn không thể chọn cả hai). Trong trường hợp này, bạn muốn biết cái nào có tác dụng điều trị trung bình lớn nhất đối với toàn bộ dân số.

Câu hỏi B là một vấn đề tương tự, khó khăn là một vấn đề gây nhiễu, vì vậy bạn cần có bảng phân tách để biết bác sĩ nào tốt hơn, cả về điều kiện và điều kiện. Quan điểm của bạn về kích thước mẫu là hoàn toàn hợp lệ, trong thực tế, bạn nên luôn luôn xem xét độ không đảm bảo của mẫu --- nhưng lưu ý rằng nó không thay đổi thực tế là bạn vẫn sẽ cần thông tin của dữ liệu tách biệt.

Về bình luận cuối cùng của bạn,

nếu 2 thất bại xảy ra sớm trong sự nghiệp của anh ấy (trong khi anh ấy vẫn còn học) hoặc gần đây hơn (sau khi anh ấy bắt đầu uống nhiều rượu).

Nó thực sự chạm đến một vấn đề sâu sắc trong suy luận nguyên nhân, đó là giả định về tính bất biến . Hãy xem trường hợp bác sĩ bắt đầu uống nhiều ngay bây giờ. Trong trường hợp này, dữ liệu trước và sau sự kiện đó không đến từ cùng một mô hình nguyên nhân --- vì vậy bạn thực sự sẽ cần thêm thông tin và nhiều giả định nguyên nhân hơn để suy luận trong trường hợp này.


2
Cảm ơn. Nhận xét của bạn về vấn đề đầu tiên đặc biệt được làm rõ.
saulspatz

3

Tôi đã đọc Nhân quả của Pearl , tái bản lần 2 (2009) nhưng không phải là Primer mà bạn đề cập ở đây. Bạn dường như đang tiếp cận những câu hỏi nghiên cứu với tâm lý chính xác. Bạn đang khơi gợi kiến ​​thức nền tảng của chính mình để điền vào các tình huống này với thông tin nhân quả cần thiết . Bạn cũng đang trực tiếp tấn công những gì dường như tôi khá khó hiểu về các vấn đề quyết định như đã trình bày, và cố gắng hết sức để thay thế chúng bằng các vấn đề thực tế và có ý nghĩa hơn.


2
+1 cho cụm từ "quan niệm khá đồi trụy." Tất nhiên các vấn đề trong sách giáo khoa không bao giờ hoàn toàn thực tế, vì những lý do rõ ràng, nhưng đối với tôi rõ ràng chúng thực tế đến mức nào. Tôi đoán mọi thứ sẽ rõ ràng hơn khi tôi tiếp tục đọc.
saulspatz
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.