Là học máy ít hữu ích để hiểu nhân quả, do đó ít thú vị hơn cho khoa học xã hội?


42

Sự hiểu biết của tôi về sự khác biệt giữa học máy / các kỹ thuật dự đoán thống kê khác so với loại thống kê mà các nhà khoa học xã hội (ví dụ, các nhà kinh tế) sử dụng là các nhà kinh tế dường như rất quan tâm đến việc hiểu tác động của một hoặc một vài biến - cả về cường độ và phát hiện xem mối quan hệ là nguyên nhân. Đối với điều này, bạn kết thúc liên quan đến bản thân với các phương pháp thử nghiệm và bán thử nghiệm, vv

Học máy hoặc mô hình thống kê mang tính dự đoán thường bỏ qua hoàn toàn khía cạnh này và trong nhiều trường hợp không cung cấp cho bạn một mức độ cụ thể mà một biến ảnh hưởng đến kết quả (logit và probit dường như làm cả hai).

Một câu hỏi liên quan là mức độ nào các mô hình kinh tế hoặc hành vi lấy cảm hứng từ lý thuyết có lợi thế hơn các mô hình vô thần khi dự đoán các lĩnh vực mới? Một nhà thống kê học máy hoặc dự đoán theo định hướng sẽ nói gì với những lời chỉ trích rằng nếu không có mô hình kinh tế, bạn sẽ không thể dự đoán chính xác các mẫu mới trong đó các đồng biến rất khác nhau.

Tôi thực sự rất vui khi nghe mọi người đảm nhận điều này từ mọi khía cạnh.


Câu hỏi. Ý của bạn là viết 'mô hình vô thần', và nếu vậy, ý của bạn là gì? HAY bạn chỉ có nghĩa là 'lý thuyết'?
Faheem Mitha

2
Có lẽ bạn đang nhìn vào các mô hình thế hệ so với phân biệt đối xử? Machine Learning dựa vào các mô hình và kỹ thuật phân biệt đối xử.
Wayne

@FaheemMitha: 'athorory': không có lý thuyết.
ness101

Câu trả lời:


32

IMHO không có sự khác biệt chính thức nào phân biệt học máy và thống kê ở cấp độ cơ bản của mô hình phù hợp với dữ liệu. Có thể có sự khác biệt về văn hóa trong việc lựa chọn mô hình, mục tiêu của mô hình phù hợp với dữ liệu và một số mở rộng các diễn giải.

Trong các ví dụ điển hình tôi có thể nghĩ về chúng ta luôn luôn có

  • một tập hợp các mô hình cho cho một số chỉ mục đặt , i I tôiMiiII
  • và với mỗi một thành phần không xác định (các tham số, có thể là chiều vô hạn) của mô hình .q i M iiθiMi

Việc gắn vào dữ liệu hầu như luôn là một vấn đề tối ưu hóa toán học bao gồm việc tìm ra sự lựa chọn tối ưu của thành phần chưa biết để làm cho phù hợp với dữ liệu được đo bằng một số chức năng yêu thích.θ i M iMiθiMi

Lựa chọn trong số các mô hình là ít tiêu chuẩn hơn, và có một loạt các kỹ thuật có sẵn. Nếu mục tiêu của sự phù hợp mô hình hoàn toàn là dự đoán, việc lựa chọn mô hình được thực hiện với nỗ lực để có được hiệu suất dự đoán tốt, trong khi nếu mục tiêu chính là giải thích các mô hình kết quả, thì các mô hình dễ hiểu hơn có thể được chọn so với các mô hình khác ngay cả khi sức mạnh dự đoán dự kiến ​​sẽ tồi tệ hơn.Mi

Những gì có thể được gọi là lựa chọn mô hình thống kê trường học cũ dựa trên các bài kiểm tra thống kê có thể kết hợp với các chiến lược lựa chọn theo từng bước, trong khi lựa chọn mô hình học máy thường tập trung vào lỗi tổng quát hóa dự kiến, thường được ước tính bằng xác nhận chéo. Tuy nhiên, những phát triển và hiểu biết về lựa chọn mô hình dường như hội tụ về một nền tảng chung hơn, ví dụ, xem, Chọn mô hình và Trung bình mô hình .

Suy ra nhân quả từ các mô hình

Mấu chốt của vấn đề là làm thế nào chúng ta có thể diễn giải một mô hình? Nếu dữ liệu thu được là từ một thử nghiệm được thiết kế cẩn thận và mô hình đầy đủ, chúng ta có thể hiểu tác động của sự thay đổi của một biến trong mô hình là hiệu ứng nhân quả và nếu chúng ta lặp lại thí nghiệm và can thiệp vào biến cụ thể này chúng ta có thể mong đợi để quan sát hiệu quả ước tính. Tuy nhiên, nếu dữ liệu là quan sát, chúng ta không thể mong đợi rằng các hiệu ứng ước tính trong mô hình tương ứng với các hiệu ứng can thiệp có thể quan sát được. Điều này sẽ yêu cầu các giả định bổ sung không quan tâm đến việc mô hình đó là "mô hình học máy" hay "mô hình thống kê cổ điển".

Có thể là những người được đào tạo sử dụng các mô hình thống kê cổ điển tập trung vào ước tính tham số đơn biến và diễn giải kích thước hiệu ứng là ấn tượng rằng một diễn giải nguyên nhân có giá trị hơn trong khung này so với khung học máy. Tôi sẽ nói là không.

Khu vực suy luận nguyên nhân trong thống kê không thực sự loại bỏ vấn đề, nhưng nó đưa ra các giả định mà kết luận nguyên nhân dựa trên đó rõ ràng. Chúng được gọi là giả định không thể kiểm chứng . Bài viết Suy luận nguyên nhân trong thống kê: Tổng quan về Judea Pearl là một bài viết hay để đọc. Đóng góp chính từ suy luận nguyên nhân là tập hợp các phương pháp để ước tính tác động nhân quả theo các giả định trong đó thực sự có các yếu tố gây nhiễu không quan sát được, đó là một mối quan tâm lớn. Xem Phần 3.3 trong bài viết trên Pearl. Một ví dụ nâng cao hơn có thể được tìm thấy trong bài báo Mô hình cấu trúc cận biên và suy luận nguyên nhân trong dịch tễ học .

Đây là một câu hỏi chủ đề cho dù các giả định không thể kiểm soát được. Chúng chính xác là không thể kiểm chứng vì chúng tôi không thể kiểm tra chúng bằng dữ liệu. Để biện minh cho các giả định cần có các đối số khác.

Như một ví dụ về trường hợp học máy và suy luận nguyên nhân gặp nhau, các ý tưởng về ước lượng khả năng tối đa được nhắm mục tiêu như được trình bày trong Học tập khả năng tối đa được nhắm mục tiêu của Mark van der Laan và Daniel Rubin thường khai thác các kỹ thuật học máy để ước tính phi tham số theo sau là "nhắm mục tiêu "Hướng tới một tham số quan tâm. Cái sau rất có thể là một tham số với một giải thích nguyên nhân. Ý tưởng trong Super Learnerlà dựa nhiều vào các kỹ thuật học máy để ước tính các tham số quan tâm. Một điểm quan trọng của Mark van der Laan (giao tiếp cá nhân) là các mô hình thống kê cổ điển, đơn giản và "có thể giải thích" thường sai, dẫn đến các ước lượng sai lệch và đánh giá quá lạc quan về tính không chắc chắn của các ước tính.


Cảm ơn câu trả lời đáng kinh ngạc này ... Tôi mong muốn theo dõi tất cả các liên kết bạn cung cấp. Một câu hỏi còn sót lại tôi có là về kỹ thuật. Có sự tương tự học máy của một cái gì đó giống như các biến công cụ cho dữ liệu quan sát? Ngoài ra - trong trường hợp ngẫu nhiên hóa một biến, phương pháp thay thế máy học sẽ liên quan gì đến một thử nghiệm đơn giản về sự khác biệt giữa các phương pháp điều trị? Là một kỹ thuật trả lời máy học cần thiết, nó sẽ có lợi thế gì?
d_a_c321

@dowderler, kinh nghiệm của tôi với các biến công cụ rất hạn chế, nhưng một lần nữa tôi thấy không có lý do chính thức nào để phân biệt giữa phương pháp học máy và phương pháp thống kê để phù hợp với mô hình , do đó bạn rất có thể bao gồm các biến công cụ nếu điều đó phục vụ mục đích. Tôi thấy rằng vấn đề thú vị nhất liên quan đến quan hệ nhân quả là ảnh hưởng của can thiệp. Đây về cơ bản là một câu hỏi dự đoán nhưng có lẽ không thuộc phân phối dữ liệu quan sát.
NRH

@dframler, đối với câu hỏi thứ hai, tôi sẽ không đặt nó như một câu hỏi về mối quan hệ một-một của các phương pháp trong học máy và phương pháp trong thống kê. Một test được tính toán để trả lời câu hỏi: Có bằng chứng nào trong dữ liệu để bác bỏ giả thuyết khống rằng các phương tiện có bằng nhau không? Chúng ta có thể có một cuộc thảo luận dài về việc liệu điều này có thú vị hay không, và thậm chí liệu -test và -value tương ứng có cung cấp một câu trả lời hay không, nhưng tôi không nghĩ có bất kỳ điểm nào trong việc hỏi liệu có phương pháp học máy nào không. t pttp
NRH

Sau khi thực hiện can thiệp, máy học sẽ sử dụng loại thống kê nào? Các số liệu thống kê cơ bản của thiết kế thí nghiệm nói chung là dễ chết (so sánh các phương tiện thông qua kiểm tra t). Trong kinh tế lượng, với giả định nhiều hơn, bạn có thể cố gắng phục hồi các lượng tử khác nhau hoặc phân phối hiệu quả điều trị. Một phân tích học máy sẽ làm gì ngoài việc so sánh các phương tiện?
d_a_c321

Cái gì dễ chết là để tính toán cái gì đó, cái không dễ là để biện minh cho những giả định cần có. Cách tiếp cận TMLE của Mark là ước tính kích thước hiệu ứng (thông số quan tâm, nói chung, có thể là hiệu ứng can thiệp, có thể là hiệu ứng quan sát) và cung cấp khoảng tin cậy trung thực với các giả định mô hình ít hạn chế hơn. Mô hình linh hoạt phù hợp với lựa chọn mô hình dựa trên xác nhận chéo được sử dụng để tránh mô hình tham số hạn chế và sai.
NRH

10

Có một bộ công cụ thống kê (khá hạn chế) cho cái gọi là "suy luận nguyên nhân". Chúng được thiết kế để thực sự đánh giá các mối quan hệ nhân quả và được chứng minh là làm điều này một cách chính xác. Tuyệt vời, nhưng không phải cho sự nhu mì của trái tim (hoặc bộ não, cho vấn đề đó).

Ngoài ra, trong nhiều trường hợp, khả năng ngụ ý nhân quả là kết quả của thiết kế của bạn nhiều hơn so với các kỹ thuật trong tay: nếu bạn có quyền kiểm soát 'tất cả' các biến trong thử nghiệm của mình và bạn sẽ thấy điều gì đó xảy ra mỗi khi bạn ( chỉ) thay đổi một biến, thật hợp lý khi gọi điều xảy ra là "hậu quả" của điều bạn thay đổi (thật không may, trong nghiên cứu thực tế, những trường hợp cực đoan này hiếm khi thực sự xảy ra). Một lý do trực quan nhưng hợp lý khác là dựa trên thời gian: nếu bạn ngẫu nhiên (nhưng theo cách được kiểm soát) thay đổi một biến và một thay đổi khác vào ngày hôm sau, quan hệ nhân quả cũng ở quanh góc.

Tất cả đoạn thứ hai của tôi về cơ bản hoạt động bất kể bạn sử dụng phương pháp nào để tìm biến nào thay đổi trong điều kiện nào, vì vậy ít nhất về lý thuyết, không có lý do nào khiến Machine Learning (ML) tồi tệ hơn phương pháp dựa trên Thống kê.

Disclaimer : folowing đoạn chủ quan cao

Tuy nhiên, theo kinh nghiệm của tôi, quá thường xuyên, các kỹ thuật ML chỉ buông lỏng một đốm dữ liệu mà không xem xét dữ liệu đến từ đâu hoặc được thu thập như thế nào (tức là coi thường thiết kế). Trong những trường hợp đó, thường thì kết quả sẽ tăng lên, nhưng sẽ cực kỳ khó để nói điều gì đó hữu ích về quan hệ nhân quả. Điều này sẽhoàn toàn giống nhau khi một số phương pháp thống kê được chạy trên cùng một dữ liệu đó. Tuy nhiên, những người có nền tảng thống kê mạnh mẽ được đào tạo để trở nên quan trọng đối với những vấn đề này, và nếu mọi việc suôn sẻ, sẽ tránh được những cạm bẫy này. Có lẽ nó chỉ đơn giản là suy nghĩ của những người sớm chấp nhận (nhưng cẩu thả) các kỹ thuật ML (thường không phải là nhà phát triển các kỹ thuật mới mà là những người mong muốn 'chứng minh' một số kết quả với họ trong lĩnh vực họ quan tâm) đã mang lại cho ML tiếng xấu về điều này tài khoản. (lưu ý rằng tôi không nói số liệu thống kê tốt hơn ML hoặc tất cả những người làm ML đều cẩu thả và những người làm thống kê thì không)


Cảm ơn rất nhiều cho câu trả lời. Tôi thực sự thích lời giải thích của bạn về việc nhân quả là hệ quả của thiết kế hơn là kỹ thuật. Một câu hỏi tôi có mặc dù về các kỹ thuật là liệu có một cái gì đó giống như các biến công cụ cho máy học. Ngoài ra - trong trường hợp ngẫu nhiên hóa một biến, phương pháp thay thế máy học sẽ liên quan gì đến một thử nghiệm đơn giản về sự khác biệt giữa các phương pháp điều trị?
d_a_c321

9

Quan điểm của tôi là các mô hình được sử dụng trong kinh tế và các ngành khoa học xã hội khác chỉ hữu ích khi chúng có sức mạnh dự đoán trong thế giới thực - một mô hình không dự đoán thế giới thực chỉ là một phép toán thông minh. Một câu nói yêu thích của tôi với các đồng nghiệp là "dữ liệu là vua".

Dường như với tôi rằng câu hỏi của bạn đưa ra hai lời phê bình về một cách tiếp cận dự đoán. Đầu tiên, bạn chỉ ra rằng các mô hình được tạo ra bởi các kỹ thuật máy học có thể không thể hiểu được . Thứ hai, bạn đề xuất rằng các phương pháp được sử dụng bởi những người trong khoa học xã hội sẽ hữu ích hơn cho việc khám phá mối quan hệ nhân quả so với học máy.

Để giải quyết điểm đầu tiên, tôi sẽ đưa ra đối số truy cập sau. Các mốt hiện tại trong các phương pháp học máy ủng hộ các phương pháp (như SVM và NN) mà không dễ hiểu cho một giáo dân. Điều này không có nghĩa là tất cả các kỹ thuật máy học đều có tính chất này. Ví dụ, cây quyết định C4.5 đáng kính vẫn được sử dụng rộng rãi 20 năm sau khi đạt đến giai đoạn phát triển cuối cùng và tạo ra một số quy tắc phân loại. Tôi sẽ lập luận rằng các quy tắc như vậy cho vay để giải thích tốt hơn so với các khái niệm như tỷ lệ cược log, nhưng đó là một tuyên bố chủ quan. Trong mọi trường hợp, các mô hình như vậy là có thể giải thích.

Khi giải quyết điểm thứ hai, tôi sẽ thừa nhận rằng nếu bạn huấn luyện một mô hình học máy trong một môi trường và thử nghiệm nó ở một môi trường khác, thì có khả năng sẽ thất bại, tuy nhiên, không có lý do gì để cho rằng một tiên nghiệm rằng điều này cũng không đúng với mô hình thông thường hơn: nếu bạn xây dựng mô hình của mình theo một nhóm các giả định và sau đó đánh giá nó theo mô hình khác, bạn sẽ nhận được kết quả xấu. Để đồng chọn một cụm từ từ lập trình máy tính: "rác vào, rác ra" cũng áp dụng như nhau cho cả mô hình học máy và thiết kế.


9

Số nhân quả suy luận là một lĩnh vực hoạt động nghiên cứu trong học máy, ví dụ thấy quá trình tố tụng của này hội thảo và một này . Tuy nhiên, tôi sẽ chỉ ra rằng ngay cả khi suy luận nguyên nhân hoặc giải thích mô hình là mối quan tâm chính của bạn, thì vẫn nên thử song song một cách tiếp cận dự đoán hoàn toàn mờ nhạt, để bạn sẽ biết liệu có một hình phạt hiệu suất đáng kể nào liên quan đến việc nhấn mạnh vào một mô hình có thể giải thích.


1
xen kẽ? Có thể bạn có nghĩa là có thể giải thích?
Faheem Mitha

4

Tôi sẽ không lặp lại những điểm rất tốt đã được đưa ra trong các câu trả lời khác, nhưng muốn thêm một góc nhìn hơi khác. Những gì tôi nói ở đây có phần triết lý, không nhất thiết phải rút ra từ kinh nghiệm chuyên môn, mà từ một nền tảng hỗn hợp trong khoa học vật lý, lý thuyết hệ thống phức tạp và học máy (và, tôi phải thừa nhận, phần lớn là thống kê đại học).

Một sự khác biệt đáng kể giữa học máy và phương pháp thống kê cổ điển (mà tôi biết) là trong tập hợp các giả định được đưa ra. Trong thống kê cổ điển, nhiều giả định về các quy trình và phân phối cơ bản được cố định và có xu hướng được coi là đương nhiên. Tuy nhiên, trong học máy, các giả định này được chọn rõ ràng cho từng mô hình, dẫn đến một bộ khả năng rộng hơn nhiều và có lẽ nhận thức rõ hơn về các giả định được đưa ra.

Chúng ta đang thấy ngày càng nhiều hệ thống trên thế giới xung quanh chúng ta hành xử theo những cách phức tạp, phi tuyến tính và nhiều quy trình không tuân theo các giả định về tính quy phạm, v.v. thường xuất hiện trong thống kê cổ điển. Tôi sẽ lập luận rằng, do tính linh hoạt và đa dạng của các giả định mô hình, các phương pháp học máy thường sẽ dẫn đến một mô hình mạnh mẽ hơn trong những trường hợp như vậy.

Có các giả định mô hình mạnh được xây dựng thành các cụm từ như "mức độ ảnh hưởng", "mối quan hệ nhân quả" và "mức độ mà một biến ảnh hưởng đến kết quả". Trong một hệ thống phức tạp (như nền kinh tế), những giả định này sẽ chỉ có hiệu lực trong một cửa sổ nhất định của các trạng thái hệ thống có thể. Với một số quan sát và quy trình, cửa sổ này có thể lớn, dẫn đến các mô hình tương đối mạnh mẽ. Với những người khác, nó có thể nhỏ hoặc thậm chí trống rỗng. Có lẽ mối nguy hiểm lớn nhất là nền tảng giữa: một mô hình có thể đang hoạt động, nhưng khi hệ thống thay đổi, thất bại theo một cách đột ngột và đáng ngạc nhiên.

Học máy không phải là thuốc chữa bách bệnh. Thay vào đó, tôi thấy đó là một cuộc tìm kiếm những cách thức mới để lượm lặt ý nghĩa từ những quan sát của chúng ta, tìm kiếm những mô hình mới cần thiết nếu chúng ta giải quyết hiệu quả sự phức tạp mà chúng ta đang bắt đầu nhận thức trong thế giới xung quanh.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.