Trên George Box, Galit Shmueli và phương pháp khoa học?


16

(Câu hỏi này có vẻ như phù hợp hơn với Triết lý SE. Tôi hy vọng rằng các nhà thống kê có thể làm rõ những quan niệm sai lầm của tôi về các tuyên bố của Box và Shmueli, vì vậy tôi sẽ đăng nó ở đây).

George Box (danh tiếng ARIMA) cho biết:

"Tất cả các mô hình đều sai, nhưng một số là hữu ích."

Galit Shmueli trong bài báo nổi tiếng của mình "Để giải thích hoặc dự đoán" , lập luận (và trích dẫn những người khác đồng ý với cô) rằng:

Giải thích và dự đoán không giống nhau, và một số mô hình làm tốt công việc giải thích, mặc dù họ làm công việc dự đoán kém.

Tôi cảm thấy rằng những nguyên tắc này bằng cách nào đó mâu thuẫn.

Nếu một mô hình không dự đoán tốt, nó có hữu ích không?

Quan trọng hơn, nếu một mô hình giải thích tốt (nhưng không nhất thiết phải dự đoán tốt), thì nó phải đúng (nghĩa là không sai) theo cách này hay cách khác. Vậy làm thế nào mà lưới với "tất cả các mô hình đều sai" của Box?

Cuối cùng, nếu một mô hình giải thích tốt, nhưng không dự đoán tốt, làm thế nào nó thậm chí còn khoa học? Hầu hết các tiêu chí phân định khoa học (xác minh, giả mạo, v.v ...) ngụ ý rằng một tuyên bố khoa học phải có sức mạnh dự đoán, hoặc thông tục: Một lý thuyết hoặc mô hình chỉ đúng nếu nó có thể được kiểm nghiệm bằng thực nghiệm (hoặc giả mạo), có nghĩa là nó phải dự đoán kết quả trong tương lai.

Những câu hỏi của tôi:

  • Là tuyên bố của Box và ý tưởng của Shmueli thực sự trái ngược nhau, hay tôi đang thiếu một cái gì đó, ví dụ như một mô hình không có sức mạnh dự đoán mà vẫn hữu ích?
  • Nếu các phát biểu của Box và Shmueli không mâu thuẫn, thì điều gì có nghĩa là một mô hình sai và không dự đoán tốt, nhưng vẫn có sức mạnh giải thích? Đặt nó khác đi: Nếu một người lấy đi cả tính chính xác và khả năng dự đoán, những gì còn lại của một mô hình?

Những giá trị thực nghiệm nào có thể có khi một mô hình có sức mạnh giải thích, nhưng không có khả năng dự đoán? Shmueli đề cập đến những điều như: sử dụng AIC để giải thích và BIC để dự đoán, v.v., nhưng tôi không thấy cách giải quyết vấn đề đó. Với các mô hình dự đoán, bạn có thể sử dụng AIC, hoặc BIC hoặc hoặc chính quy, v.v ... nhưng cuối cùng, ngoài kiểm tra mẫu và hiệu suất trong sản xuất là yếu tố quyết định chất lượng của mô hình. Nhưng đối với các mô hình giải thích tốt, tôi không thấy bất kỳ chức năng mất mát nào có thể thực sự đánh giá một mô hình. Trong triết học của khoa học, có khái niệm về sự không xác địnhR2L1L L p < 0,05 p < 0,1 p < 0,01có vẻ thích hợp ở đây: Đối với bất kỳ tập dữ liệu cụ thể nào, người ta luôn có thể chọn một cách thận trọng một số phân phối (hoặc hỗn hợp phân phối) và hàm mất theo cách chúng phù hợp với dữ liệu (và do đó có thể được yêu cầu giải thích nó). Hơn nữa, ngưỡng mà nên đặt ra cho ai đó để tuyên bố rằng mô hình giải thích đầy đủ dữ liệu là tùy ý (loại giống như giá trị p, tại sao lại là chứ không phải hoặc ?).LLp<0.05p<0.1p<0.01

  • Dựa trên những điều trên, làm thế nào người ta có thể xác nhận một cách khách quan một mô hình giải thích tốt, nhưng không dự đoán tốt, vì không thể kiểm tra mẫu?


3
Theo như tôi có thể nhớ Shmueli, để cô ấy giải thích rõ nghĩa là có được hình thức chức năng đúng (nhưng có thể có sự ước tính rất lớn khi nói đến các tham số của hình thức chức năng đó), trong khi dự đoán tốt có nghĩa là có được sự đánh đổi sai lệch đúng (thỏa hiệp về hình thức chức năng để tăng độ chính xác dự toán). Ngoài ra, thẻ triết học có thể hữu ích ở đây.
Richard Hardy

1
Tôi không nghĩ rằng "hoặc" cần phải độc quyền. Đơn giản và thống nhất là các tiêu chí lựa chọn không gây tranh cãi cho các lý thuyết có giá trị dự đoán như nhau, và nếu vậy, hy sinh độ chính xác cho chúng cũng có thể được biện minh trong nhiều bối cảnh. Phương châm của Box phản ánh một quan điểm khác về khoa học, tiên tiến, ví dụ như trong Hình ảnh khoa học của van Fraassen (và quay trở lại Kant): đó là xây dựng các mô tả đầy đủ / hữu ích về quan sát, không kể những câu chuyện có thật theo nghĩa đen về "thực tế" không thể quan sát được. Sự tương xứng thô sơ có thể đủ cho nhiều nhiệm vụ và "một mô hình chính xác" có thể là một điều khó hiểu.
Conifold

2
@Conifold Thật vậy, phân tích vòng lặp của Richard Levins về các hệ thống nhân quả phức tạp (không phải là phương pháp thống kê, mặc dù có những ứng dụng liên quan trực tiếp đến dự đoán thống kê) hy sinh gần như tất cả sự chính xác có lợi cho chủ nghĩa hiện thực mô hình (biến & mối quan hệ giữa chúng) và tính tổng quát (khả năng áp dụng các kết quả phân tích trên một mô hình cho tất cả các biến có chung cấu trúc nguyên nhân). Xem Levins, R. (1966). Chiến lược xây dựng mô hình trong sinh học dân số . Nhà khoa học Mỹ , 54 (4), 421 trừ431.
Alexis

(+1. Tôi vẫn hy vọng tìm thấy thời gian để đăng câu trả lời ở đây ...)
amip nói rằng Rebstate Monica

Câu trả lời:


9

Hãy để tôi bắt đầu với trích dẫn sâu sắc của George Box, rằng "tất cả các mô hình đều sai, nhưng một số là hữu ích". Tuyên bố này là sự gói gọn của phương pháp phương pháp luận của "chủ nghĩa thực chứng", đây là một cách tiếp cận triết học có ảnh hưởng lớn trong các ngành khoa học. Cách tiếp cận này được mô tả chi tiết (trong bối cảnh của lý thuyết kinh tế) trong bài tiểu luận phương pháp cổ điển của Friedman (1966) . Trong bài luận đó, Friedman lập luận rằng bất kỳ lý thuyết khoa học hữu ích nào cũng nhất thiết cấu thành sự đơn giản hóa thực tế, và do đó, các giả định của nó phải luôn luôn rời khỏi thực tế ở một mức độ nào đó, và thậm chí có thể rời khỏi thực tế.trong việc giảm sự phức tạp của thế giới thành một bộ nguyên tắc có thể quản lý được và tính chính xác của nó trong việc đưa ra dự đoán về thực tế và tạo ra những giả thuyết mới có thể kiểm chứng về thực tế. Do đó, Friedman lập luận rằng "tất cả các mô hình đều sai" khi tất cả đều chứa các giả định đơn giản hóa (và do đó rời khỏi) thực tế, nhưng "một số là hữu ích" khi chúng đưa ra một khuôn khổ đơn giản để đưa ra dự đoán hữu ích về thực tế.

Bây giờ, nếu bạn đọc Box (1976) (bài báo đầu tiên anh ta nói rằng "tất cả các mô hình đều sai"), bạn sẽ thấy rằng anh ta không trích dẫn Friedman, và anh ta cũng không đề cập đến chủ nghĩa thực chứng phương pháp luận. Tuy nhiên, lời giải thích của ông về phương pháp khoa học và đặc điểm của nó rất gần với phương pháp được phát triển bởi Friedman. Cụ thể, cả hai tác giả đều nhấn mạnh rằng một lý thuyết khoa học sẽ đưa ra dự đoán về thực tế có thể được kiểm tra đối với các sự kiện được quan sát và lỗi trong dự đoán sau đó có thể được sử dụng làm cơ sở để sửa đổi lý thuyết.

Bây giờ, về sự phân đôi được thảo luận bởi Galit Shmueli trong Shmueli (2001) . Trong bài báo này, Shmueli so sánh giải thích nguyên nhân và dự đoán kết quả quan sát được và cho rằng đây là những hoạt động riêng biệt. Cụ thể, cô lập luận rằng các mối quan hệ nhân quả dựa trên các cấu trúc cơ bản không biểu hiện trực tiếp trong các kết quả có thể đo lường được và do đó "dữ liệu có thể đo được không phải là biểu diễn chính xác của các cấu trúc cơ bản của chúng" (tr. 293). Do đó, bà lập luận rằng có một khía cạnh của phân tích thống kê liên quan đến việc đưa ra những suy luận về mối quan hệ nhân quả tiềm ẩn không thể quan sát được mà không được biểu hiện trong những khác biệt có thể đo lường được trong kết quả.

Trừ khi tôi hiểu nhầm điều gì đó, tôi nghĩ thật công bằng khi nói rằng ý tưởng này đang căng thẳng với quan điểm thực chứng của Box và Friedman, như được trình bày trong trích dẫn của Box. Quan điểm thực chứng về cơ bản nói rằng không có "cấu trúc" siêu hình nào được chấp nhận ngoài những cấu trúc biểu hiện trong kết quả có thể đo lường được. Chủ nghĩa thực chứng chỉ giới hạn việc xem xét dữ liệu quan sát được và các khái niệm được xây dựng trên dữ liệu này; nó không bao gồm sự xem xét của một tiên nghiệmkhái niệm siêu hình. Do đó, một nhà thực chứng sẽ lập luận rằng khái niệm nhân quả chỉ có thể có giá trị ở mức độ được xác định theo các kết quả có thể đo lường được trong thực tế --- đến mức nó được định nghĩa là một cái gì đó khác biệt với điều này (như Shmueli đối xử với nó), điều này sẽ được coi là suy đoán siêu hình, và sẽ được coi là không thể chấp nhận được trong diễn ngôn khoa học.

Vì vậy, tôi nghĩ rằng bạn đúng --- hai cách tiếp cận này về cơ bản là xung đột. Cách tiếp cận thực chứng được Box sử dụng khẳng định rằng các khái niệm khoa học hợp lệ hoàn toàn có cơ sở trong các biểu hiện của chúng trong thực tế, trong khi phương pháp thay thế được Shmueli sử dụng nói rằng có một số "cấu trúc" là các khái niệm khoa học quan trọng (mà chúng tôi muốn giải thích) nhưng không thể được thể hiện hoàn hảo khi chúng được "vận hành" bằng cách liên hệ chúng với các kết quả có thể đo lường được trong thực tế.


Chính xác!!! Shmueli dường như mâu thuẫn với hầu hết các định nghĩa thực chứng (và giả mạo) về một tuyên bố khoa học là gì, và tôi tự hỏi liệu ý định của cô ấy có thực sự đưa ra một tuyên bố triết học táo bạo như vậy không? hoặc liệu cô ấy, với tư cách là một nhà thống kê, không nhận thức được những phát ngôn của cô ấy thực sự táo bạo đến mức nào?
Skander H. - Tái lập Monica

Tôi đã đăng một câu hỏi liên quan đến triết lý SE , quan tâm để cân nhắc về nó?
Skander H. - Tái lập Monica

1
Mặc dù chủ nghĩa thực chứng và chủ nghĩa thực dụng có chung đặc điểm chống chủ nghĩa hiện thực, cách tiếp cận của Box là phương pháp sau và chủ nghĩa thực chứng không có ảnh hưởng trong khoa học ít nhất là từ cuối những năm 1960. Đây là lý do tại sao Box không đề cập đến Friedman, hoặc các nhà thực chứng khác. Chủ nghĩa thực dụng không giới hạn bản thân với dữ liệu quan sát được và không có vấn đề gì với các khái niệm tiên nghiệm hoặc các công trình siêu hình. Nó chỉ không xem chúng là tiếp cận "thực tế", và do đó nhắm đến các tính năng "đúng" duy nhất, chúng có thể là số nhiều, phụ thuộc vào nhiệm vụ và có thể xem lại. Quan hệ nhân quả là những cấu trúc như vậy, vì vậy không có xung đột giữa Box và Shmueli.
Conifold

Dù Box có phải là người theo chủ nghĩa thực dụng hay không, thì câu nói cụ thể mà anh ta đưa ra ở đây là, theo quan điểm của tôi, có lợi cho chủ nghĩa thực chứng hơn là chủ nghĩa thực dụng. Triết học sau này có cái nhìn đa nguyên về siêu hình học, cho rằng có nhiều cách thức khái niệm mạch lạc thực tế, và tất cả những điều này là "đúng" theo nghĩa là khái niệm hữu ích của thực tế. Do đó, chủ nghĩa thực chứng sẽ nói, "tất cả các mô hình đều sai, nhưng một số mô hình là hữu ích", trong khi câu châm ngôn của chủ nghĩa thực dụng sẽ gần với "nhiều mô hình là đúng, bởi vì chúng hữu ích".
Phục hồi

Việc xác định đúng với hữu ích chỉ là một quan niệm sai lầm dân gian về chủ nghĩa thực dụng. Tất cả các mô hình đều sai bởi vì "đúng" cho thấy rằng chúng có một cái gì đó tương ứng, mà những người theo chủ nghĩa thực dụng phủ nhận. Và nguyên tắc khoan dung, "các mô hình là đúng miễn là chúng phục vụ một mục đích", là do Carnap, cha đẻ của chủ nghĩa thực chứng logic.
Conifold

4

Một mô hình, khi được sử dụng để giải thích mọi thứ, là một sự đơn giản hóa của thực tế. Đơn giản hóa chỉ là một từ khác cho "sai theo một cách hữu ích". Ví dụ: nếu chúng ta làm tròn số 3.1415926535898 thành 3.14 thì chúng ta đang mắc lỗi, nhưng lỗi này cho phép con người chúng ta tập trung vào phần quan trọng nhất của số đó. Đây là cách các mô hình được sử dụng để giải thích, nó cung cấp cái nhìn sâu sắc về một số vấn đề, nhưng do sự cần thiết phải trừu tượng ra khỏi nhiều thứ khác: Con người chúng ta chỉ không giỏi trong việc nhìn vào hàng ngàn thứ cùng một lúc. Nếu chúng ta chủ yếu quan tâm đến việc dự đoán, chúng ta muốn bao gồm hàng ngàn thứ đó bất cứ khi nào có thể, nhưng với việc giải thích sự đánh đổi thì khác.


1
π

1
@SkanderH. Trong phạm vi "đồ thị thanh lịch và trực quan" tạo điều kiện cho các ứng dụng kỹ thuật, hoặc phát triển các lý thuyết mới, giá trị của chúng không hoàn toàn chủ quan, hoặc không khoa học, nó mang tính thực dụng. Sự thống nhất, sức mạnh giải thích, sự đơn giản và sự gắn kết được thừa nhận rộng rãi là giá trị nhận thức , không mang tính thẩm mỹ . Sự lựa chọn giữa lý thuyết ether và thuyết tương đối đặc biệt của Lorentz được đưa ra dựa trên những cân nhắc như vậy, chúng tương đương nhau về mặt dự đoán.
Conifold

3

Một ví dụ về một mô hình xuất sắc trong dự đoán nhưng không giải thích bất cứ điều gì được đưa ra trong bài viết trên Wikipedia Tất cả các mô hình đều sai . Ví dụ là mô hình hấp dẫn của Newton. Mô hình của Newton hầu như luôn đưa ra những dự đoán không thể phân biệt được với các quan sát thực nghiệm. Tuy nhiên, mô hình là vô cùng hợp lý: bởi vì nó quy định một lực có thể hành động tức thời trên khoảng cách lớn tùy ý.

Mô hình của Newton đã được thay thế bằng mô hình được đưa ra trong lý thuyết tương đối tổng quát của Einstein. Với thuyết tương đối rộng, lực hấp dẫn truyền qua không gian với tốc độ hữu hạn (tốc độ ánh sáng).

Mô hình của Newton không phải là sự đơn giản hóa của mô hình tương đối tổng quát. Để minh họa điều đó, hãy xem xét một quả táo rơi xuống từ cây. Theo thuyết tương đối rộng, quả táo rơi mà không cần Trái đất tác dụng bất kỳ lực nào lên quả táo. (Lý do chính khiến quả táo rơi xuống là do Trái đất cong vênh thời gian, do đó đồng hồ ở gần gốc cây chạy chậm hơn so với đồng hồ cao trên cây.) Vì vậy, như bài viết trên Wikipedia ghi nhận, mô hình của Newton hoàn toàn sai từ một giải thích Góc nhìn cá nhân.

Bài báo của Shmueli [2010] cho rằng có hai mục đích cho một mô hình: dự đoán và giải thích. Trên thực tế, một số tác giả đã tuyên bố rằng có ba mục đích (ví dụ: Konishi & Kitagawa [ Tiêu chí thông tin và mô hình thống kê , 2008: §1.1] và Friendly & Meyer [ Phân tích dữ liệu rời rạc , 2016: §11.6]). Ba mục đích tương ứng với ba loại lý luận logic:

  • dự đoán (tương ứng với khấu trừ);
  • ước lượng tham số (tương ứng với cảm ứng);
  • mô tả cấu trúc (tương ứng với vụ bắt cóc).

Nói rằng mô hình hấp dẫn của Newton "không giải thích bất cứ điều gì" là, thẳng thắn, lố bịch. -1.
amip nói phục hồi Monica

amip, mô hình của Newton không giải thích bất cứ điều gì về cách thức hoạt động của trọng lực, theo giả định rằng thuyết tương đối rộng là chính xác. Nếu một quả táo rơi xuống, mô hình của Newton cho rằng Trái đất tác dụng một lực lên quả táo và định đề đó là hoàn toàn sai. Tôi yêu cầu bạn xem xét câu trả lời của tôi hơn nữa. Nếu bạn vẫn không hiểu, thì vui lòng cho tôi biết những gì không rõ ràng.
SolidPhase

Những gì bạn nói là khá rõ ràng nhưng tôi hoàn toàn không đồng ý với nó.
amip nói phục hồi Monica

amip, tôi yêu cầu bạn giải thích lý do tại sao bạn không đồng ý: bạn có lý do không? (Lưu ý rằng tôi đã thêm một câu bổ sung vào câu trả lời.)
SolidPhase

Cảm ơn. Tôi sẽ tìm kiếm các tài liệu tham khảo mà bạn đề cập. Tôi hiểu làm thế nào một mô hình có thể dự đoán ngay cả khi nó không giải thích. Những gì tôi không nhận được là hướng ngược lại: Làm thế nào một mô hình có thể giải thích mà không dự đoán. Các ví dụ của Newton so với Einstein chỉ làm vẩn đục mọi thứ hơn nữa: Toàn bộ lý do lý thuyết của Einstein thay thế Newton là vì nó dự đoán tốt hơn. Nhìn vào nó theo một cách khác: Nếu chúng ta có các mô hình giải thích cạnh tranh, làm thế nào chúng ta có thể đánh giá chúng trừ khi chúng ta kiểm tra cái nào có sức mạnh dự đoán nhất?
Skander H. - Tái lập Monica

1

Tôi là một sinh viên ngành Thống kê, vì vậy tôi sẽ không gọi mình là chuyên gia, nhưng đây là hai xu của tôi.

Người mẫu không tự giải thích; con người giải thích chúng. Các mô hình tuyến tính dễ hiểu hơn các mạng thần kinh và các khu rừng ngẫu nhiên vì chúng gần với cách chúng ta đưa ra quyết định. Thật vậy, ANN bắt chước bộ não của con người, nhưng bạn không quyết định nhà hàng nào sẽ đi vào ngày mai bằng cách thực hiện một loạt các phép nhân. Thay vào đó, bạn cân nhắc một số yếu tố trong tâm trí của bạn bởi tầm quan trọng của chúng, về cơ bản là sự kết hợp tuyến tính.

"Sức mạnh giải thích" đo lường mức độ một mô hình hòa hợp với trực giác của con người, trong khi "sức mạnh dự đoán" đo lường mức độ phù hợp với cơ chế cơ bản của quá trình. Mâu thuẫn giữa chúng về cơ bản là khoảng cách giữa thế giới và cách chúng ta có thể nhận thức / hiểu về nó. Tôi hy vọng điều này giải thích tại sao "một số mô hình làm tốt công việc giải thích, mặc dù họ dự đoán kém".

Ian Stewart từng nói: "Nếu bộ não của chúng ta đủ đơn giản để chúng ta hiểu chúng, thì chúng ta sẽ đơn giản đến mức chúng ta không thể." Thật không may, bộ não con người nhỏ bé của chúng ta thực sự rất đơn giản so với vũ trụ, hoặc thậm chí là một thị trường chứng khoán (liên quan đến rất nhiều bộ não :). Cho đến nay, tất cả các mô hình đều là sản phẩm của bộ não con người, do đó, nó ít nhiều không chính xác, dẫn đến "Tất cả các mô hình đều sai" của Box. Mặt khác, một mô hình không nhất thiết phải đúng về mặt kỹ thuật để có ích. Ví dụ, định luật về chuyển động của Newton đã bị Einstein bác bỏ, nhưng nó vẫn hữu ích khi một vật thể không lớn hoặc nhanh một cách lố bịch.

Để giải quyết câu hỏi của bạn, tôi thực sự không thể thấy sự không tương thích giữa các điểm của Box và Shmueli. Có vẻ như bạn coi "công suất giải thích" và "công suất dự đoán" là thuộc tính nhị thức, nhưng tôi nghĩ rằng chúng nằm ở hai đầu của một phổ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.