Suy nghĩ thực tế về mô hình giải thích và dự đoán


70

Trở lại vào tháng Tư, tôi đã tham dự một buổi nói chuyện tại chuỗi hội thảo của nhóm Thống kê của Bộ Toán UMD có tên là "Để giải thích hay dự đoán?". Bài nói chuyện được đưa ra bởi Giáo sư Galit Shmueli , người giảng dạy tại Trường Kinh doanh Smith của UMD. Bài nói chuyện của cô dựa trên nghiên cứu mà cô đã làm cho một bài báo có tựa đề "Dự đoán so với mô hình giải thích trong nghiên cứu IS" , và một bài viết tiếp theo có tiêu đề "Để giải thích hay dự đoán?" .

Lập luận của Tiến sĩ Shmueli là các thuật ngữ dự đoán và giải thích trong bối cảnh mô hình thống kê đã bị xáo trộn, và rằng tài liệu thống kê thiếu một cuộc thảo luận kỹ lưỡng về sự khác biệt. Trong bài báo, cô ấy đối chiếu cả hai và nói về ý nghĩa thực tế của chúng. Tôi khuyến khích bạn đọc các bài báo.

Các câu hỏi tôi muốn đặt ra cho cộng đồng học viên là:

  • Làm thế nào để bạn xác định một bài tập dự đoán so với một bài giải thích / mô tả? Nó sẽ hữu ích nếu bạn có thể nói về ứng dụng cụ thể.
  • Bạn đã bao giờ rơi vào cái bẫy của việc sử dụng cái này khi có nghĩa là sử dụng cái kia chưa? Tôi chắc chắn có. Làm thế nào để bạn biết cái nào để sử dụng?

2
Câu hỏi này được đề xuất để đóng cửa. Xem: meta.stats.stackexchange.com/questions/213/ Quảng Tôi thấy rằng nó có 2 phiếu. Những người bỏ phiếu hoặc OP có thể bình luận về lý do tại sao họ muốn thấy câu hỏi vẫn mở ở luồng meta không?

9
Thay vì nói "điều này nên được đóng lại. Ai đó nên bảo vệ nó" làm thế nào về việc bắt đầu giải thích lý do tại sao bạn muốn nó đóng cửa. Quá mơ hồ? Sau đó yêu cầu làm rõ. Đây có vẻ là một câu hỏi hợp lý với tôi. Người hỏi trình bày một bài báo và hỏi về sự khác biệt là giữa thống kê dự đoán và giải thích. Sự thay đổi duy nhất tôi sẽ làm cho câu hỏi là làm rõ chính xác câu hỏi để dễ bỏ phiếu hơn.
JD Long

2
Tôi đã đưa ra một lý do về chủ đề meta. Tôi cảm thấy rằng 'các cuộc thảo luận meta' về câu hỏi sẽ làm lộn xộn trang đặc biệt này.

2
@Srikant @JD Tôi sẽ tăng cường câu hỏi. Cảm ơn vì bạn đã phản hồi. Tôi nghĩ rằng đây là một chủ đề đáng để thảo luận.
wahalulu

4
Bạn có thể thêm các liên kết thích hợp để nói chuyện / giấy tờ được đề cập ở trên?
chl

Câu trả lời:


39

Trong một câu

Mô hình dự đoán là tất cả về "những gì có khả năng xảy ra?", Trong khi mô hình giải thích là tất cả về "chúng ta có thể làm gì về nó?"

Trong nhiều câu

Tôi nghĩ rằng sự khác biệt chính là những gì được dự định sẽ được thực hiện với phân tích. Tôi sẽ đề nghị giải thích là quan trọng hơn nhiều để can thiệp hơn dự đoán. Nếu bạn muốn làm một cái gì đó để thay đổi một kết quả, thì tốt nhất bạn nên tìm cách giải thích tại sao nó lại như vậy. Mô hình giải thích, nếu được thực hiện tốt, sẽ cho bạn biết cách can thiệp (nên điều chỉnh đầu vào nào). Tuy nhiên, nếu bạn chỉ đơn giản muốn hiểu tương lai sẽ như thế nào, mà không có bất kỳ ý định (hoặc khả năng) nào để can thiệp, thì mô hình dự đoán có nhiều khả năng là phù hợp.

Như một ví dụ cực kỳ lỏng lẻo, sử dụng "dữ liệu ung thư".

Mô hình dự đoán sử dụng "dữ liệu ung thư" sẽ phù hợp (hoặc ít nhất là hữu ích) nếu bạn tài trợ cho các phường ung thư của các bệnh viện khác nhau. Bạn không thực sự cần phải giải thích lý do tại sao mọi người bị ung thư, thay vào đó bạn chỉ cần một ước tính chính xác về số lượng dịch vụ sẽ được yêu cầu. Mô hình giải thích có lẽ sẽ không giúp được nhiều ở đây. Ví dụ, việc biết rằng hút thuốc dẫn đến nguy cơ mắc bệnh ung thư cao hơn không tự nó cho bạn biết nên cấp thêm tiền cho phường A hay phường B.

Mô hình giải thích về "dữ liệu ung thư" sẽ phù hợp nếu bạn muốn giảm tỷ lệ ung thư quốc gia - mô hình dự đoán sẽ khá lỗi thời ở đây. Khả năng dự đoán chính xác tỷ lệ ung thư hầu như không thể giúp bạn quyết định làm thế nào để giảm nó. Tuy nhiên, biết rằng hút thuốc dẫn đến nguy cơ mắc bệnh ung thư cao hơn là thông tin có giá trị - bởi vì nếu bạn giảm tỷ lệ hút thuốc (ví dụ như làm thuốc lá đắt hơn), điều này dẫn đến nhiều người có ít rủi ro hơn, điều này (hy vọng) sẽ dẫn đến giảm ung thư giá.

Nhìn vào vấn đề theo cách này, tôi sẽ nghĩ rằng mô hình giải thích chủ yếu sẽ tập trung vào các biến đang kiểm soát người dùng, trực tiếp hoặc gián tiếp. Có thể cần phải thu thập các biến khác, nhưng nếu bạn không thể thay đổi bất kỳ biến nào trong phân tích, thì tôi nghi ngờ rằng mô hình giải thích sẽ hữu ích, ngoại trừ có thể mang lại cho bạn mong muốn giành quyền kiểm soát hoặc ảnh hưởng đến các biến đó đó là quan trọng Mô hình dự đoán, thô sơ, chỉ tìm kiếm sự liên kết giữa các biến, cho dù người dùng có kiểm soát hay không. Bạn chỉ cần biết đầu vào / tính năng / biến độc lập / vv .. để đưa ra dự đoán, nhưng bạn cần có thể sửa đổi hoặc tác động đến đầu vào / tính năng / biến độc lập / vv .. để can thiệp và thay đổi kết quả .


9
+1, được thực hiện độc đáo! Tôi ghét nitpick, nhưng tôi muốn lưu ý rằng dự đoán không phải là về tương lai. Ví dụ, một nhà khảo cổ học có thể muốn xác định (nghĩa là dự đoán) mức độ mưa trong một khu vực tại một thời điểm trong quá khứ bằng kiến ​​thức về dấu vết (tức là ảnh hưởng của lượng mưa) còn lại.
gung - Phục hồi Monica

@gung - Tôi nghĩ tôi đã trả lời câu trả lời của mình để điều này không xảy ra. Rõ ràng, tôi đã bỏ lỡ một vị trí :-)
xác suất

Câu trả lời tốt đẹp. Tôi nghĩ rằng trong nhiều trường hợp chúng ta cần biết tương lai sẽ như thế nào và tại sao. Giả sử, khi nghiên cứu về khách hàng, bạn muốn biết có bao nhiêu khách hàng (và chính xác là khách hàng nào) sẽ ra mắt vào tháng tới và sau đó tại sao họ lại rời đi để tiếp thị có thể can thiệp để giữ chân họ. Sau đó, chúng tôi cần cả dự đoán (để tìm hiểu số lượng và khách hàng trong tương lai) và giải thích để cho chúng tôi biết lý do tại sao, vì vậy chúng tôi có thể giảm số lần khuấy. Vì vậy, chúng ta có mô hình lai của cả hai hoặc một đủ? Varty chạm vào nó bằng cách nói "Mối quan hệ đã biết có thể xuất hiện từ một phân tích giải thích / mô tả hoặc một số kỹ thuật khác"
Espanta

@gung Tôi thích nitpick: nhà khảo cổ học mong muốn dự đoán những trải nghiệm trong tương lai của cô ấy (tức là dự đoán nơi cô ấy sẽ đến một lúc nào đó trong tương lai sẽ tìm thấy dấu vết của lượng mưa cao trong quá khứ).
Alexis

@Alexis, điều đó chắc chắn là có thể, nhưng cũng có thể đó không phải là mối quan tâm nghiên cứu chính của nhà khảo cổ học, và những dữ liệu đó đã được thu thập bởi các nhà nghiên cứu khác (nhà cổ sinh vật học) và nhà khảo cổ học chỉ đơn giản muốn sử dụng những dữ liệu đó để kiểm tra các lý thuyết lợi ích lý thuyết chính của họ ( Gill, 200 ).
gung - Phục hồi Monica

30

Theo quan điểm của tôi, sự khác biệt như sau:

Giải thích / mô tả

Khi tìm kiếm một câu trả lời giải thích / mô tả, trọng tâm chính là dữ liệu chúng tôi có và chúng tôi tìm cách khám phá mối quan hệ cơ bản giữa dữ liệu sau khi tiếng ồn đã được tính đến.

Ví dụ: Có đúng là tập thể dục thường xuyên (nói 30 phút mỗi ngày) dẫn đến hạ huyết áp? Để trả lời câu hỏi này, chúng tôi có thể thu thập dữ liệu từ bệnh nhân về chế độ tập luyện và giá trị huyết áp của họ theo thời gian. Mục tiêu là để xem liệu chúng ta có thể giải thích các biến thể của huyết áp bằng các biến thể trong chế độ tập thể dục.

Huyết áp bị ảnh hưởng bởi không chỉ tập thể dục bởi nhiều yếu tố khác cũng như lượng natri mà một người ăn v.v ... Những yếu tố khác sẽ được coi là tiếng ồn trong ví dụ trên vì trọng tâm là trêu chọc mối quan hệ giữa chế độ tập thể dục và huyết áp.

Sự dự đoán

Khi thực hiện một bài tập dự đoán, chúng ta sẽ ngoại suy thành ẩn số bằng cách sử dụng các mối quan hệ đã biết giữa dữ liệu chúng ta có trong tay. Mối quan hệ đã biết có thể xuất hiện từ một phân tích giải thích / mô tả hoặc một số kỹ thuật khác.

Ví dụ: Nếu tôi tập thể dục 1 giờ mỗi ngày đến mức nào thì huyết áp của tôi có khả năng giảm? Để trả lời câu hỏi này, chúng tôi có thể sử dụng mối quan hệ chưa được khám phá trước đó giữa huyết áp và chế độ tập thể dục để thực hiện dự đoán.

Trong bối cảnh trên, trọng tâm không phải là giải thích, mặc dù một mô hình giải thích có thể giúp cho quá trình dự đoán. Ngoài ra còn có các cách tiếp cận không giải thích (ví dụ, mạng lưới thần kinh) rất tốt trong việc dự đoán những điều chưa biết mà không nhất thiết phải bổ sung vào kiến ​​thức của chúng ta về bản chất của mối quan hệ cơ bản giữa các biến.


6
+1 Câu trả lời này phần lớn tránh sự liên kết khó hiểu với quan hệ nhân quả bằng cách sử dụng ngôn ngữ giải thích, mô tả và mối quan hệ. Điều này cho nó một mức độ rõ ràng mong muốn.
whuber

4
Trong phần Giải thích, bạn đã viết "trọng tâm chính là dữ liệu chúng tôi có" - Tôi nghĩ rằng bạn đang cố gắng nói rằng nhiệm vụ là hồi cứu (trái ngược với bản chất dự đoán trong tương lai). Trong phần giải thích (đọc "giải thích nguyên nhân") thực sự có một sự tập trung lớn vào lý thuyết và kiến ​​thức miền và dữ liệu được sử dụng để kiểm tra các giả định / lý thuyết này. Ngược lại, trong dự đoán, nó dựa trên dữ liệu nhiều hơn và bạn cởi mở hơn về các mối quan hệ, bởi vì bạn không tìm kiếm mối quan hệ nhân quả mà thay vào đó là mối tương quan.
Galit Shmueli

@GalitShmueli Reg lý thuyết / kiến ​​thức tên miền - vâng, tôi đồng ý với quan điểm đó. Tôi chỉ đơn giản là cố gắng đối chiếu lời giải thích vis-a-vis dự đoán bằng cách tập trung vào những gì dường như đối với tôi sự khác biệt chính - ngoại suy giá trị của một biến so với làm sáng tỏ mối quan hệ giữa các biến. Trong quá trình đó, tôi tất nhiên có tội khi bỏ qua các sắc thái tinh tế giữa hai mô hình.
varty

1
@varty Tôi đồng ý với quan điểm của bạn: trong phần giải thích / mô tả bạn quan tâm đến mối quan hệ / hiệu ứng tổng thể / trung bình trong khi dự đoán bạn quan tâm đến việc dự đoán các giá trị riêng lẻ (không nhất thiết phải ngoại suy)
Galit Shmueli

19

Một vấn đề thực tế phát sinh ở đây là lựa chọn biến trong mô hình hóa. Một biến có thể là một biến giải thích quan trọng (ví dụ, có ý nghĩa thống kê) nhưng có thể không hữu ích cho mục đích dự đoán (nghĩa là việc đưa nó vào mô hình dẫn đến độ chính xác dự đoán kém hơn). Tôi thấy lỗi này hầu như mỗi ngày trong các bài báo được xuất bản.

Một điểm khác biệt là ở sự phân biệt giữa phân tích thành phần chính và phân tích nhân tố. PCA thường được sử dụng trong dự đoán, nhưng không hữu ích để giải thích. FA liên quan đến bước quay bổ sung được thực hiện để cải thiện giải thích (và do đó giải thích). Có một bài viết hay ngày hôm nay trên blog của Galit Shmueli về điều này .

Cập nhật: trường hợp thứ ba phát sinh theo chuỗi thời gian khi một biến có thể là một biến giải thích quan trọng nhưng nó không có sẵn cho tương lai. Ví dụ, các khoản vay mua nhà có thể liên quan mật thiết đến GDP nhưng điều đó không được sử dụng nhiều để dự đoán các khoản vay mua nhà trong tương lai trừ khi chúng ta cũng có những dự đoán tốt về GDP.


3
Tại sao / làm thế nào một biến giải thích quan trọng sẽ làm giảm độ chính xác dự đoán?

3
@Srikant. Điều này có thể xảy ra khi biến giải thích có mối quan hệ yếu nhưng có ý nghĩa với biến trả lời. Sau đó, hệ số có thể có ý nghĩa thống kê nhưng khó ước tính. Do đó, MSE của các dự đoán có thể tăng khi bao gồm biến so với khi nó bị bỏ qua. (Độ lệch được giảm khi đưa vào nhưng phương sai được tăng lên.)
Rob Hyndman

Đoạn đầu tiên là một điểm rất, rất tốt. Vẫn đôi khi còn tồi tệ hơn; ở đây PMID: 18052912 là một ví dụ tuyệt vời rằng đôi khi một mô hình tốt hơn có thể được tạo ra trên phần nhiễu của tập hợp so với trên thực tế - rõ ràng là người ta có thể làm một mô hình tốt trên dữ liệu ngẫu nhiên, nhưng điều này hơi gây sốc .

1
tha thứ cho sự khéo léo của tôi, nhưng thông thường không phải là một phần của PCA cũng như FA?
richiemorrisroe

3
Một thống kê sig. nhưng yếu tố dự đoán yếu hiếm khi hiệu quả để dự đoán hoặc giải thích. Ví dụ: nếu giải pháp hồi quy tuyến tính có RSQ là 0,40 mà không bao gồm bộ dự đoán X1 và nếu bao gồm X1 thêm 0,01 vào RSQ đó, thì X1 là "quan trọng" không dự đoán cũng không giải thích.
rolando2

17

Mặc dù một số người thấy dễ dàng nhất khi nghĩ đến sự khác biệt về mô hình / thuật toán được sử dụng (ví dụ: lưới thần kinh = dự đoán), đó chỉ là một khía cạnh cụ thể của phân biệt giải thích / dự đoán. Đây là một loạt các slide mà tôi sử dụng trong khóa học khai thác dữ liệu của mình để dạy hồi quy tuyến tính từ cả hai góc độ. Ngay cả với hồi quy tuyến tính một mình và với ví dụ nhỏ bé này, các vấn đề khác nhau đã xuất hiện dẫn đến các mô hình khác nhau cho các mục tiêu giải thích và dự đoán (lựa chọn biến, lựa chọn biến, đo lường hiệu suất, v.v.)

Galit


5
Vì tò mò, có phải trong cuộc thảo luận về hồi quy dự đoán của bạn (bắt đầu từ trang 33), bạn chọn dự đoán (bước 1) trước khi phân vùng thành tập dữ liệu huấn luyện và xác nhận (bước 3)? Tôi đã nghĩ rằng thủ tục khách quan và trung thực nhất sẽ là phân vùng ngay từ đầu, ngay cả trước khi nhìn vào các biểu đồ phân tán (bước 2). Nếu các biến hồi quy được chọn dựa trên toàn bộ tập dữ liệu, liệu mức tăng có ý nghĩa rõ ràng trên nhiều thử nghiệm ngay cả khi chúng được áp dụng cho dữ liệu xác nhận sau đó?
whuber

Tôi nghĩ rằng câu hỏi chung hơn là liệu bạn có thực hiện trực quan hóa dữ liệu trước khi giữ một khoản giữ. Khi tập dữ liệu lớn, thì nó không thực sự quan trọng. Với một mẫu nhỏ, sử dụng trực quan để chọn dự đoán thực sự nguy hiểm. Trong các trang trình bày của tôi, tôi không có nghĩa là sử dụng trực quan để lựa chọn biến. "Dự đoán chọn" nói chung là "chọn một bộ dự đoán tiềm năng hợp lý". Đó là nhiều hơn về việc kết hợp kiến ​​thức tên miền để chọn một bộ hợp lý.
Galit Shmueli

Tiếp tục chủ đề "Để giải thích hoặc dự đoán", tôi có một câu hỏi liên quan ở đây . Tôi sẽ đánh giá cao nếu bạn đã xem vì câu hỏi chủ yếu dựa trên giấy của bạn.
Richard Hardy

Giáo sư Shmueli, bạn nói trên trang 29 của bài viết về chủ đề này rằng bạn chỉ đang xem xét "dự đoán phi hình học" như được định nghĩa bởi Geisser, 1993. Tôi sẽ đi đâu để tìm định nghĩa đầy đủ về dự đoán phi hình thể? Vui mừng khi bắt đầu một bài viết mới, nhưng nghĩ rằng tôi sẽ hỏi ở đây đầu tiên.
user0

11

Ví dụ: Một ví dụ kinh điển mà tôi đã thấy là trong bối cảnh dự đoán hiệu suất của con người. Năng lực bản thân (nghĩa là mức độ mà một người nghĩ rằng họ có thể thực hiện tốt nhiệm vụ) thường là một yếu tố dự báo mạnh mẽ về hiệu suất công việc. Do đó, nếu bạn đặt năng lực bản thân vào hồi quy bội cùng với các biến số khác như trí thông minh và mức độ kinh nghiệm trước đó, bạn thường thấy rằng tự hiệu quả là một yếu tố dự báo mạnh mẽ.

Điều này đã dẫn đến một số nhà nghiên cứu cho rằng tự hiệu quả gây ra hiệu suất nhiệm vụ. Và những can thiệp hiệu quả đó là những biện pháp tập trung vào việc tăng ý thức về năng lực bản thân của một người.

Tuy nhiên, mô hình lý thuyết thay thế coi hiệu quả của bản thân phần lớn là kết quả của việc thực hiện nhiệm vụ. Tức là, nếu bạn tốt, bạn sẽ biết điều đó. Trong khuôn khổ này, các can thiệp nên tập trung vào việc tăng năng lực thực tế và không nhận thức được năng lực.

Do đó, bao gồm một biến như tự hiệu quả có thể làm tăng dự đoán, nhưng giả sử bạn áp dụng mô hình tự hiệu quả, thì không nên đưa vào như một công cụ dự đoán nếu mục đích của mô hình là làm sáng tỏ các quá trình nguyên nhân ảnh hưởng đến hiệu suất.

Điều này tất nhiên đặt ra vấn đề làm thế nào để phát triển và xác nhận một mô hình lý thuyết nguyên nhân. Điều này rõ ràng dựa vào nhiều nghiên cứu, lý tưởng với một số thao tác thử nghiệm và lập luận chặt chẽ về các quy trình động.

Gần và xa : Tôi đã thấy các vấn đề tương tự khi các nhà nghiên cứu quan tâm đến tác động của các nguyên nhân xa và gần. Nguyên nhân gần có xu hướng dự đoán tốt hơn so với nguyên nhân xa. Tuy nhiên, mối quan tâm về mặt lý thuyết có thể là trong việc tìm hiểu các cách thức mà các nguyên nhân xa và gần hoạt động.

Vấn đề lựa chọn biến : Cuối cùng, một vấn đề rất lớn trong nghiên cứu khoa học xã hội là vấn đề lựa chọn biến. Trong bất kỳ nghiên cứu nào, có vô số biến số có thể được đo nhưng không. Vì vậy, việc giải thích các mô hình cần xem xét ý nghĩa của việc này khi đưa ra các diễn giải lý thuyết.


Ngoài ra còn có một vấn đề trong khoa học xã hội về "giả thuyết yếu" (ví dụ: hiệu ứng là tích cực so với tiêu cực). Và trong ví dụ "hiệu quả bản thân" đó, bạn có thể xem đó là một yếu tố dự đoán nội bộ về hiệu suất mà mỗi người đã xây dựng. Vì vậy, nó có thể tương tự như sử dụng dự đoán "hộp đen" như một biến giải thích.
xác suất

9

Mô hình thống kê: Two Cultures (2001) của L. Breiman, có lẽ, là bài báo hay nhất về điểm này. Kết luận chính của ông (xem thêm các câu trả lời từ các nhà thống kê nổi bật khác ở phần cuối của tài liệu) như sau:

  • "Độ chính xác dự đoán cao hơn có liên quan đến thông tin đáng tin cậy hơn về cơ chế dữ liệu cơ bản. Độ chính xác dự đoán yếu có thể dẫn đến kết luận đáng ngờ."
  • "Các mô hình thuật toán có thể cho độ chính xác dự đoán tốt hơn các mô hình dữ liệu và cung cấp thông tin tốt hơn về cơ chế cơ bản."

3
Chỉ để tạo một liên kết với một câu hỏi liên quan trước đó: Hai nền văn hóa: thống kê so với học máy?
chl

3
Vấn đề với các mô hình thuật toán là chúng khó hiểu. Điều này làm cho nó khó khăn để chẩn đoán và khắc phục các vấn đề tiềm ẩn phát sinh. Một mô hình cấu trúc dễ dàng hơn để đánh giá bởi vì bạn biết mỗi thành phần sẽ trông như thế nào.
xác suất

8

Tôi chưa đọc tác phẩm của cô ấy ngoài bản tóm tắt của bài báo được liên kết, nhưng ý nghĩa của tôi là sự khác biệt giữa "giải thích" và "dự đoán" nên được bỏ đi và thay thế bằng sự phân biệt giữa các mục tiêu của học viên, hoặc là " nhân quả "hoặc" dự đoán ". Nói chung, tôi nghĩ "giải thích" là một từ mơ hồ đến nỗi nó gần như không có gì. Ví dụ, Luật Hooke là giải thích hay dự đoán? Ở phía bên kia của quang phổ, các hệ thống khuyến nghị có thể dự đoán chính xác các mô hình nguyên nhân tốt của xếp hạng mục rõ ràng không? Tôi nghĩ tất cả chúng ta đều chia sẻ trực giác rằng mục tiêu của khoa học là giải thích, trong khi mục tiêu của công nghệ là dự đoán; và trực giác này bằng cách nào đó bị lạc khi xem xét các công cụ chúng ta sử dụng, như các thuật toán học có giám sát,

Đã nói tất cả những điều đó, có lẽ từ duy nhất mà tôi sẽ áp dụng cho một mô hình là có thể hiểu được. Các hồi quy thường có thể giải thích được; lưới thần kinh với nhiều lớp thường không như vậy. Tôi nghĩ mọi người đôi khi ngây thơ cho rằng một mô hình có thể hiểu được là cung cấp thông tin nhân quả, trong khi các mô hình không thể giải thích được chỉ cung cấp thông tin dự đoán. Thái độ này có vẻ đơn giản là nhầm lẫn với tôi.


7

Tôi vẫn còn một chút không rõ ràng về câu hỏi là gì. Phải nói rằng, với tôi, sự khác biệt cơ bản giữa các mô hình dự đoán và giải thích là sự khác biệt trong trọng tâm của chúng.

Mô hình giải thích

Theo định nghĩa, các mô hình giải thích có trọng tâm chính là mục tiêu giải thích một cái gì đó trong thế giới thực. Trong hầu hết các trường hợp, chúng tôi tìm cách đưa ra những giải thích đơn giản và rõ ràng. Nói một cách đơn giản, ý tôi là chúng tôi thích phân tích cú pháp (giải thích các hiện tượng với càng ít tham số càng tốt) và bằng cách sạch sẽ, ý tôi là chúng tôi muốn đưa ra các tuyên bố có dạng sau: "hiệu ứng thay đổi theo một đơn vị thay đổi theo giữ mọi thứ khác không đổi ". Đưa ra các mục tiêu giải thích đơn giản và rõ ràng này, các mô hình giải thích tìm cách xử phạt các mô hình phức tạp (bằng cách sử dụng các tiêu chí phù hợp như AIC) và thích thu được các biến độc lập trực giao (thông qua các thử nghiệm được kiểm soát hoặc thông qua các phép biến đổi dữ liệu phù hợp).y βxyβ

Mô hình dự đoán

Mục tiêu của các mô hình dự đoán là dự đoán một cái gì đó. Vì vậy, họ có xu hướng tập trung ít hơn vào sự kỳ thị hoặc đơn giản mà nhiều hơn vào khả năng dự đoán biến phụ thuộc.

Tuy nhiên, ở trên có phần phân biệt giả tạo vì các mô hình giải thích có thể được sử dụng để dự đoán và đôi khi các mô hình dự đoán có thể giải thích điều gì đó.


+1 để đề cập đến sự phức tạp không được đề cập trực tiếp bởi các câu trả lời hàng đầu. Tuy nhiên, thách thức nảy sinh khi các mô hình giải thích được sử dụng để can thiệp. Làm thế nào để đảm bảo rằng các hệ số ước tính không bị sai lệch, đây là một vấn đề phổ biến do sự phân tách?
Thomas Speidel 23/12/13

5

như những người khác đã nói, sự khác biệt là hơi vô nghĩa, ngoại trừ mục đích của nhà nghiên cứu có liên quan.

Brad Efron, một trong những nhà bình luận trên tờ Hai nền văn hóa , đã đưa ra quan sát sau đây (như đã thảo luận trong câu hỏi trước đây của tôi ):

Dự đoán của chính nó chỉ đôi khi là đủ. Bưu điện hài lòng với bất kỳ phương pháp dự đoán địa chỉ chính xác từ những dòng chữ viết tay. Peter Gregory thực hiện nghiên cứu của mình cho mục đích dự đoán, nhưng cũng để hiểu rõ hơn về cơ sở y tế của bệnh viêm gan. Hầu hết các khảo sát thống kê có xác định các yếu tố nguyên nhân là mục tiêu cuối cùng của họ.

Một số lĩnh vực (ví dụ: Y học) đặt một trọng lượng lớn lên sự phù hợp của mô hình như là quá trình giải thích (phân phối, v.v.), như một phương tiện để hiểu quá trình cơ bản tạo ra dữ liệu. Các lĩnh vực khác ít quan tâm đến điều này và sẽ hài lòng với mô hình "hộp đen" có thành công dự đoán rất cao. Điều này có thể làm việc theo cách của nó vào quá trình xây dựng mô hình là tốt.


5

Với sự tôn trọng, câu hỏi này có thể được tập trung tốt hơn. Có bao giờ mọi người sử dụng một thuật ngữ khi khác là phù hợp hơn? Phải, tất nhiên. Đôi khi nó đủ rõ ràng từ ngữ cảnh, hoặc bạn không muốn trở thành nhà mô phạm. Đôi khi mọi người chỉ cẩu thả hoặc lười biếng trong thuật ngữ của họ. Điều này đúng với nhiều người, và tôi chắc chắn không khá hơn.

Giá trị tiềm năng ở đây là gì (thảo luận về giải thích so với dự đoán trên CV), là để làm rõ sự khác biệt giữa hai phương pháp. Nói tóm lại, sự phân biệt tập trung vào vai trò của quan hệ nhân quả. Nếu bạn muốn hiểu một số động trên thế giới và giải thích lý do tại sao điều gì đó xảy ra theo cách đó, bạn cần xác định mối quan hệ nhân quả giữa các biến có liên quan. Để dự đoán, bạn có thể bỏ qua quan hệ nhân quả. Ví dụ, bạn có thể dự đoán một hiệu ứng từ kiến ​​thức về nguyên nhân của nó; bạn có thể dự đoán sự tồn tại của nguyên nhân từ kiến ​​thức mà hiệu ứng xảy ra; và bạn có thể dự đoán mức độ gần đúng của một hiệu ứng bằng kiến ​​thức về một hiệu ứng khác được điều khiển bởi cùng một nguyên nhân. Tại sao ai đó muốn có thể làm điều này? Để tăng kiến ​​thức của họ về những gì có thể xảy ra trong tương lai, để họ có thể lên kế hoạch phù hợp. Ví dụ, một hội đồng tạm tha có thể muốn dự đoán khả năng một người bị kết án sẽ tái phạm nếu được tạm tha. Tuy nhiên, điều này là không đủ để giải thích. Tất nhiên, ước tính mối quan hệ nhân quả thực sự giữa hai biến có thể cực kỳ khó khăn. Ngoài ra, các mô hình nắm bắt (những gì được cho là) ​​các mối quan hệ nhân quả thực sự thường tồi tệ hơn để đưa ra dự đoán. Vậy tại sao làm điều đó, sau đó? Đầu tiên, hầu hết những điều này được thực hiện trong khoa học, nơi sự hiểu biết được theo đuổi vì mục đích riêng của nó. Thứ hai, nếu chúng ta có thể chọn ra những nguyên nhân thực sự và có thể phát triển khả năng ảnh hưởng đến chúng, chúng ta có thể tạo ra một số ảnh hưởng đối với các hiệu ứng.

Đối với chiến lược mô hình thống kê, không có sự khác biệt lớn. Chủ yếu sự khác biệt nằm ở cách tiến hành nghiên cứu. Nếu mục tiêu của bạn là có thể dự đoán, hãy tìm hiểu thông tin nào sẽ có sẵn cho người dùng của mô hình khi họ cần đưa ra dự đoán. Thông tin họ sẽ không có quyền truy cập không có giá trị. Nếu họ rất có thể muốn có thể dự đoán ở một mức độ nhất định (hoặc trong phạm vi hẹp) của các yếu tố dự đoán, hãy cố gắng tập trung vào phạm vi được lấy mẫu của người dự đoán ở cấp độ đó và chồng chéo ở đó. Chẳng hạn, nếu một ủy ban tạm tha hầu như muốn biết về tội phạm với 2 tiền án, bạn có thể thu thập thông tin về tội phạm với 1, 2 và 3 tiền án. Mặt khác, việc đánh giá trạng thái nguyên nhân của một biến về cơ bản đòi hỏi phải có một thử nghiệm. Đó là, các đơn vị thử nghiệm cần được chỉ định ngẫu nhiên cho các mức quy định của các biến giải thích. Nếu có mối quan tâm về việc liệu bản chất của hiệu ứng nhân quả có phụ thuộc vào một số biến khác hay không, thì biến đó phải được đưa vào thí nghiệm. Nếu không thể tiến hành một thử nghiệm thực sự, thì bạn phải đối mặt với một tình huống khó khăn hơn nhiều, một tình huống quá phức tạp để đi vào đây.


1
Tôi tự hỏi về vai trò của quan hệ nhân quả. Chẳng hạn, giả sử chúng ta có một tập dữ liệu về kích thước và khối lượng của một tập hợp các khối, và chúng ta đang mô hình hóa liên kết của chúng bằng cách hồi quy trên (và tương tác của chúng ). Theo nghĩa nào có thể nói rằng hai chiều và một khối "gây ra" chiều thứ ba? Do đó, sự khác biệt giữa giải thích và dự đoán dường như được dựa trên một cái gì đó khác nhau về cơ bản; cụ thể là mục đích của phân tích. Đoạn cuối của bạn, có nhiều tài khoản trên trang này chứng thực sự khác biệt rõ rệt trong chiến lược. z ( x , y , v )(x,y,z,v)z(x,y,v)
whuber

1
Bạn đúng bản lề này về mục đích của nghiên cứu. Tôi cho rằng tôi đã không nói rõ điều đó (tôi chỉ nói về những gì bạn muốn đạt được). Cũng đúng là giải thích không cần phải quan tâm chính xác đến quan hệ nhân quả - một cái gì đó tương tự với quan hệ nhân quả cũng phù hợp (ví dụ, kích thước - trường hợp khối lượng là một trong những hàm ý logic / toán học). Tuy nhiên, hầu hết các trung tâm mô hình giải thích về quan hệ nhân quả; Tôi đoán tôi nghĩ rằng tôi có thể bỏ qua những thứ đó vì đơn giản. Cuối cùng, chiến lược không khác nhau trong quá trình nghiên cứu thiết kế & thu thập dữ liệu, nhưng hồi quy y trên x là khá giống nhau.
gung - Phục hồi Monica

Cảm ơn bạn đã trả lời. Từ các trao đổi khác trên trang web này, tôi đã học cách hiểu các tuyên bố phổ quát như "hầu hết các trung tâm mô hình giải thích về quan hệ nhân quả" để phản ánh nền tảng và kinh nghiệm của nhà văn, thay vì đúng theo nghĩa đen. Trong khoa học vật lý và "cứng", tuyên bố này có thể đúng, nhưng trong khoa học xã hội và "mềm", tôi nghi ngờ các học viên sẽ đưa ra yêu sách mạnh mẽ như vậy. Trên thực tế, thông thường, các mối quan hệ đang được nghiên cứu được cho là có những nguyên nhân tiềm ẩn chung nhưng không phản ánh quan hệ nhân quả trực tiếp giữa hồi quy và hồi quy.
whuber

@whuber chắc chắn đúng là ý tưởng của tôi bị ảnh hưởng bởi nền tảng và kinh nghiệm của tôi. Nếu câu trả lời này không hữu ích (tôi nhận thấy rằng không nhận được bất kỳ phiếu bầu nào), tôi có thể xóa nó. Một số người khác đã cung cấp câu trả lời bao gồm các ý tưởng tôi muốn truyền đạt.
gung - Phục hồi Monica

@whuber - một ví dụ điển hình về nguyên nhân mềm là "hút thuốc gây ung thư" - mặc dù tôi chắc chắn bạn có thể tìm thấy một người hút thuốc chuỗi không bị ung thư. Khái niệm nhân quả được liên kết với thời gian của các sự kiện. Nguyên nhân phải xảy ra trước hiệu ứng - điều này giải thích tại sao ví dụ khối không có ý nghĩa.
xác suất

4

Hầu hết các câu trả lời đã giúp làm rõ mô hình hóa để giải thích và mô hình hóa cho dự đoán là gì và tại sao chúng khác nhau. Điều không rõ ràng, cho đến nay, là chúng khác nhau như thế nào . Vì vậy, tôi nghĩ rằng tôi sẽ đưa ra một ví dụ có thể hữu ích.

Giả sử chúng ta được xen kẽ trong mô hình GPA đại học như là một chức năng của chuẩn bị học tập. Là biện pháp chuẩn bị học tập, chúng tôi có:

  1. Điểm kiểm tra năng khiếu;
  2. Điểm trung bình HS; và
  3. Số lượng thử nghiệm AP được thông qua.

Chiến lược dự đoán

Nếu mục tiêu là dự đoán, tôi có thể sử dụng đồng thời tất cả các biến này trong mô hình tuyến tính và mối quan tâm chính của tôi sẽ là độ chính xác dự đoán. Bất kỳ biến nào chứng minh hữu ích nhất để dự đoán GPA đại học sẽ được đưa vào mô hình cuối cùng.

Chiến lược giải thích

Nếu mục tiêu là giải thích, tôi có thể quan tâm nhiều hơn đến việc giảm dữ liệu và suy nghĩ cẩn thận về mối tương quan giữa các biến độc lập. Mối quan tâm chính của tôi sẽ là giải thích các hệ số.

Thí dụ

Trong một vấn đề đa biến điển hình với các yếu tố dự đoán tương quan, sẽ không có gì lạ khi quan sát các hệ số hồi quy là "bất ngờ". Với các mối quan hệ tương quan giữa các biến độc lập, sẽ không ngạc nhiên khi thấy các hệ số từng phần của một số biến không cùng hướng với mối quan hệ không thứ tự của chúng và có vẻ phản cảm và khó giải thích.

Ví dụ: giả sử mô hình gợi ý rằng (với Điểm kiểm tra năng khiếu và Số lượng bài kiểm tra AP được hoàn thành thành công), điểm trung bình cao hơn có liên quan đến điểm trung bình đại học thấp hơn . Đây không phải là một vấn đề để dự đoán, nhưng nó đặt ra vấn đề cho một mô hình giải thích trong đó một mối quan hệ như vậy rất khó để giải thích . Mô hình này có thể cung cấp các dự đoán mẫu tốt nhất nhưng không giúp chúng tôi hiểu được mối quan hệ giữa chuẩn bị học tập và GPA đại học.

Thay vào đó, một chiến lược giải thích có thể tìm kiếm một số hình thức giảm biến, chẳng hạn như các thành phần chính, phân tích nhân tố hoặc SEM để:

  1. tập trung vào biến số là thước đo tốt nhất về "kết quả học tập" và mô hình GPA đại học theo mô hình đó; hoặc là
  2. sử dụng điểm yếu tố / biến tiềm ẩn xuất phát từ sự kết hợp của ba biện pháp chuẩn bị học tập thay vì các biến ban đầu.

Các chiến lược như thế này có thể làm giảm sức mạnh dự đoán của mô hình, nhưng chúng có thể mang lại hiểu biết tốt hơn về việc Chuẩn bị học tập có liên quan đến GPA đại học như thế nào.


Về dấu hiệu phản trực giác, tôi tự hỏi liệu đó có phải là do trực giác của chúng ta đang hiểu sai hiệp phương sai - giống như một hiệu ứng chính như thể nó được lồng hoặc hiệu ứng tương tác.
xác suất

3

Tôi muốn đưa ra một cái nhìn tập trung vào mô hình về vấn đề này.

Mô hình dự đoán là những gì xảy ra trong hầu hết các phân tích. Ví dụ, một nhà nghiên cứu thiết lập mô hình hồi quy với một loạt các yếu tố dự đoán. Các hệ số hồi quy sau đó đại diện cho so sánh dự đoán giữa các nhóm. Khía cạnh dự đoán xuất phát từ mô hình xác suất: suy luận được thực hiện liên quan đến một mô hình siêu phổ biến có thể đã tạo ra dân số hoặc mẫu quan sát được. Mục đích của mô hình này là để dự đoán kết quả mới cho các đơn vị nổi lên từ siêu dân số này. Thông thường, đây là một mục tiêu vô ích vì mọi thứ luôn thay đổi, đặc biệt là trong thế giới xã hội. Hoặc bởi vì mô hình của bạn là về các đơn vị hiếm như các quốc gia và bạn không thể vẽ một mẫu mới. Sự hữu ích của mô hình trong trường hợp này được để lại cho sự đánh giá cao của các nhà phân tích.

Khi bạn cố gắng khái quát hóa kết quả cho các nhóm khác hoặc các đơn vị tương lai, đây vẫn là dự đoán nhưng thuộc loại khác. Chúng tôi có thể gọi nó là dự báo chẳng hạn. Điểm mấu chốt là sức mạnh dự đoán của các mô hình ước tính, theo mặc định, có tính chất mô tả . Bạn so sánh một kết quả giữa các nhóm và đưa ra giả thuyết mô hình xác suất cho những so sánh này, nhưng bạn không thể kết luận rằng những so sánh này tạo thành hiệu ứng nhân quả.

Lý do là các nhóm này có thể bị sai lệch lựa chọn . Tức là, họ có thể tự nhiên có điểm cao hơn trong kết quả của sự quan tâm, bất kể điều trị (can thiệp nguyên nhân giả định). Hoặc họ có thể phải chịu một kích thước hiệu quả điều trị khác với các nhóm khác. Đây là lý do tại sao, đặc biệt đối với dữ liệu quan sát, các mô hình ước tính nói chung là về so sánh dự đoán và không giải thích. Giải thích là về việc xác định và ước tính hiệu ứng nhân quả và đòi hỏi các thí nghiệm được thiết kế tốt hoặc sử dụng chu đáo các biến công cụ. Trong trường hợp này, các so sánh dự đoán được cắt từ bất kỳ sai lệch lựa chọn nào và đại diện cho các hiệu ứng nhân quả. Các mô hình do đó có thể được coi là giải thích.

Tôi thấy rằng suy nghĩ trong các điều khoản này thường làm rõ những gì tôi đã thực sự làm khi thiết lập một mô hình cho một số dữ liệu.


+1, có thông tin tốt ở đây. Tuy nhiên, tôi sẽ thận trọng với tuyên bố "Mô hình dự đoán là những gì xảy ra trong hầu hết các phân tích", tuy nhiên. Việc mô hình dự đoán có phổ biến hơn hay không sẽ thay đổi theo ngành học, v.v. Tôi đoán rằng hầu hết mô hình hóa trong học viện là lý giải, và rất nhiều mô hình / khai thác dữ liệu được thực hiện trong khu vực tư nhân (ví dụ: xác định khách hàng tiềm năng lặp lại) là dự đoán. Tôi có thể dễ dàng sai, nhưng sẽ rất khó để nói, một tiên nghiệm, xảy ra hầu hết thời gian.
gung - Phục hồi Monica

1
Vâng, theo quan điểm của tôi, hầu hết việc mô hình hóa dữ liệu quan sát là dự đoán, ngay cả khi mục đích là giải thích. Nếu bạn không ngẫu nhiên quy kết điều trị và thực sự tạo ra sự thay đổi trong thiết lập thử nghiệm, thì hệ số hồi quy của bạn sẽ chỉ có giá trị mô tả, nghĩa là chúng chỉ cung cấp phương tiện để so sánh dự đoán. Ví dụ: bạn có thể dự đoán thành công ở trường dựa trên các đặc điểm nhân khẩu học nhưng điều đó không có nghĩa là những nhân khẩu học này là tác động nhân quả giải thích. Lý do là các dự đoán so sánh được tiếp xúc với xu hướng lựa chọn.
Lionel Henry

1

Chúng ta có thể học được nhiều hơn những gì chúng ta nghĩ từ các mô hình "dự đoán" hộp đen. Chìa khóa nằm ở việc chạy các loại phân tích và mô phỏng độ nhạy khác nhau để thực sự hiểu cách mô hình OUTPUT bị ảnh hưởng bởi những thay đổi trong không gian INPUT. Theo nghĩa này, ngay cả một mô hình dự đoán thuần túy cũng có thể cung cấp những hiểu biết giải thích. Đây là một điểm thường bị bỏ qua hoặc hiểu lầm bởi cộng đồng nghiên cứu. Chỉ vì chúng tôi không hiểu tại sao thuật toán hoạt động không có nghĩa là thuật toán thiếu khả năng giải thích ...

Nhìn chung từ quan điểm chính thống, câu trả lời ngắn gọn của xác thực là hoàn toàn chính xác ...


Không rõ "những hiểu biết giải thích" có thể được lượm lặt theo cách này, nếu bằng cụm từ đó bạn ngụ ý nhân quả.
gung - Phục hồi Monica

1

Có sự khác biệt giữa những gì cô gọi là ứng dụng giải thíchdự đoán trong thống kê. Cô ấy nói rằng chúng ta nên biết mỗi khi chúng ta sử dụng cái này hay cái khác chính xác là cái nào đang được sử dụng. Cô ấy nói rằng chúng tôi thường trộn chúng lên, do đó liên kết .

Tôi đồng ý rằng trong các ứng dụng khoa học xã hội , sự khác biệt là hợp lý, nhưng trong khoa học tự nhiên, chúng là và nên giống nhau. Ngoài ra, tôi gọi chúng là suy luận so với dự báo và đồng ý rằng trong khoa học xã hội, người ta không nên trộn lẫn chúng.

Tôi sẽ bắt đầu với khoa học tự nhiên. Trong vật lý, chúng tôi tập trung vào giải thích, chúng tôi đang cố gắng hiểu thế giới hoạt động như thế nào, nguyên nhân gây ra điều gì v.v ... Vì vậy, trọng tâm là nhân quả, suy luận và như vậy. Mặt khác, khía cạnh dự đoán cũng là một phần của quá trình khoa học. Trên thực tế, cách bạn chứng minh một lý thuyết, đã giải thích tốt các quan sát (nghĩ về mẫu), là dự đoán các quan sát mới sau đó kiểm tra xem dự đoán hoạt động như thế nào. Bất kỳ lý thuyết nào thiếu khả năng dự đoán sẽ gặp khó khăn lớn trong việc chấp nhận vật lý. Đó là lý do tại sao các thí nghiệm như Michelson-Morley rất quan trọng.

Trong khoa học xã hội, thật không may, các hiện tượng cơ bản là không ổn định, không thể lặp lại, không thể thực hiện được. Nếu bạn xem phân rã hạt nhân, bạn sẽ nhận được kết quả tương tự mỗi khi bạn quan sát chúng, và kết quả tương tự mà tôi hoặc một anh chàng một trăm năm trước đã nhận được. Không phải trong kinh tế hay tài chính. Ngoài ra, khả năng tiến hành thí nghiệm rất hạn chế, hầu như không tồn tại cho tất cả các mục đích thực tế, chúng tôi chỉ quan sát và tiến hành các mẫu ngẫu nhiênquan sát. Tôi có thể tiếp tục nhưng ý tưởng cho rằng các hiện tượng mà chúng ta đối phó là rất không ổn định, do đó lý thuyết của chúng ta không có chất lượng như trong vật lý. Do đó, một trong những cách chúng ta xử lý tình huống là tập trung vào suy luận (khi bạn cố gắng hiểu nguyên nhân hoặc tác động của cái gì) hoặc dự báo (chỉ nói những gì bạn nghĩ sẽ xảy ra với điều này hoặc bỏ qua cấu trúc).


0

Một mô hình kết cấu sẽ đưa ra lời giải thích và một mô hình dự đoán sẽ đưa ra dự đoán. Một mô hình cấu trúc sẽ có các biến tiềm ẩn. Một mô hình cấu trúc là một đỉnh cao đồng thời của hồi quy và phân tích nhân tố

Các biến tiềm ẩn được biểu hiện dưới dạng đa cộng tuyến trong các mô hình dự báo (hồi quy).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.