Ba vấn đề triết học mở trong thống kê


9

Gần đây tôi đã đọc xong The Lady Tếm Tea , một cuốn sách thú vị về lịch sử thống kê. Ở cuối cuốn sách, tác giả, David Salsburg , đề xuất ba vấn đề triết học mở trong thống kê, các giải pháp mà ông cho rằng sẽ có ý nghĩa lớn hơn trong việc áp dụng lý thuyết thống kê vào khoa học. Tôi chưa bao giờ nghe về những vấn đề này trước đây, vì vậy tôi quan tâm đến phản ứng của người khác đối với họ. Tôi đang mạo hiểm vào lãnh thổ mà tôi có ít kiến ​​thức, vì vậy tôi sẽ mô tả chân dung của Salsburg về những vấn đề này và đặt ra hai câu hỏi chung về những vấn đề dưới đây.

Các vấn đề triết học của Salsburg là:

  1. Mô hình thống kê có thể được sử dụng để đưa ra quyết định?
  2. Ý nghĩa của xác suất khi áp dụng vào cuộc sống thực là gì?
  3. Mọi người có thực sự hiểu xác suất?

Thống kê và ra quyết định

Như một minh họa cho vấn đề được trình bày trong câu hỏi 1, Salsburg trình bày nghịch lý sau đây. Giả sử chúng tôi tổ chức xổ số với 10000 vé không bị đánh số. Nếu chúng tôi sử dụng xác suất để đưa ra quyết định về việc liệu có vé nào sẽ trúng xổ số hay không bằng cách từ chối giả thuyết này về vé có xác suất dưới đây, giả sử, 0,001, chúng tôi sẽ từ chối giả thuyết về vé trúng cho tất cả các vé trong xổ số!

Salsburg sử dụng ví dụ này để lập luận rằng logic không phù hợp với lý thuyết xác suất vì lý thuyết xác suất hiện đang được hiểu và do đó, hiện tại chúng ta không có một phương tiện tích hợp thống kê tốt (mà ở dạng hiện đại của nó, phần lớn dựa trên lý thuyết xác suất) với một phương tiện hợp lý của việc ra quyết định.

Ý nghĩa của xác suất

Là một sự trừu tượng hóa toán học, Salsburg lập luận rằng xác suất hoạt động tốt, nhưng khi chúng ta cố gắng áp dụng kết quả vào cuộc sống thực, chúng ta gặp phải vấn đề rằng xác suất không có ý nghĩa cụ thể trong cuộc sống thực. Cụ thể hơn, khi chúng ta nói rằng có khả năng mưa 95% vào ngày mai, không rõ thực thể nào áp dụng 95%. Có áp dụng cho tập hợp các thí nghiệm khả thi mà chúng ta có thể tiến hành để có được kiến ​​thức về mưa không? Có áp dụng cho nhóm người có thể ra ngoài và bị ướt không? Salsburg lập luận rằng việc thiếu một phương tiện để giải thích xác suất tạo ra vấn đề cho bất kỳ mô hình thống kê nào dựa trên xác suất (ví dụ, hầu hết trong số chúng).

Mọi người có hiểu xác suất không?

Salsburg lập luận rằng một nỗ lực để giải quyết các vấn đề với việc thiếu một phương tiện cụ thể để giải thích xác suất là thông qua khái niệm " xác suất cá nhân ", được đề xuất bởi Jimmie SavageBruno de Finetti, hiểu xác suất là niềm tin cá nhân về khả năng của các sự kiện trong tương lai. Tuy nhiên, để xác suất cá nhân cung cấp cơ sở mạch lạc cho xác suất, mọi người cần có một sự hiểu biết chung về xác suất là gì và một phương tiện phổ biến sử dụng bằng chứng để đưa ra kết luận về xác suất. Thật không may, bằng chứng như sản phẩm của Kahneman và Tversky cho thấy niềm tin cá nhân có thể là một cơ sở khó khăn để tạo ra một cơ sở mạch lạc cho xác suất. Salsburg gợi ý rằng các phương pháp thống kê mô hình xác suất là niềm tin (có lẽ như phương pháp Bayes? Tôi đang mở rộng kiến ​​thức của mình ở đây) sẽ cần phải giải quyết vấn đề này.

Những câu hỏi của tôi

  1. Các vấn đề của Salsburg thực sự là vấn đề đối với các số liệu thống kê hiện đại?
  2. Chúng ta đã có tiến bộ nào trong việc tìm giải pháp cho những vấn đề này chưa?

1
+1 Bạn sẽ tìm thấy một cuộc thảo luận mở rộng về (1) và (3) - với các câu trả lời theo kinh nghiệm xác định - trong cuốn sách Thinking, Fast and Slow (2011) của Daniel Kahnemann .
whuber

2
Tôi cần đọc lại cuốn sách, nhưng (1) dường như là một cách sử dụng xác suất khá kỳ quặc để ra quyết định. Bạn không cần phải từ chối các giả thuyết để đưa ra quyết định, đưa ra quyết định tối đa hóa lợi nhuận kỳ vọng là hoàn toàn hợp lệ và trong trường hợp này sẽ cho bạn biết rằng bất kỳ vé xổ số nào cũng tốt như mọi thứ khác (không bao gồm việc xem xét hành vi của các khách hàng khác ).
Dikran Marsupial

3
Tôi phải nói rằng, tôi đã có một khoảng thời gian khó khăn để đọc qua "nghịch lý" đầu tiên; một tác giả phản đối thống kê và ra quyết định trong khi nó sẽ xuất hiện, không có kiến ​​thức về việc ra quyết định thống kê, sẽ không được tin tưởng vào khả năng áp dụng thống kê nói chung. Ngoài ra, như Russell và Whitehead đã chỉ ra, logic là một phần của toán học, và tất nhiên cũng là lý thuyết xác suất, vì vậy chúng không thể không nhất quán với nhau - trừ khi chính toán học không nhất quán trong nội bộ. Đối với nghịch lý # 2, hãy hỏi bất kỳ chuyên gia tính toán hoặc người đánh bạc nào về việc liệu xác suất có thể được áp dụng vào cuộc sống thực hay không.
jbowman

"Khi chúng ta nói rằng có khả năng mưa 95% vào ngày mai, không rõ thực thể nào 95% áp dụng" Gigerenzer (ví dụ như trong "Savvy Rủi ro") thảo luận về điều này nhưng theo cách hoàn toàn thực tế và phi triết học. Ông đề nghị rằng ít nhất bạn đánh vần 95% những gì (đối với phát sóng thời tiết: thường là những ngày tương tự như ngày mai), hoặc tốt hơn: 19 trong số 20 ngày như vậy có mưa và đưa ra định nghĩa về "mưa" nghĩa là gì đặc biệt. Ông cũng lập luận rằng trẻ em ở trường có thể hiểu những tuyên bố như vậy, nhưng hầu như không ai có thể nếu thông tin quan trọng về mẫu số bị bỏ qua.
cbeleites không hài lòng với SX

Câu trả lời:


4

Chúng ta có thể sử dụng số liệu thống kê / xác suất để đưa ra quyết định? Tất nhiên chúng ta có thể, cách mà chúng ta nên đi về vấn đề này là bằng cách chọn quá trình hành động để giảm thiểu tổn thất dự kiến ​​của chúng ta. Trong trường hợp này, tất cả các số xổ số đều có khả năng xuất hiện như nhau; nếu tất cả đều cung cấp cùng một giải thưởng, thì tổn thất dự kiến ​​là như nhau đối với bất kỳ số nào, vì vậy chúng tôi không chọn vấn đề gì. Nếu chúng ta cũng có tùy chọn không chơi xổ số, đó có thể là hành động chúng ta nên thực hiện vì nó sẽ giảm thiểu tổn thất dự kiến ​​của chúng ta khi cho rằng xổ số mang lại lợi nhuận cho ai đó (hoặc ít nhất là chi phí cho việc chạy xổ số ). Tất nhiên đây chỉ là lẽ thường và phù hợp với logic, và có thể được diễn đạt bằng thuật ngữ xác suất hoàn toàn.

Dường như với tôi rằng câu hỏi đặt ra từ một quan điểm khá hạn chế về cách sử dụng số liệu thống kê để đưa ra quyết định, nó không phải được thực hiện với các bài kiểm tra giả thuyết bán thủy sản.

Tôi sẽ đề nghị cuốn sách của Jaynes về lý thuyết Xác suất đi một cách công bằng để giải quyết các điểm (2) và (3), xác suất có thể đại diện cho các biện pháp khách quan về tính hợp lý mà không phải là "xác suất cá nhân", nhưng tôi hy vọng @probabilityislogic có thể giải thích điều đó tốt hơn tôi có thể.


4

Tôi không nghĩ rằng đây thực sự là những câu hỏi có thể được trả lời một cách thuyết phục. (IOW, họ thực sự là triết học). Mà nói...

Thống kê và ra quyết định

Có, chúng tôi có thể sử dụng số liệu thống kê trong việc ra quyết định.

Tuy nhiên, có giới hạn cho khả năng ứng dụng của nó; IOW, người ta phải hiểu những gì một người đang làm.

Điều này là hoàn toàn áp dụng cho bất kỳ lý thuyết.

Ý nghĩa của xác suất

95% xác suất mưa vào ngày mai có nghĩa là nếu chi phí của bạn chuẩn bị cho một cơn mưa (ví dụ, lấy ô) Avà chi phí của bạn bị mắc mưa không chuẩn bị (ví dụ, bộ đồ ướt) B, thì bạn nên mang theo ô khi và chỉ khi A < 0.95 * B .

Mọi người có hiểu xác suất không?

Không, mọi người không hiểu nhiều, ít nhất là tất cả xác suất.

Kahneman và Tversky đã chỉ ra rằng trực giác của con người bị thiếu sót ở nhiều cấp độ, nhưng trực giácsự hiểu biết không giống nhau, và tôi sẽ cho rằng mọi người hiểu thậm chí còn kém hơn cả trực giác.

Các vấn đề của Salsburg thực sự là vấn đề đối với các số liệu thống kê hiện đại?

Không. Tôi không nghĩ có ai quan tâm đến những vấn đề này ngoại trừ các nhà triết học và những người có tâm trạng triết học.

Chúng ta đã có tiến bộ nào trong việc tìm giải pháp cho những vấn đề này chưa?

Mọi người quan tâm có một giải pháp. Giải quyết cá nhân của tôi là ở trên.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.