Gần đây tôi đã đọc xong The Lady Tếm Tea , một cuốn sách thú vị về lịch sử thống kê. Ở cuối cuốn sách, tác giả, David Salsburg , đề xuất ba vấn đề triết học mở trong thống kê, các giải pháp mà ông cho rằng sẽ có ý nghĩa lớn hơn trong việc áp dụng lý thuyết thống kê vào khoa học. Tôi chưa bao giờ nghe về những vấn đề này trước đây, vì vậy tôi quan tâm đến phản ứng của người khác đối với họ. Tôi đang mạo hiểm vào lãnh thổ mà tôi có ít kiến thức, vì vậy tôi sẽ mô tả chân dung của Salsburg về những vấn đề này và đặt ra hai câu hỏi chung về những vấn đề dưới đây.
Các vấn đề triết học của Salsburg là:
- Mô hình thống kê có thể được sử dụng để đưa ra quyết định?
- Ý nghĩa của xác suất khi áp dụng vào cuộc sống thực là gì?
- Mọi người có thực sự hiểu xác suất?
Thống kê và ra quyết định
Như một minh họa cho vấn đề được trình bày trong câu hỏi 1, Salsburg trình bày nghịch lý sau đây. Giả sử chúng tôi tổ chức xổ số với 10000 vé không bị đánh số. Nếu chúng tôi sử dụng xác suất để đưa ra quyết định về việc liệu có vé nào sẽ trúng xổ số hay không bằng cách từ chối giả thuyết này về vé có xác suất dưới đây, giả sử, 0,001, chúng tôi sẽ từ chối giả thuyết về vé trúng cho tất cả các vé trong xổ số!
Salsburg sử dụng ví dụ này để lập luận rằng logic không phù hợp với lý thuyết xác suất vì lý thuyết xác suất hiện đang được hiểu và do đó, hiện tại chúng ta không có một phương tiện tích hợp thống kê tốt (mà ở dạng hiện đại của nó, phần lớn dựa trên lý thuyết xác suất) với một phương tiện hợp lý của việc ra quyết định.
Ý nghĩa của xác suất
Là một sự trừu tượng hóa toán học, Salsburg lập luận rằng xác suất hoạt động tốt, nhưng khi chúng ta cố gắng áp dụng kết quả vào cuộc sống thực, chúng ta gặp phải vấn đề rằng xác suất không có ý nghĩa cụ thể trong cuộc sống thực. Cụ thể hơn, khi chúng ta nói rằng có khả năng mưa 95% vào ngày mai, không rõ thực thể nào áp dụng 95%. Có áp dụng cho tập hợp các thí nghiệm khả thi mà chúng ta có thể tiến hành để có được kiến thức về mưa không? Có áp dụng cho nhóm người có thể ra ngoài và bị ướt không? Salsburg lập luận rằng việc thiếu một phương tiện để giải thích xác suất tạo ra vấn đề cho bất kỳ mô hình thống kê nào dựa trên xác suất (ví dụ, hầu hết trong số chúng).
Mọi người có hiểu xác suất không?
Salsburg lập luận rằng một nỗ lực để giải quyết các vấn đề với việc thiếu một phương tiện cụ thể để giải thích xác suất là thông qua khái niệm " xác suất cá nhân ", được đề xuất bởi Jimmie Savage và Bruno de Finetti, hiểu xác suất là niềm tin cá nhân về khả năng của các sự kiện trong tương lai. Tuy nhiên, để xác suất cá nhân cung cấp cơ sở mạch lạc cho xác suất, mọi người cần có một sự hiểu biết chung về xác suất là gì và một phương tiện phổ biến sử dụng bằng chứng để đưa ra kết luận về xác suất. Thật không may, bằng chứng như sản phẩm của Kahneman và Tversky cho thấy niềm tin cá nhân có thể là một cơ sở khó khăn để tạo ra một cơ sở mạch lạc cho xác suất. Salsburg gợi ý rằng các phương pháp thống kê mô hình xác suất là niềm tin (có lẽ như phương pháp Bayes? Tôi đang mở rộng kiến thức của mình ở đây) sẽ cần phải giải quyết vấn đề này.
Những câu hỏi của tôi
- Các vấn đề của Salsburg thực sự là vấn đề đối với các số liệu thống kê hiện đại?
- Chúng ta đã có tiến bộ nào trong việc tìm giải pháp cho những vấn đề này chưa?