Chúng ta có thể nghĩ về một xác suất theo cả nghĩa cổ điển và chủ quan không?


7

Tôi là một sinh viên thống kê. Tôi đang cố gắng để hiểu các định nghĩa cổ điển và khách quan về xác suất và làm thế nào chúng có liên quan đến suy luận thường xuyên và Bayes. Tôi không rõ ràng tại sao xác suất cổ điển được kết hợp với suy luận thường xuyên và tại sao suy luận Bayes được kết hợp với xác suất chủ quan. Trong một số nguồn tôi đã đọc các tuyên bố như sau từ bài viết này của Wellek (xin lỗi tôi không thể tìm thấy một phiên bản không nằm sau bức tường trả tiền):

Từ quan điểm thường xuyên, các tham số dân số là hằng số không quan sát được mà không có báo cáo xác suất có ý nghĩa nào có thể được thực hiện.

Tôi đang cố gắng để hiểu nếu điều này là do định nghĩa cổ điển về xác suất như các thử nghiệm lặp đi lặp lại hoặc nếu đó là do các ràng buộc của suy luận thường xuyên.

Câu hỏi cụ thể của tôi là ở cuối nếu độc giả muốn bỏ qua phía trước, nhưng tôi muốn chia sẻ suy nghĩ của tôi trong trường hợp có ích.

Xem xét biến ngẫu nhiên X. Theo định nghĩa cổ điển về xác suất nếu tôi muốn đo lường một cách khoa học xác suấtP(X=x), Tôi sẽ nghĩ rằng tôi chỉ cần lặp lại thí nghiệm một số lượng lớn và thực hiện kiểm đếm. Theo định nghĩa chủ quan, tôi nghĩ ban đầu dự kiến ​​sẽ tham khảo niềm tin của chính tôi hoặc niềm tin của một tác nhân hợp lý. Khi tôi thu thập thêm dữ liệu, những niềm tin đó sau đó được sửa đổi một cách hợp lý.

Bây giờ có vẻ như với tôi H0|X không thể quan sát được nên không có cách nào để tính giá trị của P(H0|X)bởi thủ tục kinh nghiệm cổ điển của tôi. Ngược lại, tôi luôn có thể tin vào những điều tôi không thể quan sát trực tiếp nhưH0|X và vì vậy giả sử tôi biết một số mối quan hệ giữa những thứ tôi có thể quan sát như X và những điều tôi không thể quan sát như H0, điều này cho phép tôi có niềm tin về P(H0|X) mà tôi có thể sửa đổi hợp lý theo thời gian.

Nó xảy ra với tôi rằng tôi cũng có thể lập luận rằng đối với người thường xuyên, H0 dù sao cũng là một tài sản cố định của vũ trụ nên có lẽ tôi bị mắc kẹt với khái niệm rằng H0được cố định ngay cả khi tôi có thể quan sát nó. Nhưng điều gì sẽ xảy ra nếu chúng ta nghĩ về thí nghiệm điển hình về việc lật một đồng xu và chúng ta sửa đổi nó để nói rằng tôi có nguồn cung quý lớn và tôi luôn sử dụng một đồng tiền mới mỗi khi tôi ghi lại một lần lật. Vì vậy, trong trường hợp đó, tôi nghi ngờ có một tham số cơ bảnpđó là đồng tiền cụ thể nhưng tôi không bao giờ có thể quan sát trực tiếp nó. Vì thế,P(p=0.5|X) là có ý nghĩa nhưng tôi không thể tính toán nó thông qua quan sát trực tiếp p.

Vì vậy, chỉ để quay lại các câu hỏi cấp cao của tôi.

  1. Có cách nào có ý nghĩa để diễn giải một thủ tục suy luận Bayes như một người thường xuyên không?

  2. Có cách nào có ý nghĩa để thực hiện suy luận Bayes trong đó xác suất được xác định theo định nghĩa cổ điển của xác suất?


Bài viết có sẵn trên trung tâm khoa học viễn tưởng. Ngoài ra: +1
Alexis

3
"Theo quan điểm của Bayes, ... dữ liệu đã được sửa" làm tôi ngạc nhiên. Tôi tin rằng người Bayes áp dụng quan điểm thống kê gần như phổ quát rằng dữ liệu được phân tích bằng mô hình xác suất cho họ. Do đó, mô hình của họ bao gồm các phân phối chung của các tham số và dữ liệu. Trong phạm vi câu hỏi của bạn được xác định dựa trên sự hiểu biết (mis?) Này, bạn có thể muốn cải tổ chúng.
whuber

2
@whuber Được rồi. Tuyệt quá. Cảm ơn đã làm sáng tỏ sự hiểu lầm này. Tôi sẽ kết hợp nó vào câu hỏi của tôi (giả sử có một phiên bản câu hỏi của tôi vẫn có ý nghĩa).
Kareem Carr

1
Một số thứ liên quan: stats.stackexchange.com/a/232507/28666
amip

2
Theo nhận xét của @whuber, mô hình Bayes yêu cầu một mô hình để dữ liệu có chức năng khả năng. Nhưng sau đó, dữ liệu được điều hòa hoàn toàn và được coi là một nhóm các hằng số với mục đích nhận được các phân phối của các tham số chưa biết.
Frank Harrell

Câu trả lời:


2

Có một câu hỏi tương tự trước đó tại: Xác suất cơ bản là về các lớp tham chiếu (thực tế hay tưởng tượng)? và tôi thực sự đang cố gắng ở đây để trả lời cả hai. Chúng ta phải bắt đầu với xác suất là gì?

Câu trả lời toán học là bất cứ điều gì đáp ứng các tiên đề xác suất thông thường là một xác suất. Nhưng điều đó không thực sự trả lời câu hỏi của chúng tôi! bởi vì chúng ta đang ở cách chúng ta có thể sử dụng xác suất , làm thế nào chúng ta có thể giải thích xác suất . Theo suy nghĩ của tôi (hôm nay, 7 sao hỏa 2018, ngày mai ...) tất cả các quan niệm về xác suất (thường xuyên, chủ quan, cá nhân, ...) đều có một điểm chung quan trọng, mang lại cho chúng một ý nghĩa chung. Đó là khái niệm về hiệu chuẩn hoặc các lớp tham chiếu . Để hiệu chuẩn, xem ví dụ Hiển thị hiệu chuẩn xác suất dự đoán của một mô hình hoặc tìm kiếm trang web này để "hiệu chuẩn". Đối với các lớp tham khảo các bài liên kết đầu tiên.

Hiệu chuẩn khác nhau ở loại lớp tham chiếu nào bạn đang kết hợp với:

  1. Đối với xác suất thường xuyên cổ điển, chúng tôi đang hiệu chỉnh đối với một tập hợp các sự kiện tương tự và có thể quan sát được theo kinh nghiệm, như lặp lại các lần ném của cùng một đồng xu hoặc súc sắc. Những xác suất này được cho là khách quan bởi vì hầu hết những người hợp lý sẽ đồng ý với chúng.
  2. Bookies cần phải hiệu chỉnh với nhóm người đánh cược của họ, để về lâu dài, chiến thắng và thua lỗ của anh ta được cân bằng. Nếu nhóm người đánh cược của anh ta, với tư cách là một tập thể, được hiệu chỉnh kém theo nghĩa 1), thì nhà cái phải điều chỉnh theo đó. Một cách khác để nói điều này là tỷ lệ cược (hoặc xác suất) thực sự là giá thị trường.
  3. Xác suất chủ quan được hình thành bởi người đưa ra phán đoán hình thành các lớp tương đương của các sự kiện với kết quả không chắc chắn. Sự kiệnA,Bthuộc cùng một lớp tương đương nếu người đó đánh giá họ là có thể trao đổi. Điều đó có nghĩa là đối với người này, trong bất kỳ hệ thống đặt cược nào liên quan đếnA nhưng không B anh ấy có thể trao đổi A cho Bvà vẫn đánh giá đặt cược ở cùng một mức giá. Những sự kiện như vậy phải có cùng xác suất. Vì vậy, các lớp tương đương bao gồm các sự kiện được đánh giá là có cùng xác suất và hiệu chuẩn chống lại tần suất dài của các sự kiện trong lớp.

Chúng ta có thể nói rằng xác suất có khuôn mặt Janus:

nhập mô tả hình ảnh ở đây

(hoặc có lẽ tốt hơn để nói rằng xác suất đó là một kẻ troll nhiều đầu!)

Với quan điểm này có vẻ như có một sự diễn giải liên tục, từ rất khách quan đến rất chủ quan! nhiều hơn những cách giải thích khác nhau. Rất nhiều cuộc thảo luận thực tế về xác suất có thể được đóng khung trong các khái niệm này, một ví dụ: xác suất của một vụ nổ ở Biển Bắc là gì? Ngay trước khi ra mắt Bravo tại trường Ekofisk https://en.wikipedia.org/wiki/Ekofisk_oil_fieldđiều này đã được thảo luận tại Storting, một thành viên đã hỏi những gì đã được thực hiện về rủi ro xả đáy và đề cập đến xác suất lấy từ kinh nghiệm lịch sử từ vịnh Mexico. Bộ trưởng dầu mỏ Bjartmar Gjerde trả lời rằng điều này khiến anh nhớ đến người phụ nữ có ba đứa con, và không muốn nhiều hơn, bởi vì cô đã nghe nói rằng mỗi đứa trẻ thứ tư được sinh ra là người Trung Quốc ... Một ngày sau khi tờ báo dagbladet xuất hiện có tiêu đề này: "Một người Trung Quốc được sinh ra ở Biển Bắc". Vì vậy, kinh nghiệm từ Vịnh Mexico nên được sử dụng trong việc hình thành các lớp tham chiếu cho Biển Bắc, hoặc theo cách khác, nên xả hơi ở Vịnh Mexico và Biển Bắc để được hiệu chỉnh cùng nhau hay riêng rẽ? Không có câu trả lời hoàn toàn khách quan cho những câu hỏi như vậy, làm cho những đánh giá như vậy một phần chủ quan ngay cả khi chúng ta nhắm vào việc giải thích tần số.

Vì vậy, "tính chủ quan" trong "xác suất chủ quan" có nghĩa là những người hợp lý khác nhau có thể đi đến những đánh giá khác nhau, định nghĩa các lớp tham chiếu theo những cách khác nhau, chứ không phải là "mọi thứ đều ổn". Để xác suất chủ quan có ý nghĩa, dự kiến ​​các lớp tham chiếu (hoặc quy trình hiệu chuẩn) được thực hiện càng rõ ràng càng tốt, để có thể thảo luận và phê bình. Nếu không, nó sẽ biến thành một trò chơi đoán số.

Vì vậy, theo nghĩa này (chủ quan) xác suất chỉ có ý nghĩa đối với các sự kiện mà xác suất có thể được hiệu chuẩn. Một ví dụ mà điều này là không thể (tôi có tin không) làP(Does God exist). Hiệu chuẩn là không thể, vì vậy một xác suất như vậy không thể được thực hiện có ý nghĩa. Theo nghĩa này, chúng ta có thể nói về xác suất (chủ quan) của sự kiệnE chỉ khi xảy ra hay không E cuối cùng sẽ được biết đến, hoặc ít nhất là điều đó là có thể, ít nhất là về nguyên tắc.

Vì vậy, với câu hỏi đầu tiên của bạn:

Từ quan điểm thường xuyên, các tham số dân số là hằng số không quan sát được mà không có báo cáo xác suất có ý nghĩa nào có thể được thực hiện.

Chà, người thường xuyên chọn không đưa ra bất kỳ tuyên bố xác suất nào về giá trị tham số chưa biết (nhưng cố định), nhưng anh ta có bị buộc phải thực hiện lựa chọn đó không? Bây giờ, anh không. Ví dụ, hãy để tham sốμđại diện cho chiều cao trung bình của nam giới Na Uy 20 tuổi. Chúng tôi không biết giá trị chính xác, vì vậy sẽ rất hợp lý khi đặt cược vào các sự kiện (đề xuất) liên quan đếnmu, Nói E={μ<=1.73m}. Nhưng ở trên chúng tôi đã nói rằng "... chúng ta có thể nói về xác suất (chủ quan) của sự kiệnE chỉ khi xảy ra hay không E cuối cùng sẽ được biết đến, ... ". Đó có phải là trường hợp của E? Không phải là công thức, nhưng người Bayes như deFinetti đã suy nghĩ sâu sắc về vấn đề này, và đưa ra giải pháp sau đây. Để choX=(X1,X2,,Xn,)được quan sát chiều cao trên một mẫu ngẫu nhiên của 20 con đực Na Uy. Trước khi lấy mẫu, chúng tôi sẽ có một số kỳ vọng về các giá trị có thể. Là một mẫu ngẫu nhiên, phân phối củaXsẽ được trao đổi . deFinetti đã chứng minh định lý đại diện của mình, một (vô hạn) có thể trao đổiX có thể được biểu diễn dưới dạng độc lập có điều kiện với một số biến tiềm ẩn bên dưới, trong ví dụ μ (và có thể một số tham số khác như σ) và với phân phối trước về các biến / tham số tiềm ẩn này. Theo cách này, chúng ta có thể xây dựng phân phối xác suất (trước) trênμ, và vẫn nghĩ về nó như một hằng số chưa biết! Điều đó có thể trông lạ, nhưng có thể được giải quyết bằng cách nghĩ rằng bản phân phối này là epistemia , không phải aleatori . Theo cách này, đặt cược vàoμ có thể được dịch để đặt cược vào X, mà chúng ta có thể giải quyết.

(chưa thực sự kết thúc, bit vẫn là đêm khuya ...) mặc dù tôi hy vọng điều đó có thể được thực hiện Nếu bất cứ ai có một số tài liệu tham khảo thú vị liên quan, xin vui lòng bấm chuông trong ...


3
Tôi nghĩ rằng một số suy nghĩ tốt nhất về điều này là trong cuốn sách Tư duy tốt của IJ Good, nơi anh ta có một lập luận thuyết phục rằng tất cả các xác suất là chủ quan, do những gì trong cơ sở tri thức / kiến ​​thức của người quan sát. Nếu chỉ có một người chơi bài biết rằng một lá bài có bề mặt gồ ghề, thì người chơi đó sẽ có xác suất khác về việc lá bài đó vươn lên trên cỗ bài so với những người chơi khác. (Đó là một trong những ví dụ của Good)
Frank Harrell
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.