Không ai đã đề xuất một cách tiếp cận Bayes chưa? Tôi biết câu hỏi đã được trả lời rồi, nhưng cái quái gì thế. Dưới đây chỉ dành cho một cái chết 3 mặt, nhưng tôi đoán rõ ràng là cách khắc phục nó cho mặt.n=37
Đầu tiên, phù hợp với những gì @Glen_b đã nói, một người Bayes không thực sự quan tâm đến việc liệu cái chết có chính xác hay không - điều đó không đúng. Những gì anh ấy quan tâm là liệu nó có đủ gần hay không , dù "đủ" có nghĩa là gì trong bối cảnh, giả sử, trong vòng 5% công bằng cho mỗi bên.
Nếu , và tương ứng với các xác suất của lần lượt 1, 2 và 3, thì chúng tôi trình bày kiến thức trước về với phân phối trước và để làm cho phép toán dễ dàng, chúng tôi có thể chọn một phân phối Dirichlet . Lưu ý rằng . Đối với thông tin không có thông tin trước, chúng tôi có thể chọn các tham số trước đó, giả sử, .p 2 p 3p1p2p3p=(p1,p2,p3)p1+p2+p3=1α0=(1,1,1)
Nếu đại diện cho số lượng quan sát là 1,2,3 thì tất nhiên có phân phối đa thức với các tham số và lý thuyết nói rằng hậu thế cũng là một Phân phối Dirichlet với các tham số . (Dirichlet được gọi là liên hợp trước , ở đây.)X p = ( p 1 , p 2 , p 3 ) α = ( x 1 + 1 , x 2 + 1 , x 3 + 1 )X=(X1,X2,X3)Xp=(p1,p2,p3)α=(x1+1,x2+1,x3+1)
Chúng tôi quan sát dữ liệu, tìm ra hậu thế với quy tắc của Bayes, sau đó TẤT CẢ suy luận dựa trên hậu thế. Bạn muốn một ước tính cho ? Tìm giá trị trung bình của hậu thế. Muốn khoảng tin cậy (không, khoảng đáng tin cậy )? Tính toán một số khu vực dưới sau. Đối với các vấn đề phức tạp trong thế giới thực, chúng ta thường mô phỏng từ phía sau và lấy các ước tính mô phỏng cho tất cả các điều trên.p
Dù sao, đây là cách (với R):
Đầu tiên, lấy một số dữ liệu. Chúng tôi lăn chết 500 lần.
set.seed(1)
y <- rmultinom(1, size = 500, prob = c(1,1,1))
(chúng ta đang bắt đầu với một cái chết công bằng; trong thực tế, những dữ liệu này sẽ được quan sát.)
Tiếp theo, chúng tôi mô phỏng 5000 quan sát từ phía sau và xem kết quả.p
library(MCMCpack)
A <- MCmultinomdirichlet(y, alpha0 = c(1,1,1), mc = 5000)
plot(A)
summary(A)
Cuối cùng, hãy ước tính xác suất sau của chúng tôi (sau khi quan sát dữ liệu) rằng súc sắc nằm trong 0,05 công bằng trong mỗi tọa độ.
B <- as.matrix(A)
f <- function(x) all((x > 0.28)*(x < 0.38))
mean(apply(B, MARGIN = 1, FUN = f))
Kết quả là khoảng 0,9486 trên máy của tôi. (Không có gì đáng ngạc nhiên, thực sự. Chúng tôi đã bắt đầu với một cái chết công bằng sau tất cả.)
Nhận xét nhanh: có lẽ không hợp lý khi chúng tôi đã sử dụng một thông tin không có thông tin trước trong ví dụ này. Vì thậm chí có một câu hỏi có lẽ là cái chết có vẻ gần như cân bằng ở vị trí đầu tiên, vì vậy có thể tốt hơn để chọn một ưu tiên tập trung gần hơn 1/3 trong tất cả các tọa độ. Ở trên điều này chỉ đơn giản là sẽ làm cho xác suất sau ước tính của chúng tôi là "gần với công bằng" thậm chí cao hơn.