Phân phối Beta khi lật một đồng xu


11

Cuốn sách Bayesian của Kruschke nói, liên quan đến việc sử dụng bản phân phối beta để lật một đồng xu,

Ví dụ: nếu chúng ta không có kiến ​​thức trước ngoài kiến ​​thức rằng đồng xu có mặt đầu và mặt đuôi, thì đó là tương đương với việc trước đó đã quan sát một đầu và một đuôi, tương ứng với a = 1 và b = 1.

Tại sao không có thông tin nào tương đương với việc nhìn thấy một đầu và một đuôi - 0 đầu và 0 đuôi có vẻ tự nhiên hơn đối với tôi.


8
(+1) Đoạn trích dẫn gây hiểu lầm vì nó mời người đọc đánh đồng hai ý nghĩa rất khác nhau của "quan sát". Ý nghĩa được sử dụng ở đây là việc đã tự kiểm tra đồng tiền - thực tế, điều đó có nghĩa là bạn hiểu thiết lập thử nghiệm. Nhưng kết luận rằng điều này hàm ý phụ thuộc vào việc diễn giải lại "quan sát" theo nghĩa khác nhau là đã chạy thử nghiệm hai lần trong đó một kết quả là đầu và các đuôi khác. Kiểu bóng bẩy logic này là một cảnh sát trí tuệ; nó chỉ làm cho các phương thức Bayes xuất hiện tùy ý và trơn trượt một cách logic, đó là một điều đáng tiếc. a=b=1
whuber

Báo giá là sai: không có lời biện minh nào cho bản Beta trước (1, 1).
Neil G

Người ta có thể dễ dàng lập luận rằng đó là giá trị thông tin của một quan sát duy nhất - nửa đầu / nửa đuôi.
Glen_b -Reinstate Monica

4
Hãy ghi nhớ mục đích dự định của đoạn văn đó trong cuốn sách. Đây được coi là một biện minh trực quan đơn giản cho người dùng mới bắt đầu , rõ ràng không phải là một đối số toán học và chắc chắn không phải là một tuyên bố rằng beta (1,1) là tốt nhất hoặc chỉ mơ hồ trước đó. Ở những nơi khác trong cuốn sách tôi đau đớn chỉ ra rằng những biến thể khiêm tốn của các linh mục mơ hồ không tạo ra sự khác biệt đáng kể nào ở phía sau khi có một lượng dữ liệu vừa phải. (Tất nhiên, ngoại trừ các yếu tố Bayes, rất nhạy cảm với phần trước!) Trong các bài viết khác tôi đã thảo luận về Haldane trước đó.
John K. Kruschke

Câu trả lời:


17

Báo giá là một "bàn tay hợp lý" (biểu hiện tuyệt vời!), Như @whuber đã lưu ý trong các nhận xét cho OP. Điều duy nhất chúng ta thực sự có thể nói sau khi thấy rằng đồng xu có đầu và đuôi, là cả hai sự kiện "đầu" và "đuôi" đều không thể xảy ra. Do đó, chúng ta có thể loại bỏ một phần rời rạc trước đó đặt toàn bộ khối xác suất lên "đầu" hoặc "đuôi". Nhưng điều này không tự nó dẫn đến đồng phục trước: câu hỏi tinh tế hơn nhiều. Trước hết chúng ta hãy tóm tắt một chút về nền tảng. Chúng tôi đang xem xét các mô hình liên hợp Beta-Binominal cho Bayesian suy luận của xác suất của người đứng đầu của một đồng xu, được đưa ra n độc lập và hệt phân phối (có điều kiện trên θ ) tung đồng xu.θnθ khi chúng ta quan sát x đầu trong n quăng:p(θ|x)xn

p(θ|x)=Beta(x+α,nx+β)

chúng ta có thể nói rằng beta đóng vai trò của một "số trước của người đứng đầu" và "số trước của đuôi" (pseudotrials), và α + β có thể được hiểu như là một kích thước mẫu có hiệu quả. Chúng tôi cũng có thể đi đến việc giải thích này bằng cách sử dụng biểu nổi tiếng với giá trị trung bình sau như một bình quân gia quyền của giá trị trung bình trước khi ααβα+β và giá trị trung bình mẫuxαα+β .xn

Nhìn vào , chúng ta có thể làm cho hai cân nhắc:p(θ|x)

  1. kể từ khi chúng tôi không có kiến thức trước về (tối đa sự thiếu hiểu biết), chúng tôi trực giác hy vọng quy mô mẫu có hiệu quả α + β là "nhỏ". Nếu nó lớn, thì trước đó sẽ được kết hợp khá nhiều kiến ​​thức. Một cách khác để nhìn thấy điều này được lưu ý rằng nếu αβ là "nhỏ" đối với với xn - x , xác suất hậu nghiệm sẽ không phụ thuộc rất nhiều vào trước của chúng tôi, bởi vì x + α xn - x + β n - xθα+βαβxnxx+αxnx+βnx. Chúng tôi hy vọng rằng một ưu tiên không kết hợp nhiều kiến ​​thức phải nhanh chóng trở nên không liên quan trong một số dữ liệu.
  2. Ngoài ra, vì là giá trị trung bình trước đó, và chúng tôi không có kiến thức trước về sự phân bố của θ, chúng tôi mong chờμprior=0,5. Đây là một đối số của tính đối xứng - nếu chúng ta không biết gì hơn, chúng ta sẽ không mong đợimột tiên nghiệmrằng phân phối bị lệch về 0 hoặc về 1. Phân phối Beta làμprior=αα+βθμprior=0.5

    f(θ|α,β)=Γ(α+β)Γ(α)+Γ(β)θα1(1θ)β1

    Biểu thức này chỉ đối xứng xung quanh nếu α = β .θ=0.5α=β

α=β=cc

  1. θα=β=1

    f(θ|1,1)=Γ(2)2Γ(1)θ0(1θ)0=1

    θ[0,1]α=β=1

  2. Bạn có thể chọn một quan điểm khác, quan điểm được OP sử dụng và nói rằng không có thông tin nào tương ứng với việc không nhìn thấy đầu và không có đuôi, tức là

    α=β=0π(θ)θ1(1θ)1

    θ1(1θ)1I=[0,1]θ=0θ=1θθ

    α+xα+β+n=xnθθ

  3. Cuối cùng, bạn có thể sử dụng mức ưu tiên không phụ thuộc vào tham số của vấn đề, tức là trước Jeffreys, đối với mô hình Beta-Binomial tương ứng với

    α=β=12π(θ)θ12(1θ)12

    θλ=log(θ1θ)θ

Tóm lại, không chỉ có một lựa chọn không rõ ràng cho một sự không phù hợp trước trong mô hình Beta-Binomial. Những gì bạn chọn phụ thuộc vào những gì bạn có nghĩa là không có kiến ​​thức trước và vào các mục tiêu phân tích của bạn.


0

p(θ=0)=0p(θ=1)=0θp(θ)=Beta(h+1,(Nh)+1)


Tôi có một thời gian khó hiểu câu trả lời của bạn.
Michael R. Chernick

pθ=0θ=1
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.