Bayesian trung bình b gậy trước


23

Tôi muốn hỏi một câu hỏi lấy cảm hứng từ một câu trả lời xuất sắc cho truy vấn về trực giác cho bản phân phối beta. Tôi muốn có được một sự hiểu biết tốt hơn về sự phát sinh cho phân phối trước cho mức trung bình. Có vẻ như David đang sao lưu các tham số từ giá trị trung bình và phạm vi.

Theo giả định rằng giá trị trung bình là 0.27 và độ lệch chuẩn là , bạn có thể sao lưu và bằng cách giải hai phương trình này: alpha beta alpha0.18αβ

αα+β=0.27αβ(α+β)2(α+β+1)=0.182

3
Thành thật mà nói, tôi chỉ giữ các giá trị đồ thị trong R cho đến khi nó nhìn đúng.
David Robinson

1
nơi nào bạn có được độ lệch chuẩn là 0,18?
appleLover

Làm thế nào bạn đưa ra độ lệch chuẩn này? Bạn có biết nó trước?
Maria Lavrovskaya

Câu trả lời:


21

Thông báo rằng:

αβ(α+β)2=(αα+β)(1αα+β)

Điều này có nghĩa là phương sai có thể được biểu thị dưới dạng trung bình như

σ2=μ(1μ)α+β+1

Nếu bạn muốn giá trị trung bình là .27 và độ lệch chuẩn là .18 (phương sai .0324 ), chỉ cần tính toán:

α+β=μ(1μ)σ21=.27(1.27).03241=5.083333

Bây giờ bạn biết tổng, αβ là dễ dàng:

α=μ(α+β)=.275.083333=1.372499β=(1μ)(α+β)=(1.27)5.083333=3.710831

Bạn có thể kiểm tra câu trả lời này trong R:

> mean(rbeta(10000000, 1.372499, 3.710831))
[1] 0.2700334
> var(rbeta(10000000, 1.372499, 3.710831))
[1] 0.03241907

David, bạn có theo dõi nghiên cứu bóng chày nào không? Có một số kỹ thuật cạnh tranh trên mạng cho việc tìm kiếm các hợp β , vì vậy tôi đã tự hỏi nếu bạn có bất kỳ ý kiến về vấn đề này nếu bạn đang làm một cái gì đó bên cạnh việc chỉ cố gắng tìm một biểu đồ trông hợp lý. αβ
Michael McGowan

Tôi không đặc biệt theo dõi sabermetrics - trong câu trả lời khác, nó chỉ tình cờ cung cấp một ví dụ rất thuận tiện về việc ước tính p từ một nhị thức với trước. Tôi thậm chí không biết liệu đây có phải là cách nó được thực hiện trong sabermetrics hay không, và nếu có, tôi biết có nhiều thành phần tôi đã bỏ đi (người chơi có các linh mục khác nhau, điều chỉnh sân vận động, đánh trọng số gần đây so với những cái cũ ...)
David Robinson

3
Tôi ấn tượng rằng nhãn cầu của bạn là chính xác này.
Dimitriy V. Masterov

α=1.37β=3.71 đến các giá trị nhãn cầu của bạn trong bài được liên kết lần lượt là 81 và 219?
Alex

1
@Alex Phương sai được yêu cầu và độ lệch chuẩn xuất phát từ câu hỏi trên, yêu cầu SD là 0,18, không phải bài đăng phân phối beta. Nếu tôi đang tính toán thay vì nhãn cầu, tôi có thể đoán được SD có dạng như 0,03, sẽ có giá trị 59 và 160.
David Robinson

3

I wanted to add this as a comment on the excellent answer but it ran long and will look better with answer formatting.

Something to keep in mind is that not all (μ,σ2) are possible. It's clear μ[0,1], but not as clear are the limitations for σ2.

Using the same reasoning as David, we can express

σ2(α,μ)=μ2(1μ)α+μ

This is decreasing with respect to α, so the largest σ2 can be for a given μ is:

limα0σ2(α,μ)=μ(1μ)

This is only a supremum since the set of valid α is open (i.e., for Beta, we must have α>0); this limit is itself maximized at μ=12.

Notice the relationship to a corresponding Bernoulli RV. The Beta distribution with mean μ, since it is forced to take all values between 0 and 1, must be less dispersed (i.e., have lower variance) than the Bernoulli RV with the same mean (which has all of its mass at the ends of the interval). In fact, sending α to 0 and fixing β=1μμα amounts to putting more and more of the mass of the PDF close to 0 and 1, i.e., getting closer to a Bernoulli distribution, which is why the supremum of the variance is exactly the corresponding Bernoulli variance.

Taken together, here is the set of valid means and variances for Beta:

enter image description here

(Indeed this is noted on the Wikipedia page for Beta)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.