θ
y1,...,yny=(y1,...,yn)T
y1,...,yn|θ∼N(θ,σ2)
Hoặc như thường được viết bởi Bayesian,
y1,...,yn|θ∼N(θ,τ)
τ=1/σ2τ
yi
f(yi|θ,τ)=(√τ2π)×exp(−τ(yi−θ)2/2)
θ^=y¯
θ
θ∼N(a,1/b)
Phân phối sau mà chúng ta thu được từ mô hình dữ liệu Bình thường-Bình thường (sau rất nhiều đại số) này là một phân phối Bình thường khác.
θ|y∼N(bb+nτa+nτb+nτy¯,1b+nτ)
b+nτay¯bb+nτa+nτb+nτy¯
θ|yθθ
Điều đó nói rằng, bây giờ bạn có thể sử dụng bất kỳ ví dụ sách giáo khoa dữ liệu thông thường để minh họa điều này. Tôi sẽ sử dụng tập dữ liệu airquality
trong R. Xem xét vấn đề ước tính tốc độ gió trung bình (MPH).
> ## New York Air Quality Measurements
>
> help("airquality")
>
> ## Estimating average wind speeds
>
> wind = airquality$Wind
> hist(wind, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
>
> n = length(wind)
> ybar = mean(wind)
> ybar
[1] 9.957516 ## "frequentist" estimate
> tau = 1/sd(wind)
>
>
> ## but based on some research, you felt avgerage wind speeds were closer to 12 mph
> ## but probably no greater than 15,
> ## then a potential prior would be N(12, 2)
>
> a = 12
> b = 2
>
> ## Your posterior would be N((1/))
>
> postmean = 1/(1 + n*tau) * a + n*tau/(1 + n*tau) * ybar
> postsd = 1/(1 + n*tau)
>
> set.seed(123)
> posterior_sample = rnorm(n = 10000, mean = postmean, sd = postsd)
> hist(posterior_sample, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
> abline(v = median(posterior_sample))
> abline(v = ybar, lty = 3)
>
> median(posterior_sample)
[1] 10.00324
> quantile(x = posterior_sample, probs = c(0.025, 0.975)) ## confidence intervals
2.5% 97.5%
9.958984 10.047404
Trong phân tích này, nhà nghiên cứu (bạn) có thể nói rằng dữ liệu đã cung cấp + thông tin trước đó, ước tính gió trung bình của bạn, sử dụng phân vị thứ 50, tốc độ phải là 10,00324, lớn hơn đơn giản là sử dụng trung bình từ dữ liệu. Bạn cũng có được một bản phân phối đầy đủ, từ đó bạn có thể trích xuất khoảng tin cậy 95% bằng cách sử dụng các lượng tử 2,5 và 97,5.
Dưới đây tôi bao gồm hai tài liệu tham khảo, tôi khuyên bạn nên đọc bài viết ngắn của Casella. Nó đặc biệt nhắm vào các phương pháp Bayes theo kinh nghiệm, nhưng giải thích phương pháp chung Bayes cho các mô hình Bình thường.
Người giới thiệu:
Casella, G. (1985). Giới thiệu về phân tích dữ liệu theo kinh nghiệm Bayes. Nhà thống kê người Mỹ, 39 (2), 83-87.
Gelman, A. (2004). Phân tích dữ liệu Bayes (tái bản lần 2, văn bản trong khoa học thống kê). Boca Raton, Fla.: Chapman & Hội trường / CRC.