Ví dụ thế giới thực đơn giản để dạy thống kê Bayes?


10

Tôi muốn tìm một số "ví dụ thực tế" để dạy số liệu thống kê Bayes. Thống kê Bayes cho phép một người chính thức kết hợp kiến ​​thức trước vào phân tích. Tôi muốn cung cấp cho sinh viên một số ví dụ thực tế đơn giản về các nhà nghiên cứu kết hợp kiến ​​thức trước vào phân tích của họ để sinh viên có thể hiểu rõ hơn động lực tại sao người ta có thể muốn sử dụng số liệu thống kê Bayes ngay từ đầu.

Bạn có biết về bất kỳ ví dụ thực tế đơn giản nào như ước tính trung bình dân số, tỷ lệ, hồi quy, vv khi các nhà nghiên cứu chính thức kết hợp thông tin trước đó không? Tôi nhận ra người Bayes cũng có thể sử dụng các linh mục "không thông tin", nhưng tôi đặc biệt quan tâm đến các ví dụ thực tế nơi các linh mục thông tin (tức là thông tin thực sự trước đó) được sử dụng.


Tôi nghĩ IQ là một ví dụ khá hay.
hejseb

Không hoàn toàn là một câu trả lời nhưng khi bạn lật một đồng xu ba lần và ngẩng đầu lên hai lần thì không học sinh nào tin, cái đầu đó có khả năng gấp đôi đuôi. Điều đó khá thuyết phục mặc dù chắc chắn không phải là nghiên cứu thực sự.
Bernhard

1
Bạn có thể kiểm tra câu trả lời này, được viết bởi bạn thật sự: stats.stackexchange.com/a/134385/61496
Yair Daon

Có lẽ bạn có thể quy tắc Bayes, có thể được áp dụng trong xác suất / ước lượng thường xuyên và thống kê Bayes trong đó "xác suất" là một bản tóm tắt về niềm tin?
AdamO

Câu trả lời:


6

Lý thuyết tìm kiếm Bayes là một ứng dụng thú vị trong thống kê Bayesian đã được áp dụng nhiều lần để tìm kiếm các tàu bị mất trên biển. Để bắt đầu, một bản đồ được chia thành các ô vuông. Mỗi ô vuông được gán một xác suất trước đó chứa tàu bị mất, dựa trên vị trí đã biết cuối cùng, tiêu đề, thời gian bị mất, dòng điện, v.v. những thứ như độ sâu của nước. Những phân phối này được kết hợp để ưu tiên các ô vuông bản đồ có khả năng tạo ra kết quả tích cực cao nhất - đó không nhất thiết là nơi có khả năng nhất cho tàu, nhưng là nơi có khả năng thực sự tìm thấy tàu nhất.


1
Thật tuyệt, đây là những ứng dụng được mô tả trong cuốn sách giải trí Lý thuyết sẽ không chết: Quy tắc của Bayes đã phá vỡ Bộ luật bí ẩn, săn lùng tàu ngầm Nga và Chiến thắng mới nổi sau hai thế kỷ tranh cãi . Ngoài ra, Turing đã sử dụng loại lý luận này để phá vỡ sự đố kị.
jpmuc

Xác suất nhưng nó là Bayes?
Andrew

5

Tôi nghĩ rằng ước tính quy mô sản xuất hoặc dân số từ số sê-ri là thú vị nếu ví dụ giải thích truyền thống. Ở đây bạn đang cố gắng tối đa của một phân phối thống nhất rời rạc. Tùy thuộc vào sự lựa chọn của bạn trước đó, khả năng tối đa và ước tính Bayes sẽ khác nhau một cách khá minh bạch.

Có lẽ ví dụ nổi tiếng nhất là ước tính tốc độ sản xuất xe tăng của Đức trong Thế chiến thứ hai từ các dải số sê-ri xe tăng và mã nhà sản xuất được thực hiện trong bối cảnh thường xuyên của (Ruggles và Brodie, 1947). Một phân tích thay thế theo quan điểm Bayes với các linh mục thông tin đã được thực hiện bởi (Downey, 2013), và với một linh mục không thông tin không chính xác của (Höhle và Held, 2004). Tác phẩm của (Höhle và Held, 2004) cũng chứa nhiều tài liệu tham khảo hơn về điều trị trước đây trong tài liệu và cũng có nhiều thảo luận về vấn đề này trên trang web này.

Nguồn:

Chương 3, Downey, Allen. Hãy suy nghĩ Bayes: Thống kê Bayes trong Python. "O'Reilly Media, Inc.", 2013.

Wikipedia

Ruggles, R.; Brodie, H. (1947). "Cách tiếp cận theo kinh nghiệm đối với tình báo kinh tế trong Thế chiến II". Tạp chí của Hiệp hội Thống kê Hoa Kỳ. 42 (237): 72.

Höhle, Michael và Leonhard Held. Bayesian ước tính kích thước của một dân số. Số 499. Tài liệu thảo luận // Sonderforschungsbereich 386 der Ludwig-Maximilians-Đại học München, 2006.


3

Có một câu chuyện hay trong Cressie & Wickle Statistics cho Spatio-Temporal Data , Wiley, về cuộc tìm kiếm (bayesian) của USS Scorpion, một chiếc tàu ngầm đã bị mất vào năm 1968. Chúng tôi kể câu chuyện này cho các sinh viên của chúng tôi và họ thực hiện ( đơn giản hóa) tìm kiếm bằng cách sử dụng một trình giả lập .

Những ví dụ tương tự có thể được xây dựng xung quanh câu chuyện về chuyến bay mất tích MH370; bạn có thể muốn xem Davey và cộng sự, Phương pháp Bayes trong Tìm kiếm MH370 , Springer-Verlag.


1

θ

y1,...,yny=(y1,...,yn)T

y1,...,yn|θN(θ,σ2)

Hoặc như thường được viết bởi Bayesian,

y1,...,yn|θN(θ,τ)

τ=1/σ2τ

yi

f(yi|θ,τ)=(τ2π)×exp(τ(yiθ)2/2)

θ^=y¯

θ

θN(a,1/b)

Phân phối sau mà chúng ta thu được từ mô hình dữ liệu Bình thường-Bình thường (sau rất nhiều đại số) này là một phân phối Bình thường khác.

θ|yN(bb+nτa+nτb+nτy¯,1b+nτ)

b+nτay¯bb+nτa+nτb+nτy¯

θ|yθθ

Điều đó nói rằng, bây giờ bạn có thể sử dụng bất kỳ ví dụ sách giáo khoa dữ liệu thông thường để minh họa điều này. Tôi sẽ sử dụng tập dữ liệu airqualitytrong R. Xem xét vấn đề ước tính tốc độ gió trung bình (MPH).

> ## New York Air Quality Measurements
> 
> help("airquality")
> 
> ## Estimating average wind speeds
> 
> wind = airquality$Wind
> hist(wind, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
>

nhập mô tả hình ảnh ở đây

> n = length(wind)
> ybar = mean(wind)
> ybar
[1] 9.957516 ## "frequentist" estimate
> tau = 1/sd(wind)
> 
> 
> ## but based on some research, you felt avgerage wind speeds were closer to 12 mph
> ## but probably no greater than 15,
> ## then a potential prior would be N(12, 2)
> 
> a = 12
> b = 2
> 
> ## Your posterior would be N((1/))
> 
> postmean = 1/(1 + n*tau) * a + n*tau/(1 + n*tau) * ybar
> postsd = 1/(1 + n*tau)
> 
> set.seed(123)
> posterior_sample = rnorm(n = 10000, mean = postmean, sd = postsd)
> hist(posterior_sample, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
> abline(v = median(posterior_sample))
> abline(v = ybar, lty = 3)
> 

nhập mô tả hình ảnh ở đây

> median(posterior_sample)
[1] 10.00324
> quantile(x = posterior_sample, probs = c(0.025, 0.975)) ## confidence intervals
2.5%     97.5% 
9.958984 10.047404 

Trong phân tích này, nhà nghiên cứu (bạn) có thể nói rằng dữ liệu đã cung cấp + thông tin trước đó, ước tính gió trung bình của bạn, sử dụng phân vị thứ 50, tốc độ phải là 10,00324, lớn hơn đơn giản là sử dụng trung bình từ dữ liệu. Bạn cũng có được một bản phân phối đầy đủ, từ đó bạn có thể trích xuất khoảng tin cậy 95% bằng cách sử dụng các lượng tử 2,5 và 97,5.

Dưới đây tôi bao gồm hai tài liệu tham khảo, tôi khuyên bạn nên đọc bài viết ngắn của Casella. Nó đặc biệt nhắm vào các phương pháp Bayes theo kinh nghiệm, nhưng giải thích phương pháp chung Bayes cho các mô hình Bình thường.

Người giới thiệu:

  1. Casella, G. (1985). Giới thiệu về phân tích dữ liệu theo kinh nghiệm Bayes. Nhà thống kê người Mỹ, 39 (2), 83-87.

  2. Gelman, A. (2004). Phân tích dữ liệu Bayes (tái bản lần 2, văn bản trong khoa học thống kê). Boca Raton, Fla.: Chapman & Hội trường / CRC.


1

Một lĩnh vực nghiên cứu mà tôi tin rằng các phương pháp Bayes là hoàn toàn cần thiết là thiết kế tối ưu.

xβx

xβββx

  • n=0β^

  • β^

  • β=1β^=5xβ=5x

  • β

xx

xβ

βx

x


1

Gần đây tôi đã nghĩ đến câu hỏi này và tôi nghĩ rằng tôi có một ví dụ về việc Bayes có ý nghĩa, với việc sử dụng một xác suất trước: tỷ lệ có khả năng của một thử nghiệm lâm sàng.

Ví dụ có thể là ví dụ này: tính hợp lệ của dipslide trong nước tiểu trong điều kiện thực hành hàng ngày (Family Practice 2003; 20: 410-2). Ý tưởng là để xem những gì một kết quả tích cực của dipslide nước tiểu ngụ ý trong chẩn đoán nhiễm trùng nước tiểu. Tỷ lệ có khả năng của kết quả dương tính là:

LR(+)=test+|H+test+|H=Sensibility1specificity
H+H

OR(+|test+)=LR(+)×OR(+)
OROR(+|test+)OR(+)

LR(+)=12.2LR()=0.29

p+=2/3p+|test+=0.96p+|test=0.37

Ở đây xét nghiệm là tốt để phát hiện nhiễm trùng, nhưng không tốt để loại bỏ nhiễm trùng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.