Lựa chọn giữa các linh mục beta không thông tin


16

Tôi đang tìm kiếm các linh mục không thông tin để phân phối beta để làm việc với quy trình nhị thức (Hit / Miss). Tại lần đầu tiên tôi nghĩ về việc sử dụng tạo ra một PDF thống nhất, hoặc Jeffrey trước α = 0,5 , β = 0,5 . Nhưng tôi đang thực sự tìm kiếm priors rằng có tác dụng tối thiểu về kết quả sau, và sau đó tôi nghĩ về việc sử dụng không đúng cách trước khi α = 0 , β = 0 . Vấn đề ở đây là phân phối sau của tôi chỉ hoạt động nếu tôi có ít nhất một lần nhấn và một lần bỏ lỡ. Để khắc phục điều này thì tôi nghĩ về việc sử dụng một hằng số rất nhỏ, như α = 0,0001 , βα=1,β=1α=0.5,β=0.5α=0,β=0 , chỉ để đảm bảo rằng sau α β sẽ > 0 .α=0.0001,β=0.0001αβ>0

Có ai biết cách tiếp cận này được chấp nhận? Tôi thấy những tác động số của việc thay đổi những điều này trước đây, nhưng ai đó có thể cho tôi một cách giải thích về việc đặt các hằng số nhỏ như thế này làm linh mục?


1
Đối với các mẫu lớn có nhiều lượt truy cập và bỏ lỡ, nó tạo ra sự khác biệt nhỏ. Đối với các mẫu nhỏ, đặc biệt là nếu không có ít nhất một lần nhấn và một lần bỏ lỡ, điều đó tạo ra sự khác biệt lớn; thậm chí kích thước của "hằng số rất nhỏ" của bạn có thể có tác động đáng kể. Tôi xin đề nghị các thí nghiệm tưởng tượng quan trọng đối với bạn có thể là những loại sau có ý nghĩa sau một kích thước mẫu : điều này có thể thuyết phục bạn rằng một cái gì đó giống như Jeffrey s trước là hợp lý1
Henry

Và có một bài báo Kerman gợi ý 1/3 & 1/3, b
Bjorn

Bạn có ý nghĩa gì bởi 'hiệu ứng tối thiểu đối với kết quả sau'? So với cái gì?
Sẽ

Tôi đã cải thiện định dạng và tiêu đề cho câu hỏi của bạn, vui lòng hoàn nguyên hoặc thay đổi các chỉnh sửa.
Tim

Câu trả lời:


32

Trước hết, không có thứ gọi là không thông tin trước . Dưới đây bạn có thể thấy các bản phân phối sau kết quả từ năm linh mục "không thông tin" khác nhau (được mô tả bên dưới cốt truyện) được cung cấp dữ liệu khác nhau. Như bạn có thể thấy rõ, việc lựa chọn các linh mục "không thông tin" đã ảnh hưởng đến phân phối sau, đặc biệt là trong trường hợp dữ liệu không cung cấp nhiều thông tin .

Posteriors from uninformative priors

"Không đủ thông tin" priors cho phân phối phiên bản beta phần tài sản mà , những gì dẫn đến phân phối đối xứng, và α 1 , β 1 , các lựa chọn thông thường: là thống nhất (Bayes-Laplace) trước đó ( α = β = 1 ), Jeffreys trước ( α = β = 1 / 2 ), "Neutral" trước đó ( α = β = 1 / 3 ) bởi Kerman (2011) đề xuất, Haldane trước ( α = β = 0α=βα1,β1α=β=1α=β=1/2α=β=1/3α=β=0), Hoặc nó xấp xỉ ( với ε > 0 ) (xem thêm các bài viết Wikipedia lớn ).α=β=εε>0

Thông số của phân phối trước khi phiên bản beta thường được coi là "pseudocounts" thành công ( ) và thất bại ( β ) kể từ khi phân bố sau của mô hình beta-nhị thức sau khi quan sát y thành công trong n thử nghiệm làαβyn

θyB(α+y,β+ny)

α,βα=β=1n

Ngay từ cái nhìn đầu tiên, Haldane trước đây, dường như là "không chính xác" nhất, vì nó dẫn đến trung bình sau, điều đó chính xác bằng với ước tính khả năng tối đa

α+yα+y+β+ny=y/n

y=0y=n

Có một số lý lẽ cho và chống lại từng linh mục "không thông tin" (xem Kerman, 2011; Tuyl et al, 2008). Ví dụ, như thảo luận của Tuyl et al,

101

Mặt khác, sử dụng các linh mục thống nhất cho các bộ dữ liệu nhỏ có thể rất có ảnh hưởng (hãy nghĩ về điều đó theo giả danh). Bạn có thể tìm thấy nhiều thông tin và thảo luận về chủ đề này trong nhiều bài báo và cẩm nang.

Rất xin lỗi, nhưng không có các linh mục "tốt nhất", "không thông tin nhất" hay "phù hợp với một kích cỡ tất cả". Mỗi người trong số họ mang một số thông tin vào mô hình.

Kerman, J. (2011). Trung tính phân phối beta và gamma không liên quan đến thông tin và trung tính. Tạp chí điện tử thống kê, 5, 1450-1470.

Tuyl, F., Gerlach, R. và Mengersen, K. (2008). Một so sánh về Bayes-Laplace, Jeffreys và các nhà tiên tri khác. Nhà thống kê người Mỹ, 62 (1): 40-44.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.