Là phân tích sức mạnh cần thiết trong Thống kê Bayes?


19

Gần đây tôi đã nghiên cứu Bayes về các số liệu thống kê cổ điển. Sau khi đọc về yếu tố Bayes, tôi đã tự hỏi liệu phân tích sức mạnh có cần thiết trong quan điểm thống kê này hay không. Lý do chính của tôi để tự hỏi điều này là yếu tố Bayes thực sự chỉ xuất hiện là một tỷ lệ khả năng. Khi nó giống như 25: 1, dường như tôi có thể gọi nó là một đêm.

Tôi có xa không? Bất kỳ cách đọc nào khác tôi có thể làm để tìm hiểu thêm? Hiện đang đọc cuốn sách này: Giới thiệu về Bayesian Statistics , của WM Bolstad (Wiley-Interscience; 2nd ed., 2007).



Câu trả lời:


10

Sức mạnh là về xác suất dài hạn của p <0,05 (alpha) trong các nghiên cứu trong tương lai. Ở Bayes, bằng chứng từ nghiên cứu A đưa vào các linh mục để nghiên cứu B, v.v. Do đó, sức mạnh như được định nghĩa trong thống kê thường xuyên không thực sự tồn tại.


12
Một cái nhìn ít hạn chế hơn về sức mạnh coi nó như một biểu hiện của đường cong rủi ro cho hàm mất 0-1. Một phân tích Bayes tích hợp rủi ro đó so với xác suất trước đó. Tuy nhiên, các phân tích Bayes tốt xem xét độ nhạy của kết quả của họ đối với lựa chọn phân phối trước. Điều đó dường như sẽ đặt chúng ta trở lại vào lĩnh vực phân tích quyền lực. Mặc dù nó có thể không đi theo tên đó và sẽ được tính toán khác nhau, mục đích sẽ giống nhau: cụ thể là xác định một mẫu lớn để có được để đảm bảo hợp lý các mục tiêu nghiên cứu.
whuber

2
Đó là một điểm rất tốt Whuber. Tuy nhiên, đó không phải là lý do duy nhất để tính toán sức mạnh và nhiều người Bayes cho rằng điều đó là không cần thiết bởi vì bạn không cần phải xác định N trước (một sai lầm).
Giăng

5
N

2
Tôi đã không đưa ra ý tưởng, có một số bài báo mà Bayes cho rằng bạn có thể thêm đối tượng cho đến khi bạn có đủ bằng chứng để đưa ra quyết định thay vì kiểm tra thường xuyên trong đó việc kiểm tra và thêm thủ tục không hiệu quả. Tôi có thể tra cứu một tài liệu tham khảo mà tôi cho là. Đáng chú ý nhất là điều này xuất hiện trong việc đề xuất cách phân tích dữ liệu trong các thử nghiệm lâm sàng.
Giăng

8
N

14

Bạn có thể thực hiện các bài kiểm tra giả thuyết với số liệu thống kê Bayes. Ví dụ: bạn có thể kết luận hiệu ứng lớn hơn 0 nếu hơn 95% mật độ sau lớn hơn 0. Hoặc thay thế, bạn có thể sử dụng một số hình thức quyết định nhị phân dựa trên các yếu tố Bayes.

Khi bạn thiết lập một hệ thống ra quyết định như vậy, có thể đánh giá sức mạnh thống kê giả định một quy trình tạo dữ liệu nhất định và kích thước mẫu. Bạn có thể dễ dàng đánh giá điều này trong một bối cảnh nhất định bằng cách sử dụng mô phỏng.

Điều đó nói rằng, một cách tiếp cận Bayes thường tập trung nhiều hơn vào khoảng tin cậy hơn là ước tính điểm và mức độ tin tưởng hơn là quyết định nhị phân. Sử dụng phương pháp tiếp cận liên tục hơn này để suy luận, thay vào đó bạn có thể đánh giá các hiệu ứng khác đối với suy luận về thiết kế của bạn. Cụ thể, bạn có thể muốn đánh giá kích thước dự kiến ​​của khoảng tin cậy của mình cho một quy trình tạo dữ liệu và kích thước mẫu nhất định.


3

Vấn đề này dẫn đến rất nhiều hiểu lầm bởi vì mọi người sử dụng số liệu thống kê Bayes để đặt câu hỏi thường xuyên. Ví dụ, mọi người muốn xác định xem biến thể B tốt hơn biến thể A. Họ có thể trả lời câu hỏi này bằng các số liệu thống kê Bayes bằng cách xác định xem khoảng mật độ cao nhất 95% của chênh lệch giữa hai phân phối sau (BA) lớn hơn 0 hay a Tuy nhiên, khu vực có ý nghĩa thực tế khoảng 0. Nếu bạn sử dụng số liệu thống kê bayes để trả lời các câu hỏi thường gặp, tuy nhiên, bạn vẫn có thể mắc lỗi thường xuyên: loại I (dương tính giả; opps - B không thực sự tốt hơn) và loại II (bỏ lỡ; không nhận ra rằng B thực sự tốt hơn).

Điểm của phân tích công suất là giảm các lỗi loại II (ví dụ: có ít nhất 80% cơ hội tìm thấy hiệu ứng nếu nó tồn tại). Một phân tích sức mạnh cũng nên được sử dụng khi sử dụng số liệu thống kê Bayes để đặt câu hỏi thường gặp như câu hỏi trên.

Nếu bạn không sử dụng phân tích công suất, và sau đó bạn liên tục nhìn trộm dữ liệu của mình trong khi thu thập dữ liệu và sau đó chỉ dừng lại khi bạn tìm thấy một sự khác biệt đáng kể, thì bạn sẽ tạo ra nhiều lỗi loại I (báo động sai) hơn bạn mong đợi - giống như khi bạn đã sử dụng số liệu thống kê thường xuyên.

kiểm tra:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

Lưu ý - Một số cách tiếp cận Bayes có thể giảm, nhưng không loại trừ, xác suất xảy ra lỗi loại I (ví dụ: một thông tin thích hợp trước).


0

Ví dụ, nhu cầu phân tích sức mạnh trong một thử nghiệm lâm sàng là có thể tính toán / ước tính có bao nhiêu người tham gia tuyển dụng để có cơ hội tìm thấy hiệu quả điều trị (với kích thước tối thiểu nhất định) nếu nó tồn tại. Việc tuyển dụng vô số bệnh nhân là không khả thi, trước tiên là do hạn chế về thời gian và thứ hai là do hạn chế về chi phí.

Vì vậy, hãy tưởng tượng chúng ta đang thực hiện một cách tiếp cận Bayes để thử nghiệm lâm sàng. Mặc dù về lý thuyết căn hộ là có thể, nhưng dù sao thì cũng có thể có sự nhạy cảm với ưu tiên, vì thật không may, có nhiều hơn một căn hộ có sẵn (điều kỳ lạ hiện tại tôi đang nghĩ, vì thực sự chỉ nên có một cách để thể hiện sự không chắc chắn hoàn toàn).

Vì vậy, hãy tưởng tượng rằng, hơn nữa, chúng tôi thực hiện một phân tích độ nhạy (mô hình và không chỉ trước đó cũng sẽ được xem xét kỹ lưỡng ở đây). Điều này liên quan đến việc mô phỏng từ một mô hình hợp lý cho "sự thật". Trong thống kê cổ điển / Thường xuyên, có bốn ứng cử viên cho 'sự thật' ở đây: H0, mu = 0; H1, mu! = 0 trong đó hoặc được quan sát có lỗi (như trong thế giới thực của chúng ta) hoặc không có lỗi (như trong thế giới thực không quan sát được). Trong thống kê của Bayes, có hai ứng cử viên cho 'sự thật' ở đây: mu là một biến ngẫu nhiên (như trong thế giới thực không thể quan sát được); mu là một biến ngẫu nhiên (như trong thế giới thực có thể quan sát được của chúng ta, từ quan điểm của một cá nhân không chắc chắn).

Vì vậy, thực sự nó phụ thuộc vào việc bạn đang cố gắng thuyết phục A) bằng thử nghiệm và B) bằng phân tích độ nhạy. Nếu đó không phải là cùng một người, điều đó sẽ khá lạ.

Điều thực sự trong câu hỏi là một sự đồng thuận về sự thật là gì và về những gì chứng minh bằng chứng hữu hình. Mặt bằng chung là các phân phối xác suất chữ ký có thể quan sát được trong thế giới thực có thể quan sát được của chúng ta, theo một cách nào đó rõ ràng có một số sự thật toán học tiềm ẩn chỉ là tình cờ, hoặc là do thiết kế. Tôi sẽ dừng ở đó vì đây không phải là trang Nghệ thuật, mà là trang Khoa học, hoặc đó là sự hiểu biết của tôi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.