Tính ổn định của xác nhận chéo trong các mô hình Bayes


19

Tôi đang điều chỉnh một HLM Bayes trong JAGS bằng cách sử dụng xác thực chéo k-Fold (k = 5). Tôi muốn biết liệu các ước tính của tham số có ổn định trên tất cả các lần không. Cách tốt nhất để làm điều này là gì?β

Một ý tưởng là tìm ra sự khác biệt của các phần sau của và xem 0 có nằm trong 95% CI của sự khác biệt không. Nói cách khác, là 0 trong khoảng 95% của (và sau đó lặp lại cho tất cả các cặp nếp gấp).ββk= =1-βk= =2

Một ý tưởng khác là coi các hậu thế từ mỗi nếp gấp là các chuỗi MCMC khác nhau và tính toán (Hệ số giảm quy mô tiềm năng) của Gelman trên các chuỗi giả này.R^

Là một trong những thích hợp hơn, và có những lựa chọn thay thế?


1
Cảm thấy kỳ lạ khi thấy số 0 nằm trong số những khác biệt đáng tin cậy vì chắc chắn bạn mong đợi có một số khác biệt giữa các nếp gấp. Một đề xuất sẽ là tính toán các ước tính điểm của cho mỗi lần và xem xét mức độ lây lan của các điểm này. β
Rasmus Bååth

3
Chỉ cần một nhận xét chung về xác thực chéo và công cụ Bayes: Tại sao không chỉ tính WAIC? Nó tương đương với LOOCV và bạn vẫn có thể sử dụng tất cả dữ liệu của mình.
Cân bằng Brash

1
Làm thế nào bạn có thể tạo mô phỏng sau của ? βk= =1-βk= =2
Stéphane Laurent

Trong các thử nghiệm tại nhà máy cũ của tôi, chúng tôi đã phải chứng minh rằng tổn thất năng suất 0% là trong 95% CI. Các câu hỏi về mẫu đầy đủ, độc lập và bản chất của kiểm tra nhị thức chiếm ưu thế. Bạn có thể cho một ý tưởng về kích thước mẫu của bạn là gì?
EngrStudent - Phục hồi Monica

Câu trả lời:


2

Tôi không biết nếu điều này đủ điều kiện là một nhận xét hoặc như một câu trả lời. Tôi đang đặt ở đây vì cảm thấy như một câu trả lời.

Trong xác thực chéo k-Fold, bạn đang phân vùng dữ liệu của mình thành các nhóm k. Nếu bạn đang bao gồm cả "những điều cơ bản" thì bạn sẽ chọn ngẫu nhiên các thành viên cho mỗi thùng k.

Khi tôi nói về dữ liệu, tôi nghĩ mỗi hàng là một mẫu và mỗi cột là một thứ nguyên. Tôi đã quen với việc sử dụng các phương pháp khác nhau để xác định tầm quan trọng của biến, tầm quan trọng của cột.

Điều gì sẽ xảy ra nếu bạn, như một bài tập suy nghĩ, rời khỏi đồng phục "sách giáo khoa" một cách ngẫu nhiên, và xác định những hàng nào là quan trọng? Có thể họ thông báo cho một biến duy nhất tại một thời điểm, nhưng có thể họ thông báo thêm. Có một số hàng ít quan trọng hơn những hàng khác? Có thể nhiều điểm là thông tin, có thể ít.

Biết tầm quan trọng của biến, có lẽ bạn có thể bin chúng theo mức độ quan trọng. Có lẽ bạn có thể làm một thùng duy nhất với các mẫu quan trọng nhất. Điều này có thể xác định kích thước của "k" của bạn. Theo cách này, bạn sẽ xác định thùng thứ k "nhiều thông tin nhất" và so sánh nó với các thùng khác, và so với nhóm ít thông tin nhất.

Điều này có thể cho bạn ý tưởng về sự thay đổi tối đa của các tham số mô hình của bạn. Nó chỉ là một hình thức.

Một cách thứ hai để phân chia các thùng thứ k là độ lớn và hướng của ảnh hưởng. Vì vậy, bạn có thể đặt các mẫu lắc lư một tham số hoặc tham số theo một hướng vào một nhóm và đặt các mẫu lắc lư cùng tham số hoặc tham số theo hướng ngược lại vào một nhóm khác.

Biến thể tham số trong hình thức này có thể giúp quét rộng hơn các biến, không dựa trên mật độ thông tin, mà dựa trên giống thông tin.

May mắn nhất.


0

Nó có thể không phải là một câu trả lời hoàn chỉnh, nhưng nếu 0 KHÔNG nằm trong 95% CI cho một số khác biệt thì khá an toàn để nói rằng chúng không giống nhau ở mức 0,05.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.