Tại sao việc thêm hiệu ứng trễ làm tăng độ lệch trung bình trong mô hình phân cấp Bayes?


14

Bối cảnh: Hiện tại tôi đang thực hiện một số công việc so sánh các mô hình phân cấp khác nhau của Bayes. Dữ liệu là số đo mức độ hạnh phúc của người tham gia i và thời gian jyijij . Tôi có khoảng 1000 người tham gia và 5 đến 10 quan sát cho mỗi người tham gia.

Giống như với hầu hết các bộ dữ liệu theo chiều dọc, tôi hy vọng sẽ thấy một số dạng tương quan tự động, theo đó các quan sát gần hơn về thời gian có mối tương quan lớn hơn so với các khoảng cách xa hơn. Đơn giản hóa một vài điều, mô hình cơ bản như sau:

yijN(μij,σ2)

nơi tôi đang so sánh một mô hình không có độ trễ:

μij=β0i

với mô hình độ trễ:

μij=β0i+β1(yi(j1)β0i)

nơi là một người cấp trung bình và β 1 là tham số lag (tức là, hiệu ứng lag thêm một bội số của độ lệch của các quan sát từ điểm thời gian trước đó từ giá trị dự đoán về điều đó thời điểm). Tôi cũng đã phải làm một vài điều để ước tính y i 0 (nghĩa là quan sát trước lần quan sát đầu tiên).β0iβ1yi0

Kết quả tôi nhận được chỉ ra rằng:

  • Tham số độ trễ là khoảng 0,18, 95% CI [.14, .21]. Tức là nó khác không
  • Độ lệch trung bình và DIC đều tăng thêm vài trăm khi độ trễ được đưa vào mô hình
  • Kiểm tra dự báo sau cho thấy bằng cách bao gồm hiệu ứng trễ, mô hình có khả năng phục hồi tương quan tự động trong dữ liệu tốt hơn

Vì vậy, tóm lại, tham số độ trễ khác không và kiểm tra dự báo sau cho thấy mô hình độ trễ là tốt hơn; nhưng có nghĩa là lệch lạc và DIC cho rằng mô hình không có độ trễ là tốt hơn. Điều này đánh đố tôi.

Kinh nghiệm chung của tôi là nếu bạn thêm một tham số hữu ích thì ít nhất nó cũng sẽ làm giảm độ lệch trung bình (ngay cả khi sau một hình phạt phức tạp, DIC không được cải thiện). Hơn nữa, giá trị 0 cho tham số độ trễ sẽ đạt được độ lệch tương tự như mô hình không có độ trễ.

Câu hỏi

Tại sao việc thêm hiệu ứng trễ làm tăng độ lệch trung bình trong mô hình phân cấp Bayes ngay cả khi tham số độ trễ bằng không và nó cải thiện kiểm tra dự báo sau?

Suy nghĩ ban đầu

  • Tôi đã thực hiện rất nhiều kiểm tra hội tụ (ví dụ: nhìn vào traceplots; kiểm tra sự thay đổi kết quả sai lệch giữa các chuỗi và trên các lần chạy) và cả hai mô hình dường như đã hội tụ ở phía sau.
  • Tôi đã thực hiện kiểm tra mã trong đó tôi buộc hiệu ứng độ trễ bằng 0 và điều này đã phục hồi độ lệch mô hình không có độ trễ.
  • Tôi cũng đã xem xét độ lệch trung bình trừ đi hình phạt sẽ mang lại độ lệch ở các giá trị dự kiến ​​và những điều này cũng làm cho mô hình độ trễ xuất hiện tồi tệ hơn.
  • β0i
  • Có lẽ có một số vấn đề với cách tôi ước tính thời điểm ngụ ý trước lần quan sát đầu tiên.
  • Có lẽ hiệu ứng lag chỉ yếu trong dữ liệu này
  • Tôi đã thử ước lượng mô hình bằng cách sử dụng tối đa khả năng sử dụng lmevới correlation=corAR1(). Ước tính của tham số độ trễ là rất giống nhau. Trong trường hợp này, mô hình độ trễ có khả năng đăng nhập lớn hơn và AIC nhỏ hơn (khoảng 100) so với mô hình không có độ trễ (nghĩa là mô hình độ trễ tốt hơn). Vì vậy, điều này củng cố ý tưởng rằng việc thêm độ trễ cũng sẽ làm giảm độ lệch trong mô hình Bayes.
  • Có lẽ có một cái gì đó đặc biệt về dư lượng Bayes. Nếu mô hình độ trễ sử dụng sự khác biệt giữa dự đoán và y thực tế tại thời điểm trước đó, thì đại lượng này sẽ không chắc chắn. Do đó, hiệu ứng trễ sẽ hoạt động trong một khoảng đáng tin cậy của các giá trị còn lại như vậy.

Bạn nói rằng tham số độ trễ là khoảng 0,18. Bạn đã học được thông số độ trễ? Nếu có, những gì bạn đã sử dụng trước?
Hội nghị thượng đỉnh

Tôi đã sử dụng đồng phục -.6 đến .6 trên tham số độ trễ. y0 [i] được rút ra từN(β0Tôi,σ2)
Jeromy Anglim

Câu trả lời:


1

Đây là suy nghĩ của tôi:

  • Thay vì DIC, BIC, AIC tôi đề nghị trực tiếp làm việc với khả năng cận biên (còn được gọi là bằng chứng ) nếu bạn có đủ khả năng. Bằng chứng càng lớn , lớp mô hình của bạn càng có nhiều khả năng. Nó có thể không tạo ra sự khác biệt lớn, nhưng cuối cùng, DIC, BIC, AIC chỉ là xấp xỉ.
  • Để kiểm tra xem hiệu ứng trễ có dẫn đến khả năng cận biên lớn hơn không , tôi đề nghị thực hiện kiểm tra ban đầu sau: Lấy mô hình bao gồm tham số độ trễ. (a) Sửa tham số độ trễ thành0,18. (b) Đặt tham số độ trễ bằng không . Tính khả năng cận biên của cả hai lớp mô hình. Lớp mô hình (a) nên có khả năng cận biên lớn hơn .
  • Hãy tiến thêm một bước: Lấy mô hình không xem xét hiệu ứng trễ (c) và tính khả năng cận biên của nó . Tiếp theo, lấy lớp mô hình của bạn (d) kết hợp hiệu ứng trễ và có trước tham số độ trễ; tính khả năng cận biên của (d). Bạn sẽ mong đợi rằng (d) có khả năng cận biên lớn hơn . Vì vậy, những gì, nếu bạn không?:

    (1) Khả năng cận biên xem xét toàn bộ lớp mô hình. Điều này bao gồm hiệu ứng trễ, số lượng tham số, khả năng, ưu tiên.

    (2) So sánh các mô hình có số lượng tham số khác nhau luôn luôn là tinh tế, nếu có sự không chắc chắn đáng kể ở trước các tham số bổ sung.

    (3) Nếu bạn chỉ định độ không đảm bảo trước thông số độ trễ lớn một cách vô lý, bạn sẽ phạt toàn bộ lớp mô hình.

    (4) Thông tin hỗ trợ xác suất bằng nhau cho độ trễ âm và độ trễ dương là gì? Tôi tin rằng rất khó có thể quan sát độ trễ âm và điều này nên được đưa vào trước.

    (5) Ưu tiên mà bạn chọn trên tham số độ trễ là đồng nhất. Điều này thường không bao giờ là một lựa chọn tốt: Bạn có chắc chắn rằng các tham số của bạn phải thực sự nằm trong giới hạn quy định không? Liệu mỗi giá trị độ trễ bên trong giới hạn có thực sự có khả năng như nhau không? Đề xuất của tôi: đi với phân phối beta (nếu bạn chắc chắn rằng độ trễ bị giới hạn; hoặc với log-normal nếu bạn có thể loại trừ các giá trị nhỏ hơn 0 .

    (6) Đây là một ví dụ cụ thể, trong đó việc sử dụng các linh mục không cung cấp thông tin là không tốt (nhìn vào khả năng cận biên ): Bạn sẽ luôn ưu tiên mô hình có số lượng tham số không chắc chắn nhỏ hơn; không quan trọng là mô hình tốt hay xấu với nhiều tham số có thể làm như thế nào.

Tôi hy vọng suy nghĩ của tôi cung cấp cho bạn một số ý tưởng mới, gợi ý?!


Cảm ơn vì những lời khuyên. Chỉ để làm tròn mọi thứ, tôi đã cố gắng hạn chế tham số độ trễ để có giá trị trung bình của giá trị sau (tức là 0,18). Mô hình không có độ trễ vẫn có độ lệch trung bình nhỏ hơn.
Jeromy Anglim
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.