Bối cảnh và ví dụ thực nghiệm
Tôi có hai nghiên cứu; Tôi đã chạy thử nghiệm (Nghiên cứu 1) và sau đó nhân rộng nó (Nghiên cứu 2). Trong nghiên cứu 1, tôi đã tìm thấy một sự tương tác giữa hai biến; trong nghiên cứu 2, sự tương tác này theo cùng một hướng nhưng không đáng kể. Dưới đây là tóm tắt cho mô hình của Nghiên cứu 1:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.75882 0.26368 21.840 < 2e-16 ***
condSuppression -1.69598 0.34549 -4.909 1.94e-06 ***
prej -0.01981 0.08474 -0.234 0.81542
condSuppression:prej 0.36342 0.11513 3.157 0.00185 **
Và mô hình học tập 2:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.24493 0.24459 21.444 <2e-16 ***
prej 0.13817 0.07984 1.731 0.0851 .
condSuppression -0.59510 0.34168 -1.742 0.0831 .
prej:condSuppression 0.13588 0.11889 1.143 0.2545
Thay vì nói: "Tôi đoán tôi không có gì cả, vì tôi đã thất bại trong việc sao chép", những gì tôi đã làm là kết hợp hai bộ dữ liệu, tạo ra một biến giả cho nghiên cứu dữ liệu đến từ đâu, và sau đó chạy tương tác một lần nữa sau khi kiểm soát biến giả nghiên cứu. Sự tương tác này rất có ý nghĩa ngay cả sau khi kiểm soát nó và tôi thấy rằng sự tương tác hai chiều giữa điều kiện và không thích / prej này không đủ điều kiện bởi sự tương tác ba chiều với biến giả trong nghiên cứu.
Giới thiệu Phân tích Bayes
Tôi đã có người gợi ý rằng đây là một cơ hội tuyệt vời để sử dụng phân tích Bayes: Trong nghiên cứu 2, tôi có thông tin từ nghiên cứu 1 mà tôi có thể sử dụng làm thông tin trước đó! Theo cách này, Nghiên cứu 2 đang thực hiện cập nhật Bayes từ kết quả bình thường, bình phương nhỏ nhất trong Nghiên cứu 1. Vì vậy, tôi quay lại và phân tích lại mô hình Nghiên cứu 2, bây giờ sử dụng các mục sư thông tin về các hệ số: Tất cả các hệ số đều có bình thường trước khi giá trị trung bình là ước tính trong nghiên cứu 1 và độ lệch chuẩn là sai số chuẩn trong nghiên cứu 1.
Đây là một bản tóm tắt của kết quả:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.63 0.17 5.30 5.52 5.63 5.74 5.96
condSuppression -1.20 0.20 -1.60 -1.34 -1.21 -1.07 -0.80
prej 0.02 0.05 -0.08 -0.01 0.02 0.05 0.11
condSuppression:prej 0.34 0.06 0.21 0.30 0.34 0.38 0.46
sigma 1.14 0.06 1.03 1.10 1.13 1.17 1.26
mean_PPD 5.49 0.11 5.27 5.41 5.49 5.56 5.72
log-posterior -316.40 1.63 -320.25 -317.25 -316.03 -315.23 -314.29
Có vẻ như bây giờ chúng ta có bằng chứng khá chắc chắn cho sự tương tác từ phân tích Nghiên cứu 2. Điều này đồng ý với những gì tôi đã làm khi tôi đơn giản xếp chồng dữ liệu lên nhau và chạy mô hình với số nghiên cứu là một biến giả.
Phản tác dụng: Điều gì sẽ xảy ra nếu tôi học 2 đầu tiên?
Điều đó khiến tôi suy nghĩ: Điều gì sẽ xảy ra nếu tôi đã chạy Nghiên cứu 2 trước và sau đó sử dụng dữ liệu từ Nghiên cứu 1 để cập nhật niềm tin của mình vào Nghiên cứu 2? Tôi đã làm điều tương tự như trên, nhưng ngược lại: Tôi đã phân tích lại dữ liệu Nghiên cứu 1 bằng cách sử dụng ước lượng hệ số bình phương nhỏ nhất bình thường và độ lệch chuẩn so với Nghiên cứu 2 làm phương tiện trước và độ lệch chuẩn cho phân tích dữ liệu Nghiên cứu 1 của tôi. Các kết quả tóm tắt là:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.35 0.17 5.01 5.23 5.35 5.46 5.69
condSuppression -1.09 0.20 -1.47 -1.22 -1.09 -0.96 -0.69
prej 0.11 0.05 0.01 0.08 0.11 0.14 0.21
condSuppression:prej 0.17 0.06 0.05 0.13 0.17 0.21 0.28
sigma 1.10 0.06 0.99 1.06 1.09 1.13 1.21
mean_PPD 5.33 0.11 5.11 5.25 5.33 5.40 5.54
log-posterior -303.89 1.61 -307.96 -304.67 -303.53 -302.74 -301.83
Một lần nữa, chúng ta thấy bằng chứng cho sự tương tác, tuy nhiên điều này có thể không nhất thiết phải như vậy. Lưu ý rằng ước tính điểm cho cả hai phân tích Bayes thậm chí không nằm trong khoảng tin cậy 95% cho nhau; hai khoảng đáng tin cậy từ các phân tích Bayes có nhiều điểm không trùng lặp hơn so với chúng.
Bayesian biện minh cho ưu tiên thời gian là gì?
Vì vậy, câu hỏi của tôi là: những lời biện minh mà Bayes dành cho việc tôn trọng niên đại về cách dữ liệu được thu thập và phân tích là gì? Tôi nhận được kết quả từ Nghiên cứu 1 và sử dụng chúng như các linh mục thông tin trong Nghiên cứu 2 để tôi sử dụng Nghiên cứu 2 để "cập nhật" niềm tin của mình. Nhưng nếu chúng ta cho rằng kết quả tôi nhận được được lấy ngẫu nhiên từ một bản phân phối có hiệu ứng dân số thực sự ... thì tại sao tôi lại ưu tiên kết quả từ Nghiên cứu 1? Lý do nào cho việc sử dụng kết quả của Nghiên cứu 1 với tư cách là linh mục cho Nghiên cứu 2 thay vì lấy kết quả của Nghiên cứu 2 làm linh mục cho Nghiên cứu 1? Thứ tự mà tôi thu thập và tính toán các phân tích có thực sự quan trọng không? Đối với tôi, có vẻ như nó không phải là lý do để biện minh cho điều này? Tại sao tôi nên tin rằng ước tính điểm gần với 0,34 hơn so với 0,17 chỉ vì tôi đã chạy Nghiên cứu 1 trước?
Trả lời câu trả lời của Kodiologist
Nhà khoa học Kodi nhận xét:
Điểm thứ hai trong số những điểm này cho một sự khởi hành quan trọng mà bạn đã thực hiện từ hội nghị Bayes. Bạn đã không đặt trước trước và sau đó phù hợp với cả hai mô hình trong thời trang Bayes. Bạn phù hợp với một mô hình theo kiểu phi Bayes và sau đó sử dụng mô hình đó cho các linh mục cho mô hình khác. Nếu bạn đã sử dụng phương pháp thông thường, bạn sẽ không thấy sự phụ thuộc vào thứ tự mà bạn đã thấy ở đây.
Để giải quyết vấn đề này, tôi phù hợp với các mô hình cho Nghiên cứu 1 và Nghiên cứu 2 trong đó tất cả các hệ số hồi quy có trước . Các biến là một biến giả cho điều kiện thực nghiệm, mã hóa 0 hoặc 1; cả biến số, cũng như kết quả, đều được đo trên thang điểm 7 từ 1 đến 7. Vì vậy, tôi nghĩ rằng đó là một lựa chọn hợp lý của trước. Chỉ bằng cách dữ liệu được thu nhỏ, sẽ rất, rất hiếm khi thấy các hệ số lớn hơn nhiều so với những gì trước đó cho thấy.cond
prej
Các ước tính trung bình và độ lệch chuẩn của các ước tính đó giống như trong hồi quy OLS. Nghiên cứu 1:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.756 0.270 5.236 5.573 5.751 5.940 6.289
condSuppression -1.694 0.357 -2.403 -1.925 -1.688 -1.452 -0.986
prej -0.019 0.087 -0.191 -0.079 -0.017 0.040 0.150
condSuppression:prej 0.363 0.119 0.132 0.282 0.360 0.442 0.601
sigma 1.091 0.057 0.987 1.054 1.088 1.126 1.213
mean_PPD 5.332 0.108 5.121 5.259 5.332 5.406 5.542
log-posterior -304.764 1.589 -308.532 -305.551 -304.463 -303.595 -302.625
Và học 2:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.249 0.243 4.783 5.082 5.246 5.417 5.715
condSuppression -0.599 0.342 -1.272 -0.823 -0.599 -0.374 0.098
prej 0.137 0.079 -0.021 0.084 0.138 0.192 0.287
condSuppression:prej 0.135 0.120 -0.099 0.055 0.136 0.214 0.366
sigma 1.132 0.056 1.034 1.092 1.128 1.169 1.253
mean_PPD 5.470 0.114 5.248 5.392 5.471 5.548 5.687
log-posterior -316.699 1.583 -320.626 -317.454 -316.342 -315.561 -314.651
Vì các phương tiện và độ lệch chuẩn này ít nhiều giống với ước tính OLS, nên hiệu ứng thứ tự ở trên vẫn xảy ra. Nếu tôi cắm các số liệu thống kê tóm tắt sau từ Nghiên cứu 1 vào các linh mục khi phân tích Nghiên cứu 2, tôi quan sát thấy một hậu thế cuối cùng khác so với khi phân tích Nghiên cứu 2 trước và sau đó sử dụng các thống kê tóm tắt sau đó làm mục sư để phân tích Nghiên cứu 1.
Ngay cả khi tôi sử dụng các phương tiện Bayes và độ lệch chuẩn cho các hệ số hồi quy là các linh mục thay vì các ước tính thường xuyên, tôi vẫn sẽ quan sát hiệu ứng thứ tự tương tự. Vì vậy, câu hỏi vẫn còn: lý do Bayes cho đặc quyền nghiên cứu đến trước là gì?
rstanarm
hay Stan không? Có vẻ như câu hỏi đó đã được hỏi ở đây trước đây: stats.stackexchange.com/questions/241690/iêu
prej
phải giống nhau, trừ khi tôi hiểu sai quy trình của bạn.