Tôi nghĩ câu trả lời của Jeromy là đủ nếu bạn đang kiểm tra hai nghiên cứu thử nghiệm hoặc phân tích tổng hợp thực tế. Nhưng thường thì chúng ta phải đối mặt với việc kiểm tra hai nghiên cứu phi thực nghiệm và được giao nhiệm vụ đánh giá tính hợp lệ của hai phát hiện khác nhau đó.
Như danh sách các câu hỏi tạp hóa của Cyrus cho thấy, bản thân chủ đề không thể đáp ứng ngắn, và toàn bộ các cuốn sách về bản chất là nhằm giải quyết một câu hỏi như vậy. Đối với bất kỳ ai quan tâm đến việc tiến hành nghiên cứu về dữ liệu phi thực nghiệm, tôi rất khuyến nghị bạn đọc
Các thiết kế thử nghiệm và bán thử nghiệm cho suy luận nguyên nhân tổng quát của William R. Shadish, Thomas D. Cook, Donald Thomas Campbell (Ngoài ra tôi đã nghe nói rằng các phiên bản cũ hơn của văn bản này cũng tốt như vậy).
Một số mục mà Jeromy đề cập (cỡ mẫu lớn hơn và độ nghiêm ngặt về phương pháp lớn hơn) và mọi thứ mà Cyrus đề cập sẽ được coi là thứ mà Campbell và Cook gọi là "Hiệu lực nội bộ". Chúng bao gồm các khía cạnh của thiết kế nghiên cứu và các phương pháp thống kê được sử dụng để đánh giá mối quan hệ giữa X và Y. Đặc biệt là các nhà phê bình, chúng tôi lo ngại về các khía cạnh có thể làm sai lệch kết quả và làm giảm độ tin cậy của các phát hiện. Vì đây là một diễn đàn dành cho phân tích thống kê, phần lớn các câu trả lời tập trung vào các phương pháp thống kê để đảm bảo các ước tính không thiên vị về bất kỳ mối quan hệ nào bạn đang đánh giá. Nhưng chúng là những khía cạnh khác của thiết kế nghiên cứu không liên quan đến phân tích thống kê làm giảm tính hợp lệ của các phát hiện cho dù người ta đi sâu vào phân tích thống kê nào (chẳng hạn như Cyrus đề cập đến một số khía cạnh của độ trung thực thử nghiệm có thể được giải quyết nhưng không được giải quyết phương pháp thống kê, và nếu chúng xảy ra sẽ luôn làm giảm tính hợp lệ của kết quả nghiên cứu). Có nhiều khía cạnh khác của tính hiệu lực nội bộ trở nên quan trọng để đánh giá khi so sánh kết quả của các nghiên cứu phi thực nghiệm không được đề cập ở đây và các khía cạnh của các thiết kế nghiên cứu có thể phân biệt độ tin cậy của các phát hiện. Tôi không nghĩ nó khá thích hợp để đi vào quá nhiều chi tiết ở đây,
Campbell và Cook cũng đề cập đến "tính hợp lệ bên ngoài" của các nghiên cứu. Khía cạnh này của thiết kế nghiên cứu thường có phạm vi nhỏ hơn nhiều và không đáng được quan tâm nhiều như hiệu lực nội bộ. Hiệu lực bên ngoài về cơ bản liên quan đến tính tổng quát của các phát hiện, và tôi sẽ nói rằng giáo dân thường có thể đánh giá tính hợp lệ bên ngoài một cách hợp lý miễn là họ quen thuộc với chủ đề này. Câu chuyện dài đọc cuốn sách của Shadish, Cook và Campbell.