Câu hỏi của bạn (cộng với bình luận thêm trong các bình luận) dường như chủ yếu quan tâm đến trường hợp chúng tôi có một thử nghiệm ngẫu nhiên có kiểm soát trong đó nhà nghiên cứu chỉ định ngẫu nhiên một hoặc nhiều biến giải thích, dựa trên một số thiết kế ngẫu nhiên. Trong ngữ cảnh này, bạn muốn biết lý do tại sao chúng tôi sử dụng một mô hình coi các biến giải thích là các hằng số đã biết, thay vì coi chúng là các biến ngẫu nhiên từ phân phối lấy mẫu do áp dụng ngẫu nhiên. (Câu hỏi của bạn rộng hơn câu hỏi này, nhưng đây có vẻ là trường hợp quan tâm chính trong bài bình luận, vì vậy đây là câu hỏi tôi sẽ giải quyết.)
Lý do mà chúng ta dựa vào các biến giải thích, trong bối cảnh này, là trong bài toán hồi quy cho RCT, chúng ta vẫn quan tâm đến phân phối có điều kiện của biến trả lời cho các yếu tố dự đoán . Thật vậy, trong một RCT, chúng tôi quan tâm đến việc xác định các tác động nguyên nhân của biến giải thích X đến biến trả lời Y , mà chúng tôi sẽ xác định thông qua suy luận về phân phối có điều kiện (theo một số giao thức để tránh gây nhiễu). Sự ngẫu nhiên được áp đặt để phá vỡ sự phụ thuộc giữa biến giải thích X và bất kỳ biến gây nhiễu nào (nghĩa là ngăn chặn các liên kết cửa sau). †† Tuy nhiên, đối tượng suy luận trong bài toán vẫn là phân phối có điều kiện của biến trả lời cho các biến giải thích. Do đó, việc ước tính các tham số trong phân phối có điều kiện này vẫn hợp lý, sử dụng các phương pháp ước lượng có các đặc tính tốt để suy ra phân phối có điều kiện .
Đó là trường hợp bình thường áp dụng cho một RCT sử dụng các kỹ thuật hồi quy. Tất nhiên, có một số tình huống chúng ta có những mối quan tâm khác, và chúng ta thực sự có thể muốn kết hợp sự không chắc chắn về các biến giải thích. Kết hợp sự không chắc chắn trong các biến giải thích thường xảy ra trong hai trường hợp:
(1) Khi chúng ta vượt ra ngoài phân tích hồi quy và phân tích đa biến, lúc đó chúng ta quan tâm đến việc phân phối chung các biến giải thích và phản ứng, thay vì chỉ phân phối có điều kiện của cái sau được đưa ra trước. Có thể có các ứng dụng mà đây là mối quan tâm của chúng tôi và do đó chúng tôi sẽ vượt ra ngoài phân tích hồi quy và kết hợp thông tin về phân phối các biến giải thích.
(2) Trong một số ứng dụng hồi quy, mối quan tâm của chúng tôi là phân phối có điều kiện của biến trả lời có điều kiện trên một biến giải thích không quan sát được, trong đó chúng tôi giả sử rằng các biến giải thích được quan sát là có lỗi ("lỗi-biến-biến"). Trong trường hợp này, chúng tôi kết hợp tính không chắc chắn thông qua "lỗi trong biến". Lý do cho điều này là sự quan tâm của chúng tôi trong các trường hợp này là trong phân phối có điều kiện , có điều kiện trên một biến cơ bản không quan sát được .
Lưu ý rằng cả hai trường hợp này đều phức tạp hơn về mặt toán học so với phân tích hồi quy, vì vậy nếu chúng ta có thể thoát khỏi việc sử dụng phân tích hồi quy, điều đó thường được ưa thích hơn. Trong mọi trường hợp, trong hầu hết các ứng dụng phân tích hồi quy, mục tiêu là suy luận về phân phối có điều kiện của đáp ứng, đưa ra các biến giải thích có thể quan sát được, do đó những khái quát này trở nên không cần thiết.
† Lưu ý rằng severs ngẫu nhiên nhân quả tác động từ nhiễu biến để biến ngẫu nhiên, nhưng nó không ảnh hưởng nhân quả sever từ biến ngẫu nhiên các biến nhiễu, và sau đó đến các phản ứng. Điều này có nghĩa là các giao thức khác (ví dụ: giả dược, mù, v.v.) có thể được yêu cầu để cắt đứt hoàn toàn tất cả các liên kết cửa sau trong phân tích nguyên nhân.