Sử dụng biến điều khiển trong thí nghiệm?


9

Tại sao người ta muốn kiểm soát bất kỳ số lượng đồng biến cơ sở nào trong tình huống chỉ định cho nhóm điều trị là ngẫu nhiên?

Sự hiểu biết của tôi là việc chỉ định điều trị ngẫu nhiên sẽ làm cho biến điều trị trở nên hoàn toàn ngoại sinh, tạo ra một nhóm kiểm soát có thể được coi là một phản ứng thích hợp. Ngoại lệ duy nhất tôi có thể nghĩ đến là khi kích thước mẫu nhỏ và việc gán ngẫu nhiên vẫn có thể tạo ra các nhóm không cân bằng.

Bất kỳ suy nghĩ đều được đánh giá cao. Cảm ơn!

Câu trả lời:


6

Từ quan điểm thường xuyên, một so sánh không được điều chỉnh dựa trên phân phối hoán vị luôn có thể được biện minh sau một nghiên cứu ngẫu nhiên (đúng). Một sự biện minh tương tự có thể được đưa ra để suy luận dựa trên các phân phối tham số chung (ví dụ: phân phối hoặc phân phối ) do sự tương đồng của chúng với phân phối hoán vị. Trên thực tế, việc điều chỉnh cho hiệp phương sai khi chúng được chọn dựa trên các phân tích hậu hoc, thực sự có nguy cơ làm tăng lỗi Loại I. Lưu ý rằng sự biện minh này không liên quan gì đến mức độ cân bằng trong mẫu được quan sát hoặc với kích thước của mẫu (ngoại trừ đối với các mẫu nhỏ, phân phối hoán vị sẽ rời rạc hơn và gần đúng hơn bởitFthoặc phân phối ).F

Điều đó nói rằng, nhiều người nhận thức được rằng việc điều chỉnh các hiệp phương sai có thể làm tăng độ chính xác trong mô hình tuyến tính. Cụ thể, điều chỉnh cho hiệp phương sai làm tăng độ chính xác của hiệu quả điều trị ước tính khi chúng được dự đoán về kết quả và không tương quan với biến điều trị (như đúng trong trường hợp nghiên cứu ngẫu nhiên). Tuy nhiên, điều ít được biết đến là điều này không tự động chuyển sang các mô hình phi tuyến tính. Ví dụ, Robinson và Jewell [1] cho thấy rằng trong trường hợp hồi quy logistic, việc kiểm soát các đồng biến làm giảm độ chính xác của hiệu quả điều trị ước tính, ngay cả khi chúng được dự đoán về kết quả. Tuy nhiên, vì hiệu quả điều trị ước tính cũng lớn hơn trong mô hình được điều chỉnh, nên việc kiểm soát các biến số dự đoán kết quả sẽ không tăng hiệu quả khi kiểm tra giả thuyết khống về hiệu quả điều trị sau một nghiên cứu ngẫu nhiên.

[1] LD Robinson và NP Jewell. Một số kết quả đáng ngạc nhiên về điều chỉnh đồng biến trong các mô hình hồi quy logistic. Tạp chí thống kê quốc tế , 58 (2): 227 Từ40, 1991.


Xin chào - câu trả lời thú vị. Bất kỳ quan tâm đến việc có một cuộc trò chuyện ngoại tuyến về điều này?
rolando2

12

Nếu kết quả phụ thuộc vào điều trị cũng như các yếu tố có thể quan sát khác, việc kiểm soát sau này thường cải thiện độ chính xác của ước tính tác động (nghĩa là sai số chuẩn của hiệu quả điều trị sẽ nhỏ hơn). Khi kích thước mẫu nhỏ, điều này có thể hữu ích.

Đây là một mô phỏng đơn giản trong đó mặc dù điều trị là ngẫu nhiên, lỗi tiêu chuẩn thu nhỏ lại một phần ba:

. set obs 100
obs was 0, now 100

. gen treat =mod(_n,2)

. gen x=rnormal()

. gen y = 2 + 3*treat + 1*x + rnormal()

. reg y treat

      Source |       SS       df       MS              Number of obs =     100
-------------+------------------------------           F(  1,    98) =  112.75
       Model |  209.354021     1  209.354021           Prob > F      =  0.0000
    Residual |  181.973854    98  1.85687606           R-squared     =  0.5350
-------------+------------------------------           Adj R-squared =  0.5302
       Total |  391.327875    99  3.95280682           Root MSE      =  1.3627

------------------------------------------------------------------------------
           y |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       treat |   2.893814   .2725345    10.62   0.000     2.352978     3.43465
       _cons |   2.051611    .192711    10.65   0.000     1.669183     2.43404
------------------------------------------------------------------------------

. reg y treat x

      Source |       SS       df       MS              Number of obs =     100
-------------+------------------------------           F(  2,    97) =  180.50
       Model |  308.447668     2  154.223834           Prob > F      =  0.0000
    Residual |  82.8802074    97  .854435127           R-squared     =  0.7882
-------------+------------------------------           Adj R-squared =  0.7838
       Total |  391.327875    99  3.95280682           Root MSE      =  .92436

------------------------------------------------------------------------------
           y |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       treat |   2.918349   .1848854    15.78   0.000     2.551403    3.285295
           x |   1.058636   .0983022    10.77   0.000     .8635335    1.253739
       _cons |   1.996209    .130825    15.26   0.000     1.736558     2.25586
------------------------------------------------------------------------------

1
+1 - Một lý do khác là để xác định hiệu ứng tương tác với điều trị, nhưng điều đó không chỉ là "kiểm soát" đối với các yếu tố khác như OP đã đề cập.
Andy W

Cảm ơn! Vì vậy, nếu một hoặc nhiều đồng biến ảnh hưởng đến kết quả mà bạn đang cố gắng đo lường, bao gồm chúng trong mô hình của bạn sẽ cải thiện độ chính xác của ước tính của bạn về hiệu quả điều trị được chỉ định ngẫu nhiên, nhưng sẽ không thực sự ảnh hưởng đến ước tính của bạn về giá trị của Hệ số xử lý, đúng?
Robb

Vâng đúng vậy.
Dimitriy V. Masterov

Xin lỗi về ping ngoài chủ đề: có một gợi ý trên Meta để biến [thử nghiệm ngẫu nhiên] thành một từ đồng nghĩa của thẻ [phân bổ ngẫu nhiên] ( stats.meta.stackexchange.com/a/4651 ). Bạn có đủ danh tiếng trong thẻ này để bỏ phiếu cho đề xuất này tại đây: stats.stackexchange.com/tags/random-allocation/synonymouss - hiện cần 4 lượt upvote để đi qua. Nếu bạn không đồng ý với đề xuất này, hãy xem xét nhận xét về Meta để giải thích lý do. Tôi sẽ xóa bình luận này sớm. Chúc mừng.
amip
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.