Sự khác biệt giữa kiểm soát và điều trị nên được mô hình hóa rõ ràng hay ngầm định?


9

Đưa ra các thiết lập thử nghiệm sau:

Nhiều mẫu được lấy từ một đối tượng và mỗi mẫu được xử lý theo nhiều cách (bao gồm cả điều trị đối chứng). Điều chủ yếu thú vị là sự khác biệt giữa kiểm soát và từng điều trị.

Tôi có thể nghĩ về hai mô hình đơn giản cho dữ liệu này. Với mẫu , xử lý , xử lý 0 là đối chứng, hãy để là dữ liệu, là đường cơ sở cho mẫu , là sự khác biệt cho xử lý . Mô hình đầu tiên xem xét cả sự kiểm soát và sự khác biệt:j Y i j γ i i δ j jijYijγiiδjj

δ 0 = 0

Yij=γi+δj+ϵij
δ0=0

Trong khi mô hình thứ hai chỉ nhìn vào sự khác biệt. Nếu chúng ta tính toán trước trước thì d i j = Y i j - Y i 0 d i j = δ j + ε i jdij

dij=YijYi0
dij=δj+εij

Câu hỏi của tôi là sự khác biệt cơ bản giữa hai thiết lập này là gì? Cụ thể, nếu bản thân các cấp độ là vô nghĩa và chỉ có sự khác biệt, thì mô hình đầu tiên có làm quá nhiều và có lẽ bị thiếu năng lực?


2
Tôi có thể đưa ra một câu trả lời kỹ lưỡng hơn sau đó, nhưng tôi sẽ đề nghị bài báo này của Paul Allison sẽ được quan tâm ( Allison, 1990 ).
Andy W

1
Được chỉnh sửa để phản ánh thực tế rằng các lỗi trong các mô hình khác nhau không thực sự giống nhau và do đó không nên sử dụng cùng các ký hiệu.
Rónán Daly

Câu trả lời:


6

Các được khả năng được tương quan trong mô hình thứ hai nhưng không phải là người đầu tiên.ϵij

Đầu tiên, các thuật ngữ này đại diện cho sai số đo và độ lệch so với mô hình phụ gia. Với sự chăm sóc hợp lý - chẳng hạn như bằng cách ngẫu nhiên trình tự các phép đo - những lỗi đó có thể được thực hiện độc lập khi mô hình chính xác. Từ đâu

dij=YijYi0=γi+δj+ϵij(γi+δ0+ϵi0)=δj+(ϵijϵi0).

(Lưu ý rằng điều này mâu thuẫn với phương trình cuối cùng trong câu hỏi, vì sai khi giả sử Làm như vậy sẽ buộc chúng ta thừa nhận rằng là các biến ngẫu nhiên thay vì tham số, ít nhất là một khi chúng ta thừa nhận khả năng xảy ra lỗi đo lường đối với điều khiển. Điều này sẽ dẫn đến kết luận tương tự bên dưới.)ϵi0=0γi

Đối với , điều này ngụ ýj,k0jk

Cov(dij,dik)=Cov(ϵijϵi0,ϵikϵi0)=Var(ϵi0)0.

Sự tương quan có thể là đáng kể. Đối với các lỗi iid, một phép tính tương tự cho thấy nó bằng 0,5. Trừ khi bạn đang sử dụng các quy trình xử lý rõ ràng và chính xác mối tương quan này, hãy ưu tiên mô hình đầu tiên hơn mô hình thứ hai.


Vì vậy, bạn đã cho rằng mô hình đầu tiên là mô hình thực sự và có được một thuộc tính không mong muốn của mô hình thứ hai. Chúng tôi biết tất cả các mô hình đều sai vì vậy kết quả này có thực sự có ý nghĩa?
Macro

1
@Macro Vui lòng đọc phản hồi của tôi cẩn thận hơn: nó được tạo ra để chỉ ra những giả định nào là cần thiết để biện minh cho mô hình đầu tiên và phân biệt nó với mô hình thứ hai, nhưng không chứa giả định rằng bất kỳ mô hình nào là "đúng". Ví dụ, lưu ý cảnh báo "khi mô hình chính xác." Ngay cả từ "chính xác" cũng được chọn với một số suy nghĩ nhằm tránh ấn tượng sai lầm rằng có một mô hình "đúng" hoặc "chính xác".
whuber

1
Tôi hơi bối rối, gì? dik
Andy W

1
@Andy và chỉ số hai phương pháp điều trị riêng biệt. Tôi nên viết "Dành cho ..."; Tôi sẽ sửa lỗi đánh máy đó. Cảm ơn đã bắt nó. k j , k 0jkj,k0
whuber

@whuber Có tài liệu tham khảo nào hỗ trợ tuyên bố của bạn không, ví dụ như để thuyết phục người đánh giá?
Daniel
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.