Sự khác biệt cơ bản trong RCT: Biến nào (nếu có) nên được đưa vào dưới dạng hiệp phương sai?


8

Gần đây tôi đã hoàn thành một nghiên cứu, theo đó tôi ngẫu nhiên chỉ định người tham gia vào một trong hai nhóm điều trị. Tôi đã thử nghiệm những người tham gia tại đường cơ sở, ngay lập tức sau can thiệp, 1 tháng và 4 tháng về một số lượng lớn các biến số kết quả. Tôi đã lên kế hoạch chạy một số ANOVA hỗn hợp để kiểm tra các tương tác thời gian của nhóm x. Một số so sánh sẽ là so sánh 2 (nhóm) x 2 (thời gian: đường cơ sở và sau can thiệp) và một số so sánh sẽ là 2 (nhóm) x 3 (thời gian: đường cơ sở, 1 tháng, 4 tháng) so sánh.

Trước khi bắt đầu phân tích, tôi đã so sánh hai nhóm điều trị trên tất cả các biến số cơ bản. Tôi thấy rằng các nhóm khác nhau trên 4 biến cơ sở nếu tôi sử dụng mức alpha 0,05 hoặc 2 biến cơ sở nếu tôi sử dụng cấp độ alpha là 0,01 để so sánh các nhóm.

Tôi có hai câu hỏi về điều này:

  1. Tôi nên sử dụng cấp độ alpha nào để so sánh các nhóm tại đường cơ sở? Tôi đã suy nghĩ mức độ alpha là 0,01 bởi vì tôi đang so sánh hai nhóm về 24 đặc điểm cơ bản và tôi nghĩ rằng tôi nên chọn mức độ alpha nghiêm ngặt hơn 0,05 để giảm tỷ lệ lỗi thông minh trong gia đình khi thấy một số lượng lớn các bài kiểm tra thực hiện, nhưng từ bài đọc của tôi, có vẻ như hầu hết mọi người sử dụng 0,05. Bạn đề xuất món gì?

  2. Tôi phải làm gì về những khác biệt này? Tôi có thể bao gồm các biến này dưới dạng đồng biến, nhưng kích thước mẫu của tôi khá nhỏ và sử dụng 4 biến số có vẻ không phù hợp (đó cũng là một phần lý do tại sao tôi chỉ chấp nhận sự khác biệt nếu chúng có ý nghĩa ở mức 0,05)

Bất kỳ trợ giúp về điều này sẽ được rất nhiều đánh giá cao!

Câu trả lời:


8

Như Stephen Senn đã viết, không phù hợp để so sánh các phân phối cơ bản trong một nghiên cứu ngẫu nhiên. Cách tôi muốn nói về vấn đề này là đặt câu hỏi "bạn dừng ở đâu?", Tức là bạn nên quay lại bao nhiêu phương trình đường cơ sở khác? Bạn sẽ tìm thấy các đồng biến đối trọng nếu bạn nhìn đủ cứng.

Cơ sở để chọn một mô hình không phải là sự khác biệt hậu-hoc mà là kiến ​​thức về chủ đề apriori về các biến nào có khả năng là yếu tố dự báo quan trọng của biến phản ứng. Phiên bản cơ sở của biến trả lời chắc chắn là một yếu tố dự đoán thống trị nhưng có những thứ khác có khả năng quan trọng. Mục tiêu là giải thích sự không đồng nhất có thể giải thích trong kết quả để tối đa hóa độ chính xác và sức mạnh. Hầu như không có vai trò kiểm tra ý nghĩa thống kê trong xây dựng mô hình.

Một mô hình được chỉ định trước sẽ quan tâm đến sự khác biệt về cơ hội đối với các biến quan trọng - những biến dự đoán kết quả.


Cảm ơn tất cả các hồi đáp của bạn. Các biến số cơ sở khác nhau dựa trên nhiều thử nghiệm t là các mức cơ sở của một số biến kết quả (ví dụ: điểm trầm cảm cơ sở khác nhau và trầm cảm ở 1 và 4 tháng là một trong các biện pháp kết quả).
Rachel

3

Thông thường, điều bạn nên quan tâm khi so sánh hai nhóm ở mức cơ bản không có quá nhiều ý nghĩa thống kê về sự khác biệt nhưng quy mô của sự khác biệt: có sự khác biệt nào trong số những khác biệt này đủ lớn để nghiên cứu không? Đủ lớn để ảnh hưởng đến các so sánh nhóm và các mối quan hệ khác nhau là trọng tâm của nghiên cứu? Đủ lớn để điều chỉnh cho nó (bằng cách sử dụng nó như một đồng biến) là cần thiết?

Bây giờ, trường hợp của bạn có một chút thú vị ở chỗ, ngay cả khi chỉ định ngẫu nhiên, bạn đã có 4 trong số 24 biến thể hiện sự khác biệt đáng kể ở mức 0,05 (17% thay vì 5% dự kiến). Điều đó có vẻ liên quan đến quá trình ngẫu nhiên của bạn hoặc một số khía cạnh khác của nghiên cứu. Nhưng về mặt lý thuyết, nếu việc ngẫu nhiên được thực hiện hoàn hảo và không có sự tiêu hao nào trong cả hai nhóm sau đó, thì kết quả cực đoan này hoặc nhiều hơn sẽ xảy ra 2,4% thời gian, dựa trên 24! / (4! (24-4)!) ( 0,05 ^ 4) (0,95 ^ (24-4)). Rốt cuộc, đó không thực sự là một sự cố hiếm gặp. Những gì bạn có cũng có thể là một tập hợp các sự khác biệt ngẫu nhiên. Tôi sẽ gắn bó với việc đánh giá dựa trên mức độ khác biệt.


2
Điểm tuyệt vời về sự đa dạng. Về việc đánh giá sự khác biệt, tôi nghĩ rằng tìm kiếm sự khác biệt lớn có mối tương quan rất cao với việc tìm kiếm các giá trị P nhỏ; Tôi cũng không đề nghị.
Frank Harrell

Làm thế nào để tôi biết nếu bất kỳ sự khác biệt nào trong số những khác biệt này đủ lớn để quan trọng với nghiên cứu và đủ lớn để điều chỉnh cho nó (bằng cách sử dụng nó như một đồng biến) là cần thiết? Kích thước hiệu ứng cho mỗi trong bốn điểm khác biệt tại đường cơ sở (sử dụng cohen's d) lần lượt là 0,78, 0,64, 1,06 và 0,89.
Rachel

2
Bạn không và không thể. Hãy suy nghĩ về việc xây dựng mô hình phù hợp lên phía trước hơn là điều chỉnh bài hoc.
Frank Mitchell

Được rồi có ý nghĩa. Tôi có nên phân tích kết quả của mình theo cách khác hơn là sử dụng thiết kế mô hình hỗn hợp không? Hoặc là đủ để đề cập đến sự khác biệt nhưng không điều chỉnh cho chúng?
Rachel

3
Suy nghĩ duy nhất của tôi là hỏi một chuyên gia về vấn đề các yếu tố dự đoán quan trọng của biến phản ứng có khả năng là gì, mà không nói cho chuyên gia về sự khác biệt bạn tìm thấy, sau đó điều chỉnh cho các dự đoán này.
Frank Harrell

2

+1 vào @FrankHarrell. Tôi có thể thêm một điểm nhỏ. Nếu bạn chỉ định ngẫu nhiên những người tham gia của mình cho các nhóm, bất kỳ sự khác biệt 'đáng kể' nào trong các giá trị đồng biến trước khi can thiệp đều nhất thiết là lỗi loại I.


1
Đặt một cách chính xác, và nhận xét của bạn chỉ ra những khó khăn trong việc chỉ định chính xác những gì mà suy luận về sự khác biệt cơ bản suy luận dân số nhằm vào.
Frank Harrell

2
@gung-xin chào! Điều gì về quan điểm này: Trong một RCT, 2 nhóm là tất cả chúng ta có. Tất nhiên họ đến từ cùng một dân số: không có 2 quần thể nào gây ra lỗi nào, Loại I hay cách khác. Vì vậy, ý nghĩa thống kê là không liên quan, nhưng sự khác biệt lớn cũng có thể là vấn đề và cũng có thể yêu cầu điều chỉnh thông qua việc sử dụng các đồng biến.
rolando2

2
Tôi thích phần đầu tiên, nhưng phần cuối có vẻ phức tạp hơn và điều chỉnh hậu hoc có thể tạo ra sự thiên vị trong khi không điều chỉnh cho các trình giải thích không đồng nhất đáp ứng lớn. Ngoài ra, dữ liệu không có khả năng cho chúng tôi biết tập hợp số liệu nào cần điều chỉnh.
Frank Harrell

@ rolando2, cách tôi nghĩ về nó là thế này: Dân số của bạn là dân số mà mẫu của bạn được rút ra; "điều trị" là thủ tục chuyển nhượng ngẫu nhiên của bạn; & biến trả lời là hiệp phương sai bạn đang kiểm tra. Kiểm tra t kiểm tra xem liệu thủ tục gán ngẫu nhiên có được liên kết với giá trị trung bình của hiệp phương sai không. Bây giờ, nếu quy trình chuyển nhượng của bạn bị sai sót, điều hoàn toàn hợp lý là nó có thể được liên kết với các giá trị đồng biến kết quả, nhưng nếu nó thực sự ngẫu nhiên, theo định nghĩa, nó không thể và vì vậy mọi phát hiện 'đáng kể' là lỗi loại I .
gung - Phục hồi Monica

2
Bạn đang điều chỉnh cho biến kết quả của bạn tại đường cơ sở nào; Đó là tiêu chuẩn. Sau đó, bạn đang tin tưởng rằng thủ tục ngẫu nhiên của bạn là hợp lệ và do đó có những suy luận hợp lệ. Nếu bạn tin rằng quy trình chuyển nhượng của bạn không hoàn hảo & kết luận của bạn không hợp lệ, bạn phải bắt đầu lại bằng cách thu thập một mẫu mới, chỉ định người tham gia của bạn cho các nhóm điều trị thông qua một quy trình thực sự ngẫu nhiên cho phép bạn tự tin vào kết luận của mình, & chạy lại nghiên cứu.
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.