Thực hành tốt nhất khi phân tích các thiết kế kiểm soát trước điều trị sau điều trị


53

Hãy tưởng tượng thiết kế phổ biến sau đây:

  • 100 người tham gia được phân bổ ngẫu nhiên vào nhóm điều trị hoặc nhóm đối chứng
  • biến phụ thuộc là số và đo lường trước và sau điều trị

Ba tùy chọn rõ ràng để phân tích dữ liệu đó là:

  • Kiểm tra nhóm theo hiệu ứng tương tác thời gian trong ANOVA hỗn hợp
  • Thực hiện ANCOVA với điều kiện là IV và số đo trước là hiệp phương sai và số đo sau là DV
  • Thực hiện kiểm tra t với điều kiện là IV và điểm thay đổi trước bài là DV

Câu hỏi:

  • Cách tốt nhất để phân tích dữ liệu đó là gì?
  • Có những lý do để thích một cách tiếp cận hơn một cách khác?

1
Khi bạn nói "điều kiện", bạn có nghĩa là phân công nhóm?
pmgjones

1
@propofol: có. xin lỗi nếu ngôn ngữ của tôi không rõ ràng.
Jeromy Anglim

1
Ngoài ra còn có các phương pháp "N-of-1" tham số để đánh giá thống kê dữ liệu thời gian cho các quan sát đơn lẻ. Ứng dụng ví dụ: ncbi.nlm.nih.gov/pubmed/2039432 Phương pháp so sánh: europepmc.org/abauge/MED/10557859/
user31256

Câu trả lời:


34

Có một tài liệu khổng lồ xung quanh chủ đề này (thay đổi / tăng điểm) và tôi nghĩ rằng các tài liệu tham khảo tốt nhất đến từ lĩnh vực y sinh, ví dụ

Senn, S (2007). Vấn đề thống kê trong phát triển thuốc . Wiley (chương 7 trang 96-112)

Trong nghiên cứu y sinh, công việc thú vị cũng đã được thực hiện trong nghiên cứu các thử nghiệm chéo (đặc biệt liên quan đến các hiệu ứng lan truyền , mặc dù tôi không biết nó có thể áp dụng như thế nào cho nghiên cứu của bạn).

Từ Gain Score t đến ANCOVA F (và ngược lại) , từ Knapp & Schaffer, cung cấp một đánh giá thú vị về ANCOVA so với phương pháp tiếp cận (cái gọi là Nghịch lý của Chúa). Phân tích đơn giản về điểm số thay đổi không phải là cách được đề xuất cho thiết kế trước / sau theo Senn trong bài viết của ông Thay đổi từ đường cơ sở và phân tích hiệp phương sai được xem xét lại (Stat. Med. 2006 25 (24)). Ngoài ra, sử dụng mô hình hiệu ứng hỗn hợp (ví dụ để tính tương quan giữa hai điểm thời gian) sẽ không tốt hơn vì bạn thực sự cần sử dụng phép đo "trước" như một phép toán để tăng độ chính xác (thông qua điều chỉnh). Rất ngắn gọn:

  • Việc sử dụng điểm thay đổi (sau trước hoặc kết quả đường cơ sở) không giải quyết được vấn đề mất cân bằng; mối tương quan giữa đo lường trước và sau là <1, và mối tương quan giữa trước và ( trước trước) nói chung là tiêu cực - điều đó xảy ra nếu việc điều trị (phân bổ nhóm của bạn) khi được đo bằng điểm số thô xảy ra là một bất lợi không công bằng so với để kiểm soát, nó sẽ có một lợi thế không công bằng với điểm số thay đổi.---
  • Phương sai của công cụ ước tính được sử dụng trong ANCOVA thường thấp hơn so với điểm số thô hoặc thay đổi (trừ khi tương quan giữa trước và sau bằng 1).
  • Nếu mối quan hệ trước / sau khác nhau giữa hai nhóm (độ dốc), thì đó không phải là vấn đề so với bất kỳ phương pháp nào khác (cách tiếp cận điểm thay đổi cũng cho rằng mối quan hệ này giống hệt nhau giữa hai nhóm - giả thuyết độ dốc song song ).
  • Theo giả thuyết khống về sự bình đẳng của điều trị (về kết quả), không có điều trị tương tác x đường cơ sở nào được mong đợi; Thật nguy hiểm khi phù hợp với một mô hình như vậy, nhưng trong trường hợp này, người ta phải sử dụng các đường cơ sở trung tâm (nếu không, hiệu quả điều trị được ước tính ở nguồn gốc đồng biến).

Tôi cũng thích Mười huyền thoại về Điểm khác biệt từ Edwards, mặc dù nó tập trung vào điểm số khác biệt trong một bối cảnh khác; nhưng đây là một thư mục có chú thích về phân tích thay đổi trước bài (thật không may, nó không bao gồm công việc gần đây). Van Breukelen cũng so sánh ANOVA với ANCOVA trong cài đặt ngẫu nhiên và không ngẫu nhiên, và kết luận của ông ủng hộ ý kiến ​​cho rằng ANCOVA sẽ được ưu tiên, ít nhất là trong các nghiên cứu ngẫu nhiên (ngăn chặn hồi quy với hiệu quả trung bình).


Chỉ cần làm rõ: bạn có nghĩa là ANCOVA với điểm kiểm tra trước là đồng biến là lựa chọn tốt nhất?
mkt - Phục hồi

17

Daniel B. Wright thảo luận về điều này trong phần 5 của bài viết Kết bạn với dữ liệu của bạn . Ông đề nghị (tr.130):

Quy trình duy nhất luôn luôn đúng trong tình huống này là một biểu đồ phân tán so sánh điểm số tại thời điểm 2 với các điểm tại thời điểm 1 cho các nhóm khác nhau. Trong hầu hết các trường hợp, bạn nên phân tích dữ liệu theo nhiều cách. Nếu các phương pháp cho kết quả khác nhau ... hãy suy nghĩ kỹ hơn về mô hình được ngụ ý bởi mỗi mô hình.

Ông đề nghị các bài viết sau khi đọc thêm:

  • Tay, DJ (1994). Giải cấu trúc câu hỏi. Tạp chí của Hiệp hội Thống kê Hoàng gia: A, 157, 317 Bóng56.
  • Chúa, FM (1967). Một nghịch lý trong việc giải thích so sánh nhóm. Bản tin tâm lý, 72, 304 trục305. PDF miễn phí
  • Wainer, H. (1991). Điều chỉnh tỷ lệ cơ sở chênh lệch: Nghịch lý của Chúa một lần nữa. Bản tin tâm lý, 109, 147 Điêu151. PDF miễn phí

9

Các chiến lược phổ biến nhất sẽ là:

  1. Lặp đi lặp lại các biện pháp ANOVA với một yếu tố bên trong đối tượng (trước so với sau thử nghiệm) và một yếu tố giữa các đối tượng (điều trị so với kiểm soát).
  2. ANCOVA về điểm số sau điều trị, với điểm số trước điều trị là đồng biến và điều trị như một biến độc lập. Theo trực giác, ý tưởng là một bài kiểm tra về sự khác biệt giữa cả hai nhóm thực sự là những gì bạn đang theo đuổi và bao gồm cả điểm kiểm tra trước vì một hiệp phương sai có thể tăng sức mạnh so với bài kiểm tra t đơn giản hoặc ANOVA.

Có nhiều cuộc thảo luận về việc giải thích, giả định và sự khác biệt rõ ràng nghịch lý giữa hai cách tiếp cận này và về các lựa chọn thay thế phức tạp hơn (đặc biệt là khi người tham gia không thể được chỉ định điều trị ngẫu nhiên) nhưng tôi vẫn khá chuẩn.

Một nguồn gây nhầm lẫn quan trọng là đối với ANOVA, hiệu quả của sự quan tâm rất có thể là sự tương tác giữa thời gian và điều trị chứ không phải là tác dụng chính của điều trị. Ngẫu nhiên, bài kiểm tra F cho thuật ngữ tương tác này sẽ mang lại kết quả chính xác so với bài kiểm tra mẫu độc lập về điểm số đạt được (tức là điểm đạt được bằng cách trừ điểm trước bài kiểm tra từ điểm sau bài kiểm tra cho mỗi người tham gia) để bạn có thể cũng đi cho điều đó.

Nếu tất cả những điều này là quá nhiều, bạn không có thời gian để tìm ra nó và không thể nhận được sự giúp đỡ từ một nhà thống kê, một cách nhanh chóng và bẩn thỉu nhưng không có nghĩa là cách tiếp cận hoàn toàn vô lý sẽ chỉ đơn giản là so sánh điểm số sau kiểm tra với kiểm tra mẫu độc lập, bỏ qua các giá trị trước thử nghiệm. Điều này chỉ có ý nghĩa nếu trên thực tế những người tham gia được chỉ định ngẫu nhiên vào nhóm điều trị hoặc nhóm kiểm soát .

Cuối cùng, đó không phải là lý do chính đáng để chọn nó nhưng tôi nghi ngờ cách tiếp cận 2 ở trên (ANCOVA) là những gì hiện đang vượt qua cho cách tiếp cận đúng trong tâm lý học, vì vậy nếu bạn chọn một cách khác, bạn có thể phải giải thích chi tiết về kỹ thuật này hoặc để biện minh bản thân bạn cho một người nào đó bị thuyết phục, ví dụ như điểm số đạt được điểm nổi tiếng là xấu.


1
Tôi muốn nói rằng khuyến nghị đầu tiên, các biện pháp lặp lại ANOVA, không phù hợp để phân tích dữ liệu trước khi đăng. Điều trị có được mã hóa thành 0 trong nhóm can thiệp lúc ban đầu không? Dù bằng cách nào, điều này giới thiệu lại hiệu ứng Hawthorne. Sự khác biệt có hệ thống về trước / bài giữa các điều khiển được điều chỉnh theo sự thay đổi ngẫu nhiên. OVA RM AN C là hợp lý khi có nhiều phép đo trong một giai đoạn sau và các giá trị cơ bản vẫn được điều chỉnh dưới dạng hiệp phương sai hoặc được sử dụng làm điểm số đạt được.
AdamO

2

ANCOVA và các biện pháp lặp lại / mô hình hỗn hợp cho thuật ngữ tương tác đang thử nghiệm hai giả thuyết khác nhau. Tham khảo bài viết này: ariticle 1 và bài viết này: bài viết 2


-2

Vì bạn có hai phương tiện (một trong hai mặt hàng cụ thể hoặc tổng số hàng tồn kho), không có lý do gì để xem xét ANOVA. Một bài kiểm tra t cặp có lẽ là thích hợp; điều này có thể giúp bạn chọn kiểm tra t mà bạn cần.

Bạn có muốn xem kết quả cụ thể của mặt hàng, hoặc ở điểm tổng thể không? Nếu bạn muốn thực hiện phân tích vật phẩm, đây có thể là nơi bắt đầu hữu ích.


4
Còn nhóm kiểm soát thì sao? Một thử nghiệm t được ghép nối trên tất cả các dữ liệu nghe có vẻ là một ý tưởng tồi và chắc chắn không giải quyết được câu hỏi chính (điều trị có hiệu quả không?). Một thử nghiệm t cặp được giới hạn trong nhóm điều trị là một chiến lược hợp lý nhưng bỏ qua nhóm kiểm soát sẽ lấy đi rất nhiều dữ liệu và làm cho bằng chứng yếu hơn nhiều cho thấy sự can thiệp trên thực tế là thành phần hoạt chất. ANOVA trên thực tế là một cách phổ biến - nếu thường bị chỉ trích - để phân tích thiết kế này.
Gala
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.