Các biện pháp lặp đi lặp lại theo thời gian với


14

Tôi đã được cung cấp dữ liệu để phân tích cho một nghiên cứu xem xét tác động của điều trị đối với nồng độ sắt ở bốn thời điểm khác nhau (trước khi điều trị, kết thúc điều trị trong ngày, 4 tuần sau điều trị và 2-4 tháng sau khi điều trị). Không có nhóm kiểm soát. Họ đang tìm kiếm để xem liệu có sự gia tăng đáng kể về mức độ sắt ở mỗi trong 3 điểm thời gian sau điều trị đến mức trước khi điều trị (đường cơ sở). Mười một bệnh nhân có mức cơ bản nhưng chỉ có 8 bệnh nhân có dữ liệu hoàn chỉnh cho cả 4 điểm thời gian ( = 11, 10, 9 và 8 cho mỗi điểm thời gian). Không chỉ đo nồng độ sắt, mà hai biện pháp phòng thí nghiệm khác được thực hiện tại mỗi thời điểm được so sánh với đường cơ sở.n

Tôi có một vài câu hỏi như làm thế nào để phân tích điều này. Trước tiên tôi nghĩ rằng một ANOVA RM sẽ phù hợp để phân tích dữ liệu này, nhưng tôi lo ngại về kích thước mẫu nhỏ, mất dữ liệu và phân phối dữ liệu không bình thường. Sau đó, tôi đã xem xét so sánh từng biện pháp sau điều trị với đường cơ sở bằng cách sử dụng các xét nghiệm xếp hạng có chữ ký của Wilcoxon, nhưng sau đó tôi gặp phải vấn đề so sánh nhiều. Tuy nhiên, tôi đã đọc một số tài liệu cho thấy các tuyến dưới cần chạy nhiều so sánh. Vì vậy, về tổng thể, tôi đang xử lý các cỡ mẫu nhỏ, dữ liệu không đầy đủ và nhiều so sánh (và có cần thiết hay không).

Tôi hy vọng tất cả điều này có ý nghĩa. Tôi mới tham gia CrossValidated và được một đồng nghiệp hướng dẫn ở đây như một nơi để học hỏi từ các nhà thống kê có kinh nghiệm, vì vậy tôi đánh giá cao bất kỳ lời khuyên nào! Cảm ơn!


Đã chỉnh sửa để thêm dữ liệu thô từ nhận xét:

Có bốn điểm tổng thời gian và biến kết quả là liên tục. Ví dụ: kết quả tại mỗi thời điểm trông tương tự như sau:

 Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 
 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
 2nd Post (n=9):  [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
 3rd Post (n=8):  [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]

1
Nếu bạn thêm ví dụ tái tạo (hoặc dữ liệu thô) thì sẽ rất hữu ích.
Ladislav Naďo

Biến kết quả là liên tục. Ví dụ: kết quả tại mỗi điểm thời gian trông tương tự như sau: Mức cơ bản n = 11: [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]. Bài 1 n = 10 [167, 200, 45, 132,., 245, 199, 177, 134, 298, 111]. Bài 2 n = 9 [75, 43, 23, 98, 87,., 300,., 118, 202, 156]. Cấp 3 Bài n = 8 [23, 34, 98, 112,., 200,., 156, 54, 18 ,.]. Có bốn điểm tổng thời gian.
msturm17

Câu trả lời:


5

Tôi đã suy nghĩ lại vấn đề của bạn và tìm thấy thử nghiệm của Friedman, đây là phiên bản không tham số của ANOVA một chiều với các biện pháp lặp đi lặp lại .

Tôi hy vọng bạn có một số kỹ năng cơ bản với R.

# Creating a source data.frame
my.data<-data.frame(value=c(2,7,7,3,6,3,2,4,4,3,14,167,200,45,132,NA,
245,199,177,134,298,111,75,43,23,98,87,NA,300,NA,118,202,156,23,34,98,
112,NA,200,NA,156,54,18,NA),
post.no=rep(c("baseline","post1","post2","post3"), each=11),
ID=rep(c(1:11), times=4))

# you must install this library
library(pgirmess)

Thực hiện kiểm tra thử nghiệm của Friedman ...

friedman.test(my.data$value,my.data$post.no,my.data$ID)

    Friedman rank sum test

data:  my.data$value, my.data$post.no and my.data$ID
Friedman chi-squared = 14.6, df = 3, p-value = 0.002192

và sau đó tìm thấy giữa các nhóm sự khác biệt tồn tại bằng thử nghiệm hậu hoc không tham số . Ở đây bạn có tất cả các so sánh có thể.

friedmanmc(my.data$value,my.data$post.no,my.data$ID)
Multiple comparisons between groups after Friedman test 
p.value: 0.05 
Comparisons
               obs.dif critical.dif difference
baseline-post1      25     15.97544       TRUE
baseline-post2      21     15.97544       TRUE
baseline-post3      20     15.97544       TRUE
post1-post2          4     15.97544      FALSE
post1-post3          5     15.97544      FALSE
post2-post3          1     15.97544      FALSE

Như bạn chỉ có thể thấy đường cơ sở (thời điểm đầu tiên) là khác biệt về mặt thống kê so với những người khác.

Tôi hy vọng điều này sẽ giúp bạn.


1
Ladislav, đây là một câu trả lời tuyệt vời cho câu hỏi này. Nó là vô cùng kỹ lưỡng và đầy đủ. Vấn đề duy nhất tôi thấy là Kruskal-Wallis ANOVA cũng có một giả định về tính độc lập của các quan sát, sao cho có các đối tượng khác nhau ở mỗi cấp của biến độc lập, trong trường hợp này, chúng ta không có cùng một 11 bệnh nhân trên 4 điểm thời gian. Bạn có ý kiến ​​gì về vấn đề này hay có bất kỳ phương pháp nào khác để giải quyết vấn đề này không? Cám ơn rất nhiều!
Matt Reichenbach

Tôi đã xóa bình luận của tôi ở trên. Cuối cùng tôi đã tìm thấy thử nghiệm tốt hơn. Thưởng thức !
Ladislav Naďo

Đây không phải là câu hỏi ban đầu của tôi, @ msturm17, sẽ phải chấp nhận câu trả lời của bạn, mặc dù tôi đã đưa cho bạn tiền thưởng!
Matt Reichenbach

Cảm ơn bạn, Ladislav, đã dành thời gian để trả lời thấu đáo câu hỏi của tôi!
msturm17

2

Nếu bạn không biết phân phối các thay đổi riêng lẻ theo thời gian, bạn không thể ước chừng nó với phân phối giữa các khác biệt giữa bệnh nhân. Ví dụ: nếu bạn có 10 bệnh nhân có nồng độ sắt tương ứng (510,520, ..., 600) trước khi điều trị và (520,530, ..., 610) sau khi điều trị, Kruskal-Wallis ANOVA (hoặc bất kỳ thuật toán tương tự nào khác) sẽ yêu cầu rằng không có sự thay đổi đáng kể về mức độ sắt.

IMHO, không có nhóm kiểm soát, điều tốt nhất bạn có thể làm là đếm xem có bao nhiêu bệnh nhân tăng mức độ sắt và bao nhiêu giảm, và kiểm tra tầm quan trọng của việc này.

Điều đó nói rằng, nếu KW ANOVA cho bạn biết rằng có một mức độ sắt đáng kể, thì đó là (không có dương tính giả).


1
Yay không có dương tính giả! Haha, cảm ơn câu trả lời của bạn Làm thế nào để bạn đề nghị chúng tôi "kiểm tra tầm quan trọng của việc này" liên quan đến việc đếm xem có bao nhiêu bệnh nhân tăng mức độ sắt và bao nhiêu giảm nó? Cảm ơn!
Matt Reichenbach

2
mnp=2(m+n)k=0m(m+nk)

Cảm ơn bạn! Đây là một cách thú vị khác để xem xét câu hỏi của tôi và sẽ xem cách áp dụng cho dữ liệu của tôi.
msturm17
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.