Tôi đã được cung cấp dữ liệu để phân tích cho một nghiên cứu xem xét tác động của điều trị đối với nồng độ sắt ở bốn thời điểm khác nhau (trước khi điều trị, kết thúc điều trị trong ngày, 4 tuần sau điều trị và 2-4 tháng sau khi điều trị). Không có nhóm kiểm soát. Họ đang tìm kiếm để xem liệu có sự gia tăng đáng kể về mức độ sắt ở mỗi trong 3 điểm thời gian sau điều trị đến mức trước khi điều trị (đường cơ sở). Mười một bệnh nhân có mức cơ bản nhưng chỉ có 8 bệnh nhân có dữ liệu hoàn chỉnh cho cả 4 điểm thời gian ( = 11, 10, 9 và 8 cho mỗi điểm thời gian). Không chỉ đo nồng độ sắt, mà hai biện pháp phòng thí nghiệm khác được thực hiện tại mỗi thời điểm được so sánh với đường cơ sở.
Tôi có một vài câu hỏi như làm thế nào để phân tích điều này. Trước tiên tôi nghĩ rằng một ANOVA RM sẽ phù hợp để phân tích dữ liệu này, nhưng tôi lo ngại về kích thước mẫu nhỏ, mất dữ liệu và phân phối dữ liệu không bình thường. Sau đó, tôi đã xem xét so sánh từng biện pháp sau điều trị với đường cơ sở bằng cách sử dụng các xét nghiệm xếp hạng có chữ ký của Wilcoxon, nhưng sau đó tôi gặp phải vấn đề so sánh nhiều. Tuy nhiên, tôi đã đọc một số tài liệu cho thấy các tuyến dưới cần chạy nhiều so sánh. Vì vậy, về tổng thể, tôi đang xử lý các cỡ mẫu nhỏ, dữ liệu không đầy đủ và nhiều so sánh (và có cần thiết hay không).
Tôi hy vọng tất cả điều này có ý nghĩa. Tôi mới tham gia CrossValidated và được một đồng nghiệp hướng dẫn ở đây như một nơi để học hỏi từ các nhà thống kê có kinh nghiệm, vì vậy tôi đánh giá cao bất kỳ lời khuyên nào! Cảm ơn!
Đã chỉnh sửa để thêm dữ liệu thô từ nhận xét:
Có bốn điểm tổng thời gian và biến kết quả là liên tục. Ví dụ: kết quả tại mỗi thời điểm trông tương tự như sau:
Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]
1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
3rd Post (n=8): [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]