Tôi có một bộ dữ liệu chứa ~ 7.500 xét nghiệm máu từ ~ 2.500 cá nhân. Tôi đang cố gắng tìm hiểu xem sự thay đổi trong các xét nghiệm máu tăng hay giảm theo thời gian giữa hai lần xét nghiệm. Ví dụ: Tôi lấy máu của bạn để kiểm tra cơ bản, sau đó ngay lập tức vẽ mẫu thứ hai. Sáu tháng sau, tôi vẽ một mẫu khác. Người ta có thể mong đợi sự khác biệt giữa đường cơ sở và thử nghiệm lặp lại ngay lập tức nhỏ hơn chênh lệch giữa đường cơ sở và thử nghiệm sáu tháng.
Mỗi điểm trên cốt truyện dưới đây phản ánh sự khác biệt giữa hai bài kiểm tra. X là số ngày giữa hai lần kiểm tra; Y là kích thước của sự khác biệt giữa hai thử nghiệm. Như bạn có thể thấy, các bài kiểm tra không được phân phối đồng đều dọc theo X - nghiên cứu không được thiết kế để giải quyết câu hỏi này, thực sự. Do các điểm được xếp chồng lên nhau ở mức trung bình, tôi đã bao gồm các dòng lượng tử 95% (màu xanh) và 99% (màu đỏ), dựa trên các cửa sổ 28 ngày. Chúng rõ ràng được kéo xung quanh bởi các điểm cực đoan hơn, nhưng bạn có ý tưởng.
văn bản thay thế http://a.imageshack.us/img175/6595/diffsbyday.png
Có vẻ như tôi là sự thay đổi khá ổn định. Nếu bất cứ điều gì, nó cao hơn khi thử nghiệm được lặp lại trong một khoảng thời gian ngắn - điều đó cực kỳ phản trực giác. Làm thế nào tôi có thể giải quyết vấn đề này một cách có hệ thống, tính toán cho n khác nhau tại mỗi thời điểm (và một số giai đoạn không có bài kiểm tra nào)? Ý tưởng của bạn được đánh giá rất cao.
Chỉ để tham khảo, đây là phân phối số ngày giữa kiểm tra và kiểm tra lại:
văn bản thay thế http://a.imageshack.us/img697/6572/testsateachtimepoint.png