Ước tính thay đổi theo thời gian

Tôi có một bộ dữ liệu chứa ~ 7.500 xét nghiệm máu từ ~ 2.500 cá nhân. Tôi đang cố gắng tìm hiểu xem sự thay đổi trong các xét nghiệm máu tăng hay giảm theo thời gian giữa hai lần xét nghiệm. Ví dụ: Tôi lấy máu của bạn để kiểm tra cơ bản, sau đó ngay lập tức vẽ mẫu thứ hai. Sáu tháng sau, tôi vẽ một mẫu khác. Người ta có thể mong đợi sự khác biệt giữa đường cơ sở và thử nghiệm lặp lại ngay lập tức nhỏ hơn chênh lệch giữa đường cơ sở và thử nghiệm sáu tháng.

Mỗi điểm trên cốt truyện dưới đây phản ánh sự khác biệt giữa hai bài kiểm tra. X là số ngày giữa hai lần kiểm tra; Y là kích thước của sự khác biệt giữa hai thử nghiệm. Như bạn có thể thấy, các bài kiểm tra không được phân phối đồng đều dọc theo X - nghiên cứu không được thiết kế để giải quyết câu hỏi này, thực sự. Do các điểm được xếp chồng lên nhau ở mức trung bình, tôi đã bao gồm các dòng lượng tử 95% (màu xanh) và 99% (màu đỏ), dựa trên các cửa sổ 28 ngày. Chúng rõ ràng được kéo xung quanh bởi các điểm cực đoan hơn, nhưng bạn có ý tưởng.

văn bản thay thế http://a.imageshack.us/img175/6595/diffsbyday.png

Có vẻ như tôi là sự thay đổi khá ổn định. Nếu bất cứ điều gì, nó cao hơn khi thử nghiệm được lặp lại trong một khoảng thời gian ngắn - điều đó cực kỳ phản trực giác. Làm thế nào tôi có thể giải quyết vấn đề này một cách có hệ thống, tính toán cho n khác nhau tại mỗi thời điểm (và một số giai đoạn không có bài kiểm tra nào)? Ý tưởng của bạn được đánh giá rất cao.

Chỉ để tham khảo, đây là phân phối số ngày giữa kiểm tra và kiểm tra lại:

văn bản thay thế http://a.imageshack.us/img697/6572/testsateachtimepoint.png

repeated-measures variability

— Matt Parker
nguồn

+1 cho trường hợp thực tế thú vị! bạn có thể giúp chúng tôi hiểu xét nghiệm máu là gì? (bạn tính toán như thế nào)

— robin girard

Có một bài viết về LFT (xét nghiệm chức năng gan) và cách nó dường như thay đổi theo chu kỳ (tính theo tháng). Tôi nghĩ rằng đó là trong Biên niên sử của Nội khoa.

— Minh K

Chắc chắn - một thời gian ngắn, đó là một thử nghiệm cho nhiễm trùng lao tiềm ẩn. Máu được rút từ bệnh nhân thành ba ống: một ống không có kháng nguyên, một ống đã chọn kháng nguyên lao và một ống có mitogen. Sau đó, chúng tôi so sánh lượng phản ứng miễn dịch trong ống không có kháng nguyên với người bị lao - nếu họ có sự tăng cường mạnh mẽ của phản ứng trong ống TB, họ có thể bị lao tiềm ẩn. (Ống mitogen đóng vai trò kiểm tra để đảm bảo rằng người đó có khả năng tạo ra phản ứng miễn dịch hoàn toàn - hầu hết mọi người đều có phản ứng rất mạnh với nó)

— Matt Parker

Từ mô tả của bạn, tôi không thể thấy bất kỳ lý do nào để phân biệt "thử nghiệm cơ bản" với "mẫu thứ hai" được rút ra ngay lập tức. Chúng chỉ đơn giản là 2 phép đo cơ sở và phương sai (tại đường cơ sở) có thể được tính toán trên cơ sở đó. Sẽ tốt hơn là vẽ đồ thị trung bình của hai phép đo cơ sở so với mẫu "sáu tháng" thứ ba.

Vấn đề là với mẫu 6 tháng. Vì chỉ có một mẫu được lấy tại thời điểm này, không có cách nào để ước tính "độ biến thiên" tại thời điểm này, hoặc thay vào đó là tách biệt biến thể lấy mẫu với thay đổi theo chiều dọc (thực) trong cách đọc TB.

Nếu chúng tôi coi đây là vấn đề phân tích dữ liệu theo chiều dọc, có lẽ chúng tôi sẽ chọn phương thức chặn ngẫu nhiên (TB cơ sở) và độ dốc ngẫu nhiên (để phù hợp với TB 6 tháng). Độ biến thiên lấy mẫu sẽ được ước tính từ hai phép đo cơ sở và độ dốc từ phép đo 6 tháng thứ ba. Chúng tôi không thể ước tính mức độ biến động sau 6 tháng mà không có giả định phân phối mạnh mẽ về số tiền trong sáu tháng đó, chẳng hạn như giả sử không có thay đổi.

— Thylacoleo
nguồn