Xin hãy giúp tôi ở đây. Có lẽ trước khi cho tôi một câu trả lời, bạn có thể cần giúp tôi đặt câu hỏi. Tôi chưa bao giờ tìm hiểu về phân tích chuỗi thời gian và không biết đó có thực sự là thứ tôi cần không. Tôi chưa bao giờ tìm hiểu về thời gian trung bình trơn tru và không biết đó có thực sự là điều tôi cần không. Cơ sở thống kê của tôi: Tôi có 12 tín chỉ về thống kê sinh học (hồi quy tuyến tính đa biến, hồi quy logistic nhiều, phân tích tỷ lệ sống, anova đa yếu tố nhưng không bao giờ lặp lại các biện pháp anova).
Vì vậy, hãy nhìn vào kịch bản của tôi dưới đây. Các từ thông dụng tôi nên tìm kiếm là gì và bạn có thể đề xuất một tài nguyên để tìm hiểu những gì tôi cần học không?
Tôi muốn xem xét một số bộ dữ liệu khác nhau cho các mục đích hoàn toàn khác nhau nhưng phổ biến cho tất cả chúng là có ngày là một biến. Vì vậy, một vài ví dụ nảy ra trong đầu: năng suất lâm sàng theo thời gian (như trong bao nhiêu ca phẫu thuật hoặc bao nhiêu lần khám tại văn phòng) hoặc hóa đơn điện theo thời gian (như tiền được trả cho công ty điện mỗi tháng).
Đối với cả hai cách trên, cách làm gần như phổ biến là tạo một bảng tính tháng hoặc quý trong một cột và trong cột kia sẽ là một cái gì đó như thanh toán tiền điện hoặc số bệnh nhân nhìn thấy trong phòng khám. Tuy nhiên, đếm mỗi tháng dẫn đến rất nhiều tiếng ồn không có ý nghĩa. Chẳng hạn, nếu tôi thường thanh toán hóa đơn tiền điện vào ngày 28 hàng tháng nhưng trong một dịp tôi quên và vì vậy tôi chỉ trả 5 ngày sau vào ngày 3 của tháng tiếp theo, sau đó một tháng sẽ xuất hiện như thể không có chi phí và tháng tiếp theo sẽ hiển thị chi phí ginormous. Vì người ta có ngày thanh toán thực tế, tại sao người ta lại cố tình vứt bỏ dữ liệu rất chi tiết bằng cách đóng hộp vào chi phí theo tháng.
Tương tự như vậy nếu tôi ra khỏi thị trấn trong 6 ngày tại một hội nghị thì tháng đó sẽ có vẻ rất không hiệu quả và nếu 6 ngày đó rơi vào gần cuối tháng, tháng tiếp theo sẽ không bận rộn vì sẽ có cả một danh sách chờ đợi của những người muốn gặp tôi nhưng phải đợi đến khi tôi trở về.
Sau đó, tất nhiên có các biến thể theo mùa rõ ràng. Máy điều hòa sử dụng rất nhiều điện nên rõ ràng người ta phải điều chỉnh cho nắng nóng mùa hè. Hàng tỷ trẻ em được giới thiệu cho tôi về bệnh viêm tai giữa cấp tính tái phát vào mùa đông và hầu như không có trong mùa hè và đầu mùa thu. Không có đứa trẻ nào trong độ tuổi đi học được lên lịch để phẫu thuật tự chọn trong 6 tuần đầu tiên mà các trường trở lại sau kỳ nghỉ hè dài. Tính thời vụ chỉ là một biến độc lập ảnh hưởng đến biến phụ thuộc. Phải có các biến độc lập khác mà một số biến số có thể đoán được và các biến khác không được biết.
Cả một loạt các vấn đề khác nhau mọc lên khi xem xét tuyển sinh trong một nghiên cứu lâm sàng lâu đời.
Chi nhánh thống kê nào cho phép chúng ta xem xét điều này theo thời gian bằng cách chỉ nhìn vào các sự kiện và ngày thực tế của chúng nhưng không tạo ra các hộp nhân tạo (tháng / quý / năm) không thực sự tồn tại.
Tôi đã nghĩ đến việc làm cho số lượng trung bình có trọng số cho bất kỳ sự kiện nào. Ví dụ, số bệnh nhân được thấy trong tuần này bằng 0,5 * nr được thấy trong tuần này + 0,25 * nr được thấy vào tuần trước + 0,25 * nr được thấy vào tuần tới.
Tôi muốn tìm hiểu thêm về điều này. Những từ thông dụng nào tôi nên tìm kiếm?