Nói một cách dễ hiểu: Tôi có mô hình hồi quy bội hoặc ANOVA nhưng biến trả lời cho mỗi cá nhân là hàm số theo thời gian.
- Làm thế nào tôi có thể biết biến số nào ở phía bên phải chịu trách nhiệm cho sự khác biệt đáng kể về hình dạng hoặc độ lệch dọc của các đường cong?
- Đây có phải là một vấn đề chuỗi thời gian, một vấn đề đo lường lặp đi lặp lại, hoặc một cái gì đó hoàn toàn khác?
- Các thực tiễn tốt nhất để phân tích dữ liệu đó (tốt nhất là trong
R
, nhưng tôi sẵn sàng sử dụng phần mềm khác)?
Nói một cách chính xác hơn: giả sử tôi có một mô hình nhưng thực sự là một chuỗi các điểm dữ liệu được thu thập từ cùng một cá nhân tại nhiều điểm thời gian , được ghi lại dưới dạng một biến số. Vẽ dữ liệu cho thấy rằng đối với mỗi cá nhân là một hàm bậc hai hoặc theo chu kỳ của thời gian mà phần bù, hình dạng hoặc tần số theo chiều dọc (trong trường hợp theo chu kỳ) có thể phụ thuộc đáng kể vào các hiệp phương sai. Các đồng biến không thay đổi theo thời gian - tức là, một cá nhân có trọng lượng cơ thể hoặc nhóm điều trị không đổi trong suốt thời gian thu thập dữ liệu.
Cho đến nay tôi đã thử các R
cách tiếp cận sau :
Manova
Anova(lm(YT~A*B,mydata),idata=data.frame(TIME=factor(c(1:10))),idesign=~TIME);
... trong đó
YT
một ma trận có các cột là các điểm thời gian, 10 trong số chúng trong ví dụ này, nhưng nhiều hơn trong dữ liệu thực.Vấn đề: điều này coi thời gian là một yếu tố, nhưng thời điểm không khớp chính xác với từng cá nhân. Hơn nữa, có rất nhiều trong số chúng liên quan đến kích thước mẫu để mô hình được bão hòa. Có vẻ như hình dạng của biến trả lời theo thời gian bị bỏ qua.
Mô hình hỗn hợp (như trong Pinheiro và Bates, Mô hình hiệu ứng hỗn hợp trong S và S-Plus )
lme(fixed=Y~ A*B*TIME + sin(2*pi*TIME) + cos(2*pi*TIME), data=mydata, random=~(TIME + sin(2*pi*TIME) + cos(2*pi*TIME))|ID), method='ML')
... Đâu
ID
là yếu tố nhóm dữ liệu theo từng cá nhân. Trong ví dụ này, phản ứng theo chu kỳ theo thời gian, nhưng thay vào đó có thể có các thuật ngữ bậc hai hoặc các chức năng khác của thời gian.Vấn đề: Tôi không chắc chắn liệu mỗi thuật ngữ thời gian có cần thiết hay không (đặc biệt đối với các thuật ngữ bậc hai) và những thuật ngữ nào bị ảnh hưởng bởi hiệp phương sai nào.
- Là
stepAIC()
một phương pháp tốt để lựa chọn chúng? - Nếu nó loại bỏ một thuật ngữ phụ thuộc thời gian, nó cũng sẽ loại bỏ nó khỏi
random
đối số? - Điều gì sẽ xảy ra nếu tôi cũng sử dụng hàm tự tương quan (chẳng hạn như
corEXP()
) có công thức trongcorrelation
đối số-- tôi có nên tạo công thức đó chocorEXP()
giống như hàm trongrandom
hay chỉ~1|ID
? - Các
nlme
gói hiếm khi được đề cập đến trong bối cảnh của chuỗi thời gian bên ngoài Pinheiro và Bates ... là nó không được coi là rất thích hợp cho vấn đề này?
- Là
Lắp mô hình bậc hai hoặc lượng giác cho từng cá nhân, sau đó sử dụng từng hệ số làm biến trả lời cho hồi quy bội hoặc ANOVA.
Vấn đề: Cần so sánh nhiều hiệu chỉnh. Không thể nghĩ ra bất kỳ vấn đề nào khác khiến tôi nghi ngờ rằng tôi đang xem xét một cái gì đó.
Như đã đề xuất trước đây trên trang web này ( Thuật ngữ cho hồi quy chuỗi thời gian có nhiều hơn một yếu tố dự báo là gì? ), Có ARIMAX và mô hình hồi quy động / mô hình hồi quy động .
Vấn đề: Các mô hình dựa trên ARMA giả định thời gian rời rạc, phải không? Đối với hồi quy động, tôi đã nghe về nó lần đầu tiên vào ngày hôm nay, nhưng trước khi tôi đi sâu vào một phương pháp mới khác có thể không được sử dụng, tôi nghĩ rằng sẽ rất khôn ngoan khi hỏi những người đã làm điều này trước đây để được tư vấn.