Tôi đã tiến hành đánh giá dựa trên máy tính về các phương pháp khác nhau để phù hợp với một loại mô hình cụ thể được sử dụng trong khoa học palaeo. Tôi đã có một tập huấn luyện lớn và vì vậy tôi ngẫu nhiên (lấy mẫu ngẫu nhiên phân tầng) để dành một bộ kiểm tra. Tôi đã trang bị các phương pháp khác nhau cho các mẫu tập huấn luyện và sử dụng các mô hình kết quả tôi dự đoán đáp ứng cho các mẫu của bộ thử nghiệm và tính toán RMSEP trên các mẫu trong bộ thử nghiệm. Đây là một lần chạy duy nhất .m
Sau đó, tôi đã lặp lại quá trình này một số lượng lớn, mỗi lần tôi chọn một tập huấn luyện khác nhau bằng cách lấy mẫu ngẫu nhiên một bộ thử nghiệm mới.
Đã làm điều này tôi muốn điều tra xem liệu bất kỳ phương pháp có hiệu suất RMSEP tốt hơn hay kém hơn. Tôi cũng muốn làm nhiều so sánh về các phương pháp cặp đôi.
Cách tiếp cận của tôi là phù hợp với mô hình hiệu ứng hỗn hợp tuyến tính (LME), với một hiệu ứng ngẫu nhiên duy nhất cho Run . Tôi đã sử dụng lmer()
từ gói lme4 để phù hợp với mô hình và các chức năng của tôi từ gói multcomp để thực hiện nhiều so sánh. Mô hình của tôi về cơ bản là
lmer(RMSEP ~ method + (1 | Run), data = FOO)
trong đó method
một yếu tố chỉ ra phương pháp nào đã được sử dụng để tạo dự đoán mô hình cho tập kiểm tra và Run
là chỉ báo cho mỗi lần chạy "thử nghiệm" cụ thể của tôi.
Câu hỏi của tôi liên quan đến phần còn lại của LME. Với hiệu ứng ngẫu nhiên duy nhất cho Run Tôi giả sử rằng các giá trị RMSEP cho lần chạy đó có tương quan ở một mức độ nào đó nhưng không tương quan giữa các lần chạy, trên cơ sở tương quan cảm ứng của các hiệu ứng ngẫu nhiên.
Là giả định độc lập giữa các lần chạy hợp lệ? Nếu không có cách nào để giải thích điều này trong mô hình LME hay tôi nên tìm cách sử dụng một loại phân tích thống kê khác để trả lời câu hỏi của mình?