Tôi đã bắt gặp một tin đồn rằng một số nghiên cứu cho thấy rằng hiệu suất của các mô hình dự đoán phụ thuộc nhiều vào chuyên môn của nhà phân tích dữ liệu với phương pháp được chọn hơn là lựa chọn phương pháp.
Nói cách khác, tuyên bố là điều quan trọng hơn là nhà phân tích dữ liệu quen thuộc với phương pháp được chọn hơn là phương pháp "phù hợp" có vẻ như thế nào đối với vấn đề từ quan điểm lý thuyết hơn.
Điều này đã được đề cập trong bối cảnh hóa học, bao gồm các vấn đề điển hình của nhiều biến thể (100 - 1000), nhiều cộng tuyến và tất nhiên, quá ít mẫu. Dự đoán có thể đã được phân loại hoặc hồi quy.
Kinh nghiệm cá nhân của tôi cho thấy rằng điều này là hợp lý , nhưng một nghiên cứu đã được đề cập (tôi đã hỏi người đã đề cập rằng qua email sau khi tìm kiếm nhanh nhưng không thành công, nhưng không bao giờ nhận được bất kỳ câu trả lời nào). Tuy nhiên, cũng với một tìm kiếm phức tạp hơn, tôi không thể theo dõi bất kỳ giấy tờ nào.
Có ai biết những phát hiện như vậy? Nếu không, trải nghiệm cá nhân của Big Guys ở đây nói lên điều gì?