Câu hỏi được gắn thẻ «cross-validation»

Liên tục giữ lại các tập hợp con của dữ liệu trong quá trình điều chỉnh mô hình để định lượng hiệu suất mô hình trên các tập hợp dữ liệu bị giữ lại.









3
Lựa chọn tính năng và xác nhận chéo
Gần đây tôi đã đọc rất nhiều trên trang web này (@Aniko, @Dikran Marsupial, @Erik) và những nơi khác về vấn đề quá mức xảy ra với xác nhận chéo - (Smialowski et al 2010 Bioinformatics, Hastie, Các yếu tố của học thống kê). Gợi ý là mọi lựa chọn …



1
Làm cách nào để phân chia tập dữ liệu để xác thực chéo, đường cong học tập và đánh giá cuối cùng?
Một chiến lược thích hợp để chia dữ liệu là gì? Tôi yêu cầu phản hồi về phương pháp sau đây (không phải trên các thông số cá nhân như test_sizehay n_iter, nhưng nếu tôi sử dụng X, y, X_train, y_train, X_test, và y_testmột cách thích hợp và nếu chuỗi …


8
Làm cách nào tôi có thể giúp đảm bảo dữ liệu thử nghiệm không bị rò rỉ vào dữ liệu đào tạo?
Giả sử chúng ta có ai đó xây dựng một mô hình dự đoán, nhưng ai đó không nhất thiết phải thành thạo các nguyên tắc thống kê hoặc máy học phù hợp. Có thể chúng tôi đang giúp người đó khi họ đang học hoặc có thể người đó …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.