Câu hỏi được gắn thẻ «out-of-sample»

Đề cập đến việc thực hành đánh giá hiệu suất của mô hình trên một số tập dữ liệu "thử nghiệm" hoặc "giữ lại" hoặc "ngoài mẫu" không được sử dụng để xây dựng mô hình.

8
Làm cách nào tôi có thể giúp đảm bảo dữ liệu thử nghiệm không bị rò rỉ vào dữ liệu đào tạo?
Giả sử chúng ta có ai đó xây dựng một mô hình dự đoán, nhưng ai đó không nhất thiết phải thành thạo các nguyên tắc thống kê hoặc máy học phù hợp. Có thể chúng tôi đang giúp người đó khi họ đang học hoặc có thể người đó …




1
Bảng xếp hạng riêng của Kaggle có phải là một công cụ dự đoán tốt về hiệu suất vượt trội của mô hình chiến thắng không?
Mặc dù kết quả của bộ thử nghiệm riêng không thể được sử dụng để tinh chỉnh mô hình hơn nữa, nhưng không phải lựa chọn mô hình trong số lượng lớn các mô hình đang được thực hiện dựa trên kết quả của thử nghiệm riêng? Bạn sẽ không, …


3
Tại sao không phải là phương pháp nắm giữ (chia dữ liệu thành đào tạo và thử nghiệm) được sử dụng trong thống kê cổ điển?
Trong lớp học của tôi tiếp xúc với khai thác dữ liệu, phương pháp nắm giữ được giới thiệu như một cách đánh giá hiệu suất mô hình. Tuy nhiên, khi tôi học lớp đầu tiên về các mô hình tuyến tính, điều này không được giới thiệu như một …


4
Cách thích hợp hơn để tạo một tập hợp giữ: xóa một số đối tượng hoặc xóa một số quan sát khỏi từng đối tượng là gì?
Tôi có một bộ dữ liệu với 26 tính năng và 31000 hàng. Đây là bộ dữ liệu của 38 đối tượng. Đó là cho một hệ thống sinh trắc học. Vì vậy, tôi muốn có thể xác định đối tượng. Để có một bộ thử nghiệm, tôi biết tôi …





Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.