Các bộ xác nhận lớn hơn cho các ước tính chính xác hơn về hiệu suất ngoài mẫu. Nhưng như bạn đã nhận thấy, tại một số điểm, ước tính đó có thể chính xác như bạn cần và bạn có thể đưa ra một số dự đoán sơ bộ về kích thước mẫu xác thực bạn cần để đạt đến điểm đó.
Để có độ chính xác phân loại chính xác / không chính xác, bạn có thể tính sai số chuẩn của ước tính là (độ lệch chuẩn của biến Bernouilli), trong đó là xác suất của phân loại chính xác và là kích thước của bộ xác nhận. Tất nhiên bạn không biết , nhưng bạn có thể có một số ý tưởng về phạm vi của nó. Ví dụ: giả sử bạn mong đợi một độ chính xác giữa 60-80%, và bạn muốn ước tính của bạn phải có một sai số chuẩn nhỏ hơn 0,1%:
Làm thế nào lớn nên (kích thước của bộ xác nhận) được? Với chúng tôi nhận được:
Đối vớip(1−p)/n−−−−−−−−−√pnp
p(1−p)/n−−−−−−−−−√<0.001
np=0.6n>0.6−0.620.0012=240,000
p=0.8chúng tôi nhận được:
Vì vậy, điều này cho chúng tôi biết bạn có thể thoát khỏi việc sử dụng ít hơn 5% trong số 5 triệu mẫu dữ liệu của mình để xác thực. Tỷ lệ phần trăm này giảm xuống nếu bạn mong đợi hiệu suất cao hơn hoặc đặc biệt là nếu bạn hài lòng với lỗi tiêu chuẩn thấp hơn của ước tính hiệu suất ngoài mẫu (ví dụ: với và với se <1%, bạn chỉ cần 2100 mẫu xác thực hoặc ít hơn một phần hai phần trăm dữ liệu của bạn).
n>0.8−0.820.0012=160,000
p=0.7
Các tính toán này cũng cho thấy điểm mà Tim đưa ra trong câu trả lời của anh ấy, rằng độ chính xác của các ước tính của bạn phụ thuộc vào kích thước tuyệt đối của bộ xác thực của bạn (tức là trên ), thay vì kích thước của nó so với tập huấn luyện.n
(Ngoài ra tôi có thể thêm rằng tôi giả sử lấy mẫu đại diện ở đây. Nếu dữ liệu của bạn rất không đồng nhất, bạn có thể cần sử dụng các bộ xác thực lớn hơn chỉ để đảm bảo rằng dữ liệu xác thực bao gồm tất cả các điều kiện giống như dữ liệu kiểm tra và thử nghiệm của bạn. )