Một câu hỏi hiệu quả hơn có thể là "tại sao nó không được sử dụng trong các số liệu thống kê cổ điển mà tôi đã học?"
Tùy thuộc vào cấp độ mà nó được dạy, nội dung khóa học (và thời gian có sẵn) mà sự lựa chọn có thể là do sự kết hợp của nhiều yếu tố khác nhau. Thông thường các chủ đề quan trọng bị bỏ qua một bên vì tài liệu khác phải được dạy vì lý do này hay lý do khác, với hy vọng rằng chúng có thể được đề cập trong các môn học sau này.
Trong một số giác quan ít nhất, khái niệm này đã được sử dụng từ lâu bởi nhiều người. Nó đã phổ biến hơn ở một số khu vực hơn những nơi khác. Nhiều sử dụng số liệu thống kê không có dự đoán hoặc lựa chọn mô hình như là một thành phần chính (hoặc trong một số trường hợp, thậm chí cả), và trong trường hợp đó, việc sử dụng các mẫu giữ có thể ít quan trọng hơn khi dự đoán là điểm chính. Có thể cho rằng, nó đã được sử dụng rộng rãi hơn ở giai đoạn sớm hơn trong một số ứng dụng có liên quan so với trước đây, nhưng đó không phải là điều tương tự như chưa biết.
Nếu bạn nhìn vào các khu vực tập trung vào dự đoán, khái niệm đánh giá mô hình bằng cách dự đoán dữ liệu bạn không sử dụng để ước tính mô hình của bạn chắc chắn xuất hiện (mặc dù không phải là phổ quát). Tôi chắc chắn đã làm điều đó với mô hình chuỗi thời gian tôi đã làm vào những năm 1980, ví dụ, trong đó hiệu suất dự đoán ngoài mẫu của dữ liệu gần đây nhất là đặc biệt quan trọng.
Khái niệm loại bỏ ít nhất một số dữ liệu đã được sử dụng trong hồi quy (ví dụ đã xóa, PRESS, jacknife, v.v.) và trong phân tích ngoại lệ, chẳng hạn.
Một số trong những ý tưởng dữ liệu trở lại một thỏa thuận tốt trước đó vẫn còn. Stone (1974) [1] đề cập đến các bài báo về xác nhận chéo (với từ trong tiêu đề) từ những năm 1950 và 60. Có lẽ thậm chí gần hơn với ý định của bạn, ông đề cập đến việc Simon (1971) sử dụng thuật ngữ "mẫu xây dựng" và "mẫu xác nhận" - nhưng cũng chỉ ra rằng "Larson (1931) đã sử dụng phân chia mẫu ngẫu nhiên trong bội số giáo dục nghiên cứu -regression ".
Các chủ đề như xác nhận chéo, và sử dụng số liệu thống kê dựa trên dự đoán, v.v., đã trở nên thường xuyên hơn trong tài liệu thống kê trong thập niên 70 và thập niên 80, nhưng nhiều ý tưởng cơ bản đã xuất hiện khá lâu sau đó.
[1]: Stone, M., (1974)
"Lựa chọn và đánh giá hợp lệ các dự đoán thống kê",
Tạp chí của Hiệp hội thống kê Hoàng gia. Dòng B (Phương pháp luận) , Tập. 36, số 2., trang 111-147