Trong bối cảnh của Machine Learning , tôi đã thấy thuật ngữ Ground Truth được sử dụng rất nhiều. Tôi đã tìm kiếm rất nhiều và tìm thấy định nghĩa sau trong Wikipedia :
Trong học máy, thuật ngữ "sự thật mặt đất" dùng để chỉ tính chính xác của phân loại tập huấn đối với các kỹ thuật học có giám sát. Điều này được sử dụng trong các mô hình thống kê để chứng minh hoặc bác bỏ các giả thuyết nghiên cứu. Thuật ngữ "mặt đất" dùng để chỉ quá trình thu thập dữ liệu mục tiêu (có thể chứng minh) thích hợp cho thử nghiệm này. So sánh với tiêu chuẩn vàng.
Lọc thư rác Bayes là một ví dụ phổ biến của việc học có giám sát. Trong hệ thống này, thuật toán được dạy thủ công sự khác biệt giữa thư rác và không thư rác. Điều này phụ thuộc vào sự thật cơ bản của các thông điệp được sử dụng để huấn luyện thuật toán - sự không chính xác trong sự thật cơ bản sẽ tương quan với sự không chính xác trong kết quả của thư rác / không phải thư rác.
Vấn đề là tôi thực sự không thể hiểu ý nghĩa của nó. Đó có phải là nhãn được sử dụng cho từng đối tượng dữ liệu hoặc hàm mục tiêu cung cấp nhãn cho từng đối tượng dữ liệu hoặc có thể là thứ gì khác không?