Trong học máy, người ta nói về chức năng khách quan, chức năng chi phí, chức năng mất mát. Có phải họ chỉ là tên khác nhau của cùng một điều? Khi nào sử dụng chúng? Nếu chúng không phải luôn luôn đề cập đến cùng một điều, sự khác biệt là gì?
Trong học máy, người ta nói về chức năng khách quan, chức năng chi phí, chức năng mất mát. Có phải họ chỉ là tên khác nhau của cùng một điều? Khi nào sử dụng chúng? Nếu chúng không phải luôn luôn đề cập đến cùng một điều, sự khác biệt là gì?
Câu trả lời:
Đây không phải là những điều khoản rất nghiêm ngặt và chúng có liên quan cao. Tuy nhiên:
Câu chuyện dài, tôi sẽ nói rằng:
Hàm mất mát là một phần của hàm chi phí là một loại hàm mục tiêu.
Theo giáo sư Andrew Ng (xem slide trên trang 11),
Hàm h (X) đại diện cho giả thuyết của bạn. Đối với các tham số phù hợp cố định theta, đó là một chức năng của các tính năng X. Tôi muốn nói điều này cũng có thể được gọi là Chức năng Mục tiêu.
Hàm chi phí J là một hàm của các tham số phù hợp theta. J = J (theta).
Theo sách giáo khoa "Các yếu tố của học thống kê" của Hastie và cộng sự , theo tr.37:
"Chúng tôi tìm kiếm một hàm f (X) để dự đoán các giá trị Y đã cho của đầu vào X." [...] Hàm mất L (Y, f (X)) là "hàm xử phạt các lỗi trong dự đoán",
Vì vậy, có vẻ như "hàm mất" là một thuật ngữ chung hơn một chút so với "hàm chi phí". Nếu bạn tìm kiếm "mất" trong bản PDF đó, tôi nghĩ rằng họ sử dụng "hàm chi phí" và "hàm mất" một cách đồng nghĩa.
Thật vậy, p. 502
"Tình huống [trong Phân cụm] có phần giống với đặc điểm của hàm mất hoặc chi phí trong các vấn đề dự đoán (học có giám sát)".
Có thể các thuật ngữ này tồn tại bởi vì chúng phát triển độc lập trong các cộng đồng học thuật khác nhau. "Hàm mục tiêu" là một thuật ngữ cũ được sử dụng trong Nghiên cứu hoạt động và Toán kỹ thuật. "Chức năng mất" có thể được sử dụng nhiều hơn giữa các nhà thống kê. Nhưng tôi đang suy đoán ở đây.
Theo lời của Andrew NG-
"Cuối cùng, hàm mất mát được xác định theo một ví dụ đào tạo duy nhất. Nó đo lường mức độ bạn đang làm trong một ví dụ đào tạo duy nhất. Bây giờ tôi sẽ định nghĩa một thứ gọi là hàm chi phí, đo lường mức độ tốt của bạn thực hiện toàn bộ tập huấn luyện. Vì vậy, hàm chi phí J được áp dụng cho các tham số W và B của bạn sẽ là trung bình với một trong số m của tổng hàm mất áp dụng cho từng ví dụ đào tạo và lần lượt. "
Từ phần 4.3 trong "Học sâu" - Ian Goodfellow, Yoshua Bengio, Aaron Courville http://www.deeplearningbook.org/
"Hàm chúng ta muốn tối thiểu hóa hoặc tối đa hóa được gọi là hàm mục tiêu hoặc tiêu chí. Khi chúng ta thu nhỏ nó, chúng ta cũng có thể gọi nó là hàm chi phí, hàm mất hoặc hàm lỗi. Trong cuốn sách này, chúng ta sử dụng các thuật ngữ này thay thế cho nhau, mặc dù một số ấn phẩm học máy có ý nghĩa đặc biệt đối với một số thuật ngữ này. "
Trong cuốn sách này, ít nhất, mất mát và chi phí là như nhau.
Để cho bạn một câu trả lời ngắn, theo tôi chúng là đồng nghĩa. Tuy nhiên, hàm chi phí được sử dụng nhiều hơn trong bài toán tối ưu hóa và hàm mất mát được sử dụng trong ước tính tham số.
Các thuật ngữ chi phí và chức năng mất đồng nghĩa với một số người cũng gọi đó là chức năng lỗi. Kịch bản tổng quát hơn là xác định hàm mục tiêu trước tiên mà chúng ta muốn tối ưu hóa. Hàm mục tiêu này có thể là
Thực tế là đơn giản Nếu bạn có m dữ liệu đào tạo như thế này (x (1), y (1)), (x (2), y (2)) ,. . . (x (m), y (m)) Chúng tôi sử dụng hàm mất L (ycap, y) để tìm mất giữa ycap và y của một tập huấn luyện duy nhất Nếu chúng tôi muốn tìm mất giữa ycap và y của toàn bộ tập huấn luyện, chúng tôi sử dụng chức năng ước lượng.
Lưu ý: - ycap có nghĩa là đầu ra từ mô hình của chúng tôi Và y có nghĩa là đầu ra dự kiến
Lưu ý: - Tín dụng đi Andrew ng Tài nguyên: mạng lưới thần kinh coursera và học tập sâu
Hàm mất mát tính toán sai số cho một ví dụ đào tạo, trong khi hàm chi phí là trung bình của các hàm mất mát của toàn bộ tập huấn luyện.