Tôi đã có câu hỏi tương tự khi đọc các bài báo từ người khác nộp. Và đã hỏi rất nhiều câu hỏi liên quan đến vấn đề này, chẳng hạn như câu hỏi này trong cộng đồng Khai thác dữ liệu giáo dục:
Tại sao sử dụng tổn thất bình phương cho xác suất thay vì mất logistic?
Ở đây tôi sẽ trình bày rất nhiều ý kiến cá nhân.
Tôi cảm thấy chức năng mất không quá quan trọng trong nhiều trường hợp sử dụng thực tế. Một số nhà nghiên cứu có thể biết nhiều hơn về mất bình phương và xây dựng hệ thống của nó, nó hoạt động vẫn hoạt động và giải quyết các vấn đề trong thế giới thực. Các nhà nghiên cứu có thể không bao giờ biết mất logistic hoặc mất bản lề, và muốn thử nó. Hơn nữa, họ có thể không quan tâm để tìm ra mô hình toán học tối ưu, nhưng muốn giải quyết các vấn đề thực sự mà không ai cố gắng giải quyết trước đây.
Đây là một ví dụ khác: nếu bạn kiểm tra câu trả lời này cho câu hỏi của tôi, tất cả chúng đều giống nhau. Các tác động của việc chọn các hàm mất khác nhau trong phân loại để mất xấp xỉ 0-1
Thêm suy nghĩ: một nghiên cứu về máy học có thể dành nhiều thời gian cho việc chọn mô hình nào và cách tối ưu hóa mô hình. Điều này là do một nhà nghiên cứu máy học có thể không có khả năng thu thập thêm dữ liệu / nhận được nhiều biện pháp hơn. Và công việc của một nhà nghiên cứu máy học là làm toán tốt hơn, không giải quyết vấn đề thế giới thực cụ thể tốt hơn.
Mặt khác, trong thế giới thực, nếu dữ liệu tốt hơn, nó sẽ đánh bại mọi thứ. Vì vậy, lựa chọn mạng lưới thần kinh hoặc rừng ngẫu nhiên có thể không quá quan trọng. Tất cả các mô hình này tương tự như một người muốn sử dụng máy học như một công cụ để giải quyết các vấn đề trong thế giới thực. Một người không quan tâm đến việc phát triển toán học hoặc công cụ có thể dành nhiều thời gian hơn cho việc sử dụng kiến thức tên miền cụ thể để làm cho hệ thống tốt hơn.
Như tôi đã đề cập trong bình luận. Và nếu một người cẩu thả với toán học, anh ấy / cô ấy vẫn có thể xây dựng một cái gì đó hoạt động.