Cấu trúc của câu hỏi này như sau: ban đầu, tôi cung cấp khái niệm về học tập hòa đồng , hơn nữa tôi cung cấp một danh sách các nhiệm vụ nhận dạng mẫu , sau đó tôi đưa ra các ví dụ về thuật toán học tập đồng bộ và cuối cùng, giới thiệu câu hỏi của tôi. Những người không cần tất cả các thông tin bổ sung có thể chỉ cần nhìn vào tiêu đề và đi thẳng vào câu hỏi của tôi.
Học tập là gì?
Theo bài viết trên Wikipedia :
Trong thống kê và học máy, các phương pháp tập hợp sử dụng nhiều thuật toán học tập để có được hiệu suất dự đoán tốt hơn so với bất kỳ thuật toán học cấu thành nào. Không giống như một tập hợp thống kê trong cơ học thống kê, thường là vô hạn, một tập hợp máy học chỉ đề cập đến một tập hợp hữu hạn cụ thể của các mô hình thay thế, nhưng thường cho phép tồn tại cấu trúc linh hoạt hơn nhiều trong số các phương án đó.
Ví dụ về các nhiệm vụ nhận dạng mẫu:
- Nhận dạng ký tự quang học
- Nhận dạng mã vạch
- Nhận dạng biển số
- Phát hiện khuôn mặt
- Nhận dạng giọng nói
- Nhận dạng hình ảnh
- Phân loại tài liệu
Ví dụ về các thuật toán học tập đồng bộ:
Các thuật toán học tập đồng bộ sau đây được sử dụng cho các nhiệm vụ PR (theo Wiki):
Các thuật toán học tập đồng bộ (các thuật toán meta được giám sát để kết hợp nhiều thuật toán học tập với nhau):
Boosting (mộtthuật toánhọc máy đồng bộvới thuật toán metachủ yếu để giảmsự thiên vị, và cả sự khác biệt tronghọc tập có giám sátvà một nhóm các thuật toán học máy chuyển đổi những người học yếu thành những người mạnh mẽ)
Bootstrap tổng hợp (" đóng bao ") (một thuật toán meta tập hợp máy học được thiết kế để cải thiện tính ổn định và độ chính xác của các thuật toán học máy được sử dụng trongphân loạivàhồi quythống kê).
Tính trung bình của đồng bộ (quá trình tạo nhiều mô hình và kết hợp chúng để tạo ra một đầu ra mong muốn, trái ngược với việc chỉ tạo một mô hình. Thường thì một mô hình hoạt động tốt hơn bất kỳ mô hình riêng lẻ nào, vì các lỗi khác nhau của các mô hình "trung bình". )
- Hỗn hợp các chuyên gia, hỗn hợp phân cấp của các chuyên gia
Thực hiện khác nhau
- Tập hợp các mạng nơ-ron (một tập hợp các mô hình mạng nơ-ron đưa ra quyết định bằng cách lấy trung bình các kết quả của các mô hình riêng lẻ).
- Rừng ngẫu nhiên (một phương pháp học tập đồng bộ để phân loại, hồi quy và các nhiệm vụ khác, hoạt động bằng cách xây dựng vô sốcây quyết địnhtrong thời gian đào tạo và đưa ra lớp làchế độcủa các lớp (phân loại) hoặc dự đoán (hồi quy) của cá nhân cây).
- AdaBoost (đầu ra của các thuật toán học tập khác ('người học yếu') được kết hợp thành một tổng có trọng số đại diện cho đầu ra cuối cùng của trình phân loại được tăng cường).
Ngoài ra:
- Các phương thức sử dụng một mạng thần kinh để kết hợp các phân loại khác nhau
- Phương pháp năng lực khu vực
Câu hỏi của tôi
Các thuật toán học tập đồng bộ nào được coi là hiện đại và thực sự được sử dụng trong thực tế (để nhận diện khuôn mặt, nhận dạng biển số xe, nhận dạng ký tự quang học, v.v.) của các doanh nghiệp và tổ chức? Sử dụng các thuật toán học tập đồng bộ được cho là để tăng độ chính xác nhận dạng và dẫn đến hiệu quả tính toán tốt hơn. Nhưng, liệu các vấn đề có đứng theo cách này trong thực tế?
Phương pháp tập hợp nào, có khả năng, có thể hiển thị độ chính xác và hiệu suất phân loại tốt hơn trong các tác vụ nhận dạng mẫu? Có lẽ, một số phương pháp đã lỗi thời hoặc đã được chứng minh là không hiệu quả. Hiện tại cũng có thể các phương thức tập hợp có xu hướng không được sử dụng nữa trên sức mạnh của một số thuật toán mới. Những người có kinh nghiệm trong lĩnh vực hoặc có đủ kiến thức trong lĩnh vực này, bạn có thể giúp làm rõ các vấn đề?