Tôi cần triển khai một chương trình sẽ phân loại các bản ghi thành 2 loại (đúng / sai) dựa trên một số dữ liệu đào tạo và tôi đã tự hỏi nên xem xét thuật toán / phương pháp nào. Dường như có rất nhiều trong số chúng để lựa chọn - Mạng thần kinh nhân tạo, Thuật toán di truyền, Học máy, Tối ưu hóa Bayes, v.v., và tôi không chắc bắt đầu từ đâu. Vì vậy, câu hỏi của tôi là: Tôi nên chọn thuật toán học như thế nào cho vấn đề của mình?
Nếu điều này có ích, đây là vấn đề tôi cần giải quyết.
Dữ liệu đào tạo: Dữ liệu
đào tạo bao gồm nhiều hàng như thế này:
Precursor1, Precursor2, Boolean (true/false)
Việc chạy
tôi sẽ được cung cấp một loạt các tiền chất.
Sau đó,
- Tôi chọn một thuật toán A từ các thuật toán khác nhau (hoặc tự động tạo ra một thuật toán) và áp dụng nó cho mọi kết hợp có thể có của các tiền chất này và thu thập các "bản ghi" được phát ra. "Bản ghi" bao gồm một số cặp khóa-giá trị *.
Tôi áp dụng một số thuật toán tuyệt vời và phân loại các bản ghi này thành 2 loại (đúng / sai).
Tôi sẽ tạo một bảng có cùng định dạng với dữ liệu tàu:
Precursor1, Precursor2, Boolean
Và toàn bộ chương trình được tính dựa trên số lượng tôi đúng / sai.
*: "Bản ghi" sẽ trông như thế này (hy vọng điều này có ý nghĩa)
Record [1...*] Score
-Precursor1 -Key
-Precursor2 -Value
Chỉ có một số hữu hạn các Khóa có thể. Các bản ghi chứa tập hợp con khác nhau của các khóa này (một số bản ghi có key1, key2, key3 ... các bản ghi khác có key3, key4 ... vv).
Tôi thực sự cần 2 học tập. Một là cho bước 1. Tôi cần phải có một mô-đun nhìn vào các cặp Tiền thân, v.v. và quyết định áp dụng thuật toán nào để phát ra một bản ghi để so sánh. Một cách khác là cho bước 2. Tôi cần một mô-đun phân tích bộ sưu tập các bản ghi và phân loại chúng thành 2 loại (đúng / sai).
Cảm ơn bạn trước!