Câu hỏi tuyệt vời. Đây là một vấn đề phức tạp và cách tiếp cận bạn sử dụng sẽ phụ thuộc vào mức độ phức tạp của vấn đề. Bất kỳ vấn đề nào chúng tôi cố gắng giải quyết sẽ có một mức độ phức tạp liên quan đến nó, được định nghĩa thông tục là "số lượng những thứ tương tác hoặc những thứ cần được xem xét." Trong học tập có giám sát và không giám sát, chúng tôi chỉ định chính xác số lượng điều cần xem xét.
Ví dụ, trong hồi quy tuyến tính đa biến, chúng tôi cho thuật toán học biết có bao nhiêu tính năng cần xem xét khi khớp một mô hình (số lượng cột trong tập huấn luyện của bạn). Tình trạng tương tự cũng xảy ra đối với việc học tập không giám sát; một tập huấn luyện được xác định rõ ràng với một số tính năng rõ ràng được sử dụng (trong trường hợp này không có nhãn).
Những gì bạn đang phải đối mặt là một tình huống không phù hợp để phân loại hoặc hồi quy, bởi vì bạn không thể xác định chính xác số lượng "điều cần xem xét". Như bạn nói, không gian vấn đề của bạn là vô cùng lớn. Một cách khác để suy nghĩ về điều này là về mặt tập huấn cần thiết để học một mô hình; Làm thế nào là khó khăn cho bạn tưởng tượng các tập huấn luyện trông như thế nào? Trong trường hợp của bạn khó khăn. Chính xác thì các cột trong bộ của tôi chứa gì?
Đây là lý do tại sao các ứng dụng như xe tự lái, Atari và AlphaGo không sử dụng phân loại hoặc hồi quy. Không thể biết tập huấn luyện sẽ trông như thế nào. Bạn có thể thử, nhưng mô hình của bạn sẽ thất bại trong việc đưa ra dự đoán mạnh mẽ (trong trường hợp này là di chuyển). Có bao nhiêu điều bạn phải cân nhắc để xây dựng một mô hình về điều kiện đường xá?
Đây là lý do tại sao một loại thứ ba của máy học, học tăng cường, tồn tại. Thay vì sử dụng một tập huấn luyện được chỉ định trước, nó sử dụng thử và lỗi. Bằng cách liên tục chọc vào môi trường của nó, nó có thể học được một chính sách hoạt động lâu dài.
Vì vậy, đối với các không gian vấn đề nhỏ hơn, nơi chúng tôi có cơ hội xác định tập huấn luyện, chúng tôi sử dụng máy học có giám sát và không giám sát. Đối với không gian vấn đề lớn hơn, nơi khó xác định tập huấn luyện, chúng tôi sử dụng phương pháp học tăng cường. Tất nhiên bạn cũng có thể thực hiện các kết hợp thú vị của tất cả các phương pháp trên, nhưng nó vẫn đi xuống phức tạp.