Sau khi chơi quá nhiều Angry Birds, tôi bắt đầu quan sát các chiến lược của riêng mình. Hóa ra tôi đã phát triển một cách tiếp cận rất cụ thể để đạt được 3 sao trên mỗi cấp độ.
Điều đó khiến tôi băn khoăn về những thách thức trong việc phát triển một hệ thống máy học có thể chơi Angry Birds. Tương tác với trò chơi và tung ra những chú chim là chuyện nhỏ. Nhưng một câu hỏi mà tôi có là về "các khối xây dựng" của hệ thống.
Các hệ thống máy học dường như hoạt động với các khái niệm đơn giản hoặc hiểu về vấn đề. Điều này thường được mã hóa như các tính năng như đầu vào. Vì vậy, dường như hệ thống cần có khả năng hiểu một số khái niệm cấp cao để tạo ra một chiến lược.
Điều này có đúng không? Ngoài ra, những thách thức hoặc phần khó khăn của việc phát triển một hệ thống như vậy là gì?
EDIT # 1:
Dưới đây là một số làm rõ. Đạt 3 sao là một vấn đề khó khăn vì bạn phải tối đa hóa điểm. Điều này có thể được thực hiện theo hai cách không độc quyền: 1) Tối thiểu hóa số lượng chim được sử dụng (bạn nhận được 10.000 điểm cho mỗi con chim không sử dụng). 2) Tối đa hóa sự phá hủy thủy tinh, gỗ và các vật thể khác. Mỗi đối tượng bị phá hủy cung cấp cho bạn điểm. Có thể phá hủy các vật thể trị giá hơn 10.000 điểm bằng một con chim.
Dưới đây là một chút giải thích về "khái niệm cấp cao". Để tối đa hóa các điểm được mô tả ở trên, bạn cần sử dụng sức mạnh đặc biệt của mỗi con chim. Vì vậy, điều đó có nghĩa là phóng các loài chim khác nhau với các quỹ đạo khác nhau, tùy thuộc vào bố cục của bản đồ. Và, trong khi chơi, tôi phát triển một chiến lược phá hủy các khu vực nhất định với một số loài chim theo một trật tự nhất định.
Dường như không có cách hiểu về cách sử dụng mỗi con chim để phá hủy một khu vực cụ thể, hệ thống không thể học được 3 sao. Vì vậy, làm thế nào để bạn quản lý và mã hóa một cái gì đó như thế? Làm thế nào để bạn đảm bảo rằng hệ thống có thể học các khái niệm cấp cao này?