Làm thế nào để tìm kiếm mới lạ làm việc?


16

Trong bài viết này , tác giả tuyên bố rằng hướng dẫn tiến hóa chỉ bằng tính mới (không có mục tiêu rõ ràng) có thể giải quyết vấn đề thậm chí tốt hơn so với sử dụng mục tiêu rõ ràng. Nói cách khác, sử dụng một biện pháp mới lạ làm chức năng tập thể dục cho thuật toán di truyền hoạt động tốt hơn chức năng tập thể dục hướng đến mục tiêu. Làm thế nào là có thể?

Câu trả lời:


7

Như đã giải thích trong câu trả lời cho câu hỏi AI SE này , GA là 'người thỏa mãn' thay vì 'tối ưu hóa' và có xu hướng không khám phá các khu vực 'xa xôi' của không gian tìm kiếm. Thay vào đó, dân số có xu hướng tập trung ở các khu vực 'khá tốt' theo chức năng tập thể dục.

Ngược lại, tôi tin rằng suy nghĩ là sự mới lạ mang đến một loại thể dục năng động, có xu hướng đẩy dân số ra khỏi các khu vực được phát hiện trước đó.


6

Tìm kiếm mới lạ chọn "hành vi tiểu thuyết", theo một số định nghĩa phụ thuộc vào miền của tính mới. Ví dụ: tính mới trong miền giải quyết Mê cung có thể là "sự khác biệt của tuyến đường được khám phá". Cuối cùng, các mạng đi theo mọi tuyến đường có thể đi qua mê cung sẽ được tìm thấy và sau đó bạn có thể chọn nhanh nhất. Điều này sẽ hoạt động tốt hơn nhiều so với một "mục tiêu" ngây thơ, như khoảng cách đến mục tiêu, có thể dễ dàng dẫn đến một tối ưu cục bộ không bao giờ giải quyết được mê cung.

Từ mục tiêu từ bỏ: Tiến hóa thông qua Tìm kiếm một mình mới lạ (nhấn mạnh của tôi):

Trong tìm kiếm mới lạ, thay vì đo lường tiến trình tổng thể bằng hàm mục tiêu truyền thống, tiến hóa sử dụng thước đo tính mới của hành vi được gọi là số liệu mới. Trong thực tế, một tìm kiếm được hướng dẫn bởi một số liệu như vậy thực hiện một cách rõ ràng những gì tiến hóa tự nhiên thực hiện một cách thụ động, tức là tích lũy dần các hình thức tiểu thuyết đi lên các bậc thang phức tạp.
Ví dụ: trong miền đầu máy hai chân, các nỗ lực ban đầu có thể chỉ đơn giản là rơi xuống. Số liệu mới lạ sẽ thưởng đơn giản là rơi xuống theo một cách khác, bất kể nó có gần với hành vi khách quan hơn hay không. Ngược lại, một chức năng mục tiêu có thể rõ ràng là phần thưởng rơi xuống xa nhất, điều này có khả năng không dẫn đến mục tiêu cuối cùng là đi bộ và do đó minh họa một cách tối ưu cục bộ lừa đảo. Ngược lại, trong quá trình tìm kiếm tính mới, một tập hợp các trường hợp được duy trì đại diện cho những khám phá mới lạ nhất. Tìm kiếm thêm sau đó nhảy ra từ những hành vi đại diện. Sau khi một vài cách để rơi được phát hiện, cách duy nhất để được khen thưởng là tìm ra một hành vi không rơi ngay lập tức . Theo cách này, sự phức tạp về hành vi tăng lên từ dưới lên.Cuối cùng, để làm một cái gì đó mới, người hai chân sẽ phải đi bộ thành công trong một khoảng cách mặc dù đó không phải là một mục tiêu .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.