Sự khác biệt giữa các tác nhân dựa trên mục tiêu và dựa trên tiện ích là gì?

9

Sự khác biệt giữa các tác nhân dựa trên mục tiêu và dựa trên tiện ích là gì? Xin vui lòng, cung cấp một ví dụ thực tế.

— RashkRizwan
nguồn

7

Tiện ích là nền tảng cho Trí tuệ nhân tạo vì đó là phương tiện để chúng tôi đánh giá hiệu suất của một tác nhân liên quan đến một vấn đề. Để phân biệt giữa khái niệm tiện ích kinh tế và chức năng tính toán dựa trên tiện ích, thuật ngữ "đo lường hiệu suất" được sử dụng.

Cách đơn giản nhất để phân biệt giữa tác nhân dựa trên mục tiêu và tác nhân dựa trên tiện ích là mục tiêu được xác định cụ thể, trong đó tối đa hóa tiện ích là chung. (Tối đa hóa tiện ích tự nó là một dạng mục tiêu, nhưng được khái quát hóa trái ngược với cụ thể.)

Một tác nhân điều hướng dựa trên mục tiêu được giao nhiệm vụ đi từ điểm A đến điểm B. Nếu tác nhân thành công, mục tiêu đã được thỏa mãn.
Một tác nhân điều hướng dựa trên tiện ích có thể tìm cách đi từ điểm A đến điểm B trong khoảng thời gian ngắn nhất, với chi phí nhiên liệu tối thiểu hoặc cả hai.

Trong ví dụ trên, tác nhân tiện ích cũng dựa trên mục tiêu, nhưng trong đó thước đo hiệu suất cho tác nhân mục tiêu là nhị phân [thành công / thất bại], tác nhân tiện ích có thể sử dụng số thực và đo hiệu suất theo mức độ. Các tác nhân tiện ích cho phép chi tiết hơn trong đánh giá.

Để biết ví dụ về một tác nhân tiện ích không dựa trên mục tiêu, hãy xem xét một hình thức của một sudoku đảng phái trong đó người chơi cạnh tranh để kiểm soát các khu vực trên bảng trò chơi bằng cách đặt các số nguyên có trọng số.

Trong một trò chơi có 9 vùng, tác nhân dựa trên mục tiêu tìm cách kiểm soát một số vùng cụ thể khi kết thúc trò chơi . Nếu tác nhân bảo thủ, mục tiêu có thể là 5 vùng. Nếu tác nhân quá khích, mục tiêu có thể là 9 vùng. Khi đánh giá môi trường (gameboard), nếu tác nhân chi phối số vùng mong muốn, nó có thể chọn củng cố (củng cố); nếu tác nhân không thống trị số vùng mong muốn, nó có thể chọn mở rộng (tấn công).

Chiến lược trên có thể có hiệu quả, nhưng bị giới hạn bởi tính đặc thù của mục tiêu. Một mục tiêu siêu tích cực sẽ hoạt động tốt trước một đối thủ yếu, nhưng chống lại một đối thủ mạnh, nó có thể gây ra thảm họa. Nếu tác nhân tinh vi, nơi hiệu suất kém, nó có thể thay đổi mục tiêu bằng cách chuyển sang "chiến lược rùa" và tìm cách kiểm soát ít khu vực hơn, nhưng vì mục tiêu mới vẫn cụ thể, nên đại lý có thể bỏ lỡ cơ hội để cải thiện tình trạng cuối cùng vượt quá mục tiêu điều chỉnh.

Tác nhân dựa trên tiện ích có thể tiếp cận trò chơi mà không có mục tiêu cụ thể nào ngoài việc cải thiện tình trạng của nó. Thay vì tìm cách kiểm soát một số khu vực đã đặt, tác nhân tiện ích sẽ đánh giá xem một lựa chọn nhất định có cải thiện hay làm xấu đi tình trạng của nó hay không. ("Tôi có thống trị nhiều hay ít khu vực nếu tôi đảm nhận vị trí này không?") Tác nhân tiện ích có thể phân biệt giữa các bộ lựa chọn có lợi ("lựa chọn nào tối đa hóa lợi ích mong đợi của tôi?") tập hợp các lựa chọn có ít nhược điểm nhất ("trong số các lựa chọn xấu, đâu là lựa chọn kém nhất?")

Trong ví dụ này, tác nhân tiện ích thậm chí không cần hiểu điều kiện chiến thắng (kiểm soát nhiều vùng hơn đối thủ khi kết thúc trò chơi.) Thay vào đó, tác nhân tiện ích chỉ tìm cách tối đa hóa số lượng vùng được kiểm soát trên Tất nhiên, sẽ mang lại chiến thắng nếu người đại diện đưa ra nhiều lựa chọn tối ưu hơn đối thủ.

— DukeZhou
nguồn

0

Sự khác biệt giữa các tác nhân dựa trên mục tiêu và dựa trên tiện ích là gì?

Cả hai tác nhân dựa trên mục tiêu và dựa trên tiện ích đều có mục tiêu. Tuy nhiên, có các mục tiêu không đủ hiệu quả (hoặc hiệu quả), do một tác nhân dựa trên mục tiêu có thể có một số hành động có thể dẫn đến các mục tiêu, nhưng không phải tất cả các hành động này đều có hiệu quả như nhau. Vì vậy, cần có một tác nhân để thực hiện hành động hiệu quả nhất. Và điều này được thực hiện bởi một đại lý dựa trên tiện ích.

Điều đó nói rằng, đối với một tác nhân thể hiện chức năng tiện ích, nó ánh xạ từng trạng thái sau mỗi hành động được thực hiện cũng như không được thực hiện hiệu quả và hiệu quả.

Thí dụ

Hãy xem xét hai máy bay không người lái $G$ và $U$ , Ở đâu $G$ là một mục tiêu dựa trên và $U$ một đại lý dựa trên tiện ích. (Hai máy bay không người lái có chip vi tính trên tàu, do đó không cần điều khiển mặt đất). Những máy bay không người lái này được gửi đi trong một nhiệm vụ và họ có một mục tiêu. Cả hai máy bay không người lái phát hiện mục tiêu đã cho, nhưng $G$ không biết hành động khả dụng nào của nó hiệu quả hơn hay hiệu quả hơn. Tuy nhiên, $U$ , dựa trên chức năng tiện ích của nó , có thể chọn hành động hiệu quả hoặc hiệu quả nhất.

Xem thêm bài viết trên web Giới thiệu về Đại lý thông minh (2005), của Frederick Mills và Robert Stufflebeam, để biết thêm thông tin về các tác nhân thông minh.

— tinh hoa
nguồn