Điều này được đề cập rất kỹ trong chương tương ứng của Russell & Norvig (chương 3.5, trang 93 đến 99 (Ấn bản thứ ba)). Kiểm tra để biết thêm chi tiết.
Trước tiên, hãy xem lại các định nghĩa:
Định nghĩa của bạn về sự chấp nhận và nhất quán là chính xác.
Một heuristic đáng ngưỡng mộ về cơ bản chỉ là "lạc quan". Nó không bao giờ đánh giá quá cao một khoảng cách.
Một heuristic nhất quán là một trong đó niềm tin trước đây của bạn về khoảng cách giữa các quốc gia là tự nhất quán. Đó là, bạn không nghĩ rằng nó có giá 5 từ B đến mục tiêu, 2 từ A đến B và 20 từ A đến mục tiêu. Bạn được phép lạc quan quá mức mặc dù. Vì vậy, bạn có thể tin rằng đó là 5 từ B đến mục tiêu, 2 từ A đến B và 4 từ A đến mục tiêu.
Một tìm kiếm cây là một chiến lược tìm kiếm chung để tìm kiếm các vấn đề rằng có một cấu trúc cây: có nghĩa là, nó không bao giờ có thể "trở lại đôi" để trạng thái trước đó từ một trạng thái sau. Mô hình này, ví dụ như một số loại trò chơi nhất định, như Tic-Tac-Toe. Tìm kiếm cây không nhớ trạng thái nào nó đã truy cập, chỉ có "rìa" của trạng thái mà nó chưa truy cập.
Một tìm kiếm đồ thị là một chiến lược tìm kiếm chung để tìm kiếm các vấn đề biểu đồ cấu trúc, nơi nó có thể tăng gấp đôi trở lại trạng thái trước đó, giống như trong cờ vua (ví dụ như cả hai người chơi chỉ có thể di chuyển vị vua của họ trở lại và ra). Để tránh các vòng lặp này, tìm kiếm biểu đồ cũng theo dõi các trạng thái mà nó đã xử lý.
Để biết thêm về tìm kiếm trên cây và biểu đồ, hãy xem câu trả lời hay cho câu hỏi Stack Overflow này .
Được rồi, bây giờ hãy nói qua trực giác đằng sau các bằng chứng.
Trước tiên chúng tôi muốn thể hiện rằng
Nếu h ( n ) được chấp nhận, A * sử dụng tìm kiếm cây là tối ưu.
Bằng chứng thông thường là do mâu thuẫn.
Giả sử rằng A * với tìm kiếm cây và một heuristic được chấp nhận là không tối ưu.
Không tối ưu có nghĩa là đường dẫn hoàn chỉnh đầu tiên từ điểm bắt đầu đến mục tiêu được phát hiện bởi A * (gọi đây là q) sẽ dài hơn một số đường dẫn khác p, mà A * đã khám phá đến một số tiểu bang S, nhưng không còn nữa.
Vì heuristic là chấp nhận được, chi phí ước tính để đạt được mục tiêu từ S phải nhỏ hơn chi phí thật.
Đến 3, và thực tế là chúng ta biết chi phí để đạt được là bao nhiêu S dọc theo p, tổng chi phí ước tính của pvà do đó, chi phí để mở rộng S phải nhỏ hơn chi phí thật của p.
Kể từ khi chi phí thực sự của p nhỏ hơn chi phí q (bằng 2), chi phí ước tính để mở rộng s phải nhỏ hơn chi phí thật của q.
A * luôn chọn đường dẫn có tổng chi phí hứa hẹn nhất để mở rộng tiếp theo và chi phí mở rộng trạng thái mục tiêu được đưa ra bằng tổng chiều dài đường dẫn cần thiết để đạt được nó.
5 và 6 tạo thành mâu thuẫn, vì vậy giả định của chúng tôi trong 1 phải không chính xác. Do đó A * phải tối ưu.
Bằng chứng tìm kiếm biểu đồ sử dụng một ý tưởng rất giống nhau, nhưng thực tế là bạn có thể lặp lại các trạng thái trước đó.