Đây là một khái niệm rất quan trọng khi KOTH bao gồm một tập hợp các quyết định tương đối đơn giản, chỉ liên quan đến một vài người chơi (thường là 2) và mang tính quyết định. Điểm cân bằng Nash mô tả vị trí "chặn lưới": nếu hai người chơi quyết định hai chiến lược của họ, thì hai người chơi sẽ bị khóa một cách hiệu quả ở những vị trí đó: hoặc người chơi thay đổi chiến lược của họ chỉ đơn giản là tạo thêm lỗ hổng.
Ví dụ về các trò chơi trong đó cân bằng Nash rất quan trọng là:
- Rock-Paper-Kéo (-Lizard-Spock), trong đó chiến lược "bất khả chiến bại" là chơi ngẫu nhiên
- Morra , có "phổ" cân bằng. Peter Taylor đã viết một ví dụ tốt trong câu trả lời của mình ở đây .
- Dilemma của tù nhân, một trò chơi hợp tác đáng chú ý vì có một lưới điện "mọi người đều thua"
Làm thế nào để tìm một trạng thái cân bằng
Tìm một trạng thái cân bằng thực sự khá đơn giản đối với hầu hết các trò chơi đơn giản và thường khá trực quan. Một tấn chi tiết về các phương pháp khác nhau có thể được tìm thấy trên internet. Khái niệm cơ bản, thường được áp dụng, là tạo ra một danh sách các chiến lược khả thi mà hai người chơi có thể sử dụng (các tùy chọn do trò chơi cung cấp). Nếu một chiến lược bị "chi phối" bởi một chiến lược khác, thì chiến lược đó có thể bị xóa khỏi danh sách và quá trình này được lặp lại. Bằng "sự thống trị", ý tôi là nếu chiến lược A luôn mang lại kết quả tương đương hoặc tốt hơn chiến lược B, chống lại tất cả các chiến lược đối thủ còn lại, thì chiến lược B có thể bị loại khỏi danh sách.
Ví dụ: Rock-Paper-Kéo
RPS có một cái gì đó gọi là trạng thái cân bằng "hỗn hợp", nghĩa là phân phối có liên quan. Thay vì chơi cùng một động tác lặp đi lặp lại (sẽ dẫn đến thất bại nhanh chóng), điểm cân bằng là chơi 1/3 đá, 1/3 giấy và 1/3 kéo trong một bản phân phối ngẫu nhiên. Nếu tôi chơi ngẫu nhiên, không có gì đối thủ của tôi có thể làm để có được lợi thế với tôi, khoảng thời gian. Nếu đối thủ của tôi chọn không chơi ngẫu nhiên, thì điều đó chỉ tạo ra một lỗ hổng từ phía anh ta.
Các trò chơi có trạng thái cân bằng hỗn hợp có lẽ là phổ biến nhất trên PPCG, vì chúng có thể có nhiều hình thức ( trò chơi thú vị duy nhất tôi có thể nghĩ đến với trạng thái cân bằng thuần túy là tình huống khó xử của tù nhân). Tôi nên lưu ý rằng trạng thái cân bằng hỗn hợp không nhất thiết phải ngẫu nhiên , đơn giản là một cái gì đó khác hơn là chơi cùng một động tác mỗi lần.
Sử dụng thông tin này
Điểm cân bằng Nash của một trò chơi thường đại diện cho "đường cơ sở" mà bạn nên cố gắng vận hành. Trong RPS, chơi ngẫu nhiên đảm bảo một điểm kết thúc ở giữa gói. Để di chuyển lên đầu, bạn phải bắt đầu xác định điểm yếu của người chơi khác.
Để làm điều này, bạn nên giữ trạng thái cân bằng khi không chắc chắn về điểm yếu của đối phương. Khi những điểm yếu đó đã được xác định (bạn đã phát hiện ra rằng đối thủ của bạn không ở trạng thái cân bằng), thì bạn cần nhẹ nhàng chuyển ra khỏi trạng thái cân bằng để tận dụng lợi thế của đối thủ. Hành động này, đến lượt nó, tạo ra điểm yếu về phía bạn. Sau đó, bạn phải phát hiện khi đối thủ của bạn thay đổi chiến lược của mình, để sau đó bạn có thể dừng cuộc tấn công và tiếp tục chơi ngẫu nhiên.
Phát hiện sự thay đổi từ trạng thái cân bằng
Điều này là khá khó khăn, và tôi không phải là một chuyên gia. Biến thể có thể có nhiều dạng:
- Không thích một số tùy chọn trên / dưới các lựa chọn khác mà không có lý do, như một người chơi RPS chơi đá hai lần thường xuyên như kéo hoặc một người tránh chơi giấy. Một số thống kê tương đối đơn giản có thể phát hiện điều này.
- Dựa trên một động thái hiện tại ra khỏi di chuyển trong quá khứ, trong một số mô hình dự đoán. Điều này bao gồm mèo sao chép, "nhịp đập những gì nhịp đập của bạn" hoặc bot "đạp xe". Điều này cần logic bổ sung để phát hiện, vì phân phối di chuyển tổng thể có thể được phân phối đồng đều, mặc dù các di chuyển không ngẫu nhiên. Bạn nên cố gắng ghi lại các bước di chuyển và tìm các mối tương quan như "di chuyển tôi đã thực hiện 2 lượt trước và di chuyển mà đối thủ của tôi thực hiện ngay bây giờ" và "di chuyển anh ta thực hiện 1 lượt trước và di chuyển anh ta thực hiện bây giờ", v.v.
- Bots có phân phối di chuyển dựa trên của bạn. Lỗ hổng trong các bot này thường không được tạo ra (với số lượng có thể đo được) cho đến khi bạn tự thay đổi từ một bản phân phối ngẫu nhiên. Nói chung, bot của riêng bạn rơi vào thể loại này.