Sự phức tạp của trò chơi thông tin một phần trạng thái hữu hạn


12

Đưa ra một trò chơi tổng bằng không thông tin một phần xác định chỉ có nhiều trạng thái,
với kết quả có thể là [thua, hòa, thắng] với các giá trị tương ứng [-1,0, + 1],
độ phức tạp của xấp xỉ giá trị của nó là bao nhiêu một trò chơi theo lối cộng trong phạm vi ?ϵ

Đặc biệt, tôi không thể đưa ra bất kỳ thuật toán nào để làm điều đó.
Phần còn lại của bài đăng này được dành hoàn toàn để đưa ra một mô tả kỹ lưỡng hơn
về vấn đề, vì vậy nếu bạn đã có thể tìm ra câu hỏi ở đầu
bài này có nghĩa là gì, thì không có lý do gì để bạn đọc phần còn lại của bài đăng này.

Cho một máy trọng tài với các trạng thái , với trạng thái ban đầu được chỉ định s 0 , trạng thái s a có cặp điểm là [ - 1 , + 1 ] , trạng thái s b có cặp điểm là [ + 1 , - 1 ] và trạng thái của biểu mẫu{1,2,3,...,S}s0sa[1,+1]sb[+1,1]

trong đó:[p1_info,p2_info,num_of_choices,player_to_move,next_state_table]

  • player_to_move{1,2}
  • là một hàm từ { 1 , 2 , 3 , . . . , num_of_choices } { 1 , 2 , 3 , . . . , S }next_state_table{1,2,3,...,num_of_choices}{1,2,3,...,S}
  • p1_info,p2_info,num_of_choices1

Khi máy ở trạng thái như sau:

  • gửi đến Player_1 và gửi p2_info tới Player_2,p1_infop2_info
  • gửi đến trình phát được chỉ định, chờ đợi một phần tử { 1 , 2 , 3 , . . . , num_of_choices } làm đầu vào từ trình phát đó,num_of_choices{1,2,3,...,num_of_choices}
  • sau đó chuyển đến trạng thái được chỉ định bởi next_state_table

Khi máy vào một trong hai trạng thái khác hoặc s b ,sasb

  • tạm dừng với cặp điểm của tiểu bang đó là đầu ra của nó

Có một trò chơi hai người chơi tự nhiên: máy trọng tài được bắt đầu trong trạng thái , các cầu thủ cung cấp các đầu vào mà máy tài đợi, nếu máy trọng tài tạm dừng sau đó chơi 1 điểm giá trị đầu tiên của cặp đầu ra của máy và Người chơi 2 chấm điểm giá trị thứ hai của cặp đầu ra của máy, nếu không cả hai người chơi đều có điểm 0. s0=1





Sự phức tạp của vấn đề sau đây là gì?
Cho một máy trọng tài và số nguyên dương N, xuất ra một số hữu
tỷ (cộng) trong phạm vi 1 / N giá trị của trò chơi tự nhiên cho Người chơi 1.

Như đã đề cập trước đó trong câu hỏi này, tôi không thể đưa
ra bất kỳ thuật toán nào để làm điều đó.


Các cầu thủ có biết cấu trúc bên trong không? Lợi thế của việc có thêm thông tin là gì, nó mang lại nhiều khả năng di chuyển hơn?
domotorp

Đúng. Nó cho họ một ý tưởng tốt hơn về tình trạng hiện tại là gì.

Xin lỗi nhưng tôi vẫn không hiểu. Sau đó, họ biết cấu trúc bên trong nhưng họ không biết họ đang ở đâu vào lúc này? Vui lòng làm rõ mô tả, tôi chắc chắn tôi không phải là người duy nhất không thể hiểu được vấn đề.
domotorp

3
Mô hình của bạn có giống như một "trò chơi ngẫu nhiên dựa trên lượt không có tổng số không với thông tin một phần" không?
Kristoffer Arnsfelt Hansen

1
@Kristoffer: Không rõ ràng (ít nhất là với tôi) rằng mô hình của tôi cho phép mã hóa xác suất phi lý, mặc dù mô hình của tôi tương đương với mô hình đó.

Câu trả lời:


6

LƯU Ý: thuật toán có mục đích của tôi không chính xác; Tôi đã xóa nó.

Một điều cần nhận ra là không quan trọng trò chơi có mang tính quyết định hay không. Để chọn ngẫu nhiên, trọng tài có thể yêu cầu mỗi người chơi đóng góp một số ngẫu nhiên , sau đó thêm chúng. Thật dễ dàng để chỉ ra rằng nếu người chơi sử dụng chiến lược tối ưu của họ, thì tổng là số mod p ngẫu nhiên , sau đó trọng tài có thể sử dụng để ngẫu nhiên hóa chiến lược của mình. Điều này không làm tăng đáng kể số lượng trạng thái trong trò chơi.pp

Đối với một thấp hơn bị ràng buộc vào sự phức tạp, câu hỏi về xấp xỉ giá trị của một trò chơi ngẫu nhiên đơn giảnkhông biết đến là trong P . Sử dụng thủ thuật ngẫu nhiên mà tôi đã đưa ra ở trên, thật dễ dàng để viết một trò chơi ngẫu nhiên đơn giản như một trò chơi được giới thiệu với một bảng tra cứu kích thước đa thức.


Ý tưởng ngẫu nhiên đó (ít nhất, như bạn đã mô tả) chỉ có thể đưa ra xác suất hợp lý. Ngoài ra, các định nghĩa được sử dụng trong hai bài báo đầu tiên bạn liên kết cũng ngụ ý rằng các trò chơi của họ có cây trò chơi hữu hạn, trong khi tôi chỉ yêu cầu một không gian trạng thái hữu hạn (trong đó "trạng thái" không bao gồm lịch sử của trò chơi).

Bạn nói đúng ... phần đầu tiên trong câu trả lời của tôi là không chính xác. Hãy để tôi xóa nó. Tôi khá chắc chắn rằng giá trị xấp xỉ của các trò chơi ngẫu nhiên đơn giản không được biết là nằm trong P ngay cả khi tất cả các lần lật đồng xu có xác suất 1/2.
Peter Shor

1


ε0<ε

Đầu vào: một trò chơi như được mô tả trong câu hỏi của tôi
phải xuất ra CÓ nếu: giá trị của trò chơi cho Người chơi 1 lớn hơn 1-ε
ε

vẫn còn RE- ngay cả khi

player_to_move luôn là 1 (nghĩa là chỉ cần 1 người chơi)

s 0 ≠ s a và s a không nằm trong Phạm vi (next_state_table)
(nghĩa là người chơi không thể thua theo nghĩa đen)

p1_info và p2_info và number_of_choices độc lập với trạng thái
(nghĩa là phản hồi duy nhất của người chơi là liệu nó có chiến thắng hay không)

.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.