Submodularity bất động sản trong các trò chơi tắc nghẽn?


15

Hãy để là một -players và m -elements trò chơi ùn tắc .n mGnm

Đối với trạng thái cân bằng e , biểu thị bằng

SBạnP(e)≜ <Sbạnp1(e),Sbạnp2(e),Giáo dục,Sbạnpn(e)>

Trong đó SbạnpTôi(e) chứa sự hỗ trợ của người chơi thứ Tôi đang chơi e (bộ chiến lược Tôi chơi với xác suất dương).

Ngoài ra, chúng tôi nói rằng SBạnP(e)SBạnP(e') iff Tôi[n]:SbạnpTôi(e)SbạnpTôi(e') , đó là mọi người chơi trong e ngẫu nhiên hành động của mình trên một tập hợp con về những hành động anh ta có thể đã chọn chơi e' .

Một định nghĩa cuối cùng là chi phí xã hội, SC(e) được định nghĩa là tổng chi phí cho người chơi.

Hãy để e,e là hai (có thể là hỗn hợp) điểm cân bằng cho G .

Liệu

SUP(e)SUP(e)
bao hàm
SC(e)SC(e)
?


Ý của bạn là nói SC(e)SC(e) ? Theo trực giác, người ta sẽ nghĩ rằng việc cân bằng tập trung chơi xung quanh ít yếu tố hơn sẽ dẫn đến mỗi yếu tố bị tắc nghẽn hơn.
Ubiquitous

@Ubiquitous - Tôi nghĩ nó hoàn toàn ngược lại. Mỗi người chơi tập trung vào ít yếu tố hơn, điều đó có nghĩa là ít người chơi đang sử dụng từng yếu tố. Thực tế là mỗi người chơi bây giờ chọn một tập hợp con các yếu tố và đây vẫn là trạng thái cân bằng , có thể có nghĩa là xã hội đang thu lợi từ nó (nếu không, có vẻ như người chơi có thể đi chệch hướng sử dụng nhiều yếu tố hơn).
RB

Phụ thuộc vào hàm chi phí (độ trễ). Trò chơi trong câu hỏi được chỉ định không đầy đủ, bởi vì tiền chi trả (chi phí) không có.
Sander Heinsalu

Câu trả lời:


2

Đề xuất này nói chung là không đúng sự thật . Người ta có thể chỉ ra rằng nó đúng trong trường hợp và . Ở đây, tôi trưng bày một ví dụ ngược khi và .m = 2 n = 3 m = 2n=2m=2n=3m=2

Một nhận xét ngắn gọn. Chúng ta có thể viết lại câu hỏi bằng từ ngữ: liệu trạng thái cân bằng Nash "ngẫu nhiên hơn" ( so với ) có kém hiệu quả hơn không? Theo trực giác, khi nhiều chiến lược hỗn hợp được chơi, kết quả nhận ra là ngẫu nhiên hơn và nó có thể rất kém hiệu quả do thiếu sự phối hợp giữa các tác nhân. Khi các tác nhân chơi các chiến lược thuần túy, chúng ta có thể nghĩ rằng chúng ta giảm vấn đề phối hợp được đưa ra mà chúng ta xem xét cân bằng Nash. Trực giác này không giữ nếu mệnh đề là sai, vì tôi sẽ chỉ ra khi và . e n = 3 m = 2een=3m=2

Suy ra và hai hành động có thể. Các hàm độ trễ được xác định như sau: , , và , , . Điều đó có nghĩa là khi các tác nhân chơi (resp. ), họ sẽ nhận được tiền thưởng (resp. ). Đây là một trò chơi tắc nghẽn (đối xứng) miễn là các chức năng trì hoãn đang tăng lên.B d A ( 1 ) = 5 d A ( 2 ) = 7 d A ( 3 ) = 10 d B ( 1 ) = 1 d B ( 2 ) = 6 d B ( 3 ) = 7 x A B - d A ( x ) - d B ( x )ABdA(1)=5dA(2)=7dMột(3)= =10dB(1)= =1dB(2)= =6dB(3)= =7xMộtB-dMột(x)-dB(x)

Xác định là trạng thái cân bằng khi 1 đại lý đóng và 2 đại lý chơi . Xác định là điểm cân bằng khi 1 tác nhân luôn chơi và 2 người khác chơi với xác suất và với xác suất . Nó thỏa mãn thuộc tính .Một B e ' B A μ = 2 / 3 B 1 - μ = 1 / 3 s u p ( e ) s u p ( e ' )eMộtBe'BMộtμ= =2/3B1-μ= =1/3Sbạnp(e)Sbạnp(e')

Đầu tiên, chúng tôi chỉ ra rằng là trạng thái cân bằng Nash. Tác nhân đóng vai đang tối đa hóa khoản thanh toán của cô ấy dựa trên chiến lược của hai người chơi khác khi chọn tốt hơn là chọn , (tức là ). Cả hai tác nhân chơi đều chơi tối ưu nếu (tức là ). là như vậy, một cân bằng Nash và chi phí xã hội của nó là .A A B d A ( 1 ) < d B ( 3 ) 5 < 7 B d B ( 2 ) < d A ( 2 ) 6 < 7 e d A ( 1 ) + 2 d B ( 2 ) = 17 = 153eMộtMộtBdMột(1)<dB(3)5<7BdB(2)<dMột(2)6<7edMột(1)+2dB(2)= =17= =1539

Thứ hai, chúng tôi cho thấy rằng là trạng thái cân bằng Nash. Một mặt, người đại diện chơi đang tối đa hóa khoản thanh toán của cô ấy khi hai người khác chơi chiến lược hỗn hợp nếu cô ấy chơi tốt hơn , tức là , điều này đúng. Mặt khác, mỗi một trong số các tác nhân chơi chiến lược hỗn hợp lại thờ ơ giữa việc chọn hoặc nếu tức là . B B A ( 1 - μ ) 2 d B ( 3 ) + 2 μ ( 1 - μ ) d B ( 2 ) + μ 2 d B ( 1 ) < ( 1 - μ ) 2 d Một ( 1 ) + 2 μ ( 1 - μ ) d A ( 2e'BBMột1

(1-μ)2dB(3)+2μ(1-μ)dB(2)+μ2dB(1)<(1-μ)2dMột(1)+2μ(1-μ)dMột(2)+μ2dMột(3)
ABμdA(2)+(1-μ)dA(1)=μdB(2)+(1-μ)dB(3)19195+497+4910<197+496+491MộtB
μdMột(2)+(1-μ)dMột(1)= =μdB(2)+(1-μ)dB(3)
e'(1-μ)2[3dB(3)]+2μ(1-μ)[dMột(1)+2dB(2)]+μ2[2dMột(2)+dB(1)]1193= =193e'sau đó là trạng thái cân bằng Nash và chi phí xã hội của nó là bằng với .
(1-μ)2[3dB(3)]+2μ(1-μ)[dMột(1)+2dB(2)]+μ2[2dMột(2)+dB(1)]
1921+4917+4915= =1499

Cuối cùng, chúng tôi đã chỉ ra rằng nhưng . Cân bằng Nash chiến lược hỗn hợp dẫn đến chi phí xã hội thấp hơn so với chiến lược thuần túy.Sbạnp(e)Sbạnp(e')SC(e)>SC(e')

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.