Chọn một đề tài nghiên cứu bằng lý thuyết trò chơi


19

Câu hỏi lý thuyết trò chơi gần đây này khiến tôi suy nghĩ (tất nhiên đây là một tiếp tuyến): Có thể tối ưu hóa hiệu quả một chiến lược cá nhân để chọn câu hỏi nghiên cứu để sử dụng lý thuyết trò chơi không?

Để hướng tới việc chính thức hóa câu hỏi, tôi sẽ đưa ra các giả định (không chính thức) sau đây:

  • Tôi cũng "tận hưởng" bất kỳ vấn đề cụ thể nào có sẵn để tôi giải quyết (để tránh câu trả lời "mềm" (và chính xác!) Của "Làm những gì bạn thích!").
  • Tôi có thể hoặc không thể thành công trong việc tìm câu trả lời cho bất kỳ vấn đề nào tôi chọn để giải quyết. Đối với bất kỳ vấn đề nào, tôi có một số ước tính về xác suất tôi sẽ giải quyết vấn đề tốt như thế nào (sau khi đầu tư thời gian vào nó).
  • Mục tiêu của tôi là tối đa hóa khoản thanh toán của mình khi được đánh giá xuống dòng (xin việc, xin việc, xin học bổng, v.v.), đó là chức năng của bao nhiêu vấn đề tôi giải quyết và vấn đề quan trọng hay khó khăn như thế nào . Tôi không có ý tưởng rõ ràng về số tiền chi trả chính xác cho mỗi vấn đề, nhưng tôi có thể ước tính hợp lý.
  • Có một mối quan hệ nghịch đảo lỏng lẻo giữa tiền chi trả vấn đề và khó khăn vấn đề. Một tuyên bố khác về mục tiêu của tôi là "chơi" sự khác biệt (tức là tìm "trái cây treo thấp").
  • Một ví dụ của vấn đề tổng thể này được chỉ định bởi một danh sách các câu hỏi nghiên cứu (có thể là số lượng vô hạn), mà tôi đính kèm chắc chắn (không tính chi phí tính toán; nó được đưa ra làm đầu vào) ước tính giá trị của câu hỏi và độ khó của câu hỏi. Tôi đang chơi trò chơi này với một kẻ thù (người đánh giá tôi); tự nhiên quyết định, đưa ra xác suất tôi giải quyết một vấn đề nhất định, liệu tôi có giải quyết thành công hay không sau khi tôi chọn thử.

Trong một nỗ lực để thực sự chính thức hóa những gì đang diễn ra (và phản hồi không thú vị hoặc phản hồi kiểu tranh luận / thảo luận), tôi sẽ xem vấn đề này là một trò chơi dạng rộng với thông tin không đầy đủ với một bộ hành động vô hạn .


Câu hỏi : Tôi cho rằng các trò chơi loại này không thể tính toán hiệu quả. Tuy nhiên, có một thuật toán thời gian đa thức để tối đa hóa mức tối đa của tôi không? Điều gì về một PTAS?

Hoặc, thay vào đó, có một mô hình lý thuyết trò chơi chính xác hơn cho vấn đề này? Nếu vậy, cùng một câu hỏi: Tôi có thể (xấp xỉ) tối đa hóa khoản thanh toán của mình một cách hiệu quả không? Nếu vậy thì thế nào?


4
Một vấn đề tiềm ẩn khi coi đây là một trò chơi là đối thủ của bạn, người đánh giá bạn, không nhất thiết phải chơi với bạn. Thật vậy, đó thường là trường hợp họ đứng về phía bạn, và chỉ sẵn sàng nhìn thấy bạn thất bại nếu bạn không vượt qua mức tối thiểu của các yêu cầu. Một đối thủ có thể khác là tất cả các nhà nghiên cứu khác , vì họ có thể đang làm việc (có thể hợp tác) trong cùng một vấn đề và do đó đang chống lại bạn để đạt được thành công bằng cách cố gắng đạt được kết quả trước khi bạn làm.
Dave Clarke

Vì mục đích của câu hỏi này (tôi muốn thảo luận càng nhiều càng tốt vì vậy đây là một câu hỏi hay ...), giả sử người đánh giá tôi thực sự chịu một áp lực nghiêm trọng khi chọn một và chỉ một cá nhân tốt nhất cho một phần thưởng cụ thể, vì vậy chúng là nghịch cảnh. Ngoài ra, hãy giả sử rằng "bất cứ điều gì thực sự nguyên bản sẽ chỉ là: bản gốc", vì vậy các nhà nghiên cứu khác không phải là một mối quan tâm nghiêm trọng. Cá nhân tôi (tất nhiên!) Quan tâm đến các khả năng khác, nhưng tôi nghĩ để nó mở sẽ mời những câu trả lời không hay. :)
Daniel Apon

Một yếu tố trong vấn đề có thể xứng đáng với một mô hình khác: Đánh giá xác suất thành công / cơ cấu phần thưởng cho mỗi vấn đề mà tôi chọn giải quyết.
Daniel Apon

2
RTrtôiPtôi(t)t

2
Tất nhiên, trong cuộc sống thực, mỗi câu hỏi bạn trả lời sẽ mở ra nhiều câu hỏi hơn mà bạn không thể dự đoán trước nhưng điều này hoàn toàn có thể dễ dàng và / hoặc đáng giá hơn so với nhóm câu hỏi bạn đã bắt đầu, nhưng một khi bạn bắt đầu tạo cây chiến lược như thế này cơ hội tìm thấy bất cứ điều gì thú vị mà bạn có thể nói về trò chơi đi xuống đáng kể.
Peter Shor

Câu trả lời:


4

Tôi sẽ cố gắng trả lời câu hỏi của bạn bằng cách đề xuất một mô hình thay thế cho câu hỏi. Tôi thường hỏi nhiều câu hỏi hơn là tôi trả lời ở đây, vì vậy tôi hy vọng bạn sẽ tha thứ nếu câu trả lời của tôi không tối ưu, mặc dù tôi đang cố hết sức.

Tôi nghĩ rằng cách để diễn đạt câu hỏi sẽ là tối ưu để cho phép lý thuyết trò chơi trở nên hữu ích sẽ là giả định một kịch bản cạnh tranh hơn. Tức là, cần phải có sự cạnh tranh giữa nhiều diễn viên khác nhau. Vì vậy, tôi sẽ giả sử như sau:

  • Có một số lượng lớn nhưng hữu hạn n của các nhà nghiên cứu khác đang cố gắng theo đuổi cùng một bộ câu hỏi nghiên cứu có sẵn, mà tôi gọi là Q , mà bạn quan tâm.
  • Mỗi vấn đề nghiên cứu được xác định bởi các đặc điểm sau:
    • Đầu tư thời gian , hoặc tôi , được yêu cầu để đạt được khả năng hiển thị về việc bạn có thể giải quyết vấn đề hay không
    • Xác suất thành công , hoặc S , khi giải quyết vấn đề; Một khi bạn đạt đến "khoảnh khắc của sự thật" và đã đầu tư đủ thời gian, Thiên nhiên sẽ quyết định ngẫu nhiên nếu bạn có thể giải quyết vấn đề hay không
    • Có lợi cho sự nghiệp của bạn , hoặc U (như trong tiện ích), với điều kiện thành công đạt được
  • Mỗi nhà nghiên cứu có mức độ khác nhau về các đại lượng sau:
    • Thời gian để đầu tư vào nghiên cứu, t
    • Tài năng nghiên cứu, r
    • Kỹ năng giao tiếp và các phẩm chất hỗ trợ nghề nghiệp khác, l (như có thể), điều này sẽ quyết định nhà nghiên cứu sẽ tận dụng thành công nghiên cứu của họ như thế nào để thăng tiến trong sự nghiệp

Bây giờ, giả sử không có sự hợp tác trong bất kỳ vấn đề nào là có thể, hãy xem xét những gì tôi sẽ đề cập đến như một "trò chơi lặp lại năng động". Đây là một trò chơi được chơi lặp đi lặp lại, nhưng nó thay đổi một chút mỗi khi nó được chơi.

Gọi M là số lần di chuyển, hoặc lượt, trong trò chơi. Biểu hiện ban đầu của trò chơi có thể được thể hiện dưới dạng một danh sách chứa mọi diễn viên (nhà nghiên cứu) và mọi vấn đề họ có thể làm việc, ngoài tất cả các giá trị liên quan đến từng diễn viên và từng vấn đề mà tôi liệt kê ở trên. (Tất nhiên, tôi cho rằng mọi nhà nghiên cứu đều biết mọi thứ hiện tại đã biết về tất cả các vấn đề và về tất cả các nhà nghiên cứu khác, biến đây thành một trò chơi thông tin hoàn hảo.)

Trong mỗi lần lặp lại của trò chơi, một diễn viên nhất định chọn một câu hỏi nghiên cứu để làm việc. Mỗi diễn viên được phép chuyển câu hỏi bất cứ lúc nào và nếu một vấn đề được giải quyết, lợi ích cho sự nghiệp U bị giảm xuống 0 cho tất cả người chơi khác. Nếu một người chơi đầu tư đủ thời gian và không giải quyết được vấn đề, thì người chơi cụ thể đó bị cấm cố gắng giải quyết vấn đề đó một lần nữa ... mặc dù bất kỳ người chơi nào khác được phép tiếp tục giải quyết vấn đề và một diễn viên khác có thể giải quyết nó thành công Trò chơi kết thúc sau khi tất cả các lượt M đã được thực hiện.

Mỗi lượt mà một nhà nghiên cứu đã chọn một vấn đề sẽ khiến người chơi đó tiến gần hơn đến "thời điểm của sự thật" và có thể giải quyết vấn đề, Thiên nhiên cho phép. Một vấn đề, một khi được giải quyết, sẽ thêm một lợi ích nhất định cho sự nghiệp của nhà nghiên cứu dựa trên l . Tài năng nghiên cứu khuếch đại xác suất thành công, trong khi thời gian rảnh sẽ khuếch đại khả năng tiến bộ trong một lượt nhất định.

Tôi nghi ngờ rằng có bất kỳ thuật toán thời gian đa thức để giải quyết điều này; Tôi thấy không có lý do tại sao các nhà nghiên cứu nên hạn chế chơi cân bằng Nash chiến lược thuần túy, vì vậy vấn đề sẽ liên quan đến cân bằng Nash chiến lược hỗn hợp và do đó hoàn thành PPAD tồi tệ nhất, nếu bạn xem xét "giải quyết vấn đề" có nghĩa là "tìm ra Nash cân bằng cho vấn đề. " (Người ta có thể tưởng tượng rằng nếu bạn là nhà nghiên cứu chủ động nhất xung quanh, bạn có thể tiếp tục và tính toán cân bằng Nash yêu thích của mình và sau đó báo hiệu cho tất cả những người chơi khác ... do đó giúp bạn tự tin rằng sẽ không ai thay đổi chiến lược khỏi chiến lược hồ sơ bạn đã báo hiệu.)

Ở mức độ nào, đây là câu trả lời liên quan nhất mà tôi từng đăng. Tôi hy vọng nó có giá trị ít nhất. Vui lòng cho tôi biết nếu có ai có bất kỳ phản hồi nào hoặc phản hồi hoặc đề xuất cải thiện nó.


1
Philip, cảm ơn vì câu trả lời! Đây là một viễn cảnh tuyệt vời về vấn đề này; Tôi tự hỏi: Bạn có thể nghĩ ra bất kỳ cách nào để thêm một khái niệm "thông tin một phần" vào vấn đề để nó giữ trạng thái hoàn thiện PPAD không? Một cái gì đó để mô hình thực tế rằng là một người chơi trong trò chơi này, tôi không nhất thiết phải biết tất cả những kẻ thù của mình đang làm gì (tức là tôi không có kiến ​​thức hoàn hảo về những câu hỏi mà họ đang xem xét và sức mạnh mà họ tin rằng họ có trả lời từng câu hỏi)? Việc thêm điều này có ảnh hưởng đến sự phức tạp của việc tính toán Cân bằng Nash không? (Tôi không biết!)
Daniel Apon

1
@Daniel Apon: Cảm ơn bạn đã bình luận! Tôi không nghĩ rằng sẽ khó thay đổi các điều kiện để bạn đơn giản không biết đối thủ của mình đang làm gì, hoặc đặc điểm của họ là gì. Nhắc nhở duy nhất là, tôi nghĩ rằng sự đảm bảo về sự tồn tại của trạng thái cân bằng Nash sẽ biến mất khi bạn đang làm việc với một trò chơi thông tin không hoàn hảo. Tôi không biết nhiều về cái được gọi là "trò chơi Stackelberg", nhưng tôi nghĩ chúng có thể liên quan đến thay đổi được đề xuất của bạn. Tôi đã thực sự tự hỏi khái niệm giải pháp tốt nhất là gì trong các trò chơi thông tin không hoàn hảo ... Tôi sẽ suy nghĩ kỹ.
Philip White

Tôi đọc thêm một chút về điều này ... Tôi nghĩ rằng các trò chơi Bayes có thể có liên quan ở đây, bởi vì chúng được sử dụng để đối phó với các trò chơi có thông tin không hoàn hảo. Đây là một liên kết đến trang Wikipedia mà tôi đã liếc qua: en.wikipedia.org/wiki/Bayesian_game
Philip White
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.