Xây dựng các hàm phân phối xác suất từ ​​quan sát


7

Có N người chơi và M đối tượng, mỗi đối tượng có một giá trị. Mỗi người chơi có một chiến lược trong việc chọn một đối tượng. Mỗi vòng một người chơi sẽ chọn một đối tượng, nhiều người chơi có thể chọn cùng một đối tượng. Tuy nhiên, giá trị của từng đối tượng được chia đều cho mỗi người chơi đã chọn nó. Sẽ có 9000 vòng (lựa chọn) cho mỗi trò chơi. Mục tiêu của chúng tôi là tối đa hóa các giá trị mà chúng tôi tích lũy vào cuối trò chơi.

Câu hỏi: làm thế nào tôi có thể xây dựng hàm phân phối xác suất cho mỗi lần chơi giả định rằng các quyết định của họ là các biến ngẫu nhiên?

Cách tiếp cận hiện tại: Cách tiếp cận hiện tại của tôi là đếm tần suất người chơi chọn một đối tượng cụ thể và chia cho tổng số vòng, điều đó sẽ đưa ra xác suất người chơi có khả năng chọn đối tượng cụ thể đó.

Vấn đề: Với mỗi người chơi đang cố gắng hết sức để không thể đoán trước được (tiếng ồn), với cách tiếp cận hiện tại của tôi, các hàm phân phối xác suất không chính xác (9000 vòng dường như không đủ dữ liệu). Có cách nào tốt hơn để xây dựng các chức năng phân phối này không?

Lưu ý: Tôi đã đọc ở đâu đó rằng (mô hình Bayes và HMM) vượt trội hơn so với số lượng tần số, nhưng tôi không chắc làm thế nào để thích ứng với tình huống này.


2
Bạn có thể giả định bất cứ điều gì về các bản phân phối? Tất cả các phương pháp tôi biết sẽ giả sử một số mô hình tham số và huấn luyện các tham số đã cho dữ liệu. Một số mô hình chung chung hơn các mô hình khác (và một số người bỏ qua các giả định và huấn luyện bất kỳ mô hình nào được biết là mang lại kết quả có thể sử dụng được) nhưng không có bất kỳ giả định nào , tôi nghi ngờ có nhiều điều bạn có thể làm (một cách nghiêm ngặt).
Raphael

@Raphael bạn có thể cho rằng người chơi sẽ ủng hộ giá trị cao nhất họ có thể nhận được sau khi chia đối tượng cho những người chọn nó, bạn có thể đăng câu trả lời với ý tưởng bạn có không?
Mike G

Câu trả lời:


1

tôi không chắc là tôi hiểu chính xác câu hỏi là gì hay đúng hơn là những quan sát mà từ đó các bản phân phối (thử nghiệm) sẽ được ước tính .

Vấn đề của một ước tính phân phối có liên quan nhiều đến thống kê hơn là khoa học máy tính cũng có thể liên quan đến lĩnh vực này.

Có nhiều phương pháp sử dụng 2 cách tiếp cận chính:

  1. Các mô hình tham số của phân phối xác suất, trong đó một mô hình (giả sử kiến ​​thức trước) sử dụng mô hình được xác định trước (hoặc hình thức hoặc chức năng) của phân phối (ví dụ: Gaussian ) với một số tham số miễn phí tùy thuộc vào dữ liệu (quan sát) và ước tính các tham số này (ví dụ: qua Maximum Likelihood hoặc thuật toán EM hoặc Maximum Entropy vv ..). Ngay cả khi hình thức phân phối thăm dò không được biết đến, phương pháp này vẫn có thể được sử dụng trên các xấp xỉ như Mô hình hỗn hợp Gauusian . Phương pháp này tạo ra các phân phối ước tính trơn tru (và thường mạnh mẽ ) với giả định mẫu trước đó gần với thăm dò cơ bản. phân phối.

  2. Các mô hình không tham số, ước tính toàn bộ PD (bao gồm cả hình thức của nó) trực tiếp từ dữ liệu. các phương thức trong thể loại này là cửa sổ Parzen và ước tính kernel . Phương pháp này có thể tốt hơn từ ước lượng tham số hóa với điều kiện hình thức pdf cơ bản là hoàn toàn không biết hoặc không tầm thường hoặc không thường xuyên trong một số ý nghĩa.

Tất cả các phương pháp trước đây đều có hiệu quả tính toán (mặc dù không nhất thiết phải là đa thức). Điều này giống như cách thuật toán Simplex hoạt động, mặc dù nó không phải là đa thức thời gian, nhưng nó hiệu quả trong nhiều tình huống thực tế.


1

Tôi nghĩ rằng bạn đang sử dụng phương pháp sai. Tôi đề nghị bạn sử dụng lý thuyết trò chơi, để tìm ra cách chơi tối ưu của bạn.

Bắt đầu với trường hợp đặc biệt của N= =2; mỗi người chơi cóM lựa chọn, vì vậy chúng tôi có một M×Mma trận xuất chi. Ma trận xuất chi dễ xác định. Chiến lược tối ưu là (nói chung) một chiến lược ngẫu nhiên. Có các phương pháp tiêu chuẩn để tính toán chiến lược tối ưu, đưa ra ma trận xuất chi. Sau đó, bạn có thể chơi chiến lược tối ưu. Vì vậy đối vớiN= =2, giải quyết trò chơi này là dễ dàng.

Dành cho N>2, lý thuyết trò chơi trở nên phức tạp hơn một chút, nhưng tôi nghĩ những ý tưởng tương tự vẫn thể hiện cách tiếp cận tốt hơn cho vấn đề này hơn là cố gắng ước tính phân phối mà mỗi người chơi đã chọn trong quá khứ. Rốt cuộc, lịch sử trong quá khứ không nhất thiết là đại diện cho lối chơi trong tương lai; Người chơi có thể thay đổi lựa chọn của mình theo thời gian, do đó, việc phân phối các lựa chọn của họ trước đó trong trò chơi có thể không đại diện cho việc phân phối các lựa chọn của họ sau này trong trò chơi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.