Hàm chi phí cho kẻ cướp theo ngữ cảnh


14

Tôi đang sử dụng wow vowpal để giải quyết vấn đề tên cướp theo ngữ cảnh . Tôi đang hiển thị quảng cáo cho người dùng và tôi có một chút thông tin về bối cảnh quảng cáo được hiển thị (ví dụ: người dùng là ai, họ đang ở trang nào, v.v.). Đây có vẻ là một vấn đề tên cướp bối cảnh khá cổ điển, như được mô tả bởi John Langford .

Trong tình huống của tôi, có 2 phản hồi chính mà người dùng có thể có đối với quảng cáo: nhấp (có thể nhiều lần) hoặc không nhấp. Tôi có khoảng 1.000 quảng cáo tôi có thể chọn giữa. Vowpal Wợi yêu cầu một biến mục tiêu ở dạng action:cost:probabilitycho mỗi bối cảnh. Trong trường hợp của tôi, actionprobabilityrất dễ để tìm ra: actionlà quảng cáo tôi đã chọn hiển thị và probabilitylà khả năng chọn quảng cáo đó với chính sách hiện tại của tôi để hiển thị quảng cáo.

Tuy nhiên, tôi gặp khó khăn khi đưa ra một cách hay để lập bản đồ chi trả (số lần nhấp) của mình theo chi phí. Các nhấp chuột rõ ràng là tốt và nhiều nhấp chuột trên cùng một quảng cáo cũng tốt hơn các nhấp chuột trên cùng một quảng cáo. Tuy nhiên, không nhấp vào quảng cáo là trung tính: nó thực sự không tốn bất kỳ chi phí nào ngoài cơ hội bị bỏ lỡ (tôi đang làm việc trong bối cảnh quảng cáo kỳ lạ).

Một số ý tưởng tôi đã có là:

  1. chi phí = -1 * dấu (số lần nhấp) + 0 * (không được nhấp)
  2. chi phí = -1 * lần nhấp + 0 * (không nhấp)
  3. chi phí = -1 * dấu (nhấp) + 0,01 * (không nhấp)
  4. chi phí = -1 * lần nhấp + 0,01 * (không nhấp)

Trong trường hợp một vectơ hành động của (0, 1, 5, 0)chi phí từ 4 hàm này sẽ là:

  1. (0, -1, -1, 0)
  2. (0, -1, -5, 0)
  3. (0.01, -1, -1, 0.01)
  4. (0.01, -1, -5, 0.01)

Rõ ràng có nhiều cách khác để thể hiện điều đó clicks=goodno clicks=bad.nói chung, tôi nên làm thế nào để mô hình hóa chi phí cho các vấn đề tên cướp theo ngữ cảnh trong vowpal wợi? Có thể biểu thị lợi ích dưới dạng chi phí âm hay tôi nên điều chỉnh lại mọi thứ sao cho tất cả các chi phí đều dương? Liệu các hành động tương đối trung lập có chi phí bằng 0 có ổn không, hay tôi nên cho họ một chi phí tích cực nhỏ để đẩy mô hình theo hướng các hành động tích cực?


1
Tôi bối rối bởi "có 2 hành động có thể xảy ra: người dùng có thể nhấp vào quảng cáo hoặc người dùng không thể nhấp vào quảng cáo." Nếu bạn đang cố gắng quyết định quảng cáo nào sẽ hiển thị, thì quảng cáo có nên là hành động không?
alto

1
@alto: Tôi nghĩ rằng nên đọc "có 2 phản hồi có thể chúng tôi có thể ghi lại cho người dùng". Điều đó có làm cho nó ý nghĩa hơn không?
Zach

Tôi không chắc đây thực sự là một vấn đề tên cướp theo ngữ cảnh bởi vì tôi không chắc mục tiêu của bạn là gì ở đây. Giải quyết vấn đề tên cướp theo ngữ cảnh "cố gắng tối ưu hóa một chính sách chọn các hành động với chi phí tối thiểu cho các bối cảnh quan sát được." Bạn đang cố gắng tìm ra bao nhiêu quảng cáo để chạy? Cố gắng mô hình hóa hành vi của người tiêu dùng? Thứ gì khác?
shadowtalker

1
@ssdecontrol Tôi đang cố gắng tìm ra quảng cáo nào sẽ hiển thị, được cung cấp một bối cảnh. Đây là một vấn đề ví dụ thường được sử dụng cho những tên cướp theo ngữ cảnh, nhưng tôi đang nhận được kết quả thực sự tồi tệ từ người giải quyết băng cướp theo ngữ cảnh của vowpal-wợi. Tôi đã tự hỏi liệu có lẽ có một cách khác tôi nên chỉ định "chi phí" một lần nhấp hoặc không nhấp vào quảng cáo.
Zach

1
@nik Tôi chưa bao giờ thực sự tìm ra nó, và đã đi với một mô hình đa kính thông thường từ VW thay thế.
Zach

Câu trả lời:


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.