Trong những tình huống thực tế nào chúng ta có thể sử dụng thuật toán kẻ cướp nhiều cánh tay?


15

Kẻ cướp nhiều cánh tay hoạt động tốt trong tình huống bạn có lựa chọn và bạn không chắc chắn kẻ nào sẽ tối đa hóa sức khỏe của bạn. Bạn có thể sử dụng thuật toán cho một số tình huống thực tế. Ví dụ, học tập có thể là một lĩnh vực tốt:

Nếu một đứa trẻ đang học nghề mộc và anh ta kém về nó, thuật toán sẽ cho anh ta / cô ta biết rằng anh ta / cô ta có lẽ cần phải tiếp tục. Nếu anh ấy / cô ấy giỏi về nó, thuật toán sẽ bảo anh ấy / cô ấy tiếp tục học lĩnh vực đó.

Hẹn hò cũng là một lĩnh vực tốt:

Bạn là một người đàn ông đặt bạn rất nhiều 'nỗ lực' trong việc theo đuổi một người phụ nữ. Tuy nhiên, những nỗ lực của bạn chắc chắn là không mong muốn. Thuật toán sẽ "hơi" (hoặc mạnh mẽ) thúc đẩy bạn tiếp tục.

Chúng ta có thể sử dụng thuật toán kẻ cướp nhiều cánh tay để làm gì?

PS: Nếu câu hỏi quá rộng, vui lòng để lại nhận xét. Nếu có sự đồng thuận, tôi sẽ xóa câu hỏi của tôi.


3
Cho rằng có 3 câu trả lời nâng cao (cho đến nay), tôi không nghĩ rằng câu này quá rộng để có thể trả lời được.
gung - Phục hồi Monica

@gung Tôi đã nhận được nhiều lượt ủng hộ hơn, tuy nhiên, chúng không được phản ánh trên điểm số của tôi. Làm thế nào mà?
Andy K

5
Đó là bởi vì chủ đề này là wiki cộng đồng (CW), @AndyK. Khi một chủ đề là CW, mọi người không nhận được danh tiếng từ upvote (hoặc mất nó từ downvote). Bạn sẽ kiếm được huy hiệu như bình thường, mặc dù. Những câu hỏi như thế này thu hút danh sách các nội dung & trong đó không có câu trả lời 'chính xác' rõ ràng nào được cho là lạc đề trên các trang web SE. Sự thỏa hiệp của chúng tôi (tôi tin rằng các trang web khác cũng làm điều này) là cho phép các câu hỏi như vậy trong từng trường hợp, nhưng để biến chúng thành CW.
gung - Phục hồi Monica

đủ công bằng @gung
Andy K

1
tuyển sinh đại học. Lựa chọn các số liệu để lựa chọn người nhận cho các cơ quan hiến tặng.
EngrStudent - Phục hồi Monica

Câu trả lời:


8

Khi bạn chơi các trò chơi Pokemon gốc (Đỏ hoặc Xanh lam và Vàng) và bạn đến thành phố Celadon, các máy đánh bạc tên lửa Đội có tỷ lệ cược khác nhau. Multi-Arm Bandit ngay tại đó nếu bạn muốn tối ưu hóa việc có được Porygon thực sự nhanh chóng.

Nói một cách nghiêm túc, mọi người nói về vấn đề với việc chọn các biến điều chỉnh trong học máy. Đặc biệt là nếu bạn có rất nhiều biến số, việc thăm dò và khai thác sẽ được nói đến. Xem như Spearmint hoặc thậm chí bài báo mới trong chủ đề này sử dụng thuật toán siêu đơn giản để chọn tham số điều chỉnh (và vượt trội hơn so với các kỹ thuật biến điều chỉnh khác)


6

Chúng có thể được sử dụng trong môi trường thiết kế nghiên cứu / điều trị y sinh. Ví dụ: tôi tin rằng các thuật toán q-learning được sử dụng trong Tuần tự, Nhiều bài tập, Thử nghiệm ngẫu nhiên ( thử nghiệm SMART ). Một cách lỏng lẻo, ý tưởng là chế độ điều trị thích nghi tối ưu với tiến trình mà bệnh nhân đang đạt được. Rõ ràng làm thế nào điều này có thể là tốt nhất cho một bệnh nhân, nhưng nó cũng có thể hiệu quả hơn trong các thử nghiệm lâm sàng ngẫu nhiên.


Cảm ơn @gung. Tôi không biết về thuật toán đó. Tôi sẽ có một bài đọc về nó
Andy K

6

Chúng được sử dụng trong thử nghiệm A / B của quảng cáo trực tuyến, trong đó các quảng cáo khác nhau được hiển thị cho những người dùng khác nhau và dựa trên các quyết định kết quả được đưa ra về những quảng cáo sẽ hiển thị trong tương lai. Điều này được mô tả trong bài báo hay của nhà nghiên cứu Google Steven L. Scott .


Cảm ơn @Tim. Tôi đọc rằng vwo.com/blog/multi-armed-bandit-alacticm
Andy K

2

Tôi đã hỏi câu hỏi tương tự trên Quora

Đây là câu trả lời

  • Phân bổ tài trợ cho các bộ phận khác nhau của một tổ chức

  • Chọn các vận động viên có thành tích tốt nhất trong số các nhóm sinh viên trong thời gian giới hạn và ngưỡng chọn tùy ý

  • Tối đa hóa thu nhập của trang web trong khi đồng thời kiểm tra các tính năng mới (thay vì thử nghiệm A / B) Bạn có thể sử dụng chúng bất cứ lúc nào bạn cần để tối ưu hóa kết quả khi bạn không có đủ dữ liệu để tạo mô hình thống kê nghiêm ngặt.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.