Câu hỏi được gắn thẻ «reinforcement-learning»

Lĩnh vực học máy liên quan đến cách các tác nhân phần mềm phải thực hiện các hành động trong một môi trường để tối đa hóa một số khái niệm về phần thưởng tích lũy.


1

5
Sự khác biệt giữa mạng chính sách và mạng giá trị của AlphaGo
Tôi đã đọc một bản tóm tắt cấp cao về AlphaGo của Google ( http://googleresearch.blogspot.co.uk/2016/01/alphago-mastering-ancient-game-of-go.html ) và tôi đã tìm thấy các điều khoản "chính sách mạng "và" mạng giá trị ". Ở cấp độ cao, tôi hiểu rằng mạng chính sách được sử dụng để đề xuất di chuyển …


1
Trải nghiệm trên mạng là gì
Tôi đã đọc DeepMind Atari của Google giấy và tôi đang cố gắng để hiểu được khái niệm "kinh nghiệm phát lại". Phát lại kinh nghiệm xuất hiện trong rất nhiều tài liệu học tập củng cố khác (đặc biệt là bài AlphaGo), vì vậy tôi muốn hiểu cách thức …



4
Có mô hình ngôn ngữ ngoài luồng nào tốt cho python không?
Tôi đang tạo mẫu cho một ứng dụng và tôi cần một mô hình ngôn ngữ để tính toán sự bối rối trên một số câu được tạo. Có mô hình ngôn ngữ được đào tạo nào trong python tôi có thể dễ dàng sử dụng không? Một cái gì …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 





4
Sách về học tập tăng cường
Tôi đã cố gắng để hiểu học tăng cường trong một thời gian khá lâu, nhưng bằng cách nào đó tôi không thể hình dung được cách viết một chương trình học tăng cường để giải quyết vấn đề thế giới lưới. Bạn có thể gợi ý cho tôi một …



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.