MOOCs, オンライン学習, 速報 《日経Robo》フィードバックから行動を獲得する強化学習 – 日経テクノロジーオンライン 2017-10-02 強化学習は、人間や動物の学習を参考にして作られた技術である。次のような問題を解くために使う。「学習の主体であるエージェントは、時刻ごとに環境から ... 上記は、記事のサマリーだけ表示されています。 元記事を読むには、こちらをクリック