EdTech速報

《日経Robotics》オムロン子会社の新強化学習技術、オンラインで全エピソードの安全保証

OSXによれば、エピソード全体に対する制約値を満たせることを理論的に保証できるオンライン強化学習技術は、線形MDPを対象したものでは今回が初という。

上記は、記事のサマリーだけ表示されています。 元記事を読むには、こちらをクリック