方策勾配法のアルゴリズムまとめ 〜REINFORCE・ベースライン・Actor-Critic〜 投稿日: 2023-07-082023-08-28 投稿者: lib-arts 方策勾配法(Policy Gradient Method)を改善させたアルゴリズムには、REINFORCE・ベースライン・Actor-Criticなどのアルゴリズムがあります。当記事ではこれらの$3$つのアルゴリズムにつ… 全文を読む