yo_itzのブログ

日々のツイートまとめと(あれば)追記

2018-10-11から1日間の記事一覧

2018年10月10日(水)のツイート

お気に入り piqcy @icoxfog417 強化学習において、頭脳である戦略だけでなく体(エージェントの形態: 足の角度や長さなど)も学習させるという試み。体の調整具合に応じて、報酬も変動させる。戦略と体の調整は重みを共有し、学習は素のPolicy Gradientがベー…