2018年10月10日(水)のツイート
お気に入り
-
piqcy @icoxfog417
強化学習において、頭脳である戦略だけでなく体(エージェントの形態: 足の角度や長さなど)も学習させるという試み。体の調整具合に応じて、報酬も変動させる。戦略と体の調整は重みを共有し、学習は素のPolicy Gradientがベース… https://twitter.com/i/web/status/1049885404231553031
13:52
ツイート | お気に入り | フォロー | フォロワー |
---|---|---|---|
2907(0) | 374(+2) | 297(0) | 264(-1) |
delivered by Twieve