学習コードとconfigファイルを分離するとき、学習コードにコメント、file://パス と書けば直接ジャンプできてよき
学習コードとconfigファイルを分離するとき、学習コードにコメント、file://パス と書けば直接ジャンプできてよき
LSTMはうまくいった
話が飛躍し過ぎた
IS weightてたくさんあるけど、全て掛けたら学習率下がり過ぎて、学習しなさそう。
動画みて報酬ボタン、ポチッして強化学習とか、逆強化学習で動画そのまま与えるとか
「メディア、食べた。ぜんぶ……」
真後ろを振り向く動作にLSTMみを感じる
MineRL Treechopの斧壊れた
Make it Work, Make it Right, Make it Fast
Unity 4月から中華圏のアセットが購入不可
ここ2週間の進捗
LSTMつけたら学習が遅くなった。encoder次元下げたらさらに遅くなった。
特徴を学び始めるのに丸1日
強化学習じゃないただの推論 お金もかかる
api頼りの強化学習好きじゃない
10,000ブロック探して永遠に熱帯バイオーム いつ終わる?
マイクラ 拠点近くの海底神殿25個
マイクラVulKan対応 (で今度はvulkan非推奨にして、全人類にMPS使わせるのかあ)
www.minecraft.net/ja-jp/articl...
マイクラAI 木こりタスクで人間超えを達成
オフポリシーでMulti-discreteなアルゴリズムないかなあ
ついでに安定して原木が取れるようになった
Buffer直したら100k stepを400MBで保存できるようになった
人生で初めて終電逃した
FramestackをReplayBufferにつっこむ設計のつけが,今ここに
画像を横にならべてpng,webp圧縮なら高圧縮になりがちだが限界が来た
やっぱりだめ、安定しない Vtraceいれるか
今まで使っていたRainbowからDouble DQNとOptim勾配リセットを抜いてみたが以外と学習が進んでいるな
早い段階の妥協は大切
形にしてから突き詰めよう
卒論発表対戦よろしくお願いします
3割以下は学習崩壊
tech.preferred.jp/ja/blog/pfrl...
NoisyNetの代わりにepsilon greedy 3割で代替できた。
Framestackで観測出来ない何かがある
海底神殿さん?
#マイクラ