強化学習

「強化学習」に関する情報が集まっています

人気の投稿

新着の投稿

はじめに モチベーション 強化学習のお勉強のため,Pythonで実装しようぜ系の本をしばらく読んでいたのですが,肝心のBellman方程式はわりとサラッと導出されていて,自分で手を動かして式を追ってみないとなんだかよくわからない.そうするにあたって瀧先生の深層学習本の強化学習の章における説明が個人的に分かりやすかったので,これを参考にBellman...

2019-02-03

これの続きです 深層強化学習 PyTorchによる実践プログラミング の6章の内容です。 前回の Deep Q-Netowork の発展版として、Double DQN と Dueling Network の実装が紹介されていた。 Double DQN の結果がこれ。Dueling Network の結果がこれ。この課題だともう学習後の...

2019-02-03

これの続きです 5章の Deep Q-Network (DQN) についての実装を試してみた。 Q学習のときには q_table (離散化されたstate × action) の表を作っておいて、state から次の action を決めるのはその表を元にやっていたが、DQN では state を入力、action を出力とするニューラルネ...

2019-02-01

強化学習について勉強中です。深層強化学習 PyTorchによる実践プログラミングを読んでいます。 3章のCartPole課題の結果です。 0 エピソードの学習後 (ランダムに左右に動かしてるだけ) 130 エピソードの学習後 ちゃんと振り子が倒れないようにできているようです。以下コードのメモ。実際はJupyter Noteboo...

2019-02-01

【問題】Unity飽きてきちゃったよ。なんか面白いのないの? Unityでなんか面白いことできないかな~~、 なんとなく、Unityを使えるようになったけど、 最近飽きてきたな~~、 よし、Unityやめて、スプラトゥーンしよっと。 と思ったあなた! そんなあなたにおすすめがあります! Unity ML-Agen...

2018-10-25

みなさん、こんばんは! ML-agentのサンプルをマネしつつ、自分で学習させてみたいと思い、いろいろ試してみました。 けども、まったくうまくいかず、 しかも、一度学習をスタートさせて、うまくいかなかったら、うまくいってない学習状況を眺めるしかないという悲しい時間ができてしまいました。 なんとか、なんとか、 動作確認でちょ...

2018-10-14

みなさん、こんにちは! 今回も前回「Unity ML-agents② 開発環境の準備②」の続きということで、実際にUnityでプロジェクトを作成するところのお話をしていきます。 前回と前々回の開発環境の準備の記事をのせておきますね。 https://hk-ryukyu.muragon.com/entry/103.html htt...

2018-10-14

みなさん、こんにちは! ML-agents②の開発環境の準備②ということで、前回のつづきですね。 前回はAnacondaのインストールを行いました。 今回はPythonのパッケージをインストールするところまで説明したいと思います!(^^)! あの、 パソコン苦手な人が一番見たくない「黒い画面」が登場します。 しかし、...

2018-10-13

みなさん、こんにちは! 沖縄のお盆も終わり、やっと、海に行けるようになりました!(^^)! 天気も最高です! ML-agentの勉強も毎日やらないと気持ち悪いぐらいに習慣化されてきました(^^♪ 勉強しているうち、 みんなにも体験してほしいという気持ちが出てきました! なので、少しづつ、 ML-agentsの使...

2018-10-13

自己紹介  はじめまして、べんぞうといいます。  自然な対応ができるAIを作って世の中から接客業をなくすことを目標に2018年6月から機械学習の勉強を始めました。ほぼ知識0からのスタートでしたが、2018年12月現在でCouseraの「Machine Learning」講座を修了、実装のためにPythonを2ヶ月勉強して形になるものを作れるよ...

2018-12-20

技術ブログ開設

ここから先はアカウント(ブログ)開設が必要です

英数字4文字以上
.qrunch.io
英数字6文字以上
ログインする