Skip to the content.

Personal Information

Education

Publications

Research Contents


ビデオゲームコンテンツの設計には,ゲームに関する多くの知識や経験が必要であるため,手作業でコンテンツを設計することはコストのかかる作業である. Procedural Contents Generation (PCG)とは,プログラムを使用してゲームのコンテンツを自動生成する技術であり,上記のコストを最小限に抑えることができる. ここでは,ゲームのステージをビデオゲームコンテンツの一例とする.一般的なPCG手法では,生成されるステージが(1)プレイ可能であるか,(2)美的センスがあるか,などの暗黙の制約を満たす必要があり,この制約を満たすステージを生成するプログラムを開発することにもゲームに関する知識や経験が必要になる.そこで,既存のコンテンツをデータセットとし,機械学習モデルを用いてステージを生成することで,そのゲームに関する知識や経験がなくても誰でもステージを生成できる手法(PCGML)が注目されている.しかし,ビデオゲーム分野では,データセットとして使用できるデータ自体が少ないこともあり,プレイ可能なステージを生成することは困難である. 本研究では,特にプレイ可能なステージを生成するのが困難な「Angry Birds」というゲームを対象とし、時系列ベースのエンコーディング手法を提案し、Sequential VAEを用いることでジェネレータの学習を行った。そして、ジェネレータの入力空間である潜在空間をCMAESを用いて最適化することで、「プレイ可能である」という制約を常に満たしながら望ましい構造を持つステージの探索に成功した。


現実世界で強化学習を用いて方策を学習することは高コストかつ高リスクであるため,シミュレーション環境で学習した方策を現実世界に転移させるという試みがしばしば行われている.しかしながら,シミュレーション環境は現実世界を完全に模倣できるわけではなく,現実世界とシミュレーション環境の間にはモデル化誤差が生じる.このモデル化誤差が原因で,シミュレーション環境で高性能な方策を獲得したとしても,現実世界では方策の性能が著しく劣化するという問題が複数報告されている.本研究では,不確実性パラメータによってモデル化誤差が生じるシミュレーション環境と現実世界の不確実性パラメータが存在する空間が既知であるという設定に着目する.現実世界が不確実性パラメータ空間に含まれている場合に現実世界での方策の性能の下界を保証するために,不確実性パラメータ空間に対する最悪ケース性能の最適化を目指す.最悪ケース性能に対して最適化された方策を獲得するために,強化学習の枠組みの中で同時勾配降下法を用いてmax-min最適化を行うMax-Min Twin Delayed Deep Deterministic Policy Gradient Algorithm(M2TD3)を提案する.Multi-Joint dynamics with Contact (MuJoCo)を用いた実験により,M2TD3は多くのシナリオでベースライン手法よりも優れた最悪ケース性能を示す方策の獲得に成功することを示した.

Awards

Part-time job and Internship

Projects

このChrome拡張はPDF上でDeepLの翻訳結果を表示するChrome拡張である.毎週1万人弱のアクティブユーザーがいる.

これは,プログラムによって自動で人狼ゲームをプレイするエージェントである. ルールベースによって複数の性格のエージェントが実装されてる.

Others