211service.com
よりスマートなAIエージェントのための3Dワールド
一般的な人工知能に向けて根本的な進歩を遂げることに焦点を当てているAlphabetの子会社であるGoogleDeepMindは、新しい3D仮想世界を本日リリースし、他の研究者が自由に実験して変更できるようにします。
DeepMind Labと呼ばれる新しいプラットフォームは、ブロックのような3Dファーストパーソンシューティングゲームに似ています。世界の中で、AIエージェントは、周囲を認識し、動き回って、簡単なアクションを実行できるフローティングオーブの形を取ります。エージェントは、前向きな報酬を受け取ることを含む機械学習の形式を通じて、さまざまなタスクを実行するようにトレーニングできます。プラットフォームにバンドルされる簡単なサンプルタスクには、迷路のナビゲート、果物の収集、落下することなく狭い通路を横断することが含まれます。
DeepMindのチーフサイエンティスト兼共同創設者であるシェーンレッグは、環境の観察から何が起こるかを観察することから、幅広いタスクでうまく機能することを学ぶことができるこれらの人工知能エージェントを開発しようとしています。
同社は、以前はラビリンスと呼ばれていた環境のバージョンを社内でしばらくの間使用してきました(「Googleが人工知能を解決する方法」を参照)。以前は、試行錯誤を繰り返しながら、多くのAtariビデオゲームのプレイ方法を学習できるAIエージェントを作成することで、最初の大きな注目を集めました(GoogleのAIマスタースペースインベーダーを参照)。
オープンでカスタマイズ可能な3Dの世界は、エージェントにとってより複雑で視覚的に豊かな課題を提供しますが、潜在的なタスクの範囲がはるかに広いことも意味します。 DeepMind Labは、あるタスクから次のタスクに学習を転送できるAIアルゴリズムにつながる可能性があります。
AIエージェントを3D環境内で動作させることは、産業用ロボットなどの実世界で動作するシステムを制御するアルゴリズムを開発するための利点も持つ可能性がある、とLegg氏は言います。
さらに、基本的な原則からシミュレートされた世界について学習するエージェントを作成するというアイデアは、人間がどのように学習するかについての重要なアイデアを利用します。これは、レッグが彼の学歴で探求したものです。あなたや私が子供の頃に世界について学ぶのと同じように、それはこの学習と一般性の問題に対する非常に基本的なアプローチです、とLeggはDeepMindLabについて語っています。
他のAI専門家は、DeepMindLabの立ち上げを歓迎しました。彼らがより多くの環境をリリースしていることは非常に良いことです、とOpenAIの共同創設者兼リサーチディレクターであるIlya Sutskevarは言います。これは、基礎研究を行い、それを公開することに専念する非営利団体です。強化学習エージェントがアクセスできる環境が多ければ多いほど、フィールドはより速く前進します。
Zoubin Ghahrahmani 、英国のケンブリッジ大学の教授は、DeepMind Labやその他の強化学習のプラットフォームは、研究者がお互いのアイデアをテストできるようにすることで、進歩をより透明にすると言います。
しかし、Gahrahmaniはまた、強化への既存のアプローチは、必ずしも人間の能力を十分に測定できるとは限らないと述べています。たとえば、特定のビデオゲームやボードゲームをマスターするのにかかる時間は、通常、人間の方がはるかに短くなります。強化学習アプローチは非常にデータ効率が悪いと彼は言います。人間に匹敵するペースでシステムを学習させるにはどうすればよいでしょうか。