GoogleのAIは、予想よりも10年早く囲碁のゲームをマスターします

Googleは、より人間らしい直感を備えたAIの構築に向けて、見事で予想外の一歩を踏み出しました。非常に複雑なボードゲームの囲碁で、熟練した人間のプレーヤーでさえも打ち負かすことができるコンピューターを開発しました。





2、500年以上前に中国で発明されたゲームであるGoの目的は、かなり単純です。プレーヤーは、対戦相手の駒を囲み、自分の作品を囲んでいます。ただし、Goをマスターするには、無限の練習と、ボード全体に広がるピースの配置の微妙なパターンを認識するための微調整されたコツが必要です。

Googleのチームは、Goを習得するために必要なスキルは、結局のところそれほど人間的ではないことを示しています。彼らのコンピュータープログラムはAlphaGoと呼ばれ、ヨーロッパの囲碁チャンピオンであるFanHuiを5試合でゼロにした。そして今年の3月には、韓国のソウルで開催されるトーナメントで、世界最高の選手の1人である李世ドルが参加します。

囲碁は人間がこれまでに考案した中で最も複雑で美しいゲームであり、Googleチームの責任者であり熱心な囲碁プレーヤーであるデミスハサビス氏は記者会見で語った。ファンホイを打ち負かすことで、私たちのプログラムはAIの長年の壮大な課題の1つを達成したと彼は付け加えました。



ハサビス氏はまた、AlphaGoの作成に使用された手法は、一般的なAIを開発するための彼のチームの取り組みに役立つと述べました。最終的には、これらの手法を実際の重要な問題に適用したいと彼は言いました。私たちが使用した方法は汎用であったため、いつの日か、医療診断から気候モデリングまで、社会の最も差し迫った問題のいくつかに対処するために拡張できることを願っています(AIは世界最大の問題を解決できるか?を参照)。

ハサビス氏は、このテクノロジーをグーグルに適用する最初の方法は、より優れたソフトウェアパーソナルアシスタントの開発を伴うだろうと語った。そのようなアシスタントは、オンラインでの行動からユーザーの好みを学び、製品やイベントについてより直感的な推奨を行う可能性があると彼は提案しました。



Goは、たとえばチェスよりもコンピューターにとってはるかに困難です。これは、各ターンの潜在的な動きの数がはるかに多いことと、材料の利点を測定する簡単な方法がないことです。したがって、プレーヤーは、全面的に配置された何百ものピースの抽象的なパターンを認識することを学ぶ必要があります。また、専門家でさえ、特定のポジションが有利または問題があると思われる理由を説明するのに苦労することがよくあります。

実際、ほんの数年前、ほとんどの囲碁プレイヤーとゲームプログラマーは、ゲームが非常に複雑で、コンピューターが人間のエキスパートプレイヤーの標準に達するまでに数十年かかると信じていました。

AlphaGoは、Googleが2014年にDeepMindと呼ばれる小さなAI UKスタートアップを買収した後に作成されたグループであるGoogleDeepMindとして知られるチームによって開発されました。潜在的な動きをモデル化するため。深層学習には、データのパターンに応答するために大規模なシミュレートされたニューラルネットワークをトレーニングすることが含まれます。これは画像および音声処理に非常に役立つことが証明されており、多くの大手テクノロジー企業がこの技術を適用するための新しい方法を模索しています。



AlphaGoでは2つの深層学習ネットワークが使用されました。1つは次の動きを予測することを学習し、もう1つはボード上のさまざまな配置からの結果を予測することを学習しました。 2つのネットワークは、より一般的なAIアルゴリズムを使用して結合され、ゲームで可能な動きを先取りしました。 Googleの研究者が書いた、研究について説明した科学論文 ジャーナルに掲載 自然 今日

囲碁のゲームには、力ずくの検索には手に負えない巨大な検索スペースがあると、この取り組みを主導した別のGoogle研究者であるDavidSilverは言います。 AlphaGoの鍵は、その検索スペースをより管理しやすいものに減らすことです。このアプローチにより、AlphaGoは以前のアプローチよりもはるかに人間味のあるものになります。

IBMのDeepBlueコンピューターが1997年にチェスを習得したとき、それは手作業でコーディングされたルールを使用し、潜在的なチェスの動きを徹底的に検索しました。 AlphaGoは基本的に、潜在的に有利なパターンを認識することを時間をかけて学習し、限られた数の潜在的な結果をシミュレートしました。



Googleの業績は、この分野の他の研究者からのお祝いと驚きに満ちています。

技術面では、この作業はAIへの多大な貢献であると、AIの第一人者であり、OpenAIと呼ばれる新しい非営利団体のディレクターであるIlya Sutskever氏は述べています(35歳未満のイノベーター:Ilya Sutskeverを参照)。 Sutskeverは、AlphaGoが本質的に勝つ方法を自分自身に教えたので、この作業は特に重要だったと言います。同じ手法を使用して、他の多くのゲームでも非常に高いパフォーマンスを実現できると彼は言います。

マイケルボウリング 、カナダのアルバータ大学のコンピュータサイエンスの教授で、最近 プログラムを開発しました ヘッズアップリミットポーカーで誰をも倒すことができることも、この成果に興奮していました。彼は、このアプローチは、機械学習が適用される多くの分野で実際に役立つはずだと信じています。人間の知性がパターンマッチングを中心に構築されているため、私たちが伝統的に考えることの多くは、彼は言います。そして、私たちが学習として考えることの多くは、過去にこれらのパターンを見て、それらが現在の状況にどのように関連しているかを理解できることです。

注目に値する結果の1つの側面は、ディープラーニングと他の手法を組み合わせていることです、とニューヨーク大学の心理学教授であり、 幾何学的知性 、ディープラーニングと他の方法を組み合わせたAIスタートアップ(この男はAIをより人間的にすることができますか?を参照)。

これは、いわゆるエンドツーエンドのディープラーニングシステムではない、とマーカス氏は言います。これは慎重に構造化されたモジュラーシステムであり、フロントエンドにいくつかの思慮深い手作業が施されています。これは、あなたがそれについて考えるとき、人間の心と非常に平行しています:ランダムに相互接続され、経験によって完全に調整されたニューロンの束ではなく、進化によって少し調整された、豊かでモジュール式です。

ディープラーニングを使用してGo-playingAIを開発している企業もGoogleだけではありません。 Facebookは以前、そのようなシステムに取り組んでいる研究者がいると言っていましたが、昨夜は両方 ヤン・ルカン 、FacebookのAIリサーチディレクター、CEO マーク・ザッカーバーグ 取り組みに関する最新情報を投稿しました。 Facebookの取り組みは初期段階ですが、ディープラーニングと別の手法も組み合わせています。

AIマスターのGoを見ると、実存的な不安につながる可能性もあります。ニュースを発表した記者会見で、ハサビスはグーグルが開発しているAIシステムの長期的なリスクについての質問に直面した。同社は、学者と協力し、会議を開催し、社内の倫理委員会と協力することで、これらのリスクを軽減するための措置を講じていると彼は語った。

隠れる