シリはその過ちから学ぶことで賢くなるかもしれない

Appleの音声アシスタントであるSiri。





Siri、Cortana、またはAlexaとの短い会話でも試してみてください。そうすると、欲求不満で最も近い壁に頭をぶつけてしまう可能性があります。

音声アシスタントは、多くの場合、単純なクエリに応答するのが得意ですが、複雑な要求やあらゆる種類のやりとりに苦労します。ただし、今後数年間で新しい機械学習技術が人間と機械の対話の課題に適用されるため、これは変化し始める可能性があります。

先週の主要なAI会議で講演し、 スティーブ・ヤング ケンブリッジ大学の教授で、AppleのSiriチームでもパートタイムで働いている人は、最近の進歩が対話システムをどのように改善し始めているかについて話しました。ヤングはアップルでの彼の仕事についてコメントしなかったが、彼の学術研究について説明した。

Siriを含む初期の音声アシスタントは、音声認識に機械学習を使用していましたが、ハードコードされたルールに従って言語に応答していました。機械学習技術が言語の解析に適用されるにつれて、これはますます変化しています(AIの言語問題を参照)。

ヤング氏は特に、強化学習、つまりDeepMindが世界最高の囲碁プレーヤーの1人を打ち負かすことができるプログラムを構築するために使用した手法は、最先端技術を大幅に進歩させるのに役立つ可能性があると述べました。 AlphaGoはそれ自体に対して何千ものゲームをプレイすることで学習し、勝利するたびに前向きな強化を受けましたが、会話型エージェントは応答を変えて、ユーザーのアクションの形で正(または負)のフィードバックを受け取ることができます。

ヤングは、彼の話の後で彼に話しかけたとき、強化学習について語った。あなたが持っている最も強力な資産はユーザーです。

ヤング氏は、これが効果を発揮するために、音声アシスタントは行動を劇的に変える必要はないと述べました。彼らは単に少し異なる方法でアクションを実行しようとするかもしれません。あなたは非常に制御された方法でそれを行うことができると彼は言った。気の利いたことをする必要はありません。

ヤングは講演の中で、言語の解析が機械にとって非常に難しい理由を説明しました。たとえば、画像認識とは異なり、言語は構成的です。つまり、同じコンポーネントを再配置して、大きく異なる意味を生成することができます。言語に関するもう1つの重要な課題は、他の人が考えていることを不完全に垣間見ることしかできないことです。そのため、フレーズや文の意味を推測する必要があることがよくあります。実用的なレベルでは、音声クエリが長くなるにつれて、それを解釈するには、多くの場合、異なるドメインからの知識をマージする必要があります。たとえば、レストランに関する複雑なクエリでは、時間、場所、および食事についての理解が必要になる場合があります。

それでも、Youngは、会話アシスタントが全体を改善するのに適切な時期であると信じています。商業的需要があり、技術があります、と彼は言います。今後5年間で、本当に大きな進歩が見られると思います。

ヤングは、2015年にスタートアップのVocalIQを買収した後、アップルに入社しました。アップルは、機械学習とAIの進歩に基づくテクノロジーの活用競争で競合他社に遅れをとっていると非難されていますが、ヤングの研究はこれが真実とはほど遠いことを示唆しています。また、優秀な人材を惹きつけるために、AI研究の開拓にも取り組んでいます。同社は最近、カーネギーメロン大学の教授であるRuslan SalakhutdinovをAIの最初のディレクターとして採用し、その研究者は初めて論文の発表と公開を開始しました(AppleがAIの最初のディレクターを取得するを参照)。

もちろん、会話型テクノロジーに関心を持っているのはAppleだけではありません。アマゾンのAlexa(音声制御に完全に依存する家庭用デバイス)がヒットし、他の企業も同様のホームヘルパーの開発を急いでいます。 Google Homeと呼ばれるGoogleのサービスは、特に高度な言語解析技術を使用しています(GoogleのアシスタントはSiriやAlexaよりも野心的ですを参照)。

IBMの研究者は、ミシガン大学のチームと協力して、強化学習を活用する会話型システムの実験も行っています。 Satinder Baveja そのプロジェクトに携わっているミシガン大学の教授は、強化学習は対話システムを訓練するための強力な新しい方法を提供すると述べていますが、シリは生涯で真に人間のようなコミュニケーションスキルを達成するとは考えていません。

これらのシステムは、より豊富なコンテキストを使用し始めると彼は言います。レストランの予約、旅行、技術サポートなどの特定のタスクに対処するため、範囲は限定されたままになると思います。

隠れる