AIソフトウェアはより少ないデータから学ぶ確率を調整します

Gamalonによって開発されたアプリは、いくつかの例を見た後、オブジェクトを認識します。学習プログラムは、線や長方形などのより単純な概念を認識します。





機械学習は非常に強力になりつつありますが、膨大な量のデータが必要になります。

たとえば、ディープラーニングアルゴリズムをトレーニングして、猫好きのレベルの専門知識を持つ猫を認識することができますが、猫の数万または数十万の画像をフィードして、膨大な量のバリエーションをキャプチャする必要があります。サイズ、形状、テクスチャ、照明、および向き。人のように、アルゴリズムが、より少ない例から猫を猫にする理由についてのアイデアを開発できれば、はるかに効率的です。

ボストンを拠点とするスタートアップ ガマロン は、ある状況でコンピューターがこれを実行できるようにする技術を開発し、そのアプローチに基づいて火曜日に2つの製品をリリースしています。



基礎となる手法を他の多くのタスクに適用できる場合、それは大きな影響を与える可能性があります。より少ないデータから学習する機能により、ロボットは新しい環境を非常に迅速に探索して理解できるようになり、コンピューターはデータを共有せずに好みについて学習できるようになります。

Gamalonは、ベイジアンプログラム合成と呼ばれる手法を使用して、より少ない例から学習できるアルゴリズムを構築します。 18世紀の数学者トーマスベイズにちなんで名付けられたベイズ確率は、経験に基づいて世界についての予測を洗練するための数学的フレームワークを提供します。 Gamalonのシステムは、確率的プログラミング(または特定の変数ではなく確率を扱うコード)を使用して、特定のデータセットを説明する予測モデルを構築します。ほんの数例から、確率的プログラムは、たとえば、猫が耳、ひげ、尻尾を持っている可能性が非常に高いことを判断できます。さらなる例が提供されると、モデルの背後にあるコードが書き直され、確率が微調整されます。これは、データから顕著な知識を学ぶための効率的な方法を提供します。

確率的プログラミング手法はしばらく前から存在しています。たとえば、2015年、MITとNYUのチームは確率的手法を使用して、1つの例を見ただけで、コンピューターに書かれた文字やオブジェクトの認識を学習させました(このAIアルゴリズムは私たちと同じくらい速く簡単なタスクを学習しますを参照)。しかし、そのアプローチは主に学術的な好奇心でした。



プログラムは多くの異なる考えられる説明を考慮しなければならないため、克服するのが難しい計算上の課題があります、と言います ブレンデン湖 、2015年の仕事を率いたニューヨーク大学の研究員。

それでも、理論的には、このアプローチは機械学習モデルの開発の側面を自動化できるため、大きな可能性を秘めているとレイク氏は言います。確率的プログラミングにより、研究者や実務家にとって機械学習がはるかに簡単になります、とLake氏は言います。難しい[プログラミング]部分を自動的に処理する可能性があります。

確かに、使いやすく、データ消費量の少ない機械学習アプローチを開発するための重要なインセンティブがあります。機械学習では、現在、大量の生データセットを取得し、それを手動でラベル付けすることがよくあります。その後、学習は大規模なデータセンター内で行われ、多くのコンピュータープロセッサが数時間または数日間並行して実行されます。ガマロンの共同創設者兼最高経営責任者であるベン・ビゴダは、これを実際に行う余裕のある本当に大規模な企業はほんのわずかしかない、と述べています。

理論的には、Gamalonのアプローチにより、誰かが機械学習モデルを構築および改良することも非常に簡単になります。ディープラーニングアルゴリズムを完成させるには、数学と機械学習に関する多くの専門知識が必要です。これらのシステムをセットアップするためのブラックアートがあります、とVigodaは言います。 Gamalonのアプローチを使用すると、プログラマーは重要な例を入力してモデルをトレーニングできます。

ヴィゴダが示した MITテクノロジーレビュー このテクニックを使用した描画アプリのデモ。これは、Googleが昨年リリースしたものに似ており、ディープラーニングを使用して、人がスケッチしようとしているオブジェクトを認識します(AIを理解したいですか?ニューラルネットワークのアヒルをスケッチしてみてくださいを参照)。ただし、Googleのアプリは以前に見たものと一致するスケッチを見る必要がありますが、Gamalonのバージョンは確率的プログラムを使用してオブジェクトの主要な機能を認識します。たとえば、あるプログラムは、正方形の上にある三角形が家である可能性が高いことを理解しています。つまり、スケッチが以前に見たものと大きく異なっていても、それらの機能があれば、正しく推測されます。

この手法は、短期的には重要な商用アプリケーションにもなる可能性があります。同社の最初の製品は、ベイジアンプログラム合成を使用してテキスト内の概念を認識します。

Gamalon Structureと呼ばれる1つの製品は、通常可能であるよりも効率的に生のテキストから概念を抽出できます。たとえば、テレビのメーカーの説明を取得して、説明されている製品、ブランド、製品名、解像度、サイズ、およびその他の機能を判別できます。別の商品であるGamalonMatchは、店舗の在庫にある商品と価格を分類するために使用されます。いずれの場合も、製品または機能に異なる頭字語または略語が使用されている場合でも、システムはそれらを認識するように迅速にトレーニングできます。

ヴィゴダは、学ぶ能力が他の実際的な利益をもたらすと信じています。コンピューターは、非現実的な量のデータや何時間ものトレーニングを必要とせずに、ユーザーの興味について学ぶことができます。ユーザーのスマートフォンやラップトップで機械学習を効率的に実行できる場合は、個人データを大企業と共有する必要がない場合もあります。また、ロボットや自動運転車は、何十万もの例を見なくても、新しい障害物について学ぶことができます。

隠れる