211service.com
プレイタイムの終わり
昨年の初め、コンピュータは囲碁で世界クラスのパフォーマンスを達成しました。ほとんどの人がそのような偉業が可能であると信じる何年も前のことです。
それは印象的ですが、私たちの野心はもっと高く設定されるべきです。コンピュータサイエンスは、世界が批判的に必要としているものを提供するのに役立つ可能性があります。それは、私たち全員が自分たちの能力を超えて到達できるようにするツールです。 Goの成功の不可欠な部分である強化学習は、そのプロセスを加速することができます(10の画期的なテクノロジー:強化学習を参照)。
強化学習は、コンピューターが経験を通じて学習し、その行動が直接の環境にどのように影響するかについての事前の知識がなくても、前向きな結果をもたらす一連の決定を下す方法です。たとえば、ソフトウェアベースの家庭教師は、学生がそれを使用した後のテストでどのように実行するかに応じて、その活動を変更します。
エマ・ブランスキル
強化学習を使用して人工的な教育エージェントを作成したい場合は、データスマートなアルゴリズムが必要になります。オンライン教育システムからデータを収集し、それを使用して、エージェントがさまざまな教育アプローチの有効性を推定するのに役立てることができます。学生がログインするとき、システムは彼に解決すべき問題を提供する必要がありますか?それとも、説明ビデオから始める方が良いでしょうか?データはそれが決定するのを助けることができます。
ただし、場合によっては、十分なデータがないか、適切な種類のデータがないため、適切な意思決定を行うシステムの開発が困難になります。そもそもそれほど多くのデータを必要としないシステムを作れるといいですね。そして、まさにそれが私のグループが取り組んでいることです。私たちは強化学習アルゴリズムと統計手法を開発して、コンピューターがより少ないデータを使用しながら優れた提案を開発できるようにしています。やるべきことはまだたくさんありますが、理論と実践のギャップを縮めています。
結局、すべてをコンピューターに任せるべきではありません。いわゆるヒューマンインザループ強化学習は、プロセスを加速し、アルゴリズムが自身の限られたパフォーマンスについて推論し、たとえば、可能な決定のセットを拡張する必要があるときに、人間に助けを求めることを可能にします。私のグループとワシントン大学の共同研究者は現在、現在のカリキュラムではすべての生徒がうまく学習できないかどうかを判断できる個別指導システムのアルゴリズムをテストしており、システムに新しいヒントを追加するように人々に求めています。このような人間とコンピュータのコラボレーションは、学生がまだ想像できないアプローチを使用して学習するのに役立つ可能性があります。強化学習のこのビジョンは、人工知能エージェントが卓越した人間のパフォーマンスがどのように見えるかを再定義し、私たち全員がそれを達成できるようにします。
エマ・ブランスキルは、スタンフォード大学のコンピューターサイエンスの助教授です。 。