機械学習は、障害を持つ人々を支援する新しい方法を開きます

アリー・デイビス





FCCの規則では、テレビ局は、音声、音響効果、および聴覚障害者や難聴者への笑い声などの視聴者の反応を伝えるクローズドキャプションを提供する必要があります。 YouTubeはこれらのルールの対象ではありませんが、Googleの機械学習テクノロジーのおかげで、同様の支援を提供するようになりました。

YouTubeは、2009年以来、音声テキスト変換ソフトウェアを使用して、動画の音声に自動的にキャプションを付けています(1日に1500万回使用されています)。 今日それはアルゴリズムを展開しました キャプションに拍手、笑い、音楽を示します。基盤となるソフトウェアはため息、吠え声、ノックなどのノイズも識別できるため、さらに多くの音が続く可能性があります。

同社によれば、ユーザーテストによると、この機能により、聴覚障害者や難聴者(および音量を下げる必要がある人)のエクスペリエンスが大幅に向上することがわかっています。機械学習は、状況によっては他の人と同じように宿泊施設を必要とする私のような人々に、聴覚障害のあるYouTubeのプロダクトマネージャーであるLiatKaver氏は言います。



実際、YouTubeのプロジェクトは、機械学習の能力と実用性の進歩に基づいて新しいアクセシビリティツールを作成しているさまざまなプロジェクトの1つです。コンピューティング業界は、主に広告、検索、クラウドコンピューティングなどの分野での利益の見通しによって、画像、テキスト、または音声を解釈できるソフトウェアを進歩させるように駆り立てられてきました。しかし、世界を理解する能力を備えたソフトウェアには多くの用途があります。

YouTubeは、クローズドキャプションで一部のサウンドを自動的に説明するようになりました。

Facebookは昨年、画像認識に関する同社の調査を使用して、たとえば人の友人からの画像のテキスト説明を作成する機能を開始しました。



IBMの研究者は、同社のWatsonプロジェクトで開発された言語処理ソフトウェアを使用して、自閉症や認知症などの認知障害または知的障害を持つ人々を支援するContentClarifierと呼ばれるツールを作成しています。雨が降っている猫や犬などの比喩をよりわかりやすい言葉に置き換えたり、長い文を複数の句や間接的な言葉で切り取ったり分割したりすることができます。

マサチューセッツ大学医学部は、このシステムが読書障害や認知障害のある人をどのように支援できるかをテストするのに役立っています。このプロジェクトに携わったIBMの研究者であるウィル・スコット氏は、自閉症の高校生が大学生活に移行するのを支援する組織と、管理文書や教育文書を理解するのに役立つシステムのテストについて話し合っていると語った。コンピューティング能力とアルゴリズム、およびワトソンのようなクラウドサービスは、以前はこの種のことを実行するために利用できなかったと彼は言います。

イネケシューマン ベルギーのルーベン大学の研究者は、社会がコンピューターやモバイルデバイスを介したコミュニケーションにますます依存するようになるにつれて、一部の人々が取り残されるのを防ぐために、新しい種類のアクセシビリティツールを発明することが重要であると言います。



彼女はのリーダーの一人です 私は投影します 知的障害を持つ人々のために独自のテキスト簡略化ソフトウェアをテストします。このテクノロジーは、GmailやFacebookなどのソーシャルネットワークと統合するアプリに組み込まれています。知的障害のある人、または何らかの障害のある人は、友人や姉妹、兄弟がしていることをしたいと思っています。スマートフォン、タブレット、ソーシャルネットワーキングを使用しているとSchuurmanは言います。

Facebookは、視覚障害者や弱視の人々を支援するために、テキストを使用して画像を説明するサービスを作成しました。

自閉症スペクトラム障害のあるオースティン・ルベトキンは、フロリダの非営利団体と協力してきました 自閉症の芸術家 スペクトル上の他の人がより自立するのを助けるために。彼はIBMのような研究を歓迎しますが、そのようなツールが確実に機能することを保証することは挑戦になるだろうと言います。気にしない映画を推奨する機械学習アルゴリズムは1つです。友達を誤解させるエラーは別です。



それでも、大学の学位を取得しながらスタートアップで働いているLubetkinは、機械学習が今後数年間で障害を持つ人々に多くの新しい機会を開くことになると楽観視しています。彼は最近、スタートアップのClarifaiから ナビゲーションアプリのプロトタイプ これは、運転中に従来のアプリからのテキストと図の情報を解釈するための彼自身の闘争に触発された、ランドマークの形で方向を提供します。正直なところ、AIは競争の場を平準化することができます、とLubetkinは言います。

隠れる