ディープラーニングが実現した各技術のブレークスルー

 音声認識は、長く研究されてきた分野で、統計手法による解析などを組み合わせ、ある程度の認識精度はあった。しかし、カーナビで使うとなると、音声に走行ノイズなどが混じるため認識精度が一気に下がってしまう、という問題があった。音声認識技術の専門家がその見識を生かしてチューニングを重ね、徐々に精度は向上していたが、ノイズの混じり方は車種ごとに違い、個別の対応にも限界があった。

 テクノロジーの進化により、この限界を超える音声認識技術が登場し、われわれの生活の中に溶け込んでライフスタイルを変えてしまおうとしている。われわれの手のひらの上では iPhoneのパーソナルアシスタントSiriが認識精度をどんどん向上させているし、海外では Amazon EchoやGoogle Homeといった音声インターフェースを持ったデバイスがそのエコシステムを広げ、新しいライフスタイルを提供している。Google Homeは日本語対応も発表されたので、注目している読者も多いだろう。

 画像認識も同じだ。例えば監視カメラでは、侵入者の自動検知機能が登場しときに、大きな期待を寄せられたものの、実際には、猫を侵入者として検知してしまうなど誤検知が多く、実用的なものとはならなかった。画像認識の分野でも、従来手法で専門家がチューニングして精度を向上させていたが、2012年に画期的な研究成果が発表され、状況が一気に変わった。それが、GPUで動くニューラルネットワークに100万枚以上の画像を処理させて、画像の特徴を自動でコンピューターに学ばせるディープラーニングだ。

 画像認識の領域ではディープラーニングの研究が進み、2015年にはとうとう人間の認識精度を超える画像認識AIが生まれた。その成果は、かつて顧客をがっかりさせてしまった監視カメラ業界にもスタートアップ企業によって革新的な映像解析技術がもたらされ、保守的な業界のプレーヤーに衝撃を与えている。

2020 年までに、世界の監視カメラの合計台数は、約10億台まで増えると予測されている。撮影された動画のうち、現在、人間の目でモニタリングできているのはごくわずかであるが、カメラやビデオレコーダー、サーバーやクラウドにディープラーニングを適用することにより、データを迅速かつ正確に分析し、より深い洞察が可能になる
[画像のクリックで拡大表示]

 人工知能による医療診断補助も同様だ。かつて、エキスパートシステムというAIによる画像診断システムがあったが、その精度の限界から、医療分野でのAI活用は下火となっていた。ところが最近は、ディープラーニングによる認識精度向上を生かしたシステムが開発され、人間よりも正確な診断ができるようになっている。

医療、ライフサイエンス分野では、ディープラーニングにより創薬化合物の発見やデザイン、大量の医療データ解析に基づく病気の予測や早期発見、病理画像解析によるがんの診断精度向上などで成果が多く生み出されている
[画像のクリックで拡大表示]

ディープラーニングが業界をひそかに変える

 注目したいのは、一度は顧客をがっかりさせてしまったような分野・製品でも、ディープラーニングによって非常に高い精度の機能が実現可能になっているということだ。Amazon Echoがその典型例だ。多くの人が持っていた音声認識に対する不信をディープラーニングによって覆し、既に一つのエコシステムを築くほど普及している。

 今後、音声認識や画像認識だけでなく、精度の低さから興味が失われてしまった他の分野・製品でも、ディープラーニングを活用することで精度向上を実現し、顧客の先入観を良い意味で裏切る製品やサービスの登場が続くだろう。

矢戸 知得
エヌビディア コーポレーション/Jetsonプロダクト・マーケティング・マネージャー
氏名2005年にカリフォルニア大学サンタバーバラ校のコンピューター工学科を卒業後、ソニーに入社。GPSカーナビゲーションシステムやタブレットの組み込み開発に携わった後、ソニー・コンピューターエンターテインメントにて家庭用ゲーム機の周辺機器の商品企画を担当する。2013年にNVIDIAに入社。エンジニアとしての知見を活かしながら、テクニカルマーケティング・マネージャーとしてNVIDIAの技術や取り組みについて周知する活動に従事後、2017年4 月より米国本社にて、エッジ デバイス用のAI コンピューティングプラットフォーム、NVIDIA Jetsonのプロダクト・マーケティングを担当。