米Amazon.comに続いて米Google、米Appleなどが立て続けに、音声で操作するスマートスピーカーを発売・発表した。パソコンの登場とほぼ同時期に研究開発が始まった音声認識技術が、なぜ今になって急成長しているのか? そして、日本市場はどうなるのか?

米国で製品化が相次ぐスマートスピーカー

 有力なIT企業が次々と製品化するスマートスピーカー。すでに複数のモデルをラインアップするなど先行する「Amazon Echo」シリーズは、販売台数が1000万台を超えたとの報道もある。

 そのAmazon Echoシリーズを追うように、米Googleは2016年11月にスマートスピーカー「Google Home」を発売。米Appleは2017年6月に開催した開発者向けのカンファレンスで「HomePod」を発表し、年内の発売を予告した。米Microsoftも秋ごろに「Invoke」を投入する計画で、さらにAndroidを開発したアンディ・ルービン氏が「Essential Home」を発表するなど、米国は時ならぬスマートスピーカーのブームに沸いている。

 日本でもGoogleのGoogle Homeが年内に発売される見込み。国内勢ではLINEがスマートスピーカー「WAVE」を開発。機能を絞った先行版をこの夏に発売し、秋に正式版の発売を予定している。AppleのHomePodは、残念ながら来年以降になる見込みで、そのほかのスマートスピーカーは、まだ発売時期が明確になっていない。

米国で先行するAmazon Echo
米国で先行するAmazon Echo
年内に日本に登場予定のGoogle Home(提供: Google)
年内に日本に登場予定のGoogle Home(提供: Google)
AppleのHomePod。高音質で他社と差異化を図る
AppleのHomePod。高音質で他社と差異化を図る
オーディオメーカーHarman Kardonが販売するInvoke。Microsoftの音声アシスタントを搭載する(米Microsoft社のブログより)
オーディオメーカーHarman Kardonが販売するInvoke。Microsoftの音声アシスタントを搭載する(米Microsoft社のブログより)
LINEのWAVE。まずはこの夏に音楽配信サービス「LINE MUSIC」との連携機能に絞った先行版を発売し、秋には正式版を発売する予定
LINEのWAVE。まずはこの夏に音楽配信サービス「LINE MUSIC」との連携機能に絞った先行版を発売し、秋には正式版を発売する予定

人工知能で音声アシスタントが急激に進化

 スマートスピーカーは、「音声アシスタント」を内蔵するネットに接続されたワイヤレススピーカーである。利用者の声を聞き取るためにマイクも内蔵している。

 利用者が音声で「音楽が聴きたい」などとリクエストすると、音楽の再生が始まる。ネット検索などの機能もあり、カレンダーの予定を確認したり、スマホと連動させて電話をかけたりすることもできる。

 利用者とのインターフェースとして使われる音声アシスタントは、単純に音声をディクテーション(認識してテキスト化)するだけではなく、会話の流れと意味を理解し、自然な対話から利用者の行動をサポートする方向に進化を続けている。

 ちなみに、各社のスマートスピーカーに搭載されている音声アシスタントの名前は、

 ・Amazon Echoは「Alexa(アレクサ)」
 ・Google Homeは「Google Assistant」
 ・HomePodは「Siri」
 ・Invokeは「Cortana(コルタナ)」
 ・LINEは「Clova(クローバ)」

となっている。Google Assistantは、Androidスマホを中心にAndroid OSに対応したデバイスで使うことができ、SiriはAppleが提供する4つのiOS機器で、また、CortanaはWindowsパソコンや日産が自動車への適用を検討している。LINEは先日、トヨタが推進するスマホやタブレットと自動車を連携するコネクテッドカーの規格であるSDL(Smart Device Link)でClovaを活用すると発表したところだ。

音声アシスタントの開発競争が激化

 今、これほど多くのスマートスピーカーが登場する背景とは何か?

 大きな要因は、音声アシスタントの開発にAI(人工知能)が使われるようになり、急速に進化。音声認識などが実用レベルに達したことが挙げられる。ただし、まだ自然な会話が成立するほどではないことから、各社は音声アシスタントを進化させるため熾烈な開発競争を繰り広げている。

 音声アシスタントをあたかも人間のように会話させるには、対話の意図やパターンをAIが学習して賢くなる必要がある。学習に必要なデータ(※編集部注)は、多ければ多いほど学習効率は上がるため、各社はスマホなどに音声アシスタントを搭載したり、音声アシスタント搭載デバイスを実際に使ってもらったりして、データをどんどん集積するという手法を取っている。

※編集部注:各社は、どのようなデータを集積しているかについては具体的に明らかにしていないが、どのような言葉でどのよう指示を出したかといった音声データと推察される。

 スマートスピーカーは、データの集積に有効な製品の1つと位置付けられている。なぜなら、スマホ以外では利用者が話しかけやすく、話しかけられても違和感がないデバイスと考えられているからだ。エアコンや電子レンジに音声アシスタントが搭載されたとしてもいきなり話しかけにくいものだ。また、スマートスピーカーは置き場所を自在に移動させられる点も、相次ぐ製品化の要因にあると考えられる。

 なお、GoogleやAppleのように、スマホからのデータ集積があまり見込めないAmazon.comは、より多くのユーザーからデータを集積するため約40ドルの廉価版のスピーカー「Echo Dot」を発売して、ユーザーのすそ野を広げている。さらに先日、発売したものの不振だったバーコードリーダーを読み込むだけで商品を発注できる「Amazon Dash Wand」にAlexaを搭載したバージョンをたった20ドル(購入者には20ドルのクーポンが付くので実質無料)で発売している。

 加えてAmazonはASK(Alexa Skills Kit)と呼ばれるAlexaを使ってさまざなデバイスをコントロールできる開発キットを早くから開発者に公開している。Amazon以外の会社がAlexaを使って、音声でピザを頼んだり、タクシーを呼んだり、ドローンやVRをコントロールするなどの機能を簡単に提供できることから、すでに1000を超える機能が開発、公開されている。これもユーザー獲得に一役買っていることは間違いない。

実売39.99ドルのAmazon Echo Dot
実売39.99ドルのAmazon Echo Dot

プライバシーの問題もある

 音声アシスタントを搭載した製品は、自然な対話の実現だけでなく、まだまだ使い勝手の点では多くの課題が残っている。例えば、英語以外の言語は先行するAmazon Echoシリーズでも対応を始めたばかりだし、スマートスピーカーがテレビからの音声など意図しない音声に反応したり、子どもが勝手に使ったりしないよう、音声を聴き分ける機能が求められている。

 また、プライバシーの問題も重要だ。音声アシスタントを使用するデバイスは待機中もマイクがオンになっていることから、会話や音声が常に収集され、クラウドに送られているのではないかと指摘されたことがある。Essential Homeは使用中だと分かるよう、あえてディスプレーを搭載しているし、AppleがHomePodが音声解析を本体だけで行っていると強調したのも、過去にSiriで同様の指摘をされた経緯があったからだ。

Essential Homeは、上部にディスプレーを搭載している(米Essential社のWebサイトより)
Essential Homeは、上部にディスプレーを搭載している(米Essential社のWebサイトより)

擬人化好きな日本は独自に進化?

 日本での音声アシスタント市場は、スマートスピーカーの登場で加速すると見られている。だが、日本語は言葉の進化が激しい上に、世代によって使われる言葉の意味が変わったり、ニュアンスを重視することから、サービスを始めたとしても使いものになると感じてもらえるかが難しいところだ。

 一方で日本人は、ロボットや家電だけでなく、さまざまなデバイスを擬人化することに抵抗が少ない。LINEが資本業務提携したウィンクルの「Gatebox」のようにキャラクターを介して対話する音声アシスタントが人気を集めるケースもある。そのLINEはこの冬に同社のキャラクターをモチーフにしたスマートスピーカー「CHAMP」を発売予定で、日本独自の市場を見越したような動きを見せている。

Gateboxは、キャラクターを介して音声アシスタントを利用する。音声のほか、チャットで会話する機能もある
Gateboxは、キャラクターを介して音声アシスタントを利用する。音声のほか、チャットで会話する機能もある

 いずれにしても音声アシスタントは、まずは話しかけるのに違和感がないスマホとスピーカーから始まって、スマート家電へと拡がり、パーソナルロボット、家全体(スマートホーム)、そして自動車のユーザーインターフェースとして重要な機能になるのは間違いない。音声だけであらゆるものをコントロールするだけでなく、ジェスチャーや視線入力などを組み合わせるケースも出てくるだろう。

 音声アシスタントを搭載するデバイスは、機能を最小限に抑えた廉価版と、高度な会話やデバイスそのものの機能を高めた高機能版の二極化が進みそうだ。前述した通り、スマートスピーカーではAmazonが廉価版を発売しているし、その他にも音声アシスタントを開発している中国バイドゥや韓国サムスンなど各社から、今後廉価版のスマートスピーカーが発売される可能性は高い。

 高機能版のデバイスの主役となりそうなのがパーソナルロボットだ。シャープのロボホンをはじめ、台湾ASUSTeK Computerの「Zenbo」や独Boschが支援する「Kuri」など、多数の大手メーカーが製品を発表済みで、驚くほどバリエーションが増えている。

ASUSのZenbo(写真/小口覺)
ASUSのZenbo(写真/小口覺)

 音声アシスタントの搭載デバイスとしてロボットの需要が増えれば、日本のロボティクス技術が強みを発揮する可能性も出てくる。いずれにしろ、日本の音声アシスタント市場がどのようなデバイスを中心に拡大していくのか、興味は尽きない。

(文/野々下裕子)

この記事をいいね!する