注目企業の中の人によるコラム
近年話題のAlexaやGoogleアシスタントなどをはじめとしたデジタルアシスタントやスマートフォンはもちろん、音声認識技術は多くの場面で利用されており、今後もさらに一般的なインターフェイスとして広まっていくと考えられます。
今回はデジタル領域に関するマーケティングを手がけるiProspectのお二人に、音声認識技術の現在と、より生活に浸透していく際に重要性が増してくるクリエイティブとの関係性について寄稿いただきました。

アイプロスペクトAPAC Head of Innovation & North Asia CommerceのNate Shurilla(ネイト・シュリラ)です。今年リリースしたマーケティングビジネスとそのトレンド予測「Future Focus 2018 THE NEW MACHINE RULES」、音声技術に関するマーケット調査「The Future is Voice Activated – 未来はVoice認識 -」の執筆も担当し、音声技術の活用を模索するVoice Lab APACをリードしています。

アイプロスペクト・ジャパン株式会社 COOの渡辺大吾です。2013年にアイプロスペクト・ジャパン株式会社にCSO(チーフ・ストラテジー・オフィサー)として入社し、現在はCOOとして事業戦略の立案を担っております。
弊社はデジタルパフォーマンス領域を中心にサービス提供を行っています。サービスを提供する上で、最適なタイミングで最適なメッセージをターゲットオーディエンスに届けるには、まずはオーディエンスのライフスタイルを把握し、テクノロジーが人々の生活にどのように影響を与えていくのか理解、想像することが非常に重要になってきます。
近年のテクノロジーの飛躍的な進歩により、我々の生活が大きく変化する中、AI、機械学習、IoT、VR、ブロックチェーンが様々な領域で活用され始めています。

その中の一つに音声の力があり、本記事では音声技術の「今と近い将来」についてお話しさせていただきます。

音声認識によってまさに今大きく変わりつつある「日常」

Googleによると音声認識の識別能力は向上し、95%にまで達しています。しかし、まだまだ質問に対して回答できない事があるのも事実です。
これは質問に対してどのように回答すべきかアプリが十分に設計されていないという問題、メディア側で管理する複数のプラットフォームとの連結が不完全であるため発生していると考えられます。
また、音声を認識はするものの、内容を解読できないといった問題も起こっています。

まだ開発の余地はあるものの、音声テクノロジーは徐々に日々の生活の中になじみ始めており、現在はメディアを聞く(音楽、ラジオ、ニュース、ポッドキャストなど)、情報を確認する(天気、通勤、カレンダー、など)、タイマーやアラームを設定する、ゲームで遊ぶ、料理を教えてもらう、アプリにアクセスする、連絡する(電話やメッセージ)、スマートホーム操作等々に利用されています。

日本における音声の定着はまさにこれから!世界の音声テクノロジー事情

今年、iProspectは3つの地域、14ヵ国にて音声技術に関する現状調査を実施しました。

アジアの6ヵ国(日本、中国、インド、シンガポール、インドネシア、オーストラリア)ではスマホユーザーの62%が音声技術ユーザー(日本40%、中国77%、インド82%、シンガポール55%、インドネシア62%、オーストラリア57%)、ヨーロッパ(UK、ドイツ、フランス)のネットユーザーの27%(UK、ドイツ25%、フランス32%)が音声技術ユーザーということが判明しました。(※ネットユーザーがベースになっているため、他の国と比較すると%は若干低い数字となる。)

また、中南米(アルゼンチン、ブラジル、チリ、コロンビア、メキシコ)ではスマホユーザーの51%が音声技術ユーザー(アルゼンチン46%、ブラジル49%、チリ48%、コロンビア61%、メキシコ53%)だということが分かりました。

APACを注視すると、2つのカテゴリ(日本、オーストラリア、シンガポールの保守的市場と中国、インド、インドネシアの躍動的成長市場)に分類することができます。
調査の結果、各カテゴリにおける過去6ヶ月の音声技術の利用は躍動的成長市場の中国、インド、インドネシアでは上昇し、保守的市場の日本、オーストラリア、シンガポールでは安定傾向にありました。
保守的市場における普及を阻む障害として、公の場で音声テクノロジーを利用した際に恥をかくのではという不安がありました。一方で、躍動的市場では、音声機能を使用することはクールだと感じている事もあり、普及の後押しになっていると考えられます。各マーケットのエコシステムはもちろんのこと、文化的なニュアンスやエチケットを考慮したアプローチが必要になることが分かります。日本では方言による言葉の違いやアクセント、イントネーションといった事も機械に学習させていく必要があるかもしれません。

まずは自宅から?音声テクノロジーを利用した商品やサービス

人の目を気にする日本では公共の場である電車や路上で活発に利用するといったことはまだまだ少ないと考えられます。スマートフォンで何かを検索している時、他人に画面をのぞかれることはあまり心地よいことではありません。それと同じ感覚ではないでしょうか。

しかし、音声機能はマルチタスクを可能にする側面や効率性を向上させる側面を持っており、ハンズフリーな状態でタスクを実行させることができる特徴を持っています。その為、自宅や車内などのクローズドな空間で利便性を即時に提供することができれば、日々の生活の中に溶け込み継続的に利用してもらえるようになります。前述のように、音楽やニュースを聴いたり、天気を尋ねたり、To Do listを読み上げたり、目的地への行き方など、自然に習慣の中に入り込むことでエンドユーザーに付加価値を提供し、その便利さこそが継続的な利用に結び付き、知らず知らずのうちに音声認識技術に対するハードルは下がっていくでしょう。

企業側の利用方法としては、ホテルの客室にスマートスピーカーを置き、ルームコンシェルジュサービスや室内のライトやエアコン、TVなどの機器の操作などを可能にし、より利便性を高める試みも見られます。

オフィスでも今後益々活用の場は広がっていくでしょう。手作業で行っている検索を音声で行ったり、電話代わりに使用したり、個人秘書のようにスケジュールの確認やミーティングの予約も簡単に行われるようになります。
日本において公共の場で音声技術を普及させるには高いハードルがありますが、ソーシャル利用を通してユーザーを巻き込める可能性はあると考えています。
ポケモンGOが出たころは、多くの人が外に出てゲームをしていました。普通ならちょっとおかしな光景ですが、多くの人が一緒に遊んでいたため利用がさらに増えて、社会現象になり、至って普通の光景になりましたね。音声技術も同様に、多くの人が行うようになり見慣れた光景になってくると必ずや利用は増えるはずです。例えば、「宝探し」といったゲームを仕掛けるのも一つのきっかけ作りになるかもしれません。町全体を対象として、ヒントをたよりに場所を探索して、次のヒントを見つけて、謎を解いていく。音声技術でこういった宝探しゲームをすれば、みんなが一緒に遊び、公の場で音声技術を使うことがもう少し普通になるかもしれません。

音声技術の「今」と今後の課題とは?その魅力と可能性を倍増させるクリエイティビティはこんなところに!

音声技術は現在の日本において日常的なアシスタント機能としてはまだ定着していません。しかし、MicrosoftとEconsultancyの調査によると、回答者の60%が将来デジタルアシスタントとの会話はまるで本物の会話のようになり、自分の代わりにアクションを起こしてくれるだろうと回答しています。

こういった期待を背景に、音声技術を利用したサービスを提供するAlexaのSkill数は2017年では7,000件しかありませんでしたが、現在はその7倍以上の50,000件を超え、さらに増え続けています。またGoogle Homeも多言語展開を行い、世界でシェアを大きく伸ばしています。

テクノロジーを活用する際に最も重要なことは、ユーザーはテクノロジーを楽しみたいのではなく、テクノロジーを通して、ユーザー自身のことをより理解し、自身の日常に利便性を与えてくれることを望んでいることを開発側が理解することです。

新しいテクノロジーを興味本位で試すことはありますが、ユーザー自身の利便性に繋がらない場合は利用をやめてしまいます。企業はこの事を理解した上で音声ベースのインタラクションニーズを反映した戦略にシフトするべきです。初めて音声技術を使うユーザーにシンプルで実用的な体験を提供し、音声技術に対して賛同するユーザーを集め、音声技術が如何にスムーズで良い影響と体験を与えるかを強く印象づけていく必要があります。

今後IoT化が進んでいく中で、音声テクノロジーはユーザーと接触を持つ重要なタッチポイントとなり、ビジュアルや他のテクノロジーと連動し、必要不可欠なテクノロジーとなっていくでしょう。

VR/AR/ホログラムとの連携。デジタルアシスタントやスマートスピーカーと積み重ねられた会話、IoTデバイスを通じて行った行動、ソーシャルリスニングによる情報を元に機械学習で最適化されたパーソナライゼーション。表情に関する情報、個人データ(プライバシー保護を考慮する必要は当然ありますが)を追加すると、より高度なパーソナライゼーションが可能になるでしょう。

天気やニュース、メディアを聞くといったことはもちろんのこと、ショッピング・教育・金融・医療・スポーツなど利用範囲は多岐に渡ります。
消費者の個人データと感情の推測データを掛け合わせ、インタラクティブな会話を行い、消費者にアクションを促すために何を作るべきか、音声認識テクノロジーが世の中に浸透し、日常に欠かせない技術になるために、クリエイターが果たす役割は非常に大きいのではないでしょうか。



iProspect (アイプロスペクト)について
iProspectはアディダス、アコーホテルズ、スタンダードチャータード銀行、ゼネラルモーターズ、ペイパル、マイクロソフトなど、世界的クライアント企業のオンラインマーケティングの投資収益率最大化をサポートし、数々の賞を受賞しているデジタルパフォーマンス・マーケティングエージェンシーです。英国に本拠地を置き世界55ヵ国、93のオフィスで勤務する4300人のネットワークで構成されたiProspectチームがグローバルに活躍しています。
iProspectは電通グループのグローバルエージェンシー・ネットワークである電通イージス・ネットワークに属しており、iProspectの日本法人であるアイプロスペクト・ジャパンは2003年に設立されました。
https://www.iprospect.com/en/jp/