視線入力を併用する新たな音声認識エンジン、ニュアンスがデモ…CES 2019

ニュアンス・コミュニケーションが行った視線入力を併用する音声認識のデモ。
ニュアンス・コミュニケーションが行った視線入力を併用する音声認識のデモ。全 7 枚

音声認識エンジンの世界的メーカーとして知られるニュアンス・コミュニケーションズ(以下:ニュアンス)は、米ラスベガスで開催されたCES 2019に出展。開発中の自動車用音声認識エンジン「ドラゴン・ドライブ」の最新バージョンのデモンストレーションを披露した。

同社は音声認識ソフト「ドラゴンスピーチ」などで一般に知られるが、近年は自動車向け音声認識エンジン「ドラゴン・ドライブ」の開発を通して急速にその地位を高めてきた。特にその実力を広く知らしめることになったのが、メルセデス・ベンツで採用されている「Hi, Mercedes!」をキーワードに立ち上げる音声認識だ。CMでも盛んに展開されたことで多くの人がその存在を知ることになったのだ。

今回のデモはその発展系で、音声認識入力に加えて視線入力を追加したものだ。デモ車には視線入力を実現するシステムとして、フロントウインドウにタイル状のメニューを表示するプロジェクターと、ドライバーの視線を読み取るための赤外線カメラが設置されていた。これにより、左右から照射した赤外線をカメラが受光して目の動きを検知し、そこから座標を割り出すというわけである。

このシステムで最大のポイントとなるのは、音声認識と視線入力を併用していることだ。たとえばドアを開けるコマンドを発する場合、音声認識だけだと「Open the right door.(右のドアを開けて)」と開けたいドアを音声で指定する必要があった。これに視線入力を加えれば、開けたいドアの方向を見ながら「Open the door.(ドアを開けて)」といえば、希望するドアを明けることができる。これは窓を開ける時などでも有効だ。

驚かされたのは、フロントウインドウに映し出されたタイル状のメニューも視線入力で選択できていたことだ。電話をかける時にこのメニューを表示させ、リストの中から電話をかけたい項目に視線を合わせて「This one.(こここにかける)」と発話すればいい。これで自動的に電話が発信されるのだ。

さらに、デモでは外側の風景と連動してコマンドをこなすことができる。たとえば、見ていると思われる建物が何であるかを知りたい時、その建物を見ながら「What is this building?(この建物は何ですか?)」と発話すると答えが出てくる。その様子は本当にガイドが横に座って答えてくれているかのようだ。

しかも、この音声認識システムでは「Hi, Mercedes!」といったウェイクアップワードを入力しなくてもよい。常に車室内の会話を読み取っていて、コマンドと思われるワードをAIが理解して対応するのだ。視線入力と合わせて使う以上、この組み合わせは必須だったのは言うまでもない。

ただ、この機能を使うには視線移動が伴うわけで、当然ながら走行中の利用には制約が出てくるはず。それについて担当者は「当然ながら安全上、影響のない形で提案していくことになるし、それは国ごとの法規制に合わせていく必要もある」と述べた。いずれにしても、スマートフォンやスマートスピーカーによる音声操作が定着しつつある中で、CES 2019の中でも特に最先端技術の素晴らしさを実感できたデモだったと言えるだろう。

《会田肇》

【注目の記事】[PR]

ピックアップ

教えて!はじめてEV

アクセスランキング

  1. 新型マツダ『CX-5』発表に「先代よりマッチョ」「今風になった」など反響! 注目はサイズとインテリア
  2. レクサスの新境地を開くか...『ES』に「スポーツクロス」導入の噂
  3. スバル初の小型EVクロスオーバー『アンチャーテッド』、7月17日発表へ
  4. 何が変わる? 国交省が自動車整備の「事業規制」を見直し…知っておくべき7項目
  5. ほんと? マツダ『CX-5』新型、価格は350万~420万円か
ランキングをもっと見る

ブックマークランキング

  1. 茨城県内4エリアでBYDの大型EVバス「K8 2.0」が運行開始
  2. リチウムイオン電池の寿命を2倍に、矢崎総業、バインダフリー電極材料を開発
  3. 「AIディファインド」の衝撃、日本の自動車産業は新たな波に飲み込まれるのか…アクセンチュア シニア・マネジャー 藤本雄一郎氏[インタビュー]
  4. 栃木ホンダ販売、テラチャージの急速充電器設置…EV充電環境を強化
  5. トヨタや京大、全固体フッ化物イオン電池開発…従来比2倍超の容量達成
ランキングをもっと見る