まるで人間同士の会話を実現。ヤマハ「HEARTalk™」搭載の電子工作基板

３Dプリント技術の進化や、IoTの普及、更にはオープンプラットフォームという新たな仕組みの登場は、ものづくりを取り巻く環境を大きく変えつつある。具体的には、製品開発に必要とされるコストとリードタイムを大きく減らし、アイデアをカタチにするハードルを驚くほど低くしている。

例えば、デジタルモールド（3Dプリンタで作った樹脂型）の登場は、試作開発から小ロット量産まで、3Dプリンタで一貫して行うことができる。それも従来の金型量産に比べて、驚くほど低コスト、短納期で実現することが可能だ。

また、ArduinoやRaspberry Piの普及は、オープンソースという概念をハードウェアの分野にももたらし、開発をよりスムーズにしてくれる。こうしたテクノロジーの進化がもたらす恩恵は、既存のメーカーや製造業の中に新たな動きを起こすだけではなく、メイカームーブメントといわれるパーソナルファブリケーションの動きを加速させつつある。

今回は、そんな個人のものづくりを豊かにし、機械音声との自然な対話を可能にする、ヤマハ株式会社（以下、ヤマハ）の画期的な技術とそれを搭載した新製品をご紹介しよう。

自然応答技術「HEARTalk™」を搭載した電子工作基板登場

今回ヤマハが発売したされたのは、ヤマハの独自技術である自然応答技術「HEARTalk™」を搭載した、電子工作基板だ。現在、多くのロボットや機械が人間との“対話”機能を搭載しているが、その返答音声はなんとも一本調子で “人間味”が感じられない場合が多い。

しかし、「HEARTalk™」の画期的な点は、話しかけた人間の声の調子に応じて、自然な調子で応答してくれる対話システムを構築できる点だ。例えるなれば、まるで“人間同士の会話”のような受け答えをしてくれるのだ。

HEARTalk™搭載の電子工作基板を使えば、人間との対話のような会話が機械とできる。

声の強弱、長短、高低、間、抑揚を分析し最適な自然な返答を実現

では、一体どのようにして自然な応答を可能にするのだろうか。その技術的な背景には、“韻律”を分析するヤマハ独自の技術が関係する。

“韻律”とは音の調子のことで、声の強弱、長短、高低、間、抑揚などのことだ。ヤマハによると、人間が会話をしている時は、相手の会話の内容だけではなく、この韻律を読み取って返答時の声の調子を変化させ最適なものにしているらしい。

一方、今の機械音声や対話音声システムは、この韻律に関係なく、一方的な音程や間などで返答してしまうためにどうしても不自然に感じてしまうのだそうだ。

ヤマハでは、この会話における韻律のルールを発見して以来、2012年夏ごろから開発をスタートさせ、2013年には試作が、2014年には今の原型となるものが完成した。その後最終的には、2015年に創設された新規事業・価値の社内公募制度である「Value Amplifier」でその価値が認められ、晴れて2016年5月に「HEARTalk™」として世に発表されることとなった。

ヤマハの浦氏は「人間の対話にはテキスト情報以外の要素が非常に大きな役割をはたしています。特に日本語は同じ『はい』でも音程や声色、強弱、間、など微妙なニュアンスによって相手に与える印象が大きく異なります。人と人との会話にもこうした音楽的な法則が働いている。それを発見したことが「HEARTalk™」の新しさではないか。」と語っている。

さらに「HEARTalk™」では、「うん」、「はい」といった相槌だけでなく、「おはよう」などの挨拶、更には「んーと」とか「えーと」などのフィラー（Filler）という概念、いわゆる間投詞にも対応しており、会話に隠れている人間の感情や、微妙なニュアンスを細かく表現することができる。

例えば、同じ「おはよう」などの挨拶でも、語りかける人間がゆっくり話しかると、それに応じてゆっくりと答えてくれたり、話す側の人間の態度や感情に応じた対応が可能なのだ。

今回発売された「HEARTalk™ UU-001」は、この「HEARTalk™」を自作のロボットや機械に組み込める電子工作基板だ。

電子楽器「ウダー」を製作者としても知られるウダデンシの宇田道信氏が、ヤマハからの技術提供のもとで企画・製造を担当した。随所に宇田氏のこだわりが反映されており、返答用の音声ファイルをPCから自由に入れ込むことが出来たり、Arduinoやラズベリーパイから対話をコントロール出来るようになっている。

現在、「HEARTalk™ UU001」は、スイッチサイエンスの公式サイトで販売されており、価格は税込み￥9,180だ。

約半世紀つづくヤマハの半導体とデジタル音源の進化の系譜

今回の「HEARTalk™」はどのような背景から生まれたのだろうか。はそこにはヤマハの半導体開発の歴史がある。、ヤマハと半導体の歴史は長く、その始まりは1971年にさかのぼる。飽くなき音への探究心からエレクトーン用の音源LSIを独自開発。

その後FM音源を初めて搭載したシンセサイザー「GS1」を1980年に発表。音楽シーンを激変させたあの「DXシリーズ」もFM音源搭載のシンセサイザーだ。さらに1990年代にはパソコンやゲーム機などの音源チップとして採用されることでヤマハの半導体はさらに広がり、2000年代には携帯電話の着メロ用の音源チップで市場を席巻した。

は、最近では初音ミクなどでも採用されている「VOCALOIDTM」を半導体用に改良した「eVOCALOID」にも対応した歌って奏でる音源チップ「NSX-1」が話題を呼んだ。

このようにヤマハは音に関するさまざまな半導体を世に送りだしてきた。

そして今回、「自然な対話」を実現する「HEARTalk™」の機能を汎用MCUに集約することに成功。その汎用MCUを搭載した電子工作用の基板が「HEARTalk™ UU-001」として登場した。まさにヤマハの半導体とデジタル音源の進化の系譜を踏襲した画期的な製品といえよう。

まとめ　音声認識システムとの融合でさらなる拡大も

現在、「HEARTalk™」を使った新たな音声対話システムの実現に向けて、音声認識で国内最大手の株式会社フュートレックと、高度な音声合成技術を持つNTTテクノクロス株式会社、そしてヤマハの3社によるの共同開発がすすめられている。

音声認識技術の展開といえば、人工知能（AI）での展開が注目される分野だ。AppleのiOS搭載の「Siri」やAndroid OSの「Google Assistant」などが有名だが、最近ではアマゾンの音声認識・対話機能基盤「Alexa」なども登場し、機械や自動車などへの搭載も普及し始めている。

「HEARTalk™」の開発がさらに進めば、会話を内容と音楽的要素の両方で分析し、あたかも人と会話しているような機械との自然な対話も実現するかもしれない。今後の展開にも更なる注目が集まりそうだ。

i-MKAERでは光造形3DプリンターForm3＋やレーザー焼結3DプリンターFuse 1、Raise3Dシリーズなど多彩な3Dプリンターのノウハウ、販売をご提供しています。ご質問や無料サンプルや無料テストプリントなどお気軽にご相談ください。

自然応答技術「HEARTalk™」を搭載した電子工作基板登場

声の強弱、長短、高低、間、抑揚を分析し最適な自然な返答を実現

約半世紀つづくヤマハの半導体とデジタル音源の進化の系譜

まとめ 音声認識システムとの融合でさらなる拡大も

関連記事

関連記事

3Dプリンター・3Dスキャナーなどお気軽にお問合せください。

まとめ　音声認識システムとの融合でさらなる拡大も