V-Tuber ZERO

エイベックススタジオで収録した個人の声を音声合成技術で再現・保存できる「デジタルボイス・プレミアム」が提供開始

エイベックス子会社のコエステ株式会社(本社:東京都港区、代表取締役社長:加藤信介)は、40年以上にわたる研究開発により培われた音声合成技術をもとに、エイベックスのスタジオで収録する音源から個人の声の特徴を学習し、いつでも音声出力できるようになる「デジタルボイス・プレミアム」を2020年9月8日より提供開始することを明らかにしました。

「デジタルボイス・プレミアム」は、自分の声をさまざまな分野で広く活用したい、もしくは病気などの事由で今の声を残しておきたいと考える個人向けのサービスで、収録した音声からその特徴を抽出した声の分身=「コエ」を作成しておくことで、テキストを入力するだけでその人の声色や喋り方を再現した合成音声をいつでも生成することが可能です。

「デジタルボイス・プレミアム」詳細ページ

以下プレスリリースより引用。

■「デジタルボイス・プレミアム」について

活用できるシーンは多岐にわたり、たとえば忙しい経営者に代わって本人不在の場でも広く講演やプレゼンテーションを行ったり、創業者の「コエ」で何代にもわたって従業員に新しいメッセージを届けたりできるようになります。また自身の葬儀や大切な人の冠婚葬祭などで、生前の「コエ」でメッセージを送ることや、もし病気や怪我などで声を失っても、自身の「コエ」でリアルタイムにコミュニケーションを取り続けることなどが可能になります。また今後は、SNSメッセージを送信者本人の「コエ」で送ったり、スマートスピーカーの音声を身近な人の「コエ」で出したりなど、各種サービス企業との連携実現を目指しています。

音声合成とは、人間の音声を人工的に作り出す音声情報処理の一分野で、昨今IoTの普及などで音声インタフェース(Voice UI)の重要性が高まり、スマートスピーカーの音声や動画のナレーションなど活用される場が急速に広がっています。一般的にはロボットのような無機質な機械音のイメージが大きい音声合成ですが、当社が提供する「コエステーション」は、収録音声の音色や抑揚、リズムなどの特徴を合成音声に最適に反映する技術や、 統計的な学習に基づく滑らかなパラメーターを生成するコア技術により、人間に近い自然な発話が可能で、その再現性の高さが特徴です。

今後IoT化が加速し、音声インタフェースを持つサービスやデバイスがさらに広がっていく中、特定の個人や有名人の「コエ」による音声出力へのニーズは高まっていくことが予想されます。当社は「コエ」を活用できる可能性のある多方面の分野における各種サービス企業との連携を進めており、当サービスが活用できるシーンはこれからさらに広がっていく予定です。

収録スタジオの例

活用シーンの例

■関連リンク

コエステ株式会社

参考コエステ株式会社 プレスリリース