仕事の関係で、今日某電器メーカの方に自動スピーチソフト(テキストを読み込ませると自動で喋るやつ)のプレゼンとレクチャーを1時間半ほどしていただきました。
この手のソフトもしばらく見ない間にかなり進化したもので、昔テイさんが使ったチャターだっけ?と比べてもかなり自然な発声になっていて、ほんの時折だけある「不自然な音の繋がり」を聞き逃してしまえばほぼ『抑揚を抑えた肉声』として聞けるでしょう。・・・て言うか既に色んなところで使われているようです。声質に聞き覚えがある声だったし。
ソフト全体の容量も数百MB程度(それも恐らくほとんどは「プロのアナウンサーによって収録された様々な単音節による『声の響きのライブラリ』」でしょう)だし、家電製品組み込み(ボイスナビ等)の場合は喋らせる内容が限定されるのでその10分の1位まで容量を落とせるそう。Webサーバにインストールして動かすことも出来るみたい。
たださすがに導入金額は高くて・・・・↑では便宜上「ソフト」と書いたけれどパッケージソフトとして販売されている訳では無く実際は「SDK+利用状況に応じた課金(「自然に発話させるソフトウェア+その為の音声ライブラリ」に対する使用料金が初期導入費用とは別にかかる、ということ)」というサービス体系になっていて、初期導入費用だけで50万必要。 まあそれだけ開発にコストがかかっていることは間違い無いのですが。
で、このソフト日英中韓4か国語対応。中国語や韓国語のナレーターはなかなかいないよな、と思い「中国語、韓国語での発音はどうなんですか?」と聞いたところ”実は韓国語が一番完成度が高く、中国語と日本語がその次位”との事。それもそのはず、このソフト基礎開発チームは韓国でやってるそうで。 あひゃー。
コメント