最近、合成音声等で講演をすることを聞く機会が増えてきました。文章を読み込ませて、それが、自動的に音声となる、というのは、とても画期的なテクノロジーで、読み手にとってはこれほど楽なことはないと思います。ですが、聞き手にとってどうか、というのは、微妙で、そのことと、合成音声で聞かせる未来を考えてみました。
聞きやすさについては、メリット/デメリットがあるなー、というところです。喋り間違えがない、とか、癖がない、とかは聞きやすい要素です。ただ、抑揚がない、とか、感情がこもっていない、というのもあるので、長時間聞くのは辛いかな、、と思います。平板な喋り方が辛いのは、人間でも一緒ですが、ITだと、それがより徹底されてしまいます。
あと、もう一つの問題として、関係性が構築しづらい、ということがあります。Youtubeでも音源でも、人が喋っていると感情移入しやすく、関係性を感じるので、聞きやすい、という面があります。合成音声だと、なかなか、感情移入はしづらく感じます。特に、〇〇さんがやるセミナー、という触れ込みで申し込んで、音声が合成だったりすると、若干、戸惑いを覚えるのも事実です。
解決策はどうするか、というと、いくつかあります。一つは、最初から合成音声で押し通すことです。実は、慣れ、というところがあります。最初から、合成音声で聞いていると、慣れてしまい、そちらが自然と感じます。逆に、投稿主が読んだ方が、つまづいたりとして聞きにくい、と感じることもあります。ゆっくりボイスも、聴き慣れると不自然でなく、むしろそちらでないと寂しく感じてしまうかもしれません。
あとは、特に課金が伴うサービスの場合は、きちんと、そのことを申し込む前に言っておくことです。申し込んだ後で、実は、合成音声でした、とか、言われても、なんだかなー、と感じてしまいます。特に、話す人との関係で、申し込んで、それをされてしまうと、不信感まで感情が流れてしまいます。無料なら、仕方がないかな、と思えるのですが、課金されてそれだと、どうなのか、と思います。
それと、ハイブリッド、というのはあるかも。一部はその人が喋って、もう一部は合成音声にする、というのであれば、まあ、受け入れやすいかな、、と思います。ただ、えてして、中途半端になる可能性もあって、注意が必要です。
もしかしたら、今は、過渡期かもしれなくて、ITの進展によっては、抑揚や感情移入もできるようになるかもしれないし、特定の人物と同じような声色にできるかもしれません。ですが、今は、聞き手の感覚はそれほどまで行っていない、というのもあります。合成音声を活用すれば、話者の負担は格段に減らせるので、その辺りのバランスは気をつける必要があるでしょう。