オーディオブックのためのAI

An icon of a key

オーディオブックのためのAIは非常によく機能します。完璧ではありませんが、機能します。現在、著者や出版社は、全規模のナレーター中心のオーディオブック制作が経済的に実現不可能な場合に、主にAIツールをオーディオブック制作に使用しています。そして、それは英語のオーディオブックだけでなく、翻訳されたオーディオブックにも適用されています。

オーディオブックのためのAIの使用は新しいものではありません。私はこの傾向を2021年にPublishers Weeklyで報告しました。しかし、新しい大規模言語モデルは、自動オーディオブックナレーションの技術を再活性化させました。

2021年に私は「完璧ですか?確かにそうではありません。十分に良いですか?おそらく、出版社がプロジェクトの音声編集段階に必要な時間を費やす意欲があるならば」と述べました。2年半後、多くの報告によれば、AIの声は非常に注意深く聞かなければ人間の声と区別がつかないほどです。

昨年11月、Meta(Facebook)は「Seamless」を導入しました。これは「トーン、感情表現、声のスタイルの特質」を200の言語の翻訳に転送できるものです。オーディオブックは、驚異的な品質で複数の言語に即座に翻訳できます。

また、2021年には「Audibleによる非人間のナレーターを使用したオーディオブックの配信ブロックは、解決には時間がかかる可能性がある実際の問題です」と報告しました。その間に、GoogleとAppleの両方が、著者がAI生成の声でオーディオブックを作成できるプログラムを発表しました。12月5日には、SpotifyのFindaway Voicesが「Google Play Booksからのデジタル音声ナレーションオーディオブックの一部の小売パートナーへの配信を受け入れ始めました」。

2023年11月初旬、AmazonはKindle Direct Publishing(KDP)著者が「合成音声技術を使用して、電子書籍のオーディオブックバージョンを迅速かつ簡単に制作できるサービスにまもなくアクセスできるようになる」と発表しました。2024年1月、Jane Friedmanは「Audibleは昨年の秋に他の小売業者が同じことをしてからしばらくして、静かにAIナレーションのオーディオブックをストアに導入し始めた」と報告しました(有料記事)。

そしてもちろん、私はこの本のオーディオブックバージョンにもAIを使用しています。