ШІ для аудіокниг

An icon of a key

ШІ для аудіокниг працює дуже добре. Він не ідеальний, але працює. Автори та видавці зараз регулярно використовують інструменти ШІ у виробництві аудіокниг, переважно для книг, де повномасштабне виробництво аудіокниг з акцентом на оповідача є фінансово недоцільним. І не лише для англомовних аудіокниг, а й для аудіокниг у перекладі.

Використання ШІ для аудіокниг не є новим; я вперше повідомляв про цю тенденцію у Publishers Weekly у 2021 році. Але нові великі мовні моделі дали новий поштовх технології автоматизованого озвучування аудіокниг.

У 2021 році я зазначав: “Чи це ідеально? Звичайно, ні. Чи може бути достатньо добре? Мабуть, якщо видавець готовий витратити необхідний час на етапі редагування голосу проекту.” Два з половиною роки потому, за багатьма оцінками, голоси ШІ невідрізняються від людських голосів, якщо не слухати дуже уважно.

Минулого листопада Meta (Facebook) представила “Seamless,” що здатна “переносити тони, емоційні вирази та якості стилю голосу” у переклад 200 мов. Аудіокнига може бути негайно перекладена на кілька мов з надзвичайною якістю.

Також у 2021 році я повідомляв, що “Заборона Audible на розповсюдження аудіокниг з нелюдськими оповідачами є реальною проблемою, яку може знадобитися деякий час, щоб вирішити.” Тим часом, і Google, і Apple оголосили програми, які дозволяють авторам створювати аудіокниги з голосами, згенерованими ШІ. 5 грудня Findaway Voices від Spotify почала приймати “аудіокниги з цифровим голосовим озвученням від Google Play Books для розповсюдження до обраних роздрібних партнерів.”

На початку листопада 2023 року Amazon оголосила, що автори Kindle Direct Publishing (KDP) скоро матимуть доступ до сервісу, який дозволить їм “швидко та легко створювати аудіокнигу з їхньої електронної книги за допомогою віртуального голосового озвучення, технології синтетичного мовлення.” У січні 2024 року Джейн Фрідман повідомила (платний доступ), що “Audible потихеньку почала дозволяти аудіокнигам, озвученим ШІ, з’являтися в її магазині пізно восени минулого року, задовго після того, як це зробили інші роздрібні продавці.”

І, звичайно, я використовую ШІ для аудіоверсій цієї книги.