오디오북을 위한 인공지능

An icon of a key

오디오북을 위한 인공지능은 매우 잘 작동합니다. 완벽하지는 않지만, 효과적으로 작동합니다. 저자와 출판사들은 이제 오디오북 제작에서, 특히 전체 스케일의 내레이터 중심 오디오북 제작이 재정적으로 현실적이지 않은 경우에, 인공지능 도구를 일상적으로 사용하고 있습니다. 이는 영어 오디오북뿐만 아니라 번역된 오디오북에서도 마찬가지입니다.

오디오북을 위한 인공지능 사용은 새로운 것이 아닙니다; 저는 2021년에 Publishers Weekly에서 이 트렌드에 대해 처음 보도했습니다. 하지만 새로운 대형 언어 모델들이 자동화된 오디오북 내레이션 기술을 다시 활성화시켰습니다.

2021년에 저는 “완벽한가요? 확실히 그렇지 않습니다. 충분히 좋을 수 있나요? 아마도, 출판사가 프로젝트의 음성 편집 단계에서 필요한 시간을 기꺼이 투자한다면 가능합니다.“라고 언급했습니다. 2년 반이 지난 지금, 많은 보고에 따르면, 인공지능 음성은 매우 주의 깊게 듣지 않으면 인간 음성과 구별할 수 없을 정도로 향상되었습니다.

작년 11월 Meta(Facebook)는 “Seamless“를 도입하여 200개 언어로 번역할 때 “톤, 감정 표현, 음성 스타일 품질“을 전이할 수 있게 했습니다. 오디오북은 즉시 여러 언어로 번역될 수 있으며, 그 품질은 매우 뛰어납니다.

또한 2021년에 저는 “비인간 내레이터가 있는 오디오북의 배포를 차단하는 Audible의 정책은 해결하는 데 시간이 걸릴 수 있는 진짜 문제입니다.“라고 보도했습니다. 그동안 Google과 Apple은 저자들이 인공지능으로 생성된 음성으로 오디오북을 만들 수 있는 프로그램을 발표했습니다. 12월 5일에 Spotify의 Findaway Voices는 “Google Play Books에서 디지털 음성 내레이션 오디오북을 선택된 소매 파트너에게 배포하기 위해” 수락하기 시작했습니다.

2023년 11월 초, Amazon은 Kindle Direct Publishing(KDP) 저자들이 “가상 음성 내레이션, 합성 음성 기술을 사용하여 전자책의 오디오북 버전을 빠르고 쉽게 제작할 수 있는” 서비스를 곧 이용할 수 있게 될 것이라고 발표했습니다. 2024년 1월, Jane Friedman은 (paywall) “Audible은 작년 가을 늦게 타 소매업체들이 이미 했던 것처럼 인공지능 내레이션 오디오북을 조용히 상점에 허용하기 시작했습니다.“라고 보고했습니다.

그리고 물론, 저는 이 책의 오디오북 버전에도 인공지능을 사용하고 있습니다.