Революція штучного інтелекту в книговиданні (Українське Видання)
Революція штучного інтелекту в книговиданні (Українське Видання)
Thad McIlroy
Buy on Leanpub

Table of Contents

Вступ

“Наступна революція застане нас зненацька, як завжди. Іншими словами: якщо натовп очікує революцію, це не може бути революцією.” —Doc Searls, 2002

Пройшло більше року і півтора з тих пір, як OpenAI представила ChatGPT публіці, яка здебільшого не була знайома зі штучним інтелектом. Спочатку здавалося, що він не має очевидного відношення до видавничої справи. З тих пір все змінилося. І нічого не змінилося. Видавці починають занурюватися в нові інструменти ШІ, досліджуючи їх межі, і ведуть обережні бесіди з ChatGPT. Але немає жодних ознак справжньої революції в практиці видавництва; це просто надто рано.

Є багато невизначеності навколо ШІ у письмі та видавництві. Великі суперечки стосуються використання ШІ. Проте, для багатьох існує захоплення можливостями.

Я зосереджуся тут більше на обіцянках, ніж на небезпеках, але я включаю огляд занепокоєнь і ризиків, пов’язаних з ШІ, особливо тих, що стосуються авторів і видавців. Я не намагаюся применшити занепокоєння. Просто це не те, про що ця книга.

Це книга?

Я вважаю це видання більше “брошурою”, ніж книгою. Визначення книги за версією ЮНЕСКО - “щонайменше 49 сторінок” (чому не 50?), і, при 300 словах на сторінку, ця робота може не відповідати вимогам. Але, що важливіше, вона не має на меті бути остаточним словом у чомусь - це більше звіт про прогрес. Штучний інтелект і його роль у видавничій справі змінюються із шаленою швидкістю, яка не показує жодних ознак уповільнення. Тому ця книга (брошура), цей звіт, є лише миттєвим знімком.

Використовуючи платформу Leanpub, я випускаю свої дослідження та аналіз як роботу в процесі - це переглядається як живий документ. Я ніколи раніше не намагався цього зробити. Мої причини дві: запропонувати щось корисне в короткостроковій перспективі та мати можливість переглядати це за потребою. Історія ШІ далеко не завершена.

Я сподіваюся, що мій підхід буде корисним для читачів, хоча я усвідомлюю, що занадто багато оновлень можуть скоро стати дратівливими. Я намагався зменшити актуальність цієї книги, щоб зменшити акцент на речах, які швидко змінюються.

Версію, яка була (тихо) доступна з квітня 2024 року, я позначив як “75% завершено” і пропонував безкоштовно читачам. 23 липня - офіційна дата публікації “100% завершеної” версії, яка також знайде свій шлях до ширшого розповсюдження за межами Leanpub. Я продовжуватиму оновлювати 100% версію: але ці оновлення будуть доступні тільки покупцям Leanpub - постійно оновлювати друковані видання, електронні книги та аудіокниги, які знаходяться у ширшому розповсюдженні, незручно.

Біль видавців через сам ШІ

Щодня я чую про біль, який відчувають люди в усьому видавничому бізнесі, намагаючись зрозуміти ШІ. Чому це так болісно? Ось три причини, які я бачу:

  • Технологія складна і загадкова, надто складна для розуміння не науковцями. (Є фасцинуюче дослідження, яке пропонує “шкалу тривоги щодо ШІ (AIAS)”, що вимірює 21 різну причину, через яку люди відчувають тривогу щодо ШІ.)

  • ШІ став дуже суперечливим у видавничій справі, головним чином через питання авторських прав, які вражають саму суть авторства та видавництва.

  • Є також атмосфера FOMO - страху пропустити щось важливе. Незважаючи на численні недоліки ШІ, як і з багатьма привабливими технологіями (Apple Watch? Розумні колонки?), ми відчуваємо це нав’язливе почуття: а що, якщо я пропускаю наступну дійсно велику подію, як пропустив кілька останніх великих подій. Тоді я відчував себе дурнем; не хочу знову відчувати себе дурнем. Це боляче.

Добре: зрозуміло, що люди у видавничій справі відчувають біль через ШІ.

Так навіщо тоді ця книга?

Ця книга для тих, хто працює у видавничій справі, або для авторів, які намагаються краще зрозуміти видавничу справу, і вам набридло відчувати себе дурнем і збентеженим через ШІ. Занадто багато ваших колег здається краще розуміють це, ніж ви, і вам набридло не мати можливості інтелектуально спілкуватися на цю тему.

Моя мета для читачів полягає в тому, щоб до кінця цієї книги вони відчували себе здатними приєднатися до розмови, висловити обґрунтовану думку. Я хочу, щоб ви відчували себе готовими приймати особисті рішення щодо технології та мали шлях для навчання використанню ШІ, якщо ви вирішите це зробити.

Я не хочу навантажувати читачів великою кількістю розмов про основи технологій штучного інтелекту — я не буду багато говорити про ШІ в абстрактному сенсі. Натомість я хочу дати вам знання про ШІ спеціально для написання та публікації книг. Якщо хтось запитає вас, що насправді означає обробка природної мови, ви зможете відповісти, як і я: я не є експертом з ШІ. Але я знаю, як ШІ використовується в моїй галузі.

Чи буде це саме те, що вам потрібно знати?

Мені не подобається фраза “що вам потрібно знати”, оскільки вона так рідко відповідає своїй обіцянці, часто не потрапляючи в ціль, або надто багато, або надто мало. Чи зможу я зробити це правильно? Я серйозно намагаюся передати мінімум. Я думаю, що знаю, що видавцям потрібно знати про ШІ, оскільки я багато розмовляв з ними, проводячи семінари та вебінари, спеціально розроблені для надання лише основної інформації.

An icon of a key

Замість того, щоб безкінечно повторювати фразу “що вам потрібно знати”, я буду використовувати логотип ключа з деяким відступленим текстом.

Після зведень, що вводять багато розділів, я розширю основні концепції. Я також зберіг їх якомога коротшими, хоча, правду кажучи, інколи я можу відволікатися.

Коротка форма, яку я буду використовувати, це “Чат ШІ”. Коли OpenAI вперше випустила ChatGPT, це був єдиний продукт на ринку, але тепер з’явилося кілька важливих конкурентів. Я розповім про конкретику пізніше, але ви вже чули про деякі з них, очевидно, Google та Microsoft. Вони (та кілька інших компаній) тепер пропонують онлайн-програмне забезпечення для чатів ШІ, схоже на ChatGPT. І тому, замість того, щоб говорити “ChatGPT та його конкуренти”, я просто буду називати всю категорію “Чат ШІ”. Якщо я напишу “ChatGPT”, я буду мати на увазі конкретно програмне забезпечення OpenAI.

Книга в основному практична, але в останньому розділі я запропоную есе про те, які можуть бути реальні наслідки ШІ для індустрії публікації книг, поряд з кількома іншими гіпотетичними роздумами.

Для кого ця книга?

Основна аудиторія цієї книги — видавці книг для споживачів. Друга аудиторія — всі інші видавці книг (наукові, освітні…), настільки, наскільки є перетини в цих галузях. Моя третя аудиторія — це автори, які мають інтерес у грі, та багато інших, хто захоплюється публікацією книг.

Підзаголовок говорить, що це керівництво з ШІ як для письменників, так і для видавців. Частково це тому, що я хочу, щоб видавці також розуміли, що письменники роблять з цією технологією. Я вважаю, що це важливо. На своєму нещодавньому щорічному засіданні BISG (Група досліджень книжкової індустрії), яка в основному представляє видавців книг для споживачів, зазначила, що “вона прагне залучити ширше коло, включаючи літературних агентів та авторів.” Це вітається.

Я хочу, щоб письменники читали цю книгу, оскільки це може допомогти їм зрозуміти, що видавці роблять з їхніми рукописами. Самовидавці завжди тримають одне око на традиційній публікації, частково тому, що вони, по суті, є видавцями самі по собі, і тому технологія ШІ, яка цікавить видавців, може бути цікавою і для них.

Але, не помиліться, це не практичний посібник для авторів про те, як використовувати ШІ, щоб бути кращими та продуктивнішими письменниками. Є безліч книг на цю тему (на жаль, багато з них просто шахрайські підробки на Amazon). І багато відео на YouTube (різної якості).

У межах публікації книг для споживачів мій ідеальний читач не обов’язково є приймаючим рішення, а скоріше одним з багатьох людей, які працюють у галузі щодня, створюючи книги та знаходячи читачів. Я буду говорити про всі ключові функції публікації в цій книзі, від редагування до продажів і розповсюдження. І про перетин письменників з читачами.

Хоча я виріс у Канаді і почав свою кар’єру в публікації там, я базуюся в Сан-Франциско, у Сполучених Штатах, і тому схильний думати про видавничу індустрію США. Але майже все в цій книжці має бути так само актуальним для видавця на Мадагаскарі, як і для видавця в Манхеттені. Хоча видавці в менших країнах стикаються з проблемами масштабу, так само і невеликі видавці в Америці, і ця книжка призначена для компаній усіх розмірів.

Коли я говорю з маленькими видавцями про ШІ, і коли я говорю з дуже великими видавцями про ШІ, велика різниця, яку я помічаю, це поняття видавничого ‘підприємства’. Найбільші видавці часто є частиною (або поруч з) публічних компаній, і коли ви стаєте публічною компанією, питання репутації та безпеки стають набагато важливішими, ніж для звичайного видавця, який не підзвітний таким чином акціонерам та засобам масової інформації. Хоча редактор у великому видавництві може використовувати ті самі інструменти ШІ, що і фріланс-редактор, який працює для менших організацій, контекст, у якому вони використовують ці інструменти, зовсім інший.

Скільки ви повинні знати про ШІ, щоб читати цю книгу?

Я припускаю, що моя аудиторія має приблизно нульові знання про внутрішню структуру ШІ, але що це розумні читачі. Тому я буду балансувати між нульовими знаннями і не говорити з читачем з висоти.

Я уявляю, що майже всі чули про нове покоління ШІ: згідно з опитуванням YouGov у березні 2024 року, лише 7% американців не знають “нічого взагалі” про ШІ. Письменники та видавці майже напевно чули про деякі скарги на авторські права, але, ймовірно, не мають уявлення про проблеми. Тому я не буду пояснювати, що ШІ означає “штучний інтелект”. Але я не буду припускати, що читачі можуть визначити, що таке ШІ, що це означає, його потенційний вплив тощо. Ось чому ви тут.

Доступність як загалом, так і конкретно

Мій девіз для публікації цієї книги – “доступність”.

Для більшості людей це просто означає щось на кшталт “наявності”, і, справді, я маю намір зробити цю книгу доступною у всіх можливих формах і форматах. Я хочу розширити контейнер. Я намагаюся зробити свою книгу зразковою публікацією, підкреслюючи весь спектр того, що можна досягти сьогодні при публікації однієї книги.

На Leanpub ви знайдете книгу у форматі PDF, EPUB та як безкоштовну веб-публікацію. Ви знайдете переклади на 31 мову, включаючи основні азійські та європейські мови. Буде кілька аудіокниг на основних мовах.

Я також зроблю книгу доступною у друкованих та цифрових форматах на всіх електронних платформах, які можна отримати через Ingram та Amazon. Це включає більшість онлайн-магазинів книг у багатьох країнах світу. Таким чином, бібліотеки також зможуть придбати книгу, хоча, зрозуміло, у них мало місця для самовидавчих робіт. (Я подарую друковані та цифрові копії будь-якій бібліотеці у світі, яка їх запросить.)

Крім безкоштовної веб-версії повної книги, я створю безкоштовні уривки, Q&A та інфографіку для тих, хто просто хоче посмакувати або ознайомитися. Вони будуть доступні через мій блог.

Немає сенсу записувати відео всієї книги, коли доступні аудіокниги. Але деякі люди віддають перевагу доступу до контенту через відео. Тому я пропоную скорочені відео-версії різної тривалості.

А як щодо людського дотику? Я також буду доступний через вебінари або індивідуальні онлайн-консультації через мій веб-сайт та блог. Мене навіть можна найняти, щоб я з’явився особисто!

“Доступність” означає набагато більше, ніж її словникове визначення. Як кажуть у Канадській національній мережі рівноправного бібліотечного обслуговування (NNELS), “Доступна книга – це та, яку можуть використовувати та розуміти всі.” Тому мій англійський файл EPUB відповідає рекомендації W3C 1.1 для людей з обмеженими можливостями читання, включаючи надійні описи alt text для зображень. Ми очікуємо, що цей стандарт доступності буде дотриманий і для перекладів іноземними мовами.

Alt-текст був створений за допомогою ChatGPT. Я не редагував версію ChatGPT, щоб кожен, хто читає EPUB, міг побачити, наскільки добре це виходить, і де ще є недоліки. Як нагадує мені мій колега Білл Касдорф, хороший alt-текст описує те, що бачить читач із поганим зором, а не лише те, як це виглядає.

Для видавців книг доступність більше не є опцією: це стандарт за замовчуванням.

(У мене є два mea culpa, якими хочу поділитися: Через обмеження платформ публікації, файл PDF за замовчуванням, на жаль, не відповідатиме стандарту PDF/UA, і я не зможу запропонувати великодруковану версію книги на електронних комерційних сайтах. Але обидва варіанти доступні за запитом.)

Деякі господарські питання

Як зазначено, ця книга (відносно) коротка. Коли ви називаєте короткий документ “книгою”, ви ризикуєте, що покупці будуть протестувати: “Я думав, що купую книгу, а це лише 50 сторінок!” Я зробив усе можливе, щоб було зрозуміло на сторінці продажу, що це не повноцінна книга, але якщо ви розчаровані, пам’ятайте, що Leanpub пропонує 60-денну гарантію повернення грошей, і я з радістю продовжу цю пропозицію до “назавжди”. Я хочу, щоб читачі були задоволені, а не розчаровані. (Якщо ви купили книгу на іншій платформі, напишіть мені: я надішлю чек!)

Книга містить багато гіперпосилань (вони з’являються по-різному в різних форматах, але часто як виноски). Я завжди вірив у те, що потрібно посилатися на оригінальні джерела в своїй роботі, щоб читачі могли перевірити мої іноді амбітні заяви. Але я розумію, що гіперпосилання і виноски можуть відволікати, особливо якщо ви використовуєте електронний пристрій для читання. Вибачте за це. Найкраще - ігнорувати посилання під час читання і повертатися до них, якщо ви хочете глибше зануритися в тему.

Я не знаю, у якому форматі ви зараз читаєте (або слухаєте). Або якою мовою. Я намагався зробити “ергономіку” книги максимально зручною для користувача, але посилання і виноски не завжди оптимальні з цієї точки зору.

Ця книга має спонсорів, що, я знаю, є незвичним для “книги”. Я пояснюю, як працює спонсорування у розділі ‘disclosures’ наприкінці тексту.

Чому ШІ зараз?

An icon of a key

Коли я спілкуюся з видавцями, я чую про нагальні, невідкладні проблеми. І ШІ зазвичай не є однією з них.

Зростаюча вартість виробництва друкованої продукції хвилює вже кілька років, хоча зараз здається, що вона стабілізується. Підвищені витрати на розповсюдження є викликом для всіх гравців. Це веде до цінового тиску - є докази, що читачі починають опиратися поточним цінам на нові тверді обкладинки та торгові паперові книги. Я класифікую ці проблеми як ‘аналогові’ - цифрові технології мало що приносять для їх вирішення.

Потім є більш широкі ‘екзистенційні’ проблеми, які викликають все більше занепокоєння, але вони є неясними питаннями, без очевидних рішень. Сюди входять:

  • Виявлення контенту та взаємодія з аудиторією через онлайн та соціальні медіа.

  • Зміна споживчої поведінки та звичок читання.

  • Конкуренція з іншими цифровими медіа.

Я вважаю, що ШІ може бути надзвичайно корисним для видавців у цих сферах, але методи неочевидні і потребуватимуть часу для впровадження. Я опишу це в наступних розділах книги.

ШІ: Початок

Перш ніж я перейду до нудного технічного фону, я запрошую вас просто зануритися в онлайн-програмне забезпечення. Найкращі інструменти безкоштовні для гри. Є ChatGPT. І Claude.ai. Ви можете пограти з Microsoft Copilot. Або спробувати Google’s Gemini.

Саме так більшість людей починають з ШІ - я впевнений, що ви вже пробували один або більше з цих інструментів. Я також впевнений, що ви не пробували їх довго. Більшість людей, з якими я спілкуюся, витрачають лише кілька хвилин. Вони задають кілька питань, отримують очевидні відповіді і йдуть далі.

Неправильний підхід.

Я підтримую Ітана Молліка, про роботу якого я кілька разів розповім у цій книзі. У своєму блозі та в недавньому інтерв’ю, Моллік говорить про своє ‘правило 10 годин’:

“Я хочу зазначити, що 10 годин є так само довільними, як 10 000 кроків. Ні, це не має наукової основи. Це спостереження. Але це також переміщує вас з рівня, коли ви пробували це на вечір, до рівня, коли ви використовуєте це серйозно. Я не знаю, чи є 10 годин реальним лімітом, але здається, що це дещо трансформує. Ключовим є використання цього в області, де у вас є експертиза, щоб ви могли зрозуміти, у чому це добре чи погано, і вивчити форму його можливостей.”

Інший коментатор, рецензуючи недавню книгу Молліка про ШІ, зазначив настільки ж правдиве ‘правило десяти’: “Година експериментування з цими інструментами варта десяти годин читання про них.”

Ви зрозуміли ідею. Це про дію, а не роздуми. Моя книга - це роздуми. Вам потрібно забруднити руки.

ШІ: Дуже коротка історія

An icon of a key

Ще кілька років тому середній обиватель чув про ШІ як про абстракцію, або як про наукову фантастику, або як про щось, що може перемогти гросмейстера в шахах або го. Раптом ШІ всюди, створюючи хибне враження, що він новий. Навіть нові речі не зовсім нові. Але це спірне питання. ШІ мало значення для книговидання до ChatGPT. Тепер це багато значить.

Розуміння приблизно 70-річного розвитку штучного інтелекту може бути захоплюючим, але це зовсім не обов’язково, щоб оцінити те, що відбувається сьогодні.

Our World In Data добре виконує короткий огляд історії—залишу це їм.

Поточне покоління штучного інтелекту було розроблено здебільшого протягом останнього десятиліття. Потім, раптом, 30 листопада 2022 року з’явився ChatGPT. Через два місяці у нього було 100 мільйонів щомісячних користувачів, що є найшвидшим показником серед технологій, які коли-небудь виходили на споживчий ринок (для порівняння, Facebook знадобилося більше двох років, щоб досягти 100 мільйонів користувачів).

Чому такий швидкий прийом? По-перше, це захоплююче і весело. По-друге, це безкоштовно. По-третє, не потрібно купувати новий пристрій, щоб ним користуватися. І по-четверте, не потрібно жодного навчання, щоб отримати доступ до ChatGPT (або його конкурентів Chat AI). Але ті ж фактори застосовувалися і до Facebook, тож чому ChatGPT?

Як відомо, Артур К. Кларк зазначив: “Будь-яка досить передова технологія не відрізняється від магії.” Chat AI - це магія. Досвід ‘спілкування’ з машиною на повсякденній мові… це магія. Досвід сказати “Я хочу зображення книги в повітряній кулі в хмарі біля сонця,” і через кілька секунд,

Відкрита книга з повітряною кулею, що піднімається з її сторінок, плаваючи серед хмар.

… також магічний. Зображення, згенеровані GPT, починають виглядати схожими за стилем, яскравими та фантастичними. Тож я надіслав другий запит: “тепер у стилі, який виглядає як ілюстрація 15-го століття.” І ось:

Художня ілюстрація повітряної кулі з вишуканими візерунками, що плаває серед хмар із сонцем на задньому плані.

Якщо я хочу відео книги в повітряній кулі в хмарі біля сонця, є понад десяток інструментів на вибір, і вуаля. І музичний саундтрек до відео. Ну як це звучить? Це просто як магія.

Щоб не здатися зневажливим до надзвичайних здібностей штучного інтелекту, відносячи його до категорії незрозумілої “магії,” цікаво дізнатися, що багато вчених, відповідальних за поточне покоління штучного інтелекту, зізнаються, що вони насправді не розуміють точно, як це працює. Як зазначено в недавньому випуску MIT Technology Review, “незважаючи на свій шалений успіх, ніхто точно не знає, як—або чому—це працює.” Це хвилює, але трохи лякає.

Розуміння штучного інтелекту та деякі ключові терміни

An icon of a key

Штучний інтелект супроводжується великою кількістю технологій та термінології, більшість з яких незрозумілі всім, крім фахівців з обробки даних. Користувачам Chat AI не потрібно глибоке знання термінології штучного інтелекту чи технічних концепцій. Розмовний характер системи дозволяє інтуїтивні взаємодії без спеціальних знань про те, як усе працює. Зосередження на тому, що Chat AI насправді може робити, є важливішим.

Готуючи цю книгу, я боровся з тим, що є ‘відповідальним’ для мене як автора книги про штучний інтелект. Звичайний підхід - це надати коротке пояснення науки та огляд часто використовуваних термінів.

Я не збираюся цього робити.

Я запропоную тут кілька зовнішніх посилань на те, що я вважаю досить зрозумілими короткими описами основ штучного інтелекту.

Яке майбутнє штучного інтелекту?: McKinsey & Co. (квітень, 2024) має хороший набір пояснень.

Також Gartner’s Generative AI (не датовано) не поганий.

Futurepedia пропонує непоганий огляд Основ штучного інтелекту (травень, 2024).

Відмовившись від того, як це зробити, я тепер представлю деякі терміни, які, на мою думку, є цінними для розуміння. Не тому, що ви повинні їх знати, щоб користуватися програмним забезпеченням. Тільки тому, що цей набір термінів стосується деяких ключових аспектів того, як насправді працює поточне покоління штучного інтелекту.

Мій випадок використання для розгляду цих термінів і концепцій - це автори та видавці, які (i) хочуть піти на рівень глибше в штучному інтелекті, з будь-якої причини, або (ii) хочуть зрозуміти контекст поточних критичних зауважень щодо штучного інтелекту, або (iii) хочуть внести свій вклад у стратегічні дискусії про те, як їхні колеги чи організації повинні підходити до штучного інтелекту.

Іншими словами, це не те, що вам потрібно знати, а те, що вам може бути цікаво знати. Ось вони, у неалфавітному порядку:

Підказки та підказування

Ви можете відкрити програмне забезпечення Chat AI і просто ввести питання, так само, як ви робите це зараз у Google.

Велика мовна модель (ВММ)

Великі мовні моделі працюють, аналізуючи величезну кількість (переважно) письмових матеріалів, що дозволяє їм передбачати, які слова або речення мають бути наступними у розмові або творі. Вони не «розуміють» мову у людському сенсі, натомість обробляють текст, розбиваючи його на менші частини (так звані токени), а потім перетворюють токени у числа. Вони обробляють текст як числа, перетворюючи більше чисел, які потім знову перетворюються на текст на виході. Це надто спрощене пояснення того, чому Chat AI не «містить» захищені авторським правом роботи: він побудований з чисел, які представляють величезну абстракцію від початкових текстів.

ВММ навчаються на тому, як зазвичай використовується мова, і потім генерують відповіді на основі цього розуміння. Ми схильні недооцінювати, наскільки передбачуваною є більшість мови. Chat AI може генерувати текст, який (іноді вражаюче) схожий на існуючу літературу, але за дизайном не має можливості відтворювати конкретні уривки або копії захищених авторським правом текстів. (Я знаю, багато з вас чули про позов New York Times проти OpenAI - Times змогла змусити ChatGPT відтворити деякі частини раніше опублікованих статей дослівно).

Генеративний штучний інтелект

Найважливіше, що потрібно зрозуміти про цей термін, це частина «генеративний». Генеративний штучний інтелект генерує новий текст.

Генеративний попередньо натренований трансформер (GPT)

Це, найбільш технічний термін тут, описує конкретний тип ВММ, розроблений OpenAI. «Генеративний» вказує на його здатність створювати текст, «попередньо натренований» означає, що він був навчений на великому обсязі текстових даних, а «трансформер» посилається на програмне забезпечення, яке він використовує. Знання того, що означає GPT, корисне лише для того, щоб зрозуміти, що представляє собою GPT у ChatGPT.

ChatGPT

ChatGPT - це програмне забезпечення, яке ви бачите; GPT - це те, що стоїть за програмним забезпеченням. Користувачі взаємодіють із ChatGPT, а не з GPT за ним. Як зазначено вище, ChatGPT - це лише одна з декількох онлайн-систем Chat AI з подібною функціональністю.

Ще один термін, який ви часто зустрічатимете і який є незнайомим для багатьох:

Корпус

Словникове визначення корпусу - це «збірка письмових текстів» (хоча, насправді, це не завжди текст). Термін використовується з посиланням на те, на чому навчаються GPT: величезні корпуси (переважно) тексту. Нам кажуть, що найбільші корпуси містять сотні мільярдів слів. Для простих смертних це неможливо осягнути. Ви не вважаєте Вікіпедію величезною, що містить величезну кількість слів? Ну, у Вікіпедії лише 4,5 мільярда слів - GPT-4 навчався на понад трильйоні.

Я думаю, що важливо враховувати цей масштаб. Автори, зрозуміло, турбуються, що 75,000 слів, більше або менше, у їхній книзі могли бути втягнуті у велику мовну модель. Можливо, вони і були (більше про це нижче). Але якщо це так, подумайте, наскільки мала цінність будь-якої однієї книги для загальної потужності сьогоднішніх великих мовних моделей. Це справді незначно. Навіть 10,000 книг - це дрібниці.

Програмне забезпечення AI: Головні системи

An icon of a key

Я перерахував вище чотири головні системи Chat AI: ChatGPT, Claude.ai, Microsoft Copilot і Google Gemini.

Вони працюють більш-менш однаково і дають подібні результати. Тож яка з них найкраща? Це питання заводить вас у кролячу нору. Це трохи схоже на питання, яке місто пропонує найкращий пляжний відпочинок, або який позашляховик найкращий для сімей. Є величезна кількість нюансів у цих питаннях і велика кількість гордості та упереджень, що впливають на наші відповіді.

Так само і з цим, здавалося б, простим, але надзвичайно складним програмним забезпеченням. Люди стверджують, що Claude має більш тонкі навички роботи з мовою, а ChatGPT краще працює з програмним кодом. Microsoft Copilot інтегрується з пакетом програмного забезпечення Microsoft. Google Gemini може підключатися до Gmail, Google Maps і YouTube. Деякі з відмінностей мають значення; багато - незначні. І вони постійно змінюються з кожним новим випуском програмного забезпечення.

An icon of a key

«Найкраще» програмне забезпечення не буде визначено ще деякий час. Якщо ви експериментуєте з достатньою кількістю доступних інструментів, ви оберете деякі улюблені.

Є два верхніх рівні програмного забезпечення AI. Перший - це те, що можна назвати основним програмним забезпеченням, програмним забезпеченням, таким як ChatGPT та його конкуренти (Chat AI). Так більшість людей сьогодні взаємодіє з AI.

Наступний рівень - це все інше програмне забезпечення, яке забезпечує, по суті, вікно в основне програмне забезпечення. Новачки в чатах з ШІ здебільшого не стикалися з цим програмним забезпеченням, хоча воно не є рідкісним чи маловідомим. Деякі знайомі з Jasper (маркетингове програмне забезпечення) або Perplexity (пошук). Це програмне забезпечення просто не існувало б без ChatGPT та його аналогів.

Слід пам’ятати, що основне програмне забезпечення від Adobe, Microsoft, Grammarly, Zoom та інших тепер включає інструменти ШІ, але це відрізняється від програмного забезпечення, яке створене з нуля на основі інтерфейсів чатботів. (Інші, такі як Otter (транскрипції), існували до ChatGPT, але тепер вони насичені технологією великих мовних моделей.)

Нижче ми розглянемо програмне забезпечення, специфічне для видавництва, яке використовує можливості генеративного ШІ.

Парадигми програмного забезпечення

Давно, коли програмне забезпечення було кодом і тільки інженери розуміли, як воно працює. Що зробило персональні комп’ютери успішними, крім відносно низької вартості, це програмне забезпечення, яке було (відносно) легким у використанні. Ми не багато думаємо про все це; воно просто оточує нас.

Але подумайте, на мить, про Microsoft Word, програму, яку, я можу з упевненістю сказати, використовує 99% читачів цієї книги. Потрібно приблизно 10 хвилин, щоб показати комусь, як написати абзац тексту в Word. Потім можна показати їм, як створити жирний текст, курсив і як змінити основний шрифт, можливо, з Calibri на Arial або Times Roman. Потім, як зберегти файл і надрукувати файл. Як здійснити пошук і заміну.

І тоді ви залишаєте їх самостійно.

Через роки ви виявляєте, що вони все ще форматують свої абзаци в Word за допомогою пробілів і табуляцій. І все ще забувають зберігати свої файли або плутаються, яку версію вони зберегли, іноді змушені відновлювати текст з нуля. Але вони “знають, як користуватися Word.”

Word має сотні функцій, але третину часу користувачі використовують лише 5 команд: Вставити, Зберегти, Скопіювати, Скасувати і Жирний. Потрібно кілька тижнів навчання, щоб правильно освоїти розширені функції Word; функції, які можуть допомогти видавцю заощадити сотні годин часу. Але більшість цього ніколи не роблять. Я використовую Word з 1985 року, майже сорок років, і ніколи не брав курсів. Я навіть не знаю, чого я не знаю про те, як витягти повну потужність з цього програмного забезпечення.

Я говорю про це, тому що це корисний спосіб зрозуміти, чому програмне забезпечення ШІ настільки відрізняється від будь-якого програмного забезпечення, з яким ви коли-небудь працювали. Воно не поставляється з інструкцією, навіть не з Керівництвом швидкого старту. Воно поставляється з порожнім екраном і питанням: “Чим я можу допомогти.”

Привітальне повідомлення на інтерфейсі розмовного ШІ, адресоване Таддеусу, з питанням, чим можна допомогти.

Немає панелі меню, немає кнопки для натискання, немає клавішових скорочень. Ви задаєте питання, починаєте чат, і отримуєте деякі відповіді.

Інтерфейс розмовного ШІ з введенням користувача, який запитує, як пояснити різницю між новим поколінням розмовного ШІ та традиційними інструментами, такими як Microsoft Word або Excel.

Відповідь Клода:

“Є кілька ключових відмінностей між роботою з сучасним розмовним ШІ, таким як я, і традиційними інструментами, такими як Microsoft Word або Excel:

“1. Взаємодія природною мовою: З розмовним ШІ ви можете спілкуватися своєю повсякденною мовою, а не вивчати та орієнтуватися в складних меню та функціях. Ви просто пояснюєте, що хочете досягти, у розмовній манері.

“2. Контекстуальне розуміння: Асистенти ШІ зберігають контекст і розуміють хід розмови, що дозволяє більш природній діалог. Традиційне програмне забезпечення не має контекстуальної обізнаності від однієї команди до наступної.

“3. Адаптивність: ШІ може динамічно адаптуватися і відповідати на широкий спектр запитів, тоді як традиційні інструменти обмежені заздалегідь визначеним набором функцій. Асистент ШІ може допомогти з написанням, аналізом, математикою, кодуванням, генерацією ідей та багато іншого в одному інтерфейсі.”

Це було корисно, але я хотів щось легше для розуміння. Тож я запитав:

Запит користувача на інтерфейсі розмовного ШІ з проханням про просте пояснення для нетехнічної аудиторії.

Клод:

“Ось простий спосіб пояснити різницю людині без технічного фону:

“Думайте про традиційне програмне забезпечення, таке як Microsoft Word або Excel, як про інструмент, наприклад, молоток або калькулятор. Він має фіксований набір функцій, які він може виконувати, і вам потрібно навчитися правильно ним користуватися, щоб отримати бажаний результат.

“З іншого боку, уявіть собі сучасний розмовний AI як розумного асистента, як обізнаного колегу або друга. Ви можете просто говорити з ним звичайною англійською, і він розуміє, що ви намагаєтеся зробити. Він може допомогти вам з різними завданнями, від написання до математики і до створення ідей.

“Вам не потрібно вчити спеціальні команди чи техніки—просто спілкуйтеся з ним природно. Він адаптується до ваших потреб і запам’ятовує контекст вашої розмови. З часом він дізнається вас і ваші вподобання.

“Тому, в той час як традиційне програмне забезпечення схоже на статичний інструмент, який ви використовуєте, розмовний AI більше схожий на інтелектуального партнера, з яким ви взаємодієте природно, щоб виконати завдання. Це більш гнучкий, персоналізований та ефективний спосіб роботи.”

Гмм. Не зовсім те, що я хотів. Тому я продовжив розмову:

Відповідь розмовного AI з порадою уникати технічного жаргону та посилань, які можуть бути незрозумілі нетехнічним людям.

Клод:

“Звичайно, давайте спробую знову без використання технічних термінів:

“Уявіть, що ви говорите з другом, який дуже обізнаний і готовий допомогти вам. Ви можете просто говорити з ним звичайною англійською про те, що ви намагаєтеся зробити, будь то написання есе, розв’язання математичної задачі або обмірковування ідей для проекту.

“Замість того, щоб вчити і запам’ятовувати багато конкретних кроків або команд, ви можете просто пояснити, що вам потрібно, своїми словами. Ваш друг розуміє контекст і адаптує свою допомогу на основі того, що ви вже обговорювали.

“Це взаємна розмова, де ви можете ставити питання, уточнювати речі і отримувати поради. І чим більше ви спілкуєтеся з цим другом, тим краще він розуміє ваші унікальні потреби і стиль спілкування.

“А тепер уявіть, що ви можете мати той самий тип корисної, легкої взаємодії, але з комп’ютерною програмою. Це основна ідея нових типів програмного забезпечення, про які ви, можливо, чули.

“Замість старого стилю програмного забезпечення, де є жорсткий набір функцій і потрібно вчити правильний спосіб його використання, це нове програмне забезпечення більше схоже на обізнаного друга. Ви можете просто говорити з ним розмовно, і він зрозуміє, як вам допомогти на основі природного потоку вашої дискусії.

“Отже, це розумніший, більш персоналізований і легший спосіб отримувати допомогу з усіма видами завдань на вашому комп’ютері, просто розмовляючи з ним, як з людиною. Це ключова різниця від старого, більш жорсткого стилю програмного забезпечення.”

Резюме: Я намагався зробити дві речі з цими прикладами. Одна з них - запропонувати дуже простий приклад того, чому програмне забезпечення чат-ботів так відрізняється від будь-якого програмного забезпечення, яке ми коли-небудь використовували. І інша - проілюструвати, як один чат може розвиватися. Це не просто одне питання і одна відповідь. Це розмова. Це велика частина прориву.

Чат-AI є свого роду поєднанням інтерна та обізнаного консультанта. Ви не можете припускати, що вони знають, що ви маєте на увазі. Вам потрібно пояснити, що ви хочете, чому ви це хочете і як вони можуть бути найбільш корисними.

Три види програмного забезпечення AI

An icon of a key

Грубо кажучи, сьогодні доступні три види програмного забезпечення AI. Перше - це базові платформи AI, як ChatGPT, основна технологія AI. Друге - назвемо це, доповнення AI, програмне забезпечення, яке створено на основі основних платформ. Ви не чули про багато з них, такі як Jasper або Rewind.

Моя третя категорія - це програмне забезпечення з AI-інструментами, приєднаними до існуючого продукту. Наприклад, у пакеті програмного забезпечення Microsoft з’явилися нові AI-інструменти в Word, Excel і PowerPoint. Adobe додала технологію AI до Photoshop і Acrobat. Grammarly перебудовується на основі нової генерації технології LLM. Це в основному той самий продукт, але з додаванням AI.

Стає ясно, що майже все програмне забезпечення, яке ви використовуєте сьогодні, незабаром матиме AI-функції. Вам потрібно буде самостійно оцінити, чи ці інструменти дійсно корисні або просто є вітринами AI.

Мене більше цікавлять нові інструменти, створені з нуля, щоб забезпечити цінність, яку може надати лише AI. Це наступне покоління програмного забезпечення.

Робота з програмним забезпеченням AI

На жаль, я користуюся Windows (це довга історія), тому я говорю про свій досвід доступу до програмного забезпечення AI через комп’ютер з Windows, а не Mac. Оскільки все програмне забезпечення тут є браузерним, не повинно бути різниці у використанні цих інструментів на Mac. Але я не даю ніяких гарантій.

Вам знадобляться деякі гроші, щоб грати в гру AI, але не дуже багато. Як описано вище, багато базового програмного забезпечення можна отримати через безкоштовні версії. Але зазвичай вам потрібна платна підписка під час тестування, і підписка повинна коштувати близько $20/місяць. Скасуйте після того, як ви його спробували (не забудьте!). Якщо ви бачите щось, що коштує $79/місяць або, не дай Бог, $159/місяць, ви можете це ігнорувати. Вони не думають про вас як про потенційного користувача; вони думають про великих основних корпоративних користувачів.

Навчання для Chat AI

An icon of a key

Сучасний AI оманливо простий. Будь-хто, хто може набрати питання, може ним користуватися. Але користуватися ним добре - це складно, що на перший погляд не має сенсу, доки ви не зануритеся в складнощі, пов’язані з “запитами” та іншими подібними концепціями.

Щоб отримати доступ до його інтелекту, іноді вам доводиться розмовляти з ним так, ніби він ідіот. Або, можливо, ідіот савант. Це трохи схоже на персонажа, якого грав Дастін Гоффман у фільмі Людина дощу.

Будь-хто може використовувати ChatGPT. Просто зайдіть на chat.openai.com і ви зможете отримати доступ до найновішої версії, GPT-4o, безкоштовно (існують деякі преміум-функції за додаткову $20/місяць).

Коли ви заходите на ChatGPT, ви бачите в основному порожній екран і неявне питання “Як я можу вам допомогти сьогодні?”

Ви можете задавати йому питання. Ще краще, ви можете завантажити великий PDF і задавати питання щодо файлу. Ви також можете завантажувати зображення, які він може описувати, або відскановану сторінку: він може розпізнавати текст, навіть якщо він написаний вручну.

Те, що стало ключовою проблемою для успішного використання Chat AI, це навчитися “розмовляти” з ним (що ви буквально можете зробити в останній версії мобільного додатку). У Chat AI це називається створенням “запитів” або “створенням запитів”. Користувачі виявили, що чим точніші та детальніші їхні запити, тим кращі відповіді вони отримують від ChatGPT. Крім того, запити не є одноразовими. Chat AI може продовжувати розмову протягом певного часу (хоча не нескінченно), і якщо ви не отримали потрібну відповідь, ви можете переглянути та уточнити свої запити. Це вимагає багато часу, щоб звикнути, і породило серію посібників, написаних і онлайн, для навчання користувачів, як отримати максимум від запитів.

Спробуйте попросити будь-яке програмне забезпечення Chat AI пояснити концепцію, як-от розвивальне редагування. Потім попросіть його скласти пояснення, яке зрозуміє 12-річна дитина. Результати будуть кардинально різними. Кумедно, але Chat AI, здається, також реагує на емоційні прохання. Додавання “це дуже важливо для моєї кар’єри” до запиту може витягнути більш корисні відповіді.

(Це найкращий час додати примітку: Це одночасно заспокоює і глибоко тривожить, що найкращі вчені, які працюють над мовними AI, не можуть пояснити, чому такі речі відбуваються.)

Як створювати запити

An icon of a key

“Створення запитів” - це специфічна навичка, яка є важливою для ефективного використання Chat AI.

З усієї різноманітної термінології, яку захопили під час золотого буму AI, “запити” і “створення запитів” є найкращими. Ви насправді не “розмовляєте” з Chat AI. Ви не “задаєте” йому питання (або, не повинні - це не так працює). Ви запитуєте ці двигуни для відповідей, а не для простих відповідей.

Спочатку я думав, що аналогія може бути з театральними підказками. Підказник підштовхує актора, який втратив рядок, змушуючи його повернутися в дію. Але це не точно, тому що запит AI не послабляє шматок запам’ятованого тексту - це не так працює генеративний AI. Дайте AI двигуну один і той же запит кілька разів, і відповіді завжди будуть хоча б трохи різними.

Щойно я попросив ChatGPT “перелічити ключові елементи ефективного створення запитів”. Я запитав вдруге, і відповіді були тематично послідовними, але досить різними в деталях. Висвітлені теми включали:

  • Будьте конкретними

  • Уникайте двозначності

  • Надавайте контекст

  • Використовуйте чіткі інструкції

В певному сенсі це доволі дивно: AI добре розуміє мову - хіба він не повинен розуміти, що ви маєте на увазі, без педантичного створення запитів? Але саме це майстерність мови робить створення запитів найбільш потужним. Скажіть йому точно, що ви маєте на увазі, а не приблизно.

Говоріть з ним як з корисним асистентом, знаючим радником, яким ви хочете, щоб він був, а не як з дитиною з вулиці.

Висновок тут такий: принаймні на даний момент ефективне використання інструментів AI на основі великих мовних моделей вимагає хоча б знайомства з найкращими практиками створення запитів. Майстерність у створенні запитів буде відповідно винагороджена.

Галюцинації: Муха в мазі

An icon of a key

AI, заснований на великих мовних моделях, вигадує речі. Просто робить. Це загалом називається “галюцинації”. Це реальна проблема, серйозна проблема. Ви повинні розуміти галюцинації, якщо збираєтеся працювати з AI.

Cambridge Dictionary’s Word of the Year for 2023 was “Hallucinate,” whose definition has been expanded to include “When an artificial intelligence… hallucinates, it produces false information.” (Other additions to the 2023 dictionary include “prompt engineering,” “large language model,” and “GenAI.”)

AI hallucinations, Cambridge notes, “sometimes appear nonsensical. But they can also seem entirely plausible–even while being factually inaccurate or ultimately illogical.” This, sadly, is quite true, and as of July 2024 remains a dramatic limitation for using generative AI for mission-critical tasks. It’s one of the several great oddities of AI, and it takes people a while to get their heads around it. Remember, generative AI is mostly a next word prediction engine, not a database of facts. Hence the need for HITLs, Humans-In-The-Loop, as we’re now known, double-checking AI output. And again, it’s remarkable that we can get such extraordinary value from a technology that can produce provably inaccurate output. So it goes.

Гері Маркус, досвідчений і добре поінформований критик ШІ, порівнює ілюзії ШІ з поламаними годинниками, які два рази на день показують правильний час. “Він правий деякий час,” каже він, “але ви не знаєте, в який саме час, і це значно зменшує його цінність.”

Ітан Моллік, головний доповідач на конференції Publishers Weekly у вересні 2023 року, зазначає, що люди, які використовують ШІ, очікують 100% точності. Ілюзії, каже він, схожі з “рівнем помилок у людей,” які ми щодня терпимо.

Андрей Карпати, відомий вчений, який спеціалізується на ШІ і зараз працює в OpenAI, пише про ілюзії:

“Я завжди трохи борюся, коли мене запитують про ‘проблему ілюзій’ у великих мовних моделях. Тому що, в певному сенсі, ілюзії – це все, що вони роблять. Вони – машини для снів.

“Ми спрямовуємо їхні сни за допомогою підказок. Підказки починають сон, і на основі туманного згадування тренувальних документів великої мовної моделі, більшість часу результат виходить корисним.

“Тільки коли сни переходять у фактично неправильну територію, ми позначаємо це як ‘ілюзію.’ Це виглядає як помилка, але це просто велика мовна модель робить те, що вона завжди робить.”

Це не лише проблема вигадування речей. Чат-ШІ – це глибоко недосконале програмне забезпечення.

Для багатьох запитів, особливо від новачків, відповіді є звичайними, неточними або просто непотрібними. Чат-ШІ має проблеми з рахуванням: попросіть його написати блог довжиною 500 слів, і вам пощастить, якщо отримаєте 150.

І кожна з компаній, що займається ШІ, щоб зменшити упередження і уникнути відповідей на запити типу “як зробити бомбу,” встановила жорсткі обмеження на свої продукти: занадто часто відповідь на запитання фактично звучить як “Ні, я не відповім на це.” Я запитав Google Gemini переглянути чернетку цього тексту і отримав попередження, що “важливо отримати схвалення автора перед публікацією.”

Перевірка фактів

An icon of a key

Я стверджую, здебільшого на глухі вуха, що ілюзії – це технологічна проблема, яка знайде технологічне рішення. Так, вони властиві великим мовним моделям, але їх можна обійти.

Розглянемо це: я попросив чотири чати ШІ перевірити наступні твердження:

  • Станом на 2024 рік, у Нью-Йорку базуються 6 великих міжнародних видавництв. Вони відомі як Велика шістка.

  • Електронні книги продовжують домінувати у продажах книг у Сполучених Штатах.

  • Borders і Barnes & Noble – дві найбільші мережі книжкових магазинів у Сполучених Штатах.

  • Після спаду продажів під час Covid, продажі книг у США знову зростають двозначними цифрами.

Усі вони виявили помилки в перших трьох твердженнях. Кожен з них трохи заплутався на четвертому, не бувши впевненим у ступені підвищення продажів під час Covid і подальших тенденціях продажів. Це маленький, нерепрезентативний експеримент, але ці чати ШІ, які не призначені для роботи з фактами, можуть робити достовірну перевірку фактів, яку більшість випадкових спостерігачів пропустить.

А як щодо зображень і відео?

An icon of a key

Оскільки торгівельне книговидання більше залежить від тексту, ніж від зображень, видавці схильні не помічати новаторські інструменти на основі ШІ для зображень і відео.

Вони важливі для розуміння революції ШІ будь-ким. Але обговорення занадто велике для доступного простору: я просто не зможу його справедливо висвітлити.

Рекомендую авторам і видавцям: пограйте з функціями генерації зображень у ChatGPT – вони безкоштовні і веселі у використанні. Потім зробіть пошук за “відео та ШІ” і дивуйтеся деяким прикладам, які ви знайдете на пов’язаних сайтах. Хоча інструмент ще не доступний публічно, Sora від OpenAI надає деякі приголомшливі приклади відео, створених лише з текстових підказок.

Програмне забезпечення для видавців книг

Мало програмного забезпечення, створеного з нуля спеціально для видавців книг (хоча для авторів є багато доступних варіантів).

Наукові видавці мають більше можливостей, з різноманітними інструментами ШІ для дослідження, написання та публікації.

Для торгових видавців більшість варіантів стосується ШІ та аудіо. Позаяк аудіо, вибір зосереджується навколо інструментів редагування та маркетингу. Також існує декілька інструментів для виявлення контенту на основі ШІ і інструментів та послуг для ліцензування контенту.

Програмне забезпечення для редагування орієнтоване на авторів, а не на професійних редакторів — авторів набагато більше, ніж редакторів, і якість, яку вимагають професійні редактори, набагато вища, ніж для (переважно самостійно виданих) авторів.

Інструменти маркетингу також націлені ширше, ніж просто на видавців книг, а на маркетологів усюди, з інструментами для веб-контенту, генерації текстів та оптимізації пошукових систем (SEO). Jasper.ai є лідером у цій категорії та заявляє, що HarperCollins є його клієнтом.

Shimmr, спонсор цієї книги, є інструментом створення рекламних оголошень на основі ШІ, спеціально для видавців книг. Компанія та її засновник Надім Садек були описані в статті в Publishers Weekly за травень 2024 року.

“Що ми робимо, так це використовуємо ШІ, щоб врахувати психологічний профіль книги та зіставити його з настроєм конкретної аудиторії, забезпечуючи більш ефективний зв’язок між читачами та книгами,” сказав Садек у інтерв’ю PW. “Ми називаємо це ‘Книжковою ДНК’, і це включає не лише знання персонажів і сюжету книги, але й цінностей, інтересів і емоцій книги.”

Звертаючись до Книжкової ДНК, інструменти ШІ Shimmr потім створюють цільові рекламні оголошення для пошукових і соціальних медіа-каналів (наразі Google та Meta). Оголошення зображаються у вигляді дисплейних оголошень, що містять зображення, згенеровані ШІ, супроводжувані слоганами.

Я вказую видавцям, що оцінюють Shimmr, що він може забезпечити додатковий дохід, що ми очікуємо від нового інструменту реклами/маркетингу.

Якщо ви хочете випробувати інше програмне забезпечення, можливе лише завдяки ШІ, ознайомтеся з Hypnovels, яке анімує розділи у художніх книгах. “Нарація, зображення та рух, усе згенероване ШІ, поєднуються з чудовим сюжетом таким чином, що менш буквально, ніж традиційна анімація (отже, “гіпно”), і більш сенсорно захоплююче, ніж аудіокнига, у стилі, який робить розділ унікальним і привабливим.”

Інший новий постачальник, що виник завдяки можливостям ШІ, - це Veristage (також спонсор цієї книги). Veristage пропонує Insight, свого “AI Publishing Assistant,” завданням якого є виконання різних функцій видавництва.

Подорож з Insight починається з рукопису. Завантаження ранньої версії відкриває безліч інструментів, деякі з яких більш цінні для редакторів, інші - для маркетологів. Після роботи з будь-якими та всіма функціями можна завантажити PDF-звіт, який включає редакторські аспекти, такі як стиль написання, тропи, кліше та використання прислівників і прикметників, а також маркетинговий контент, такий як описи, метадані, унікальні торгові пропозиції, порівняння, контент, оптимізований для Amazon, та запропоновані пости у соціальних мережах.

Що мені найбільше подобається в Insight, так це те, що він підходить до застосування ШІ до видавничого процесу в цілому, а не вимагає збирання кількох програмних інструментів, кожен для різної функції.

Також хочу підкреслити тут свою видавничу платформу Leanpub. Вони були чудовими в роботі. Маленьке – це красиво: вони ризикують з технологіями та послугами, від яких великі компанії відмовилися б. Найбільше цікавить авторів і менших видавців їхній новий сервіс TranslateWord, де ви можете перекласти книгу, написану в Microsoft Word, на до 31 мов за допомогою API GPT-4o (який є основою ChatGPT). Саме це я використовую для перекладу цієї книги.

Я шукав інші сервіси для перекладу книг. Є багато перекладацьких компаній, деякі з яких використовують ШІ. Єдиний, кого я знайшов, який пропонує переклад книг, - це DeepL. Але це не основний напрямок діяльності компанії. Зараз Leanpub - це місце, куди варто звертатися.

Бізнес-програмне забезпечення для видавництва книг

An icon of a key

Існуючі постачальники бізнес-систем, що обслуговують видавничу індустрію, починають впроваджувати технології ШІ, як ми бачимо у великих компаніях, таких як Salesforce і Oracle.

Я говорив з кількома постачальниками програмного забезпечення для видавництва, зокрема з Firebrand, і всі вони розглядають можливості, але діють обережно.

Я з нетерпінням чекаю можливості поговорити про ШІ з різноманітною групою учасників на Форумі інновацій у видавництві Firebrand у вересні 2024 року у Нешвіллі, Теннессі.

knk провів два вебінари щодо ШІ і випустив білій папір, але (станом на 26 червня 2024 року) ще не оголосив про жодні функції ШІ у своїх продуктах.

Virtusales нещодавно запустив свої перші інструменти з підтримкою штучного інтелекту, включаючи маркування зображень, генерування альтернативного тексту, інструменти для редагування тексту, створення копій для продажу та маркетингу та їх переклади.

Я спілкувався з Klopotek на їхньому Klopotek Publishing Radio. Вони “розпочали ініціативу ШІ у сфері обслуговування клієнтів”, хоча жодних деталей поки немає.

Supadu, що пропонує видавцям “веб-дизайн, рішення для електронної комерції та даних,” тепер має “Supadu Smart AI,” (pdf) з “відеооглядом заголовка з аватаром і Smart Buy,” “промоційними матеріалами, керованими аватаром, для маркетингових та продажних команд,” і “легким багатомовним перекладом відео авторів та заголовків.”

Програмне забезпечення ШІ для видавців книг: стартапи

Деякі люди знайомі з моєю роботою щодо стартапів, пов’язаних із технологіями видавництва книг. Є звіт у Publishers Weekly, що описує цю роботу, і посилання на базу даних.

Як ви побачите у звіті, я досить широко розглядаю стартапи у сфері видавництва книг. Я не включаю нові видавничі компанії, якщо вони не займаються чимось незвичним з технологіями. Основний критерій: чи використовуєте ви технології для спроби оживити якийсь аспект видавничого процесу? У моїй базі даних більше 1600 компаній, більшість з яких було засновано після того, як Amazon випустив перший Kindle у 2007 році.

Після того як ви отримаєте загальне уявлення про базу даних, ви можете почати більш глибоко заглиблюватися. На вкладці праворуч ви побачите спосіб сортування лише за стартапами, що стосуються ШІ.

Знімок екрану таблиці з інструментами та послугами з вибраним фільтром для ШІ, що підкреслює кількість 243.

Як ви бачите на ілюстрації, є понад 240 стартапів, пов’язаних з видавництвом, що використовують ШІ (станом на початок липня 2024 року). Ми окремо рахуємо стартапи аудіовидавництва, які використовують ШІ, і загальна кількість перевищує 300 компаній. Більшість, понад 280, було засновано після появи ChatGPT у листопаді 2022 року. Цей обсяг нових бізнес-стартапів є безпрецедентним у видавництві книг. Це вражає.

Як характерно для всієї бази даних, ці стартапи ШІ в основному орієнтовані на авторів (70%). Приблизно 13% прагнуть обслуговувати видавничі компанії. 10% орієнтовані на дитяче видавництво.

Близько 50 стартапів орієнтовані на читачів з різноманітними інноваційними пропозиціями. Декілька з них — платформи для розповідання історій. Є досить багато систем для створення резюме. Є кілька сайтів для відкриття нових книг, “Використовуйте ШІ, щоб знайти свою нову улюблену книгу.” Швидке покращення голосів, згенерованих ШІ, призвело до вибору інструментів “прочитай мені”.

І деякі цікаві ідеї, які були б неможливими без ШІ.

Bookshelf: Reading Tracker — це поєднання додатку для відкриття книг та особистої бібліотеки, який включає “автоматичне відстеження часу, цілі для читання та нагадування, а також інсайтфульну статистику та тренди.” Його ШІ-бібліотекар “може генерувати резюме та флеш-картки, обговорювати ключові ідеї та висновки і багато іншого.”

Мій друг Рон Мартінез нещодавно запустив сайт Inventionarts.ai, який представляє “новий розмовний медіум.” Як пояснює сайт, “Говоріть з кількома особистостями ШІ, кожна з яких має свою ідентичність, експертизу та усвідомлення. Запрошуйте різних персонажів приєднатися до вас у сценаріях. І ви також можете грати вигадану роль!” Літературна гра, так би мовити.

Як характерно для більшої групи стартапів, багато з цих стартапів є малими або мікроскопічними, лише одна людина з веб-сайтом і напівготовою ідеєю. Я включаю їх усіх — хто знає, куди вони прямують.

Я настійно рекомендую вам пограти з базою даних. Натисніть кілька посилань. Думаю, вас потішить інноваційність і сміливість багатьох з цих організацій.

Один із спонсорів цієї книги, Book Advisors, спеціалізується на злиттях та поглинаннях у видавничій індустрії. Я завжди раджу інноваційним стартапам шукати партнерів, і Book Advisors — це місце, куди я їх відправляю для обговорення процесу. У видавничій сфері є кілька відомих фірм із злиття та поглинання, до яких можна звернутися, зокрема The Fisher Company та Oaklins DeSilva+Phillips. Book Advisors — єдина фірма, яку я знаю, що також працює з технологічними стартапами.

Штучний інтелект і книговидання: Що зараз робить індустрія?

An icon of a key

Діяльність, пов’язана зі штучним інтелектом, багатьох відомих торгових груп видавництв, схоже, додає їхні голоси до хору тих, хто стурбований авторським правом. Асоціація американських видавців “подала відповідні коментарі в розслідуванні Бюро авторських прав США щодо перетину законодавства про авторське право та штучного інтелекту (AI)...”

Асоціація видавців Великобританії зазначає, “що це має надзвичайне значення, щоб уряд якомога швидше впровадив відчутні рішення для захисту людської творчості та знань, які є основою безпечного та надійного AI.”

З іншого боку, Гільдія незалежних видавців (IPG), що налічує понад 600 членів, пропонує керівництво щодо AI та навчання своїм членам, включаючи “Практичний посібник з AI у видавництві,” проведений відомим експертом з AI і видавництва, Джорджем Воклі.

Тут, у США, я маю честь бути частиною Робочої групи з AI Групи дослідження книжкової індустрії (BISG), яка підзвітна Комітету з робочих процесів. Робоча група окреслила кілька потенційних стратегічних ініціатив:

  • Розробка найкращих практик та стандартів: Рекомендації щодо найкращих практик, пов’язаних з використанням AI, з урахуванням етичних настанов, існуючих регуляцій та законів. Це включає прозорість у AI-генерованому контенті та його розкриття споживачам.

  • Огляд та визначення галузі: Проведення опитувань для збору широких галузевих уявлень про поточне та потенційне використання AI, а також встановлення чітких визначень і меж того, що AI означає в контексті книговидання.

  • Періодичні звіти та огляди: Надання періодичних звітів, щоб допомогти галузі передбачити та адаптуватися до швидких змін, викликаних технологіями AI.

Інші асоціації письменників та видавців також намагаються випередити цю тему. Деякі виступають проти AI; інші просто намагаються допомогти своїм членам зрозуміти технологію та, можливо, експериментувати з нею.

Штучний інтелект і книговидання: Що роблять видавничі компанії?

Рік тому питання про те, що роблять видавничі компанії, було відповіддю: “не так багато.” Відтоді не багато змінилося, але деяка активність була. Я зосереджуся на видавцях торгових книг; наукові та академічні видавці більш активні. Ось деякі з того, що я виявив.

Hachette: За даними звіту за листопад 2023 року у The Bookseller у Великобританії, Hachette опублікувала заяву про позицію щодо AI, пропонуючи розрізнення між ‘операційним’ використанням та ‘творчим’ використанням. Компанія “чітко зазначила, що заохочує ‘відповідальні експерименти’ для операційного використання, але виступає проти ‘машинної творчості... з метою захисту оригінального творчого контенту, створеного людьми’.”

HarperCollins: За даними звіту за квітень 2023 року в Publishers Weekly від Ендрю Альбанезе та Еда Науотки, генеральний директор HarperCollins Брайан Мюррей сказав:

“Ми знаємо, що це буде важливо і матиме значний вплив на нашу галузь протягом наступних трьох-п’яти років. І тому я думаю, що багато хто з нас намагається зрозуміти, як це зробити, і переконатися, що ми використовуємо це етично і морально, що допоможе нам обслуговувати авторів і надавати професійні послуги авторам і не конкурувати з авторами та розповіданням історій.

“І це, я думаю, виклик. Можливо, не так сильно для всіх видавців, які тут присутні, але я гарантую, що є багато маленьких технічних команд по всьому світу, які можуть прагнути зайняти нашу нішу. Вони не видавці, вони не редактори. Вони технологи і бачать можливість.”

Penguin Random House (PRH): Bertelsmann, материнська компанія PRH, пропонує білу книгу під назвою Стан гри: дослідження трансформаційних ефектів генеративного ШІ на медіа та розважальну індустрію, яка включає розділ про видавництво книг.

Також, згідно з звітом у Publishers Lunch, компанія “впровадила власний внутрішній додаток ШІ, названий PRH ChatGPT.”

У статті зазначається, що внутрішні документи PRH пояснюють, що програма “‘може використовуватися для оптимізації процесів, підвищення креативності та надання даних висновків’ у всіх відділах. Компанія пропонує, що серед використань додатку є резюмування книг та документів; редагування електронних листів; складання блог-постів або описів вакансій; аналіз текстових даних і ‘генерація ідей для контенту.’”

Simon & Schuster: Генеральний директор компанії Джонатан Карп отримав згадку в New York Times “Найбільш запам’ятовувані літературні моменти останніх 25 років” з цитатою, опублікованою у Publishers Weekly з травня 2024 року на виставці U.S. Book Show. Він сказав, що ШІ не був “слоном у кімнаті,” а скоріше “більше схожий на цикаду у світі. Знаєте, багато дзижчання і багато парування.”

Він визнав, що ШІ “безумовно є цінним інструментом. Він точно зробить нас більш ефективними. Він допоможе нам краще обробляти і збирати інформацію, і, сподіваюсь, дозволить працівникам виконувати роботу на вищому рівні, яка є більш цікавою та креативною.”

У березні, на Лондонському книжковому ярмарку, як повідомляється у The Bookseller, Карп сказав, що компанія також розглядатиме іноземні мовні версії аудіокниг, згенерованих ШІ “на територіях, де [твори цього автора] ніколи інакше не мали б шансу через вартість [аудіопродукції].”

ШІ та книговидання: випадки використання

An icon of a key

Конкретні випадки використання ШІ у книговиданні, у різних функціях, легко описати концептуально. Але доступно мало інформації про те, що насправді роблять видавці.

Кіт Ріґерт, генеральний директор Ulysses Press та Perfect Bound, виступив на Publishers Weekly U.S. Book Show у травні 2024 року, пропонуючи найповніший огляд випадків використання ШІ у видавничих компаніях, який я бачив. Perfect Bound є спонсором цього звіту; я підтримую цю заяву. Він пропонує “20 практичних способів, як ви, як видавничий професіонал, можете почати використовувати ШІ прямо зараз.”

Його презентацію, Початок роботи з ШІ, можна переглянути та завантажити з вебсайту Perfect Bound.

Що відбувається, коли ШІ читає книгу?

Я спеціально запозичую цей заголовок розділу з розсилки Ітана Молліка — немає потреби намагатися його покращити. Моллік є професором у Wharton School при Університеті Пенсильванії, який вивчає підприємництво та інновації. Його розсилка, яку я часто рекомендую, є спокійною, освіжаючою та унікально проникливою.

Серед речей, які кваліфікують Молліка як коментатора, є те, що він не має особистого інтересу. Йому не потрібно продавати ШІ, ані критикувати його. Він просто зобов’язався досліджувати ШІ у його численних впливах, в основному на освіту, культуру, письмо та видавництво. І він є чудовим, ясним письменником.

Якщо ви переглянете архіви розсилки Молліка, ви побачите, що він не почав зосереджуватися на ШІ до грудня 2022 року. Це не була його тема — як і для більшості з нас, ШІ з’явився у його щоденній роботі, і він не міг відвести від нього очей.

У цьому пості його інсайти найбільше наближаються до нашого інтересу як професіоналів видавництва. “Чи може ШІ,” запитує він, “змінити спосіб, у який ми взаємодіємо з книгами?”

Щоб відповісти на це питання, Моллік зазначає, “нам потрібен як ШІ з достатньо великою пам’яттю, щоб утримати книгу, так і автор, який добре знає свою книгу, щоб оцінити результати ШІ.” Моллік тестує один зі своїх кількох творів (він не уточнює, який саме, але з чату це явно Тінь єдинорога: боротьба з небезпечними міфами, що стримують стартапи, засновників та інвесторів, книга, яка отримала схвальні відгуки на Amazon, хоча і не є бестселером на даний момент).

Моллік розглядає різні аспекти потенційної цінності штучного інтелекту для автора, видавця чи читача, включаючи “ШІ як читач і редактор” та “практичне використання: допомога для викладачів.” Він просить ВММ — велику мовну модель — не ChatGPT — підсумувати книгу. Це вдається на задоволення Молліка.

Потім складніше завдання: “Дайте мені приклади метафор у книзі.” Метафора, зазначає він, “є складною навіть для людських читачів, оскільки вона передбачає використання образної мови без чітких маркерів (на відміну від порівняння, тут немає “як” чи “мов”).” Результати, він записує, “вражаючі, хоча є незначні помилки.”

ВММ менш успішна як редактор: її недоліки в цій галузі, зауважує Моллік, ілюструють “щось, що стало зрозумілим про поточний стан ШІ: якщо ви дуже хороший письменник або редактор, ви кращий за поточний ШІ…”

Проте, “ШІ має, або принаймні здається, що має, розуміння контексту та значення тексту.” Як результат, Моллік вірить, що “як ми ставимося до книг, ймовірно, зміниться завдяки ШІ.”

Я теж так думаю.

ШІ та дизайн і виробництво книг

An icon of a key

Експертні системи та автоматизація процесів все ще випереджають ШІ, коли йдеться про дизайн і виробництво книг.

Програмне забезпечення для автоматичного набору тексту книг існує щонайменше з 1970-х років. У середині 1980-х я керував програмним проектом під назвою PageOne, заснованим на TeX Дональда Кнута, який міг набрати книгу за хвилини. SGML з’явився приблизно в той самий час, заснований на стандарті документа, введеному в 1969 році. Його значною мірою замінив XML, введений у 1996 році. Ці надійні мови розмітки створюють тверді структури для автоматизації.

Настільне видавництво принесло ще один раунд автоматизації для QuarkXPress та Adobe InDesign, а також Adobe Illustrator та Adobe Photoshop. Видавничі робочі процеси можна керувати за допомогою різних програм і систем.

Організація, за якою варто стежити, це Coko Foundation. Вони пропонують набір інструментів з відкритим вихідним кодом для управління виробництвом та видавництвом, включаючи Kotahi, платформу для наукового видавництва, та Ketty для виробництва книг, яка включає ШІ Асистента. Kotahi AI PDF Designer, “перетворює дизайн PDF у простий, інтерактивний процес.”

Є деякі ранні ініціативи щодо впровадження ШІ у робочі процеси InDesign. У квітні 2024 року Adobe оголосила про функцію Text to Image. Треті сторони можуть випереджати Adobe тут: інноваційні постачальники переддрукарської підготовки та виробництва в Індії, такі як Hurix Digital та Integra, проявляють більше ініціативи, ніж Adobe, у використанні ШІ для виробництва.

ШІ та маркетинг книг

An icon of a key

Вплив ШІ на маркетинг книг буде поверхневим у короткостроковій перспективі, але в довгостроковій перспективі набагато глибшим. Багато залежить від того, що ви сприймаєте як “маркетинг книг”; це змінюється.

“Легкі здобутки” очевидні. Запитайте Chat AI, щоб допомогти з описом продукту чи прес-релізом. Запитайте його, щоб запропонував кілька ключових слів. Це він може зробити, без особливих зусиль. Але більшість професіоналів видавничої справи можуть зробити те саме, лише з незначними зусиллями.

Використання випадків Кіта Рігерта, пов’язаних вище, включає пропозиції для мозкового штурму назв, складання звіту з цифрового маркетингу та створення трекера цифрової маркетингової кампанії в Google Sheets.

Програмне забезпечення Shimmr, описане вище, натякає на форму автоматизованого маркетингу, що прийде.

ШІ та метадані

An icon of a key

Що ШІ має спільного з метаданими, і навпаки? Його роль досі видається скромною; очікуйте значних змін.

Метадані є основою для виявлення книг. Ви чули це достатньо разів, щоб відчути нудоту від цього застереження. Це відбиває бажання головним чином тому, що “метадані” залишаються невловимими для більшості не технічних людей. Якщо ви скажете: “це просто базова інформація про книгу, назва, опис, ціна, категорії тем, щось на зразок цього,” люди видихають. З цим їм комфортно. Але це майже все.

На жаль, мушу нагадати вам, що метадані — це далеко не лише кілька деталей про книгу. Це набагато більше. Більше, ніж я можу охопити в цій маленькій книзі. Я був співавтором цілої книги на цю тему. Ingram публікує Metadata Essentials, чудовий короткий том. Скажу це тут, і не в останній раз: автори та видавці нехтують своїми метаданими на свій страх і ризик.

ШІ може допомогти з генерацією метаданих. Наприклад, видавець самостійних публікацій PublishDrive, пропонує “Генератор метаданих книги на основі ШІ”, який надає рекомендації ШІ щодо назви книги, анотації, категорій Amazon, категорій BISAC та ключових слів.

Insight від Veristage, описаний вище, може генерувати описи, ключові слова, категорії BISAC та визначати цільову аудиторію.

Декларування використання ШІ у метаданих

An icon of a key

Ви можете подумати, що величний світ метаданих буде повільним, щоб охопити ШІ. Не так! Минулого листопада EDItEUR, хранитель стандарту ONIX, випустив коротку Застосункову Примітку під назвою “Аспекти ШІ в ONIX.” (pdf)

Зі своєю типовою глибокою мудрістю, Грехем Белл, директор організації, зазначає, що “однією з реакцій на (суперечки навколо технології) є відмовитися від використання ШІ або уникати торгівлі продуктами, створеними ШІ. Більш реалістичний варіант - просто бути прозорими з торговими партнерами та читачами, коли використовується ШІ. І оскільки деякі реселери обмежують або забороняють контент на основі ШІ на своїх платформах, важливо, щоб поважні видавці підкреслювали ті продукти, які використовують генеративні техніки ШІ для створення контенту.”

Белл продовжує описувати способи, якими видавці можуть вказати у метаданих:

  • Внески ШІ

  • Голоси на основі ШІ в аудіокнигах

… а також метод, щоб вказати у метаданих для цифрових продуктів, що видавець чітко відмовляється від текстового та даних майнінгу (TDM) для використання, крім досліджень. Також є спосіб вказати окрему ліцензію, що покриває комерційний або не дослідницький TDM.

Як часто буває, те, що вказано в ONIX, може не бути виявлено вниз по ланцюжку поставок, але щонайменше було зроблено найкращі зусилля.

Стратегії інтеграції ШІ в діяльність видавництва

An icon of a key

Є кілька речей, які видавництва менш комфортно роблять, ніж інтеграція складних цифрових технологій у свої повсякденні операції. Це зрозуміло. ШІ, зокрема, викликає тривогу у всіх, і не тільки у видавництві. Він новий, загадковий, персоналізований, потужний. Люди відчувають загрозу від ШІ з багатьох причин. Зміна відносин займає час.

Але це не найкращий час бути боязким з технологіями.

Існують спокійні та раціональні підходи для інтеграції ШІ у вашу видавничу діяльність, незалежно від розміру вашої організації.

Імпульс повинен йти від верхівки. Від самої верхівки. Старші керівники повинні прийняти бачення потенційно трансформаційного впливу ШІ та передати програму співробітникам по всій організації. Програма може бути не більше, ніж “експериментуйте, документуйте свої експерименти та діліться ними.” Це хороший початок.

The Economist нещодавно згадував організаційну тактику для впровадження нових технологій під назвою “маяк підхід.” Ви створюєте маяк, обираючи один високопрофільний доказ концепції, який можна швидко реалізувати, з яким кожен може співвідноситися.

Видавництва страждають від шуму навколо авторських прав: автори в обуренні. Опитування Гільдії Авторів у травні 2023 року показало, що “90 відсотків письменників вважають, що автори повинні отримувати компенсацію, якщо їх робота використовується для навчання генеративних технологій ШІ,” і 67 відсотків сказали, що “не впевнені, чи включають їх видавничі контракти або умови сервісу платформи дозволи або надання прав на використання їх роботи для будь-яких цілей, пов’язаних з ШІ.” Тепер ці невпевнені автори запитують своїх видавців, чи використовується ШІ у редагуванні або виробництві їхньої роботи, і деякі впливові автори наполягають, щоб цього не було. Вони шукають ШІ-еквівалент пекарні без арахісу.

Це складна проблема для видавців - якщо ви не можете використовувати ШІ на книгах, які плануєте видати, то для чого ви можете його використовувати?

Розробка та комунікація політик щодо ШІ

Незважаючи на його широке використання, мало хто з видавців публічно визначив свої політики щодо ШІ та пояснив свої підходи до ШІ громадськості. Термін ‘громадськість’ має слизьке значення тут, коли ви враховуєте різні громади, на які спрямовані торгові, наукові та освітні видавці.

Для торгових видавців найважливішою аудиторією є автори та їхні агенти. Наукові видавці стикаються з іншими перешкодами, коли вони розглядають перспективний вплив ШІ на дослідження, а потім більш проблематичний вплив ШІ на перетворення досліджень у наратив (Аві Стайман написав змістовний допис на цю тему). Для освітніх видавців встановлення політик є складним процесом, оскільки втручання ШІ у практику викладання, освіти є багатогранним і складним.

Я вважаю, що видавці стикаються з двома великими викликами, коли рухаються вперед із технологіями ШІ. Перший - це розробити позицію компанії щодо загального підходу до ШІ, інтегрування ШІ у свої робочі процеси. Другий виклик - це чітко та недвозначно донести цю позицію до своїх клієнтів.

Видавницькі політики, які я бачив, здебільшого мають недоліки. Деякі з них є фактично політиками, спрямованими зовні, до авторів, з рядом застережень щодо того, що є прийнятною практикою (не багато) і що є неприйнятною (багато). Політика O’Reilly “AI Use Policy for Talent Developing Content for O’Reilly” триває сторінками, з езотеричними настановами, такими як “НЕ ВИКОРИСТОВУЙТЕ жодні OSS GenAI моделі, що продукують програмний вихід, який підпадає під умови копілефт або мережевої вірусної ліцензії з відкритим кодом.”

З іншого боку, науковий видавець Elsevier, у розділі “Elsevier Policies” на своєму сайті, включає заяви про “Відповідальні принципи ШІ”, “Текстовий та даний майнінг” та “Використання генеративного ШІ та технологій, які допомагають ШІ, у написанні для Elsevier.”

Декілька внутрішніх, неопублікованих політик видавців, які я бачив, є консервативними, надмірно так. Ці видавці реагували занадто швидко на діапазон сприйнятих і можливих загроз, і на тривоги своїх авторів, і обмежили свою здатність активно взаємодіяти з цією швидкорозвиваючоюся, швидкозмінюючоюся технологією.

Очевидно, що вони збираються використовувати ШІ “відповідально”, що б це не означало. Очевидно, що вони мають найвищу стурбованість щодо інтелектуальної власності авторів і агресивного захисту авторських прав. (Хоча, звичайно, ці загальні принципи повинні бути публічно проголошені і часто повторювані.)

Але що ще?

  • Чи дозволять вони ШІ мати роль у редакційних придбаннях? Чи може ШІ переглянути купу рукописів?

  • Чи дозволять вони ШІ мати роль у розробницькому редагуванні, построчному редагуванні та копірайтингу?

  • Чи дозволять вони ШІ мати роль у визначенні тиражів та розподілів?

  • У створенні доступних файлів електронних книг, включаючи альтернативний текст?

  • У допомозі створення аудіокниг у випадках, коли економічно нерентабельно наймати талановитих людських оповідачів?

  • У допомозі з перекладом на іноземні мови на ринки, де права ніколи не будуть продані?

  • У розробці маркетингових матеріалів у великих масштабах?

  • У спілкуванні з реселлерами?

Якщо так, вони повинні це чітко пояснити, і чітко пояснити, міркування, що стоять за цими політиками. Видавці повинні бути сміливими у протидії багатьом запереченням більшості авторів у цей час страху і сумнівів.

Питання працевлаштування

An icon of a key

Лише найбільші видавці зможуть наймати спеціалізований персонал для роботи з програмним забезпеченням і системами ШІ. Середній видавець захоче познайомити весь свій персонал з інструментами ШІ, очікуючи, що кожен з них може досліджувати використання ШІ для пошуку ефективності у своїй роботі.

На конференції PubWest у лютому 2024 року в Арізоні спікер з поза видавничої індустрії припустив, що одним із використань ШІ буде заміна стажерів. Зала вибухнула. Вона мала на увазі добре - насправді звіт New York Times від 10 квітня 2024 року описує, як інвестиційні банки на Уолл-стріт прагнуть замінити багатьох своїх стажерів на ШІ. Подібно до випадку у видавництві, очевидним питанням є: як знайти старших аналітиків, якщо вони не можуть почати як молодші аналітики?

Видавнича індустрія завжди покладалася на стажування. Дослідження 2019 року показало, що 80 відсотків людей, які працювали у видавництві менше п’ятнадцяти років, раніше проходили стажування.

Частково це спосіб виконати рутинну роботу за розумну ціну. Але це меркне перед більшою реальністю, що жодна видавнича школа не може підготувати когось до рівня середнього менеджера у видавничій компанії. Єдиний спосіб розвивати кваліфікований персонал завтрашнього дня - це навчати стажерів та учнів сьогодні.

Мета тут не в тому, щоб замінити стажерів на ШІ, а в тому, щоб зробити їх роботу більш продуктивною та винагороджуваною за допомогою інструментів ШІ, на користь як стажера, так і видавничої компанії.

ШІ для аудіокниг

An icon of a key

ШІ для аудіокниг працює дуже добре. Він не ідеальний, але працює. Автори та видавці зараз регулярно використовують інструменти ШІ у виробництві аудіокниг, переважно для книг, де повномасштабне виробництво аудіокниг з акцентом на оповідача є фінансово недоцільним. І не лише для англомовних аудіокниг, а й для аудіокниг у перекладі.

Використання ШІ для аудіокниг не є новим; я вперше повідомляв про цю тенденцію у Publishers Weekly у 2021 році. Але нові великі мовні моделі дали новий поштовх технології автоматизованого озвучування аудіокниг.

У 2021 році я зазначав: “Чи це ідеально? Звичайно, ні. Чи може бути достатньо добре? Мабуть, якщо видавець готовий витратити необхідний час на етапі редагування голосу проекту.” Два з половиною роки потому, за багатьма оцінками, голоси ШІ невідрізняються від людських голосів, якщо не слухати дуже уважно.

Минулого листопада Meta (Facebook) представила “Seamless,” що здатна “переносити тони, емоційні вирази та якості стилю голосу” у переклад 200 мов. Аудіокнига може бути негайно перекладена на кілька мов з надзвичайною якістю.

Також у 2021 році я повідомляв, що “Заборона Audible на розповсюдження аудіокниг з нелюдськими оповідачами є реальною проблемою, яку може знадобитися деякий час, щоб вирішити.” Тим часом, і Google, і Apple оголосили програми, які дозволяють авторам створювати аудіокниги з голосами, згенерованими ШІ. 5 грудня Findaway Voices від Spotify почала приймати “аудіокниги з цифровим голосовим озвученням від Google Play Books для розповсюдження до обраних роздрібних партнерів.”

На початку листопада 2023 року Amazon оголосила, що автори Kindle Direct Publishing (KDP) скоро матимуть доступ до сервісу, який дозволить їм “швидко та легко створювати аудіокнигу з їхньої електронної книги за допомогою віртуального голосового озвучення, технології синтетичного мовлення.” У січні 2024 року Джейн Фрідман повідомила (платний доступ), що “Audible потихеньку почала дозволяти аудіокнигам, озвученим ШІ, з’являтися в її магазині пізно восени минулого року, задовго після того, як це зробили інші роздрібні продавці.”

І, звичайно, я використовую ШІ для аудіоверсій цієї книги.

ШІ для перекладу книг

An icon of a key

ШІ для перекладу книг працює. Можливо, не так добре, як для автоматизованого створення аудіокниг. Але він дуже швидко наближається до цього. Нелітературна проза може бути першою. Літературна проза може піти за нею. Нонфікшн ставить перед нами інший набір викликів.

Я провів вебінар про ШІ для перекладу книг, спонсорований BISG, у червні 2024 року. Відео доступне на YouTube. Джейн Фрідман також описала програму у своєму інформаційному бюлетені Hot Sheet.

Тема є складною та багатогранною. Одне, що мене захоплює, це те, як довго люди намагаються автоматизувати переклад. Це нагадує, що книги, які заповнюють наш всесвіт, є такою малою часткою письмової комунікації, особливо в цю онлайн еру.

Уоррен Вівер, якого визнають батьком машинного перекладу (MT), зазначив своєму колезі: “Коли я дивлюся на статтю російською, я кажу: ‘Це насправді написано англійською, але закодовано якимись дивними символами. Тепер я розпочну декодування.’” Для машини мова - це просто код. Це не культура, почуття і велич письмового слова. Це задача з числами та кодом.

Очевидно, що розрив між художньою та нехудожньою літературою буде значним у перекладі ШІ. Чат-ШІ сильний у стилі, але недостатньо точний у фактах. Це дуже ранні дні, але я схильний думати, що Чат-ШІ буде блищати у художній літературі, але не зможе впоратися з нонфікшн. (Тим не менш, я продовжую машинний переклад цієї книги, наповненої фактами!)

Літературна проза - це дуже важливий аспект. Вона є дорогоцінною та шанованою, і це справедливо. Перекладачі можуть годинами сперечатися про одне слово або фразу. Чат-ШІ повинен обережно діяти в цих водах.

Але це плодотворна територія. Наскільки я можу визначити (з мінімальних даних), у 2023 році було лише 9,500 перекладів книг для торгівлі. Навіть якщо я помиляюсь на великий фактор, зрозуміло, що мало книг перекладається з іноземних мов на англійську.

Так само я знайшов статистику, яка вказує, що у 2023 році було лише 7,230 перекладів з англійської на іспанську (у іспанських книжкових ринках). Це здається смішно мало.

Тут є величезна можливість.

Більшість використання ШІ для перекладу книг буде для тих книг, де переклад ніколи не вважався економічно доцільним. Безумовно, буде вплив на роботу перекладачів “середнього ринку”; ріст роботи буде в управлінні проєктами та контролі якості. Чи компенсує це втрату роботи? Навряд чи.

Як і у більшості аспектів ШІ, є складні питання, які потрібно вирішити, і немає легких відповідей.

Як я зазначаю в розділі про програмне забезпечення, Leanpub і DeepL — це дві компанії, які пропонують авторам та видавцям послуги з перекладу книг за допомогою ШІ.

ШІ для наукового видавництва

An icon of a key

Торгові видавці та автори всіх типів повинні стежити за траєкторією ШІ в спільноті наукового видавництва. Воно розвивається значно швидше, ніж у споживчому видавництві.

Я бачу дві причини для цього прогресу. По-перше, автори в науковому видавництві за фахом є академіками, а в секторі STM (науковий, технічний та медичний) вони часто вчені з вищою освітою. Окрім видавництва, вони досліджують і часто використовують ШІ у своїй роботі. Вони були б більш здивовані, якби їхній видавець не досліджував використання ШІ для редагування та публікації їхніх робіт.

Це поширюється на екосистему наукового видавництва, де, частіше за все, редактори самі є вченими. Для них технологія не є залякуючою.

Я не збираюся детально розглядати особливості цього в книзі; я розповім про це більш докладно на своєму блозі.

ШІ для авторів

Автори та видавці часто бачать себе в двох окремих світах, пов’язаних, але по суті різних. Це значною мірою було правдою в сучасному видавництві.

Часи змінюються. Якщо раніше видавці були недосяжними, то тепер головні автори диктують правила. Як я обговорюю в інших розділах, самовидавці є першопрохідцями. Вони несуть мало зобов’язань, які обтяжують традиційне видавництво.

Коли видавці дивляться на ШІ, вони бачать небагато можливостей. Коли я розмовляю з авторами про ШІ, світ — їхня устриця. Можливості майже безмежні:

Написання та редагування

  • Спроба написати та видати цілі книги

  • Спроба генерувати ідеї для нового проєкту

  • Спроба генерувати ідеї в межах нової книги

  • Тонке налаштування історії

  • Дослідження

  • Перевірка фактів

  • Письмовий супутник

  • Розвиткове редагування

  • Копірайтинг

  • Перевірка орфографії та граматики

  • Вичитування

Ілюстрація/графіка

  • Створення ілюстрацій та діаграм

  • Ескізи дизайну обкладинок

  • Відео-промоції

Маркетинг

  • Автоматизація подання заявок до агентів, видавців, конкурсів, друзів, запитів на анотації

  • Генерація маркетингових матеріалів: прес-релізи, блоги, пости в соціальних мережах тощо.

  • Генерація вебсайтів

Автори будуть рушійною силою змін у впровадженні ШІ в індустрію, чи то підтримуючи, чи то опираючись йому.

Вони є бенефіціарами багатьох стартапів, пов’язаних із ШІ у написанні та видавництві — близько 70% стартапів прагнуть працювати з авторами на їхньому шляху.

Проблеми та ризики, пов’язані з ШІ

An icon of a key

Проблеми навколо ШІ є серйозними. Ризики реальні. Іноді вони виражаються істерично, але, коли занурюєшся в суть, вплив ШІ має потенціал бути надзвичайно руйнівним.

Є стільки питань та проблем, пов’язаних із ШІ, що вони заповнюють цілі томи. Ось хмарка слів на теми, які я моніторю. Я впевнений, що я пропускаю кілька.

Хмарка слів навколо терміну 'ШІ', з пов'язаними термінами, такими як 'проблеми', 'етика' та 'людство', що оточують його.

Є багато інформації про кожну з цих тем, і я закликаю вас читати якомога глибше. Можливо, ви дійдете висновку, що ризики перевищують вигоди, і що ви не хочете переслідувати використання ШІ, будь то особисто або у вашій організації. Це рішення приносить свої ризики; звичайне, що залишаєшся позаду. Але це особистий вибір.

Якщо ви загуглите “книги щодо ризиків ШІ”, ви знайдете добірку вартих уваги томів. Недавній подкаст, який я знайшов особливо страшним, був розмова Езри Кляйна з Даріо Амодеєм, співзасновником та генеральним директором Anthropic (компанії, що розробляє Claude.ai). Ви дізнаєтеся, що ці компанії усвідомлюють ризики. Амодей звертається до внутрішньої системи класифікації ризиків, яка називається A.S.L., для “Рівнів безпеки ШІ” (не американська жестова мова). Ми зараз на ASL 2, “системи, які показують ранні ознаки небезпечних можливостей — наприклад, здатність давати інструкції щодо створення біологічної зброї.” Він описує ASL 4 як “дозволяючи державним акторам значно підвищити їхню здатність… де ми б хвилювалися, що Північна Корея чи Китай чи Росія можуть значно посилити свої наступальні можливості в різних військових сферах за допомогою ШІ таким чином, що це надасть їм значну перевагу на геополітичному рівні.” Страшні речі.

У цьому похмурому контексті я підкреслю найважливіші питання для письменників та видавців.

Порушення авторських прав?

An icon of a key

Питання авторських прав є складними та неоднозначними. Видається певним, що деякі книги, які все ще перебувають під авторським правом, були включені в навчання деяких великих мовних моделей (LLM). Але це, безумовно, не означає, як деякі автори бояться, що вся їхня робота була зібрана у кожну і всі великі мовні моделі.

Питання авторських прав є як специфічними, так і широкими. Відомо, що всі LLM навчаються на відкритому веб-просторі — всьому, що можна зібрати з 1,5 мільярда сайтів в інтернеті сьогодні, чи то газетні статті, пости в соціальних мережах, веб-блоги і, очевидно, транскрипти відео YouTube.

Доведено, що принаймні одна з LLM поглинула справжній текст тисяч книг, які не є в суспільному надбанні.

Чи було легально поглинати весь цей текст для допомоги у створенні мільярдних компаній з ШІ, без будь-якої компенсації авторам? Компанії ШІ наводять аргумент щодо добросовісного використання; суди врешті-решт вирішать. Навіть якщо це було законно, чи було це етично чи морально? Етика виглядає менш складною, ніж юридичні міркування. Ви вирішуйте.

Закони, що стосуються авторських прав, очевидно, не передбачали унікальні виклики, які ШІ приносить до питання, і пошук юридичних рішень займе час, можливо, роки. (Якщо ви хочете заглибитися в те, чому закони не підходять для конкретної проблеми, прочитайте чудову статтю А. Федер Купера та Джеймса Гріммельмана під назвою “Файли в комп’ютері: Авторське право, Запам’ятовування і Генеративний ШІ.”)

Ось список тринадцяти найбільш відомих справ, не всі з яких стосуються книг; також зображень та музики. А ось ще один список, який оновлює статус усіх судових позовів.

Авторські права та ШІ для авторів

An icon of a key

Автори стикаються з додатковими питаннями щодо можливості авторських прав на контент, створений ШІ.

Позиція Управління з авторських прав США щодо можливості авторських прав на контент, створений ШІ стверджує, що ШІ не може мати авторського права, оскільки йому бракує правового статусу автора. Це має сенс. Але це передбачає, що 100% роботи створено ШІ. Як обговорювалося в інших місцях, мало хто з авторів дозволить ШІ створити цілу книгу. Скоріше це буде 5%, або 10% або… І тут Управління з авторських прав спотикається (як і я б).

У більш недавньому рішенні Управління дійшло висновку, що графічний роман, що складається з тексту, написаного людиною, у поєднанні із зображеннями, створеними сервісом ШІ Midjourney, є об’єктом авторського права, але окремі зображення не можуть бути захищені авторським правом. Ой!

An icon of a key

Достатньо сказати, що автори та видавці повинні бути пильними до розвитку питань авторських прав на різних фронтах.

Які довгострокові наслідки?

Дехто порівнює поточне судочинство з позовом проти Google Books, який зайняв 10 років для юридичного вирішення. Хто знає, як довго триватиме процес апеляції для цих справ. Тим часом видавці розумно діють так, ніби компанії ШІ програють, що, принаймні теоретично, піддає будь-кого, хто ліцензує або, можливо, навіть використовує Chat AI, певній умовній відповідальності.

Але це не найсерйозніше питання для видавців. Це сприйняття. Для багатьох авторів, деяких відомих, деяких маловідомих, джерело було отруєне. ШІ є радіоактивним у спільноті письменників та видавців. Все, що навіть натякає на ШІ, викликає інтенсивну критику.

Існує багато прикладів. У недавньому інциденті Angry Robot, британський видавець, “присвячений найкращому у сучасній дорослій науковій фантастиці, фентезі та WTF,” оголосив, що використовуватиме програмне забезпечення ШІ під назвою Storywise, щоб сортувати очікувану велику кількість поданих рукописів. Це зайняло лише п’ять годин, щоб компанія відмовилася від плану та повернулася до “старої скриньки.

Нестерпна дилема для видавців у використанні інструментів ШІ всередині: якщо ваші автори дізнаються, вам буде важко витримати результативний шторм. Я вважаю, що у видавців немає вибору, окрім як бути сміливими, прийняти (принаймні частину) інструментів, чітко пояснити, як ці інструменти навчаються і як вони використовуються, і продовжувати рухатися вперед.

У Великобританії Товариство авторів займає жорстку позицію: “Попросіть вашого видавця підтвердити, що він не буде використовувати ШІ в значній мірі для будь-якої мети, пов’язаної з вашою роботою, наприклад, для коректури, редагування (включаючи перевірку автентичності та перевірку фактів), індексації, юридичної експертизи, дизайну та макету або чого-небудь ще без вашої згоди. Ви можете заборонити озвучення аудіокниг, переклад та дизайну обкладинки, виконані ШІ.”

Здається, що Гільдія авторів приймає той факт, що “видавці починають досліджувати використання ШІ як інструменту в звичайній діяльності, включаючи редакційні та маркетингові цілі”. Я не думаю, що багато членів Гільдії розуміють це так само.

Ліцензування контенту компаніям ШІ

Більшість видавців та багато авторів шукають способи ліцензувати контент компаніям ШІ. У кожного є своя ідея щодо умов ліцензування і вартості їх контенту, але принаймні обговорення вже розпочато.

Існує кілька стартапів, які хочуть співпрацювати з видавцями (а в деяких випадках і з окремими авторами). Calliope Networks та Created by Humans обидва цікаві в цьому відношенні.

В середині липня Copyright Clearance Center, довгий час головний гравець індустрії в колективному ліцензуванні авторських прав, оголосив про наявність “прав на повторне використання штучного інтелекту (ШІ) в межах своїх щорічних ліцензій на авторські права (ACL), рішення для ліцензування контенту на рівні підприємства, що пропонує права на мільйони робіт для компаній, що підписуються.”

Publishers Weekly висвітлили оголошення, цитуючи Трейсі Армстронг, президента та генерального директора CCC, яка сказала: “Можливо бути за ШІ та за авторське право, і поєднувати ШІ з повагою до творців.”

Хоча це не всеосяжна, ймовірно, це прорив у наближенні видавництва до певного ступеня співпраці з розробниками великих мовних моделей.

Занадто пізно уникнути ШІ

An icon of a key

Для авторів та видавців, які воліють не контактувати з ШІ, новини погані: ви використовуєте ШІ сьогодні і користувалися ним протягом багатьох років.

Штучний інтелект у різних формах вже інтегровано у більшість програмних інструментів та сервісів, які ми використовуємо щодня. Люди покладаються на ШІ для перевірки орфографії та граматики у програмах, таких як Microsoft Word або Gmail. Microsoft Word та PowerPoint використовують ШІ для надання рекомендацій щодо написання, пропозицій з дизайну та макету тощо. Віртуальні асистенти, такі як Siri та Alexa, використовують обробку природної мови для розуміння голосових команд та відповідей на запитання. Електронні поштові сервіси використовують ШІ для фільтрації повідомлень, виявлення спаму та надсилання сповіщень. ШІ забезпечує роботу чат-ботів для обслуговування клієнтів та генерує рекомендації щодо продуктів на основі вашої історії покупок.

І більшість цього базується на великих мовних моделях, як це відбувається з ChatGPT.

Для автора чи редактора сказати: “Я не хочу, щоб ШІ використовувався на моєму рукописі,” загалом неможливо, якщо тільки вони і їх редактори не працюють на друкарських машинках і з олівцями.

Вони можуть спробувати сказати: “Я не хочу, щоб генеративний ШІ” використовувався для їхньої книги. Але це важко розділити і нарізати. Програмне забезпечення для перевірки граматики спочатку не було побудоване на генеративному ШІ. Grammarly додав його як інгредієнт до свого продукту, як і всі інші перевірки орфографії та граматики. Генеративний ШІ також є основним у маркетинговому програмному забезпеченні.

Коли автори використовують ШІ

Ще один аспект, пов’язаний з авторами та використанням ШІ, має схожість з питанням авторських прав, обговореним вище. В крайньому випадку, ми бачимо 100% контент, створений ШІ, який публікується на Amazon. Більшість з цього (все це?) є жахливої якості, але це не заважає йому бути опублікованим. (Див. також розділ Amazon.) Більш тривожним для видавців є подання, створені ШІ. Так, ШІ підвищує кількість, але великі видавці вже мають фільтр для кількості. Фільтри називаються агентами. Вони ті, хто повинен буде вирішити, як впоратися з проблемою кількості, і, очевидно, вони повинні знайти рішення, яке не використовує ШІ.

Це щось на зразок екзистенційної проблеми—чи хочу я публікувати книгу, написану “машиною”? Для більшості видавців це однозначне “ні”. Легко. А що щодо книги, де 50% контенту було згенеровано великою мовною моделлю під наглядом здібного автора? Хмм, давайте спробуємо “ні” і на це. Добре: а що щодо 25%, або 10%, або 5%? Де провести межу?

І, тепер, коли ви зайнялися проведенням меж, як ви вирішуєте дилему, що перевірка правопису та граматичні інструменти тепер частково залежать від генеративного штучного інтелекту? А як щодо інструментів транскрибування на основі ШІ, таких як Otter.ai, або функція транскрибування, вбудована в Microsoft Word?

Я не можу знайти жодного видавця, який би заявив, що не публікуватиме роботу з заздалегідь визначеною кількістю тексту, згенерованого ШІ. Ось що каже Гільдія авторів з цього приводу:

“Якщо у вашому рукописі включено помітну кількість згенерованого ШІ тексту, персонажів або сюжету, ви повинні повідомити про це вашого видавця і також повідомити читача. Ми не вважаємо за необхідне авторам розкривати використання генеративного ШІ, коли він використовується лише як інструмент для мозкового штурму, генерації ідей або для редагування тексту.”

Звісно, “помітна” кількість не визначена (Оксфорд визначає це як “достатньо велика, щоб бути поміченою або вважатися важливою”), але в дописі пояснюється, що включення більше ніж “де мініміс згенерованого ШІ тексту” порушуватиме більшість видавничих контрактів. Де мініміс, у правових термінах, не точно визначено, але загалом означає більш-менш те саме, що й “помітна”.

Чи можна виявити ШІ у письмі?

Я провів вебінар на тему виявлення ШІ, спонсорований BISG, у травні 2024 року. Відеозапис доступний онлайн на YouTube. Джейн Фрідман запропонувала всебічний огляд вебінару у своєму інформаційному бюлетені Hot Sheet.

Для багатьох авторів токсичність ШІ означає тримати його подалі від своїх слів. Видавці несуть особливий тягар—вони не створюють текст, але, після публікації, вони несуть значну відповідальність за текст. Ми бачили багато динаміту, що вибухав поблизу запальних книг, чи то через соціальні наслідки змісту, чи то через плагіат чужих слів і ідей. Тепер з ШІ ми стикаємося з новим набором етичних та правових питань, жодне з яких не було окреслено у видавничій школі.

Частина цього здається схожою на те, про що хвилюються люди щодо студентів, що використання ШІ є якимось чином шахрайством, схожим на списування зі статті у Вікіпедії або просто прохання друга написати ваше есе.

Один з наших спікерів вебінару, викладач Хосе Боуен, поділився своїм розкриттям інформації для студентів. Це не зовсім те, що використовується для автора, але воно демонструє деякі “рівні ризику” використання ШІ.

Шаблон угоди про розкриття інформації для студентів

  • Я виконав всю цю роботу самостійно без допомоги друзів, інструментів, технологій або ШІ.

  • Я зробив перший чернетку, але потім попросив друзів/сім’ю, ШІ інструменти для парафразування/ граматики/перевірки на плагіат прочитати її та дати пропозиції. Я зробив такі зміни після цієї допомоги:

    • Виправив правопис і граматику

    • Змінив структуру або порядок

    • Переписав цілі речення/абзаци

  • Я застряг на проблемах і використав тезаурус, словник, зателефонував другу, пішов до центру допомоги, використав Chegg або інші постачальники рішень.

  • Я використав ШІ/друзів/репетиторів для допомоги у генеруванні ідей.

  • Я використав допомогу/інструменти/ШІ для створення плану/першого чернетки, який я потім відредагував. (Опишіть характер вашого внеску.)

І отже видавець може скласти щось подібне для своїх авторів. Скажімо, автор розкриває найвищий рівень: я інтенсивно використовував ШІ, а потім відредагував результати. Що тоді? Ви автоматично відхиляєте рукопис? Якщо так, то чому?

І, тим часом, якщо ви уважно стежите, ви дізнаєтеся, що рукопис, який ви щойно прочитали і полюбили, автор якого клявся, що його навіть не перевіряли на граматику в Grammarly, насправді міг бути на 90% згенерований ШІ, автором, що вміє приховувати його використання.

Тоді ви змушені переосмислити питання. Воно стає: “Чому я так чортівськи рішуче налаштований виявити цю річ, яку неможливо виявити?”

Частково це тривожне занепокоєння щодо можливості отримання авторських прав на текст, створений ШІ. Бюро авторських прав не надає захисту авторських прав на 100% текст, створений ШІ (або музику, або зображення тощо). Але що щодо 50% тексту, створеного ШІ? Ну, ми покриватимемо лише ті 50%, які створені автором. А як ви дізнаєтеся, яка половина? Ми повернемося до вас з відповіддю на це питання.

Чи не було б чудово, якби ви могли просто ввести кожен рукопис у якесь програмне забезпечення, яке б сказало вам, чи було використано ШІ при створенні тексту?

Залишимо осторонь питання про те, що єдиний спосіб зробити це - використання інструментів ШІ, важливішим питанням є, чи буде програмне забезпечення (достатньо) точним? Чи можу я на це покладатися, щоб дізнатися, чи було використано ШІ при створенні рукопису? І чи можу я бути впевненим, що воно не видасть “хибних спрацьовувань” - вказавши, що ШІ було використано, коли насправді його не було?

Зараз на ринку багато програмного забезпечення, яке вирішує ці проблеми. Багато академічних досліджень, що оцінюють це програмне забезпечення, вказують на його ненадійність. Текст, створений ШІ, проходить непомітно. Гірше того, текст, який не був створений ШІ, помилково позначається як такий, що був “забруднений”.

Але видавці книг захочуть мати якісь запобіжні заходи. Видається, що, в найкращому випадку, ці інструменти можуть попередити вас про можливі проблеми, але завжди потрібно буде перевіряти двічі. Тож, можливо, це може попередити вас про тексти, які потрібно ретельніше перевіряти, ніж інші? Чи є це ефективністю?

Справжня ефективність буде знайдена в тому, щоб переступити за межі занепокоєння щодо походження тексту, залишаючи наші існуючі критерії щодо його якості.

Втрата робочих місць

“Вас не замінить ШІ. Вас замінить хтось, хто знає, як використовувати ШІ.” —Анонім

Втрата робочих місць через впровадження ШІ може бути значною. Оцінки різняться, але цифри виглядають похмуро. Є очевидні приклади: безпілотні таксі у Сан-Франциско усувають потребу в таксистах і водіях сервісів спільного використання. Діагностика з підтримкою ШІ може зменшити потребу в медичних техніках.

Оптиміст у мені вказує на приклад впровадження електронних таблиць і їх вплив на зайнятість. Як видно з графіку нижче, зайнятість у сфері “Бухгалтерський облік, підготовка податкової звітності, бухгалтерський облік та послуги з обробки заробітної плати” майже подвоїлася з 1990 року - це навряд чи є звинуваченням електронних таблиць та інших технологій, які значною мірою автоматизували ці завдання.

Графік лінії, що показує кількість працівників у сфері бухгалтерського обліку, підготовки податкової звітності, бухгалтерського обліку та послуг з обробки заробітної плати з 1990 по 2020 рік.

Дослідження Ітана Молліка з Boston Consulting Group (BCG) було експериментом, який мав на меті краще зрозуміти вплив ШІ на роботу, особливо на складні та насичені знаннями завдання. Дослідження залучило 758 консультантів BCG, випадковим чином призначених використовувати або не використовувати GPT-4 від OpenAI для двох завдань: інновацій у створенні продуктів та вирішення бізнесових проблем. Дослідження вимірювало продуктивність, поведінку та ставлення учасників, а також якість і характеристики виходу ШІ.

Серед висновків було, що “ШІ працює як вирівнювач навичок. Консультанти, які набрали найгірші результати при оцінці на початку експерименту, мали найбільший приріст у своїй продуктивності, 43%, коли їм дозволили використовувати ШІ. Найкращі консультанти також отримали приріст, але менш значний.” Повна стаття є розкриваючою, і як всі роботи Молліка, провокативною, але доступною.

Освіта

Освіта була в центрі дебатів за і проти ШІ. Введення ШІ в класи в основному розглядається як прокляття або принаймні виклик. Інші освітяни, такі як ключовий спікер PW Ітан Моллік, приймають ШІ як чудовий новий інструмент для викладачів; Моллік наполягає, щоб його студенти працювали з ChatGPT.

Найкраща книга на цю тему - Навчання з ШІ: Практичний посібник до нової ери людського навчання Хосе Антоніо Боуена та С. Едварда Вотсона.

Я не збираюся заглиблюватися в освітнє видавництво в цій книзі - це величезна тема, яка вимагає окремого звіту. Можливо, видавнича діяльність стає другорядною в межах освіти: інструменти ШІ є програмним забезпеченням, а не контентом, по суті.

Майбутнє пошуку

An icon of a key

Пошук є складною темою в ШІ. Я закликаю вас відвідати perplexity.ai та You.com, щоб отримати уявлення про те, куди прямують ці технології. Наступного разу, коли ви захочете розпочати пошук у Google, зайдіть на Perplexity замість цього. Це не здаватиметься кардинально іншим - це схоже на графіки знань, які Google часто показує на правій стороні екрану пошуку або іноді вгорі списку результатів пошуку. Замість того, щоб натискати на посилання, інформація буде прямо перед вами.

Перплексія йде далі, перефразовуючи інформацію, яку вона збирає з кількох джерел, щоб вам справді не потрібно було клацати на посилання. Вона надає посилання на свої джерела, але зазвичай їх не потрібно відкривати — ви вже отримали відповідь на своє запитання.

Ця начебто скромна зміна має величезні наслідки для кожної компанії та кожного продукту, які хоча б частково залежать від відкриття через пошукові системи. Якщо шукачі більше не відправляються на ваш сайт, як ви можете залучити їх і перетворити на клієнтів? Проста відповідь – ніяк.

Джоанна Пенн стоїть на передньому краї думок про вплив нових технологій на писання та видавництво. Вона торкнулася цієї складної теми у своєму подкасті та блозі минулого грудня.

Це все ще ранні дні для штучного інтелекту та трансформації пошуку.

Низькоякісні книги на Amazon

An icon of a key

Книги, створені штучним інтелектом, на Amazon є проблемою, хоча їх серйозність може бути більш інтуїтивною, ніж буквальною. З одного боку, ці книги засмічують онлайн-книгарню неякісним та плагіатним контентом, іноді використовуючи імена реальних авторів, щоб обманути клієнтів і скористатися їхньою репутацією. Книги є не тільки неприємністю для читачів, але й загрозою для авторів, потенційно позбавляючи їх заслужених роялті. Книги, створені штучним інтелектом, також впливають на рейтинг та видимість реальних книг та авторів на сайті Amazon, оскільки вони конкурують за ті самі ключові слова, категорії та рецензії.

Миленьке кошеня сидить на пляжі з квітами навколо і підписом 'Смішні та милі фото котів, які не можна побачити у світі'.

Amazon тепер вимагає від авторів розкривати деталі використання ШІ при створенні їхніх книг. Без сумніву, це можна зловживати.

Спробуйте пошукати на Amazon “книги, створені штучним інтелектом”. Їх багато. Деякі з результатів — книжки-інструкції про використання ШІ для створення книг. Але інші, безсоромно, створені штучним інтелектом. “Смішні та милі фото котів - Ви не можете побачити такі типи фото у світі - ЧАСТИНА-1” (стет) приписується Раджасекару Касі. Немає жодних деталей його (?) біографії на сторінці автора, але шість інших назв приписуються цьому імені. Книга, опублікована 26 серпня 2023 року, не має відгуків і рейтингу продажів. Неграмотний заголовок електронної книги не відповідає неграмотному заголовку на обкладинці друкованої книги.

Але інші автори явно широко використовують ШІ при створенні своїх книг і не розкривають це. Як я вже обговорював вище, виявлення використання ШІ практично неможливе з умілими «фальсифікаторами». Розмальовки, журнали, путівники та кулінарні книги створюються за допомогою інструментів ШІ за набагато коротший час і з меншими зусиллями, ніж традиційне видавництво.

Пошукайте “корейська веганська кулінарна книга” і ви знайдете першу назву, написану Джоанн Лі Молінаро, на першому місці. Але відразу за нею йдуть інші назви, які явно є підробками. “Корейська веганська кулінарна книга: Прості та смачні традиційні та сучасні рецепти для любителів корейської кухні” має два відгуки, включаючи один, який зазначає, що “це не веганська кулінарна книга. Усі рецепти містять м’ясо та яйця.” Але книга займає #5,869,771 у рейтингу продажів, порівняно з оригіналом, який займає #2,852 у списку.

Важко визначити ступінь завданої шкоди. Нічого доброго з цього не вийде, але наскільки це погано?

Amazon має політики, які дозволяють видаляти будь-яку книгу, яка не забезпечує “позитивного клієнтського досвіду”. Правила вмісту Kindle забороняють “описовий вміст, призначений для введення клієнтів в оману або який не точно представляє вміст книги.” Вони також можуть блокувати “вміст, який зазвичай розчаровує клієнтів.” Це величезний обсяг, який збиває з пантелику спостерігачів Amazon? Чи є інша причина?

Упередженість

LLM-системи навчаються на тому, що вже було опубліковано в Інтернеті. Те, що було опубліковано в Інтернеті, рясніє упередженнями, і тому LLM-системи відображають ці упередження. І, звичайно, не тільки упередження, але й ненависть, відображені в їхньому навчанні, а тепер і потенційний вихід у створених ШІ словах та зображеннях. Порнографія є ще одним природним бенефіціаром дивовижної здатності ШІ створювати зображення, і є останні тривожні історії про молодих жінок, які знаходять сфабриковані оголені зображення, їхні однокласники-чоловіки є ймовірними підозрюваними. The New York Times повідомила окремо про збільшення кількості онлайн-зображень сексуального насильства над дітьми.

Автори та видавці повинні бути обізнані про ці вбудовані обмеження під час використання інструментів ШІ.

Креативність може бути кліше

An icon of a key

Питання про те, чи можуть машини бути дійсно креативними, залишається темою гарячих дискусій. Це частково залежить від того, як ми визначаємо креативність.

“ШІ ніколи не буде креативним.” Це знайома мантра.

Ми всі знаємо, що таке креативність, чи не так?

Cambridge: “здатність створювати або використовувати оригінальні та незвичайні ідеї.”

Britannica: “здатність створити або іншим чином втілити в життя щось нове, будь то нове рішення проблеми, новий метод або пристрій, чи новий художній об’єкт або форма.”

Я не заперечую, що креативність у цьому сенсі значно перевищує можливості LLM.

Мій аргумент у тому, що більшість того, що видається за креативність–і часто виглядає досить креативним —- насправді є ітеративним. Що чудово підходить для багатьох речей, включаючи більшість реклами.

Але встановлювати високий бар’єр під назвою “креативність” і знецінювати LLM, означає встановити неможливо високий бар’єр, на якому ШІ неминуче зазнає поразки. Тоді люди відкидають його як “ну, я ж казав, що це не креативно.”

І таким чином пропускають ітеративні речі, в яких він дуже сильний.

Я напишу довгий есей на цю тему в недалекому майбутньому, після того, як закінчу читати:

The Creativity Code, Маркуса дю Сотої, та

The Artist in the Machine, Артура І. Міллера

Literary Theory for Robots, Денніса Ї Тенена

Ще одна думка

Джеремія Ов’янг є аналітиком індустрії, базованим у Силіконовій долині. Він є прихильником ШІ, але раніше стикався з хайпом. Він зазначає, що “ніколи не бачив такої швидкої еволюції за такий короткий час.”

Як зазначає Ов’янг у своєму блозі, малі команди програмістів тепер можуть використовувати LLM для створення “відчуваючих створінь”–як чотирирічна дитина–за два дні. Вони здатні:

  • ‘Бачити’ за допомогою комп’ютерного зору, що відбувається у реальному світі,

  • ‘Чути’ через голосові команди та фонові звуки у реальному світі,

  • ‘Думати’ обробляючи вищезазначений реальний світовий вхід,

  • ‘Вчитися’ отримуючи доступ до попередньо натренованих даних,

  • ‘Реферувати’ ексклюзивні набори даних,

  • ‘Говорити’ життєподібними аудіо голосами, які мають інтонацію та тон у будь-якій мові,

  • ‘Писати’ через текстову комунікацію, у будь-якому форматі чи стилі,

  • ‘Малювати’ створюючи зображення спонтанно, та

  • ‘Взаємодіяти’: може активно брати участь у діалозі, ставити запитання або призначати ШІ-агентів для виконання завдань самостійно.

Це надзвичайно і безпрецедентно. Чи матиме це значення для видавництва? Вирішуйте самі.

Гарні речі поза видавництвом

ШІ лежить в основі деяких передових досягнень поза видавництвом. Медицина є візитною карткою ШІ, але є також потужні історії з інших галузей. Відповідність для видавництва виникає з риторичного питання: ШІ може рятувати життя. Але ви не думаєте, що він може допомогти видавцям?

Метою цього короткого розділу є лише протидія аргументу, що, не переконавшись, що ШІ допоможе видавництву, чи може ШІ взагалі допомогти комусь?

ШІ та медицина

Читаючи березневий 2024 випуск The Economist, я заглибився в його технологічний додаток про здоров’я та ШІ. За останні кілька років медицина постійно виступає як яскрава точка штучного інтелекту. Більшість звітів позитивні. Але все ж таки стаття в The Economist вас здивує. Вони висловлюють численні добре аргументовані застереження. Але ви також прочитаєте, що ШІ у медицині “представляє можливість покращити життя сотень мільйонів, навіть мільярдів людей.”

Ще одне риторичне питання для тих, хто хоче заборонити технологію ШІ або принаймні поставити мораторій на її розвиток: чи пожертвували б ви її потенційною цінністю для здоров’я мільйонів, щоб задовольнити свою тривогу щодо невизначеного майбутнього?

ШІ та TSA в аеропортах

Ми там були: нескінченні черги, повільний рух наших ручних багажів через рентгенівські сканери.

Невдачі виявлення TSA добре задокументовані, але не дуже обговорюються.

Що найбільше мене турбує, це сумні працівники, які годинами дивляться на свої екрани. Для чого? Це не тільки нещаслива робота, але, як прості смертні, вони не дуже добре з цим справляються.

Вступає ШІ. Якщо він може виявляти важковиявлені пухлини в легенях, я впевнений, що він може виявляти контрабанду в ручній поклажі. І звільнити людей від невдячного завдання, з яким вони погано справляються.

За цим рахунком, нова програма TSA зі скринінгу за допомогою ШІ вже в дії.

Есе: Вплив ШІ на видавничу індустрію книг

Нещодавно я розмовляв із Пітером Брантлі, моїм партнером у вебінарі зі ШІ, про те, як ми могли б формувати майбутні програми ШІ. Пітер більшу частину часу працює в бібліотечній спільноті і щойно повернувся з денної події в Лос-Анджелесі з близько 150 своїми бібліотечними колегами, де вони досліджували потенційний вплив ШІ на їхній сектор. Розмова була жвавою і глибокою. Чому, запитав він, видавці торгових книг не проводять такі збори? ШІ є темою на кожному видавничому заході: чому це не головна тема?

Реальні наслідки ШІ

Відповідь, яку він знайшов, полягає в тому, що видавці торгових книг ще не дійшли висновку, що ШІ матиме які-небудь реальні наслідки для їхнього бізнесу. На основі їхнього бізнесу. На їхню здатність вести бізнес. Звісно, він може допомогти написати прес-реліз або відмовний лист на рукопис, але вони припускають, що видавництво буде продовжувати працювати так, як це було протягом десятиліть, з середнім часом від контракту до друкованої книги до двох років.

Водночас видавці, звісно, стикаються з найближчими викликами, які більш нагальні, ніж ШІ. Ціни на папір. Вартість доставки. Скорочення маржі. Здебільшого стабільні продажі. З усіма цими тисками, хто має час або можливість думати про ШІ?

Інші сектори видавничої індустрії книг починають розуміти вплив ШІ. Наукове видавництво глибоко занурене у технологію. Але видавці торгових книг діють так, ніби від ШІ не буде жодних реальних наслідків.

Якими можуть бути реальні наслідки? Чи вплине це на постачання книг? Або на попит на книги?

Постачання: Так, ШІ винен у появі купи нових сміттєвих книг на Amazon. Сотні? Безумовно. Тисячі? Можливо. Мільйони? Ні. Скільки книг на Amazon? Більше 50 мільйонів. Вже дуже насичено.

Окрім цього, зрозуміло, що в найближчій перспективі ШІ не буде писати цілі книги, які люди насправді захочуть читати. Його цінність на сьогоднішній день полягає у ролі помічника у написанні - критикувати, пропонувати, іноді видавати кілька абзаців використаного тексту. Ні, в найближчій перспективі ШІ не буде радикально змінювати результати видавництва книг, постачання нових книг.

Попит: Ні, ніхто не вимагає книг, створених ШІ. Це не є фактором. І я не можу передбачити жодного сценарію, де ШІ буде впливати на попит на книги ширше.

Що щодо процесу видавництва? Так, це зміниться. Принаймні трохи. Як ми виявили на нашій події Publishers Weekly зі ШІ минулої осені, видавці шукають допомогу від ШІ тут і там: маркетинг, редакція, трохи цього і трохи того.

Чи можливо, що вплив ШІ на торговельне книговидання матиме небагато реальних наслідків? Можливо, це просто іграшка.

Тож давайте відійдемо від дрібниць ШІ та знову розглянемо складний стан торговельного книговидання і через це заглибимося в те, де ШІ, ймовірно, матиме найбільший вплив.

Видавництво знаходиться в економічному спаді десятиліттями

За різними оцінками, вся індустрія книговидання у Сполучених Штатах має річний обсяг продажів менше $35 мільярдів. Навіть якщо б це було $40 мільярдів, річний обсяг продажів Apple Computer в 10 разів більший. Валовий прибуток Apple становить 44% продажів, а чистий прибуток - 25% продажів. Видавництво навіть не мріє про такі маржі.

Торговельне книговидання знаходиться в повільному економічному спаді десятиліттями, деякі роки зростання на кілька відсотків, деякі роки падіння. На середину 2024 року продажі виглядають стабільними рік за роком, але це той тип літнього роману, з яким знайомі видавці. Ми виграємо дещо, ми втрачаємо дещо, але загалом торговельне книговидання не є галуззю зростання.

У 2023 році, за даними AAP’s StatShot, “торговельні доходи впали на 0,3%, до $8,9 мільярда за календарний рік.” Наскільки я можу сказати, дані AAP не враховують інфляції. При інфляції 3,4% спад продажів становив би 3,6%, ближче до 2,6% спаду в одиничних продажах за даними Circana.

Без зростання альтернативних форматів, електронних книг та аудіокниг, індустрія могла б бути в дуже поганому стані. Електронні книги були двигуном зростання протягом років. Продажі аудіокниг продовжують зростати, майже на 15% у 2022 році і ще на 9% у 2023 році. Так, частина з цього – це продажі заміщення, але багато клієнтів для електронних книг та аудіокниг є новими клієнтами, не обов’язково звичайними читачами книг. Електронні книги та аудіокниги склали 21% від торговельних продажів минулого року. Чи всі ці клієнти купували б друковані книги, якби друк був єдиним доступним форматом?

Роздрібне ціноутворення стає все більшою проблемою, оскільки витрати та знижки роздрібних продавців і оптовиків стискають маржі видавців. Академічні дослідження свідчать, що існує певна еластичність цін для книг, але, звичайно, ми досягаємо точки опору: бестселери в твердих обкладинках стикаються з можливим стельовим цінником у $35. “Втома від підписок” змушує клієнтів відео на замовлення відмовлятися від послуг, зосереджуючись на зростаючій вартості кожної з них. Преміум план Netflix зараз коштує $22,99/місяць; Disney Plus Duo Premium коштує $19,99/місяць. Як нещодавно зауважив один мій колега, скільки передплатників, які стримують витрати, скажуть: о, давайте скасуємо нашу підписку на Netflix, щоб я міг купити книгу наступного місяця?

Зарплати у книговиданні

Я не збираюся вдаватися в деталі: не тільки автори намагаються заробити на життя–персонал у видавництві значно недоплачений порівняно з аналогічними професіями.

Я зберігаю представницький асортимент недавніх вакансій у видавництві. Ось одна, для менеджера з маркетингу у торговельному видавництві, яке повідомило про продажі у 2023 році у понад $30 мільйонів. Посада оплачується від $60,000 до $70,000 на рік. Ось ще одна, для менеджера з публічності в одному з підрозділів видавництва, яке повідомило про щорічні продажі у $750 мільйонів. “Ця роль матиме річну зарплату від $74,000 до $79,000,” зазначає оголошення.

Згідно з Національними оцінками зайнятості та заробітної плати Бюро статистики праці США, менеджери з маркетингу заробляють в середньому $166,410 у всіх галузях. Середній заробіток менеджерів зі зв’язків з громадськістю становить $159,420.

Видавництво книг навіть не наближається до цього рівня. Це не новина для тих, хто працює у видавничій галузі. Так було завжди. Але чи може видавництво вижити на такому рівні оплати праці? Нездатність запропонувати кандидатам навіть половину від стандарту оплати не віщує нічого доброго для галузі, яка стає все більш цифровою.

У епоху TikTok, YouTube, соціальних мереж, SEO, метаданих та авторських платформ, що ж таке “менеджер з публічності”?

Три (і пів) залишкових переваги для традиційних видавців книг

Три постійні переваги для традиційних видавців книг це (i) престиж, (ii) доступ до основних ЗМІ і (iii) доступ до розповсюдження через книгарні. Це не однаково для всіх традиційних видавців - найбільші з них мають більше кожної з цих переваг: більше престижу, кращий доступ до основних ЗМІ та кращі можливості для розміщення своїх книг на передніх столах у найбільшій кількості книгарень. Але, взяті разом, це характерні переваги традиційної видавничої індустрії.

Ще однією цінністю, яку можуть запропонувати видавці, є курована колекція взаємодоповнюючих заголовків, де кожен окремий заголовок виграє від своїх супутників. Подумайте про видавця як Fox Chapel, який спеціалізується на книгах про ремесла: якщо вам сподобалась одна з їхніх книг, є розумна ймовірність, що ви детально розглянете їхні інші книги (і журнали) на ту ж тему, навіть якщо вони написані іншими авторами.

Це переходить у щось, що вдалося розвинути лише кільком видавцям - бренд, що продається. Подумайте про серії як “For Dummies” від Wiley або “Very Short Introductions” від Oxford. Бренд передає послідовність редакторського підходу та якості, що спонукає читачів купувати кілька заголовків. Самвидавці часто запускають власні короткі серії, переважно для художньої літератури, хоча вони не можуть охопити широту каталогів цих більших видавців.

Усі інші послуги, які надають традиційні видавці, можна придбати на відкритому ринку, з подібною якістю, за доступними цінами (наприклад, редакторські, дизайнерські, виробничі та основні маркетингові функції). А для самвидавців дохід з кожної проданої книги в п’ять разів або більше перевищує традиційні роялті.

Я детальніше розгляну це у короткому додатку в кінці цієї книги. Але дозвольте мені швидко применшити цінність трьох основних переваг. Престиж корисний для похвал, але має скромну грошову цінність. Рецензії на книги та інше основне медійне висвітлення зараз мають значно менший вплив на продажі книг. А книгарні представляють приблизно 15% продажів у галузі (і набагато менше для самвидавців) - вони більше не є ключовими для успіху книги.

Речі змінилися.

Самвидав

Самвидав був основним рушієм зростання споживчого (торгового) видавництва за останнє десятиліття і більше. Точні дані про продажі навколо самвидаву залишаються прихованими - легко ігнорувати його важливість. Але доступні дані показують, що самвидав займає значну частку ринку торгового видавництва.

Як зазначив (у певній мірі) відомий генеральний директор Kobo Майкл Темблін: “Одна з кожних чотирьох книг, які ми продаємо англійською мовою, є самвидавною, що означає, що для нас самвидав подібний на окремий Penguin Random House на ринку, який ніхто не бачить. Це як темна матерія видавництва.”

Тенденції в межах ринку самвидаву є, мабуть, єдиними значущими тенденціями у торговому видавництві. Самвидавці показують шлях. Вони авантюрні і не обтяжені звичаями традиційної індустрії. Багато хто вільно володіє соціальними мережами. Вони близькі до своїх читачів, своїх клієнтів. Якщо ви хочете дізнатися про останні маркетингові техніки, слідкуйте за авторськими форумами, блогами і розсилками.

Заглибтеся у статистику доходів авторів, економіку написання, а потім порівняйте зниження доходів традиційно виданих авторів з підвищенням доходів самвидавців. У міжнародному опитуванні та звіті, який я провів разом з Стівом Зіком для ALLi у 2023 році (pdf), ми виявили, що “медіанний дохід від написання та самвидаву у 2022 році для всіх самвидавців, які відповіли, становив $12,749, на 53% більше порівняно з попереднім роком. Середні (mean) доходи були значно вищими: $82,600 у 2022 році, на 34% більше.”

У окремому опитуванні, проведеному Пітером Хілдік-Смітом для Authors Guild, “повідомили, що їх середній дохід становив $24,000 порівняно з $13,700 у 2018 році, збільшення на 76 відсотків.”

Гібридні видавці

Для повноти картини, я також хочу згадати гібридних видавців. Я все більше захоплююся гібридною моделлю, і сегмент гібридного видавництва є значущим і зростаючим. Ніхто не оцінює продажі гібридних видавців окремо. Але вплив найчіткіше видно в їх домінуванні в двох категоріях: книги від знаменитостей та популярні бізнес-книги. Ці категорії давно були надійними джерелами доходу для комерційних видавців, але “консьєрж-послуги” гібридних видавців і набагато вигідніший розподіл доходів є непереборними для багатьох високопрофільних авторів.

Останні приклади, як партнерство Authors Equity з авторами в розподілі прибутку і Keila Shaheen з 50/50 розподілом прибутку з Simon & Schuster, вказують на тренд до нормалізації гібридної моделі. Це хороші новини для авторів; менш обнадійливі для традиційних видавців.

Видавництво поза видавництвами

Я співавтор звіту з Рюдігером Вішенбартом, заснованого на його оригінальному дослідженні “Видавництво поза видавництвами.” Ми намагаємося зрозуміти і кількісно оцінити, наскільки це можливо, всю книговидавничу діяльність у всьому світі, яка могла б (і повинна) бути включеною до більш всеосяжного погляду на сучасну видавничу екосферу.

Коли ви виходите за межі книжкової форми, ви знаходите уявлення про те, де ІІ може дійсно вплинути.

Наша прикладна платформа для проекту - Wattpad, де “97 мільйонів людей проводять понад 23 мільярди хвилин на місяць, зацікавлені в оригінальних історіях.” Історії переживаються в Інтернеті, переважно на смартфонах, короткими уривками. Мало хто стає опублікованими книгами. Вони мають таку ж ймовірність потрапити до “Wattpad WEBTOON Studios, телевізійних, кінематографічних та видавничих підрозділів компанії.”

Молоді читачі більш налаштовані на онлайн цифрове читання, ніж їх старші колеги. За даними опитування Wattpad у січні 2024 року, “цифрові формати стають все більш популярними серед молодших поколінь, зокрема 65% покоління Z і 71% міленіалів використовують вебромани, електронні книги та вебкомікси, тоді як менш ніж половина покоління X і бумерів говорить те саме.”

І, звичайно, як зараз вчиться традиційна видавнича індустрія: “Різноманітність є ключовим фактором для прийняття цифрових форматів: 61% покоління Z і 70% міленіалів погоджуються, що електронні книги, вебромани та вебкомікси дають їм доступ до контенту, який важче знайти в книжкових магазинах та бібліотеках, включаючи ЛГБТК+ та контент, орієнтований на меншини.”

Wattpad має конкурентів, включаючи Inkitt, який, за даними Publishers Weekly, нещодавно залучив $37 мільйонів від інвесторів “включаючи Стефана фон Гольцбрінка, власника Holtzbrinck Publishing Group, яка володіє Macmillan, і колишнього генерального директора Penguin Майкла Лінтона; загалом він залучив $117 мільйонів інвестицій. У лютому 2023 року Financial Times заявила, що Inkitt був восьмою найшвидше зростаючою компанією в Європі та №1 в Німеччині.” Стаття в Esquire від 9 липня описала використання ІІ в Inkitt і його роль у їх успіху.

Скільки з вас навіть чули про Inkitt, відвідали його платформу для публікацій або завантажили його додаток для читання Galatea?

Але наш звіт “Видавництво поза видавцями” виходить за межі онлайн-платформ для історій, щоб розглянути, як “контент може бути створений і поширений у різних форматах (друк, цифровий), медіа (книги, аудіо, фільми, ігри), каналах розповсюдження (спільноти, платформи, потоки) і бізнес-моделях (продаж продуктів, підписки, стрімінг, фрімім, платні моделі) переважно в цифрово визначених ланцюгах постачання і маркетингу.” Скільки можливостей втрачають книговидавці через те, що вони не очевидно вписуються в їхню поточну бізнес-модель?

Інновації, технології та книговидавництво

За винятком електронних книг, сучасне видавництво ніколи не стикалося з загрозою з боку технологій. (Цифрові аудіокниги були зустрінуті з радістю, а не з острахом.) Світанок ери Інтернету надав видавцям більше можливостей, ніж загроз; це лише один роздрібний продавець, Amazon, який, завдяки Інтернету, перевернув все догори дриґом.

Я ніколи не бачив дослідження, чи був Amazon (коли врахувати всі аспекти його діяльності та впливу) в цілому позитивним для книжкової індустрії. Він досягає багатьох покупців, які не обслуговуються фізичними магазинами, і готовий жертвувати маржею, щоб утримувати низькі ціни. Електронні книги та аудіокниги доставляються в масштабі. Але Amazon може знижувати ціни частково тому, що вимагає високих знижок і комісій від постачальників, і пригнічує інші роздрібні канали. Існують болючі компроміси.

Проте не намагайтеся критикувати Amazon перед самовидатним автором. Вони не змогли б вести бізнес без The Everything Store.

Дилема новатора

Щоб отримати уявлення про вплив AI на книговидавництво, я рекомендую книгу Клейтона Крістенсена Дилема інноватора: коли нові технології спричиняють провал великих компаній, вперше опубліковану у 1997 році видавництвом Harvard Business Review Press.

Крістенсен розглядає, як існуючі (домінуючі) фірми можуть піддаватися впливу інновацій.

Успішні, добре керовані компанії часто зазнають невдачі, коли в їхню галузь приходять руйнівні зміни. Звичайні управлінські практики, які допомагали їм стати лідерами галузі, ускладнюють для цих компаній оперативно реагувати на руйнівні технології, які можуть канібалізувати їхні ринки.

Вони ігнорують продукти, породжені руйнівними технологіями, оскільки на перший погляд вони порівнюються гірше з їхніми існуючими продуктами. Їхні найприбутковіші клієнти зазвичай не можуть використовувати передбачувані інновації і не хочуть їх. Компанії намагаються боротися з руйнівними загрозами, подвоюючи свої зусилля на існуючих продуктах і послугах.

Ключове розуміння Крістенсена полягає в тому, що, роблячи, здавалося б, “правильну” річ, включаючи слухання клієнтів, успішні компанії залишають себе відкритими до руйнівних інновацій. Вони зосереджуються на своїх поточних клієнтах і ігнорують важливі нові технології, які спочатку націлені на малі, менш прибуткові ринки. Це створює можливість для спритних стартапів порушити лідерів.

Кріс Діксон, обговорюючи книгу, зазначає, що “причина, через яку великі нові речі проходять повз домінуючих гравців, полягає в тому, що наступна велика річ завжди починається з того, що її відкидають як ‘іграшку’.” Гм, так, багато людей вважають Chat AI іграшкою.

Чи не визнають видавці, що інновації, створені за допомогою генеративного AI, можуть порушити їхню крихку бізнес-модель?

Художня література проти нехудожньої літератури

Вплив AI на книговидавництво, безперечно, матиме різко різний вплив на видання художньої літератури порівняно з нехудожньою літературою.

Книговидавнича індустрія недостатньо часто аналізується як дві розділені індустрії: одна, яка видає художні книги, і інша, яка видає нехудожню літературу.

Хоча більшість торгових видавців пропонують як художні, так і нехудожні назви, розрив між двома формами на рівні індустрії є разючим як за кількістю виданих назв, так і за продажами книг. Оцінки варіюються, але художні книги становлять лише приблизно 10% книг, виданих щороку. Продажі, проте, значно більше сприяють художній літературі. Знову ж таки, є річні зміни, але художні книги захоплюють приблизно половину щорічних продажів торгових книг. Минулого року 21 з 25 бестселерів були художніми творами. Використовуючи компіляцію Вікіпедії, з книг англійською мовою, які коли-небудь продалися тиражем 20 мільйонів примірників або більше, 84% становлять художні твори.

Тренди продажу книг відомі своєю мінливістю, але продаж художньої літератури, здається, продовжує зростати. Після падіння до 32% у 2019 році, вони зайняли 40% дорослого ринку у 2022 році і знову трохи зросли у 2023 році. Продажі художньої літератури для дорослих зросли ще на 6,3% у першій половині 2024 року.

Хоча штучний інтелект буде все частіше використовуватися авторами художньої літератури для допомоги у процесі створення, як обговорювалося в інших місцях, малоймовірно, що історії, створені штучним інтелектом, займуть полиці бестселерів. Можливо, що для деякої жанрової літератури це може бути “достатньо добре,” але це не те, що має змушувати авторів і видавців втрачати сон.

З іншого боку, написання і видання науково-популярної літератури буде підтримуватися і сприятися штучним інтелектом у всіх аспектах. Це вже відбувається. Автори науково-популярної літератури використовують численні таланти Chat AI як асистента з досліджень, так і як допоміжний засіб для написання. І видавці науково-популярної літератури все частіше звертатимуться до Chat AI за допомогою у розробці рукописів, перевірці фактів, редагуванні, маркетингу та розповсюдженні.

Чи існує екзистенційна загроза для авторів?

Я розмовляв з дуже розумним агентом автора, яка багато думала про те, що означає штучний інтелект для її клієнтів і для всіх професійних авторів. Розмова звернулася до ідеї книги як “контейнера,” і я попросив її розширити цю ідею. Її відповідь:

“Основна ідея полягає в тому, що коли автори/агенти розміщують книгу у видавця, це саме книга. Є розуміння, що вона може пізніше стати однією з численних форм похідних робіт, які ми знаємо (переклад, драматична адаптація, графічний роман тощо), але все це вторинне для “Роботи” як такої. Робота не є мішком слів чи фраз чи фактів, це щось структуроване автором таким чином, що є унікальним для цього автора. Розрив контейнера, струсонення мішка зі словами і витягування випадкового набору (який не зовсім випадковий, тому що це мішок зі словами, складений з синтаксису, семантики і стилю конкретного автора), не є тим, що розглядається, коли ми надаємо права видавцю.

“Книга є цілісним твором, який є більшим за суму своїх частин. Це продукт творчого прозріння (і тонни творчої інтелектуальної роботи), який об’єднав усе це як книгу, не просто “якусь” книгу, а книгу цього конкретного автора.”

Книги містять скарби

Коли я думаю про науково-популярні книги, розрив контейнера є однією з переваг ери штучного інтелекту. Ви розриваєте контейнер, і як яйця Фаберже, там містяться скарби.

Обмеження контейнера є одночасно і перевагою, і недоліком. З одного боку, “Робота не є просто мішком слів чи фраз чи фактів, це щось структуроване автором таким чином, що є унікальним для цього автора.” З іншого боку, при створенні контейнера, автор, завдяки внутрішнім обмеженням книжкового контейнера, був змушений скоротити, відкинути, переписати та переконфігурувати. Робота є відшліфованою, але вона є дистильованою, і деякі речі були втрачені (хоча інші були набуті) по дорозі.

Люди не читають довгі науково-популярні книги частково тому, що вони стали звикати до швидкого перегляду всього тексту, який вони зустрічають в інтернеті - включаючи їхні електронні листи. Навіть модель “резюме книги” не працює - замість незрозумілої 250-сторінкової науково-популярної книги ви отримуєте незрозуміле 8-сторінкове резюме книги.

Книги як ланч-бокси - все в одному місці. Але я просто хочу печиво.

Для відомих авторів не буде легко позбутися своїх кайданів. Але їм, можливо, доведеться навчитися це робити, або ризикують бути затьмареними новим поколінням досвідчених дослідників і письменників, які можуть висловлювати себе з формальними контейнерами або без них, залежно від ситуації. Контейнери накладають занадто багато обмежень і обмежень.

Суть у тому, що бізнес написання невідворотно змінився. Це як кінець переписувачів. У цьому випадку наші монаші автори повинні вийти з-за своїх столів і свого контейнерізованого бачення книги і взаємодіяти з формою і зі своєю аудиторією.

О, так, я добре знаю, що автори відповідають: Але я письменник, я не промоутер. Я не в соціальних мережах. Мене не цікавить фактичне спілкування з моїми читачами, крім моєї роботи і зрідка електронних листів і все рідших виступів. У мене є веб-сайт (але, правду кажучи, я ніколи його не оновлюю). Моя робота - це мій дар читачам. Вони можуть прийняти мою роботу або відхилити її, але я не буду приєднуватися до них у їхніх вітальнях.

Ну, можна відкласти сувої та чорнила, зроблені з крові горностаїв. Тепер заняття «автор» вимагає від вас вийти з-за вашого столу та зустріти своїх читачів там, де вони живуть, у їхніх вітальнях та на їхніх сторінках у Facebook. Ви можете скільки завгодно жалітися на це, тоді як ми закриваємо ваші гранти, ваше постійне місце роботи та ваші можливості публікації. Це новий сміливий світ письменників і читачів, без видавців, тих жахливих посередників, які наполегливо працюють над тим, щоб покращити вашу роботу, але постійно перебивають ваш прямий зв’язок з читачами, тими, хто цінує її найбільше.

Це не виключає можливості, що чудові книги з наративною документалістикою можуть знайти свою аудиторію. Навпаки. Такі книги можуть продовжувати сяяти. Нон-фікшн все ще буде бестселером, хоча економіка буде неможливою для всіх, окрім топових письменників. Поточна модель не повинна зникнути, щоб нова модель процвітала.

Я вважаю ці чудові документальні книги «красивими». «Красиві» в сенсі прекрасно написані, ретельно відредаговані, з любов’ю створені та надруковані на папері з сертифікатом FSC з зубчастими краями. Їх продають у бутіках.

Бутіки називаються «книгарні», але вони мають усі характеристики бутікової торгівлі – прекрасні об’єкти, ретельно відібрані власником та менеджерами, трохи дорогі, але для тих, хто цінує такі об’єкти, варті своєї ціни.

Завдання більшості авторів нон-фікшн тепер полягає в тому, щоб вийти за межі контейнера, а також видавця як воротаря.

Контейнери контенту в різних медіа

Читачі, особливо молодші, стають все більш «медіа-агностичними». В пошуках розваг або знань вони можуть дивитися відео на YouTube або TikTok, серіали на Netflix, слухати Spotify, гортаючи Instagram (Інста), дізнаватися новини або, іноді, читати книгу.

(Жителі BookTok, які обожнюють друковані книги, є цінним колом інфлюенсерів, але загалом мають скромний вплив на ринок.)

Однак ринкова модель все ще зосереджена на унікальному контейнері. Видавнича індустрія. Кіноіндустрія. Телевізійна індустрія. Музична індустрія.

Фільми – це не книги. Відео на YouTube – це не фільми. Подкасти – це не аудіокниги.

Ці силоси не були історично неминучими, а стали результатом серії бізнес-рішень, прийнятих потужними організаціями з часом.

Не важко зламати бізнес-модель, побудовану на одному контейнері.

Попри все своє вміння працювати з мовою, сучасне покоління генеративного штучного інтелекту ще більш сміливо створює звуки, зображення та відео. ШІ надає цій книзі аудіокниги кількома мовами, поряд із 31 перекладом електронної книги. Нічого з цього не було б навіть віддалено можливим без ШІ – економіка традиційного виробництва для мене не має сенсу.

Силоси контейнерів

Творців контенту традиційно навчають досягати успіху лише в одному контейнері. У нас є програми з написання, програми з кіно та музичні програми. Ми рідко замислюємося про те, що творчі письменники також можуть вивчати «другорядну» спеціальність у кіно або музиці. Або в програмуванні або у розробці додатків.

Що сталося з трансмедіа? Де програми, які навчають творчих людей бути, як колись казала Apple, “Майстрами цифрових медіа”?

Найкращий контент завжди перемагатиме. Але з часом контейнери для контенту стають все менш важливими. Цифрове покоління може не бути медіа-агностичним. Але вони гнучкі до форматів. Вони сприймають більшість свого контенту цифрово, через смартфони. Друк продовжуватиме знаходити свою аудиторію, але більше ніколи не буде в центрі.

«Видавець майбутнього» теж повинен бути гнучким до форматів. Більшість зростання у розповсюдженні контенту не відбувається за допомогою чорнила на папері, ані слів у файлах EPUB. Зростання аудіокниг не є випадковістю, як і популярність YouTube та TikTok.

Більша проблема полягає в необхідності робити новий і існуючий контент доступним, незалежно від його форми, а потім після відкриття перетворювати усвідомлення у покупку.

Відкриття та конверсія

Проблема онлайн-відкриття існує вже деякий час; ШІ її не створив. Цю проблему неодноразово підкреслював ветеран індустрії Майк Шатцкін більше одного разу. Існує так багато назв у друкованому вигляді, а цифрові формати дозволяють їм постійно залишатися у друку. Мільйони книг, що вийшли з друку, можна знайти у продавців вживаних книг. Крім того, щороку публікується більше двох мільйонів нових книг, лише англійською мовою. ШІ зробить проблему насичення ще гіршою, але вона вже вийшла з-під контролю.

Алгоритми Amazon не є безкорисливими – вони дуже добре справляються з тим, щоб показати те, що продається, книгу, яку ви, ймовірно, купите наступною. Ця книга не характеризується лише своїми показниками продажу. Вона продавалася найкраще не тому, що якийсь шахрай оптимізував онлайн-список. Вона продавалася найкраще, тому що вона була найкращою, і задоволені читачі говорили іншим купити її, як онлайн, так і особисто. (Amazon заохочував рекламу, яка спотворює його алгоритми, частина enshittification платформи.)

Я говорив вище про метадані. Конверсія така ж складна, як і виявлення. Чи може ШІ допомогти авторам перетворити переглядачів у покупців?

Майбутнє авторського права

Концепція авторського права стала абсурдною через ШІ. Справа не в тому, що люди не хочуть або не заслуговують на захист своєї роботи — можна стверджувати, що вони заслуговують на нього більше, ніж будь-коли. І не в тому, що ШІ робить авторське право нездійсненним (принаймні в якійсь формі, якщо не в нинішній формі).

Справа в тому, що “захист авторського права” також стає завісою, за якою ваша робота зникає. Якщо вашу книгу не можна згадати через розмову з ChatGPT, то вона, де-факто, не існує. Компанії з ШІ будуть ліцензувати лише кращі з кращих контенту. Вони не потребують знежиреного молока.

Навіщо захищати те, що не може бути знайдено?

Це те місце, де проблема виявлення може стати катастрофою. Google чудово робить виявлення книг лише через їх метадані. ШІ хоче весь обсяг інформації. На відміну від традиційних пошукових систем, ШІ не відповідає на запити користувачів тільки на основі абстрактних метаданих про роботу.

Водночас зміна контейнерів контенту, контейнерів, окрім цілих книг, пропонує різні види викликів авторського права. Якщо текст книги може змінюватися на льоту у відповідь на введення читача, то що тоді є авторським правом на текст?

Письменники та читачі

Видавці потребують авторів; автори не потребують видавців.

Майбутнє видавничої справи — це інтимні стосунки між письменниками та читачами. Вони набагато сильніші, ніж стосунки між письменниками та видавцями і між читачами та видавцями. Видавці можуть бути перешкодою у відносинах між письменниками та читачами. У багатьох випадках вони не сприяють відносинам, а заважають їм.

Довгий час єдиним способом доступу до високоякісного письмового контенту були книги або скромний вибір періодичних видань. Це, безумовно, більше не є таким. Окрім відволікаючих факторів інших медіа, тепер існує так багато різних способів доступу до (неконтейнеризованого) високоякісного письмового контенту. Книги більше не мають того пріоритету, який вони колись мали.

ШІ може спілкуватися

“Яка ідеальна книга для мене, щоб прочитати наступну?” Генеративний ШІ може відповісти на це питання з елегантністю і точністю, які ніколи раніше не були можливі. Коли ШІ стає надійним двигуном рекомендацій, авторам потрібно буде спілкуватися через цей двигун. (Amazon, звичайно, працює над цим, і має перевагу в тому, що знає, що ви купували раніше.)

Висновок

То де це нас залишає?

Я відчув необхідність каталогізувати виклики, з якими стикається видавнича справа. Чат-ШІ з’являється в час, коли торгова видавнича справа має проблеми. Це не той час, коли індустрія є стабільною і може сказати: “нам не потрібна якась нова технологія; у нас все добре”.

Я говорив вище про найнагальніші виклики, з якими стикається видавнича справа: зростання витрат і скорочення маржі.

Вовки ніколи не будуть насичені своїми вимогами щодо ще більших знижок; маржі не покращаться. Роздрібні ціни знаходяться біля стелі. Майбутнє поточної моделі торгової видавничої справи полягає у зниженні витрат.

Зарплати не можуть бути ще нижчими, тому потрібно буде зменшити витрати у виробничому циклі.

Але видавці намагалися знижувати виробничі витрати десятиліттями. Були деякі помітні успіхи, але ми вичерпали поточні варіанти.

Я показав, що ШІ може принести ефективність у видавничу справу, у всьому робочому процесі. Вони не є миттєвими і не є легкими: вам потрібно працювати над ШІ. Але можливість є.

Видавці не прагнуть скоротити персонал, тому мета полягає в тому, щоб більше книг виходило на ринок швидше на основі поточних ресурсів персоналу. Інструменти ШІ можуть сприяти досягненню цієї мети.

І, звичайно, завжди є мета продавати більше копій книг, які видаються. ШІ може допомогти і тут.

Я описав вище, як ШІ також може бути трансформаційним для майбутнього видавничої справи.

Не хвилюйтеся про це. Приведіть свій будинок до ладу, і ми поговоримо далі.

Єдиний ресурс

Зараз є майже нескінченний запас матеріалів, доступних для інформування вас про ШІ, звичайно, занадто багато. Виберіть свій улюблений медіум: книги, блоги, розсилки, відео, подкасти, курси та психічні ворожіння. Я посилався на деякі ключові джерела протягом цієї книги, варто натиснути декілька випадкових посилань, щоб побачити, куди вони вас приведуть.

Є лише одна відмінна книга про ШІ для початківців, Книга Ітана Молліка “Co-Intelligence”, яка була випущена на початку квітня 2024 року. Вона взята з його не менш відмінної розсилки, “One Useful Thing.”

Примітка: повноваження для написання цієї книги

Я не хотів обтяжувати вступ цією інформацією, але я усвідомлюю, що багато людей скептично ставляться до тих, хто сьогодні пише про штучний інтелект, підозрюючи, що ці автори вважають себе сучасними експертами з ШІ. Без сумніву, деякі з них такі. Сподіваюся, що я маю прийнятні повноваження для здійснення цього проєкту.

Я прочитав свою першу книгу про штучний інтелект у 1988 році, книгу, опубліковану двома роками раніше, Understanding Computers and Cognition: A New Foundation for Design Террі Віноградом та Фернандо Флоресом. Книга насичена — багато з неї було понад моє розуміння — але це був перший раз, коли я захопився можливостями штучного інтелекту у книговиданні.

На той час я був глибоко занурений у діджиталізацію видавництва, викликану вибухом настільної видавничої системи, комп’ютерів Apple, PageMaker та подібних. У 1986 році я керував розробкою програмного забезпечення Page One для автоматизованого видавництва книг, програми, яка могла взяти рукопис книги у вигляді файлу Microsoft Word і розмістити його у вигляді цілої книги за хвилини. Це дуже легко зробити сьогодні; тоді це було непросто.

Після цього я продовжив працювати в технологіях видавництва, як консультант та аналітик, працюючи з деякими з провідних постачальників програмного та апаратного забезпечення, включаючи Adobe, Apple та Microsoft. Я також став співвласником програмної компанії під назвою Enfocus. Ми створили автоматизовану систему для доведення перед друком.

На той момент ми не мали доступу до ШІ, але ми дуже добре освоїли розгортання повністю автоматизованих систем видавничого виробництва. Як ШІ може бути невіддільним від магії, так і найкраща автоматизація може здаватися схожою на ШІ.

Перенесемося у 2016 рік, коли мій колега Кліфф Гурен допоміг мені зосередитися на ШІ у книговиданні: здавалося, що щось нарешті починає відбуватися. The Bestseller Code (Арчер і Джокерс) з’явилася у вересні 2016 року, чітко показуючи, що комп’ютери можуть інтерпретувати текстуру літератури з високим ступенем проникливості та точності.

На той час я уважно стежив за стартапами у книговиданні, і невелика кількість з них з’явилася з певним рівнем технологій ШІ у своїх програмних продуктах.

Перенесемося знову в жовтень 2022 року.

За кілька місяців до того, як це стало темою, про яку всі говорили у видавництві, Тім О’Рейлі виступив на конференції PageBreak з доповіддю “ШІ та трансформація видавництва”. О’Рейлі добре відомий у видавничій спільноті, як завдяки O’Reilly Media, так і конференції Tools of Change. Він є одним з провідних візіонерів у сфері технологій.

О’Рейлі був не просто захоплений новими досягненнями у ШІ, він був надзвичайно захоплений. “Ми знаходимося на точці, яка дуже схожа на те, як я відчував, коли ми відкрили Всесвітню павутину у 1992 році,” сказав він, додавши, “це таке ж трансформативне, як VisiCalc, ПК та веб-браузер.”

Він зізнався, що (на той момент) випадок використання ще був нечітким, вказуючи на кілька пілотних проєктів в O’Reilly Media. Але, сказав він, “це стає кращим лякаюче швидко. Машинне навчання більше не є чимось майбутнім. Це про демократизацію ШІ.”

О’Рейлі говорив про те, як видавці повинні підходити до цих нових технологій, кажучи, що вони повинні “знати, коли спалювати човни і йти ва-банк. Є час, коли треба взяти на себе зобов’язання.”

ChatGPT був випущений лише місяць потому. PageBreak була першою видавничою конференцією, яка поставила його в центр уваги через уявлення Тіма.

Відкриття

Ця книга має п’ять спонсорів. Я знав, коли писав книгу, що багатств тут знайти не вдасться, і вирішив підтримати свої зусилля, запросивши спонсорів взяти участь.

Як я зазначаю на своєму вебсайті, працюючи консультантом, аналітиком та журналістом, я підтримую Глобальну хартію етики журналістів Міжнародної федерації журналістів. Параграф 13 чітко вказує на обов’язок уникати конфлікту інтересів або “будь-якого змішування (моєї) діяльності з рекламою чи пропагандою.”

Мати спонсорів означає наявність конфлікту інтересів і плутанину щодо реклами. Якби я працював для New York Times, все було б просто: “Ні”. Працюючи на себе, розкриття інформації є моєю зброєю для задоволення цих зобов’язань: я опишу винагороду, яку отримав, і ви зможете судити, чи була моя робота компрометована.

Я обрав спонсорів, яких запросив до цього проекту, тому що був знайомий не тільки з їхньою роботою, але й з особистостями, які працюють в їхніх організаціях. Вони є колегами та друзями. Я сказав їм, що їхні продукти можуть бути обговорені в тексті цієї книги, і вони не матимуть контролю над цими словами. Те, що вони могли контролювати, - це їхні рекламні оголошення в кінці книги — я розміщав їх такими, якими вони були надані. Це те, що я зробив.

Я отримав платежі від інших, які могли вплинути на мою роботу над цією книгою — я можу каталогізувати наступне:

  • Я не виконував жодної оплачуваної консультаційної роботи для постачальників AI, описаних у цій книзі, включаючи спонсорів.

  • Я отримав дохід від участі в прибутках від Publishers Weekly за вебінари з AI у вересні 2023 року.

  • Мені платять стандартну ставку за мої статті в Publishers Weekly.

Будь ласка, повідомте мене, якщо ви виявите будь-яке фаворитство, яке, на вашу думку, могло виникнути через ці взаємодії. Моя упередженість на користь AI сформувалася ще до того, як почали надходити великі прибутки.

Подяки

Я не зміг би говорити з будь-якою достовірністю про AI, якби не підтримка Publishers Weekly, включаючи редактора-емерита Джима Мільота та генерального директора Кевіна Брайермана. Джим підтримував мої ранні публікації про AI, а Кевін (разом з Крістою Рафаелло та рештою команди) були ключовими для успіху минулорічної конференції, AI and the Revolution in Book Publishing. Ендрю Албанез зараз є виконавчим редактором в PW; Ед Навотка, старший редактор. Мені пощастило працювати з ними.

І подальші подяки численним колегам…

  • Пітер Брантлі

  • Кліфф Гурен, давній суперечник і проникливий читач моїх чернеток

  • Два інших читачі версії “бета”, які надали цінні відгуки: Джо Вікерт і Бред Фармер

  • Мої Партнери з технологій видавництва, Кен Брукс, Білл Касдорф, Білл Розенблатт, Білл Тріппе, Стів Сік і наші найновіші партнери, Летті Конрад і Лінда Секондари.

  • Моя сестра, Енн Пашлі, яка допомагає мені підтримувати базу даних стартапів видавництва в актуальному стані і постійно заряджає мене енергією.

  • Мої партнери в моїх щомісячних вебінарах про AI: Брук Хорн і Браян О’Лірі з BISG.

  • Білл Касдорф допоміг мені глибше зрозуміти питання доступності для моєї книги.

  • Пітер Армстронг і Лен Епп з Leanpub були терплячі з моїми дрібницями і допомогли мені пройти процес, щоб запропонувати найкращий можливий результат на платформі Leanpub.

  • Хьюго Рейн з ElevenLabs за підтримку аудіокниг.

  • Мій добрий друг і надійний виявлювач моїх помилок в письмі та мисленні, Боб Макартур.

Додаток: Дослідження залишкових переваг традиційного видавництва

Престиж традиційного видавництва є причиною, чому більшість із нас приєдналися до цієї індустрії. Ми виросли, люблячи книги, вивчали англійську чи щось подібне в коледжі, трохи поблукали, можливо, отримали роботу в книжковій крамниці, можливо, отримали сертифікат магістра видавництва, потім працювали стажером у видавничій компанії, і ось ми тут сьогодні. Ви любите свою роботу, хоча зарплата паршива, а умови роботи не завжди приємні.

Цей самий престиж живить ланцюг постачання видавництва. На вхідній стороні ланцюга постачання: це багато значить для багатьох авторів. Ми бачимо це постійно. Економіка традиційного видавництва не має сенсу, і це займає в чотири рази більше часу, щоб вийти в друк, але, можливо, просто можливо, я стану наступним новачком-переможцем, як Делія Оуенс (Там, де співають раки) або другою мега-зіркою, як Амор Тоулс (Джентльмен у Москві).

Це як Вегас: тільки шанси краще в Неваді. Грайте на один номер в рулетці, і шанси проти вас 36 до 1. Грайте в традиційне видавництво, і шанси проти вас… набагато гірші.

Шанси отримати контракт з будь-яким з традиційних торгових видавців, не кажучи вже про одного з великих п’яти, є низькими. Але це найменша проблема автора. Насправді знайти читачів - це мега-виклик.

Однією з речей, яка може допомогти, є потрапляння до списку бестселерів.

Розглянемо PRH, Penguin Random House. Компанія видає лише 15 000 нових назв щороку. У 2021 році їм вдалося потрапити на список бестселерів Publishers Weekly з 196 книгами. Як підкреслюється у статті: “PW публікує чотири списки бестселерів для дорослих, кожен з 20 назвами: художня література в твердій обкладинці, нехудожня література в твердій обкладинці, трейд-паперові обкладинки та масові ринкові паперові обкладинки. Це означає, що протягом року є 2080 позицій у твердій обкладинці на наших списках та 2080 позицій у паперовій обкладинці.

Не всі бестселери були новими в тому році — припустимо щедро, що 90% були новими, 1870 місць.

Між тим The New York Times має 15 місць для бестселерів на тиждень для кожної категорії книг (художня література, нехудожня література, дитячі книги; окремі списки для YA та практичної літератури; тверда обкладинка окремо від паперової, плюс комбіновані списки). Для окремого автора це означає 780 доступних місць на рік, хоча більшість з цих місць займають повторювані продавці. (Тіло зберігає рахунок Бессела ван дер Колка перебуває у списку паперових обкладинок вже п’ять з половиною років!) Тож розділімо це навпіл, 390 доступних місць. Треба продати багато книг, щоб захопити одне з них.

А що щодо оглядів у New York Times Book Review? У 2016 році Памела Пол, тодішній редактор Review, заявила, щоThe Book Review у Times рецензує близько 1% книг, що виходять щороку.” Очевидно, що вона має на увазі 1% книг від провідних видавців — вона не може думати про малі видавництва або самвидавців. І тому, можливо, рецензується 150 з 15 000 нових назв PRH щороку.

Більшість спостерігачів погоджуються, що хоча привернення уваги від провідних медіа все ще важливе і може бути потужним, вплив рецензій не такий, як раніше, якщо не з іншої причини, ніж те, що менше читачів книг взаємодіють з основними рецензійними виданнями.

Звернімо нашу увагу на ланцюг постачання вниз по течії, на дистрибуцію. Хоча бренди видавців мають вагу серед авторів, завжди було загальновідомо, що, на відміну від багатьох споживчих товарів, бренди видавців мають майже ніякої ваги серед покупців і читачів книг. Але вони мають велике значення для дистриб’юторів і книгопродавців. Це відображає історичний бізнес-бізнес характер видавництва (а не B2C — до споживачів). Престиж видавця поширюється через канали дистрибуції та роздрібної торгівлі: Barnes & Noble носить книгу, тому що вона від PRH, а потім ставить її перед обличчями покупців; так і поширюється престиж до читачів.

Спонсори

Банер, на якому написано 'BOOK ADVISORS LLC Транзакційні послуги та консалтинг для видавців'.

Девід Ламб та Сьюзан Рейх заснували Book Advisors LLC у 2016 році для консультацій щодо злиття та поглинання у видавничій справі. Ми завершили більше десятка транзакцій, а також різноманітні проекти з фінансового, дистрибуційного та операційного консалтингу, включаючи оцінку справедливої ринкової вартості. Ми раді, що останнім часом працювали у співпраці з Clarke & Esposito; Тад МакІлрой з The Future of Publishing; та Куо-Ю Ліанг з Ku Worldwide.

Ми пишаємося нашими відносинами, ретельністю та конфіденційністю. Якщо ви зацікавлені у купівлі, продажу, фінансуванні або консультаціях, будь ласка, зв’яжіться з нами для конфіденційної розмови.

bookadvisorsllc.com | bookadvisors@gmail.com

3x2 сітка банерів: Банер, що оголошує, що Papercutz був придбаний Mad Cave Studios у серпні 2022 року у співпраці з Ku Worldwide LLC; Банер, що оголошує, що DAW Books був придбаний Astra Publishing House у липні 2022 року у співпраці з Ku Worldwide LLC; Банер, що оголошує, що Caslon Publishing був придбаний Brookes Publishing Co. у квітні 2022 року у співпраці з Тадом МакІлроєм; Банер, що оголошує, що B.E.S. Publishing був придбаний Sourcebooks у листопаді 2021 року; Банер, що оголошує, що Applewood Books був придбаний Arcadia Publishing у квітні 2023 року; Банер, що оголошує, що Erewhon Books був придбаний Kensington Publishing у жовтні 2022 року
Логотипи Firebrand Technologies та NetGalley.

Firebrand Technologies — це компанія з розробки програмного забезпечення та надання послуг, яка вже більше 35 років допомагає видавцям книг з рішеннями для управління даними та робочими процесами.

NetGalley — це онлайн-платформа, яка з’єднує видавців та авторів з рецензентами, бібліотекарями, книготорговцями, представниками ЗМІ та освітянами, які відкривають нові книги на NetGalley та рекомендують їх своїй аудиторії.

Як розробники програмного забезпечення та цифрових рішень, Firebrand Technologies та NetGalley також є експертами галузі та активними членами видавничої спільноти. Наші рішення приносять користь усім аспектам видавничого процесу, від придбання до продажу та маркетингу.

  • NetGalley допомагає видавцям створювати шум навколо назв, отримувати швидкі відгуки та рецензії, а також виявляти ранні тенденції.

  • Title Management Enterprise разом зі своєю компактною версією, Title Management Lite, є основним програмним додатком Firebrand, що забезпечує розширене управління видавничими робочими процесами протягом усього видавничого процесу.

  • Eloquence on Demand — це найпотужніша платформа розповсюдження ONIX у видавничій галузі, що розповсюджує метадані та цифрові активи більш ніж 600 торговим партнерам у форматах ONIX та інших.

  • Flywheel — це сервіс маркетингу бекліста, який виявляє приховані можливості в беклісті для підвищення впізнаваності та продажів.

  • Eloquence on Alert моніторить дані про назви в режимі реального часу та тенденції на ринку і повідомляє видавців про критичні помилки та можливості, що можуть вплинути на продажі (відсутність кнопок купівлі, сторонні продавці тощо).

  • FlightDeck — це найпросунутіший інструмент для валідації та тестування EPUB.

Інфографіка, що показує різні послуги, які пропонує NetGalley, включаючи просування книг, управління видавничими робочими процесами, розповсюдження метаданих, маркетинг продажів та бекліста, а також тестування EPUB.
Банер для Perfect Bound, ринку, що з'єднує видавців з друкарнями по всьому світу.

Ласкаво просимо до кращого способу друкувати книги.

Perfect Bound був створений у 2022 році, щоб допомогти вирішити проблеми з ланцюгом постачання, які переслідують видавничу галузь вже багато років. Періоди надмірної потужності друкарень змінюються короткими затримками через дефіцит постачання. Perfect Bound прагне відкрити ринок друку для незалежних видавців та авторів, дозволяючи друкарням з усього світу легко з’єднуватися та співпрацювати з видавцями, які шукають нових та динамічних постачальників.

Що таке Perfect Bound?

Perfect Bound — це двосторонній ринок, що з’єднує незалежних видавців книг з друкарнями в США, Канаді, Колумбії, Бразилії, Туреччині, Китаї, Малайзії, Індії та інших країнах.

Ілюстрація друкарського преса з різними видами книг та публікацій, що виробляються.

Відкрийте нових видавничих партнерів одним кліком

Наша потужна платформа дозволяє вам легко створювати запити на продукти, надсилати запити на сотні друкарень натиском однієї кнопки, домовлятися та фіналізувати ваші друковані тиражі та відстежувати продукти від друкарні до складу. Як друкарня, з’єднання з новими видавцями, участь у тендерах на майбутні проекти та отримання оплати ще ніколи не було таким простим або безпечним.

Миттєво з’єднуйтесь з новими видавничими партнерами

  • Надсилайте та отримуйте запити на друк з усього світу

  • Виконуйте та відстежуйте друковані тиражі від друкарні до складу

  • Безперешкодно здійснюйте транзакції за допомогою ACH платежів через Stripe без покидання платформи

Реклама Shimmr, що демонструє автоматизовану рекламу, яка продає книги, зазначаючи підвищення продажів на 35% та вдвічі кращу віддачу від рекламних витрат.
Реклама Shimmr з прикладами оголошень, інформацією про ціни та QR-кодом для бронювання демонстрації.

Зустрічайте Insight, AI платформу, створену спеціально для видавців

Крупний план людини, що тримає відкриту книгу з сяючими елементами, що випромінюються з сторінок.

“Впровадження Insight для нашого видавництва було схоже на заміну велосипеда на Ferrari. Раптом все почало рухатися швидше.”

—-Німецьке видавництво дитячих книг та клієнт Insight

Працюйте розумніше, досягайте більше

Розроблений Veristage, Insight надає можливість видавцям процвітати в умовах змінного ландшафту штучного інтелекту. Використовуючи ШІ та надійний набір цифрових інструментів, Insight аналізує та розуміє ваші документи та книги, щоб допомогти вам:

  • Створювати, покращувати та оновлювати метадані

  • Прискорювати створення маркетингових, публічних та продажних матеріалів для конкретних заголовків

  • Визначати та оцінювати ключові повідомлення книги, унікальні точки продажу, цільову аудиторію, порівняльні заголовки та багато іншого

  • Оптимізувати ваші маркетингові та продажні матеріали для максимального охоплення, залучення та збільшення продажів

На відміну від загальних платформ ШІ, Insight розроблений для функціонування в межах видавничих робочих процесів та допомагає створювати інформацію та активи, специфічні для видавництва.

Як це працює

  1. Завантажте свою книгу на платформу Insight

  2. Інструменти ШІ Insight аналізують та розуміють вашу книгу

  3. За кілька хвилин Insight генерує широкий спектр метаданих та ключової інформації про вашу книгу для редакційних, маркетингових, публічних, продажних та правових відділів

  4. Вносити ручні правки до будь-якої з цієї інформації можна безпосередньо на платформі. Ваша книга та контент ШІ зберігаються в Insight, тому ви можете отримати до них доступ у будь-який час.

  5. Використовуйте наш чат штучного інтелекту з обізнаністю про документи для оптимізації інформації про заголовки, взаємодії з вашими книгами та інтеграції деталей книг у комунікації та інші матеріали

Безпека та авторське право

Команда Veristage прагне надавати послуги штучного інтелекту, які є безпечними та захищають інтелектуальну власність видавців. Наша платформа має сучасні системи інформаційної безпеки, і ми працюємо лише з моделями ШІ, які не зберігають і не використовують ваші дані для навчання майбутніх моделей.

Рішення для видавців будь-яких розмірів

Insight розроблений для роботи з видавцями будь-яких форм і розмірів, від споживчих до академічних, від команд з трьох осіб до міжнародних організацій. Ми пропонуємо конкурентоспроможні ціни та масштабовані рішення.

Зв’яжіться з нами, щоб дізнатися, як Insight може принести користь вашому бізнесу:

Логотип Veristage у синьому кольорі з абстрактним дизайном.