Rewolucja SI w Wydawnictwie Książkowym (Polskie Wydanie)
Rewolucja SI w Wydawnictwie Książkowym (Polskie Wydanie)
Thad McIlroy
Buy on Leanpub

Spis treści

Wstęp

“Następna rewolucja zaskoczy nas wszystkich, jak zawsze. Innymi słowy: jeśli tłum przewiduje rewolucję, to nie może być rewolucja.” —Doc Searls, 2002

Minęło ponad półtora roku, odkąd OpenAI wprowadziło ChatGPT do publiczności, która w większości nie była zaznajomiona ze sztuczną inteligencją. Początkowo wydawało się, że nie ma to oczywistego znaczenia dla wydawnictwa książkowego. Od tego czasu wszystko się zmieniło. I nic się nie zmieniło. Wydawcy zaczynają zanurzać się w nowe narzędzia AI, eksplorując ich granice i angażując się w ostrożne rozmowy z ChatGPT. Ale nie ma oznak prawdziwej rewolucji w praktyce wydawniczej; jest po prostu za wcześnie.

Jest mnóstwo niepewności wokół AI w pisaniu i wydawaniu. Główne kontrowersje otaczają użycie AI. Mimo to, dla wielu jest to ekscytujące możliwości.

Skupię się tutaj bardziej na obietnicy niż na zagrożeniu, ale zawieram również przegląd obaw i ryzyk związanych z AI, szczególnie w kontekście autorów i wydawców. Nie staram się umniejszać obaw. Po prostu nie o tym jest ta książka.

Czy to jest książka?

Uważam tę publikację bardziej za ‘broszurę’ niż książkę. Definicja książki według UNESCO to “przynajmniej 49 stron” (dlaczego nie 50?), a przy 300 słowach na stronę, ta mogłaby się nie kwalifikować. Ale co ważniejsze, nie ma ona być ostatecznym słowem na cokolwiek—to bardziej raport z postępów. Sztuczna inteligencja i jej rola w wydawnictwie książkowym zmieniają się w zawrotnym tempie, które nie wykazuje oznak spowolnienia. Więc ta książka(broszura), ten raport, jest tylko migawką.

Korzystając z platformy Leanpub, publikowałem moje badania i analizy jako prace w toku—jest to rewidowane jako żywy dokument. Nigdy wcześniej tego nie próbowałem. Moje powody są dwojakie: aby zaoferować coś użytecznego w krótkim okresie oraz aby mieć możliwość rewizji w miarę potrzeb. Historia AI jest daleka od zakończenia.

Mam nadzieję, że moje podejście okaże się przydatne dla czytelników, chociaż jestem świadomy, że zbyt wiele aktualizacji może stać się irytujące. Starałem się zmniejszyć aktualność tej książki, aby zmniejszyć nacisk na rzeczy, które zmieniają się najszybciej.

Wersja, która była (cicho) dostępna od kwietnia 2024, była oznaczona jako „75% ukończona” i była dostępna za darmo dla czytelników. 23 lipca to oficjalna data publikacji wersji „100% ukończona”, która również trafi do szerszej dystrybucji poza Leanpub. Będę nadal aktualizować wersję 100%: ale te aktualizacje będą dostępne tylko dla kupujących Leanpub—ciągłe aktualizowanie drukowanych książek, ebooków i audiobooków w szerszej dystrybucji jest nieporęczne.

Problemy wydawców z samą sztuczną inteligencją

Codziennie słyszę o problemach, z którymi borykają się ludzie w branży wydawniczej, próbując zrozumieć sztuczną inteligencję (SI). Dlaczego jest to takie bolesne? Oto trzy powody, które widzę:

  • Technologia jest skomplikowana i tajemnicza, zbyt skomplikowana, aby zrozumieli ją niespecjaliści. (Istnieje fascynujące badanie, które proponuje “skalę lęku przed SI (AIAS)”, mierzącą 21 różnych powodów, dla których ludzie odczuwają niepokój związany z SI.)

  • SI stała się ogromnie kontrowersyjna w wydawnictwie, głównie z powodu kwestii praw autorskich, które uderzają w samo serce tworzenia i publikowania.

  • Istnieje także atmosfera FOMO - Lęku przed przegapieniem. Pomimo wielu wad SI, jak w przypadku wielu kuszących technologii (Apple Watch? Inteligentne głośniki?), odczuwamy to dręczące uczucie: co jeśli przegapiam następną naprawdę wielką rzecz, tak jak przegapiłem kilka ostatnich wielkich rzeczy. Wtedy czułem się głupio; nie chcę znowu czuć się głupio. To boli.

W porządku: Zrozumiałe jest, że ludzie z branży wydawniczej odczuwają ból związany z SI.

Więc jaki jest przypadek użycia tej książki?

Przypadek użycia polega na tym, że pracujesz w wydawnictwie książkowym, albo jesteś autorem próbującym lepiej zrozumieć wydawnictwo książkowe, i masz dość uczucia głupoty i dezorientacji wokół SI. Zbyt wielu twoich kolegów wydaje się rozumieć to lepiej niż ty, i masz dość tego, że nie możesz inteligentnie angażować się w temat.

Moim celem dla czytelników jest, aby po przeczytaniu tej książki czuli się zdolni do włączenia się do rozmowy, do wyrażania poinformowanej opinii. Chcę, żebyś czuł się wyposażony w narzędzia do podejmowania osobistych decyzji związanych z technologią, i miał ścieżkę do nauki, jak korzystać z SI, jeśli zdecydujesz się to zrobić.

Nie chcę zalać czytelników mnóstwem bełkotu na temat podstaw technologii SI - nie zamierzam dużo mówić o SI w abstrakcji. Zamiast tego chcę dać ci podstawy dotyczące SI specjalnie dla tworzenia i wydawania książek. Jeśli ktoś zapyta cię, co naprawdę oznacza przetwarzanie języka naturalnego, możesz odpowiedzieć, jak ja: Nie jestem ekspertem od SI. Ale wiem, jak SI jest używana w mojej branży.

Czy to będzie dokładnie to, co musisz wiedzieć?

Nie lubię określenia “co musisz wiedzieć”, ponieważ rzadko kiedy spełnia ono swoje obietnice, często mijając się z celem, dostarczając albo zbyt wiele, albo zbyt mało informacji. Czy uda mi się to zrobić dobrze? Poważnie staram się przekazać minimum. Myślę, że wiem, co wydawcy muszą wiedzieć o AI, ponieważ rozmawiałem z wieloma z nich, prowadząc seminaria i webinary zaprojektowane bardzo konkretnie, aby dostarczyć tylko podstawowe informacje.

An icon of a key

Zamiast nieskończenie powtarzać frazę “co musisz wiedzieć”, użyję logo klucza z wciętym tekstem.

Po streszczeniach wprowadzających wiele sekcji, rozszerzę główne koncepcje. Starałem się również, aby były one jak najkrótsze, chociaż, prawdę mówiąc, czasami się rozpisuję.

Krótką formą, której będę używał, jest “Chat AI”. Kiedy OpenAI po raz pierwszy wprowadziło ChatGPT, było to jedyne takie rozwiązanie, ale teraz pojawiło się kilku ważnych konkurentów. Zaraz przejdę do szczegółów, ale na pewno słyszałeś już o niektórych z nich, oczywiście o Google i Microsoft. Oni (i kilka innych firm) teraz oferują oprogramowanie do czatów AI online, które jest podobne do ChatGPT. I dlatego zamiast mówić “ChatGPT i jego konkurenci”, będę odnosił się do całej kategorii jako “Chat AI”. Jeśli napiszę “ChatGPT”, będę odnosił się konkretnie do oprogramowania OpenAI.

Książka jest głównie praktyczna, ale w ostatniej części przedstawiam esej na temat możliwych realnych konsekwencji AI dla branży wydawniczej, obok kilku innych spekulacyjnych rozważań.

Dla kogo jest ta książka?

Główną grupą odbiorców tej książki są wydawcy książek handlowych (konsumenckich). Drugą grupą odbiorców są wszyscy inni wydawcy książek (naukowych, edukacyjnych…), na tyle, na ile te branże się pokrywają. Trzecią grupą są autorzy zainteresowani tematem oraz wielu innych, którzy fascynują się wydawaniem książek.

Podtytuł wskazuje, że jest to przewodnik po AI zarówno dla pisarzy, jak i wydawców. Częściowo dlatego, że chcę, aby wydawcy również rozumieli, co pisarze robią z tą technologią. Uważam, że to ważne. Na swoim ostatnim dorocznym spotkaniu, BISG (Book Industry Study Group), który głównie reprezentuje wydawców handlowych, wskazał, że “chce czerpać z szerszego grona, w tym agentów literackich i autorów.” To mile widziany krok.

Chcę, aby pisarze przeczytali tę książkę, ponieważ może im pomóc zrozumieć, co wydawcy robią z ich rękopisami. Autorzy publikujący samodzielnie zawsze śledzą tradycyjne wydawnictwa, częściowo dlatego, że de facto sami są wydawcami, więc technologia AI interesująca wydawców może być interesująca również dla nich.

Ale nie miejcie złudzeń, to nie jest praktyczny poradnik dla autorów, jak używać AI, aby być lepszymi i bardziej produktywnymi pisarzami. Istnieje wiele książek na ten temat (niestety, wiele z nich to oszukańcze podróbki na Amazonie). I mnóstwo filmów na YouTube (o różnej jakości).

W ramach wydawnictw książek handlowych moim idealnym czytelnikiem niekoniecznie jest decydent, ale raczej jeden z wielu ludzi pracujących w branży każdego dnia, tworząc książki i znajdując czytelników. W tej książce będę mówić o wszystkich kluczowych funkcjach wydawniczych, od redakcji po sprzedaż i dystrybucję. I o przecięciu pisarzy z czytelnikami.

Chociaż dorastałem w Kanadzie i tam rozpocząłem swoją karierę wydawniczą, mieszkam w San Francisco, w Stanach Zjednoczonych, więc naturalnie myślę o amerykańskim przemyśle wydawniczym. Ale prawie wszystko w tej książce powinno być równie istotne dla wydawcy na Madagaskarze, co dla wydawcy na Manhattanie. Chociaż wydawcy w mniejszych krajach borykają się z problemami skali, podobnie jak mali wydawcy w Ameryce, i ta książka jest przeznaczona dla firm różnej wielkości.

Gdy rozmawiam z małymi wydawcami o AI, a także z bardzo dużymi wydawcami o AI, zauważam dużą różnicę w pojęciu “przedsiębiorstwa wydawniczego”. Najwięksi wydawcy często są częścią (lub są blisko) publicznych firm, a gdy jesteś publiczną firmą, kwestie reputacji i bezpieczeństwa stają się znacznie większe niż dla codziennego wydawcy, nie odpowiadającego w ten sam sposób przed akcjonariuszami i mediami. Podczas gdy redaktor w jednym z Wielkiej Piątki wydawnictw ma takie samo zastosowanie narzędzi AI jak niezależny redaktor pracujący dla mniejszych firm, kontekst, w którym używają tych narzędzi, jest zupełnie inny.

Ile musisz wiedzieć o AI, aby przeczytać tę książkę?

Zakładam, że moja publiczność ma z grubsza zerową wiedzę na temat wnętrza AI, ale że są to inteligentni czytelnicy. Więc będę stąpał po cienkiej linii między zerową wiedzą a nie traktowaniem czytelnika z góry.

Wyobrażam sobie, że prawie każdy słyszał o nowej generacji AI: sondaż YouGov z marca 2024 roku sugeruje, że tylko 7% Amerykanów nie wie “nic a nic” o AI. Pisarze i wydawcy prawie na pewno słyszeli o niektórych skargach dotyczących praw autorskich, ale prawdopodobnie nie mają pełnego zrozumienia problemów. Więc nie muszę wyjaśniać, że AI oznacza “Sztuczna Inteligencja”. Ale nie zakładam, że czytelnicy mogą zdefiniować, czym jest AI, co oznacza, jaki ma potencjalny wpływ i tak dalej. Dlatego tu jesteś.

Dostępność, ogólnie i szczegółowo

Moje motto przy publikacji tej książki to „dostępność”.

Dla większości ludzi oznacza to coś w rodzaju „dostępności”, i rzeczywiście, zamierzam udostępnić tę książkę w jak największej liczbie form i formatów, jakie mogę sobie wyobrazić. Chcę rozszerzyć pojemnik. Staram się uczynić moją książkę wzorcową publikacją, podkreślając pełen zakres tego, co można dziś osiągnąć, publikując jedną książkę.

Na Leanpub znajdziesz książkę dostępną jako plik PDF, plik EPUB oraz jako bezpłatną publikację internetową. Znajdziesz tłumaczenia na 31 języków, w tym główne języki azjatyckie i europejskie. Będzie dostępnych wiele audiobooków w głównych językach.

Udostępnię również książkę, w formatach drukowanych i cyfrowych, na wszystkich platformach e-commerce, które można uzyskać za pośrednictwem Ingram i Amazon. Obejmuje to większość internetowych stron sprzedaży książek na świecie. W ten sposób biblioteki również będą mogły kupić książkę, choć, co zrozumiałe, mają ograniczoną przestrzeń na prace publikowane samodzielnie. (Podaruję kopie drukowane i cyfrowe każdej bibliotece na świecie, która o nie poprosi.)

Oprócz darmowej wersji internetowej całej książki, stworzę darmowe fragmenty, sesje Q&A i infografiki dla tych, którzy chcą tylko zasmakować lub spróbować. Będą dostępne za pośrednictwem mojego bloga.

Nie ma sensu nagrywać wideo całej książki, gdy dostępne są audiobooki. Ale niektórzy ludzie wolą mieć dostęp do treści za pośrednictwem wideo. Dlatego oferuję skrócone wersje wideo, w różnych długościach.

A co z ludzkim dotykiem? Będę również dostępny poprzez webinary lub indywidualne konsultacje online za pośrednictwem mojej strony internetowej i bloga. Mogę nawet zostać zatrudniony, aby pojawić się osobiście!

„Dostępność” oznacza znacznie więcej niż jej słownikowa definicja. Jak stwierdzili ludzie z Canadian National Network for Equitable Library Service (NNELS) wyrażają to, „Dostępna książka to taka, która może być używana i rozumiana przez każdego.” Z tego powodu mój angielski plik EPUB spełnia rekomendację W3C 1.1 dla osób z niepełnosprawnościami drukarskimi, w tym solidne opisy alt text dla obrazów. Oczekujemy, że ten standard dostępności spełnią również tłumaczenia na języki obce.

Tekst alternatywny został stworzony za pomocą ChatGPT. Nie edytowałem wersji ChatGPT, aby każdy czytający EPUB mógł zobaczyć, jak dobra jest, i gdzie wciąż brakuje. Jak przypomina mi mój kolega Bill Kasdorf, dobry tekst alternatywny opisuje, co widzi czytelnik widzący obraz, a nie tylko, jak on wygląda.

Dla wydawców książek dostępność nie jest już opcją: to ustawienie domyślne.

(Mam dwa mea culpas do podzielenia się: Z powodu ograniczeń w ramach platform wydawniczych, domyślny plik PDF niestety nie spełni specyfikacji PDF/UA, ani nie będę mógł zaoferować wersji książki z dużym drukiem na stronach e-commerce. Ale obie są dostępne na życzenie.)

Kilka spraw organizacyjnych

Jak wskazano, ta książka jest (stosunkowo) krótka. Kiedy nazywasz krótki dokument „książką”, ryzykujesz, że kupujący będą protestować: „Myślałem, że kupuję książkę, ale ma tylko 50 stron!” Zrobiłem wszystko, co w mojej mocy, aby na stronie sprzedaży było jasne, że to nie jest pełnowymiarowa książka, ale jeśli jesteś rozczarowany, pamiętaj, że Leanpub oferuje 60-dniową gwarancję zwrotu pieniędzy, a ja z przyjemnością przedłużę tę ofertę zwrotu na „zawsze”. Chcę, aby czytelnicy byli zachwyceni, a nie rozczarowani. (Jeśli kupiłeś książkę na innej platformie, napisz do mnie: wyślę czek!)

Książka jest mocno hiperłączona (pojawiają się one w różny sposób w różnych formatach, ale często jako przypisy). Zawsze wierzyłem w linkowanie do oryginalnych źródeł w mojej pracy, aby czytelnicy mogli zweryfikować moje czasem wielkie twierdzenia. Ale jestem świadomy, że hiperłącza i przypisy mogą być rozpraszające, szczególnie jeśli używasz urządzenia do e-czytania. Przepraszam za to. Najlepiej jest ignorować linki podczas czytania i wrócić do nich, jeśli chcesz zgłębić temat.

Nie wiem, w jakim formacie teraz czytasz (lub słuchasz). Ani w jakim języku. Starałem się, aby „ergonomia” książki była jak najbardziej przyjazna dla użytkownika, ale linki i przypisy nie zawsze są optymalne z tej perspektywy.

Ta książka ma sponsorów, coś, co wiem, jest nietypowe dla „książki”. Wyjaśniam, jak działa sponsoring w mojej sekcji „disclosures” na końcu tekstu.

Dlaczego AI teraz?

An icon of a key

Kiedy rozmawiam z wydawcami, słyszę o pilnych, natychmiastowych problemach. AI zazwyczaj nie jest jednym z nich.

Rosnące koszty produkcji drukarskiej są uciążliwe od kilku lat, choć teraz wydają się stabilizować. Zwiększone koszty dystrybucji stanowią wyzwanie dla wszystkich graczy. Prowadzi to do presji cenowej—istnieją dowody na to, że czytelnicy zaczynają się buntować przeciwko obecnym cenom nowych twardych okładek i książek w miękkiej oprawie. Klasyfikuję te problemy jako “analogowe”—technologie cyfrowe niewiele wnoszą, aby je rozwiązać.

Potem są szersze problemy “egzystencjalne”, które budzą coraz większy niepokój, ale są to kwestie niejasne, bez oczywistych rozwiązań. Należą do nich:

  • Odkrywanie treści i zaangażowanie odbiorców za pośrednictwem internetu i mediów społecznościowych.

  • Zmieniające się zachowania konsumentów i nawyki czytelnicze.

  • Konkurencja ze strony innych mediów cyfrowych.

Wierzę, że AI może być ogromnie pomocne dla wydawców w tych obszarach, ale metody nie są oczywiste i wdrożenie ich zajmie trochę czasu. Opiszę to w późniejszych rozdziałach książki.

AI: Jak zacząć

Zanim przejdę do nudnego tła technicznego, zachęcam cię, abyś od razu wskoczył do oprogramowania online. Najlepsze narzędzia są darmowe do wypróbowania. Jest ChatGPT. I Claude.ai. Możesz pobawić się Microsoft Copilot. Albo spróbować Google’s Gemini.

Tak większość ludzi zaczyna przygodę z AI—zakładam, że już wypróbowałeś jedno lub więcej z tych narzędzi. Zakładam również, że nie używałeś ich długo. Większość ludzi, z którymi rozmawiam, poświęca tylko kilka minut. Próbują kilku pytań, dostają dość oczywiste odpowiedzi i idą dalej.

Zła metoda.

Zgadzam się z Ethanem Mollickiem, którego prace będę opisywać kilka razy w tej książce. W swoim blogu i w niedawnym wywiadzie, Mollick mówi o swojej “zasadzie 10 godzin”:

“Chcę wskazać, że 10 godzin jest tak samo arbitralne jak 10 000 kroków. Nie ma na to naukowej podstawy. To jest obserwacja. Ale również przesuwa cię to poza, bawiłem się tym przez wieczór, i kieruje ku używaniu tego w poważny sposób. Nie wiem, czy 10 godzin to prawdziwa granica, ale wydaje się być w pewnym stopniu transformujące. Kluczem jest używanie tego w obszarze, w którym masz wiedzę, abyś mógł zrozumieć, w czym jest dobre lub złe, i nauczyć się kształtu jego możliwości.”

Inny komentator, recenzując najnowszą książkę Mollicka o AI, zauważył równie prawdziwą “zasadę dziesięciu”: “Godzina eksperymentowania z tymi narzędziami jest warta dziesięciu godzin czytania o nich.”

Rozumiesz, o co chodzi. To jest o działaniu, nie o rozważaniu. Moja książka to rozważanie. Musisz się pobrudzić ręce.

AI: Bardzo krótka historia

An icon of a key

Jeszcze kilka lat temu przeciętny człowiek słyszał o AI jedynie jako o abstrakcji, albo w kontekście science fiction, albo czegoś, co mogło pokonać arcymistrza w szachach lub Go. Nagle AI jest wszędzie, tworząc fałszywe wrażenie, że to coś nowego. Nawet nowe rzeczy nie są dokładnie nowe. Ale to bez znaczenia. AI miało niewielkie znaczenie dla wydawnictw książkowych przed ChatGPT. Teraz ma ogromne znaczenie.

Zrozumienie około 70-letniego rozwoju AI może być fascynujące, ale w żaden sposób nie jest wymagane, aby docenić to, co dzieje się dzisiaj.

Our World In Data robi to dobrze krótko zapisując historię—zostawię to im.

Obecna generacja AI została opracowana głównie w ciągu ostatniej dekady. Potem, nagle, ChatGPT pojawił się 30 listopada 2022 roku. Dwa miesiące później miał 100 milionów użytkowników miesięcznie, najszybszy, jakikolwiek technologia kiedykolwiek weszła na rynek konsumencki (dla porównania, Facebook potrzebował ponad dwóch lat, aby osiągnąć 100 milionów użytkowników).

Dlaczego tak szybka adopcja? Po pierwsze, jest fascynująca i zabawna. Po drugie, jest darmowa. Po trzecie, nie musisz kupować nowego urządzenia, aby z niej korzystać. I po czwarte, nie potrzebujesz żadnego szkolenia, aby uzyskać dostęp do ChatGPT (lub jego konkurentów Chat AI). Ale te same czynniki dotyczyły także Facebooka, więc dlaczego ChatGPT?

Jak słynnie zauważył Arthur C. Clarke, “Każda wystarczająco zaawansowana technologia jest nie do odróżnienia od magii.” Chat AI to magia. Doświadczenie ‘rozmawiania’ w codziennym języku z maszyną… to jest magiczne. Doświadczenie powiedzenia “Chcę obraz książki w balonie na chmurze blisko słońca,” a potem, po kilku sekundach,

Otwarta książka z balonem na gorące powietrze wyłaniającym się z jej stron, unoszącym się wśród chmur.

… także magiczne. Obrazy generowane przez GPT zaczynają wyglądać podobnie w stylu, kolorowe i fantazyjne. Więc wysłałem drugą komendę “teraz w stylu ilustracji z XV wieku.” I oto:

Artystyczna ilustracja balonu na gorące powietrze z misternymi wzorami, unoszącego się wśród chmur z słońcem w tle.

Jeśli chcę mieć wideo z książką w balonie w chmurze koło słońca, jest ponad tuzin narzędzi do wyboru, i presto. I muzyczny podkład do wideo. Jak to brzmi? To jak magia.

Z obawy przed wydawaniem się lekceważącym wobec niezwykłych zdolności SI, sprowadzając je do kategorii niezgłębionej “magii,” fajnie jest dowiedzieć się, że wielu naukowców odpowiedzialnych za obecną generację SI przyznaje, że naprawdę nie rozumieją dokładnie, jak to działa. Jak zauważa raport w najnowszym numerze MIT Technology Review, “pomimo wszystkich sukcesów, nikt nie wie dokładnie, jak - ani dlaczego - to działa.” Ekscytujące, ale trochę przerażające.

Zrozumienie SI i kluczowe terminy

An icon of a key

SI wiąże się z mnóstwem technologii i terminologii, z których większość jest niezrozumiała dla wszystkich oprócz naukowców zajmujących się danymi. Użytkownicy Chat SI nie muszą mieć dogłębnej wiedzy na temat terminologii SI ani technicznych koncepcji. Konwersacyjny charakter systemu pozwala na intuicyjne interakcje bez specjalistycznej wiedzy na temat działania. Ważniejsze jest skupienie się na tym, co Chat SI faktycznie może zrobić.

Przygotowując tę książkę, zmagałem się z tym, co jest ‘odpowiedzialne’ dla mnie jako autora książki o SI. Konwencjonalne podejście polega na dostarczeniu krótkiego wyjaśnienia nauki i przeglądu często używanych terminów.

Nie zamierzam tego robić.

Oferuję tu kilka zewnętrznych linków do tego, co uważam za dość zrozumiałe krótkie opisy podstaw SI.

Jaka jest przyszłość SI?: McKinsey & Co. (kwiecień, 2024) ma dobry zestaw wyjaśnień.

Podobnie, Generative AI według Gartnera (bez daty) nie jest zły.

Futurepedia oferuje niezłe podsumowanie AI Fundamentals (maj, 2024)

Po omówieniu instrukcji, teraz przedstawię kilka terminów, które uważam za wartościowe do zrozumienia. Nie dlatego, że musisz je znać, aby używać oprogramowania. Tylko dlatego, że ten zestaw terminów odnosi się do kluczowych aspektów działania obecnej generacji AI.

Moim przypadkiem użycia przy omawianiu tych terminów i koncepcji są autorzy i wydawcy, którzy (i) chcą zagłębić się w AI, z jakiegokolwiek powodu, (ii) chcą zrozumieć kontekst obecnych krytyk AI, lub (iii) chcą wnieść wkład w strategiczne dyskusje na temat tego, jak ich koledzy lub organizacje powinny podejść do AI.

Innymi słowy, to nie jest to, co musisz wiedzieć, ale raczej to, co możesz chcieć wiedzieć. Oto one, w niealfabetycznym porządku:

Podpowiedzi i Podpowiadanie

Możesz otworzyć oprogramowanie Chat AI i po prostu wpisać pytanie, bardzo podobnie jak teraz robisz to na Google.

Duży Model Językowy (LLM)

Duże Modele Językowe działają, analizując ogromne ilości (głównie) materiału pisanego, co pozwala im przewidywać, jakie słowa lub zdania powinny pojawić się następnie w rozmowie lub w tekście. Nie ‘rozumieją’ języka w ludzkim sensie, zamiast tego przetwarzają tekst, dzieląc go na mniejsze części (zwane tokenami), a następnie przekształcając tokeny w liczby. Przetwarzają tekst jako liczby, zwracając więcej liczb, które są następnie przekształcane z powrotem w tekst na wyjściu. To jest nadmiernie uproszczone wyjaśnienie, dlaczego Chat AI nie ‘zawiera’ chronionych prawem autorskim prac: jest zbudowany z liczb, które reprezentują ogromną abstrakcję od podstawowych tekstów.

LLM są szkolone na podstawie tego, jak język jest zazwyczaj używany, a następnie generują odpowiedzi na podstawie tego zrozumienia. Zwykle nie doceniamy, jak przewidywalny jest większość języka. Chat AI może generować tekst, który jest (czasami szokująco) podobny do istniejącej literatury, ale z założenia nie ma zdolności do przywoływania konkretnych fragmentów lub kopii chronionych prawem autorskim tekstów. (Wiem, wielu z was słyszało o pozwie New York Times przeciwko OpenAI—Times udało się skłonić ChatGPT do odtworzenia niektórych fragmentów wcześniej opublikowanych artykułów dosłownie).

Sztuczna inteligencja generatywna

Najważniejsza rzecz, aby zrozumieć ten termin, to część “generatywna”. Sztuczna inteligencja generatywna generuje nowy tekst.

Generative Pre-trained Transformer (GPT)

To, najbardziej nerdowskie z terminów tutaj, opisuje konkretny typ LLM opracowany przez OpenAI. “Generative” wskazuje na jego zdolność do tworzenia tekstu, “pre-trained” oznacza, że został wstępnie wytrenowany na dużej ilości danych tekstowych, a “transformer” odnosi się do oprogramowania, które wykorzystuje. Znajomość tego, co oznacza GPT, jest pomocna tylko po to, aby zrozumieć, co GPT reprezentuje w ChatGPT.

ChatGPT

ChatGPT to oprogramowanie, które widzisz; GPT to to, co jest za oprogramowaniem. Użytkownicy doświadczają ChatGPT, a nie GPT za nim stojącego. Jak wspomniano powyżej, ChatGPT jest tylko jednym z kilku systemów Chat AI online, o podobnej funkcjonalności.

Jeszcze jeden termin, który będziesz często spotykać, a który jest nieznany wielu osobom, to:

Korpus

Definicja słownikowa korpusu to “zbiór tekstów pisanych” (choć w rzeczywistości nie zawsze są to teksty). Termin ten jest używany w odniesieniu do tego, na czym GPT są trenowane: ogromnych korpusów (głównie) tekstu. Mówi się, że największe korpusy zawierają setki miliardów słów. Dla zwykłych śmiertelników to niemożliwe do pojęcia. Czy nie uważasz, że Wikipedia jest ogromna, zawierająca ogromną liczbę słów? Cóż, w Wikipedii jest jedynie 4,5 miliarda słów – GPT-4 został wytrenowany na ponad bilionie.

Myślę, że ważne jest rozważenie tej skali. Autorzy, co zrozumiałe, martwią się, że 75,000 słów, plus minus, w ich książce mogło zostać wciągnięte do dużego modelu językowego. Może tak się stało (więcej poniżej). Ale zakładając, że tak jest, rozważ, jak małą wartość ma jakakolwiek pojedyncza książka dla całkowitej mocy dzisiejszych dużych modeli językowych. To naprawdę nieistotne. Nawet 10,000 książek to drobnostka.

Oprogramowanie AI: Systemowi giganci

An icon of a key

Wymieniłem powyżej czterech gigantów AI: ChatGPT, Claude.ai, Microsoft Copilot i Google Gemini.

Każdy z nich działa mniej więcej tak samo i dostarcza podobne wyniki. Który z nich jest najlepszy? To pytanie prowadzi cię w głąb króliczej nory. To trochę jak pytanie, które miasto oferuje najlepsze wakacje na plaży lub który SUV jest najlepszy dla rodzin. Istnieje ogromna ilość niuansów w tych kwestiach i ogromna ilość dumy i uprzedzeń filtrujących nasze odpowiedzi.

Podobnie jest z tym pozornie prostym, ale niezwykle złożonym oprogramowaniem. Ludzie twierdzą, że Claude ma bardziej wyrafinowane umiejętności językowe, a ChatGPT lepiej radzi sobie z kodem oprogramowania. Microsoft Copilot integruje się z pakietem oprogramowania Microsoft. Google Gemini może połączyć się z Gmail, Google Maps i YouTube. Niektóre różnice są znaczące; wiele jest niewielkich. I ciągle się zmieniają z każdą nową wersją oprogramowania.

An icon of a key

“Najlepsze” oprogramowanie nie zostanie ustalone na długi czas. Jeśli wypróbujesz wystarczającą ilość dostępnych narzędzi, wybierzesz kilka ulubionych.

Istnieją dwie najwyższe klasy oprogramowania AI. Pierwsza to to, co można nazwać oprogramowaniem podstawowym, takim jak ChatGPT i jego konkurenci (Chat AI). Tak większość ludzi doświadcza dziś AI.

Kolejną klasą jest całe inne oprogramowanie, które zapewnia zasadniczo okno do oprogramowania podstawowego. Nowicjusze w rozmowach AI głównie nie zetknęli się z tym oprogramowaniem, chociaż nie jest ono rzadkie ani nieznane. Niektórzy znają Jasper (oprogramowanie marketingowe) lub Perplexity (wyszukiwanie). To oprogramowanie po prostu nie mogłoby istnieć bez ChatGPT i jego odpowiedników.

Pamiętaj, że popularne oprogramowanie od Adobe, Microsoft, Grammarly, Zoom itd. teraz zawiera narzędzia AI, ale jest to inne niż oprogramowanie zbudowane od podstaw na bazie interfejsów chatbotów. (Inne, jak Otter (transkrypcje), istniały przed ChatGPT, ale teraz są wyposażone w technologię dużych modeli językowych.)

Poniżej przyjrzymy się oprogramowaniu specyficznemu dla publikowania, które wykorzystuje zdolności generatywnej AI.

Paradygmaty Oprogramowania

Dawno temu oprogramowanie było kodem i tylko inżynierowie rozumieli, jak to działa. To, co sprawiło, że komputery osobiste odniosły sukces, poza ich stosunkowo niskim kosztem, to oprogramowanie, które było (stosunkowo) łatwe w użyciu. Nie zastanawiamy się nad tym zbytnio; po prostu nas otacza.

Ale zastanów się przez chwilę nad Microsoft Word, programem, który mogę bezpiecznie założyć, że używa 99% czytelników tej książki. Pokazanie komuś, jak napisać akapit tekstu w Wordzie, zajmuje około 10 minut. Następnie możesz pokazać, jak stworzyć pogrubiony tekst, kursywę i jak zmienić podstawową czcionkę, na przykład z Calibri na Arial lub Times Roman. Następnie jak zapisać plik i wydrukować plik. Jak wyszukiwać i zastępować.

A potem zostawiasz ich samych sobie.

Lata później dowiadujesz się, że nadal formatują swoje akapity w Wordzie za pomocą spacji i tabulatorów. I nadal zapominają zapisać swoje pliki, albo mylą się, którą wersję zapisali, czasami musząc odtwarzać tekst od nowa. Ale “wiedzą, jak używać Worda.”

Word ma setki funkcji, ale jedna trzecia użytkowników używa tylko 5 poleceń: Wklej, Zapisz, Kopiuj, Cofnij i Pogrubienie. Nauczenie się zaawansowanych funkcji Worda wymaga kilku tygodni szkolenia; funkcji, które mogłyby pomóc wydawcy zaoszczędzić wiele setek godzin pracy. Ale większość nigdy tego nie robi. Używam Worda od 1985 roku, prawie czterdzieści lat, i nigdy nie brałem kursu. Nawet nie wiem, czego nie wiem o tym, jak w pełni wykorzystać moc tego oprogramowania.

Rozwodzę się nad tym, ponieważ to pomocny sposób na zrozumienie, dlaczego oprogramowanie AI jest zupełnie inne od jakiegokolwiek oprogramowania, z jakim kiedykolwiek pracowałeś. Nie ma podręcznika, nawet szybkiego przewodnika startowego. Pojawia się puste okno i pytanie: “W czym mogę pomóc?”

Wiadomość powitalna na interfejsie konwersacyjnej AI skierowana do Thaddeusa, pytająca, jak może pomóc.

Nie ma paska menu, przycisku do naciśnięcia ani skrótów klawiaturowych. Zadajesz pytanie, zaczynasz czat i dostajesz odpowiedzi.

Interfejs konwersacyjnej AI z pytaniem użytkownika, jak wyjaśnić różnicę między nową generacją konwersacyjnej AI a tradycyjnymi narzędziami jak Microsoft Word czy Excel.

Odpowiedź Claude’a:

“Jest kilka kluczowych różnic między pracą z nowoczesną konwersacyjną AI, taką jak ja, a tradycyjnymi narzędziami jak Microsoft Word czy Excel:

“1. Interakcja w języku naturalnym: Z konwersacyjną AI możesz komunikować swoje intencje za pomocą codziennego języka, zamiast uczyć się i nawigować po skomplikowanych menu i funkcjach. Po prostu wyjaśniasz, co chcesz osiągnąć, w konwersacji.

“2. Zrozumienie kontekstowe: Asystenci AI utrzymują kontekst i rozumieją przepływ rozmowy, co pozwala na bardziej naturalny dialog. Tradycyjne oprogramowanie nie ma świadomości kontekstu od jednego polecenia do drugiego.

“3. Elastyczność: AI może dynamicznie dostosowywać się i odpowiadać na różnorodne prośby, podczas gdy tradycyjne narzędzia są ograniczone do zdefiniowanego zestawu funkcji. Asystent AI może pomóc w pisaniu, analizie, matematyce, kodowaniu, generowaniu pomysłów i wielu innych zadaniach w jednym interfejsie.”

To było przydatne, ale chciałem coś łatwiejszego do zrozumienia. Więc zapytałem:

Zapytanie użytkownika w interfejsie konwersacyjnej AI proszące o proste wyjaśnienie dla nietechnicznej publiczności.

Claude:

“Oto prosty sposób na wyjaśnienie różnicy komuś bez technicznego tła:

“Traktuj tradycyjne oprogramowanie, jak Microsoft Word lub Excel, jak narzędzie, na przykład młotek lub kalkulator. Ma ono zestaw funkcji, które może wykonywać, i musisz nauczyć się, jak go poprawnie używać, aby uzyskać pożądany wynik.

“Z drugiej strony, pomyśl o nowoczesnej konwersacyjnej AI jak o inteligentnym asystencie, jak o dobrze poinformowanym koledze lub przyjacielu. Możesz po prostu rozmawiać z nią zwykłym językiem, a ona rozumie, co próbujesz zrobić. Może ci pomóc w różnych zadaniach, od pisania, przez matematykę, po wymyślanie pomysłów.

“Nie musisz uczyć się żadnych specjalnych komend ani technik—po prostu rozmawiaj z nią naturalnie. Dostosowuje się do twoich potrzeb i pamięta kontekst twojej rozmowy. Z czasem poznaje cię i twoje preferencje.

“Więc podczas gdy tradycyjne oprogramowanie jest jak statyczne narzędzie, którego używasz, konwersacyjna AI jest bardziej jak inteligentny partner, z którym naturalnie współpracujesz, aby załatwiać sprawy. To bardziej elastyczny, spersonalizowany i efektywny sposób pracy.”

Hmm. Nie do końca o to mi chodziło. Więc kontynuowałem rozmowę:

Odpowiedź konwersacyjnej AI doradzająca unikanie technicznego żargonu i odniesień, które mogą być nieznane nietechnicznym osobom.

Claude:

“Oczywiście, spróbujmy jeszcze raz bez używania technicznych terminów:

“Wyobraź sobie, że rozmawiasz z przyjacielem, który jest naprawdę dobrze poinformowany i chętny do pomocy. Możesz po prostu rozmawiać z nim zwykłym językiem o tym, co próbujesz zrobić, czy to pisanie eseju, rozwiązywanie problemu z matematyki, czy burza mózgów na temat projektu.

“Zamiast musieć uczyć się i pamiętać mnóstwo specyficznych kroków lub komend, możesz po prostu wyjaśnić, czego potrzebujesz, własnymi słowami. Twój przyjaciel rozumie kontekst i dostosowuje swoją pomoc na podstawie tego, o czym już rozmawialiście.

“To jest rozmowa w obie strony, gdzie możesz zadawać pytania, wyjaśniać rzeczy i otrzymywać porady. I im więcej rozmawiasz z tym przyjacielem, tym lepiej rozumie twoje unikalne potrzeby i styl komunikacji.

“Teraz wyobraź sobie, że możesz mieć ten sam rodzaj pomocnej, łatwej interakcji, ale z programem komputerowym. To jest podstawowa idea nowych typów oprogramowania, o których możesz słyszeć.

“Zamiast starego stylu oprogramowania, gdzie masz sztywny zestaw funkcji i musisz nauczyć się, jak go poprawnie używać, to nowe oprogramowanie jest bardziej jak znający się na rzeczy przyjaciel. Możesz po prostu rozmawiać z nim w sposób konwersacyjny, a ono rozpozna, jak ci pomóc na podstawie naturalnego przepływu twojej rozmowy.

“To jest mądrzejszy, bardziej spersonalizowany i łatwiejszy sposób na uzyskanie pomocy przy wszelkiego rodzaju zadaniach na komputerze, po prostu rozmawiając z nim jak z osobą. To jest kluczowa różnica w porównaniu do starszego, bardziej sztywnego stylu oprogramowania.”

Podsumowanie: Próbowałem zrobić dwie rzeczy przy pomocy tych przykładów. Jedną z nich było przedstawienie prostego przykładu, dlaczego oprogramowanie chatbotowe jest tak inne od jakiegokolwiek oprogramowania, którego kiedykolwiek używaliśmy. A drugą było zilustrowanie, jak jedna rozmowa może się rozwijać. To nie jest tylko jedno pytanie i jedna odpowiedź. To jest rozmowa. To jest duża część przełomu.

Chatboty AI są pewnego rodzaju połączeniem stażysty i znającego się na rzeczy konsultanta. Nie możesz zakładać, że wiedzą, co masz na myśli. Musisz wyjaśnić, czego chcesz, dlaczego tego chcesz i jak mogą być najbardziej pomocne.

Trzy rodzaje oprogramowania AI

An icon of a key

Ogólnie rzecz biorąc, dostępne są dziś trzy rodzaje oprogramowania AI. Pierwszym są podstawowe platformy AI, takie jak ChatGPT, podstawowa technologia AI. Drugim są, nazwijmy to, dodatki AI, oprogramowanie, które zostało świeżo zbudowane na bazie podstawowych platform. O wielu z nich nie słyszałeś, narzędzia takie jak Jasper czy Rewind.

Moja trzecia kategoria to oprogramowanie z narzędziami AI przyczepionymi do istniejącego produktu. Na przykład pakiet Microsoftu zawiera nowe narzędzia AI w Wordzie, Excelu i PowerPoincie. Adobe dodało technologię AI do Photoshopa i Acrobata. Grammarly jest przebudowywane wokół nowej generacji technologii opartej na LLM. To w większości ten sam produkt, ale z dodanym AI.

Staje się jasne, że niemal całe oprogramowanie, którego dziś używasz, wkrótce będzie zawierać funkcje AI. Będziesz musiał sam ocenić, czy te narzędzia są naprawdę przydatne, czy tylko ozdobą AI.

Bardziej interesują mnie nowe narzędzia, zbudowane od podstaw, aby dostarczyć wartość, którą tylko AI może zapewnić. To jest następna generacja oprogramowania.

Praca z oprogramowaniem AI

Niestety, jestem użytkownikiem Windowsa (to długa historia dlaczego), więc mówię o moich doświadczeniach z dostępem do oprogramowania AI za pomocą komputera z systemem Windows, a nie Mac. Ponieważ całe oprogramowanie tutaj jest oparte na przeglądarce, nie powinno być różnicy w korzystaniu z tych narzędzi na Macu. Ale nie oferuję żadnych gwarancji.

Będziesz potrzebował trochę pieniędzy, aby grać w grę AI, ale nie dużo. Jak opisano powyżej, wiele z podstawowego oprogramowania można uzyskać za pomocą darmowych wersji. Ale zazwyczaj będziesz chciał płatną subskrypcję podczas testowania, a subskrypcja powinna wynosić około 20 USD miesięcznie. Anuluj po wypróbowaniu (nie zapomnij!). Jeśli zobaczysz coś, co kosztuje 79 USD miesięcznie, a nie daj Boże, 159 USD miesięcznie, możesz to zignorować. Nie myślą o tobie jako potencjalnym użytkowniku; myślą o dużych użytkownikach korporacyjnych.

Szkolenie dla Chat AI

An icon of a key

Dzisiejsza AI jest zwodniczo prosta. Każdy, kto potrafi wpisać pytanie, może jej używać. Ale używanie jej dobrze jest skomplikowane, co nie ma sensu, dopóki nie zagłębisz się w złożoność “komend” i pokrewnych pojęć.

Aby uzyskać dostęp do jej inteligencji, czasami musisz rozmawiać z nią tak, jakby była idiotą. Albo może raczej sawantem idiotycznym. To trochę jak postać grana przez Dustina Hoffmana w Rain Man.

Każdy może korzystać z ChatGPT. Wystarczy przejść na chat.openai.com i można uzyskać dostęp do najnowszej wersji, GPT-4, za darmo (dostępne są pewne funkcje premium za dodatkowe 20 USD miesięcznie).

Kiedy przechodzisz do ChatGPT, znajdujesz zasadniczo pusty ekran i domyślne pytanie “Jak mogę ci dzisiaj pomóc?”

Możesz zadawać pytania. Jeszcze lepiej, możesz przesłać duży plik PDF i zadawać pytania dotyczące tego pliku. Możesz również przesyłać obrazy, które może opisywać, lub zeskanowaną stronę: może rozpoznać tekst, nawet jeśli jest ręcznie napisany.

To, co wyłoniło się jako kluczowa kwestia dla skutecznego korzystania z Chat AI, to nauka jak z nią ‘rozmawiać’ (co dosłownie można zrobić w najnowszej wersji aplikacji mobilnej). W języku Chat AI nazywa się to tworzeniem “komend” lub “promptingiem”. Użytkownicy odkryli, że im bardziej precyzyjne i szczegółowe są ich komendy, tym lepsze odpowiedzi otrzymują od ChatGPT. Ponadto, komendy nie są jednorazowe. Chat AI może kontynuować rozmowę przez dość długi czas (choć nie bez końca), i jeśli nie otrzymasz odpowiedzi, której szukasz, możesz poprawić i udoskonalić swoje komendy. To wymaga dużo przyzwyczajenia się i zrodziło serię poradników, pisanych i online, aby szkolić użytkowników, jak najlepiej korzystać z komend.

Spróbuj poprosić dowolne oprogramowanie Chat AI, aby wyjaśniło pojęcie takie jak redakcja rozwojowa. Następnie poproś je, aby opracowało wyjaśnienie, które zrozumie dwunastolatek. Wyniki są dramatycznie różne. Co zabawne, Chat AI również wydaje się reagować na emocjonalne apelacje. Dodanie “to jest bardzo ważne dla mojej kariery” do polecenia może skłonić do bardziej przydatnych odpowiedzi.

(Tu jest tak dobry moment jak każdy inny, aby dodać nawias: Jest to zarówno uspokajające, jak i głęboko niepokojące, że czołowi naukowcy pracujący nad AI opartym na języku nie potrafią wyjaśnić, dlaczego takie rzeczy się zdarzają.)

Jak podawać polecenia

An icon of a key

“Podawanie poleceń” to specyficzna umiejętność, która jest niezbędna do skutecznego korzystania z Chat AI.

Spośród różnych przejętych terminologii podczas gorączki złota AI, “polecenia” i “podawanie poleceń” są jednymi z najlepszych. Naprawdę nie “rozmawiasz” z Chat AI. Nie “zadajesz” mu pytań (a przynajmniej nie powinieneś – to nie tak działa). Podajesz tym silnikom polecenia, nie proste odpowiedzi.

Na początku pomyślałem, że analogia mogłaby być teatralne podpowiedzi. Podpowiadacz podsuwa aktorowi, który stracił wątek, powodując, że wraca do akcji. Ale to nie jest dokładne, ponieważ polecenie AI nie zwalnia fragmentu zapamiętanego tekstu – to nie tak działa generatywne AI. Podaj silnikowi AI jedno polecenie wielokrotnie, a odpowiedzi zawsze będą przynajmniej trochę inne.

Właśnie poprosiłem ChatGPT, aby “wymienił kluczowe elementy skutecznego podawania poleceń”. Zapytałem drugi raz i odpowiedzi były tematycznie spójne, ale dość różne w szczegółach. Podkreślone tematy obejmowały:

  • Bądź konkretny

  • Unikaj niejednoznaczności

  • Podaj tło

  • Używaj jasnych instrukcji

W pewnym sensie to dość dziwne: AI ma dobrą znajomość języka – czy nie powinna mieć poczucia, co masz na myśli bez pedantycznego podawania poleceń? Ale to właśnie ta znajomość języka sprawia, że podawanie poleceń jest najbardziej skuteczne. Powiedz dokładnie, co masz na myśli, a nie w przybliżeniu.

Rozmawiaj z nim jak z pomocnym asystentem, uczonym doradcą, którym chcesz, aby był, a nie jak z dzieciakiem z ulicy.

Wniosek jest taki, że przynajmniej na razie skuteczne korzystanie z narzędzi AI opartych na LLM wymaga przynajmniej znajomości najlepszych praktyk w podawaniu poleceń. Mistrzostwo w podawaniu poleceń zostanie odpowiednio nagrodzone.

Halucynacje: Mucha w Maści

An icon of a key

AI, oparta na dużych modelach językowych, wymyśla rzeczy. Po prostu to robi. Ogólnie nazywa się to “halucynacjami.” To prawdziwy problem, poważny problem. Musisz zrozumieć halucynacje, jeśli zamierzasz pracować z AI.

Słowo Roku 2023 według Cambridge Dictionary to “Halucynować,” którego definicja została rozszerzona o “Kiedy sztuczna inteligencja… halucynuje, wytwarza fałszywe informacje.” (Inne dodatki do słownika 2023 to “inżynieria promptów,” “duży model językowy” i “GenAI.”)

Cambridge zauważa, że halucynacje AI “czasami wydają się nonsensowne. Ale mogą również wydawać się całkowicie wiarygodne - nawet gdy są faktycznie nieścisłe lub ostatecznie nielogiczne.” To, niestety, jest prawdą i od lipca 2024 pozostaje dramatycznym ograniczeniem w używaniu generatywnej AI do zadań o znaczeniu krytycznym. Jest to jedna z kilku wielkich dziwactw AI i zajmuje trochę czasu, aby się do niej przyzwyczaić. Pamiętaj, generatywna AI to głównie silnik przewidywania kolejnych słów, a nie baza danych faktów. Stąd potrzeba HITL, Ludzi-W-Pętli, jak jesteśmy teraz znani, którzy sprawdzają wyniki AI. I ponownie, niezwykłe jest to, że możemy uzyskać tak niezwykłą wartość z technologii, która może wytwarzać sprawdzalnie nieścisłe wyniki. Tak to bywa.

Gary Marcus, doświadczony i dobrze poinformowany krytyk AI, porównuje halucynacje AI do zepsutych zegarów, które są prawidłowe dwa razy dziennie. “Czasami jest to prawidłowe,” mówi, “ale nie wiesz, która część czasu, co znacznie zmniejsza jego wartość.”

Ethan Mollick, główny mówca na konferencji Publishers Weekly we wrześniu 2023, zauważa, że ludzie używający AI oczekują 100% dokładności. Halucynacje, jak mówi, są podobne do “ludzkich wskaźników błędów,” które tolerujemy na co dzień.

Andrej Karpathy, znany naukowiec specjalizujący się w AI, który obecnie pracuje w OpenAI, pisze o halucynacjach:

“Zawsze trochę się zmagam, gdy jestem pytany o ‘problem halucynacji’ w dużych modelach językowych. Bo w pewnym sensie, halucynacja to wszystko, co robią LLM. To maszyny snów.

“Kierujemy ich sny za pomocą promptów. Prompty rozpoczynają sen, a na podstawie zamglonych wspomnień LLM z dokumentów szkoleniowych, większość czasu wynik idzie w użyteczne miejsce.

“Tylko gdy sny wchodzą w obszar uznany za faktycznie niepoprawny, nazywamy to ‘halucynacją.’ Wygląda to jak błąd, ale to po prostu LLM robi to, co zawsze robi.”

To nie tylko problem z wymyślaniem rzeczy. Chat SI to głęboko wadliwe oprogramowanie.

W przypadku wielu zapytań, szczególnie od nowicjuszy, odpowiedzi są banalne, nietrafione lub po prostu niepomocne. Chat SI ma problem z liczeniem: poprosisz go o 500-słowny wpis na bloga, a będziesz mieć szczęście, jeśli dostaniesz 150 słów.

I każda z firm SI, aby zmniejszyć uprzedzenia i unikać odpowiadania na pytania typu „jak zbudować bombę”, wprowadziła ścisłe zabezpieczenia odpowiedzi w swoich produktach: zbyt często odpowiedź na pytanie brzmi zasadniczo: „Nie, nie odpowiem na to.” Poprosiłem Google Gemini o przejrzenie projektu tego tekstu i zostałem ostrzeżony, że „ważne jest uzyskanie zgody autora przed publikacją.”

Sprawdzanie faktów

An icon of a key

Twierdzę, głównie bez odzewu, że halucynacje są problemem technologicznym, który znajdzie rozwiązanie technologiczne. Tak, są one endemiczne dla LLM, ale można je obejść.

Rozważ to: poprosiłem cztery Chat SI o sprawdzenie faktów w następujących stwierdzeniach:

  • Na rok 2024 w Nowym Jorku znajduje się 6 dużych międzynarodowych wydawnictw. Są one znane jako Wielka Szóstka.

  • Ebooki nadal dominują w sprzedaży książek w Stanach Zjednoczonych.

  • Borders i Barnes & Noble to dwie największe sieci księgarskie w Stanach Zjednoczonych.

  • Po spadku sprzedaży podczas Covid, sprzedaż książek w USA ponownie rośnie dwucyfrowo.

Wszystkie wykryły błędy w pierwszych trzech stwierdzeniach. Każdy z nich trochę się zagubił przy czwartym, niepewny jakiego był wzrost sprzedaży podczas Covid i jakie były późniejsze wzorce sprzedaży. To mały, niereprezentatywny eksperyment, ale te Chat SI, które nie są przeznaczone do opierania się na faktach, mogą wykonać wiarygodną ocenę faktów, których większość przypadkowych obserwatorów by nie zauważyła.

Co z obrazami i wideo?

An icon of a key

Ponieważ wydawanie książek handlowych zależy bardziej od tekstu niż od obrazów, wydawcy mają tendencję do pomijania przełomowych narzędzi opartych na SI do obrazów i wideo.

Są one istotne dla zrozumienia rewolucji SI przez każdego. Ale dyskusja jest zbyt obszerna na dostępne miejsce: po prostu nie oddałbym jej sprawiedliwości.

Zalecane dla autorów i wydawców: bawcie się funkcjami generowania obrazów w ChatGPT - są darmowe i zabawne w użyciu. Następnie wyszukajcie “wideo i SI” i podziwiajcie niektóre z przykładów, które znajdziecie na podlinkowanych stronach. Chociaż narzędzie nie jest jeszcze publicznie dostępne, Sora firmy OpenAI oferuje kilka oszałamiających przykładów wideo generowanych tylko z poleceń tekstowych.

Oprogramowanie dla wydawców książek

Niewiele jest oprogramowania AI zbudowanego od podstaw specjalnie dla wydawców książek (choć jest wiele dostępnych dla autorów).

Wydawcy naukowi mają więcej opcji, z różnorodnymi narzędziami AI do badań, pisania i publikowania.

Dla wydawców handlowych większość opcji dotyczy AI i audio. Poza audio, wybory koncentrują się wokół narzędzi do edycji i marketingu. Istnieje również kilka narzędzi do wykrywania treści AI oraz narzędzi i usług licencjonowania treści.

Oprogramowanie do edycji jest skierowane do autorów, nie profesjonalnych redaktorów — jest znacznie więcej autorów niż redaktorów, a jakość wymagana przez profesjonalnych redaktorów jest znacznie bardziej wymagająca niż dla (głównie samopublikujących się) autorów.

Narzędzia marketingowe również celują szerzej niż tylko wydawcy książek, ale do marketerów wszędzie, z narzędziami do treści webowych, generowania tekstów i SEO. Jasper.ai jest liderem w tej kategorii i twierdzi, że HarperCollins jest jego klientem.

Shimmr, sponsor tej książki, to narzędzie do tworzenia reklam zasilane AI, specjalnie dla wydawców książek. Firma i jej założyciel, Nadim Sadek, byli przedstawieni w artykuł z maja 2024 w Publishers Weekly.

„To, co robimy, to użycie AI do rozważenia profilu psychologicznego książki i dopasowania go do ram umysłowych konkretnej publiczności, zapewniając skuteczniejsze połączenie między czytelnikami a książkami,” powiedział Sadek w rozmowie z PW. “Nazywamy to ‘DNA książki,’ i obejmuje to nie tylko znajomość postaci i fabuły książki, ale także wartości, zainteresowania i emocje zawarte w książce.”

Wykorzystując DNA książki, narzędzia AI Shimmr następnie tworzą ukierunkowane reklamy dla kanałów wyszukiwania i mediów społecznościowych (obecnie Google i Meta). Reklamy przyjmują formę reklam graficznych, zawierających obrazy generowane przez AI wraz z hasłami.

Zwracam uwagę wydawców oceniających Shimmr, że może on przynieść dodatkowe przychody, czego oczekujemy od nowego narzędzia reklamowego/marketingowego.

Jeśli chcesz doświadczyć innego narzędzia „tylko z AI”, sprawdź Hypnovels, które animuje rozdziały w książkach fabularnych. „Narracja, obraz i ruch, wszystko generowane przez AI, łączą się z wielkim opowiadaniem historii w sposób mniej dosłowny niż tradycyjna animacja (stąd „hypno”) i bardziej zmysłowo angażujący niż audiobook, w stylu, który czyni rozdział unikalnym i wciągającym.”

Kolejnym nowym dostawcą, który powstał z możliwości, jakie daje AI, jest Veristage (również sponsor tej książki). Veristage oferuje Insight, swojego „Asystenta Wydawniczego AI”, specyficzny dla zadań frontend obejmujący wiele funkcji wydawniczych.

Podróż z Insight zaczyna się od manuskryptu. Przesłanie wczesnej wersji odblokowuje szereg narzędzi, z których niektóre są bardziej wartościowe dla redakcji, a inne bardziej dla marketingu. Po skorzystaniu z dowolnych i wszystkich funkcji, możesz pobrać raport PDF, który zawiera aspekty redakcyjne, takie jak ton pisania, tropy, klisze oraz użycie przysłówków i przymiotników, a następnie treści marketingowe, takie jak opisy, metadane, unikalne punkty sprzedaży, porównania, treści zoptymalizowane pod kątem Amazona i sugerowane posty w mediach społecznościowych.

To, co najbardziej lubię w Insight, to holistyczne podejście do zastosowania AI w procesie wydawniczym, zamiast konieczności zbierania wielu narzędzi programowych, z których każde służyłoby innemu zadaniu.

Chcę również podkreślić tutaj moją platformę wydawniczą, Leanpub. Praca z nimi była niesamowita. Małe jest piękne: podejmują ryzyko związane z technologią i usługami, których większe firmy by się wystrzegały. Najbardziej interesującą dla autorów i mniejszych wydawców jest ich nowa usługa TranslateWord, gdzie można przetłumaczyć książkę napisaną w Microsoft Word na do 31 języków, za pomocą API GPT-4o (które napędza ChatGPT). To właśnie używam do tłumaczenia tej książki.

Szukając gdzie indziej usługi tłumaczenia książek, natrafiłem na mnóstwo firm tłumaczeniowych, niektóre z nich korzystają z AI. Jedyną, którą znalazłem, oferującą tłumaczenie książek, jest DeepL. Ale to nie jest główny cel tej firmy. Obecnie Leanpub to miejsce, do którego należy się udać.

Oprogramowanie biznesowe do wydawnictw książkowych

An icon of a key

Obecni dostawcy systemów biznesowych obsługujących branżę wydawniczą zaczynają wprowadzać technologie AI, jak widzieliśmy w przypadku przedsiębiorstw na dużą skalę, takich jak Salesforce i Oracle.

Rozmawiałem z kilkoma dostawcami oprogramowania systemów wydawniczych, w tym z Firebrand, i wszyscy przyglądają się możliwościom, ale podchodzą do nich ostrożnie.

Nie mogę się doczekać okazji do rozmowy o AI z różnorodną grupą uczestników na Firebrand’s Publishing Innovation Forum we wrześniu 2024 roku w Nashville, TN.

knk przeprowadziło dwa seminaria internetowe na temat AI i opublikowało biała księga, ale (stan na 26 czerwca 2024 r.) nie ogłosiło jeszcze żadnych funkcji AI w swoich produktach.

Virtusales niedawno uruchomił swoją pierwszą serię narzędzi z obsługą AI, w tym oznaczanie obrazów, generowanie tekstu alternatywnego, narzędzia do redakcji, generowanie treści sprzedażowych i marketingowych oraz tłumaczenie tych treści.

Rozmawiałem z Klopotek na Klopotek Publishing Radio. Zainicjowali “inicjatywę AI w obszarze obsługi klienta”, choć szczegóły nie są jeszcze dostępne.

Supadu, które oferuje wydawcom “projektowanie stron internetowych, rozwiązania e-commerce i zarządzanie danymi,” teraz wprowadza “Supadu Smart AI,” (pdf) z “wideorecenzjami tytułów prowadzonymi przez awatary z funkcją Smart Buy,” “materiałami promocyjnymi dla zespołów marketingowych i sprzedażowych prowadzonymi przez awatary wideo” oraz “łatwym wielojęzycznym tłumaczeniem wideo autorów i tytułów.”

Oprogramowanie AI dla wydawców książek: startupy

Niektórzy są zaznajomieni z moją pracą nad startupami technologicznymi w branży wydawniczej. Jest raport w Publishers Weekly, który opisuje tę pracę i linki do bazy danych.

Jak zobaczysz w raporcie, patrzę dość szeroko na startupy w całym spektrum wydawniczym. Nie uwzględniam nowych firm wydawniczych, chyba że robią coś niezwykłego z technologią. Podstawowe kryterium to: czy używasz technologii, aby ożywić jakiś aspekt procesu wydawniczego? Mam ponad 1,600 firm w bazie danych, większość uruchomiona po tym, jak Amazon wypuścił pierwszego Kindle’a w 2007 roku.

Po zapoznaniu się z bazą danych, możesz zacząć zagłębiać się bardziej szczegółowo. Na karcie po prawej stronie znajdziesz sposób na sortowanie tylko startupów wydawniczych związanych ze sztuczną inteligencją.

Zrzut ekranu tabeli z narzędziami i usługami z filtrem wybranym dla AI, podkreślający liczbę 243.

Jak widać na ilustracji, istnieje ponad 240 startupów wydawniczych związanych z AI (stan na początek lipca 2024). Liczymy startupy wydawnictw audio wykorzystujące AI jako osobną kategorię, a łączna liczba obu wynosi ponad 300 firm. Większość, ponad 280, została uruchomiona po premierze ChatGPT w listopadzie 2022 roku. Ta liczba nowych startupów jest bezprecedensowa w branży wydawniczej. To zdumiewające.

Jak to jest charakterystyczne dla całej bazy danych, te startupy AI głównie celują w autorów (70%). Około 13% chce służyć firmom wydawniczym. 10% koncentruje się na wydawnictwach dla dzieci.

Około 50 startupów celuje w czytelników z różnorodnymi, nowatorskimi ofertami. Kilka z nich to platformy do opowiadania historii. Jest sporo narzędzi do podsumowywania. Istnieje wiele stron odkrywania, “Użyj AI, aby znaleźć swoją nową ulubioną książkę”. Szybko poprawiające się głosy generowane przez AI doprowadziły do powstania zestawu narzędzi “przeczytaj mi”.

Oraz kilka interesujących pomysłów, które nie byłyby możliwe bez AI.

Bookshelf: Reading Tracker to połączenie aplikacji do odkrywania książek i osobistej biblioteki, które obejmuje “automatyczne śledzenie czasu, cele czytelnicze i przypomnienia oraz wnikliwe statystyki i trendy”. Jego bibliotekarz AI “może generować podsumowania i fiszki, omawiać kluczowe pomysły i wnioski oraz wiele więcej.”

Mój przyjaciel Ron Martinez niedawno uruchomił stronę Inventionarts.ai, która wprowadza “nowe medium konwersacyjne”. Jak wyjaśnia strona, “Rozmawiaj z wieloma osobowościami AI, każda z własną tożsamością, wiedzą i świadomością. Zaproś różne persony do scenariuszy. I Ty także możesz odgrywać fikcyjną rolę!” Gra literacka, w pewnym sensie.

Jak to jest charakterystyczne dla większej grupy startupów, wiele z tych startupów jest małych lub bardzo małych, często to jedna osoba z witryną internetową i nie do końca dopracowanym pomysłem. Uwzględniam je wszystkie - kto wie, dokąd zmierzają.

Gorąco zachęcam do zabawy z bazą danych. Kliknij kilka linków. Myślę, że będziesz zachwycony innowacyjnością i śmiałością wielu z tych organizacji.

Jednym ze sponsorów tej książki, Book Advisors, specjalizuje się w fuzjach i przejęciach w przemyśle wydawniczym. Zawsze zachęcam innowacyjne startupy, aby szukały partnerów, a Book Advisors jest miejscem, do którego ich wysyłam, aby omówić ten proces. Branża wydawnicza ma kilka cenionych firm M&A, do których można się zwrócić, w tym The Fisher Company i Oaklins DeSilva+Phillips. Book Advisors jest jedyną firmą, którą znam, która również współpracuje ze startupami technologicznymi.

Sztuczna inteligencja i przemysł wydawniczy: co obecnie robi branża?

An icon of a key

Działania związane ze sztuczną inteligencją wielu prominentnych grup handlowych w branży wydawniczej wydają się dodawać swoje głosy do chóru zaniepokojonych prawami autorskimi. Stowarzyszenie Amerykańskich Wydawców “złożyło odpowiedzi w dochodzeniu Biura Praw Autorskich USA w sprawie przecięcia prawa autorskiego i sztucznej inteligencji (AI)...”

Stowarzyszenie Wydawców Wielkiej Brytanii zauważa, że “jest niezwykle ważne, aby rząd jak najszybciej wprowadził konkretne rozwiązania w celu ochrony ludzkiej kreatywności i wiedzy, które stanowią podstawę bezpiecznej i niezawodnej sztucznej inteligencji.”

Z drugiej strony, Gildia Niezależnych Wydawców (IPG), z ponad 600 członkami, oferuje swoim członkom poradnictwo dotyczące AI i szkolenia, w tym swój “Praktyczny przewodnik po AI w wydawnictwach,” prowadzone przez znanego eksperta AI i wydawnictw, George’a Walkley’a.

Tutaj, w USA, mam przywilej być częścią Grupy Roboczej ds. AI Grupy Studium Przemysłu Książkowego (BISG), która raportuje do Komitetu ds. Workflow. Grupa Robocza nakreśliła kilka potencjalnych inicjatyw strategicznych:

  • Najlepsze praktyki i rozwój standardów: Rekomendowanie najlepszych praktyk związanych z użyciem AI, powiązanych z wytycznymi etycznymi, istniejącymi regulacjami i prawem. Obejmuje to przejrzystość w treściach generowanych przez AI i ich ujawnienie konsumentom.

  • Ankiety branżowe i definicje: Przeprowadzanie ankiet w celu zebrania szerokich spostrzeżeń branżowych na temat obecnych i potencjalnych zastosowań AI oraz ustanowienie jasnych definicji i zakresów tego, co AI oznacza w kontekście wydawnictwa książkowego.

  • Okresowe raportowanie i przeglądy: Oferowanie okresowych raportów, aby pomóc branży przewidywać i dostosowywać się do szybkich zmian wywołanych przez technologie AI.

Inne stowarzyszenia pisarskie i wydawnicze starają się zająć stanowisko w tym temacie. Niektóre sprzeciwiają się AI; inne starają się pomóc swoim członkom zrozumieć technologię i może z nią eksperymentować.

AI i wydawnictwo książkowe: Co robią firmy wydawnicze?

Rok temu na pytanie, co obecnie robią firmy wydawnicze, odpowiedź brzmiała: “niewiele”. Niewiele się od tamtego czasu zmieniło, ale pojawiła się pewna aktywność. Skupię się na wydawcach książek handlowych; wydawcy akademiccy i naukowi są bardziej aktywni. Oto niektóre z moich odkryć.

Hachette: Według raportu z listopada 2023 w The Bookseller w Wielkiej Brytanii, Hachette opublikował oświadczenie dotyczące AI, oferując rozróżnienie między ‘zastosowaniami operacyjnymi’ a ‘zastosowaniami kreatywnymi’. Firma “wyraziła jasne poparcie dla ‘odpowiedzialnych eksperymentów’ w zastosowaniach operacyjnych, ale sprzeciwia się ‘kreatywności maszynowej... w celu ochrony oryginalnych treści tworzonych przez ludzi’.”

HarperCollins: Według raportu z kwietnia 2023 w Publishers Weekly autorstwa Andrew Albanese i Ed Nawotka, CEO HarperCollins Brian Murray powiedział:

“Wiem, że to będzie ważne i będzie miało znaczący wpływ na naszą branżę w ciągu najbliższych trzech do pięciu lat. I dlatego wielu z nas stara się zrozumieć, jak z tego skorzystać w sposób etyczny i moralny, który pomoże nam służyć autorom i zapewniać im profesjonalne usługi, a nie konkurować z autorami i opowiadaniem historii.

“I to jest, myślę, wyzwanie. Może nie tyle dla wszystkich wydawców, którzy są tutaj, ale gwarantuję, że na całym świecie jest wiele małych zespołów technologicznych, które mogą przyjść po nasz biznes. Nie są wydawcami, nie są redaktorami. To technolodzy i widzą okazję.”

Penguin Random House (PRH): Bertelsmann, firma macierzysta PRH, oferuje white paper zatytułowany Stan Gry: Badanie Transformacyjnych Efektów Generatywnej AI w Przemyśle Medialnym i Rozrywkowym, który zawiera sekcję na temat wydawnictw książkowych.

Również, według raportu w Publishers Lunch, firma “wprowadziła swoje wewnętrzne narzędzie AI, nazwane PRH ChatGPT.”

Artykuł stwierdza, że wewnętrzne dokumenty PRH wyjaśniają, że program “‘może być używany do usprawniania procesów, zwiększania kreatywności i dostarczania wglądów w dane’ w różnych działach. Firma sugeruje, że wśród zastosowań aplikacji są podsumowywanie książek i dokumentów; redagowanie e-maili; tworzenie wpisów na bloga lub opisów stanowisk pracy; analizowanie danych tekstowych i ‘generowanie pomysłów na treści.’”

Simon & Schuster: Dyrektor generalny firmy Jonathan Karp zasłużył na wzmiankę w New York Times “Najbardziej Pamiętne Literackie Momentów Ostatnich 25 Lat” z cytatem zgłoszonym w Publishers Weekly z majowego U.S. Book Show 2024. Powiedział, że AI nie jest “słoniem w pokoju”, ale raczej, “bardziej jak cykada na świecie. Wiesz, dużo brzęczenia i dużo kopulacji.”

Przyznał, że AI “jest zdecydowanie cennym narzędziem. Zdecydowanie uczyni nas bardziej efektywnymi. Pomoże nam lepiej przetwarzać i gromadzić informacje, i miejmy nadzieję, że pozwoli pracownikom wykonywać bardziej interesującą i kreatywną pracę na wyższym poziomie.”

W marcu, na Targach Książki w Londynie, jak informował The Bookseller, Karp powiedział, że firma będzie również rozważać wersje językowe audiobooków generowanych przez AI “na terytoriach, gdzie [prace tego autora] nigdy nie miałyby szansy z powodu kosztów [produkcji audio].”

AI i Wydawnictwo Książkowe: Przypadki Użycia

An icon of a key

Specyficzne przypadki użycia AI w wydawnictwie książek, w różnych funkcjach, są łatwe do opisania koncepcyjnie. Ale nie ma zbyt wielu informacji dostępnych na temat tego, co wydawcy faktycznie robią.

Keith Riegert, CEO Ulysses Press i Perfect Bound, wystąpił na Publishers Weekly U.S. Book Show w maju 2024, oferując najbardziej kompleksowy przegląd, jaki widziałem, dotyczący zastosowań AI w firmach wydawniczych. Perfect Bound jest sponsorem tego raportu; podtrzymuję to stwierdzenie. Oferuje “20 praktycznych sposobów, w jakie ty, jako profesjonalista wydawniczy, możesz zacząć korzystać z AI już teraz.”

Jego prezentacja, Getting Started with AI, jest dostępna do obejrzenia i pobrania na stronie Perfect Bound.

Co się dzieje, gdy AI czyta książkę?

Celowo pożyczam ten tytuł sekcji z newslettera Ethana Mollicka–nie ma potrzeby go poprawiać. Mollick jest profesorem w Wharton School na University of Pennsylvania, który bada przedsiębiorczość i innowacje. Jego newsletter, który często polecam, jest spokojny, odświeżający i wyjątkowo wnikliwy.

Wśród rzeczy, które kwalifikują Mollicka jako komentatora, jest to, że nie ma w tym interesu. Nie musi sprzedawać AI, ani go krytykować. Po prostu zobowiązał się do eksplorowania AI w jej wielu wpływach, głównie na edukację, kulturę, pisanie i wydawnictwo. I jest świetnym, jasnym pisarzem.

Jeśli przejrzysz archiwa newslettera Mollicka, zobaczysz, że nie zaczął skupiać się na AI aż do grudnia 2022 roku. To nie był jego obszar zainteresowań–jak większość z nas, AI pojawiło się w jego codziennej pracy i nie mógł odwrócić od niego wzroku.

W tym poście jego wnioski są najbliższe naszym zainteresowaniom jako profesjonalistom wydawniczym. “Czy AI,” pyta, “może zmienić sposób, w jaki wchodzimy w interakcje z książkami?”

Aby odpowiedzieć na to pytanie, Mollick zauważa, “potrzebujemy zarówno AI z pamięcią wystarczająco dużą, aby pomieścić książkę, jak i autora, który zna swoją własną książkę na tyle dobrze, aby ocenić wyniki AI.” Mollick testuje jeden ze swoich kilku tytułów (nie określa który, ale z rozmów wynika, że jest to The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors, książka pozytywnie oceniana na Amazon, choć nie jest obecnie bestsellerem).

Mollick rozważa różne aspekty potencjalnej wartości AI dla autora, wydawcy lub czytelnika, w tym “AI jako czytelnik i redaktor” oraz “praktyczne zastosowanie: pomoc dla instruktorów.” Prosi LLM—duży model językowy—nie ChatGPT—o streszczenie książki. Udaje się to ku zadowoleniu Mollicka.

Następnie trudniejsze wyzwanie: “Podaj mi przykłady metafor w książce.” Jak zauważa, “metafora jest wyzwaniem nawet dla ludzkich czytelników, ponieważ wymaga znalezienia użycia języka przenośnego bez wyraźnych markerów (w przeciwieństwie do porównania, nie ma tu ‘jak’ lub ‘jako’).” Wyniki, jak zapisuje, “są imponujące, choć zawierają drobne błędy.”

LLM jest mniej skuteczny jako redaktor: jego niepowodzenia w tej dziedzinie, zauważa Mollick, ilustrują “coś, co stało się jasne na temat obecnego stanu AI: jeśli jesteś bardzo dobrym pisarzem lub redaktorem, jesteś lepszy niż obecne AI…”

Niemniej jednak, “AIs mają, lub przynajmniej sprawiają wrażenie, że mają, zrozumienie kontekstu i znaczenia tekstu.” W rezultacie, Mollick uważa, że “sposób, w jaki odnosimy się do książek, prawdopodobnie zmieni się w wyniku AI.”

Ja też tak myślę.

AI a projektowanie i produkcja książek

An icon of a key

Systemy ekspertowe i automatyzacja procesów wciąż wyprzedzają AI, jeśli chodzi o projektowanie i produkcję książek.

Oprogramowanie do automatycznego składania książek sięga co najmniej lat 70. XX wieku. W połowie lat 80. nadzorowałem projekt oprogramowania o nazwie PageOne, oparty na TeX Donalda Knutha, który mógł składać książkę w ciągu kilku minut. SGML pojawił się mniej więcej w tym samym czasie, bazując na standardzie dokumentów wprowadzonym w 1969 roku. Został on w dużej mierze zastąpiony przez XML, wprowadzony w 1996 roku. Te solidne języki znaczników tworzą solidne struktury dla automatyzacji.

Publikowanie na komputerze zainicjowało kolejną rundę automatyzacji dla QuarkXPress i Adobe InDesign, a także Adobe Illustrator i Adobe Photoshop. Przepływy pracy w wydawnictwach mogą być zarządzane za pomocą różnych programów i systemów.

Organizacją, którą warto obserwować, jest Fundacja Coko. Oferują oni zestaw otwartych narzędzi do zarządzania produkcją i publikacją, w tym Kotahi, platformę do publikacji naukowych, oraz Ketty do produkcji książek, która zawiera Asystenta AI. Kotahi AI PDF Designer, “przekształca projektowanie PDF w prosty, interaktywny proces.”

Istnieje kilka wczesnych inicjatyw mających na celu wprowadzenie AI do workflowów InDesign. W kwietniu 2024 roku Adobe ogłosiło funkcję Text to Image. Strony trzecie mogą tutaj wyprzedzać Adobe: innowacyjni dostawcy prepress i produkcji w Indiach, tacy jak Hurix Digital i Integra, wykazują więcej inicjatywy niż Adobe w wykorzystaniu AI do produkcji.

AI i marketing książek

An icon of a key

Wpływ AI na marketing książek będzie w krótkim okresie płytki, ale w długim okresie znacznie głębszy. Wiele zależy od tego, co rozumiesz przez “marketing książek”; to się zmienia.

„Nisko wiszące owoce” są oczywiste. Poproś Chat AI o pomoc w opisie produktu lub komunikacie prasowym. Poproś o zasugerowanie kilku słów kluczowych. To potrafi zrobić bez problemu. Ale większość profesjonalistów wydawniczych potrafi zrobić to samo, z tylko niewielkim wysiłkiem.

Przykłady użycia przedstawione przez Keitha Riegerta, podlinkowane powyżej, obejmują sugestie dotyczące burzy mózgów nad tytułami, sporządzania raportu z marketingu cyfrowego oraz tworzenia trackera kampanii marketingowej w Google Sheets.

Oprogramowanie Shimmr, opisane powyżej, sugeruje kształt zautomatyzowanego marketingu, jaki nadejdzie.

AI i metadane

An icon of a key

Co AI ma wspólnego z metadanymi i vice versa? Jego rola wydaje się jak dotąd skromna; spodziewaj się dużych zmian.

Metadane są kluczowe dla wykrywalności książek. Słyszałeś to wystarczająco wiele razy, aby poczuć mdłości od tego napomnienia. Jest to odpychające głównie dlatego, że “metadane” pozostają nieuchwytne dla większości nietechnicznych osób. Jeśli powiesz: “to tylko podstawowe informacje o książce, tytuł, opis, cena, kategorie tematyczne, tego rodzaju rzeczy,” ludzie oddychają z ulgą. Z tym są komfortowi. Ale to tylko tyle.

Z żalem przypominam, że w rzeczywistości jest znacznie więcej do metadanych niż tylko kilka szczegółów na temat książki. Jest tego znacznie więcej. Znacznie więcej niż mogę objąć w tej małej książce. Jestem współautorem całej książki na ten temat. Ingram publikuje Metadata Essentials, doskonały krótki tom. Powiem to tutaj, i nie po raz ostatni: autorzy i wydawcy lekceważą swoje metadane na własne ryzyko.

SI może pomóc w generowaniu metadanych. Na przykład, dostawca usług self-publishingowych PublishDrive, oferuje “Generator Metadanych Książki Zasilany SI”, który oferuje rekomendacje SI dotyczące tytułu książki, opisu, kategorii Amazon, kategorii BISAC i słów kluczowych.

Insight, od Veristage, opisany powyżej, może generować opisy, słowa kluczowe, kategorie BISAC i definiować docelowe grupy odbiorców.

Deklarowanie użycia SI w metadanych

An icon of a key

Można by pomyśleć, że dostojny świat metadanych będzie powoli dostosowywał się do SI. Nic bardziej mylnego! W listopadzie zeszłego roku, EDItEUR, strażnik standardu ONIX, wydał krótką notatkę aplikacyjną zatytułowaną “Aspects of AI in ONIX.” (pdf)

Ze swoją typową głęboką mądrością, Graham Bell, dyrektor organizacji, zauważa, że “jedną z reakcji na (kontrowersje wokół technologii) jest zrezygnowanie z używania SI lub unikanie handlu produktami stworzonymi przez SI. Bardziej realistyczną opcją jest po prostu być transparentnym wobec partnerów handlowych i czytelników, kiedy użyto SI. A ponieważ niektórzy sprzedawcy ograniczają lub zakazują treści opartych na SI na swoich platformach, ważne jest, aby renomowani wydawcy podkreślali te produkty, które wykorzystują techniki generatywnej SI do tworzenia treści.”

Bell dalej przedstawia sposoby, w jakie wydawcy mogą określić w metadanych:

  • Kontrybuenci SI

  • Głosy oparte na SI w audiobookach

… oraz metodę zaznaczenia w metadanych dla produktów cyfrowych, że wydawca wyraźnie rezygnuje z wydobywania tekstu i danych (TDM) do celów innych niż badawcze. Istnieje również sposób określenia oddzielnej licencji obejmującej komercyjne lub niebadawcze TDM.

Jak to często bywa, to, co jest określone w ONIX, może nie być odkryte w dalszym łańcuchu żywnościowym, ale przynajmniej dokonano najlepszych starań.

Strategie integracji SI w operacjach wydawniczych

An icon of a key

Niewiele jest rzeczy, które firmy wydawnicze robią mniej chętnie niż integracja skomplikowanych technologii cyfrowych w swoje codzienne operacje. To zrozumiałe. SI, w szczególności, powoduje niepokój u wszystkich, i to nie tylko w wydawnictwie. Jest nowa, tajemnicza, spersonalizowana, potężna. Ludzie czują się zagrożeni przez SI z wielu powodów. Zmiana postaw wymaga czasu.

Ale to nie jest dobry czas, aby być nieśmiałym wobec technologii.

Istnieją spokojne i racjonalne podejścia do integracji AI z twoją operacją wydawniczą, niezależnie od wielkości twojej organizacji.

Impuls musi pochodzić z góry. Z samej góry. Starsi menedżerowie muszą przyjąć wizję potencjalnie transformacyjnego wpływu AI i komunikować program pracownikom całej organizacji. Program może być nieco więcej niż “eksperymentuj, dokumentuj swoje eksperymenty i dziel się nimi.” To dobry początek.

The Economist niedawno odniósł się do taktyki organizacyjnej dla wdrażania nowych technologii, zwanej “podejściem latarni.” Tworzysz latarnię, wybierając jeden wysokoprofilowy dowód koncepcji, który można szybko wdrożyć, a z którym każdy może się identyfikować.

Firmy wydawnicze są ograniczone przez zgiełk wokół praw autorskich: autorzy są wściekli. W badaniu Authors Guild z maja 2023 roku stwierdzono, że “90 procent pisarzy uważa, że autorzy powinni być wynagradzani, jeśli ich prace są wykorzystywane do szkolenia technologii generatywnej AI,” a 67 procent powiedziało, że “nie są pewni, czy ich umowy wydawnicze lub warunki platformy zawierają zezwolenia lub przyznanie praw do wykorzystania ich prac do jakichkolwiek celów związanych z AI.” Ci niepewni autorzy teraz pytają swoich wydawców, czy AI jest używane w edycji lub produkcji ich prac, a niektórzy potężni autorzy nalegają, aby tak nie było. Szukają AI-ekwiwalentu piekarni bez orzeszków ziemnych.

To jest trudny problem dla wydawców - jeśli nie możesz używać AI na książkach, które planujesz wydać, do czego możesz go używać?

Opracowanie i komunikowanie polityk AI

Pomimo powszechnego użycia, niewielu wydawców publicznie zdefiniowało swoje polityki AI i skomunikowało swoje podejścia do AI publicznie. Termin ‘publiczność’ ma tutaj śliskie znaczenie, gdy rozważasz różne grupy docelowe adresowane przez wydawców literatury popularnej, naukowej i edukacyjnej.

Dla wydawców literatury popularnej najważniejszą publicznością są autorzy i ich agenci. Wydawcy naukowi napotykają inne przeszkody, gdy rozważają obiecujący wpływ AI na badania, a następnie bardziej problematyczny wpływ AI na przekształcenie badań w narrację (Avi Staiman napisał przemyślany post na ten temat). Dla wydawców edukacyjnych ustalanie polityk jest trudne, ponieważ wtargnięcie AI na praktykę nauczania, edukacji, jest wieloaspektowe i skomplikowane.

Myślę, że wydawcy stoją przed dwoma dużymi wyzwaniami, rozwijając technologie AI. Pierwszym jest opracowanie stanowiska firmy dotyczącego ogólnego podejścia do AI, na temat włączenia AI do swoich przepływów pracy. Drugim wyzwaniem jest jasne i jednoznaczne przekazanie tego stanowiska swoim interesariuszom.

Polityki wydawnicze, które widziałem, są w większości wadliwe. Niektóre z nich są faktycznie politykami skierowanymi na zewnątrz, do autorów, z szeregiem napomnień dotyczących tego, co jest dopuszczalną praktyką (niewiele) i co nie jest dopuszczalne (wiele). O’Reilly’s “AI Use Policy for Talent Developing Content for O’Reilly” ciągnie się przez strony i strony, z ezoterycznymi wskazówkami, takimi jak “NIE używaj żadnych modeli OSS GenAI, które produkują oprogramowanie podlegające warunkom licencji copyleft lub sieciowej wirusowej licencji open source.”

Z drugiej strony, wydawca naukowy Elsevier, w sekcji “Elsevier Policies” na swojej stronie internetowej, zamieszcza oświadczenia na temat “Odpowiedzialnych zasad AI,” “Eksploracji tekstu i danych” oraz “Wykorzystania generatywnego AI i technologii wspomaganych przez AI w pisaniu dla Elsevier.”

Niewiele wewnętrznych, niepublikowanych polityk wydawców, które widziałem, jest nadmiernie konserwatywnych. Ci wydawcy zareagowali zbyt szybko na zakres postrzeganych i potencjalnych zagrożeń oraz na lęki swoich autorów, co spowodowało, że ograniczyli swoją zdolność do intensywnego zaangażowania się w tę szybko rozwijającą się, szybko zmieniającą się technologię.

To oczywiste, że będą używać AI “odpowiedzialnie”, cokolwiek to znaczy. To oczywiste, że mają najwyższą troskę o własność intelektualną autorów i agresywnie chronią prawa autorskie autorów. (Chociaż, oczywiście, te szerokie zasady muszą być publicznie deklarowane i często powtarzane.)

Ale co poza tym?

  • Czy pozwolą, aby AI miało rolę w zakupach redakcyjnych? Czy AI może przyjrzeć się stosowi niezamówionych rękopisów?

  • Czy pozwolą, aby AI miało rolę w redakcji rozwojowej, redakcji technicznej i korekcie?

  • Czy pozwolą, aby AI miało rolę w określaniu nakładów i przydziałów?

  • W tworzeniu dostępnych plików ebooków, w tym tekstu alternatywnego?

  • W wspomaganiu tworzenia audiobooków w przypadkach, gdy zatrudnienie utalentowanych ludzkich lektorów nie jest ekonomicznie realistyczne?

  • W wspomaganiu tłumaczeń na obce języki na rynki, gdzie prawa nigdy nie zostałyby sprzedane?

  • Czy rozwijasz materiały marketingowe na dużą skalę?

  • Czy komunikujesz się z resellerami?

Jeżeli tak, muszą to jasno określić i wyraźnie wyjaśnić myślenie stojące za tymi zasadami. Wydawcy muszą być odważni w przeciwdziałaniu wielu zastrzeżeniom większości autorów w tym czasie strachu i wątpliwości.

Rozważania zawodowe

An icon of a key

Tylko największe wydawnictwa będą w stanie zatrudnić dedykowany personel do pracy z oprogramowaniem i systemami AI. Przeciętny wydawca będzie chciał, aby wszyscy jego pracownicy mieli dostęp do narzędzi AI, oczekując, że każdy z nich będzie mógł z nich korzystać w celu znalezienia efektywności w swojej pracy.

Na konferencji PubWest w Arizonie w lutym 2024 roku prelegent spoza branży wydawniczej zasugerował, że jednym z zastosowań AI będzie zastąpienie stażystów. Sala wybuchła. Miała dobre intencje - w rzeczywistości raport New York Times z 10 kwietnia 2024 roku opisuje, jak banki inwestycyjne na Wall Street planują zastąpić wielu swoich stażystów za pomocą AI. Podobnie jak w przypadku wydawnictw, oczywiste jest pytanie: jak znaleźć starszych analityków, jeśli nie mogą zacząć jako młodsi analitycy?

Branża wydawnicza zawsze polegała na stażach. Badanie z 2019 roku wykazało, że 80 procent osób pracujących w wydawnictwach mniej niż piętnaście lat wcześniej odbyło staż.

Częściowo jest to sposób na wykonanie prac o niższej wartości w rozsądnej cenie. Ale to blednie w porównaniu z większą rzeczywistością, że żadna szkoła wydawnicza nie jest w stanie przygotować kogoś do pracy w wydawnictwie na poziomie średniego menedżera. Jedynym sposobem na rozwijanie wykwalifikowanego personelu jutra jest szkolenie stażystów i praktykantów dzisiaj.

Celem nie jest zastąpienie stażystów AI, ale uczynienie ich pracy bardziej produktywną i satysfakcjonującą dzięki narzędziom AI, co przyniesie korzyści zarówno stażystom, jak i firmom wydawniczym.

AI dla audiobooków

An icon of a key

AI dla audiobooków działa naprawdę dobrze. Nie jest doskonałe, ale działa. Autorzy i wydawcy rutynowo używają narzędzi AI w produkcji audiobooków, głównie dla książek, w przypadku których pełnowymiarowa produkcja audiobooków z narratorem nie jest finansowo opłacalna. I nie tylko dla audiobooków w języku angielskim, ale także dla audiobooków w tłumaczeniu.

Używanie AI do audiobooków nie jest nowością; po raz pierwszy pisałem o tym trendzie w Publishers Weekly w 2021 roku. Jednak nowsze modele językowe na dużą skalę ożywiły technologię automatycznej narracji audiobooków.

W 2021 roku zauważyłem: “Czy jest to idealne? Z pewnością nie. Czy może być wystarczająco dobre? Prawdopodobnie tak, jeśli wydawca będzie skłonny poświęcić niezbędny czas na etap edycji głosu w projekcie.” Dwa i pół roku później, według wielu opinii, głosy AI są nie do odróżnienia od ludzkich, chyba że słucha się bardzo uważnie.

W listopadzie ubiegłego roku Meta (Facebook) wprowadziła “Seamless,” który potrafi “przenosić tony, wyrażenia emocjonalne i cechy stylu wokalnego” do tłumaczenia na 200 języków. Audiobook może zostać natychmiast przetłumaczony na wiele języków z niezwykłą jakością.

Również w 2021 roku zgłosiłem, że “blokowanie przez Audible dystrybucji audiobooków z nie-ludzkimi narratorami jest prawdziwym problemem, który może zająć trochę czasu, aby go rozwiązać.” Tymczasem zarówno Google, jak i Apple ogłosiły programy pozwalające autorom tworzyć audiobooki z głosami generowanymi przez AI. 5 grudnia Findaway Voices by Spotify zaczął akceptować “cyfrowo nagrane audiobooki z Google Play Books do dystrybucji do wybranych partnerów detalicznych.”

Wczesnym listopadem 2023 roku Amazon ogłosił, że autorzy Kindle Direct Publishing (KDP) wkrótce będą mieli dostęp do usługi, która pozwoli im “szybko i łatwo stworzyć wersję audiobooka swojej ebooka, używając wirtualnej narracji głosowej, technologii syntezatora mowy.” W styczniu 2024 roku Jane Friedman doniosła (paywall), że “Audible po cichu zaczęło dopuszczać audiobooki narracyjne AI do swojego sklepu pod koniec zeszłej jesieni, długo po tym, jak inni detaliści zrobili to samo.”

I oczywiście używam AI do wersji audiobookowych tej książki.

AI dla tłumaczenia książek

An icon of a key

AI dla tłumaczenia książek działa. Może nie tak dobrze, jak działa dla automatycznego tworzenia audiobooków. Ale zbliża się bardzo szybko. Fikcja nie-literacka może być pierwsza. Fikcja literacka może pójść za nią. Non-fiction stawia inne wyzwania.

W czerwcu 2024 roku zorganizowałem webinar na temat AI dla tłumaczenia książek, sponsorowany przez BISG. Wideo jest dostępne na YouTube. Jane Friedman opisała także program w swoim newsletterze Hot Sheet.

Temat jest złożony i pełen niuansów. Jedną z rzeczy, które mnie fascynują, jest to, jak długo ludzie próbują zautomatyzować tłumaczenie. To przypomnienie, że książki, które wypełniają nasz wszechświat, stanowią tak mały procent pisemnej komunikacji, zwłaszcza w tej erze online.

Warren Weaver, uznawany za ojca tłumaczenia maszynowego (MT), zauważył w rozmowie z kolegą: „Kiedy patrzę na artykuł w języku rosyjskim, mówię: ‘To jest naprawdę napisane po angielsku, ale zakodowane w dziwnych symbolach. Teraz przystąpię do dekodowania.’” Dla maszyny język to tylko kod. To nie jest kultura, uczucia ani wielkość pisanego języka. To zadanie z liczbami i kodem.

Wyraźnie podział na fikcję i niefikcję będzie miał duże znaczenie w tłumaczeniu za pomocą AI. Chat AI jest silny w stylu, ale brakuje mu faktów. To bardzo wczesne dni, ale skłaniam się ku myśli, że Chat AI zabłyśnie w fikcji, ale nie poradzi sobie z niefikcją. (Niemniej jednak, przystępuję do tłumaczenia tej pełnej faktów książki za pomocą maszyny!)

Literatura piękna to zdecydowanie słoń w pokoju. Jest cenna i szanowana, i słusznie. Tłumacze mogą spędzać godziny na dyskusji o jednym słowie lub frazie. Chat AI musi ostrożnie stąpać po tych wodach.

Ale to jest żyzny teren. O ile mogę stwierdzić (z niewielu danych), w 2023 roku było tylko 9 500 tłumaczeń książek handlowych. Nawet jeśli się mylę o dużą wartość, jest jasne, że niewiele książek jest tłumaczonych z języków obcych na angielski.

Podobnie, znalazłem statystykę wskazującą, że w 2023 roku było tylko 7 230 tłumaczeń z angielskiego na hiszpański (na hiszpańskich rynkach książek). To wydaje się absurdalnie mało.

Jest tu ogromna szansa.

Większość wykorzystania AI do tłumaczenia książek będzie dotyczyć książek, których tłumaczenie nigdy nie było uważane za ekonomicznie opłacalne. Na pewno wpłynie to na pracę tłumaczy książek „średniego rynku”; wzrost zatrudnienia będzie w zarządzaniu projektami i kontroli jakości. Czy to zrekompensuje utratę pracy? Wątpliwe.

Jak w większości aspektów AI, są trudne problemy do rozwiązania i brak łatwych odpowiedzi.

Jak zauważam w sekcji o oprogramowaniu, Leanpub i DeepL to dwie firmy oferujące usługi tłumaczenia książek wspomagane AI dla autorów i wydawców.

AI dla wydawnictw naukowych

An icon of a key

Wydawcy handlowi i autorzy wszelkiego rodzaju powinni zwracać uwagę na trajektorię AI w społeczności wydawnictw naukowych. Postępuje ona znacznie szybciej niż w wydawnictwach konsumenckich.

Widzę dwa powody tego postępu. Po pierwsze, autorzy w wydawnictwach naukowych są z zawodu akademikami, a w sektorze STM (naukowym, technicznym i medycznym) często są naukowcami z zaawansowanymi stopniami naukowymi. Oprócz publikowania, badają i często przyjmują AI w swojej pracy. Byłoby dla nich bardziej zaskakujące, gdyby ich wydawca nie badał wykorzystania AI w redagowaniu i publikowaniu ich prac.

To przenosi się do ekosystemu wydawnictw naukowych, gdzie redaktorzy często są sami uczonymi. Technologia nie jest dla nich zastraszająca.

Nie będę dalej zagłębiał się w szczegóły w tej książce; więcej na ten temat napiszę na moim blogu.

AI dla autorów

Autorzy i wydawcy często postrzegają siebie jako żyjących w dwóch odrębnych światach, połączonych, ale zasadniczo oddzielonych. W nowoczesnym wydawnictwie było to w dużej mierze prawdą.

Czasy się zmieniają. Tam, gdzie wydawcy byli kiedyś nieosiągalni, teraz to czołowi autorzy dyktują warunki. Jak omawiam gdzie indziej, autorzy samodzielnie publikujący są pionierami. Nie dźwigają oni bagażu, który obciąża tradycyjne wydawnictwa.

Kiedy wydawcy patrzą na AI, widzą niewiele możliwości. Kiedy rozmawiam z autorami o AI, świat stoi przed nimi otworem. Możliwości są niemal nieograniczone:

Autorstwo i redakcja

  • Próby pisania i publikowania całych książek

  • Próby generowania pomysłów na nowy projekt

  • Próby generowania pomysłów w nowej książce

  • Dopracowywanie fabuły

  • Badania

  • Weryfikacja faktów

  • Towarzysz pisania

  • Redakcja rozwojowa

  • Redakcja

  • Sprawdzanie pisowni i gramatyki

  • Korekta

Ilustracje/grafika

  • Tworzenie ilustracji i wykresów

  • Projekty okładek

  • Promocje wideo

Marketing

  • Automatyzacja zgłoszeń do agentów, wydawców, konkursów, znajomych, prośby o recenzje

  • Generowanie materiałów marketingowych: komunikaty prasowe, posty na blogu, media społecznościowe itp.

  • Generowanie stron internetowych

Autorzy będą napędzać wiele zmian w przyjmowaniu AI przez branżę, zarówno za, jak i przeciw.

Są beneficjentami wielu innowacji startupowych dotyczących AI w autorstwie i publikowaniu — około 70% startupów chce współpracować z autorami na ich drodze.

Obawy i ryzyka związane z AI

An icon of a key

Obawy dotyczące AI są poważne. Ryzyka są realne. Czasami wyrażane są w sposób histeryczny, ale gdy się im dokładnie przyjrzymy, wpływ AI ma potencjał być ogromnie destrukcyjny.

Jest tak wiele problemów i obaw związanych ze sztuczną inteligencją, że wypełniają one całe tomy książek. Oto chmura słów z tematami, które monitoruję. Jestem pewien, że brakuje kilku.

Chmura słów skoncentrowana wokół terminu 'AI', z powiązanymi terminami, takimi jak 'obawy', 'etyka' i 'ludzkość' wokół niej.

Na każdy z tych tematów dostępnych jest mnóstwo informacji, i zachęcam, abyś czytał/a tak głęboko, jak tylko możesz. Możliwe, że dojdziesz do wniosku, iż ryzyka przewyższają korzyści i nie chcesz korzystać ze sztucznej inteligencji, ani osobiście, ani w swojej organizacji. Ta decyzja niesie ze sobą własne ryzyka; zwykłe, czyli pozostanie w tyle. Ale to osobisty wybór.

Jeśli wpiszesz w Google “książki dotyczące ryzyk związanych ze sztuczną inteligencją”, znajdziesz wybór wartościowych tomów. Ostatni podcast, który wydał mi się szczególnie przerażający, to rozmowa Ezry Kleina z Dario Amodei, współzałożycielem i CEO Anthropic (firmy, która rozwija Claude.ai). Dowiesz się, że te firmy są świadome ryzyk. Amodei odnosi się do wewnętrznego systemu klasyfikacji ryzyk o nazwie A.S.L., dla “Poziomów Bezpieczeństwa AI” (nie American Sign Language). Obecnie znajdujemy się na poziomie ASL 2, “systemy, które wykazują wczesne oznaki niebezpiecznych możliwości - na przykład zdolność do udzielania instrukcji, jak zbudować broń biologiczną.” Opisuje poziom ASL 4 jako “umożliwienie aktorom państwowym znacznego zwiększenia swoich zdolności… gdzie martwilibyśmy się, że Korea Północna, Chiny lub Rosja mogłyby znacznie zwiększyć swoje ofensywne zdolności w różnych obszarach wojskowych dzięki AI w sposób, który dałby im znaczną przewagę na poziomie geopolitycznym.” Przerażające rzeczy.

W tym ponurym kontekście, podkreślę najbardziej istotne kwestie dla pisarzy i wydawców.

Naruszenie praw autorskich?

An icon of a key

Problemy związane z prawami autorskimi to miasma złożoności i niejasności. Wydaje się pewne, że niektóre książki wciąż objęte prawami autorskimi zostały uwzględnione w szkoleniu niektórych LLM. Ale z pewnością nie jest tak, jak niektórzy autorzy się obawiają, że całe ich dzieło zostało wciągnięte do każdego z dużych modeli językowych.

Problemy z prawem autorskim są zarówno specyficzne, jak i szerokie. Powszechnie wiadomo, że wszystkie LLM-y są szkolone na otwartym internecie - wszystko, co można zgarnąć z 1,5 miliarda stron w sieci dzisiaj, czy to artykuły prasowe, posty w mediach społecznościowych, blogi internetowe i, najwyraźniej, transkrypcje filmów z YouTube.

Jest to udowodnione, że przynajmniej jeden z LLM-ów przyswoił rzeczywisty tekst tysięcy książek, które nie są w domenie publicznej.

Czy było legalne przyswajanie całego tego tekstu w celu budowania firm AI wartych miliardy dolarów, bez żadnego wynagrodzenia dla autorów? Firmy AI argumentują to w kategoriach dozwolonego użytku; sądy w końcu zdecydują. Nawet jeśli to było legalne, czy było etyczne lub moralne? Etyka wydaje się mniej skomplikowana niż kwestie prawne. Ty decydujesz.

Prawa dotyczące prawa autorskiego oczywiście nie przewidziały unikalnych wyzwań, jakie AI wnosi do problemu, a poszukiwanie rozwiązań prawnych zajmie czas, być może lata. (Jeśli chcesz zgłębić, dlaczego prawa nie są odpowiednie do konkretnego problemu, przeczytaj doskonały artykuł A. Feder Coopera i Jamesa Grimmelmanna zatytułowany “Pliki są w komputerze: Prawo autorskie, zapamiętywanie i generatywne AI.”)

Oto lista trzynastu najbardziej znanych spraw, nie wszystkie dotyczą książek; także obrazów i muzyki. A oto inna lista, która aktualizuje status wszystkich spraw sądowych.

Prawo autorskie i AI dla autorów

An icon of a key

Autorzy stają przed dodatkowymi problemami związanymi z możliwością objęcia prawem autorskim treści generowanych przez AI.

Stanowisko Urzędu ds. Praw Autorskich USA dotyczące możliwości objęcia prawem autorskim treści generowanych przez AI stwierdza, że AI nie może samodzielnie posiadać praw autorskich, ponieważ brakuje mu statusu prawnego autora. To ma sens. Ale to zakłada, że 100% pracy jest generowane przez AI. Jak omówiono gdzie indziej, niewielu autorów pozwoli AI wygenerować całą książkę. Bardziej prawdopodobne jest, że będzie to 5%, 10% lub… I tutaj Urząd ds. Praw Autorskich napotyka trudności (jak i ja).

W niedawnym orzeczeniu Urząd stwierdził, że powieść graficzna składająca się z tekstu napisanego przez człowieka i obrazów wygenerowanych przez usługę AI Midjourney stanowi utwór podlegający prawu autorskiemu, ale same obrazy nie mogą być chronione prawem autorskim.“ Jejku!

An icon of a key

Wystarczy powiedzieć, że autorzy i wydawcy muszą być czujni na zmieniające się kwestie związane z prawem autorskim, w wielu aspektach.

Jakie są długoterminowe implikacje?

Niektórzy porównują obecne postępowania sądowe do procesu Google Books, który trwał 10 lat, zanim został prawnie rozstrzygnięty. Kto wie, jak długo potrwa proces apelacyjny w tych sprawach. W międzyczasie wydawcy rozsądnie działają, zakładając, że firmy AI przegrają, co teoretycznie naraża każdego, kto udziela licencji lub nawet używa Chat AI, na pewną formę odpowiedzialności warunkowej.

Ale to nie jest najpoważniejszy problem wydawców. To percepcja. Dla wielu autorów, zarówno znanych, jak i mniej znanych, studnia została zatruta. AI jest radioaktywne w społeczności pisarskiej i wydawniczej. Wszystko, co choćby przypomina AI, spotyka się z intensywną krytyką.

Jest wiele przykładów. W niedawnym incydencie Angry Robot, brytyjski wydawca “dedykowany najlepszej współczesnej literaturze science fiction, fantasy i WTF,” ogłosił, że będzie używał oprogramowania AI o nazwie Storywise, aby przesiać spodziewaną dużą partię zgłoszeń rękopisów. Wystarczyło tylko pięć godzin, aby firma porzuciła plan i powróciła do “starej skrzynki mailowej.

Nie do zniesienia dylemat wydawców branżowych w korzystaniu z narzędzi AI wewnętrznie: jeśli twoi autorzy się dowiedzą, trudno będzie przetrwać burzę, która nastąpi. Wierzę, że wydawcy nie mają wyboru, muszą być odważni, przyjąć (przynajmniej niektóre z) narzędzi, jasno wyjaśnić, jak te narzędzia są szkolone i jak są wykorzystywane, i iść dalej.

W Wielkiej Brytanii, The Society of Authors przyjmuje twarde stanowisko: “Poproś swojego wydawcę, aby potwierdził, że nie będzie znacząco wykorzystywał AI do żadnych celów związanych z twoją pracą - takich jak korekta, redakcja (w tym autentyczność i sprawdzanie faktów), indeksowanie, ocena prawna, projektowanie i układ, czy cokolwiek innego bez twojej zgody. Możesz chcieć zakazać narracji audiobooka, tłumaczenia i projektowania okładki wykonanego przez AI.”

The Authors Guild appears to accept that “publishers are starting to explore using AI as a tool in the usual course of their operations, including editorial and marketing uses.” I don’t think that many members of the Guild are as understanding.

Licencjonowanie treści dla firm AI

Większość wydawców i wielu autorów szuka sposobów na licencjonowanie treści dla firm zajmujących się sztuczną inteligencją. Każdy ma inne zdanie na temat warunków licencjonowania i wartości swoich treści, ale przynajmniej rozmowy się rozpoczęły.

Istnieje kilka startupów, które chcą współpracować z wydawcami (a w niektórych przypadkach także z indywidualnymi autorami). Calliope Networks i Created by Humans są w tym kontekście interesujące.

W połowie lipca Copyright Clearance Center, od dawna główny gracz w branży kolektywnego licencjonowania praw autorskich, ogłosiło dostępność „praw do ponownego wykorzystania sztucznej inteligencji (SI) w ramach swoich Annual Copyright Licenses (ACL), kompleksowego rozwiązania do licencjonowania treści oferującego prawa do milionów utworów dla firm, które subskrybują.”

Publishers Weekly relacjonował ogłoszenie, cytując Tracey Armstrong, prezes i CEO CCC, mówiącą: “Możliwe jest być pro-SI i pro-prawa autorskie, łącząc SI z szacunkiem dla twórców.”

Chociaż nie jest to wszechstronne rozwiązanie, prawdopodobnie jest to przełom w zbliżaniu wydawnictw do pewnego stopnia współpracy z twórcami dużych modeli językowych.

Jest za późno, aby uniknąć SI

An icon of a key

Dla autorów i wydawców, którzy wolą nie mieć nic wspólnego z SI, wiadomości są złe: używacie SI dziś i używaliście go od lat.

Sztuczna inteligencja, w różnych formach, została już zintegrowana z większością narzędzi programowych i usług, z których korzystamy na co dzień. Ludzie polegają na narzędziach do sprawdzania pisowni i gramatyki opartych na SI w programach takich jak Microsoft Word czy Gmail. Microsoft Word i PowerPoint wykorzystują SI do sugestii pisania, rekomendacji projektów i układów oraz innych funkcji. Wirtualni asystenci, tacy jak Siri i Alexa, używają przetwarzania języka naturalnego do rozumienia poleceń głosowych i odpowiadania na pytania. Usługi e-mail wykorzystują SI do filtrowania wiadomości, wykrywania spamu i wysyłania alertów. SI napędza chatboty obsługi klienta i generuje rekomendacje produktowe na podstawie historii zakupów.

I wiele z tego opiera się na Dużych Modelach Językowych, jak w przypadku ChatGPT.

Dla autora lub redaktora, który mówi: “Nie chcę, aby SI była używana w moim manuskrypcie,” jest to, ogólnie rzecz biorąc, prawie niemożliwe, chyba że oni i ich redaktorzy pracują na maszynach do pisania i ołówkach.

Mogliby spróbować powiedzieć: “Nie chcę, aby generatywna SI” była używana w ich książce. Ale to trudne do rozdzielenia. Oprogramowanie do sprawdzania gramatyki nie było pierwotnie oparte na generatywnej SI. Grammarly dodało ją jako składnik do swojego produktu, podobnie jak wszystkie inne narzędzia do sprawdzania pisowni i gramatyki. Generatywna SI jest również kluczowym elementem oferowanego oprogramowania marketingowego.

Kiedy autorzy używają SI

Inny aspekt autorów i używania SI ma podobieństwa do omówionego powyżej problemu z prawami autorskimi. W skrajnych przypadkach widzimy 100% treści generowanej przez SI publikowanej na Amazonie. Większość z tego (wszystko?) jest kiepskiej jakości, ale to nie zapobiega jej publikacji. (Zobacz także sekcję Amazon.) Bardziej niepokojące dla wydawców są zgłoszenia generowane przez SI. Tak, SI zwiększa ilość, ale duzi wydawcy już mają filtr na ilość. Filtry nazywane są agentami. To oni będą musieli wymyślić, jak poradzić sobie z problemem ilości, i najwyraźniej będą musieli znaleźć rozwiązanie, które nie wykorzystuje SI.

Jest to coś w rodzaju egzystencjalnego problemu - czy chcę opublikować książkę napisaną przez ‘maszynę’? Dla większości wydawców to jednoznaczne ‘nie.’ Proste. No dobrze, a co z książką, gdzie 50% treści zostało wygenerowane przez Duży Model Językowy, pod nadzorem kompetentnego autora? Hmm, spróbujmy też z ‘nie.’ OK: a co z 25%, 10% lub 5%? Gdzie ustawić granicę?

A teraz, kiedy już zaczęliście wyznaczać granice, jak rozwiązać dylemat, że narzędzia do sprawdzania pisowni i gramatyki teraz polegają, przynajmniej częściowo, na generatywnej SI? Co z narzędziami do transkrypcji napędzanymi przez SI, takimi jak Otter.ai, czy funkcją transkrypcji wbudowaną w Microsoft Word?

Nie mogę znaleźć żadnego wydawcy handlowego, który zadeklarowałby, że nie opublikuje pracy z określoną ilością tekstu generowanego przez SI. Oto, co na ten temat mówi Authors Guild:

“Jeśli znaczna ilość tekstu, postaci lub fabuły wygenerowanych przez sztuczną inteligencję zostanie włączona do twojego rękopisu, musisz to ujawnić wydawcy i powinieneś również ujawnić to czytelnikowi. Nie uważamy, że autorzy muszą ujawniać użycie generatywnej AI, gdy jest ona wykorzystywana jedynie jako narzędzie do burzy mózgów, generowania pomysłów lub do redagowania tekstu.”

Nie trzeba dodawać, że ‘znaczna’ nie jest zdefiniowana (Oxford definiuje to jako “wystarczająco duża, aby była zauważona lub uznana za ważną”), ale post idzie dalej, wyjaśniając, że włączenie więcej niż “de minimis tekstu wygenerowanego przez AI” naruszyłoby większość kontraktów wydawniczych. De minimis, w terminach prawnych, nie jest precyzyjnie określone, ale ogólnie rzecz biorąc, oznacza mniej więcej to samo co znaczna.

Czy można wykryć AI w pisaniu?

W maju 2024 roku zorganizowałem webinar na temat wykrywania AI, sponsorowany przez BISG. Powtórkę można obejrzeć online na YouTube. Jane Friedman przedstawiła obszerne podsumowanie webinaru w swoim newsletterze Hot Sheet.

Dla wielu autorów toksyczność AI oznacza trzymanie jej z daleka od ich słów. Wydawcy ponoszą szczególne brzemię - nie tworzą tekstu, ale po opublikowaniu ponoszą znaczną odpowiedzialność za tekst. Widzieliśmy wiele wybuchów w pobliżu zapalnych książek, czy to wokół społecznych implikacji treści, czy też plagiatowego przechwytywania słów i pomysłów innych pisarzy. Teraz, z AI, stajemy przed zupełnie nowym zestawem problemów etycznych i prawnych, które nie były omawiane w szkole wydawniczej.

Część z tego wydaje się podobna do tego, czym ludzie martwią się w przypadku studentów, że używanie AI jest w jakiś sposób oszustwem, podobnym do kopiowania artykułu z Wikipedii lub może po prostu poproszenia przyjaciela o napisanie eseju.

Jeden z naszych mówców webinaru, edukator, José Bowen, podzielił się swoim ujawnieniem dla studentów. To nie jest dokładnie to, co używasz dla autora, ale pokazuje pewne “poziomy ryzyka” użycia AI.

Szablon umowy ujawnienia dla studentów

  • Całą tę pracę wykonałem sam bez pomocy przyjaciół, narzędzi, technologii ani AI.

  • Zrobiłem pierwszy szkic, ale potem poprosiłem przyjaciół/rodzinę, oprogramowanie do parafrazowania/gramatyki/plagiatu AI, aby to przeczytali i zasugerowali. Po tej pomocy wprowadziłem następujące zmiany:

    • Naprawiono błędy ortograficzne i gramatyczne

    • Zmieniono strukturę lub kolejność

    • Przepisano całe zdania/akapit

  • Utknąłem na problemach i użyłem tezaurusa, słownika, zadzwoniłem do przyjaciela, poszedłem do centrum pomocy, użyłem Chegg lub innego dostawcy rozwiązań.

  • Użyłem AI/przyjaciół/tutora, aby pomogli mi wygenerować pomysły.

  • Użyłem wsparcia/narzędzi/AI do stworzenia zarysu/pierwszego projektu, który następnie edytowałem. (Opisz naturę swojego wkładu.)

I tak wydawca mógłby napisać coś takiego dla swoich autorów. Powiedzmy, że autor ujawnia najwyższy poziom: użyłem AI obszernie, a następnie edytowałem wyniki. Co wtedy? Czy automatycznie odrzucasz manuskrypt? Jeśli tak, to dlaczego?

A tymczasem, jeśli zwracasz uwagę, dowiadujesz się, że ten manuskrypt, który właśnie przeczytałeś i pokochałeś, który autor przysiągł, że nawet nie został sprawdzony pod kątem błędów przez Grammarly, mógł w rzeczywistości być w 90% wygenerowany przez AI, przez autora eksperta w ukrywaniu jego użycia.

Jesteś wtedy zmuszony ponownie przemyśleć pytanie. Staje się ono: “Dlaczego jestem tak cholernie zdeterminowany, aby wykryć tę rzecz, która jest niewykrywalna?”

Częściowo to alarmistyczne obawy dotyczące ochrony praw autorskich dla tekstów generowanych przez AI. Urząd praw autorskich nie zaoferuje ochrony praw autorskich dla w 100% tekstów generowanych przez AI (lub muzyki, obrazów itp.). Ale co z tekstem wygenerowanym w 50% przez AI? Cóż, pokrylibyśmy tylko 50% wygenerowane przez autora. A skąd byś wiedział, która połowa? Wrócimy do Ciebie w tej sprawie.

Czy nie byłoby wspaniale, gdybyś mógł po prostu wprowadzić każdy manuskrypt do jakiegoś oprogramowania, które powiedziałoby ci, czy AI zostało użyte do tworzenia tekstu?

Pomijając kwestię, że jedynym sposobem na to byłoby użycie narzędzi AI, ważniejsze pytanie brzmi: czy oprogramowanie byłoby (wystarczająco) dokładne? Czy mógłbym na nim polegać, aby powiedziało mi, czy AI zostało użyte do tworzenia manuskryptu? I czy mógłbym polegać na tym, że nie wytworzy “fałszywych pozytywów” – wskazując, że AI zostało użyte, kiedy w rzeczywistości nie zostało?

Obecnie na rynku jest wiele oprogramowania, które zajmuje się tymi wyzwaniami. Wiele badań akademickich oceniających to oprogramowanie wskazuje na jego zawodność. Tekst generowany przez AI prześlizguje się. Gorzej, tekst, który nie został wygenerowany przez AI, jest błędnie oznaczany jako “skażony”.

Ale wydawcy książek będą chcieli mieć pewne zabezpieczenia. Wydaje się, że w najlepszym razie te narzędzia mogą ostrzegać o możliwych problemach, ale zawsze będzie trzeba to sprawdzić. Może więc będą ostrzegać o tekstach, które wymagają dokładniejszego zbadania niż inne? Czy to jest efektywność?

Prawdziwa efektywność zostanie osiągnięta, gdy przestaniemy martwić się o pochodzenie tekstu, zamiast tego utrzymując nasze istniejące kryteria dotyczące jego jakości.

Utrata pracy

“Nie zostaniesz zastąpiony przez AI. Zostaniesz zastąpiony przez kogoś, kto potrafi korzystać z AI.” —Anonimowy

Utrata pracy z powodu wdrożenia AI może być poważna. Szacunki są różne, ale liczby są ponure. Istnieją oczywiste przykłady: bezzałogowe taksówki w San Francisco eliminują… kierowców taksówek i usług współdzielenia przejazdów. Diagnostyka wspierana przez AI może zmniejszyć zapotrzebowanie na techników medycznych.

Optymista we mnie wskazuje, jako jeden z przykładów, wprowadzenie arkusza kalkulacyjnego i jego wpływu na zatrudnienie. Jak widać na poniższym wykresie, zatrudnienie w “Usługach księgowych, przygotowywania podatków, prowadzenia ksiąg rachunkowych i płac” niemal podwoiło się od 1990 r. - trudno tu o oskarżenia wobec arkuszy kalkulacyjnych i innych technologii, które w dużej mierze zautomatyzowały te zadania.

Wykres liniowy pokazujący liczbę pracowników w usługach księgowych, przygotowywania podatków, prowadzenia ksiąg rachunkowych i płac w latach 1990-2020.

Badanie Ethana Mollicka z Boston Consulting Group (BCG) było eksperymentem mającym na celu lepsze zrozumienie wpływu AI na pracę, zwłaszcza na zadania złożone i wymagające wiedzy. Badanie obejmowało 758 konsultantów BCG, losowo przydzielonych do używania lub nieużywania GPT-4 od OpenAI w dwóch zadaniach: innowacja produktów kreatywnych i rozwiązywanie problemów biznesowych. Badanie mierzyło wydajność, zachowanie i postawy uczestników, a także jakość i charakterystykę wyników AI.

Wśród ustaleń było to, że “AI działa jako wyrównywacz umiejętności. Konsultanci, którzy uzyskali najgorsze wyniki na początku eksperymentu, odnotowali największy wzrost wydajności, o 43%, gdy mogli korzystać z AI. Najlepsi konsultanci również uzyskali wzrost, ale mniejszy.” Pełny artykuł jest odkrywczy, a jak wszystkie prace Mollicka, prowokacyjny, ale przystępny.

Edukacja

Edukacja była w centrum debat na temat zalet i wad sztucznej inteligencji. Wprowadzenie AI do klas jest generalnie postrzegane jako przekleństwo, a przynajmniej wyzwanie. Inni edukatorzy, jak główny prelegent PW Ethan Mollick, przyjmują AI jako niezwykłe nowe narzędzie dla nauczycieli; Mollick nalega, aby jego studenci pracowali z ChatGPT.

Najlepszą książką na ten temat jest Teaching with AI: A Practical Guide to a New Era of Human Learning autorstwa José Antonio Bowen i C. Edward Watson.

Nie zamierzam zagłębiać się w publikacje edukacyjne w tej książce - to ogromny temat, wymagający osobnego raportu. Można argumentować, że publikacje stają się drugorzędnym zainteresowaniem w edukacji: narzędzia AI to oprogramowanie, a nie treść jako taka.

Przyszłość wyszukiwania

An icon of a key

Wyszukiwanie to kontrowersyjny temat w AI. Zachęcam do odwiedzenia perplexity.ai i You.com, aby zobaczyć, dokąd zmierzają te technologie. Następnym razem, gdy będziesz myśleć o rozpoczęciu wyszukiwania w Google, zamiast tego odwiedź Perplexity. Nie będzie to wydawało się dramatycznie inne - jest podobne do grafów wiedzy, które Google często wyświetla po prawej stronie ekranu wyszukiwania lub czasem na górze wyników wyszukiwania. Zamiast klikać na link, informacje są bezpośrednio dostępne.

Perplexity idzie o krok dalej, przekształcając informacje zebrane z wielu źródeł, abyś naprawdę nie musiał klikać linku. Dostarcza linki do swoich źródeł, ale klikanie ich jest zazwyczaj zbędne - już masz odpowiedź na swoje pytanie.

Ta pozornie skromna zmiana ma ogromne implikacje dla każdej firmy i każdego produktu, który opiera się przynajmniej częściowo na byciu odkrytym przez wyszukiwarki. Jeśli wyszukiwacze nie są już kierowani na twoją stronę, jak możesz ich zaangażować i przekształcić w klientów? Prosta odpowiedź, nie możesz.

Joanna Penn jest na czele myślenia o wpływie nowych technologii na pisanie i publikowanie. Podjęła ten skomplikowany temat w swoim podcastie i blogu w grudniu zeszłego roku.

To dopiero początki dla AI i transformacji wyszukiwania.

Książki śmieciowe na Amazonie

An icon of a key

Książki śmieciowe generowane przez AI na Amazonie stanowią problem, chociaż ich powaga może być bardziej odczuwalna niż literalna. Z jednej strony te książki spamują księgarnię internetową niskiej jakości i plagiatowaną treścią, czasami używając nazwisk prawdziwych autorów, aby oszukać klientów i wykorzystać ich reputacje. Książki te są nie tylko uciążliwe dla czytelników, ale także stanowią zagrożenie dla autorów, potencjalnie pozbawiając ich trudno zarobionych tantiem. Książki generowane przez AI wpływają również na ranking i widoczność prawdziwych książek i autorów na stronie Amazona, konkurując o te same słowa kluczowe, kategorie i recenzje.

Słodki kociak siedzący na plaży wśród kwiatów z podpisem 'Śmieszne i słodkie zdjęcia kotów, których nie zobaczysz na świecie'.

Amazon teraz wymaga od autorów ujawniania szczegółów dotyczących wykorzystania AI przy tworzeniu ich książek. Bez wątpienia można to nadużyć.

Spróbuj wyszukać na Amazonie “książki generowane przez AI”. Jest ich mnóstwo. Niektóre z wyników to podręczniki na temat wykorzystania AI do tworzenia książek. Ale inne są, bez skrupułów, generowane przez AI. “Śmieszne i słodkie zdjęcia kotów - Nie zobaczysz tego typu zdjęć na świecie - CZĘŚĆ-1” (stet) jest przypisane Rajasekarowi Kasi. Na stronie autora nie ma żadnych szczegółów dotyczących jego (?) biografii, ale sześć innych tytułów jest przypisanych do tego nazwiska. Książka, opublikowana 26 sierpnia 2023 roku, nie ma recenzji ani rankingu sprzedaży. Niegramatyczny tytuł ebooka nie pasuje do niegramatycznego tytułu na okładce drukowanej książki.

Ale inni autorzy wyraźnie używają AI w dużym stopniu przy tworzeniu swoich książek i nie ujawniają tego. Jak wspomniałem powyżej, wykrycie użycia AI jest prawie niemożliwe w przypadku wykwalifikowanych “fałszerzy”. Kolorowanki, dzienniki, książki podróżnicze i książki kucharskie są tworzone za pomocą narzędzi AI w ułamku czasu i wysiłku tradycyjnego wydawnictwa.

Wyszukaj „koreańska wegańska książka kucharska”, a znajdziesz tytuł numer jeden, autorstwa Joanne Lee Molinaro, na pierwszym miejscu. Ale tuż za nim są inne tytuły, które są oczywistymi podróbkami. „Koreańska książka kucharska dla wegan: Proste i pyszne tradycyjne i nowoczesne przepisy dla miłośników kuchni koreańskiej” ma dwie recenzje, w tym jedną, która zauważa „To nie jest wegańska książka kucharska. Wszystkie przepisy zawierają mięso i jajka”. Ale książka jest na #5,869,771 w rankingu sprzedaży, w porównaniu do oryginału, który zajmuje #2,852 na liście.

Trudno określić zakres wyrządzonych szkód. Nic dobrego z tego nie wyniknie, ale jak źle może być?

Amazon ma zasady, które pozwalają na usunięcie każdej książki, która nie „zapewnia pozytywnego doświadczenia klienta”. Wytyczne dotyczące treści Kindle zabraniają „opisowej treści mającej na celu wprowadzenie klientów w błąd lub nieodpowiednio przedstawiającej zawartość książki.” Mogą również zablokować „treści, które zazwyczaj rozczarowują klientów.” Czy to ogromna ilość treści pokonuje obserwatorów Amazonu? A może jest inny powód?

Stronniczość

LLM są trenowane na tym, co już zostało opublikowane w internecie. To, co zostało opublikowane w internecie, jest pełne stronniczości, więc LLM odzwierciedlają tę stronniczość. I oczywiście nie tylko stronniczość, ale także nienawiść, odzwierciedloną w ich naukach, a teraz potencjalnie w wynikach generowanych przez AI słowach i obrazach. Pornografia jest kolejnym naturalnym beneficjentem niezwykłej zdolności AI do tworzenia obrazów, a ostatnio pojawiły się niepokojące historie o młodych kobietach znajdujących sfabrykowane nagie zdjęcia, z ich męskimi kolegami jako prawdopodobnymi podejrzanymi. The New York Times donosił oddzielnie o wzroście liczby obrazów wykorzystywania seksualnego dzieci w sieci.

Autorzy i wydawcy muszą być świadomi tych wbudowanych ograniczeń podczas korzystania z narzędzi AI.

Kreatywność może być kliszą

An icon of a key

Pytanie, czy maszyny mogą być naprawdę kreatywne, pozostaje tematem gorącej debaty. W pewnym stopniu zależy to od tego, jak definiujemy kreatywność.

„AI nigdy nie będzie kreatywna.” To znane hasło.

Wszyscy wiemy, czym jest kreatywność, prawda?

Cambridge: „zdolność do tworzenia lub używania oryginalnych i nietypowych pomysłów.”

Britannica: „zdolność do stworzenia lub w inny sposób powołania do istnienia czegoś nowego, czy to nowego rozwiązania problemu, nowej metody czy urządzenia, czy nowego obiektu artystycznego lub formy.”

Nie kwestionuję, że kreatywność w tym sensie jest poza zasięgiem LLM.

Moim argumentem jest to, że większość tego, co uważane jest za kreatywne - i często wydaje się dość kreatywne - jest w rzeczywistości iteracyjne. Co doskonale sprawdza się w wielu rzeczach, w tym w większości reklam.

Ale postawienie „stancji kreatywności”, a następnie umniejszenie LLM, to postawienie niemożliwie wysokiej bariery, której AI nie jest w stanie pokonać. Wtedy ludzie odrzucają to jako „no mówiłem, że to nie jest kreatywne.”

I tym samym przegapiają iteracyjne rzeczy, w których jest bardzo dobry.

Wkrótce opublikuję długi esej na ten temat, po tym jak skończę czytać:

The Creativity Code, autorstwa Marcusa du Sautoy, i

The Artist in the Machine, autorstwa Arthura I. Millera

Literary Theory for Robots, autorstwa Dennisa Yi Tenena

Kolejna Myśl

Jeremiah Owyang jest analitykiem branżowym z Doliny Krzemowej. Jest zwolennikiem AI, ale wcześniej spotkał się z hype’em. Zauważa, że “nigdy nie widział tak szybkiej ewolucji w tak krótkim czasie.”

Jak mówi Owyang w swoim artykule, małe zespoły programistów mogą teraz używać LLM do tworzenia “czujących istot” — jak czteroletnie dziecko — w dwa dni. Są one zdolne do:

  • ‘Widzenia’ za pomocą widzenia komputerowego, co dzieje się w rzeczywistym świecie,

  • ‘Słyszenia’ poprzez komendy głosowe i dźwięki otoczenia w rzeczywistym świecie,

  • ‘Myślenia’ poprzez przetwarzanie powyższego wejścia z rzeczywistego świata,

  • ‘Uczenia się’ poprzez dostęp do wstępnie wytrenowanych danych,

  • ‘Odniesienia’ do ekskluzywnych zbiorów danych,

  • ‘Mówienia’ za pomocą realistycznych głosów, które mają intonację i ton w dowolnym języku,

  • ‘Pisania’ poprzez komunikację tekstową, w dowolnym formacie lub stylu,

  • ‘Rysowania’ poprzez spontaniczne tworzenie obrazów, oraz

  • ‘Interakcji’: może proaktywnie angażować się w dialog, zadawać pytania lub przypisywać agentom AI wykonywanie zadań.

To jest niesamowite i bezprecedensowe. Czy będzie miało to znaczenie dla wydawnictw? Decydujesz ty.

Dobre rzeczy poza wydawnictwami

AI stoi za niektórymi przełomowymi osiągnięciami poza wydawnictwami. Medycyna jest dzieckiem plakatu AI, ale są też potężne historie z innych branż. Relewantność dla wydawnictw wynika z retorycznego pytania: AI może ratować życie. Ale nie sądzisz, że może pomóc wydawcom?

Celem tej krótkiej sekcji jest jedynie obalenie argumentu, że jeśli AI nie pomoże wydawnictwom, to nie może pomóc nikomu.

AI i medycyna

Czytając marcowy numer The Economist z 2024 roku, zagłębiłem się w dodatek technologiczny o zdrowiu i AI. W ciągu ostatnich kilku lat medycyna konsekwentnie była jasnym punktem sztucznej inteligencji. Większość raportów jest pozytywna. Ale artykuł w The Economist cię powali. Wyrażają liczne, dobrze sformułowane zastrzeżenia. Ale przeczytasz też, że AI w medycynie “reprezentuje szansę na poprawę życia setek milionów, a nawet miliardów ludzi.”

Kolejne retoryczne pytanie do tych, którzy chcieliby zakazać technologii SI lub przynajmniej wprowadzić moratorium na jej rozwój: czy poświęcilibyście jej potencjalną wartość dla zdrowia milionów, aby zaspokoić swoje obawy dotyczące niepewnej przyszłości?

SI i TSA na lotniskach

Wszyscy to znamy: niekończące się kolejki, powolne przesuwanie się naszych bagaży podręcznych przez skanery rentgenowskie.

Niepowodzenia w wykrywaniu przez TSA są dobrze udokumentowane, ale rzadko omawiane.

Najbardziej martwi mnie widok smutnych pracowników, wpatrujących się w ekrany godzinami. Po co? Nie tylko, że to jest okropna praca, ale także, jako zwykli śmiertelnicy, nie są w tym zbyt dobrzy.

Wkracza SI. Jeśli może wykrywać trudne do wykrycia guzy w płucach, jestem przekonany, że może wykrywać kontrabandę w bagażach podręcznych. I uwolnić ludzi od niewdzięcznego zadania, do którego są źle przystosowani.

Według tego raportu, nowy program TSA wspomagany przez SI jest w trakcie realizacji.

Esej: Wpływ SI na przemysł wydawniczy książek

Niedawno rozmawiałem z Peterem Brantleyem, moim partnerem w webinarach o SI, o tym, jak moglibyśmy kształtować nadchodzące programy SI. Peter dużo pracuje w społeczności bibliotecznej i właśnie wrócił z całodniowego wydarzenia w Los Angeles z około 150 swoich kolegów bibliotekarzy, gdzie osobiście badali potencjalny wpływ SI na ich sektor. Rozmowa była żywa i dogłębna. Zastanawiał się, dlaczego wydawcy książek nie organizują takich spotkań? SI jest tematem na każdym wydarzeniu wydawniczym: dlaczego nie jest tematem przewodnim?

Rzeczywiste konsekwencje SI

Odpowiedź, którą wymyślił, jest taka, że wydawcy książek nie doszli jeszcze do wniosku, że SI będzie miała jakiekolwiek rzeczywiste konsekwencje dla ich biznesu. Dla rdzenia ich biznesu. Dla ich zdolności do prowadzenia działalności. Oczywiście, może pomóc w napisaniu informacji prasowej lub listu odrzucającego rękopis, ale zakładają, że wydawnictwo będzie nadal działać jak od dekad, z przeciętnym czasem od umowy do wydrukowanej książki, który może trwać nawet do dwóch lat.

Jednocześnie wydawcy oczywiście stają przed bardziej palącymi wyzwaniami niż AI. Ceny papieru. Koszty wysyłki. Kurczące się marże. Sprzedaż w większości przypadków płaska. Przy wszystkich tych naciskach, kto ma czas lub możliwości, aby martwić się o AI?

Ale inne branże kreatywne to rozumieją. Sztuka i design to rozumieją. Reklama to rozumie. Hollywood widzi, co nadchodzi, podobnie jak przemysł muzyczny. Dziennikarze obserwują z obawą.

Inne sektory wydawnicze zaczynają rozumieć wpływ AI. Wydawnictwa naukowe są głęboko zaangażowane w technologię. Ale wydawcy komercyjni zachowują się, jakby AI miało niewielkie rzeczywiste konsekwencje.

Jakie mogą być te rzeczywiste konsekwencje? Czy wpłynie to na podaż książek? Albo na popyt na książki?

Podaż: Tak, AI jest winne powstawaniu mnóstwa nowych, bezużytecznych książek na Amazonie. Setki? Z pewnością. Tysiące? Może. Miliony? Nie. Ile książek jest na Amazonie? Ponad 50 milionów. Jest już bardzo zatłoczony.

Pomijając to, jest jasne, że w najbliższym czasie AI nie będzie pisać całych książek, które ludzie będą rzeczywiście chcieli czytać. Jego wartość na razie polega na byciu towarzyszem pisania—krytykowaniu, sugerowaniu, czasami tworzeniu kilku akapitów użytecznego tekstu. Nie, w najbliższym czasie AI nie zmieni radykalnie wyników wydawniczych, podaży nowych książek.

Popyt: Nie, nikt nie domaga się książek generowanych przez AI. To nie jest czynnik. I nie mogę przewidzieć żadnego scenariusza, w którym AI wpłynie na popyt na książki w szerszym zakresie.

A co z procesem wydawniczym? Tak, to się zmieni. Przynajmniej trochę. Jak odkryliśmy na naszym wydarzeniu AI Publishers Weekly zeszłej jesieni, wydawcy szukają pomocy w AI tu i tam: marketing, redakcja, trochę tego i tamtego.

Czy możliwe jest, że AI będzie miało niewiele realnych konsekwencji dla wydawania książek handlowych? Być może to tylko zabawka.

Więc cofnijmy się od chwastów AI i ponownie przyjrzyjmy się trudnej sytuacji wydawnictw handlowych, a poprzez to, wniknijmy, gdzie AI prawdopodobnie będzie miało największy wpływ.

Wydawnictwo jest w ekonomicznym spadku od dekad

Według różnych szacunków, cały przemysł wydawniczy w Stanach Zjednoczonych ma roczną sprzedaż poniżej 35 miliardów dolarów. Nawet gdyby wynosiła 40 miliardów, roczna sprzedaż samego Apple Computer jest 10 razy wyższa. Zysk brutto Apple wynosi 44% sprzedaży, a zyski netto 25% sprzedaży. Wydawnictwo nawet nie marzy o takich marżach.

Wydawanie książek handlowych jest w łagodnym ekonomicznym spadku od dekad, niektóre lata wzrastają o kilka procent, inne spadają. Na półmetku 2024 roku sprzedaż wygląda solidnie rok do roku, ale to rodzaj letniego romansu, jaki wydawcy dobrze znają. Czasem wygrywamy, czasem przegrywamy, ale ogólnie rzecz biorąc, wydawanie książek handlowych nie jest przemysłem wzrostowym.

W 2023 roku, według raportu StatShot AAP “przychody z handlu spadły o 0,3%, wynosząc 8,9 miliarda dolarów za rok kalendarzowy.” O ile wiem, dane AAP nie uwzględniają inflacji. Przy inflacji wynoszącej 3,4% spadek sprzedaży wyniósłby 3,6%, bliżej 2,6% spadku w sprzedaży jednostkowej zgłoszonego przez Circana.

Bez wzrostu alternatywnych formatów, takich jak książki elektroniczne i audiobooki, branża mogłaby być w bardzo złym stanie. Książki elektroniczne były motorem wzrostu przez lata. Sprzedaż audiobooków nadal rośnie, wzrosła o prawie 15% w 2022 roku i kolejny 9% w 2023. Tak, część z tego to sprzedaż substytucyjna, ale wielu klientów książek elektronicznych i audiobooków to nowi klienci, niekoniecznie regularni czytelnicy książek. Książki elektroniczne i audiobooki stanowiły 21% sprzedaży handlowej w zeszłym roku. Czy wszyscy ci klienci kupiliby książki drukowane, gdyby druk był jedyną dostępną opcją?

Ceny detaliczne stają się coraz większym problemem, gdyż koszty oraz zniżki detalistów i hurtowników zmniejszają marże wydawców. Badania akademickie sugerują, że istnieje pewien stopień elastyczności cenowej dla książek, ale z pewnością osiągamy punkt oporu: bestsellery w twardej oprawie zbliżają się do granicy cenowej 35 dolarów. “Zmęczenie subskrypcjami” powoduje, że klienci usług wideo na żądanie rezygnują z nich, koncentrując się na rosnących kosztach każdej z nich. Plan Premium Netflixa kosztuje teraz 22,99 USD/miesiąc; Disney Plus Duo Premium kosztuje 19,99 USD/miesiąc. Jak niedawno zauważył mój kolega, ilu zubożałych subskrybentów powie, och, anulujmy naszą subskrypcję Netflix, aby móc kupić książkę w przyszłym miesiącu?

Wynagrodzenia w branży wydawniczej

Nie zamierzam tego rozwlekać: nie tylko autorzy walczą o utrzymanie się – personel wydawniczy jest skandalicznie niedopłacany w porównaniu z porównywalnymi zawodami.

Utrzymuję reprezentatywny przegląd ofert pracy w dziedzinie wydawnictw. Przyglądam się jednej z nich, na stanowisko Managera ds. Marketingu w wydawnictwie, które w 2023 roku odnotowało sprzedaż na poziomie nieco ponad 30 milionów dolarów. Stanowisko to oferuje wynagrodzenie w przedziale od 60 000 do 70 000 dolarów rocznie. Oto kolejna oferta, na stanowisko Managera ds. Public Relations w jednym z imprintów wydawnictwa, które odnotowuje roczną sprzedaż na poziomie 750 milionów dolarów. “Rola ta będzie miała roczne wynagrodzenie w przedziale od 74 000 do 79 000 dolarów,” zauważa ogłoszenie.

Zgodnie z Amerykańskim Biurem Statystyki Pracy, menedżerowie ds. marketingu zarabiają średnio, we wszystkich branżach, 166 410 dolarów. “Menedżerowie ds. Public Relations” zarabiają średnio 159 420 dolarów.

Wydawnictwo książkowe nie jest nawet w tej samej lidze. To nie jest nowość dla nikogo, kto pracuje w branży wydawniczej. Zawsze tak było. Ale czy wydawnictwo może się utrzymać na tych poziomach wynagrodzeń? Niezdolność do oferowania kandydatom nawet połowy standardowego wynagrodzenia nie wróży dobrze dla branży, która staje się coraz bardziej cyfrowa.

W erze TikToka, YouTube, mediów społecznościowych, SEO, metadanych i platform autorskich, czym w ogóle jest “manager ds. public relations”?

Trzy (i pół) pozostałe zalety tradycyjnych wydawnictw książkowych

Trzy trwałe zalety tradycyjnych wydawnictw książkowych to (i) prestiż, (ii) dostęp do głównych mediów i (iii) dostęp do dystrybucji w księgarniach. Nie dotyczy to w równym stopniu wszystkich tradycyjnych wydawnictw — największe z nich mają więcej każdej z tych zalet: więcej prestiżu, lepszy dostęp do głównych mediów i lepsze możliwości umieszczania swoich książek na przednich stołach w największej liczbie księgarni. Ale, biorąc to wszystko razem, są to charakterystyczne zalety tradycyjnego przemysłu wydawniczego.

Inną wartością, jaką mogą oferować wydawnictwa, jest starannie dobrana lista komplementarnych tytułów, gdzie każdy pojedynczy tytuł korzysta na swojej obecności w towarzystwie innych. Pomyśl o wydawnictwie takim jak Fox Chapel, specjalizującym się w książkach o rzemiośle: jeśli podoba ci się jeden z ich tytułów, istnieje duża szansa, że przyjrzysz się ich innym książkom (i magazynom) na ten sam temat, nawet jeśli są napisane przez innych autorów.

To przechodzi do czegoś, co udało się rozwinąć tylko kilku wydawcom, czyli do sprzedawalnej marki. Pomyśl o seriach takich jak „For Dummies” wydawnictwa Wiley, czy „Very Short Introductions” wydawnictwa Oxford. Marka przekazuje konsekwencję podejścia redakcyjnego i jakości, która zachęca czytelników do zakupu wielu tytułów. Samodzielni wydawcy często uruchamiają własne krótkie serie, głównie dla beletrystyki, chociaż nie mogą one dorównać szerokości katalogów większych wydawnictw.

Wszystkie inne usługi, które zapewniają tradycyjni wydawcy, można kupić na otwartym rynku, o podobnej jakości, w przystępnych cenach (na przykład funkcje redakcyjne, projektowanie, produkcja i podstawowe funkcje marketingowe). A dla samodzielnych wydawców dochód na sprzedaną książkę jest pięć razy lub więcej większy niż według tradycyjnych harmonogramów tantiem.

Zagłębię się w to nieco głębiej w krótkim dodatku na końcu tej książki. Ale pozwól mi szybko umniejszyć wartość trzech głównych zalet. Prestiż jest dobry do chwalenia się, ale ma skromną wartość gotówkową. Recenzje książek i inne duże media mają teraz znacznie mniejszy wpływ na sprzedaż książek. A księgarnie stanowią około 15% sprzedaży w branży (i znacznie mniej dla samodzielnie wydających się autorów) - nie są już kluczowe dla sukcesu książki.

Rzeczy się zmieniły.

Samodzielne publikowanie

Samodzielne publikowanie było głównym motorem wzrostu w wydawnictwach konsumenckich (handlowych) w ciągu ostatniej dekady i dłużej. Dokładne dane sprzedaży dotyczące samodzielnego publikowania pozostają ukryte - łatwo jest zignorować jego znaczenie. Jednak dostępne dane pokazują, że samodzielne publikowanie zajmuje znaczną część rynku wydawnictwa handlowego.

Jak zauważył CEO Kobo Michael Tamblyn (dość) słynnie, „Jedna na 4 książki, które sprzedajemy w języku angielskim, to tytuł samodzielnie wydany, co oznacza, że w praktyce, dla nas, samodzielne publikowanie jest jak posiadanie całego innego Penguin Random House na rynku, którego nikt nie widzi. To jak ciemna materia wydawnictwa.”

Trendy w rynku samodzielnego publikowania są prawdopodobnie jedynymi znaczącymi trendami w wydawnictwie handlowym. Samodzielnie publikujący autorzy wskazują drogę. Są odważni i nie są ograniczeni zwyczajami tradycyjnej branży. Wielu z nich jest biegłych w mediach społecznościowych. Są blisko swoich czytelników, swoich klientów. Jeśli chcesz nauczyć się najnowszych technik marketingowych, śledź fora autorów fora, blogi i newslettery.

Zagłęb się w statystyki dochodów autorów, ekonomię pisania, a następnie porównaj spadek dochodów autorów publikujących tradycyjnie z wzrostem dochodów autorów samopublikujących się. W międzynarodowym badaniu i raporcie, który przeprowadziłem wraz ze Steve’em Sieckiem dla ALLi w 2023 roku (pdf), odkryliśmy, że “mediany dochód z pisania i samopublikowania się wszystkich respondentów w 2022 roku wyniósł 12,749 dolarów, co stanowi wzrost o 53% w porównaniu do poprzedniego roku. Średnie dochody (średnia arytmetyczna) były znacznie wyższe: 82,600 dolarów w 2022 roku, co stanowi wzrost o 34%.”

W odrębnym badaniu, przeprowadzonym przez Petera Hildick-Smitha dla Authors Guild, “pełnoetatowi autorzy samopublikujący się, którzy publikowali co najmniej od 2018 roku, zgłosili średni dochód w wysokości 24,000 dolarów w porównaniu do 13,700 dolarów w 2018 roku, co stanowi wzrost o 76 procent.”

Wydawcy hybrydowi

Dla pełnej dokładności chcę również wspomnieć o wydawcach hybrydowych. Coraz bardziej entuzjastycznie podchodzę do modelu hybrydowego, a segment wydawnictw hybrydowych jest znaczący i rośnie. Nikt nie szacuje osobno sprzedaży hybrydowej. Ale wpływ ten jest najjaśniej widoczny w ich dominacji w dwóch kategoriach: książki celebrytów i popularne książki biznesowe. Te kategorie od dawna stanowiły niezawodne źródła dochodów dla wydawców handlowych, ale “usługi concierge” wydawców hybrydowych i znacznie korzystniejszy podział dochodów są nieodparte dla wielu autorów o wysokim profilu.

Niedawne przypadki, takie jak podział zysków Authors Equity z jego autorami, oraz podział zysków Keili Shaheen 50/50 z Simon & Schuster, sugerują trend w kierunku normalizacji modelu hybrydowego. To dobra wiadomość dla autorów; mniej obiecująca dla tradycyjnych wydawców.

Wydawanie poza wydawcami

Współtworzę raport z Rüdigerem Wischenbartem, oparty na jego oryginalnym badaniu “Publishing Beyond Publishers.” Staramy się jak najlepiej zrozumieć i oszacować całą działalność wydawniczą dotyczącą książek na całym świecie, która mogłaby (i powinna) być uwzględniona jako część bardziej kompleksowego spojrzenia na współczesną ekosferę wydawniczą.

Gdy wyjdziesz poza książkowe ramy, znajdziesz przebłyski, gdzie AI mogłaby naprawdę wywrzeć wpływ.

Naszym sztandarowym przykładem jest Wattpad, gdzie “97 milionów ludzi spędza ponad 23 miliardy minut miesięcznie, angażując się w oryginalne opowieści.” Historie są doświadczane online, głównie na smartfonach, w krótkich fragmentach. Niewiele z nich staje się opublikowanymi książkami. Są równie prawdopodobne, że znajdą drogę do “Wattpad WEBTOON Studios, odpowiedników firmy zajmujących się telewizją, filmem i wydawnictwami.”

Młodsi czytelnicy są bardziej dostrojeni do czytania cyfrowego online niż ich starsi bracia. Według badania Wattpad z stycznia 2024, “formaty cyfrowe są coraz bardziej popularne wśród młodszych pokoleń, z 65% pokolenia Z i 71% Millenialsów akceptujących webnowele, ebooki i webkomiksy, podczas gdy mniej niż połowa pokolenia X i Boomerów mówi to samo.”

I oczywiście, jak teraz uczy się tradycyjny przemysł wydawniczy: “Różnorodność jest kluczowym czynnikiem przyjmowania formatów cyfrowych: 61% pokolenia Z i 70% Millenialsów zgadza się, że ebooki, webnowele i webkomiksy dają im dostęp do treści, które są trudniejsze do znalezienia w księgarniach i bibliotekach, w tym treści LGBTQ+ i skoncentrowanych na mniejszościach.”

Wattpad ma konkurentów, w tym Inkitt, który, według Publishers Weekly, niedawno pozyskał 37 milionów dolarów od inwestorów “w tym Stefana von Holtzbrincka, właściciela Holtzbrinck Publishing Group, do której należy Macmillan, oraz byłego CEO Penguin, Michaela Lyntona; w sumie zgromadził już 117 milionów dolarów inwestycji. W lutym 2023 roku Financial Times powiedział, że Inkitt był ósmą najszybciej rozwijającą się firmą w Europie i numerem 1 w Niemczech.” Artykuł w Esquire z 9 lipca opisał wykorzystanie AI przez Inkitt oraz jego rolę w ich sukcesie.

Ilu z was słyszało o Inkitt, odwiedziło jego platformę wydawniczą lub pobrało jego aplikację do czytania Galatea?

Ale nasz raport “Publikowanie poza wydawnictwami” wykracza poza internetowe platformy opowieści, aby rozważyć, jak “treść może być tworzona i rozpowszechniana w różnych formatach (druk, cyfrowy), mediach (książki, audio, filmy, gry), kanałach dystrybucji (społeczności, platformy, strumienie) i modelach biznesowych (sprzedaż produktów, subskrypcje, streaming, freemium, płatne modele) w głównie cyfrowo zdefiniowanych łańcuchach dostaw i marketingu.” Ile możliwości tracą wydawcy książek, ponieważ nie pasują one do ich obecnych modeli biznesowych?

Innowacje, technologia i wydawnictwo książkowe

Z wyjątkiem ebooków, nowoczesne wydawnictwo nigdy nie stanęło w obliczu zagrożenia ze strony technologii. (Cyfrowe audiobooki zostały przyjęte bardziej z radością niż z niepokojem.) Świt ery internetowej przyniósł wydawcom więcej możliwości niż zagrożeń; to tylko jeden sprzedawca, Amazon, wspierany przez Internet, który wywrócił całą branżę.

Nigdy nie widziałem badania na temat tego, czy Amazon był (kiedy wszystkie aspekty jego działalności i wpływu są w pełni uwzględnione) netto pozytywny dla branży wydawniczej. Dociera do wielu kupujących, którzy nie są obsługiwani przez sklepy stacjonarne, i jest gotów poświęcić marżę, aby utrzymać niskie ceny. Ebooki i audiobooki są dostarczane na dużą skalę. Ale Amazon jest w stanie obniżać ceny częściowo dlatego, że wymaga wysokich rabatów i opłat od dostawców, i dusi inne kanały detaliczne. Istnieją bolesne kompromisy.

Mimo wszystko, nie próbuj krytykować Amazona przed autorem publikującym samodzielnie. Nie byliby w biznesie bez The Everything Store.

Dylemat innowatora

Aby uzyskać perspektywę na nadchodzący wpływ AI na wydawnictwo książkowe, polecam książkę Claytona Christensena The Innovator’s Dilemma: When New Technologies Cause Great Firms to Fail, po raz pierwszy opublikowaną w 1997 roku przez Harvard Business Review Press.

Christensen bada, jak istniejące (obecne na rynku) firmy mogą ulec siłom innowacji.

Sukcesywnie zarządzane firmy często zawodzą, gdy w ich branży pojawiają się destrukcyjne zmiany. Konwencjonalne praktyki zarządzania, które pomogły im stać się liderami branży, utrudniają tym firmom bycie zwinnymi w konfrontacji z technologiami destrukcyjnymi, które mogą kannibalizować ich rynki.

Ignorują produkty powstałe w wyniku technologii destrukcyjnych, ponieważ na pierwszy rzut oka wypadają one słabo w porównaniu do ich istniejących produktów. Ich najbardziej dochodowi klienci zazwyczaj nie mogą korzystać z rzekomych innowacji i ich nie chcą. Firmy próbują zwalczać destrukcyjne zagrożenia, podwajając wysiłki na rzecz istniejących produktów i usług.

Kluczowym wglądem Christensena jest to, że robiąc pozornie ‘właściwą’ rzecz, w tym słuchając klientów, odnoszące sukcesy firmy pozostawiają się otwarte na destrukcyjną innowację. Skupiają się na swoich obecnych klientach i ignorują ważne nowe technologie, które początkowo celują w małe, mniej dochodowe rynki. Tworzy to otwarcie dla zwinnych startupów, które mogą zburzyć liderów.

Chris Dixon, w dyskusji na temat książki, zauważa, że “powodem, dla którego wielkie nowe rzeczy wymykają się obecnym firmom, jest to, że następna wielka rzecz zawsze zaczyna się od bycia odrzuconą jako ‘zabawka’.” Hmm, tak, wielu ludzi widzi Chat AI jako zabawkę.

Czy wydawcy nie dostrzegają, że innowacje zbudowane z generatywnym AI mogą zakłócić ich kruchy model biznesowy?

Fikcja kontra literatura faktu

Wpływ AI na publikowanie książek z pewnością będzie miał dramatycznie różny wpływ na publikowanie fikcji niż na literaturę faktu.

Przemysł wydawniczy nie jest często analizowany jako dwa rozdzielone sektory, jeden, który publikuje książki fikcyjne, i drugi, który publikuje literaturę faktu.

Chociaż większość wydawców handlowych oferuje zarówno tytuły fikcyjne, jak i literaturę faktu, różnica między tymi dwoma formami w całej branży jest wyraźna zarówno pod względem liczby publikowanych tytułów, jak i sprzedaży książek. Szacunki różnią się, ale tytuły fikcyjne stanowią tylko około 10% książek publikowanych każdego roku. Sprzedaż jednak zdecydowanie faworyzuje fikcję. Znowu, są zmiany rok do roku, ale fikcja zdobywa około połowy rocznej sprzedaży książek handlowych. W zeszłym roku 21 z 25 najlepiej sprzedających się książek to były fikcje. Korzystając z kompilacji Wikipedii, z książek w języku angielskim, które kiedykolwiek sprzedały się w nakładzie 20 milionów egzemplarzy lub więcej, 84% to tytuły fikcyjne.

Trendy sprzedaży książek są notorycznie kapryśne, ale sprzedaż fikcji wydaje się być na ciągłej ścieżce wzrostowej. Po osiągnięciu najniższego poziomu 32% w 2019 roku, zdobyły 40% rynku dorosłych w 2022 roku i ponownie nieznacznie wzrosły w 2023 roku. Sprzedaż fikcji dla dorosłych wzrosła o dodatkowe 6,3% w pierwszej połowie 2024 roku.

Chociaż AI będzie coraz częściej używane przez autorów fikcji do wspomagania procesu tworzenia, jak omówiono gdzie indziej, wydaje się mało prawdopodobne, aby historie generowane przez AI zdominowały półki bestsellerów. Osiągnięcie „wystarczająco dobrej” jakości dla niektórej literatury gatunkowej jest możliwe, ale znowu nie jest to coś, co powinno spędzać sen z powiek autorom i wydawcom.

Natomiast pisanie i publikowanie literatury faktu będzie wspierane i wspomagane przez AI na całej linii. To już się dzieje. Autorzy literatury faktu korzystają z licznych talentów Sztucznej Inteligencji Chat zarówno jako asystenta badawczego, jak i pomocnika w pisaniu. A wydawcy literatury faktu będą coraz częściej korzystać z pomocy Sztucznej Inteligencji Chat w rozwoju rękopisów, sprawdzaniu faktów, redakcji, marketingu i dystrybucji.

Czy istnieje egzystencjalne zagrożenie dla autorów?

Rozmawiałem z bardzo bystrym agentem autora, który dużo myślał o tym, co AI oznacza dla jej klientów i dla wszystkich profesjonalnych autorów. Rozmowa zeszła na temat książki jako „pojemnika”, i poprosiłem ją, aby rozwinęła ten pomysł. Jej odpowiedź:

„Podstawowa idea jest taka, że kiedy autorzy/agenci umieszczają książkę u wydawcy, jest to po prostu: książka. Istnieje zrozumienie, że później może stać się jednym z wielu rodzajów dzieł pochodnych, które znamy (tłumaczenie, adaptacja dramatyczna, powieść graficzna itp.), ale wszystko to jest drugorzędne w stosunku do ‘Dzieła’ samego w sobie. Dzieło nie jest workiem słów czy fraz czy faktów, jest to coś ustrukturyzowanego przez autora w sposób unikalny dla tego autora. Rozbicie pojemnika, potrząśnięcie torbą z literami Scrabble i wyciągnięcie losowego wyboru (który nie jest całkowicie losowy, ponieważ jest to torba Scrabble składająca się ze składni, semantyki i stylu konkretnego autora), nie jest tym, co jest brane pod uwagę, gdy udzielamy prawa wydawcy.

“Książka jest integralną całością, która jest większa niż suma jej części. Jest produktem kreatywnego olśnienia (i masy twórczej pracy intelektualnej), które zebrały wszystko razem jako książkę, nie tylko ‘książkę’, ale książkę tego konkretnego autora.”

Książki zawierają skarby

Kiedy myślę o książkach non-fiction, przełamywanie pojemnika jest jednym z atutów ery AI. Przełamujesz pojemnik, a jak jaja Fabergé, w środku znajdują się skarby.

Ograniczenia pojemnika są jednocześnie zaletą i wadą. Z jednej strony “dzieło nie jest tylko workiem słów, fraz czy faktów, jest czymś ustrukturyzowanym przez autora w sposób unikalny dla tego autora.” Z drugiej strony, tworząc pojemnik, autor z racji inherentnych ograniczeń książkowego pojemnika, był zmuszony redukować, odrzucać, przepisywać i rekonfigurować. Dzieło jest wypolerowane, ale jest destylowane, i pewne rzeczy zostały zgubione (podczas gdy inne zyskane) po drodze.

Ludzie nie czytają długich książek non-fiction częściowo dlatego, że są przyzwyczajeni do przeglądania wszystkich tekstów, które napotykają w sieci, w tym w swoich e-mailach. Nawet model “streszczenia książki” zawodzi - zamiast niestrawnej 250-stronicowej książki non-fiction dostajesz niestrawne 8-stronicowe streszczenie książki.

Książki są jak pudełka na lunch - wszystko w jednym miejscu. Ale ja chcę tylko ciasteczka.

Nie będzie łatwo ustalonym autorom zrzucić swoje kajdany. Ale mogą musieć się tego nauczyć, albo ryzykować zostanie przyćmionym przez nowe pokolenie wykwalifikowanych badaczy i pisarzy, którzy potrafią wyrażać siebie z lub bez formalnych pojemników, w zależności od potrzeby. Pojemniki narzucają zbyt wiele ograniczeń i limitów.

Sprowadza się to do tego, że biznes pisania nieodwracalnie się zmienił. To jak koniec skrybów. W tym przypadku nasi mnisi autorzy muszą wyjść zza swoich biurek i swojego pojemnikowego spojrzenia na książkę, i zaangażować się w formę i ze swoją publicznością.

Ach tak, dobrze znam odpowiedzi autorów: Ale ja jestem pisarzem, nie promotorem. Nie jestem na mediach społecznościowych. Nie mam zainteresowania faktycznym komunikowaniem się z moimi czytelnikami poza moją pracą i okazjonalnymi e-mailami oraz coraz rzadszymi wystąpieniami. Mam stronę internetową (ale, prawdę mówiąc, nigdy jej nie aktualizuję). Moja praca jest moim darem dla czytelników. Mogą zaakceptować moją pracę, lub ją odrzucić, ale nie dołączę do nich w ich salonach.

Cóż, możesz schować zwoje i atrament zrobiony z krwi gronostajów. Zawód “autora” teraz wymaga, abyś wyszedł zza biurka i spotkał swoich czytelników tam, gdzie mieszkają, w ich salonach i na ich stronach na Facebooku. Możesz tego żałować, jak tylko chcesz, gdy zamykamy twoje granty, twoje stanowisko i twoje możliwości publikacji. To jest nowy, odważny świat pisarzy i czytelników, bez wydawców, tych okropnych pośredników, którzy ciężko pracują, aby ulepszyć twoją pracę, ale ciągle przerywają twoje bezpośrednie połączenie z czytelnikami, ludźmi, którzy ją najbardziej cenią.

Żadne z tego nie wyklucza wspaniałych książek narracyjnych literatury faktu dotarcia do wyczulonej publiczności. Wręcz przeciwnie. Te książki mogą nadal błyszczeć. Wciąż będą bestsellery literatury faktu, choć ekonomia okaże się niemożliwa dla wszystkich poza najlepiej sprzedającymi się pisarzami. Obecny model nie musi zniknąć, aby nowy model mógł prosperować.

Myślę o tych wspaniałych książkach literatury faktu jako o ‘pięknych’. ‘Piękne’ jako pięknie napisane, starannie zredagowane, zaprojektowane z troską i rozwagą, oraz drukowane, z falistymi krawędziami, na papierze z certyfikatem FSC. Są sprzedawane w butikach.

Butiki te nazywane są “księgarniami”, ale mają wszystkie cechy butikowego handlu detalicznego - piękne przedmioty, starannie wybrane przez właściciela i menedżerów, trochę drogie, ale dla tych, którzy cenią takie przedmioty, warte swojej ceny.

Zadaniem większości autorów literatury faktu jest teraz wyjście poza pojemnik, a także poza wydawcę jako strażnika dostępu.

Zawartość w wielu mediach

Publiczność czytelnicza, szczególnie jej młodsze pokolenie, jest coraz bardziej “agnostyczna wobec mediów”. W poszukiwaniu rozrywki lub wiedzy mogą oglądać wideo na YouTube czy TikToku, serial na Netflixie, słuchać na Spotify, przewijać Instagram (“Insta”), nadrabiać wiadomości lub, okazjonalnie, czytać książkę.

(Uwielbiający książki mieszkańcy BookTok są cenioną grupą influencerów, ale mają skromny wpływ na rynek ogółem.)

Jednak model rynkowy wciąż skupia się na unikalnym pojemniku. Przemysł wydawniczy. Przemysł filmowy. Przemysł telewizyjny. Przemysł muzyczny.

Filmy to nie książki. Filmy na YouTube to nie filmy. Podcasty to nie audiobooki.

Te silosy nie były historyczną nieuchronnością, lecz wynikiem serii decyzji biznesowych podejmowanych przez potężne organizacje na przestrzeni czasu.

Nie jest trudno zakłócić model biznesowy oparty na jednym pojemniku.

Mimo swoich zdolności językowych, obecna generacja generatywnej sztucznej inteligencji działa z jeszcze większą brawurą, produkując dźwięki, obrazy i wideo. AI zapewnia tej książce audiobooki w wielu językach, obok 31 tłumaczeń ebooka. Nic z tego nie byłoby nawet w najmniejszym stopniu możliwe bez AI — ekonomia tradycyjnej produkcji nie ma dla mnie sensu.

Silosy kontenerowe

Twórcy treści są tradycyjnie szkoleni, aby doskonalić się tylko w jednym silosie kontenerowym. Mamy programy pisarskie, filmowe i muzyczne. Rzadko przychodzi nam do głowy, że kreatywni pisarze mogliby również podjąć „drobne” studia z zakresu filmu lub muzyki. Albo w programowaniu komputerowym czy w tworzeniu aplikacji.

Co się stało z transmedią? Gdzie są programy, które uczą twórców, jak być, jak to kiedyś określiło Apple, „Mistrzami Mediów Cyfrowych”?

Najlepsza treść zawsze wygra. Ale z czasem kontenery treści mają coraz mniejsze znaczenie. Pokolenie cyfrowe może nie jest obojętne na kontenery, ale jest elastyczne w ich używaniu. Większość treści odbierają cyfrowo, za pośrednictwem smartfonów. Druk będzie nadal znajdował odbiorców, ale nigdy więcej nie będzie już centrum uwagi.

„Wydawca przyszłości” również musi być elastyczny w kwestii kontenerów. Większość wzrostu w dystrybucji treści nie odbywa się za pomocą atramentu na papierze, ani słów w plikach EPUB. Wzrost popularności audiobooków nie jest przypadkiem, podobnie jak popularność YouTube i TikTok.

Większym wyzwaniem jest konieczność uczynienia nowej i istniejącej treści odkrywalnej, bez względu na jej formę, a następnie po odkryciu, przekształcenie świadomości w decyzję o zakupie.

Odkrywanie i konwersja

Problem odkrywania treści online jest z nami od dłuższego czasu; AI go nie stworzyła. Problem ten wielokrotnie podkreślał weteran branży Mike Shatzkin więcej niż raz. Jest tak wiele dostępnych tytułów w druku, a formaty cyfrowe pozwalają im pozostawać ciągle w druku. Miliony książek, które wyszły z druku, można znaleźć u sprzedawców książek używanych. Na dodatek co roku publikowane są dwa miliony lub więcej nowych książek, tylko w języku angielskim. AI pogorszy problem nasycenia, ale już jest poza kontrolą.

Algorytmy Amazona nie są bezinteresowne — robią bardzo dobrą robotę, wyświetlając to, co jest sprzedażne, książkę, którą najprawdopodobniej kupisz. Ta książka nie jest charakteryzowana jedynie przez jej wyniki sprzedaży. Sprzedała się najlepiej nie dlatego, że jakiś oszust zoptymalizował ogłoszenie online. Sprzedała się najlepiej, ponieważ była najlepsza, a zadowoleni czytelnicy powiedzieli innym, aby ją kupili, zarówno online, jak i osobiście. (Amazon zachęca do reklamy, która zniekształca jego algorytmy, co jest częścią enshittification platformy.)

Mówiłem wcześniej o metadanych. Konwersja jest tak samo kłopotliwa jak odkrycie. Czy sztuczna inteligencja może pomóc autorom przekształcić przeglądających w kupujących?

Przyszłość praw autorskich

Koncepcja praw autorskich została sprowadzona do absurdu przez sztuczną inteligencję. Nie chodzi o to, że ludzie nie chcą lub nie zasługują na ochronę swojej pracy – można argumentować, że zasługują na nią bardziej niż kiedykolwiek. I nie chodzi o to, że AI sprawia, że prawa autorskie są niewykonalne (przynajmniej w jakiejś formie, jeśli nie w obecnej formie).

Chodzi o to, że “ochrona praw autorskich” staje się również zasłoną, za którą znika twoja praca. Jeśli twoja książka nie może być referowana za pomocą rozmowy z ChatGPT, to de facto nie istnieje. Firmy zajmujące się AI będą licencjonować tylko crème de la crème treści. Nie potrzebują odtłuszczonego mleka.

Po co chronić coś, czego nie można znaleźć?

Tutaj problem z odkryciem może stać się katastrofą. Google świetnie radzi sobie z odkrywaniem książek tylko na podstawie ich metadanych. AI chce całego enchilada. W przeciwieństwie do tradycyjnych wyszukiwarek, AI nie odpowiada na zapytania użytkowników wyłącznie na podstawie abstrakcyjnych metadanych dotyczących dzieła.

Jednocześnie zmieniające się kontenery treści, inne niż całe książki, sugerują różne rodzaje wyzwań związanych z prawami autorskimi. Jeśli tekst książki może zmieniać się na bieżąco, w odpowiedzi na dane wejściowe czytelnika, to czym wtedy są prawa autorskie tekstu?

Pisarze i czytelnicy

Wydawcy potrzebują autorów; autorzy nie potrzebują wydawców.

Przyszłość wydawnictwa to intymna relacja między pisarzami a czytelnikami. Jest znacznie silniejsza niż relacja między pisarzami a wydawcami i czytelnikami a wydawcami. Wydawcy mogą być przeszkodą w relacji między pisarzami a czytelnikami. W wielu przypadkach nie umożliwiają tej relacji; utrudniają ją.

Przez długi czas jedynym sposobem dostępu do wysokiej jakości treści pisanej były książki lub skromny wybór czasopism. Obecnie to z pewnością nie jest już prawdą. Oprócz odciągających uwagę innych mediów, istnieje teraz tak wiele różnych sposobów dostępu do wysokiej jakości treści pisanej (niewykontenerowanej). Książki nie mają już tej przewagi, którą kiedyś cieszyły się.

AI może komunikować się

“Jaka jest idealna książka do przeczytania dla mnie?” Generatywna AI może odpowiedzieć na to pytanie z elokwencją i precyzją, która nigdy wcześniej nie była możliwa. W miarę jak AI staje się niezawodnym silnikiem rekomendacji, autorzy będą musieli komunikować się za jego pośrednictwem. (Amazon oczywiście nad tym pracuje, i ma korzyść w postaci wiedzy, co wcześniej kupiłeś.)

Zakończenie

Więc gdzie nas to zostawia?

Uznałem za konieczne skatalogowanie wyzwań, przed którymi staje wydawnictwo. Chat AI pojawia się w czasie, gdy wydawnictwo handlowe jest w tarapatach. Nie pojawia się w momencie, gdy branża jest stabilna i może powiedzieć: „nie potrzebujemy nowej technologii; radzimy sobie dobrze.”

Powyżej omówiłem najbardziej palące wyzwania, przed którymi stoi wydawnictwo: rosnące koszty i malejące marże.

Wilki nigdy nie będą nasycone swoimi żądaniami coraz większych rabatów; marże się nie poprawią. Ceny detaliczne są blisko sufitu. Przyszłość obecnego modelu wydawnictwa handlowego leży w redukcji kosztów.

Pensje nie mogą być niższe, więc będziemy musieli ciąć koszty w cyklu produkcyjnym.

Ale wydawcy starają się ciąć koszty produkcji od dekad. Było kilka znaczących sukcesów, ale wyczerpaliśmy obecne opcje.

Pokazałem, że AI może przynieść wydajności w wydawnictwie, na całym przepływie pracy. Nie są one natychmiastowe i nie są łatwe: trzeba pracować nad AI. Ale okazja jest.

Wydawcy nie szukają redukcji zatrudnienia, więc celem jest więcej książek szybciej trafiających na rynek, opartych na obecnych zasobach kadrowych. Narzędzia AI mogą wspierać ten cel.

I, oczywiście, zawsze jest cel sprzedaży większej liczby egzemplarzy publikowanych książek. AI może w tym również pomóc.

Powyżej opisuję, jak AI może także transformować przyszłość wydawnictwa.

Nie martw się o to. Doprowadź swoje sprawy do porządku, a porozmawiamy dalej.

Jedno źródło informacji

Obecnie dostępna jest niemal nieskończona ilość materiałów, które mogą pomóc Ci zrozumieć AI, zbyt wiele, oczywiście. Wybierz preferowane medium: książki, blogi, newslettery, filmy, podcasty, kursy i jasnowidzenie. W tej książce zamieściłem linki do kilku kluczowych źródeł, warto kliknąć kilka losowych linków, aby zobaczyć, dokąd Cię zabiorą.

Istnieje tylko jedna doskonała książka o AI dla początkujących, Co-Intelligence Ethana Mollicka, która została wydana na początku kwietnia 2024 roku. Jest oparta na jego równie doskonałym newsletterze, “One Useful Thing.”

Uwaga na marginesie: kwalifikacje do napisania tej książki

Nie chciałem obciążać wstępu tymi informacjami, ale jestem świadomy, że wielu ludzi jest sceptycznych wobec osób piszących dziś o AI, podejrzewając, że ci autorzy kreują się na współczesnych ekspertów od AI. Bez wątpienia niektórzy tak robią. Mam nadzieję, że posiadam wystarczające kwalifikacje, aby podjąć się tego projektu.

Przeczytałem swoją pierwszą książkę o sztucznej inteligencji w 1988 roku, książkę wydaną dwa lata wcześniej, Understanding Computers and Cognition: A New Foundation for Design autorstwa Terry’ego Winograda i Fernando Floresa. Książka jest gęsta — wiele z niej było poza moim zrozumieniem — ale to był pierwszy raz, kiedy podekscytowałem się możliwościami sztucznej inteligencji w wydawaniu książek.

Do tego czasu byłem głęboko zaangażowany w cyfryzację wydawnictw, spowodowaną wybuchem wydawnictw cyfrowych, komputerów Apple, PageMaker i tym podobnych. W 1986 roku nadzorowałem rozwój oprogramowania do automatycznego składu książek Page One, programu, który mógł wziąć rękopis książki jako plik Microsoft Word i złożyć go w całą książkę w ciągu kilku minut. Dziś jest to bardzo łatwe do zrobienia; wtedy nie było to łatwe.

Następnie kontynuowałem pracę w technologii wydawniczej jako konsultant i analityk, współpracując z niektórymi czołowymi dostawcami oprogramowania i sprzętu, w tym Adobe, Apple i Microsoft. Zostałem również zaangażowany i częściowo właścicielem firmy programistycznej o nazwie Enfocus. Stworzyliśmy zautomatyzowany system do przygotowania do druku.

Nie mieliśmy wtedy dostępu do AI, ale byliśmy bardzo dobrzy w uruchamianiu w pełni zautomatyzowanych systemów produkcji wydawniczej. Jak sztuczna inteligencja może być nieodróżnialna od magii, tak i najlepsza automatyzacja może wydawać się przypominać AI.

Przeskakując do 2016 roku, mój kolega Cliff Guren pomógł mi skupić się na AI w wydawaniu książek: zaczęło się wydawać, że coś się wreszcie dzieje. The Bestseller Code (Archer i Jockers) pojawiła się we wrześniu 2016 roku, jasno pokazując, że komputery mogą interpretować teksturę literatury z dużym wglądem i precyzją.

Do tego czasu uważnie przyglądałem się startupom wydawniczym, a niewielka liczba z nich pojawiła się z pewnym stopniem technologii AI wplecionej w ich oferty oprogramowania.

Przeskakując ponownie do października 2022 roku.

Miesiące zanim stało się to tematem, o którym wszyscy w wydawnictwie mówili, Tim O’Reilly zaprezentował się na konferencji PageBreak na temat “AI i Transformacji Wydawnictw.” O’Reilly jest dobrze znany w społeczności wydawniczej zarówno dzięki O’Reilly Media, jak i konferencji Tools of Change. Jest jednym z czołowych wizjonerów technologii.

O’Reilly nie tylko entuzjazmował się nowymi osiągnięciami w dziedzinie AI, był wręcz zachwycony. “Jesteśmy w punkcie bardzo podobnym do tego, jak czułem się, gdy odkryliśmy Globalną Sieć w 1992 roku,” powiedział, po czym dodał: “to jest tak samo transformujące jak VisiCalc, PC i przeglądarka internetowa.”

Przyznał, że (w tamtym momencie) przypadek użycia był jeszcze niejasny, wskazując na kilka projektów pilotażowych w O’Reilly Media. Ale, jak powiedział, “to się poprawia w zastraszającym tempie. Uczenie maszynowe to już nie jest przyszłość. To jest kwestia demokratyzacji AI.”

O’Reilly mówił o tym, jak wydawcy powinni podejść do tych nowych technologii, mówiąc, że muszą “wiedzieć, kiedy spalić mosty i postawić wszystko na jedną kartę. Jest czas, kiedy trzeba się zaangażować.”

ChatGPT został wypuszczony dopiero miesiąc później. PageBreak była pierwszą konferencją wydawniczą, która postawiła ten temat na pierwszym planie, dzięki wglądowi Tima.

Ujawnienia

Ta książka ma pięciu sponsorów. Wiedziałem, pisząc książkę, że niewiele bogactwa można znaleźć, i zdecydowałem się wesprzeć swoje wysiłki, zapraszając sponsorów do udziału.

Jak wskazuję na mojej stronie internetowej, pracując jako konsultant, analityk i dziennikarz, wspieram Międzynarodową Federację Dziennikarzy Globalną Kartę Etyki Dziennikarzy. Paragraf 13 wyraźnie mówi o obowiązku unikania konfliktów interesów lub “jakiegokolwiek zamieszania między (moją) działalnością a reklamą lub propagandą.”

Posiadanie sponsorów implikuje konflikt interesów i zamieszanie wokół reklamy. Gdybym pracował dla New York Times, byłoby to proste: “Nie.” Pracując dla siebie, ujawnienie jest moją bronią do spełnienia tych obowiązków: opiszę otrzymane wynagrodzenie, a wy możecie ocenić, czy zostałem skompromitowany w mojej pracy.

Wybrałem sponsorów, których zaprosiłem do tego projektu, ponieważ znałem nie tylko ich pracę, ale i osoby zaangażowane w ich organizacje. To są koledzy i przyjaciele. Powiedziałem im, że ich produkty mogą być omawiane w tekście tej książki i że nie będą mieli kontroli nad tymi słowami. To, co mogliby kontrolować, to ich reklamy na końcu książki - zamieszczę je tak, jak zostały dostarczone. I tak właśnie zrobiłem.

Otrzymałem płatności od innych, które mogły wpłynąć na moją pracę nad tą książką - mogę katalogować następujące:

  • Nie wykonywałem żadnej płatnej pracy konsultingowej dla dostawców AI opisanych w tej książce, w tym sponsorów.

  • Otrzymałem dochody z podziału zysków od Publishers Weekly za webinaria AI we wrześniu 2023.

  • Otrzymuję standardowe wynagrodzenie za moje artykuły w Publishers Weekly.

Proszę dajcie mi znać, jeśli zauważycie jakiekolwiek faworyzowanie, które mogło wynikać z tych zaangażowań. Moje uprzedzenie na korzyść AI wykształciło się przed napływem ogromnych bogactw.

Podziękowania

Nie mógłbym mówić z jakąkolwiek wiarygodnością o AI, gdyby nie wsparcie Publishers Weekly, w tym redaktora emeritusa, Jima Milliota, oraz CEO, Cevina Bryermana. Jim wspierał moje wczesne pisanie o AI, a Cevin (wraz z Kristą Rafanello i resztą zespołu) byli kluczowi dla sukcesu zeszłorocznej konferencji, AI and the Revolution in Book Publishing. Andrew Albanese jest teraz redaktorem naczelnym w PW; Ed Nawotka, starszym redaktorem. Mam szczęście, że mogę z nimi współpracować.

I dalsze podziękowania dla licznych kolegów…

  • Peter Brantley

  • Cliff Guren, wieloletni partner do dyskusji i wnikliwy czytelnik moich wersji roboczych

  • Dwóch innych czytelników wersji ‘beta’, którzy udzielili cennych uwag: Joe Wikert i Brad Farmer

  • Moi Publishing Technology Partners, Ken Brooks, Bill Kasdorf, Bill Rosenblatt, Bill Trippe, Steve Sieck, i nasi najnowsi partnerzy, Lettie Conrad i Linda Secondari.

  • Moja siostra, Anne Pashley, która pomaga mi utrzymywać aktualną bazę danych startupów wydawniczych i nieustannie dodaje energii moim wysiłkom.

  • Moi partnerzy w moich miesięcznych webinariach AI: Brooke Horn i Brian O’Leary z BISG.

  • Bill Kasdorf pomógł mi zgłębić kwestie dostępności mojej książki.

  • Peter Armstrong i Len Epp z Leanpub mieli cierpliwość do moich drobnych uwag i pomogli mi przejść przez proces oferowania najlepszego możliwego wyniku na platformie Leanpub.

  • Hugo Rayne z ElevenLabs za wsparcie audiobooka.

  • Mój dobry przyjaciel i niezawodny wykrywacz moich pisarskich i rozumowych potknięć, Bob McArthur.

Dodatek: Badanie pozostałych zalet tradycyjnego wydawnictwa

Prestiż tradycyjnego wydawnictwa jest powodem, dla którego większość z nas dołączyła do branży. Dorastaliśmy kochając książki, poszliśmy studiować anglistykę lub coś podobnego na studiach, trochę się tułaliśmy, może dostaliśmy pracę w księgarni, może zdobyliśmy certyfikat Magistra Wydawnictwa, a potem pracowaliśmy jako stażyści w wydawnictwie, i oto jesteśmy dzisiaj. Kochasz swoją pracę, chociaż płaca jest kiepska, a warunki pracy nie zawsze są przyjemne.

Ten sam prestiż napędza łańcuch dostaw wydawniczych. Po stronie wejściowej łańcucha dostaw: to wiele znaczy dla wielu autorów. Widzimy to cały czas. Ekonomia tradycyjnego wydawnictwa nie ma sensu, a wejście do druku zajmuje cztery razy dłużej, ale może, po prostu może, będę następnym debiutantem zwycięzcą, jak Delia Owens (Gdzie śpiewają raki) lub drugim czasem megagwiazdą, jak Amor Towles (Dżentelmen w Moskwie).

To jak w Vegas: z tym że szanse są lepsze w Nevadzie. Zagraj pojedynczy numer w ruletce, a szanse przeciwko tobie wynoszą 36 do 1. Graj w tradycyjne wydawnictwo, a szanse przeciwko tobie są… znacznie gorsze.

Szanse na uzyskanie kontraktu z jakimkolwiek z tradycyjnych wydawców, nie mówiąc już o jednym z wielkiej piątki, są marne. Ale to najmniejszy problem autora. Prawdziwym wyzwaniem jest znalezienie czytelników.

Jednym z rzeczy, które mogą pomóc, jest zdobycie miejsca na liście bestsellerów.

Rozważmy PRH, Penguin Random House. Firma wydaje tylko 15 000 nowych tytułów rocznie. W 2021 roku udało im się umieścić 196 książek na liście bestsellerów Publishers Weekly. Jak podkreśla powiązany artykuł: “PW publikuje cztery listy bestsellerów dla dorosłych, każda z 20 tytułami: beletrystyka w twardej oprawie, literatura faktu w twardej oprawie, literatura w miękkiej oprawie i literatura w miękkiej oprawie na rynek masowy. Oznacza to, że w ciągu roku na naszych listach jest 2080 pozycji w twardej oprawie i 2080 pozycji w miękkiej oprawie.

Nie wszystkie bestsellery były nowo wydane w tym roku - załóżmy hojnie, że 90% z nich było, co daje 1870 miejsc.

Tymczasem The New York Times ma 15 miejsc na listach bestsellerów tygodniowo dla każdej kategorii książki (beletrystyka, literatura faktu, książki dla dzieci; oddzielne listy dla młodzieży i poradników; twarda okładka oddzielona od miękkiej, plus listy łączone). Dla pojedynczego autora oznacza to 780 dostępnych miejsc rocznie, choć większość z tych miejsc jest zajmowana przez powtarzających się sprzedawców. (The Body Keeps the Score autorstwa Bessela van der Kolka jest na liście książek w miękkiej okładce od pięciu i pół roku!) Więc podzielmy to na pół, 390 dostępnych miejsc. Musisz sprzedać wiele książek, aby zdobyć jedno z tych miejsc.

A co z recenzjami w New York Times Book Review? W 2016 roku Pamela Paul, ówczesna redaktorka Review, twierdziła, żeThe Book Review w Times recenzuje około 1% książek, które wychodzą w danym roku.” Oczywiście ma na myśli 1% książek od czołowych wydawców - nie może myśleć o małych wydawnictwach czy autorach self-publishingowych. I tak może około 150 z 15 000 nowych tytułów PRH jest recenzowanych każdego roku.

Większość obserwatorów zgadza się, że choć zwrócenie uwagi czołowych mediów jest nadal ważne i może być potężne, wpływ recenzji nie jest taki jak kiedyś, choćby z tego powodu, że mniej czytelników książek wchodzi w interakcje z głównymi źródłami recenzji.

Skupmy się teraz na łańcuchu dostaw, na dystrybucji. Podczas gdy marki wydawców mają znaczenie dla autorów, zawsze było prawdą, że, w przeciwieństwie do wielu dóbr konsumpcyjnych, marki wydawców mają niemal żadne znaczenie dla kupujących książki i czytelników. Ale mają duże znaczenie dla dystrybutorów i księgarzy. To odzwierciedla historyczny charakter B2B wydawnictwa (zamiast B2C - do konsumentów). Renoma wydawcy jest rozpowszechniana przez kanały dystrybucji i sprzedaży detalicznej: Barnes & Noble nosi książkę, ponieważ pochodzi z PRH, a następnie umieszcza ją przed oczami kupujących; w ten sposób renoma jest rozpowszechniana wśród czytelników.

Sponsorzy

Baner, który mówi 'BOOK ADVISORS LLC Usługi transakcyjne i doradcze dla wydawców'.

David Lamb i Susan Reich założyli Book Advisors LLC w 2016 roku, aby doradzać w zakresie fuzji i przejęć w branży wydawniczej. Zrealizowaliśmy ponad tuzin transakcji, a także różne projekty finansowe, dystrybucyjne i operacyjne, w tym wyceny rynkowe. Z przyjemnością informujemy, że ostatnio współpracowaliśmy z Clarke & Esposito; Thad McIlroy z The Future of Publishing; oraz Kuo-Yu Liang z Ku Worldwide.

Jesteśmy dumni z naszych relacji, staranności i dyskrecji. Jeśli jesteś zainteresowany kupnem, sprzedażą, finansowaniem lub konsultingiem, skontaktuj się z nami w celu poufnej rozmowy.

bookadvisorsllc.com | bookadvisors@gmail.com

Siatka 3x2 banerów: Baner ogłaszający, że Papercutz został przejęty przez Mad Cave Studios w sierpniu 2022 roku, we współpracy z Ku Worldwide LLC; Baner ogłaszający, że DAW Books został przejęty przez Astra Publishing House w lipcu 2022 roku, we współpracy z Ku Worldwide LLC; Baner ogłaszający, że Caslon Publishing został przejęty przez Brookes Publishing Co. w kwietniu 2022 roku, we współpracy z Thad McIlroy; Baner ogłaszający, że B.E.S. Publishing został przejęty przez Sourcebooks w listopadzie 2021 roku; Baner ogłaszający, że Applewood Books został przejęty przez Arcadia Publishing w kwietniu 2023 roku; Baner ogłaszający, że Erewhon Books został przejęty przez Kensington Publishing w październiku 2022 roku
Logo Firebrand Technologies i NetGalley.

Firebrand Technologies to firma oferująca oprogramowanie i usługi, która od ponad 35 lat wspiera wydawców książek w zarządzaniu danymi i procesami pracy.

NetGalley to platforma online, która łączy wydawców i autorów z recenzentami, bibliotekarzami, księgarzami, mediami i edukatorami, którzy odkrywają nowe książki na NetGalley i polecają je swoim odbiorcom.

Jako twórcy oprogramowania i rozwiązań cyfrowych, Firebrand Technologies i NetGalley są również ekspertami branżowymi i aktywnymi członkami społeczności wydawniczej. Nasze rozwiązania przynoszą korzyści we wszystkich aspektach procesu wydawniczego, od akwizycji aż po sprzedaż i marketing.

  • NetGalley pomaga wydawcom budować rozgłos wokół tytułów, otrzymywać szybkie opinie i recenzje oraz odkrywać wczesne trendy.

  • Title Management Enterprise, wraz z jego kompaktową wersją, Title Management Lite, jest główną aplikacją Firebrand, która zapewnia zaawansowane zarządzanie procesami wydawniczymi na każdym etapie procesu publikacji.

  • Eloquence on Demand to najpotężniejsza platforma dystrybucji ONIX w branży wydawniczej, dystrybuująca metadane i zasoby cyfrowe do ponad 600 partnerów handlowych w formatach ONIX i innych.

  • Flywheel to usługa marketingu backlist, która identyfikuje ukryte możliwości zwiększenia widoczności i sprzedaży w backlist.

  • Eloquence on Alert monitoruje dane o tytułach na żywo i trendy na rynku, ostrzegając wydawców o krytycznych błędach i możliwościach, które mogą wpłynąć na sprzedaż (brakujące przyciski “kup teraz”, sprzedawcy zewnętrzni itd.).

  • FlightDeck to najbardziej zaawansowane narzędzie do walidacji i testowania EPUB dostępne na rynku.

Infografika pokazująca różne usługi oferowane przez NetGalley, w tym promocję książek, zarządzanie procesami wydawniczymi, dystrybucję metadanych, sprzedaż i marketing backlist oraz testowanie EPUB.
Baner Perfect Bound, rynku łączącego wydawców z drukarniami na całym świecie.

Witamy w lepszym sposobie drukowania książek.

Perfect Bound został stworzony w 2022 roku, aby pomóc rozwiązać problemy z łańcuchem dostaw, które od lat nękają branżę wydawniczą. Okresy nadmiaru zdolności produkcyjnych w drukarniach są przeplatane krótkimi oknami opóźnień spowodowanych problemami z dostawami. Perfect Bound dąży do otwarcia rynku drukarskiego dla niezależnych wydawców i autorów, umożliwiając drukarniom z całego świata łatwe nawiązanie współpracy z wydawcami poszukującymi nowych i dynamicznych dostawców.

Czym jest Perfect Bound?

Perfect Bound to dwustronny rynek, który łączy niezależnych wydawców książek z drukarniami w USA, Kanadzie, Kolumbii, Brazylii, Turcji, Chinach, Malezji, Indiach i innych krajach.

Ilustracja prasy drukarskiej z różnymi typami książek i publikacji produkowanych.

Odkryj nowych partnerów wydawniczych jednym kliknięciem

Nasza solidna platforma umożliwia proste tworzenie wycen produktów, wysyłanie zapytań do setek drukarzy jednym kliknięciem, negocjacje i finalizację nakładów drukarskich oraz śledzenie produktów od drukarni do magazynu. Jako drukarz, łączenie się z nowymi wydawcami, składanie ofert na nadchodzące projekty i otrzymywanie płatności nigdy nie było łatwiejsze ani bardziej bezpieczne.

Łącz się z nowymi partnerami wydawniczymi natychmiastowo

  • Wysyłaj i odbieraj zapytania drukarskie z całego świata

  • Realizuj i śledź nakłady drukarskie od drukarni do magazynu

  • Dokonuj transakcji bezproblemowo za pomocą płatności ACH przez Stripe, nie opuszczając platformy

Reklama Shimmr prezentująca zautomatyzowaną reklamę sprzedającą książki, wspominająca o 35% wzroście sprzedaży i 2x lepszym zwrocie z inwestycji w reklamy.
Reklama Shimmr z przykładowymi reklamami, informacjami o cenach i kodem QR do umówienia się na demo.

Poznaj Insight, platformę SI stworzoną specjalnie dla wydawców

Zbliżenie na osobę trzymającą otwartą książkę z emitującymi się z jej stron jasnymi elementami.

“Wdrożenie Insight w naszym wydawnictwie było jak zamiana roweru na Ferrari. Nagle wszystko działa szybciej.”

—-Niemiecki wydawca książek dla dzieci i klient Insight

Pracuj mądrzej, osiągaj więcej

Opracowana przez Veristage, Insight umożliwia wydawcom odniesienie sukcesu w rozwijającym się krajobrazie SI. Korzystając z SI i solidnego pakietu narzędzi cyfrowych, Insight analizuje i rozumie Twoje dokumenty i książki, aby pomóc Ci:

  • Tworzyć, ulepszać i odświeżać metadane

  • Przyspieszać tworzenie materiałów marketingowych, publicystycznych i sprzedażowych specyficznych dla tytułu

  • Identyfikować i oceniać kluczowe wiadomości książki, unikalne cechy sprzedażowe, grupę docelową, tytuły porównawcze i więcej

  • Optymalizować treści marketingowe i sprzedażowe dla maksymalnego zasięgu, zaangażowania i zwiększonej sprzedaży

W przeciwieństwie do ogólnych platform SI, Insight jest zaprojektowany do funkcjonowania w ramach procesów wydawniczych i pomaga tworzyć informacje i zasoby specyficzne dla wydawnictw.

Jak to działa

  1. Prześlij swoją książkę na platformę Insight

  2. Narzędzia AI Insight analizują i rozumieją Twoją książkę

  3. W ciągu kilku minut Insight generuje szeroki zakres metadanych i kluczowych informacji o Twojej książce dla działów redakcyjnych, marketingowych, reklamy, sprzedaży i praw

  4. Wprowadź ręczne poprawki do którejkolwiek z tych informacji bezpośrednio na platformie. Twoja książka i zawartość AI są zapisywane w Insight, więc masz do nich dostęp w każdej chwili.

  5. Użyj naszego AI Chat, świadomego dokumentów, aby zoptymalizować informacje o tytule, interakcję z książkami i włączanie szczegółów książki do komunikacji i innych materiałów

Bezpieczeństwo i prawa autorskie

Zespół Veristage jest zaangażowany w świadczenie usług AI, które są bezpieczne i chronią własność intelektualną wydawców. Nasza platforma posiada zaawansowane systemy bezpieczeństwa informacji i współpracujemy tylko z modelami AI, które nie przechowują ani nie wykorzystują Twoich danych do trenowania przyszłych modeli.

Rozwiązania dla wydawców każdej wielkości

Insight został zaprojektowany, aby działać dla wydawców każdej wielkości, od konsumenckich po akademickie, od zespołów trzyosobowych po międzynarodowe organizacje. Oferujemy konkurencyjne ceny i skalowalne rozwiązania.

Porozmawiaj z nami, aby dowiedzieć się, jak Insight może przynieść korzyści Twojej firmie:

Logo Veristage w kolorze niebieskim z abstrakcyjnym wzorem.