A mesterséges intelligencia forradalma a könyvkiadásban (Magyar Kiadás)
A mesterséges intelligencia forradalma a könyvkiadásban (Magyar Kiadás)
Thad McIlroy
Buy on Leanpub

Tartalomjegyzék

Bevezetés

“A következő forradalom mindannyiunkat váratlanul ér, mint mindig. Másként fogalmazva: ha a tömeg előre látja a forradalmat, akkor az nem lehet forradalom.” —Doc Searls, 2002

Több mint másfél év telt el azóta, hogy az OpenAI bemutatta a ChatGPT-t egy olyan közönségnek, amely többnyire nem volt ismerős a mesterséges intelligenciával. Kezdetben úgy tűnt, hogy nincs nyilvánvaló jelentősége a könyvkiadás számára. Azóta minden megváltozott. És semmi sem változott. A kiadók kezdik felfedezni az új AI eszközöket, a széleket kutatva, és óvatos beszélgetéseket folytatva a ChatGPT-vel. De nincs jele a kiadás gyakorlatában bekövetkező valódi forradalomnak; egyszerűen túl korai még.

Rengeteg bizonytalanság övezi a mesterséges intelligenciát az írásban és a kiadásban. Jelentős viták vannak az AI használata körül. Mégis, sokak számára izgalmasak a lehetőségek.

Itt inkább az ígéretre fogok koncentrálni, mint a veszélyre, de áttekintést nyújtok az AI-vel kapcsolatos aggodalmakról és kockázatokról is, különösen, ahogy azok az írókra és kiadókra vonatkoznak. Nem célom alábecsülni az aggodalmakat. Egyszerűen nem erről szól ez a könyv.

Ez egy könyv?

Ezt a kiadványt inkább egy ‘füzetnek’ tartom, mint könyvnek. Az UNESCO meghatározása szerint a könyv “legalább 49 oldal” (miért nem 50?), és 300 szó per oldal alapján ez nem biztos, hogy megfelelne. De ami még fontosabb, nem célja, hogy bármiről is végleges szót mondjon - inkább egy haladási jelentés. A mesterséges intelligencia és annak szerepe a könyvkiadásban szédítő gyorsasággal változik, és nem mutat lassulás jeleit. Tehát ez a könyv(let), ez a jelentés, csak egy pillanatkép.

A Leanpub platform használatával kutatásaimat és elemzéseimet folyamatban lévő munkaként adom ki - élő dokumentumként van felülvizsgálva. Ezt még soha nem próbáltam ki. Két okom van erre: hogy rövid távon hasznosat kínáljak, és hogy lehetőségem legyen szükség szerint felülvizsgálni. A mesterséges intelligencia története messze nem ért véget.

Remélem, hogy a megközelítésem hasznos lesz az olvasók számára, bár tisztában vagyok vele, hogy túl sok frissítés hamar bosszantóvá válhat. Igyekeztem csökkenteni ennek a könyvnek az időszerűségét, hogy csökkentsem a leggyorsabban változó dolgok fókuszát.

A verzió, amely április 2024 óta (csendben) elérhető, “75%-os kész” jelzéssel volt ellátva, és ingyenesen kínálták az olvasóknak. Július 23 az “100%-os kész” verzió hivatalos megjelenési dátuma, amely szélesebb terjesztésbe is kerül a Leanpubon kívül. Folytatni fogom az 100%-os verzió frissítését: de ezek a frissítések csak a Leanpub vásárlók számára lesznek elérhetők - nehézkes folyamatosan frissíteni a szélesebb körben terjesztett nyomtatott könyveket, e-könyveket és hangoskönyveket.

A kiadók fájdalma az AI-vel kapcsolatban

Napi szinten hallom, hogy az emberek a kiadói iparágban milyen fájdalommal küzdenek az AI megértése közben. Miért olyan fájdalmas ez? Íme három ok, amit látok:

  • A technológia bonyolult és rejtélyes, túl bonyolult ahhoz, hogy nem tudósok megértsék. (Van egy lenyűgöző tanulmány, amely egy “AI szorongási skálát (AIAS)” javasol, amely 21 különböző okot mér, ami miatt az emberek szoronganak az AI miatt.)

  • Az AI rendkívül vitatottá vált a kiadásban, főként a szerzői jogi kérdések miatt, amelyek az írás és a kiadás szívét érintik.

  • Mégis van egy FOMO - a kimaradás félelme - légköre is. Az AI számos hibája ellenére, mint sok csábító technológia (az Apple óra? Okoshangszórók?), szembesülünk azzal az érzéssel: mi van, ha lemaradok a következő igazán nagy dologról, mint néhány korábbi igazán nagy dologról. Akkor ostobának éreztem magam; nem akarom újra így érezni magam. Fáj.

Rendben: Értelmes, hogy a kiadói emberek AI fájdalmat éreznek.

Akkor mi a könyv használati esete?

A használati eset az, hogy a könyvkiadásban dolgozol, vagy író vagy, aki jobban meg akarja érteni a könyvkiadást, és eleged van abból, hogy butának és összezavarodottnak érzed magad az AI körül. Túl sok kollégád úgy tűnik, jobban érti, mint te, és unod, hogy nem tudsz intelligensen beszélgetni a témáról.

Az olvasók célja az, hogy a könyv végére képesek legyenek csatlakozni a beszélgetéshez, kifejezni egy tájékozott véleményt. Azt szeretném, hogy képesek legyél személyes döntéseket hozni a technológia körül, és legyen egy útja annak, hogy megtanuld használni az AI-t, ha úgy döntesz.

Nem akarom az olvasókat elárasztani sok-sok bla-bla szöveggel az MI technológia alapjairól - nem fogok sokat beszélni az MI-ről elvont értelemben. Ehelyett azt szeretném, hogy az MI-ről szóló ismereteket kifejezetten a könyvírásra és könyvkiadásra vonatkozóan adjam át. Ha valaki megkérdezi, mit is jelent valójában a természetes nyelvfeldolgozás, válaszolhat, ahogy én is szoktam: Nem vagyok MI-szakértő. De tudom, hogyan használják az MI-t az iparágamban.

Pontosan azt fogod megtudni, amit tudnod kell?

Nem szeretem a “amit tudnod kell” kifejezést, mert ritkán teljesíti az elvárásokat, gyakran messze elmaradva attól, amit valóban tudni kell, vagy éppen túl sokat nyújt. Vajon sikerülni fog nekem? Komolyan törekszem arra, hogy a minimumot közvetítsem. Úgy gondolom, tudom, mit kell a kiadóknak tudniuk az MI-ről, mivel sokukkal beszéltem, miközben szemináriumokat és webináriumokat tartottam, kifejezetten azért, hogy csak az alapokat nyújtsam.

An icon of a key

Ahelyett, hogy végtelenszer ismételném a “amit tudnod kell” kifejezést, egy kulcs szimbólummal fogok jelölni néhány behúzott szöveget.

A sok szakaszt bevezető összefoglaló után kibővítem a főbb fogalmakat. Ezeket is a lehető legrövidebbre fogtam, bár igaz, néha elkalandozom.

Egy rövidítést fogok használni, ez a “Csevegő MI.” Amikor az OpenAI először kiadta a ChatGPT-t, az egyedüli szereplő volt, de mostanra több fontos versenytársa is van. Részletesebben is kitérek majd rájuk, de nyilván hallottál már róluk, például a Google-ról és a Microsoft-ról. Ők (és több más cég is) most online MI csevegőszoftvert kínálnak, ami hasonló a ChatGPT-hez. Így ahelyett, hogy azt mondanám, “ChatGPT és versenytársai,” egyszerűen a “Csevegő MI” kategóriára hivatkozom. Ha “ChatGPT”-t írok, akkor kifejezetten az OpenAI szoftverére utalok.

A könyv többnyire gyakorlati jellegű, de az utolsó szakaszban egy esszét írok arról, hogy mi lehet az MI valós következménye a könyvkiadási iparágra, valamint néhány más spekulatív gondolatot is megosztok.

Kinek szól ez a könyv?

A könyv elsődleges célközönsége a kereskedelmi (fogyasztói) könyvkiadók. A másodlagos célközönség minden más könyvkiadó (tudományos, oktatási…), amennyiben vannak átfedések ezekben az iparági szektorokban. A harmadik célközönségem azok a szerzők, akik érintettek, és sokan mások, akik érdeklődnek a könyvkiadás iránt.

Az alcím szerint ez egy útmutató az MI-ről mind az írók, mind a kiadók számára. Részben azért, mert azt szeretném, ha a kiadók is megértenék, mit csinálnak az írók ezzel a technológiával. Szerintem ez fontos. A BISG (Book Industry Study Group), amely többnyire kereskedelmi kiadókat képvisel, a legutóbbi éves ülésén jelezte, hogy “szélesebb kört kíván bevonni, beleértve az irodalmi ügynököket és szerzőket is.” Ez egy üdvözlendő lépés.

Azt szeretném, hogy az írók is olvassák ezt a könyvet, mert segíthet nekik megérteni, mit csinálnak a kiadók a kézirataikkal. Az önkiadó szerzők mindig egy szemmel a hagyományos kiadókra figyelnek, részben azért, mert ők maguk is kiadók, és így az MI-technológia, amely a kiadókat érdekli, őket is érdekelheti.

De ne tévedj, ez nem egy gyakorlati útmutató szerzőknek, hogyan használják az MI-t, hogy jobb és termelékenyebb írók legyenek. Számos könyv létezik ebben a témában (sajnos sok közülük csak átverős Amazon-koppintás). És sok YouTube videó (változó minőségű).

A kereskedelmi könyvkiadáson belül az ideális olvasóm nem feltétlenül egy döntéshozó, hanem inkább egyike azoknak, akik nap mint nap dolgoznak az iparágban, könyveket készítenek és olvasókat találnak. Minden kulcsfontosságú kiadói funkcióról beszélek majd ebben a könyvben, a szerkesztőségtől az értékesítésig és terjesztésig. És az írók és olvasók közötti kapcsolatokról is.

Bár Kanadában nőttem fel, és ott kezdtem kiadói karrieremet, jelenleg San Franciscóban, az Egyesült Államokban élek, így alapértelmezés szerint az amerikai kiadói iparágra gondolok. De a könyvecském szinte minden része releváns lehet egy madagaszkári kiadó számára is, ugyanúgy, mint egy manhattani kiadó számára. Bár a kisebb országok kiadói méretbeli kihívásokkal néznek szembe, ugyanígy az amerikai kis kiadók is, és ez a könyv bármilyen méretű vállalat számára készült.

Amikor kis kiadókkal beszélek az MI-ről, és amikor nagyon nagy kiadókkal beszélek az MI-ről, a legnagyobb különbség, amit észreveszek, az a kiadói ‘vállalkozás’ fogalma. A legnagyobb kiadók gyakran részei (vagy közvetlen szomszédai) nyilvános cégeknek, és amikor nyilvános cég vagy, a hírnév és a biztonság kérdései sokkal nagyobb mértékben merülnek fel, mint egy mindennapi kiadónál, amely nem ugyanúgy felelős a részvényeseknek és a médiának. Míg egy Big 5 kiadónál dolgozó szerkesztő ugyanúgy használja az MI-eszközöket, mint egy kisebb cégnek dolgozó szabadúszó szerkesztő, a kontextus, amelyben használják az eszközöket, egészen más.

Mennyit kell tudnod az MI-ről, hogy elolvashasd ezt a könyvet?

Feltételezem, hogy az olvasóim nagyjából nulla ismerettel rendelkeznek az MI belső működéséről, de intelligens olvasók. Ezért azon a vékony határvonalon fogok egyensúlyozni, hogy nulla tudás mellett se nézzem le az olvasót.

Úgy képzelem, hogy szinte mindenki hallott már az új generációs MI-ről: egy 2024 márciusi YouGov felmérés szerint az amerikaiak mindössze 7%-a tud “semmit” az MI-ről. Az írók és kiadók szinte biztosan hallottak már néhány szerzői jogi panaszról, de valószínűleg nem értik teljesen a problémákat. Ezért nem kell elmagyaráznom, hogy az MI a “mesterséges intelligencia” rövidítése. De nem feltételezem, hogy az olvasók meg tudják határozni, mi az MI, mit jelent, milyen hatással lehet stb. Ezért vagy itt.

Akadálymentesség, mind általánosan, mind specifikusan

A mantrám ennek a könyvnek a kiadására az „akadálymentesség”.

A legtöbb ember számára ez csupán valami olyasmit jelent, mint az „elérhetőség”, és valóban, azt tervezem, hogy ezt a könyvet a lehető legtöbb formában és formátumban elérhetővé teszem. Ki akarom bővíteni a konténert. Próbálom a könyvemet példaértékű kiadvánnyá tenni, bemutatva a teljes skálát, amit ma el lehet érni egyetlen könyv kiadásakor.

A Leanpub-on megtalálod a könyvet PDF fájlként, EPUB fájlként és ingyenes webalapú kiadványként. Találsz fordításokat 31 nyelvre, beleértve a főbb ázsiai és európai nyelveket. Több hangoskönyv is elérhető lesz főbb nyelveken.

A könyvet nyomtatott és digitális formátumban is elérhetővé teszem minden olyan e-kereskedelmi platformon, amelyet az Ingram és az Amazon elérhet. Ez magában foglalja a legtöbb könyv online kiskereskedelmi oldalt a világ nagy részén. Így a könyvtárak is meg tudják vásárolni a könyvet, bár érthetően kevés helyük van az önkiadott művek számára. (Adományozok nyomtatott és digitális példányokat bármely könyvtárnak a világon, amely kéri.)

Az ingyenes webes verzió mellett készítek ingyenes kivonatokat, egy Kérdés & Válasz részt, és infografikákat azok számára, akik csak ízelítőt vagy mintát szeretnének. Ezek elérhetők lesznek a blogomon keresztül.

Nem érdemes az egész könyvet videóra rögzíteni, ha hangoskönyvek elérhetők. De néhány ember inkább videón keresztül szeretne hozzáférni a tartalomhoz. Ezért rövidített videó verziókat fogok kínálni, többféle hosszúságban.

És mi a helyzet az emberi érintéssel? Webináriumokon vagy egyéni online konzultációkon keresztül is elérhető leszek a weboldalamon és a blogomon keresztül. Sőt, akár személyesen is felbérelhető vagyok!

Az „akadálymentesség” sokkal többet jelent, mint a szótári definíció. Ahogy a Kanadai Nemzeti Hálózat az Egyenlő Könyvtári Szolgáltatásokért (NNELS) fogalmaz itt, “Egy akadálymentes könyv olyan, amelyet mindenki használhat és érthet.” És így az angol EPUB fájlom megfelel a W3C 1.1 ajánlásának a nyomtatási fogyatékosok számára, beleértve a robusztus alt szöveg leírásokat a képekhez. Várhatóan ugyanezt az akadálymentességi szabványt fogjuk elérni a külföldi nyelvű fordítások esetében is.

Az alt szöveget a ChatGPT készítette. Nem szerkesztettem a ChatGPT verzióját, hogy bárki, aki olvassa az EPUB-ot, láthassa, milyen jó, és hol van még hiányosság. Ahogy kollégám, Bill Kasdorf emlékeztet rá, a jó alt szöveg leírja, amit egy látó olvasó kinyer egy képből, nem csak azt, hogy mi látható rajta.

A könyvkiadóknak az akadálymentesség már nem opcionális: ez az alapértelmezett beállítás.

(Két mea culpa-t kell megosztanom: A kiadási platformok korlátai miatt az alapértelmezett PDF fájl sajnos nem fog megfelelni a PDF/UA szabványnak, és nem tudok nagy nyomtatású verziót kínálni az e-kereskedelmi oldalakon. De mindkettő elérhető kérésre.)

Néhány házimunka

Amint jeleztem, ez a könyv (viszonylag) rövid. Amikor egy rövidebb dokumentumot „könyvnek” nevezel, fennáll a veszélye annak, hogy a vásárlók tiltakoznak: “Azt hittem, könyvet veszek, de ez csak 50 oldalas!” Mindent megtettem, hogy egyértelművé tegyem az értékesítési oldalon, hogy ez nem egy teljes hosszúságú könyv, de ha csalódott vagy, ne feledd, hogy a Leanpub 60 napos pénzvisszafizetési garanciát kínál, és én boldogan kiterjesztem ezt a visszatérítési ajánlatot „örökre”. Azt akarom, hogy az olvasók örüljenek, ne csalódottak legyenek. (Ha egy másik platformon vásároltad a könyvet, írj nekem: küldök egy csekket!)

A könyv tele van hiperhivatkozásokkal (ezek különböző formátumokban különböző módon jelennek meg, de gyakran lábjegyzetként). Mindig is hittem abban, hogy az eredeti forrásokhoz kapcsolódok a munkámban, hogy az olvasók ellenőrizhessék néha nagyszabású állításaimat. De tisztában vagyok azzal, hogy a hiperhivatkozások és lábjegyzetek zavaróak lehetnek, különösen, ha e-olvasó eszközt használ. Elnézést kérek ezért. A legjobb megoldás az, ha figyelmen kívül hagyja a linkeket olvasás közben, és visszatér rájuk, ha mélyebben bele szeretne merülni egy témába.

Nem tudom, milyen formátumban olvassa (vagy hallgatja) most. Sem azt, hogy milyen nyelven. Igyekeztem a könyv “ergonómiáját” a lehető legfelhasználóbarátabbá tenni, de a linkek és lábjegyzetek ebből a szempontból nem mindig optimálisak.

Ennek a könyvnek szponzorai vannak, ami tudom, hogy szokatlan egy “könyv” esetében. A szponzoráció működését a szöveg végén található “nyilatkozatok” részben magyarázom el.

Miért MI most?

An icon of a key

Amikor kiadókkal beszélek, sürgető, azonnali aggályokat hallok. És az MI általában nem tartozik ezek közé.

A nyomtatási gyártási költségek emelkedése évek óta zavaró, bár most úgy tűnik, hogy kiegyenlítődik. A megnövekedett terjesztési költségek minden szereplő számára kihívást jelentenek. Ezek árazási nyomásokat eredményeznek—bizonyíték van arra, hogy az olvasók kezdenek elégedetlenkedni az új keménykötések és kereskedelmi papírkötésű könyvek jelenlegi árazásával. Ezeket “analóg” problémáknak osztályozom—a digitális technológiák kevés megoldást nyújtanak ezekre.

Aztán vannak a szélesebb körű “egzisztenciális” problémák, amelyek egyre növekvő aggodalmat jelentenek, de ezek inkoherens kérdések, nyilvánvaló megoldások nélkül. Ide tartozik:

  • Tartalom felfedezése és közönség bevonása online és közösségi médián keresztül.

  • A fogyasztói viselkedés és olvasási szokások változása.

  • Verseny más digitális médiákkal.

Úgy vélem, hogy az MI óriási segítséget nyújthat a kiadóknak ezekben a területekben, de a módszerek nem egyértelműek, és időbe telik, amíg megvalósulnak. Ezt a könyv későbbi fejezeteiben fogom leírni.

MI: Kezdés

Mielőtt belemerülnék az unalmas technikai háttérbe, meghívom önt, hogy rögtön ugorjon bele az online szoftverekbe. A legjobb eszközök ingyen kipróbálhatók. Ott van a ChatGPT. És a Claude.ai. Játszhat a Microsoft Copilot alkalmazással. Vagy kipróbálhatja a Google Gemini programot.

Így kezdődnek a legtöbben az MI-vel—fogadok, hogy ön már kipróbálta egy vagy több ilyen eszközt. Azt is fogadom, hogy nem próbálta őket hosszú ideig. A legtöbb ember, akivel beszélek, csak néhány percet szán rájuk. Néhány kérdést próbálnak feltenni, visszakapnak néhány nyilvánvaló választ, és továbblépnek.

Rossz megközelítés.

Egyetértek Ethan Mollickkal, akinek a munkáját többször is leírom ebben a könyvben. Blogjában és egy nemrégiben készült interjúban, Mollick a “10 órás szabályáról” beszél:

“Szeretném jelezni, hogy a 10 óra ugyanolyan önkényes, mint a 10,000 lépés. Nincs tudományos alapja. Ez egy megfigyelés. De ez is továbblendít a, kipróbáltam egy estére, és közelebb visz ahhoz, hogy komolyan használja. Nem tudom, hogy a 10 óra az igazi határ, de úgy tűnik, hogy valamelyest átalakító hatású. A kulcs az, hogy olyan területen használja, ahol van szakértelme, így megértheti, hogy miben jó vagy rossz, és megtanulhatja a képességeinek formáját.”

Egy másik kommentátor, aki Mollick legújabb könyvét az MI-ről áttekintette, egy ugyanolyan igaz “tíz órás szabályt” említett: “Ezekkel az eszközökkel végzett egy óra kísérletezés tíz óra olvasással ér fel róluk.”

Érti az ötletet. Ez a cselekvésről szól, nem a töprengésről. Az én könyvem egy töprengés. Önnek be kell piszkolnia a kezét.

MI: Egy nagyon rövid történelem

An icon of a key

Pár évvel ezelőttig az átlagember csak elvontan hallott az MI-ről, vagy mint tudományos-fantasztikum, vagy mint valami, ami legyőzhet egy nagymestert sakkban vagy Go-ban. Hirtelen az MI mindenhol ott van, hamis benyomást keltve, hogy új. Még az új dolgok sem igazán újak. De ez mellékes kérdés. Az MI keveset jelentett a könyvkiadásban a ChatGPT előtt. Most sokat jelent.

Az AI nagyjából 70 éves fejlődésének megértése lenyűgöző lehet, de egyáltalán nem szükséges ahhoz, hogy értékeljük a mai helyzetet.

A Our World In Data remek munkát végez az AI történetének rövid feljegyzésében - ezt rájuk bízom.

Az AI jelenlegi generációját többnyire az elmúlt évtizedben fejlesztették ki. Aztán hirtelen megjelent a ChatGPT 2022. november 30-án. Két hónappal később már 100 millió havi felhasználója volt, ami a leggyorsabb, amit bármely technológia valaha elért a fogyasztói piacon (összehasonlításképpen, a Facebooknak több mint két évbe telt, mire elérte a 100 millió felhasználót).

Miért a gyors elterjedés? Először is, lenyűgöző és szórakoztató. Másodszor, ingyenes. Harmadszor, nem kell új eszközt vásárolni a használatához. És negyedszer, nem kell semmilyen képzés ahhoz, hogy hozzáférjünk a ChatGPT-hez (vagy annak Chat AI versenytársaihoz). De ezek a tényezők a Facebookra is vonatkoztak, akkor miért a ChatGPT?

Ahogyan Arthur C. Clarke híresen megjegyezte: “Bármely eléggé fejlett technológia megkülönböztethetetlen a varázslattól.” A Chat AI varázslat. Az élmény, hogy hétköznapi nyelven “beszélhetünk” egy géppel… varázslatos. Az élmény, hogy azt mondhatjuk: “Egy könyvet szeretnék egy lufiban, egy felhőben, a nap közelében”, és néhány másodperccel később

Egy nyitott könyv, amelyből egy hőlégballon emelkedik ki, lebegve a felhők között.

… szintén varázslatos. A GPT által generált képek kezdenek stílusban hasonlítani, színesek és fantáziadúsak. Szóval küldtem egy második parancsot: “most egy 15. századi illusztráció stílusában”. És íme:

Egy művészi illusztráció egy hőlégballonról, bonyolult mintákkal, felhők között lebegve, a háttérben egy nappal.

Ha egy videót szeretnék egy könyvről egy lufiban, egy felhőben, a nap közelében, több tucat eszköz közül választhatok, és kész. És egy zenei háttér a videóhoz. Nos, hogy hangzik ez? Pontosan olyan, mint a varázslat.

Attól való félelmünkben, hogy az AI rendkívüli képességeit az érthetetlen “varázslat” kategóriájába sorolva leértékeljük, szórakoztató megtudni, hogy az AI jelenlegi generációjáért felelős tudósok közül sokan bevallják, hogy valójában nem értik pontosan, hogyan működik. Ahogyan az a MIT Technology Review legutóbbi számában megjelent jelentés megjegyzi, “az összes futóteljesítménye ellenére senki sem tudja pontosan, hogyan - vagy miért - működik.” Izgalmas, de egy kicsit ijesztő is.

Az AI megértése és néhány kulcsfogalom

An icon of a key

Az AI rengeteg technológiával és terminológiával rendelkezik, amelyek nagy része az adatkutatók kivételével mindenki számára érthetetlen. A Chat AI felhasználóinak nincs szükségük mélyreható AI terminológiai ismeretekre vagy az érintett technikai fogalmakra. A rendszer beszélgetős jellege lehetővé teszi az intuitív interakciókat anélkül, hogy speciális háttértudásra lenne szükség. Fontosabb az, hogy mire képes a Chat AI.

Ennek a könyvnek az elkészítése során küzdöttem azzal, hogy mi a “felelős” dolog, amit AI-ról szóló könyv szerzőjeként megtehetek. A hagyományos megközelítés az, hogy rövid magyarázatot adunk a tudományról és áttekintjük a gyakran használt kifejezéseket.

Ezt nem fogom megtenni.

Itt néhány külső linket fogok kínálni, amelyek szerintem ésszerűen érthető rövid leírásokat nyújtanak az AI alapjairól.

Mi az AI jövője?: A McKinsey & Co. (2024. április) rendelkezik egy jó magyarázókészlettel.

Hasonlóképpen, Gartner Generative AI (dátum nélkül) sem rossz.

A Futurepedia egy nem rossz összefoglalót kínál AI Alapok (2024. május)

Miután elintéztem a hogyan-t, most bevezetek néhány olyan kifejezést, amelyeket fontosnak tartok megérteni. Nem azért, mert szükséges őket ismerni a szoftver használatához. Csak azért, mert ez a kifejezéskészlet néhány kulcsfontosságú szempontot érint, amelyek alapján az AI jelenlegi generációja ténylegesen működik.

A kifejezések és fogalmak kezelésének esettanulmánya az írók és kiadók, akik (i) egy szinttel mélyebbre akarnak menni az AI témájában, bármilyen okból, vagy (ii) meg akarják érteni az AI jelenlegi kritikáinak kontextusát, vagy (iii) hozzájárulni szeretnének a stratégiai megbeszélésekhez, hogy kollégáik vagy szervezeteik hogyan közelítsenek az AI-hoz.

Más szóval, ez nem az, amit tudnod kell, hanem inkább az, amit szeretnél tudni. Íme, nem ábécé sorrendben:

Utasítások és utasításadás

Megnyithatod a Chat AI szoftvert, és egyszerűen beírhatsz egy kérdést, ahogy most is teszed a Google-on.

Nagy nyelvi modell (LLM)

A nagy nyelvi modellek hatalmas mennyiségű (többnyire) írott anyag elemzésével működnek, lehetővé téve számukra, hogy megjósolják, milyen szavak vagy mondatok következnek egy beszélgetésben vagy írásban. Nem értik a nyelvet az emberi értelemben, ehelyett a szöveget kisebb darabokra (úgynevezett tokenekre) bontják, majd a tokeneket számokká alakítják. A szöveget számokként dolgozzák fel, majd további számokat generálnak, amelyeket aztán visszaalakítanak szöveggé a kimeneten. Ez egy nagyon leegyszerűsített magyarázata annak, hogy a Chat AI miért nem “tartalmaz” szerzői joggal védett műveket: számokkal van felépítve, amelyek egy hatalmas absztrakciót képviselnek az alapul szolgáló szövegekből.

Az LLM-eket arra képezik ki, hogy hogyan használják a nyelvet, majd ennek az ismeretnek az alapján generálnak válaszokat. Hajlamosak vagyunk alábecsülni, mennyire kiszámítható a legtöbb nyelv. A Chat AI képes olyan szövegeket generálni, amelyek (néha megdöbbentően) hasonlóak a meglévő irodalomhoz, de tervezés szerint nem képesek konkrét részleteket vagy szerzői joggal védett szövegek másolatait visszaadni. (Tudom, sokan hallottak már a New York Times OpenAI elleni peréről - a Times képes volt rávenni a ChatGPT-t, hogy szó szerint visszaadjon néhány korábban publikált cikk részletét.)

Generatív MI

A legfontosabb dolog, amit meg kell érteni ezzel a kifejezéssel kapcsolatban, az a “generatív” rész. A generatív MI új szöveget generál.

Generatív előre betanított transzformátor (GPT)

Ez, a legtechnikásabb terminológia itt, egy konkrét típusú LLM-et ír le, amelyet az OpenAI fejlesztett ki. A “generatív” azt jelzi, hogy képes szöveget létrehozni, az “előre betanított” azt jelenti, hogy egy nagy szöveges adatállományon képezték ki, és a “transzformátor” a használt szoftverre utal. A GPT rövidítés megértése csak azért hasznos, hogy megértsd, mit jelent a GPT a ChatGPT-ben.

ChatGPT

A ChatGPT az a szoftver, amit látsz; a GPT az, ami a szoftver mögött van. A felhasználók a ChatGPT-t tapasztalják meg, nem a mögötte lévő GPT-t. Mint fentebb említettük, a ChatGPT csak egy a számos online Chat AI szoftverrendszer közül, hasonló funkcionalitással.

Még egy kifejezés, amellyel gyakran találkozol, és sokak számára ismeretlen:

Korpusz

A szótári definíció szerint a “korpusz” egy “írott szövegek gyűjteménye” (bár valójában nem mindig szöveg). A kifejezést arra használják, amire a GPT-ket kiképzik: hatalmas, többnyire szöveges korpuszokra. Azt mondják, hogy a legnagyobb korpuszok több száz milliárd szót tartalmaznak. A halandók számára ez felfoghatatlan. Nem gondolod, hogy a Wikipédia hatalmas, rengeteg szót tartalmaz? Nos, a Wikipédiában mindössze 4,5 milliárd szó van - a GPT-4-et több mint egy billió szón képezték ki.

Úgy gondolom, fontos figyelembe venni ezt a méretarányt. Az írók érthetően aggódnak amiatt, hogy a könyvükben található 75 000 szó, plusz-mínusz, bekerülhetett-e egy nagynyelvi modellbe. Talán bekerült (részletek lentebb). De ha ez az eset áll fenn, gondolj arra, mennyire csekély értéke van bármelyik könyvnek a mai nagynyelvi modellek összteljesítményéhez képest. Ez valóban jelentéktelen. Még 10 000 könyv is aprópénz.

MI szoftver: A rendszer nehézsúlyúi

An icon of a key

Fent felsoroltam a négy Chat AI nehézsúlyút: ChatGPT, Claude.ai, Microsoft Copilot és Google Gemini.

Mindegyik többé-kevésbé ugyanúgy működik és hasonló eredményeket ad. Szóval melyik a legjobb? Ez a kérdés egy nyúllyukba vezet. Ez olyan, mintha megkérdeznéd, melyik város kínálja a legjobb tengerparti nyaralást, vagy melyik SUV a legjobb családok számára. A kérdésekben rengeteg árnyalat van, és a válaszainkat egy hatalmas mennyiségű büszkeség és előítélet szűri meg.

Ez a látszólag egyszerű, de rendkívül összetett szoftver esetében is így van. Egyesek azt állítják, hogy Claude finomabb nyelvi készségekkel rendelkezik, míg a ChatGPT jobb a szoftverkóddal. A Microsoft Copilot integrálódik a Microsoft szoftvercsomaggal. A Google Gemini csatlakozhat a Gmailhez, a Google Mapshez és a YouTube-hoz. Néhány különbség jelentős; sok apró. És ezek folyamatosan változnak minden új szoftver kiadással.

An icon of a key

‘A legjobb’ szoftver még egy ideig nem lesz eldöntve. Ha elég sok eszközt próbálsz ki, megtalálod a kedvenceidet.

Két felső kategóriája van az MI szoftvereknek. Az első az, amit alapvető szoftvernek nevezhetünk, például a ChatGPT és versenytársai (Chat AI). Így tapasztalja meg a legtöbb ember ma az MI-t.

A következő szint az összes többi szoftver, amely lényegében egy ablakot biztosít az alapvető szoftverbe. Az újonnan érkezők az AI beszélgetések világába valószínűleg még nem találkoztak ezekkel a szoftverekkel, bár nem ritkák vagy ismeretlenek. Néhányan ismerhetik a Jasper-t (marketing szoftver) vagy a Perplexity-t (kereső). Ezek a szoftverek egyszerűen nem léteznének a ChatGPT és társai nélkül.

Ne feledje, hogy az Adobe, a Microsoft, a Grammarly, a Zoom és mások mainstream szoftverei most már AI eszközöket tartalmaznak, de ez különbözik azoktól a szoftverektől, amelyek alapjaitól chatbot interfészekre épültek. (Mások, mint például az Otter (átiratok), megelőzik a ChatGPT-t, de most már nagy nyelvi modell technológiával vannak ellátva.)

Az alábbiakban megvizsgáljuk a kiadói specifikus szoftvereket, amelyek kihasználják a generatív mesterséges intelligencia képességeit.

Szoftver Paradigmák

Régen a szoftverek kódokból álltak, és csak a mérnökök értették, hogyan működnek. Ami a személyi számítógépeket sikeressé tette, az alacsony költségen túl, az volt, hogy (viszonylag) könnyen használható szoftverekkel rendelkeztek. Nem sokat gondolkodunk ezen; egyszerűen körülvesznek minket.

De gondoljon csak egy pillanatra a Microsoft Word-re, egy programra, amelyről biztosan állíthatom, hogy az e könyv olvasóinak 99%-a használja. Körülbelül 10 percbe telik megmutatni valakinek, hogyan írjon egy bekezdést a Word-ben. Ezután megmutathatja nekik, hogyan hozzanak létre félkövér szöveget, dőlt betűt, és hogyan változtassák meg az alapértelmezett betűtípust, mondjuk Calibri-ről Arial-ra vagy Times Roman-ra. Ezután hogyan mentsék el a fájlt és nyomtassák ki. Hogyan keressenek és cseréljenek.

És aztán magukra hagyja őket.

Évekkel később rájön, hogy még mindig szóközökkel és tabulátorokkal formázzák a Word bekezdéseit. És még mindig elfelejtik menteni a fájljaikat, vagy összezavarodnak, melyik verziót mentették el, néha újra kell alkotniuk a szöveget a semmiből. De “tudják, hogyan kell használni a Word-öt.”

A Word-nek több száz funkciója van, de az esetek egyharmadában a felhasználók csak 5 parancsot használnak: Beillesztés, Mentés, Másolás, Visszavonás és Félkövér. Hetekig tartó képzés szükséges a Word fejlett funkcióinak megfelelő elsajátításához; olyan funkciók, amelyekkel egy kiadó több száz órát takaríthat meg. De a legtöbben soha nem teszik meg. 1985 óta használom a Word-öt, közel negyven éve, és soha nem vettem részt egy tanfolyamon sem. Nem is tudom, mit nem tudok arról, hogyan lehet a szoftver teljes erejét kihasználni.

Erről beszélek, mert ez egy hasznos módja annak, hogy megértsük, miért olyan nagyon különböző az AI szoftver minden más szoftvertől, amellyel valaha dolgoztál. Nem jön kézikönyvvel, még egy Gyorsindítási útmutatóval sem. Egy üres képernyővel és egy kérdéssel érkezik: “Miben segíthetek.”

Egy üdvözlő üzenet egy beszélgetési AI interfészen, amely Thaddeus-nak szól, és megkérdezi, miben segíthet.

Nincs menüsor, nincs gomb, amit meg kell nyomni, nincsenek billentyűparancsok. Kérdést teszel fel, elindítasz egy csevegést, és válaszokat kapsz.

Egy beszélgetési AI interfész, amelyben a felhasználó beírja, hogyan magyarázza el az új generációs beszélgetési AI és a hagyományos eszközök, mint a Microsoft Word vagy Excel közötti különbséget.

Claude válasza:

“Több kulcsfontosságú különbség van a modern beszélgetési AI, mint én, és a hagyományos eszközök, mint a Microsoft Word vagy Excel között:

“1. Természetes nyelvi interakció: A beszélgetési AI-val mindennapi nyelven közölheted szándékaidat, ahelyett, hogy bonyolult menüket és funkciókat kellene megtanulnod és navigálnod. Egyszerűen elmondod, mit szeretnél elérni beszélgetési formában.

“2. Kontextuális megértés: Az AI asszisztensek fenntartják a kontextust és megértik a beszélgetés folyamatát, lehetővé téve a természetesebb oda-vissza párbeszédet. A hagyományos szoftvereknek nincs kontextuális tudatosságuk az egyik parancstól a másikig.

“3. Alkalmazkodóképesség: Az AI dinamikusan alkalmazkodik és reagál a különféle kérésekre, míg a hagyományos eszközök előre meghatározott funkciókészletre korlátozódnak. Egy AI asszisztens segíthet írásban, elemzésben, matematikában, kódolásban, ötletelésben és még sok másban egyetlen felületen belül.”

Ez hasznos volt, de valami könnyebben érthetőt szerettem volna. Ezért megkérdeztem:

Egy felhasználói kérdés egy beszélgetési AI interfészen, amely egyszerű magyarázatot kér egy nem technikai közönség számára.

Claude:

“Itt egy egyszerű módja annak, hogy elmagyarázd a különbséget valakinek, aki nem rendelkezik technikai háttérrel:

“Gondolj a hagyományos szoftverekre, mint például a Microsoft Word vagy Excel, mint egy eszközre, például egy kalapácsra vagy egy számológépre. Fix funkciókészlettel rendelkezik, amelyeket el kell sajátítanod, hogy elérd a kívánt eredményt.

“Másrészt, gondolj a modern beszédfelismerő AI-re úgy, mint egy okos asszisztensre, mint egy tudásban gazdag kollégára vagy barátra. Csak beszélned kell hozzá egyszerű angolul, és megérti, mit szeretnél csinálni. Segíthet mindenféle feladatban, az írástól a matekon át az ötletek kitalálásáig.

“Nem kell megtanulnod semmilyen speciális parancsot vagy technikát – csak beszélgess vele természetesen. Alkalmazkodik az igényeidhez és emlékszik a beszélgetésed kontextusára. Idővel megismer téged és a preferenciáidat.

“Tehát míg a hagyományos szoftverek inkább statikus eszközök, amelyeket használsz, a beszédfelismerő AI inkább egy intelligens partner, akivel természetesen interakcióba lépsz, hogy elvégezd a dolgokat. Ez egy rugalmasabb, személyre szabottabb és hatékonyabb munkamódszer.”

Hmm. Ez még mindig nem az, amit szerettem volna. Tehát folytattam a beszélgetést:

Egy beszédfelismerő AI válasza, amely arra figyelmeztet, hogy kerülje a technikai zsargont és az olyan hivatkozásokat, amelyeket a nem technikai emberek nem érthetnek.

Claude:

“Persze, próbáljuk meg újra technikai kifejezések nélkül:

“Képzeld el, hogy egy baráttal beszélgetsz, aki nagyon tudós és készségesen segít neked. Csak egyszerű angolul beszélhetsz vele arról, amit csinálni szeretnél, legyen az esszéírás, matekfeladat megoldása vagy ötletek kitalálása egy projekthez.

“Ahelyett, hogy meg kellene tanulnod és emlékezned kellene egy csomó specifikus lépésre vagy parancsra, csak elmagyarázhatod, mire van szükséged a saját szavaiddal. A barátod megérti a kontextust, és az alapján segít, amit már megbeszéltetek.

“Ez egy oda-vissza beszélgetés, ahol kérdéseket tehetsz fel, tisztázhatsz dolgokat és tanácsot kérhetsz. És minél többet beszélsz ezzel a baráttal, annál jobban megérti az egyedi igényeidet és kommunikációs stílusodat.

“Most képzeld el, hogy ugyanezt a fajta segítőkész, könnyű interakciót egy számítógépes programmal is megteheted. Ez az új típusú szoftver alapötlete, amiről hallhatsz.

“Ahelyett, hogy a régi stílusú szoftver lenne, ahol egy merev funkciókészlet van, és meg kell tanulnod a helyes használatát, ez az új szoftver inkább olyan, mint egy tudós barát. Csak beszélhetsz vele természetesen, és ő kitalálja, hogyan segítsen neked a beszélgetés természetes folyása alapján.

“Tehát ez egy okosabb, személyre szabottabb és egyszerűbb módja annak, hogy segítséget kapj mindenféle számítógépes feladathoz, csak beszélgetve vele, mint egy emberrel. Ez a kulcskülönbség a régebbi, merevebb szoftverekhez képest.”

Összefoglalás: Két dolgot próbáltam elérni ezekkel a példákkal. Az egyik az volt, hogy egyértelmű példát nyújtsak arra, miért olyan különböző a chatbot szoftver bármelyik más szoftvertől, amit eddig használtunk. A másik az volt, hogy bemutassam, hogyan evolválódhat egyetlen csevegés. Ez nem csak egyetlen kérdés és egyetlen válasz. Ez egy beszélgetés. Ez nagy része az áttörésnek.

A csevegő AI-ok valahogy egy kombinációi a gyakornoknak és a tudós tanácsadónak. Nem feltételezheted, hogy tudják, mire gondolsz. El kell magyaráznod, mit akarsz, miért akarod, és hogyan lehetnek a leghasznosabbak.

Háromféle AI szoftver

An icon of a key

Nagy vonalakban háromféle AI szoftver létezik ma. Az első az AI alapvető platformok, mint a ChatGPT, az alapvető AI technológia. A második, nevezzük AI bővítményeknek, az alapvető platformokra frissen épített szoftverek. Valószínűleg nem hallottál még sokról ezek közül, mint például a Jasper vagy a Rewind.

A harmadik kategóriám az a szoftver, amely AI eszközöket kapcsol az meglévő termékhez. Például a Microsoft szoftvercsomag új AI eszközöket tartalmaz a Wordben, az Excelben és a PowerPointban. Az Adobe AI technológiát adott hozzá a Photoshophoz és az Acrobathoz. A Grammarly-t az új generációs LLM-alapú technológia köré építik újjá. Ez többnyire ugyanaz a termék, de AI-val kiegészítve.

Világossá válik, hogy szinte az összes szoftver, amit ma használsz, hamarosan AI funkciókat fog tartalmazni. Neked kell eldöntened, hogy ezek az eszközök valóban hasznosak-e vagy csak AI díszítések.

Engem inkább az új eszközök érdekelnek, amelyek az alapoktól kezdve úgy épültek, hogy csak az AI által előidézhető értéket biztosítsanak. Ez a következő generációs szoftver.

AI szoftver használata

Sajnos Windows felhasználó vagyok (hosszú történet, hogy miért), ezért az AI szoftverekhez való hozzáférés tapasztalataim Windows számítógépen alapulnak, nem Mac-en. Mivel az itt említett szoftverek mind böngésző alapúak, nem kellene különbséget tennie ezek használatában Mac-en. De nem vállalok garanciát.

Szükséged lesz némi pénzre az AI játékhoz, de nem túl sokra. Ahogy fentebb leírtam, az alapvető szoftverek nagy része ingyenes verziókon keresztül elérhető. De általában egy fizetős előfizetésre lesz szükséged, miközben teszteled, és az előfizetésnek körülbelül 20 dollár/hónapnak kell lennie. Töröld, miután kipróbáltad (ne felejtsd el!). Ha valami 79 dollár/hónap vagy, ne adj isten, 159 dollár/hónap, figyelmen kívül hagyhatod. Nem rád, mint potenciális felhasználóra gondolnak; nagy mainstream vállalati felhasználókra gondolnak.

Chat AI Képzés

An icon of a key

A mai MI megtévesztően egyszerű. Bárki, aki képes beírni egy kérdést, használhatja. De jól használni bonyolult, ami elsőre értelmetlennek tűnik, amíg el nem mélyedsz az “utasítások” és a kapcsolódó fogalmak összetettségében.

Ahhoz, hogy hozzáférj az intelligenciájához, néha úgy kell beszélned vele, mintha egy idióta lenne. Vagy talán egy idióta zseni lenne. Ez kicsit olyan, mint Dustin Hoffman karaktere a Rain Man című filmben.

Bárki használhatja a ChatGPT-t. Csak menj a chat.openai.com oldalra, és hozzáférhetsz a legújabb verzióhoz, a GPT-4-hez ingyen (vannak prémium funkciók is elérhetők további havi 20 dollárért).

Amikor a ChatGPT-hez mész, gyakorlatilag egy üres képernyőt találsz, és az implicit kérdést: “Hogyan segíthetek ma?”

Kérdéseket tehetsz fel neki. Még jobb, hogy feltölthetsz egy nagy PDF-et, és kérdéseket tehetsz fel a fájllal kapcsolatban. Feltölthetsz képeket is, amelyeket le tud írni, vagy egy beolvasott oldalt: felismeri a szöveget, még ha kézzel írt is.

A Chat MI sikeres használatának legnagyobb akadályaként az merült fel, hogy meg kell tanulni “beszélni” vele (amit a legújabb mobilalkalmazás verzióban szó szerint is megtehetsz). A Chat MI-ese ezt “utasítások megadásának” vagy “promptingnak” nevezi. A felhasználók rájöttek, hogy minél pontosabbak és részletesebbek az utasításaik, annál jobb válaszokat kapnak a ChatGPT-től. Továbbá, az utasítások nem csak egyszeri alkalomra szólnak. A Chat MI hosszabb ideig folytathat beszélgetést (bár nem a végtelenségig), és ha nem kapod meg a keresett választ, finomíthatod és újraírhatod az utasításaidat. Ez sok megszokást igényel, és egy sor írott és online útmutatót szült, hogy megtanítsa a felhasználókat, hogyan hozhatják ki a legtöbbet az utasítások megadásából.

Próbáld megkérni bármelyik Chat MI szoftvert, hogy magyarázzon el egy olyan fogalmat, mint a fejlesztői szerkesztés. Aztán kérd meg, hogy készítsen egy magyarázatot, amit egy 12 éves is megérthet. Az eredmények drámaian különbözőek. Különösen érdekes, hogy a Chat MI érzelmi kérésekre is reagálni látszik. Ha hozzáadod az utasításhoz, hogy “ez nagyon fontos a karrierem szempontjából,” hasznosabb válaszokat kaphatsz.

(Ez éppenséggel jó alkalom egy zárójeles megjegyzésre: Megnyugtató és egyben mélyen aggasztó is, hogy a nyelvalapú MI-vel dolgozó legjobb tudósok sem tudják megmagyarázni, miért történnek ilyen dolgok.)

Hogyan adjunk utasításokat

An icon of a key

Az “utasítások megadása” egy sajátos készség, amely elengedhetetlen a Chat MI hatékony használatához.

A különböző átvett terminológiák közül, amelyeket az MI aranyláz során felkaptak, az “utasítások” és az “utasítások megadása” a legjobbak közé tartoznak. Valójában nem “beszélsz” a Chat MI-vel. Nem “kérdezel” tőle (vagyis nem kellene—ez nem így működik). Ezeket a motorokat válaszok megadására ösztönzöd, nem egyszerű válaszokra.

Először azt hittem, hogy egy színházi utasítás analógiája megfelelő lehet. Az utasító ösztönzi a színészt, aki elveszti a szöveget, hogy visszatérjen az akcióba. De ez nem pontos, mert egy MI utasítás nem lazítja meg a memorizált szövegrészt—ez nem így működik a generatív MI. Adj egy MI motorjának ugyanazt az utasítást többször, és a válaszok mindig legalább egy kicsit különbözőek lesznek.

Most kértem meg a ChatGPT-t, hogy “sorolja fel a hatékony utasítások kulcselemeit.” Másodszor is megkértem, és a válaszok tematikusan következetesek voltak, de a részletekben eléggé különbözőek. A kiemelt témák között szerepeltek:

  • Legyél konkrét

  • Kerüld a kétértelműséget

  • Adj háttérinformációt

  • Használj világos utasításokat

Bizonyos értelemben ez elég furcsa: az MI jól érti a nyelvet—nem kellene, hogy érzéke legyen ahhoz, amit mondasz, anélkül, hogy aprólékos utasításokat adsz? De épp ez a nyelv mesteri ismerete teszi az utasításokat a leghatékonyabbá. Mondd meg neki pontosan, mit értesz, nem hozzávetőlegesen.

Beszélj vele úgy, mint a segítőkész asszisztenssel, a tanult tanácsadóval, akit szeretnél, hogy legyen, nem mint egy utcai gyerekkel.

A tanulság az, hogy legalábbis egyelőre az LLM-alapú MI eszközök hatékony használata megköveteli az utasítások legjobb gyakorlataival való legalább alapszintű ismereteket. Az utasítások mesteri szintű elsajátítása megfelelően jutalmazásra kerül.

Hallucinációk: Egy légy a kenőcsben

An icon of a key

Az MI, amely nagy nyelvi modelleken alapul, dolgokat talál ki. Egyszerűen így van. Ezt általában “hallucinációknak” nevezik. Ez egy valódi probléma, egy komoly probléma. Meg kell értened a hallucinációkat, ha MI-vel akarsz dolgozni.

A Cambridge Dictionary 2023-as Év Szava a “Hallucinál” volt, amelynek meghatározását kibővítették, hogy magában foglalja: “Amikor egy mesterséges intelligencia… hallucinál, hamis információkat állít elő.” (A 2023-as szótár egyéb kiegészítései között szerepel a “prompt mérnökség”, a “nagy nyelvi modell” és a “Generatív MI”.)

A Cambridge megjegyzi, hogy az MI hallucinációk “néha értelmetlennek tűnnek. De teljesen hihetőnek is tűnhetnek–még akkor is, ha tényszerűen pontatlanok vagy végső soron illogikusak.” Ez sajnos nagyon igaz, és 2024 júliusáig továbbra is drámai korlátozást jelent a generatív MI küldetéskritikus feladatokban való használata szempontjából. Ez az MI egyik számos nagy furcsasága közé tartozik, és az embereknek időbe telik, míg megértik. Ne feledjük, a generatív MI többnyire egy következő szó predikciós motor, nem pedig egy tényszerű adatbázis. Ezért van szükség az Emberek a folyamatban (Humans-In-The-Loop, HITL) eljárásra, amelyben emberek ellenőrzik az MI kimenetét. Megjegyzendő, hogy figyelemre méltó, hogy ilyen rendkívüli értéket tudunk nyerni egy olyan technológiából, amely képes bizonyíthatóan pontatlan eredményeket produkálni. Így megy ez.

Gary Marcus, a tapasztalt és jól tájékozott MI-kritikus, az MI hallucinációkat törött órákhoz hasonlítja, amelyek naponta kétszer mutatnak helyes időt. “Néha helyes,” mondja, “de nem tudod, hogy melyik részében, és ez nagyban csökkenti az értékét.”

Ethan Mollick, a Publishers Weekly 2023 szeptemberi konferenciájának fő előadója, megjegyzi, hogy az emberek 100%-os pontosságot várnak el az MI-től. A hallucinációk, mondja, hasonlóak a “napi emberi hibaarányokhoz,” amelyeket nap mint nap elviselünk.

Andrej Karpathy, a neves tudós, aki az MI-re specializálódott és jelenleg az OpenAI-nál dolgozik, a hallucinációkról ír:

“Mindig kicsit nehezen tudok válaszolni, amikor az LLM-ek ‘hallucinációs problémájáról’ kérdeznek. Mert bizonyos értelemben a hallucináció az egyetlen, amit az LLM-ek csinálnak. Ők álomgépek.

“A promptokkal irányítjuk álmaikat. A promptok elindítják az álmot, és az LLM ködös emlékei alapján a kiképzési dokumentumairól, többnyire hasznos eredményre jutunk.

“Csak akkor nevezzük ‘hallucinációnak,’ amikor az álmok tényszerűen helytelen területre lépnek. Hibának tűnik, de ez csak az LLM csinálja azt, amit mindig is csinál.”

Nem csak az a probléma, hogy dolgokat talál ki. A csevegő MI mélyen hibás szoftver.

Sok kérdésre, különösen a kezdők kérdéseire, a válaszok hétköznapiak, céltévesztettek vagy egyszerűen haszontalanok. A csevegő MI-nek gondot okoz a számolás: Kérj tőle egy 500 szavas blogbejegyzést, és szerencsés leszel, ha 150-et kapsz.

És minden MI vállalat, hogy csökkentse az elfogultságot és elkerülje a “hogyan készítsünk bombát” típusú kérdések megválaszolását, szigorú válaszvédőkorlátokat állított fel termékei köré: túl gyakran a válasz egy kérdésre lényegében “Nem, erre nem válaszolok.” Megkértem a Google Geminit, hogy tekintse át ennek a szövegnek a vázlatát, és figyelmeztetett, hogy “lényeges az író jóváhagyását megszerezni a publikálás előtt.”

Tényellenőrzés

An icon of a key

Többnyire süket fülekre találva, azzal érvelek, hogy a hallucinációk technológiai problémák, amelyek technológiai megoldást fognak találni. Igen, endemikusak az LLM-ekben, de megkerülhetők.

Gondolj erre: Négy csevegő MI-t kértem meg, hogy ellenőrizzék a következő állításokat:

  • 2024-től hat nagy multinacionális kiadó található New York Cityben. Őket nevezik a Nagy 6-nak.

  • Az e-könyvek továbbra is uralják a könyveladásokat az Egyesült Államokban.

  • A Borders és a Barnes & Noble a két legnagyobb könyvkereskedelmi lánc az Egyesült Államokban.

  • A Covid alatti értékesítési visszaesés után az amerikai könyveladások ismét kétszámjegyű növekedést mutatnak.

Mindegyikük észrevette az első három állítás hibáit. Mindegyikük kicsit összezavarodott a negyediknél, bizonytalanul a Covid értékesítési ugrás mértékében és az azt követő értékesítési mintázatokban. Ez egy apró, nem reprezentatív kísérlet, de ezek a csevegő MI-k, amelyek nem tényalapúnak készültek, hiteles munkát végezhetnek a tények értékelésében, amit a legtöbb laikus szemlélő elmulasztana.

Mi a helyzet a képekkel és videókkal?

An icon of a key

Mivel a kereskedelmi könyvkiadás inkább a szövegre, mint a képekre támaszkodik, a kiadók hajlamosak figyelmen kívül hagyni az áttörő MI-alapú eszközöket a képek és videók számára.

Ezek relevánsak bárki számára, aki meg akarja érteni az MI forradalmat. De a vita túl nagy a rendelkezésre álló helyhez képest: egyszerűen nem tudnám igazságosan tárgyalni.

Ajánlott szerzőknek és kiadóknak: játsszanak a ChatGPT képgeneráló funkcióival–ingyenesek és szórakoztatóak. Ezután keressenek rá a “video és MI” kifejezésre, és csodálkozzanak rá néhány példára, amelyeket az összekapcsolt webhelyeken találnak. Bár az eszköz még nem érhető el nyilvánosan, az OpenAI’s Sora néhány lenyűgöző példát nyújt a szöveges promptokból generált videókra.

Szoftver könyvkiadók számára

Kevés olyan mesterséges intelligencia szoftver létezik, amely kifejezetten könyvkiadók számára készült (bár szerzők számára rengeteg elérhető).

Tudományos kiadók számára több lehetőség is van, különféle AI eszközökkel a kutatáshoz, íráshoz és kiadáshoz.

A szépirodalmi kiadók számára a legtöbb lehetőség az AI-ra és az audióra vonatkozik. Az audión kívül a választék az szerkesztési és marketing eszközök köré csoportosul. Emellett számos AI tartalomészlelési eszköz és tartalomlicencelő eszköz és szolgáltatás is létezik.

A szerkesztő szoftver inkább a szerzők számára készült, nem pedig a profi szerkesztők számára — sokkal több szerző van, mint szerkesztő, és a profi szerkesztők által megkövetelt minőség sokkal szigorúbb, mint a (többségében önálló kiadású) szerzők esetében.

A marketing eszközök szintén szélesebb közönséget céloznak meg, nem csak a könyvkiadókat, hanem minden marketingszakembert, webtartalomhoz, szöveggeneráláshoz és SEO-hoz. A Jasper.ai vezető ezen a területen, és állítólag a HarperCollins ügyfele is.

A Shimmr, ennek a könyvnek a szponzora, egy mesterséges intelligencia által vezérelt hirdetéskészítő eszköz, amely kifejezetten könyvkiadók számára készült. A céget és alapítóját, Nadim Sadek-et, egy 2024 májusi cikkben a Publishers Weekly-ben mutatták be.

„Amit mi csinálunk, az az, hogy mesterséges intelligenciát használunk egy könyv pszichológiai profiljának figyelembevételével, és ezt összekapcsoljuk egy konkrét közönség hangulatával, biztosítva egy hatékonyabb kapcsolatot az olvasók és a könyvek között,” mondta Sadek a PW-nek. „Ezt ‘Könyv DNS’-nek nevezzük, és nem csak a könyv szereplőit és cselekményét ismerjük, hanem a könyv értékeit, érdeklődését és érzelmeit is.”

A Könyv DNS-re hivatkozva a Shimmr mesterséges intelligencia eszközei célzott hirdetéseket hoznak létre keresési és közösségi média csatornákra (jelenleg a Google és a Meta). A hirdetések megjelenítési hirdetések formájában jelennek meg, amelyek mesterséges intelligencia által generált képekkel és szlogenekkel vannak ellátva.

Amire felhívom a kiadók figyelmét a Shimmr értékelésekor, az az, hogy kiegészítő bevételt biztosíthat, amit egy új reklám-/marketingeszköztől várunk el.

Ha egy másik „csak AI-val” elérhető szoftvereszközt szeretnél kipróbálni, nézd meg a Hypnovels oldalt, amely animálja a szépirodalmi könyvek fejezeteit. „Narráció, kép és mozgás, mind mesterséges intelligencia által generált, nagyszerű történetmeséléssel ötvözve oly módon, hogy kevésbé szó szerinti, mint a hagyományos animáció (innen a „hypno”), és érzékileg vonzóbb, mint egy hangoskönyv, olyan stílusban, amely egyedivé és érdekessé teszi a fejezetet.”

Egy másik új szolgáltató, amely az AI lehetőségéből született, a Veristage (szintén ennek a könyvnek a szponzora). A Veristage az Insightot kínálja, amely az „AI Publishing Assistant”, egy feladatspecifikus felület több kiadói funkcióhoz.

Az Insight útja a kézirattal kezdődik. Egy korai verzió feltöltése egy sor eszközt nyit meg, amelyek közül néhány szerkesztői, mások marketing szempontból értékesek. Miután bármelyik vagy az összes funkcióval dolgoztál, letölthetsz egy PDF-jelentést, amely tartalmaz szerkesztői szempontokat, mint például az írás hangvétele, trópusok, klisék és a határozószók és melléknevek használata, majd marketingtartalmat, mint például leírások, metaadatok, egyedi értékesítési pontok, versenytársak, Amazon-optimalizált tartalom és javasolt közösségi média bejegyzések.

Ami legjobban tetszik az Insightban, az az, hogy holisztikus megközelítést alkalmaz a mesterséges intelligencia alkalmazására a kiadási folyamatban, ahelyett, hogy több szoftvereszközt kellene összegyűjteni, mindegyiket más funkcióhoz.

Itt szeretném kiemelni a kiadói platformomat, a Leanpubot is. Csodálatos volt velük dolgozni. A kicsi szép: olyan technológiákkal és szolgáltatásokkal próbálkoznak, amelyektől a nagyobb cégek elzárkóznának. Azok számára, akik szerzők vagy kisebb kiadók, különösen érdekes az új TranslateWord szolgáltatásuk, ahol egy Microsoft Word-ben írt könyvet akár 31 nyelvre is lefordíthatsz a GPT-4o API segítségével (amely a ChatGPT-t is működteti). Ez az, amit én is használok a könyv lefordításához.

Más szolgáltatások után kutattam könyvfordításhoz. Rengeteg fordítóiroda van, néhányan mesterséges intelligenciát alkalmaznak. Az egyetlen, amely könyvfordítást kínál, a DeepL. De ez nem a cég fókuszában áll. Jelenleg a Leanpub az a hely, ahová fordulhatunk.

Üzleti szoftver könyvkiadáshoz

An icon of a key

Az eddig is meglévő üzleti rendszerszállítók, akik a kiadói iparágat szolgálják, elkezdték beépíteni az AI technológiákat, ahogyan ezt az olyan nagyvállalatoknál láttuk, mint a Salesforce és az Oracle.

Beszéltem több kiadói rendszer szoftver szállítójával, köztük a Firebranddal is, és mind keresik a lehetőségeket, de óvatosan haladnak.

Nagyon várom, hogy az AI-ról beszélhessek egy sokszínű résztvevői csoporttal a Firebrand’s Publishing Innovation Forum rendezvényen 2024 szeptemberében Nashville-ben, TN-ben.

knk két webináriumot tartott az AI-ról, és kiadott egy fehér könyvet, de (2024. június 26-án) még nem jelentette be az AI funkciókat a termékeiben.

Virtusales nemrégiben elindította első AI-alapú eszközeit, beleértve a képcímkézést, alt szöveg generálását, korrektúra eszközöket, értékesítési és marketing szöveg generálását, valamint ezek fordítását.

Beszéltem a Klopotek-kel a Klopotek Publishing Radio-n. Megkezdték az “AI kezdeményezést az ügyfélszolgálat területén,” bár részletek még nem állnak rendelkezésre.

Supadu, amely “web design, e-kereskedelem és adatmegoldásokat” kínál a kiadóknak, mostantól rendelkezik a “Supadu Smart AI”-val, (pdf) amely “avatár által vezetett címvideó áttekintést Smart Buy-val,” “avatár videó-vezérelt promóciós anyagokat marketing és értékesítési csapatok számára,” valamint “könnyű többnyelvű fordítást szerzői és címvideókhoz” kínál.

AI szoftver könyvkiadóknak: az induló vállalkozások

Néhány ember ismeri a munkámat, amit könyvkiadási technológiai alapú induló vállalkozások körében végeztem. A Publishers Weekly-ben van egy jelentés, amely leírja a munkát, és linkeket tartalmaz az adatbázishoz.

Ahogy a jelentésben is látható, elég széles körben vizsgálom az induló vállalkozásokat a könyvkiadás spektrumában. Nem veszem bele az új könyvkiadó cégeket, hacsak nem használnak valamilyen szokatlan technológiát. Az alapvető kritérium: használ-e technológiát valamilyen könyvkiadási folyamat élénkítésére? Több mint 1600 cég van az adatbázisban, a legtöbbet az Amazon első Kindle kiadása után, 2007-ben alapították.

Miután átfogó képet kapott az adatbázisról, mélyebben is elmerülhet benne. A jobb szélső fülön láthat egy módot, hogy csak az AI-vel kapcsolatos kiadói induló vállalkozásokra szűrjön.

Egy táblázat képernyőképe, amely eszközöket és szolgáltatásokat sorol fel az AI szűrővel kiválasztva, kiemelve egy 243-as számot.

Ahogy az ábrán látható, több mint 240 AI-vel kapcsolatos kiadói induló vállalkozás van (2024. július elején). Az audio kiadói induló vállalkozásokat, amelyek AI-t alkalmaznak, külön kategóriaként számoljuk, és a kettő összesen több mint 300 vállalkozást jelent. A többség, több mint 280, a ChatGPT 2022 novemberi megjelenése után indult. Ez az új üzleti vállalkozások volumene példa nélküli a könyvkiadásban. Lenyűgöző.

Ahogy az adatbázis teljes körére jellemző, ezek az AI induló vállalkozások többsége az írókat célozza meg (70%). Körülbelül 13% kifejezetten a kiadó cégeket kívánja kiszolgálni. 10% a gyermekkiadásra összpontosít.

Körülbelül 50 induló vállalkozás célozza meg az olvasókat különféle leleményes ajánlatokkal. Több történetmesélő platform is van. Elég sok összefoglaló található. Több felfedező oldal is létezik, “Használd az AI-t, hogy megtaláld az új kedvenc könyvedet.” A gyorsan fejlődő AI által generált hangok számos “olvasd fel nekem” eszközt eredményeztek.

És néhány érdekes ötlet, amelyek AI nélkül nem lennének lehetségesek.

Bookshelf: Reading Tracker egy kombinált könyv felfedező és személyes könyvtári alkalmazás, amely magában foglalja az “automatikus időkövetést, olvasási célokat és emlékeztetőket, valamint átfogó statisztikákat és trendeket.” Az AI könyvtáros “összefoglalókat és flash kártyákat tud generálni, megvitatja a kulcsfontosságú ötleteket és következtetéseket, és még sok minden mást.”

Barátom, Ron Martinez nemrégiben elindított egy oldalt, az Inventionarts.ai, amely bemutat egy “új beszélgető közeget”. Ahogy az oldal magyarázza: “Beszélgess több AI személyiséggel, mindegyik saját identitással, szakértelemmel és tudatossággal rendelkezik. Hívj meg különböző személyeket, hogy csatlakozzanak hozzád különböző szituációkban. És te is játszhatsz egy fiktív szerepet!” Egy irodalmi játék, egyfajta.

Ahogy a nagyobb induló vállalkozási csoportnál is jellemző, ezek közül az induló vállalkozások közül sok apró és parányi, csak egy ember egy weboldallal és félkész ötlettel. Mindenkit beleveszek–ki tudja, merre tartanak.

Nagyon bátorítalak, hogy játssz az adatbázissal. Kattints néhány linkre. Úgy gondolom, hogy el fogsz bűvölni a sok újítás és merészség, amit ezek a szervezetek mutatnak.

A könyv egyik szponzora, a Book Advisors, a kiadói iparágban történő felvásárlásokra és egyesülésekre specializálódott. Mindig azt javaslom az innovatív startupoknak, hogy keressenek partnereket, és a Book Advisors az a hely, ahová elküldöm őket, hogy átbeszéljék a folyamatot. A könyvkiadásban több elismert M&A cég is rendelkezésre áll, például a The Fisher Company és az Oaklins DeSilva+Phillips. A Book Advisors az egyetlen cég, amelyről tudom, hogy technológiai startupokkal is dolgozik.

AI és a könyvkiadás: Mit csinál jelenleg az iparág?

An icon of a key

Számos prominens kiadói kereskedelmi csoport AI-val kapcsolatos tevékenysége úgy tűnik, hogy a szerzői jogokkal kapcsolatos aggodalmak kórusához csatlakozik. Az Amerikai Kiadók Szövetsége “válasz megjegyzéseket nyújtott be az Egyesült Államok Szerzői Jogi Hivatalának a szerzői jogi törvény és a mesterséges intelligencia (AI) metszéspontjáról szóló vizsgálatában...”

A brit Kiadók Szövetsége megjegyzi, hogy “rendkívül fontos, hogy a kormány minél előbb kézzelfogható megoldásokat vezessen be, hogy megvédje az emberi kreativitást és tudást, amely biztonságos és megbízható AI-t alapoz meg.”

Másrészt a Független Kiadók Szövetsége (IPG), több mint 600 taggal, AI útmutatást és képzést kínál tagjainak, beleértve a “Gyakorlati útmutató az AI-hoz a kiadásban” című dokumentumot, amelyet egy elismert AI és kiadási szakértő, George Walkley tart.

Itt az Egyesült Államokban szerencsés vagyok, hogy része lehetek a Book Industry Study Group (BISG) AI Munkacsoportjának, amely a Munkafolyamat Bizottságnak jelent. A Munkacsoport több lehetséges stratégiai kezdeményezést vázolt fel:

  • Legjobb gyakorlatok és szabványok kidolgozása: Az AI használatával kapcsolatos legjobb gyakorlatok ajánlása, etikai irányelvekhez, meglévő szabályozásokhoz és törvényekhez kapcsolódóan. Ez magában foglalja az AI által generált tartalom átláthatóságát és annak feltüntetését a fogyasztók számára.

  • Ipari felmérések és meghatározások: Felmérések végzése az iparági betekintések megszerzése érdekében az AI jelenlegi és potenciális felhasználási módjairól, valamint világos meghatározások és határok felállítása arról, hogy mit jelent az AI a könyvkiadás kontextusában.

  • Időszakos jelentések és értékelések: Időszakos jelentések nyújtása az iparág számára, hogy előre láthassák és alkalmazkodhassanak az AI technológiák által hozott gyors változásokhoz.

Más írói és kiadói szövetségek is próbálnak előbbre jutni a témában. Néhányan ellenzik az AI-t; mások csak segíteni próbálják tagjaikat megérteni a technológiát, és esetleg kísérletezni vele.

AI és a könyvkiadás: Mit csinálnak a kiadóvállalatok?

Egy évvel ezelőtt a kérdésre, hogy mit csinálnak jelenleg a kiadóvállalatok, a válasz az volt: “nem sokat.” Azóta nem sok minden változott, de volt némi tevékenység. A kereskedelmi könyvkiadókra fogok koncentrálni; a tudományos és akadémiai kiadók aktívabbak. Íme néhány, amit felfedeztem.

Hachette: Az Egyesült Királyságban a The Bookseller 2023 novemberi jelentése szerint a Hachette közzétett egy állásfoglalást az AI-ról, amely különbséget tesz az “operatív” és a “kreatív” felhasználások között. A cég “egyértelművé tette, hogy támogatja az ‘felelős kísérletezést’ az operatív felhasználásokra, de ellenzi a ‘gépi kreativitást... annak érdekében, hogy megvédje az emberek által létrehozott eredeti kreatív tartalmat’.”

HarperCollins: Andrew Albanese és Ed Nawotka Publishers Weekly-ben megjelent 2023 áprilisi jelentése szerint a HarperCollins vezérigazgatója, Brian Murray így nyilatkozott:

“Tudjuk, hogy ez fontos lesz, és jelentős hatással lesz iparágunkra a következő három-öt évben. És így azt hiszem, sokan próbáljuk kitalálni, hogyan és biztosítani, hogy etikus, erkölcsi módon alkalmazzuk, amely segít kiszolgálni a szerzőket és professzionális szolgáltatásokat nyújtani nekik, és nem versenyez a szerzőkkel és a történetmeséléssel.

“És ez, azt hiszem, egy kihívás. Nem annyira talán az összes itt lévő kiadó számára, de garantálom, hogy sok apró technológiai csapat van a világon, akik talán a mi üzletünk iránt érdeklődnek. Nem kiadók, nem szerkesztők. Ők a technológusok, és lehetőséget látnak.”

Penguin Random House (PRH): Bertelsmann, a PRH anyavállalata, kiadott egy tanulmányt State of Play: Exploring Generative AI’s Transformative Effects on the Media & Entertainment Industry címmel, amely tartalmaz egy részleget a könyvkiadásról.

Ezenkívül, a Publishers Lunch jelentése szerint, a vállalat “bemutatta saját belső AI alkalmazását, a PRH ChatGPT-t.”

A cikk szerint a PRH belső dokumentumai elmagyarázzák, hogy a program “‘használható folyamatok egyszerűsítésére, kreativitás fokozására és adat betekintések biztosítására’ az egyes osztályokon. A vállalat szerint az alkalmazás felhasználási területei közé tartozik könyvek és dokumentumok összefoglalása; e-mailek átdolgozása; blogbejegyzések vagy munkaköri leírások megírása; szövegalapú adatok elemzése, és ‘tartalom ötletek generálása.’”

Simon & Schuster: A vállalat vezérigazgatója, Jonathan Karp, említést érdemelt a New York Times “Az utóbbi 25 év legemlékezetesebb irodalmi pillanatai” című cikkében egy idézetével, amelyet a Publishers Weekly 2024 májusi U.S. Book Show-jában jelentettek meg. Azt mondta, hogy az AI nem az “elefánt a szobában”, hanem inkább “olyan, mint a világban a kabóca. Tudod, sok zümmögés és sok párzás.”

Elismerte, hogy az AI “bizonyosan értékes eszköz. Biztosan hatékonyabbá tesz minket. Segít jobban feldolgozni és összegyűjteni az információkat, és remélhetőleg lehetővé teszi a munkavállalók számára, hogy magasabb szintű, érdekesebb és kreatívabb munkát végezzenek.”

Márciusban, a Londoni Könyvvásáron, ahogy azt a The Bookseller jelentette, Karp azt mondta, hogy a vállalat a mesterséges intelligencia által generált hangoskönyvek idegen nyelvű változatait is megvizsgálná “olyan területeken, ahol [az adott szerző] művei egyébként soha nem kapnának esélyt az [audio produkció] költségei miatt.”

AI és könyvkiadás: Az alkalmazási esetek

An icon of a key

A mesterséges intelligencia és a könyvkiadás konkrét alkalmazási eseteit különböző funkciókban könnyű elképzelni. De nem sok információ áll rendelkezésre arról, hogy a kiadók valójában mit csinálnak.

Keith Riegert, az Ulysses Press és a Perfect Bound vezérigazgatója, prezentált a Publishers Weekly 2024 májusi U.S. Book Show-ján, kínálva a legátfogóbb áttekintést, amit a kiadók AI alkalmazási eseteiről láttam. A Perfect Bound a jelentés szponzora; kiállok ezen állítás mellett. Ő kínál “20 gyakorlati módot arra, hogy kiadási szakemberként hogyan kezdheted el az AI használatát azonnal.”

Az ő prezentációját, Getting Started with AI, meg lehet nézni és letölteni a Perfect Bound weboldaláról.

Mi történik, amikor az AI elolvas egy könyvet?

Ezt a szakaszcímet szándékosan Ethan Mollick hírleveléből kölcsönzöm - nincs szükség arra, hogy megpróbáljuk javítani. Mollick a Pennsylvaniai Egyetem Wharton Iskolájának professzora, aki vállalkozást és innovációt tanulmányoz. Az ő hírlevele, amelyet gyakran ajánlok, nyugodt, frissítő és egyedülállóan éleslátó.

Ami Mollicket kommentátorként minősíti, az az, hogy nincs benne érdekeltsége. Nem kell eladnia vagy elítélnie az AI-t. Egyszerűen elkötelezte magát az AI különböző hatásainak feltárása mellett, leginkább az oktatásra, kultúrára, írásra és kiadásra. És kiváló, világos író.

Ha átböngészed Mollick hírlevél archívumait, látni fogod, hogy nem kezdett el az AI-ra koncentrálni 2022 decemberéig. Ez nem volt az ő területe - mint a legtöbbünk számára, az AI betoppant a napi munkájába, és nem tudta levenni róla a szemét.

Ebben a bejegyzésben az ő meglátásai állnak legközelebb a mi érdeklődésünkhöz, mint kiadási szakemberek. “Megváltoztathatja-e az AI,” kérdezi, “azt, ahogyan a könyvekkel kapcsolatban állunk?”

A kérdés megválaszolásához Mollick megjegyzi, “szükségünk van egy AI-ra, amelynek memóriája elég nagy ahhoz, hogy egy könyvet elférjen, és egy szerzőre, aki elég jól ismeri saját könyvét ahhoz, hogy megítélje az AI eredményeit.” Mollick teszteli egyik több címét (nem specifikálja melyiket, de a beszélgetésekből egyértelműen a The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors, egy könyv, amelyet kedvezően értékeltek az Amazonon, bár nem egy jelenlegi bestseller).

Mollick különböző szempontokat vizsgál meg az MI potenciális értékével kapcsolatban egy szerző, kiadó vagy olvasó számára, beleértve az “MI mint olvasó és szerkesztő” és egy “gyakorlati használat: segítség az oktatóknak.” Megkér egy LLM-et—nagy nyelvi modellt—nem a ChatGPT-t—hogy foglalja össze a könyvet. Ez Mollick megelégedésére sikerül.

Ezután egy nehezebb kihívás: “Adj példákat a metaforákra a könyvben.” Rámutat, hogy a metafora “még az emberi olvasók számára is kihívást jelent, mivel a figuratív nyelvezet használatát kell megtalálni egyértelmű jelek nélkül (ellentétben a hasonlattal, itt nincsenek ‘mint’ vagy ‘olyan, mint’ szavak).” Az eredmények, jegyzi fel, “impozánsak, bár vannak kisebb hibák.”

Az LLM kevésbé sikeres mint szerkesztő: hibái ezen a területen, jegyzi meg Mollick, “valamit világossá tesznek az MI jelenlegi állapotáról: ha nagyon jó író vagy szerkesztő vagy, akkor jobb vagy mint a jelenlegi MI…”

Ennek ellenére “az MI-k rendelkeznek, vagy legalábbis úgy tűnik, hogy rendelkeznek a szöveg kontextusának és jelentésének megértésével.” Ennek eredményeként Mollick úgy véli, hogy “az, ahogyan a könyvekkel kapcsolatos viszonyunk változni fog az MI-nek köszönhetően.”

Én is így gondolom.

MI és könyvtervezés & gyártás

An icon of a key

A szakértői rendszerek és a folyamat automatizálása még mindig előrébb tartanak az MI-nél, amikor a könyvtervezésről és gyártásról van szó.

A könyvek automatikus tördelésére szolgáló szoftverek legalább az 1970-es évekre nyúlnak vissza. Az 1980-as évek közepén felügyeltem egy PageOne nevű szoftverprojektet, amely Donald Knuth TeX alapú volt, és percek alatt képes volt egy könyvet tördelni. SGML megjelent körülbelül ugyanebben az időben, egy 1969-ben bevezetett dokumentum szabvány alapján. Ezt nagyrészt az 1996-ban bevezetett XML váltotta fel. Ezek a robusztus jelölőnyelvek szilárd struktúrákat hoznak létre az automatizáláshoz.

Az asztali kiadványszerkesztés egy újabb automatizálási kört hozott a QuarkXPress és az Adobe InDesign, valamint az Adobe Illustrator és az Adobe Photoshop számára. A kiadói munkafolyamatokat különböző programokkal és rendszerekkel lehet kezelni.

Egy figyelemre méltó szervezet a Coko Foundation. Egy nyílt forráskódú gyártási és kiadási menedzsment eszközcsomagot kínálnak, beleértve a Kotahi-t, egy tudományos kiadási platformot, és a Ketty-t könyvgyártáshoz, amely tartalmaz egy MI asszisztenst. A Kotahi MI PDF Designer, “a PDF tervezést egy egyszerű, interaktív folyamattá alakítja.”

Vannak korai kezdeményezések az MI integrálására az InDesign munkafolyamatokba. 2024 áprilisában az Adobe bejelentett egy Text to Image funkciót. Harmadik felek talán előrébb járnak az Adobe-nál: az innovatív előnyomási és gyártási szolgáltatók Indiában, mint például a Hurix Digital és az Integra, több kezdeményezést mutatnak az MI gyártásban való felhasználásában, mint az Adobe.

MI és könyvmarketing

An icon of a key

Az MI hatása a könyvmarketingre rövid távon sekélyes lesz, de hosszú távon sokkal mélyrehatóbb. Sok múlik azon, hogy mit tekint ‘könyvmarketingnek’; ez változik.

A ‘könnyű zsákmány’ nyilvánvaló. Kérd meg a Chat MI-t, hogy segítsen egy termékleírás vagy egy sajtóközlemény megírásában. Kérd meg, hogy javasoljon néhány kulcsszót. Ezt meg tudja tenni, izzadás nélkül. De a legtöbb kiadói szakember ugyanezt meg tudja tenni, csak egy kis izzadással.

Keith Riegert fent linkelt felhasználási esetei közé tartozik címötletek brainstormingja, digitális marketing jelentés vázlatának elkészítése és digitális marketing kampány nyomon követő létrehozása a Google Sheets-ben.

A fent leírt Shimmr szoftver utal az automatizált marketing jövőjének alakjára.

MI és metaadatok

An icon of a key

Mi köze van az MI-nek a metaadatokhoz, és fordítva? Szerepe eddig szerénynek tűnik; várjunk néhány nagy változást.

A metaadatok alapvetőek a könyvek felfedezhetőségéhez. Ezt már annyiszor hallottad, hogy az intés már hányingerkeltő. Ez főleg azért van, mert a “metaadatok” a legtöbb nem technikai ember számára megfoghatatlanok maradnak. Ha azt mondod, “ez csak az alapvető információ a könyvről, a cím, leírás, ár, tárgykategóriák, ilyen dolgok,” az emberek megkönnyebbülnek. Ezzel kényelmesen érzik magukat. De ennyi az egész.

Sajnálattal emlékeztetem önöket, hogy a metaadatok valójában sokkal többet jelentenek, mint néhány részlet a könyvről. Sokkal többet. Többet, mint amit ebben a kis könyvben le tudnék fedni. Társszerzője vagyok egy egész könyvnek a témáról. Az Ingram kiadja a Metadata Essentials-t, egy kiváló rövid kötetet. Elmondom most, de nem utoljára: az írók és a kiadók súlyos árat fizetnek, ha elhanyagolják a metaadataikat.

Az AI segíthet a metaadatok generálásában. Például az önkiadó szolgáltató, a PublishDrive, AI-alapú könyv metaadat generátort kínál, amely AI-ajánlásokat nyújt a könyvcímhez, a rövid leíráshoz, az Amazon kategóriákhoz, a BISAC kategóriákhoz és a kulcsszavakhoz.

A Veristage Insight, amelyet fentebb ismertettünk, képes leírásokat, kulcsszavakat, BISAC kategóriákat generálni, és meghatározhatja a célközönséget.

Az AI használatának bejelentése a metaadatokban

An icon of a key

Azt gondolhatnánk, hogy a metaadatok tekintélyes világa lassan alkalmazkodik az AI-hoz. Nem így van! Tavaly novemberben az EDItEUR, az ONIX szabvány őrzője, kiadott egy rövid alkalmazási jegyzetet “Aspects of AI in ONIX” címmel. (pdf)

Graham Bell, a szervezet igazgatója, szokásos mély bölcsességével megjegyzi, hogy “egy reakció (a technológiával kapcsolatos vitákra) az, hogy elutasítjuk az AI használatát vagy elkerüljük az AI által létrehozott termékek kereskedelmét. Egy reálisabb lehetőség az, hogy egyszerűen átláthatóak legyünk a kereskedelmi partnerekkel és az olvasókkal, amikor AI-t használtunk. És mivel néhány viszonteladó korlátozza vagy betiltja az AI-alapú tartalmat a platformjaikról, fontos, hogy a megbízható kiadók kiemeljék azokat a termékeket, amelyek generatív AI technikákat használnak a tartalom létrehozásához.”

Bell ismerteti, hogyan jelezhetik a kiadók a metaadatokban:

  • AI közreműködők

  • AI-alapú hangok hangoskönyvekben

… valamint egy módszert, amellyel jelezhetik a digitális termékek metaadataiban, hogy a kiadó kifejezetten kizárja a szöveg- és adatbányászatot (TDM) a kutatáson kívüli felhasználásokra. Van egy mód arra is, hogy külön licencet határozzanak meg a kereskedelmi vagy nem kutatási célú TDM-re.

Ami gyakran előfordul, hogy amit az ONIX-ban meghatároznak, az nem mindig kerül napvilágra a lánc végén, de legalább egy legjobb próbálkozás megtörtént.

Stratégiák az AI beépítésére a kiadói műveletekbe

An icon of a key

Kevés dolog van, amit a kiadói cégek kevésbé kényelmesen csinálnak, mint a bonyolult digitális technológiák beépítése a napi működésükbe. Ez érthető. Az AI, különösen, szorongást okoz mindenkinek, nem csak a kiadói szektorban. Új, rejtélyes, személyre szabott, hatékony. Az emberek számos okból fenyegetve érzik magukat az AI-tól. Az attitűdök megváltoztatása időt vesz igénybe.

De ez nem a legjobb idő a technológiától való félénknek lenni.

Vannak nyugodt és racionális megközelítések az AI beépítésére a kiadói műveletekbe, függetlenül a szervezet méretétől.

Az ösztönzésnek a legfelső szintről kell érkeznie. A legfelsőbb szintről. A felső vezetőknek el kell fogadniuk az AI potenciálisan átalakító hatásának vízióját, és kommunikálniuk kell egy programot a szervezeten belül. A program lehet, hogy nem több, mint “kísérletezzen, dokumentálja a kísérleteit, és ossza meg.” Ez egy jó kezdés.

A The Economist nemrégiben hivatkozott egy új technológia bevezetésére szolgáló szervezeti taktikára, amelyet “világítótorony-megközelítésnek” neveznek. Létrehoznak egy jelzőfényt egy olyan magas profilú bizonyítékkoncepció kiválasztásával, amely gyorsan végrehajtható, és amelyhez mindenki kapcsolódhat.

A kiadói cégeket hátráltatja a szerzői jog körüli felhajtás: az írók felháborodottak. A 2023 májusában végzett Authors Guild felmérés megállapította, hogy “az írók 90 százaléka úgy véli, hogy az írókat kompenzálni kell, ha munkájukat használják generatív AI technológiák képzésére,” és 67 százalékuk azt mondta, hogy “nem biztos benne, hogy kiadási szerződéseik vagy platformszolgáltatási feltételeik tartalmazzák-e az AI-val kapcsolatos célú felhasználásra vonatkozó engedélyeket vagy jogok biztosítását.” Ezek a bizonytalan írók most kérdezik a kiadóikat, hogy használnak-e AI-t a munkáik szerkesztése vagy előállítása során, és néhány befolyásos író ragaszkodik ahhoz, hogy ne használják. Olyan AI-egyenértéket keresnek, mint egy földimogyorómentes pékség.

Ez egy szúrós probléma a kiadók számára - ha nem használhatják az AI-t a kiadni tervezett könyveknél, mire használhatják?

AI irányelvek kidolgozása és kommunikálása

Annak ellenére, hogy széles körben használják, kevés kiadó határozta meg nyilvánosan AI irányelveit, és kommunikálta megközelítéseit az AI-hoz a nyilvánosság felé. A “nyilvánosság” kifejezésnek csúszós jelentősége van itt, amikor figyelembe vesszük a különböző közönségeket, amelyeket a kereskedelmi, tudományos és oktatási kiadók megcéloznak.

A kereskedelmi kiadók számára a legfontosabb közönség az írók és azok ügynökei. A tudományos kiadók más akadályokkal szembesülnek, amikor az MI ígéretes hatását mérlegelik a kutatásra, majd az MI problémásabb hatását a kutatás narratívává alakításában (Avi Staiman írt egy gondolatébresztő bejegyzést a témáról). Az oktatási kiadóknak nehéz politikákat kidolgozniuk, mivel az MI beavatkozása a tanítás és az oktatás gyakorlatába sokrétű és összetett.

Úgy gondolom, hogy a kiadók két nagy kihívással néznek szembe, amikor az MI technológiákkal haladnak előre. Az első az, hogy kialakítsanak egy vállalati álláspontot az MI általános megközelítéséről, arról, hogyan építsék be az MI-t a munkafolyamataikba. A második kihívás az, hogy ezt az álláspontot világosan és egyértelműen kommunikálják az érintettekkel.

Az általam látott kiadói politikák többnyire hibásak. Néhányuk valójában külsőleg irányuló politikák, az írók felé, különböző figyelmeztetésekkel arról, mi az elfogadható gyakorlat (nem sok) és mi nem elfogadható (sok). Az O’Reilly “MI használati politikája tehetségek számára, akik tartalmat fejlesztenek az O’Reilly számára” oldalakon át tart, esoterikus útmutatásokkal, mint például “NE használjon semmilyen OSS GenAI modellt, amely olyan szoftver kimenetet hoz létre, amely egy copyleft vagy hálózati vírusos nyílt forráskódú licenc feltételeinek van alávetve.”

Másrészt a tudományos kiadó Elsevier, a “Elsevier politikák” szekciójában a weboldalán, tartalmaz nyilatkozatokat a “Felelős MI elveiről”, “Szöveg- és adatbányászatról”, és a “Generatív MI és MI-asszisztált technológiák használata az Elsevier számára írásban.”

A néhány belső, nem publikált kiadói politika, amit láttam, konzervatív, túlzottan is. Ezek a kiadók túl gyorsan reagáltak az észlelt és lehetséges fenyegetések skálájára, és az íróik aggodalmaira, és megbénították saját képességüket arra, hogy erőteljesen foglalkozzanak ezzel a gyorsan fejlődő, gyorsan változó technológiával.

Adott, hogy ‘felelősségteljesen’ fogják használni az MI-t, bármit is jelentsen ez. Adott, hogy a legnagyobb gondot fordítják az írók szellemi tulajdonára és az írói szerzői jogok agresszív védelmére. (Bár természetesen ezeket a széles elveket nyilvánosan kell deklarálni, és gyakran meg kell ismételni.)

De mi mást?

  • Megengedik-e, hogy az MI szerepet játsszon a szerkesztői beszerzésekben? Az MI átnézheti-e a kéziratokat?

  • Megengedik-e, hogy az MI szerepet játsszon a fejlesztői szerkesztésben, sor szerkesztésben és korrigálásban?

  • Megengedik-e, hogy az MI szerepet játsszon a nyomtatási példányszámok és kiosztások meghatározásában?

  • Az akadálymentes e-könyv fájlok létrehozásában, beleértve az alternatív szövegeket?

  • A hangoskönyvek létrehozásában olyan esetekben, amikor nem gazdaságilag reális tehetséges emberi narrátorokat alkalmazni?

  • A fordítások segítésében olyan piacokra, ahol a jogokat soha nem adták volna el?

  • A marketing anyagok nagy léptékű fejlesztésében?

  • A viszonteladókkal való kommunikációban?

Ha igen, akkor ezt világosan meg kell tenniük, és világosan el kell magyarázniuk a politikák mögötti gondolkodást. A kiadóknak bátraknak kell lenniük, hogy szembeszálljanak a legtöbb író sok kifogásával ebben a félelem és kétség idején.

Állás szempontok

An icon of a key

Csak a legnagyobb kiadók képesek dedikált személyzetet felvenni az MI szoftverekkel és rendszerekkel való munkára. Az átlagos kiadó azt szeretné, hogy minden dolgozója találkozzon az MI eszközökkel, elvárva, hogy mindegyikük felfedezze, hogyan találhat hatékonyságot a munkájában az MI használatával.

A 2024 februári PubWest konferencián Arizonában egy előadó a kiadói iparon kívülről azt javasolta, hogy az MI egyik felhasználási területe az internsek helyettesítése lesz. A terem lángra lobbant. Jól gondolta—valójában egy 2024. április 10-i jelentés a New York Times szerint azt írja le, hogyan keresik a Wall Street-i befektetési bankok, hogy sok internüket MI-vel helyettesítsék. Hasonlóan a kiadói esethez, egy nyilvánvaló aggodalom az: hogyan találhatók meg a szenior elemzők, ha nem kezdhetik junior elemzőként?

A kiadói ipar mindig is támaszkodott a gyakornokokra. Egy 2019-es tanulmány megállapította, hogy a kiadásban kevesebb mint tizenöt éve dolgozó emberek 80 százaléka korábban gyakornok volt.

Részben ez egy módja annak, hogy a durva munkát ésszerű költséggel végezzék el. De ez eltörpül a nagyobb valóság mellett, hogy egyetlen kiadói iskola sem képes valakit középvezetői szinten csatlakoztatni egy kiadóhoz. Az egyetlen módja annak, hogy a holnap képzett személyzetét fejlesszük, az az, hogy ma gyakornokokat és tanoncokat képezzünk.

Az itt kitűzött cél nem az, hogy az internseket MI-vel helyettesítsük, hanem inkább az, hogy a munkájukat produktívabbá és kielégítőbbé tegyük az MI eszközeinek felhasználásával, mind a gyakornok, mind a kiadó cég számára előnyös módon.

AI a hangoskönyvekhez

An icon of a key

Az AI a hangoskönyvekhez nagyon jól működik. Nem tökéletes, de működik. A szerzők és kiadók mostanra rutinszerűen használják az AI eszközöket a hangoskönyvgyártásban, elsősorban olyan könyvek esetében, ahol a teljes narrátor-központú hangoskönyvgyártás pénzügyileg nem megvalósítható. És nemcsak az angol nyelvű hangoskönyvek esetében, hanem a fordított hangoskönyvek esetében is.

Az AI használata a hangoskönyvekhez nem új; először 2021-ben számoltam be a trendről a Publishers Weekly cikkében. De az újabb nagy nyelvi modellek új erőt adtak az automatizált hangoskönyv-narráció technológiájának.

2021-ben megjegyeztem: “Tökéletes? Biztosan nem. Lehet elég jó? Valószínűleg, ha a kiadó hajlandó időt szánni a projekt hang szerkesztési fázisára.” Két és fél évvel később, sokak szerint, az AI-hangok megkülönböztethetetlenek az emberi hangoktól, hacsak nem figyelünk nagyon alaposan.

Tavaly novemberben a Meta (Facebook) bemutatta a “Seamless” nevű programját, amely képes “átvinni a hangnemeket, érzelmi kifejezéseket és vokális stílusminőségeket” 200 nyelv fordításába. Egy hangoskönyv azonnal több nyelvre lefordítható kivételes minőségben.

2021-ben arról is beszámoltam, hogy “Az Audible blokkolása a nem emberi narrátorokkal rendelkező hangoskönyvek terjesztésével valódi probléma, amelynek megoldása időt vehet igénybe.” Eközben a Google és az Apple is bejelentette programjait, amelyek lehetővé teszik a szerzők számára, hogy AI által generált hangokkal készítsenek hangoskönyveket. December 5-én a Findaway Voices by Spotify elkezdte elfogadni a “digitális hang narrált hangoskönyveket a Google Play Books-tól, hogy kiválasztott kiskereskedelmi partnerek számára terjeszthesse.”

2023 november elején az Amazon bejelentette, hogy a Kindle Direct Publishing (KDP) szerzői hamarosan hozzáférhetnek egy szolgáltatáshoz, amely lehetővé teszi számukra, hogy “gyorsan és könnyen készítsenek hangoskönyv verziót e-könyvükből virtuális hangnarrációval, egy szintetikus beszédtechnológiával.” 2024 januárjában Jane Friedman jelentette (fizetős tartalom), hogy “Az Audible csendben elkezdte engedni az AI-narrált hangoskönyvek belépését a boltjába tavaly ősszel, jóval azután, hogy más kiskereskedők ugyanezt tették.”

És természetesen én is AI-t használok ennek a könyvnek a hangoskönyv verzióihoz.

AI a könyvfordításhoz

An icon of a key

Az AI a könyvfordításhoz működik. Talán nem olyan jól, mint az automatizált hangoskönyv készítéshez. De nagyon gyorsan közeledik. A nem irodalmi fikció lehet az első. Az irodalmi fikció követheti. A nemfikció más kihívások elé állít.

2024 júniusában egy webináriumot tartottam az AI könyvfordításhoz a BISG támogatásával. A videó online elérhető a YouTube-on. Jane Friedman is leírta a programot a Hot Sheet hírlevelében.

A téma összetett és árnyalt. Ami lenyűgöző, hogy mennyi ideje próbálják automatizálni a fordítást. Emlékeztet arra, hogy a könyvek, amelyek kitöltik univerzumunkat, milyen kis arányát teszik ki az írott kommunikációnak, különösen ebben az online korban.

Warren Weaver, akit a gépi fordítás (MT) atyjának tartanak, egy kollégájának ezt mondta: “Amikor egy orosz cikket nézek, azt mondom: ‘Ez valójában angolul van írva, csak valami furcsa szimbólumokkal van kódolva. Most dekódolni fogom.’” Egy gép számára a nyelv csak kód. Nem kultúra és érzés és az írott nyelv nagyszerűsége. Ez egy feladat számokkal és kóddal.

Nyilvánvaló, hogy az irodalmi fikció / nemfikció megosztása nagy szerepet fog játszani az AI fordításában. A Chat AI erős a stílusban, de hiányzik a tényekben. Még nagyon korai szakaszban vagyunk, de hajlamos vagyok azt gondolni, hogy a Chat AI ragyogni fog a fikcióban, de hiányosan teljesít a nemfikcióban. (Ennek ellenére folytatom ennek a tényekkel teli könyvnek a gépi fordítását!)

Az irodalmi fikció nagyon is az elefánt a szobában. Ez értékes és tisztelt, és joggal. A fordítók órákig vitatkozhatnak egyetlen szóról vagy kifejezésről. A Chat AI-nak óvatosan kell járnia ezekben a vizekben.

De ez termékeny terület. Amennyire meg tudom állapítani (kevés adatból), 2023-ban csak 9500 kereskedelmi könyvfordítás történt. Még ha nagy tényezővel tévedek is, egyértelmű, hogy kevés könyvet fordítanak idegen nyelvekről angolra.

Hasonlóképpen, találtam egy statisztikát, amely szerint 2023-ban csak 7230 fordítás történt angolról spanyolra (a spanyol könyvpiacokon). Ez nevetségesen kevésnek tűnik.

Itt hatalmas lehetőség rejlik.

Az AI könyvfordításra való felhasználása leginkább olyan könyvekre terjed majd ki, amelyek fordítását gazdaságilag sosem tartották megvalósíthatónak. Valószínűleg hatással lesz a „középpiac” könyveinek fordítóira; a munka növekedése a projektek kezelésében és a minőségbiztosításban várható. Ellensúlyozza-e majd ez a munkahelyek elvesztését? Nem valószínű.

Mint az AI legtöbb területén, itt is kihívásokkal teli kérdések merülnek fel, és nincs egyszerű válasz.

Ahogy a szoftver részben megjegyzem, a Leanpub és a DeepL az a két cég, amelyek AI-támogatott könyvfordítási szolgáltatásokat kínálnak szerzőknek és kiadóknak.

AI a tudományos kiadásban

An icon of a key

A kereskedelmi kiadóknak és a szerzőknek mindenféle szempontból érdemes figyelemmel kísérniük az AI fejlődését a tudományos kiadói közösségben. Ez sokkal gyorsabban halad előre, mint a fogyasztói kiadásban.

Két okot látok a fejlődés mögött. Először is, a tudományos kiadásban a szerzők hivatásos akadémikusok, és az STM szektorban (tudományos, műszaki és orvosi), gyakran tudósok magas fokú végzettséggel. A kiadástól függetlenül, munkájuk során kutatják és gyakran elfogadják az AI-t. Meglepődnének, ha a kiadójuk nem vizsgálná az AI használatát a munkájuk szerkesztésében és kiadásában.

Ez áramlik fel a tudományos kiadói ökoszisztémába, ahol gyakran az szerkesztők maguk is tudósok. Számukra a technológia nem megfélemlítő.

Nem fogok mélyebben belemenni a részletekbe ebben a könyvben; erről részletesebben a blogomban fogok beszámolni.

AI a szerzők számára

A szerzők és a kiadók gyakran úgy tekintenek magukra, mint akik két különálló világban élnek, kapcsolódnak, de lényegében különállnak. Ez nagyrészt igaz volt a modern kiadásban.

Az idők változnak. Ahol a kiadók egykor érinthetetlenek voltak, ma már a legjobb szerzők diktálják a feltételeket. Ahogy máshol tárgyalom, az önállóan kiadott szerzők az úttörők. Nem viselik a hagyományos kiadás terheit.

Amikor a kiadók az AI-ra tekintenek, kevés lehetőséget látnak. Amikor a szerzőkkel beszélek az AI-ról, a világ az övék. A lehetőségek szinte végtelenek:

Írás és szerkesztés

  • Egész könyvek írása és kiadása

  • Új projekt ötletelése

  • Ötletelés egy új könyvön belül

  • A történet finomítása

  • Kutatás

  • Tényellenőrzés

  • Írói társ

  • Fejlesztési szerkesztés

  • Lektorálás

  • Helyesírás- és nyelvhelyesség-ellenőrzés

  • Korrektúra

Illusztráció/képalkotás

  • Illusztrációk és diagramok készítése

  • Borítóterv vázlatok

  • Videó promóciók

Marketing

  • Automatikus beküldés ügynököknek, kiadóknak, versenyeknek, barátoknak, ajánláskéréseknek

  • Marketinganyagok generálása: sajtóközlemények, blogbejegyzések, közösségi média, stb.

  • Weboldal készítés

A szerzők fogják meghajtani az AI iparági elfogadásának nagy részét, legyen az támogató vagy ellenző.

Ők részesülnek az AI körüli startup innovációk nagy részéből az írás és kiadás terén — a startupok mintegy 70%-a a szerzőkkel kíván együttműködni az útjuk során.

Az AI-val kapcsolatos aggodalmak és kockázatok

An icon of a key

Az AI-val kapcsolatos aggodalmak komolyak. A kockázatok valósak. Néha hisztérikus módon fejezik ki őket, de ha mélyebbre ásunk, az AI hatása potenciálisan rendkívül pusztító lehet.

Az AI-val kapcsolatos kérdések és aggodalmak annyira sokrétűek, hogy önmagukban köteteket töltenek meg. Íme egy szókép a témákról, amelyeket figyelemmel kísérek. Biztos vagyok benne, hogy néhányat kihagyok.

Egy szókép az 'AI' kifejezés körül, olyan kapcsolódó kifejezésekkel, mint 'aggodalmak', 'etika' és 'emberiség'.

Rengeteg információ áll rendelkezésre ezekről a témákról, és bátorítalak, hogy olvass el mélyen, amennyire csak tudsz. Lehetséges, hogy arra a következtetésre jutsz, hogy a kockázatok meghaladják az előnyöket, és hogy nem akarod az AI-t alkalmazni, akár személyesen, akár a szervezetedben. Ez a döntés saját kockázatokat hordoz; a szokásos, hogy lemaradsz. De ez egy személyes döntés.

Ha beírod a Google-ba, hogy „könyvek az AI kockázatairól”, számos értékes kötetet találsz. Egy nemrégiben hallgatott podcast, amit különösen hátborzongatónak találtam, az Ezra Klein beszélgetése Dario Amodei-vel, az Anthropic társalapítójával és vezérigazgatójával (az a cég, amely a Claude.ai-t fejleszti). Megtudhatod, hogy ezek a cégek tisztában vannak a kockázatokkal. Amodei utal egy belső kockázatbesorolási rendszerre, amelyet A.S.L.-nek hívnak, az „AI Safety Levels” (nem az American Sign Language) rövidítése. Jelenleg az ASL 2 szinten vagyunk, „rendszerek, amelyek korai jeleit mutatják a veszélyes képességeknek – például biológiai fegyverek építésére vonatkozó utasítások adásának képessége.” Az ASL 4-et úgy írja le, mint „állami szintű szereplők képességeinek jelentős növelését… ahol attól tartanánk, hogy Észak-Korea, Kína vagy Oroszország jelentősen növelheti támadóképességét különböző katonai területeken az AI segítségével, ami jelentős előnyt biztosítana számukra a geopolitikai szinten.” Hátborzongató dolgok.

Ebben a komor kontextusban kiemelem az írók és kiadók számára legfontosabb kérdéseket.

Szerzői jog megsértése?

An icon of a key

A szerzői jogi kérdések bonyolultak és kétértelműek. Úgy tűnik, hogy bizonyos könyvek, amelyek még szerzői jogi védelem alatt állnak, bekerültek egyes nagy nyelvi modellek (LLM-ek) képzésébe. Azonban nem igaz, hogy minden szerző műve bekerült mindegyik nagy nyelvi modellbe, ahogy azt egyes szerzők félnek.

A szerzői jogi kérdések egyszerre specifikusak és átfogók. Köztudott, hogy az összes LLM az interneten elérhető nyílt adatokon alapul—minden, ami az 1,5 milliárd weboldalról lekaparható, legyen az újságcikk, közösségi média poszt, web blog vagy látszólag YouTube videók átiratai.

Bizonyítható, hogy legalább az egyik LLM több ezer, nem nyilvános könyv szövegét is bevitte.

Törvényes volt-e mindezt a szöveget felhasználni milliárd dolláros AI cégek építéséhez, anélkül, hogy bármilyen kompenzációt fizettek volna a szerzőknek? Az AI cégek a méltányos használatra hivatkoznak; a bíróságok végül eldöntik. Még ha törvényes is volt, etikus vagy erkölcsös volt-e? Az etikai kérdések kevésbé bonyolultak, mint a jogi megfontolások. Döntse el ön.

A szerzői jogi törvények nyilvánvalóan nem számítottak az AI által hozott egyedi kihívásokra, és a jogi megoldások keresése időbe telik, talán évekbe is. (Ha mélyebben szeretne elmerülni abban, hogy miért nem alkalmasak a törvények a jelenlegi problémára, olvassa el A. Feder Cooper és James Grimmelmann kiváló cikkét, amelynek címe “The Files are in the Computer: Copyright, Memorization, and Generative AI.”)

Íme egy lista a tizenhárom legjelentősebb perről, amelyek nem mindegyike könyvekkel kapcsolatos; hanem képekkel és zenével is. És itt van egy másik lista, amely frissíti az összes per állapotát.

Szerzői jog és AI az írók számára

An icon of a key

Az írók további kérdésekkel szembesülnek az AI által generált tartalom szerzői jogvédhetőségével kapcsolatban.

A U.S. Copyright Office álláspontja az AI által generált tartalom szerzői jogvédhetőségéről kimondja, hogy az AI önmagában nem tarthat szerzői jogot, mivel nem rendelkezik jogi státusszal, mint szerző. Ez érthető. De ez feltételezi, hogy a munka 100%-a AI által generált. Ahogy máshol is tárgyaltuk, kevés szerző fogja hagyni, hogy az AI egy egész könyvet generáljon. Valószínűbb, hogy ez 5%, vagy 10% vagy… És itt a Copyright Office megbotlik (ahogy én is).

Egy újabb döntés során az Office arra a következtetésre jutott, hogy egy grafikus regény, amely ember által írt szövegeket és az AI szolgáltatás Midjourney által generált képeket tartalmaz, szerzői jogvédett műnek minősül, de az egyedi képek nem védhetők szerzői joggal. Ez durva!

An icon of a key

Elég annyit mondani, hogy az íróknak és kiadóknak figyelniük kell a szerzői jogi kérdések fejlődésére, több fronton is.

Melyek a hosszú távú következmények?

Egyesek a jelenlegi pereskedést a Google könyvek peréhez hasonlítják, amelynek jogi megoldása tíz évig tartott. Ki tudja, meddig húzódik majd a fellebbezési folyamat ezeknél a beadványoknál. Addig is, a kiadók bölcsen cselekszenek, ha úgy viselkednek, mintha az AI vállalatok veszítenének, ami legalább elméletileg kiteszi azokat, akik licencelik vagy akár használják a Chat AI-t, valamiféle feltételes felelősségnek.

De ez nem a kiadók legkomolyabb problémája. Ez az észlelés. Sok szerző, néhány prominens, néhány ismeretlen számára a kút megmérgeződött. Az AI radioaktív az írás és kiadás közösségében. Bármi, ami akár csak érintőlegesen is AI-ra utal, intenzív kritikát vált ki.

Számos példa van. Egy közelmúltbeli esetben az Angry Robot, egy brit kiadó, amely “a modern felnőtt sci-fi, fantasy és WTF legjobbjainak szenteli magát,” bejelentette, hogy az AI szoftvert, a Storywise fogja használni, hogy átválogassa a várhatóan nagy mennyiségű kéziratot. Csak öt órába telt, hogy a cég elvetette a tervet és visszatért a “régi beérkező levelekhez.”

A kereskedelmi kiadók számára az AI eszközök belső használatával kapcsolatos elviselhetetlen dilemma: ha a szerzők megtudják, nehezen fogják tudni átvészelni a következmények viharában. Úgy gondolom, hogy a kiadóknak nincs más választásuk, mint bátornak lenni, elfogadni (legalább néhány) eszközt, világosan elmagyarázni, hogyan képzik ezeket az eszközöket, és hogyan használják őket, majd folytatni az utat.

Az Egyesült Királyságban, The Society of Authors kemény álláspontot képvisel: “Kérje meg kiadóját, hogy erősítse meg, hogy nem fog jelentős mértékben AI-t használni semmilyen célra a munkájával kapcsolatban - például korrektúrázás, szerkesztés (beleértve az autenticitás ellenőrzést és a tényellenőrzést), indexelés, jogi átvilágítás, tervezés és elrendezés, vagy bármi más anélkül, hogy Ön hozzájárulna. Lehet, hogy meg szeretné tiltani az AI által végzett hangoskönyv narrációt, fordítást és borítótervezést.”

Az Authors Guild úgy tűnik, elfogadja, hogy “a kiadók kezdenek felfedezni az AI használatát, mint eszközt a szokásos működésük során, beleértve a szerkesztési és marketing célokat.” Nem hiszem, hogy a Guild sok tagja ennyire megértő lenne.

Tartalom licencelése AI cégeknek

A legtöbb kiadó és sok szerző keresik a módját, hogy tartalmat licenceljenek AI cégeknek. Mindenkinek más elképzelése van arról, hogy milyenek legyenek a licencfeltételek, és mennyit ér a tartalmuk, de legalább a megbeszélések megkezdődtek.

Számos startup szeretne együttműködni a kiadókkal (és egyes esetekben az egyéni szerzőkkel is). Ebben a tekintetben mind a Calliope Networks, mind a Created by Humans érdekes.

Július közepén a Copyright Clearance Center, amely hosszú ideje az iparág fő szereplője a kollektív szerzői jogi licencelés területén, bejelentette, hogy “az éves szerzői jogi licencei (ACL) keretében az AI újrafelhasználási jogokat is kínál, egy vállalati szintű tartalomlicenc-megoldást, amely jogokat kínál több millió műből a feliratkozó vállalkozások számára.”

A Publishers Weekly tudósított a bejelentésről, idézve Tracey Armstrongot, a CCC elnökét és vezérigazgatóját, aki azt mondta: “Lehet pro-AI és pro-szerzői jog is lenni, és az AI-t a teremtők tiszteletével párosítani.”

Bár nem mindenre kiterjedő, ez valószínűleg áttörés a kiadók és a nagy nyelvi modellek fejlesztői közötti együttműködés felé.

Túl késő elkerülni az AI-t

An icon of a key

Azoknak a szerzőknek és kiadóknak, akik inkább nem érintkeznek AI-val, rossz hírem van: ma is használják az AI-t, és már évek óta használják.

Az AI különböző formákban már integrálva van a legtöbb szoftvereszközbe és szolgáltatásba, amelyeket naponta használunk. Az emberek az AI-alapú helyesírás- és nyelvtanellenőrzésre támaszkodnak olyan programokban, mint a Microsoft Word vagy a Gmail. A Microsoft Word és PowerPoint AI-t alkalmaz, hogy írási javaslatokat tegyen, tervezési és elrendezési ajánlásokat adjon, stb. A virtuális asszisztensek, mint a Siri és az Alexa, természetes nyelvfeldolgozást használnak a hangparancsok megértésére és kérdések megválaszolására. Az e-mail szolgáltatások AI-t használnak az üzenetek szűrésére, a spam felismerésére és riasztások küldésére. Az AI hajtja az ügyfélszolgálati chatbotokat és generálja a termékajánlásokat a vásárlási előzményei alapján.

És ennek nagy része a nagy nyelvi modellekre épül, mint például a ChatGPT.

Egy szerzőnek vagy szerkesztőnek azt mondani, hogy “Nem akarom, hogy AI-t használjanak a kéziratomon,” általánosságban szinte lehetetlen, hacsak ők és szerkesztőik nem írógéppel és ceruzával dolgoznak.

Megpróbálhatják azt mondani, hogy “Nem akarok generatív AI-t” használni a könyvükön. De ezt nehéz megvalósítani. A nyelvtanellenőrző szoftvereket eredetileg nem generatív AI-ra építették. A Grammarly hozzáadta ezt összetevőként a termékéhez, és minden más helyesírás- és nyelvtanellenőrző is így fog tenni. A generatív AI szintén alapvető az elérhető marketing szoftverekben.

Amikor a szerzők AI-t használnak

A szerzők és az AI használatának egy másik aspektusa hasonlóságokat mutat a fent tárgyalt szerzői jogi kérdéssel. Szélsőséges esetben 100%-ban AI által generált tartalmat látunk megjelenni az Amazonon. A legtöbb (minden?) borzalmas minőségű, de ez nem akadályozza meg, hogy megjelenjen. (Lásd még az Amazon szekciót.) A kiadók számára aggasztóbb az AI által generált benyújtások. Igen, az AI növeli a mennyiséget, de a nagy kiadóknak már van szűrőjük a mennyiségre. Ezeket az ügynököknek hívják. Nekik kell majd kitalálniuk, hogyan kezeljék a mennyiségi problémát, és úgy tűnik, olyan megoldást kell találniuk, amely nem használ AI-t.

Ez valami létezési probléma - akarok-e egy könyvet kiadni, amelyet egy ‘gép’ írt? A legtöbb kiadó számára ez egyértelmű ‘nem.’ Egyszerű. Nos, mi a helyzet egy olyan könyvvel, ahol a tartalom 50%-át egy nagy nyelvi modell generálta, egy képzett szerző felügyelete alatt? Hmm, próbáljuk meg azt is egy ‘nem’-mel. Rendben: mi a helyzet 25%, vagy 10%, vagy 5% esetén? Hol húzod meg a határt?

És most, hogy beléptél a határvonal-húzás üzletébe, hogyan oldod meg azt a dilemmát, hogy a helyesírási és nyelvtani eszközök most már legalább részben generatív MI-re támaszkodnak? Mi a helyzet az MI-alapú átíró eszközökkel, mint például Otter.ai, vagy a Microsoft Word beépített átírási funkciója?

Nem találok olyan kereskedelmi kiadót, amely kijelentette volna, hogy nem ad ki olyan művet, amely előre meghatározott mennyiségű MI-generált szöveget tartalmaz. Íme az Authors Guild véleménye a témáról:

“Ha a kéziratodban észlelhető mennyiségű MI-generált szöveg, karakter vagy cselekmény található, ezt közölnöd kell a kiadóddal, és a közönséggel is. Nem gondoljuk, hogy szükséges lenne a szerzőknek nyilvánosságra hozni a generatív MI használatát, ha azt csak ötletelésre, ötletgenerálásra vagy szövegszerkesztésre használták.”

Mondanom sem kell, hogy az ‘észlelhető’ nincs meghatározva (az Oxford szótár szerint: “elég nagy ahhoz, hogy észrevegyék vagy fontosnak gondolják”), de a poszt tovább magyarázza, hogy a “de minimis MI-generált szöveg” beépítése a legtöbb kiadói szerződést megsértené. A de minimis jogi értelemben pontosan nincs meghatározva, de általában véve körülbelül ugyanazt jelenti, mint az észlelhető.

Kimutatható-e az MI az írásban?

2024 májusában egy webináriumot tartottam az MI kimutatásáról, amelyet a BISG szponzorált. A visszajátszás elérhető a YouTube-on. Jane Friedman egy átfogó beszámolót készített a webináriumról a Hot Sheet hírlevelében.

Sok szerző számára az MI toxicitása azt jelenti, hogy távol tartják azt a szavaiktól. A kiadók különleges terhet viselnek - nem ők hozzák létre a szöveget, de miután kiadták, jelentős kötelezettséget vállalnak a szöveggel szemben. Sok dinamitot láttunk már felrobbanni gyújtókönyvek közelében, legyen szó a tartalom társadalmi hatásairól, vagy más írók szavainak és ötleteinek plagizáló eltulajdonításáról. Most az MI-vel egy teljesen új etikai és jogi kérdéskört nézünk szembe, amelyek egyike sem szerepelt a kiadói iskolában.

Ennek egy része hasonlít arra, amit az emberek a diákokkal kapcsolatban aggódnak, hogy az MI használata valahogy csalás, hasonlóan ahhoz, mintha egy Wikipédia cikkből másolnának, vagy egyszerűen csak megkérnének egy barátot, hogy írja meg az esszéjüket.

Webináriumunk egyik előadója, egy oktató, José Bowen, megosztotta a diákok számára készült nyilatkozatát. Ez nem pontosan az, amit egy szerzőnek használsz, de bemutat néhány “kockázati szintet” az MI használatával kapcsolatban.

Sablon nyilatkozat diákok számára

  • Minden munkát saját magam végeztem, barátok, eszközök, technológia vagy MI segítsége nélkül.

  • Az első vázlatot én készítettem, majd megkértem barátokat/családot, MI parafrázis/nyelvtani/plágium szoftvert, hogy olvassák el és tegyenek javaslatokat. A következő változtatásokat hajtottam végre ezen segítség után:

    • Helyesírás és nyelvtan javítása

    • A szerkezet vagy sorrend megváltoztatása

    • Teljes mondatok/bekezdések újraírása

  • Elakadtam problémákban, és szinonimaszótárt, szótárt használtam, felhívtam egy barátot, elmentem a segítő központba, használtam a Chegg vagy más megoldás szolgáltatót.

  • MI/barátok/mentor segítségét használtam ötletek generálásához.

  • Segítséget/eszközöket/MI-t használtam egy vázlat/első vázlat elkészítéséhez, amit aztán szerkesztettem. (Írd le a hozzájárulásod természetét.)

Tehát egy kiadó készíthetne valami ilyesmit a szerzői számára. Tegyük fel, hogy a szerző az első szintet közli: Kiterjedten használtam MI-t, majd szerkesztettem az eredményeket. Mi történik akkor? Automatikusan elutasítod a kéziratot? Ha igen, miért?

És közben, ha figyelsz, megtudod, hogy az a kézirat, amit épp most olvastál és szerettél, amelyről a szerző eskü alatt állította, hogy még a Grammarly-vel sem ellenőriztette, valójában 90%-ban MI generálta, egy olyan szerző által, aki szakértője az MI használatának elrejtésében.

Ezután kénytelen vagy újragondolni a kérdést. Ez lesz: “Miért vagyok annyira elhatározva, hogy észleljem ezt a dolgot, ami észlelhetetlen?”

Részben ez az MI által generált szövegek szerzői jogvédelemre való alkalmassága körüli riasztó aggodalom. A szerzői jogi hivatal nem nyújt szerzői jogi védelmet 100%-ban MI által generált szövegre (vagy zenére, képekre stb.). De mi van az 50%-ban MI által generált szöveggel? Nos, csak a szerző által generált 50%-ot fedeznénk. És honnan tudnád, melyik fél? Erre még visszatérünk.

Nem lenne nagyszerű, ha csak be tudnánk táplálni minden kéziratot valamilyen szoftverbe, amely megmondaná, hogy használtak-e MI-t a szöveg létrehozásában?

Félretéve azt a kérdést, hogy ezt csak MI eszközök alkalmazásával lehetne megtenni, a fontosabb kérdés az, hogy a szoftver (kellően) pontos lenne-e? Bízhatnék benne, hogy megmondja, használtak-e MI-t a kézirat létrehozásában? És megbízhatnék abban, hogy nem termel “hamis pozitív” eredményeket - azaz nem jelzi, hogy MI-t használtak, amikor valójában nem?

Most már rengeteg szoftver van a piacon, amely ezeket a kihívásokat kezeli. Számos akadémiai tanulmány, amely ezeket a szoftvereket értékeli, rámutat a megbízhatatlanságukra. Az MI által generált szöveg átcsúszik. Rosszabb, hogy a nem MI által generált szöveget tévesen “szennyezettnek” címkézik.

De a könyvkiadók valószínűleg valamiféle biztosítékot akarnak majd. Úgy tűnik, hogy legjobb esetben ezek az eszközök figyelmeztethetnek a lehetséges aggályokra, de mindig ellenőrizni kellene. Tehát talán figyelmeztethetnek azokra a szövegekre, amelyeket alaposabban meg kell vizsgálni, mint másokat? Ez hatékonyságot jelent?

Az igazi hatékonyság abban rejlik, hogy túllépünk a szöveg eredetével kapcsolatos aggályokon, és ehelyett fenntartjuk a meglévő kritériumainkat a minőségére vonatkozóan.

Munkanélküliség

“Nem az MI fog helyettesíteni téged. Valaki fog helyettesíteni, aki tudja, hogyan kell használni az MI-t.” —Anonim

Az MI elfogadása miatti munkanélküliség súlyos lehet. A becslések változóak, de a számok komorak. Vannak nyilvánvaló példák: San Francisco sofőr nélküli taxijai megszüntetik… a taxi- és rideshare-sofőröket. Az MI-alapú diagnosztika csökkentheti az orvosi technikusok szükségességét.

Az optimista énem egy példára, a táblázatkezelő bevezetésére mutat, és annak a foglalkoztatásra gyakorolt hatására. Ahogy az alábbi diagramon látható, a “Számvitel, adóelőkészítés, könyvelés és bérszámfejtés” területén dolgozók száma majdnem megduplázódott 1990 óta - aligha a táblázatkezelők és más technológiák vádirata, amelyek nagyrészt automatizálták ezeket a feladatokat.

Egy vonaldiagram, amely az 1990 és 2020 közötti időszakban a számvitel, adóelőkészítés, könyvelés és bérszámfejtés területén dolgozók számát mutatja.

Ethan Mollick és a Boston Consulting Group (BCG) tanulmánya egy kísérlet volt, amelynek célja az MI munkahelyi hatásának jobb megértése volt, különösen összetett és tudásintenzív feladatok esetén. A tanulmány 758 BCG tanácsadót vont be, akiket véletlenszerűen osztottak be, hogy használják vagy ne használják az OpenAI GPT-4-et két feladathoz: kreatív termékinnováció és üzleti problémamegoldás. A tanulmány mérte a résztvevők teljesítményét, viselkedését és attitűdjeit, valamint az MI kimenetének minőségét és jellemzőit.

Az egyik megállapítás az volt, hogy “az MI képességszint kiegyenlítőként működik. Azok a tanácsadók, akik a kísérlet kezdetén a legrosszabb pontszámot kapták, 43%-os teljesítménynövekedést értek el, amikor használhatták az MI-t. A legjobb tanácsadók is kaptak egy lökést, de kisebb mértékben.” A teljes cikk feltáró jellegű, és mint Mollick minden munkája, provokatív, de hozzáférhető.

Oktatás

Az oktatás központi szerepet játszik az MI előnyeiről és hátrányairól szóló vitákban. Az MI osztálytermekbe való bevezetését nagyrészt átokként, vagy legalábbis kihívásként tekintik. Más oktatók, mint például a PW keynote előadója, Ethan Mollick, az MI-t csodálatos új eszközként üdvözlik az oktatók számára; Mollick ragaszkodik ahhoz, hogy diákjai a ChatGPT-vel dolgozzanak.

A legjobb könyv a témában Teaching with AI: A Practical Guide to a New Era of Human Learning José Antonio Bowen és C. Edward Watson által.

Nem fogok belemerülni az oktatási kiadásba ebben a könyvben - ez egy hatalmas téma, amely külön jelentést igényel. Vitatható, hogy a kiadás másodlagos érdeklődésre tesz szert az oktatásban: az MI eszközök szoftverek, nem pedig tartalmak per se.

A keresés jövője

An icon of a key

A keresés vitatott téma az MI-ben. Bátorítalak, hogy látogass el a perplexity.ai és a You.com oldalra, hogy betekintést nyerj, merre tartanak a dolgok. A következő néhány alkalommal, amikor Google keresést szeretnél indítani, inkább látogass el a Perplexity oldalra. Nem tűnik majd drámaian másnak - hasonló a Google által gyakran a keresőképernyő jobb oldalán, vagy néha a keresési eredmények tetején megjelenő tudásgrafikonokhoz. Ahelyett, hogy egy linkre kellene kattintani, az információ ott van előtted.

A Perplexity egy lépéssel tovább megy, és újrafogalmazza az általa több forrásból összegyűjtött információkat, így tényleg nem kell egy linkre kattintanod. Megadja forrásainak linkjeit, de azokra kattintás általában felesleges—már megkaptad a kérdésedre a választ.

Ez a látszólag szerény változás hatalmas következményekkel jár minden olyan vállalat és termék számára, amely legalább részben a keresőmotorokon keresztüli felfedezésre támaszkodik. Ha a keresők már nem látogatják meg az oldaladat, hogyan vonhatod be őket és alakíthatod őket ügyfelekké? Egyszerű válasz: nem tudod.

Joanna Penn az új technológiák írásra és kiadásra gyakorolt hatásának gondolkodásának élvonalában áll. Ezt a komplex témát podcastjában és blogján tárgyalta tavaly decemberben.

Még mindig korai szakaszában járunk az MI és a keresés átalakulásának.

Vacak könyvek az Amazonon

An icon of a key

Az MI által generált vacak könyvek problémát jelentenek az Amazonon, bár súlyosságuk inkább érzelmi, mint szó szerinti. Egyrészt ezek a könyvek alacsony minőségű és plágium tartalmakat spammelnek az online könyvesboltba, néha valódi szerzők neveit használva, hogy megtévesszék az ügyfeleket és kihasználják hírnevüket. A könyvek nemcsak az olvasók számára bosszantóak, hanem a szerzők számára is fenyegetést jelentenek, potenciálisan elvonva tőlük a kemény munkával megszerzett jogdíjakat. Az MI által generált könyvek az Amazon oldalán a valódi könyvek és szerzők rangsorát és láthatóságát is befolyásolják, mivel ugyanazokért a kulcsszavakért, kategóriákért és értékelésekért versenyeznek.

Egy aranyos kiscica a tengerparton virágokkal körülvéve, és egy felirat mondja 'Vicces és aranyos macska fotók, amelyeket nem láthat a világon'.

Az Amazon most megköveteli a szerzőktől, hogy közöljék az MI használatának részleteit könyveik létrehozásában. Kétségtelen, hogy ez visszaélésre adhat okot.

Próbálj keresni az Amazonon “MI által generált könyvek” kifejezésre. Sok találat lesz. Néhány eredmény olyan hogyan-könyvek, amelyek az MI használatáról szólnak könyvek létrehozásához. De mások egyértelműen MI által generáltak. “Vicces és Aranyos macska képek-Te nem láthatod ezeket a fajta fotókat a világon-PART-1” (stet) Rajasekar Kasi nevéhez van fűzve. Nincs részlet az életrajzáról egy szerzői oldalon, de hat másik cím is az ő nevéhez fűződik. A könyvet, amelyet 2023. augusztus 26-án adtak ki, nincs véleményezés és nincs eladási rangsor. Az e-könyv nyelvtanilag helytelen címe nem egyezik a nyomtatott könyv borítóján található nyelvtanilag helytelen címmel.

De más szerzők egyértelműen széles körben használják az MI-t könyveik létrehozásában, és nem közlik ezt. Mint fentebb említettem, az MI használatának észlelése szinte lehetetlen a képzett ‘hamisítók’ esetében. Színezőkönyvek, naplók, utazási könyvek és szakácskönyvek MI eszközökkel történő létrehozása töredéke a hagyományos kiadási időnek és erőfeszítésnek.

Keress rá a “koreai vegán szakácskönyv” kifejezésre, és az első helyen Joanne Lee Molinaro első számú címe található. De közvetlenül mögötte olyan címek sorakoznak, amelyek nyilvánvaló másolatok. “A koreai vegán szakácskönyv: Egyszerű és finom hagyományos és modern receptek koreai konyha szerelmeseinek” két véleményezést tartalmaz, amelyek közül az egyik megjegyzi: “Ez nem egy vegán szakácskönyv. Minden recept hús és tojás összetevőket tartalmaz.” De a könyv a #5,869,771-es eladási rangsorban van, szemben az eredetivel, amely a #2,852-es helyen áll.

Nehéz meghatározni a kár mértékét. Semmi jó nem származhat ebből, de mennyire rossz ez?

Az Amazon olyan irányelveket vezetett be, amelyek lehetővé teszik bármely könyv eltávolítását, amely nem biztosít “pozitív vásárlói élményt.” A Kindle tartalmi irányelvei tiltják a “leíró tartalmat, amely megtéveszti az ügyfeleket, vagy nem pontosan tükrözi a könyv tartalmát.” Azt is blokkolhatják, hogy “az ügyfeleket általában csalódást okozó tartalom.” A hatalmas mennyiség veri le az Amazon figyelőit? Vagy van valami más oka?

Elfogultság

Az LLM-ek az online már publikált anyagokon alapulnak. Az online publikált anyagok elfogultsággal telítettek, így az LLM-ek ezt tükrözik. És természetesen nem csak elfogultság, hanem gyűlölet is, amely tükröződik a tanulmányaikban, és most potenciális kimenet az MI által generált szavakban és képekben. A pornó egy másik természetes haszonélvezője az MI figyelemre méltó képességének a képekkel, és vannak újabb aggasztó történetek fiatal nők hamisított meztelen képeiről, amelyeknél férfi osztálytársaik a valószínű gyanúsítottak. A The New York Times külön jelentett az online gyermek szexuális visszaélés képeinek növekedéséről.

A szerzőknek és kiadóknak tisztában kell lenniük ezekkel a beépített korlátokkal, amikor MI eszközöket használnak.

Kreativitás lehet klisé

An icon of a key

Az a kérdés, hogy a gépek valóban kreatívak lehetnek-e, továbbra is heves vita tárgya. Részben attól függ, hogyan definiáljuk a kreativitást.

“Az AI soha nem lesz kreatív.” Ez egy ismerős mantra.

Mindannyian tudjuk, mi a kreativitás, nem igaz?

Cambridge: “az eredeti és szokatlan ötletek létrehozásának vagy használatának képessége.”

Britannica: “az a képesség, hogy valami újat hozzunk létre, legyen az egy probléma új megoldása, egy új módszer vagy eszköz, vagy egy új művészeti tárgy vagy forma.”

Nem vitatom, hogy a kreativitás ebben az értelemben messze túlmutat az LLM-ek lehetőségein.

Az én érvelésem az, hogy a legtöbb, amit kreatívként eladnak - és gyakran nagyon kreatívnak tűnik - valójában iteratív. És ez sok mindenre tökéletesen működik, beleértve a legtöbb reklámot is.

De hogy felállítsuk a “kreativitás” mércét, majd lekicsinyeljük az LLM-eket, az egy lehetetlenül magas akadályt állít, amit az AI elkerülhetetlenül elbukik. Ekkor az emberek elutasítják, mondván: “nos, mondtam, hogy nem kreatív.”

És ezzel elmulasztják az iteratív dolgokat, amikben nagyon jó.

Nem sokára egy hosszú esszét fogok közzétenni ebben a témában, miután elolvastam:

The Creativity Code, Marcus du Sautoy-tól, és

The Artist in the Machine, Athur I. Miller-től

Literary Theory for Robots, Dennis Yi Tenen-től

Egy másik gondolat

Jeremiah Owyang egy iparági elemző a Szilícium-völgyben. Ő egy AI támogató, de már volt része a hype-ban korábban is. Megjegyzi, hogy “soha nem látott ilyen gyors evolúciót ilyen rövid idő alatt.”

Ahogy Owyang mondja, kis programozó csapatok most már LLM-eket használhatnak “érző lények” összerakásához - mint egy négyéves - két nap alatt. Ezek képesek:

  • ‘Látni’ számítógépes látással, mi történik a való világban,

  • ‘Hallani’ hangparancsok és környezeti zajok révén a való világban,

  • ‘Gondolkodni’ a fentiek feldolgozásával a való világban,

  • ‘Tanulni’ az előre betanított adat hozzáférésével,

  • ‘Hivatkozni’ exkluzív adatkészletekre,

  • ‘Beszélni’ élethű hangokkal, amelyeknek van hangsúlyuk és tónusuk bármilyen nyelven,

  • ‘Írni’ szöveges kommunikáció révén, bármilyen formátumban vagy stílusban szükséges,

  • ‘Rajzolni’ képek spontán létrehozásával, és

  • ‘Interakcióba lépni’: proaktívan párbeszédbe kezdhet, kérdéseket tehet fel, vagy AI ügynököket rendelhet feladatok elvégzésére.

Ez rendkívüli és példátlan. Számítani fog a kiadásra? Ön dönti el.

Jó dolgok a kiadáson kívül

Az AI mögött néhány áttörő eredmény áll a kiadáson kívül. Az orvostudomány az AI posztergyermeke, de más iparágakból is vannak erőteljes történetek. A kiadáshoz való relevanciája egy retorikai kérdésből fakad: Az AI életeket menthet. De nem gondolja, hogy segíthetne a kiadóknak?

Ennek a rövid szakasznak a célja egyszerűen az, hogy ellensúlyozza azt az érvet, hogy ha nem hiszi, hogy az AI segíteni fog a kiadásban, akkor az AI egyáltalán segíthet bárkinek is?

AI és az orvostudomány

Olvasva The Economist 2024. márciusi számát, belemélyedtem a technológiai mellékletbe az egészségügyről és az AI-ról. Az elmúlt években az orvostudomány következetesen az AI fényes pontjaként szerepelt. A legtöbb jelentés pozitív. De még mindig The Economist cikke le fog döbbenteni. Számos jól megfogalmazott fenntartást is kifejeznek. De azt is olvashatja, hogy az AI az orvostudományban “lehetőséget jelent több százmillió, sőt milliárd ember életének javítására.”

Egy másik retorikai kérdés azok számára, akik vagy be akarják tiltani az AI technológiát, vagy legalábbis moratóriumot akarnak bevezetni annak fejlesztésére: feláldozná az AI potenciális értékét több millió ember egészségéért, hogy kielégítse a bizonytalan jövő miatti aggodalmát?

AI és a TSA a repülőtereken

Mindannyian ott voltunk: a végtelen sorok, a kézipoggyászaink lassú áthaladása a röntgenszkennereken.

A TSA hibás észlelései jól dokumentáltak, de nem sokat tárgyalják.

Ami a legjobban aggaszt, az a szomorú munkások, akik órákon át bámulják a képernyőket. Miért? Nemcsak hogy nyomorúságos munkájuk van, de mint egyszerű halandók, nem is nagyon jók benne.

Jöjjön az MI. Ha képes észrevenni a nehezen észlelhető daganatokat a tüdőben, biztos vagyok benne, hogy képes lesz észlelni a csempészárut a kézipoggyászokban. És megszabadítja az embereket egy hálátlan feladattól, amire nem alkalmasak.

Ez a beszámoló szerint, az új TSA MI-segített szűrőprogram már folyamatban van.

Esszé: Az MI hatása a könyvkiadó iparra

Nemrég beszélgettem Peter Brantleyval, az MI webinárium mélyében lévő partneremmel, arról, hogyan alakíthatnánk a közelgő MI programokat. Peter az idő nagy részében a könyvtári közösségben dolgozik, és éppen egy egész napos eseményről tért vissza Los Angelesből, ahol mintegy 150 könyvtári kollégájával személyesen vizsgálták az MI potenciális hatását az ő szektorukra. A beszélgetés élénk és mélyreható volt. Miért, csodálkozott, nincsenek ilyen összejövetelek a kereskedelmi könyvkiadóknál? Az MI minden kiadói esemény témája: miért nem a téma?

Az MI valós következményei

A válasz, amire jutott, az, hogy a kereskedelmi könyvkiadók még nem jutottak arra a következtetésre, hogy az MI bármilyen valós következményekkel járna az üzletükre nézve. Az üzletük magjára. Az üzleti tevékenységük képességére. Persze, segíthet sajtóközlemény írásában vagy kézirat elutasító levél megfogalmazásában, de feltételezik, hogy a könyvkiadás továbbra is úgy fog működni, mint évtizedek óta, a szerződéstől a nyomtatott könyvig tartó átlagos idő akár két évig is elhúzódhat.

Ugyanakkor a kiadók természetesen szembenéznek az MI-nél közvetlenebb kihívásokkal is. Papírárak. Szállítási költségek. Csökkenő árrések. Összességében többnyire lapos értékesítés. Mindezekkel a nyomásokkal, kinek van ideje vagy kapacitása az MI-vel foglalkozni?

De más kreatív iparágak értik. Művészet és design érti. Reklám érti. Hollywood látja, mi következik, ahogy a zeneipar is. Az újságírók rettegve figyelik.

Más könyvkiadási szektorok kezdik megérteni az MI hatását. A tudományos kiadás mélyen be van ágyazva a technológiába. De a kereskedelmi kiadók úgy viselkednek, mintha az MI-nek nem lenne valós következménye.

Mik lehetnek a valós következmények? Hatással lesz a könyvek kínálatára? Vagy a könyvek keresletére?

Kínálat: Igen, az MI a tettes a sok új szemétkönyv mögött az Amazonon. Százak? Biztosan. Ezrek? Talán. Milliók? Nem. Hány könyv van az Amazonon? Több mint 50 millió. Már most is nagyon zsúfolt.

Ezt félretéve, világos, hogy a közeljövőben az MI nem fog teljes könyveket írni, amelyeket az emberek valóban el akarnak olvasni. Az eddigi értéke, mint egy író társ—kritizál, javasol, időnként néhány felhasználható bekezdést készít. Nem, a közeljövőben az MI nem fogja radikálisan megváltoztatni a könyvkiadás kimeneteit, az új könyvek kínálatát.

Kereslet: Nem, senki sem követeli az MI által generált könyveket. Ez nem tényező. És nem látok olyan forgatókönyvet, ahol az MI szélesebb értelemben hatással lenne a könyvek keresletére.

Mi a helyzet a kiadási folyamattal? Igen, az változni fog. Legalább egy kicsit. Ahogy azt a mi Publishers Weekly MI eseményünkön tavaly ősszel felfedeztük, a kiadók itt-ott keresik az MI segítségét: marketing, szerkesztés, egy kis ez, egy kis az.

Lehetséges, hogy az AI-nak kevés valós következménye lesz a kereskedelmi könyvkiadásra? Talán ez csak egy játék.

Lépjünk vissza az AI részleteitől, és tekintsük át a kereskedelmi kiadás nehéz helyzetét, és ezen keresztül vizsgáljuk meg, hol lehet az AI-nak a legnagyobb hatása.

A kiadás évtizedek óta gazdasági visszaesésben van

Becslések szerint az Egyesült Államok teljes könyvkiadási ipara éves forgalma kevesebb, mint 35 milliárd dollár. Még ha 40 milliárd dollár is lenne, az Apple Computer éves forgalma önmagában tízszer magasabb. Az Apple bruttó nyeresége az eladások 44%-a, míg a nettó nyeresége az eladások 25%-a. A kiadás még álmodni sem mer ilyen haszonkulcsokról.

A kereskedelmi könyvkiadás évtizedek óta enyhe gazdasági visszaesésben van, néhány évben néhány százalékkal emelkedik, néhány évben csökken. 2024 közepén az eladások évről évre stabilnak tűnnek, de ez az a fajta nyári románc, amelyet a kiadók jól ismernek. Nyerünk néhányat, veszítünk néhányat, de összességében a kereskedelmi könyvkiadás nem egy növekedési iparág.

2023-ban, az AAP StatShot-jának jelentése szerint “a kereskedelmi bevételek 0,3%-kal csökkentek, 8,9 milliárd dollárra az év során”. Amennyire én látom, az AAP adatai nem veszik figyelembe az inflációt. 3,4%-os inflációval az eladások csökkenése 3,6% lenne, közelebb a Circana által jelentett egység eladások 2,6%-os csökkenéséhez.

Az alternatív formátumok, az e-könyvek és hangoskönyvek növekedése nélkül az iparág nagyon rossz helyzetben lehetne. Az e-könyvek évekig növekedési motorok voltak. A hangoskönyvek eladásai tovább emelkednek, 2022-ben közel 15%-kal, és további 9%-kal 2023-ban. Igen, ennek egy része helyettesítő eladás, de az e-könyvek és hangoskönyvek vásárlóinak nagy része új vásárló, nem feltétlenül rendszeres könyvolvasó. Az e-könyvek és hangoskönyvek a tavalyi évben a kereskedelmi eladások 21%-át tették ki. Vajon mindezek a vásárlók nyomtatott könyveket vennének, ha csak nyomtatott könyvek lennének elérhetők?

A kiskereskedelmi árképzés egyre nagyobb aggodalomra ad okot, mivel a költségek és a kiskereskedelmi és nagykereskedelmi kedvezmények szűkítik a kiadók árrését. Akadémiai tanulmányok szerint van egy bizonyos fokú árérzékenység a könyveknél, de biztosan elérjük az ellenállási pontot: a keménykötésű bestseller könyvek egyre közelebb kerülnek egy 35 dolláros árplafonhoz. “Előfizetési fáradtság” miatt a videó-on-demand ügyfelek lemondják a szolgáltatásokat, az egyre növekvő költségekre koncentrálva. A Netflix Premium terve most 22,99 dollár/hó; a Disney Plus Duo Premium 19,99 dollár/hó. Ahogy egy kollégám nemrég megjegyezte, hány pénzhiányos előfizető mondja majd azt, hogy ó, mondjuk le a Netflix előfizetésünket, hogy jövő hónapban könyvet vehessek?

Könyvkiadói fizetések

Ezt nem fogom túlzottan hangsúlyozni: nem csak az írók küzdenek a megélhetésért - a kiadói személyzet is alulfizetett a hasonló szakmákhoz képest.

Tartok egy reprezentatív válogatást a legfrissebb kiadói álláshirdetésekből. Éppen egyet nézek, egy marketing menedzser pozícióját egy kereskedelmi kiadónál, amely 2023-ban 30 millió dollár feletti eladásokat jelentett. A pozíció évi 60 000 és 70 000 dollár közötti fizetést kínál. Itt van egy másik, egy PR menedzser pozíciója egy olyan kiadó egyik részlegénél, amely évi 750 millió dolláros eladásokat jelent. “Ez a szerep éves fizetése 74 000 - 79 000 dollár lesz,” jegyzi meg a hirdetés.

Az U.S. Bureau of Labor Statistics National Occupational Employment and Wage Estimates szerint a marketingmenedzserek átlagos keresete az összes iparágban 166 410 dollár. A “Közönségkapcsolati menedzserek” átlagos keresete 159 420 dollár.

A könyvkiadás még csak meg sem közelíti ezt. Ez nem újdonság a kiadói ágazatban dolgozók számára. Mindig is így volt. De vajon a könyvkiadás fenn tud maradni ilyen fizetési szinteken? Az a képesség, hogy még a standard fizetés felét sem tudják kínálni a jelölteknek, nem sok jót ígér egy egyre digitálisabbá váló iparág számára.

A TikTok, YouTube, közösségi média, SEO, metaadatok és szerzői platformok korában mi a csuda az a “publicity manager”?

A hagyományos könyvkiadók három (és fél) megmaradt előnye

A hagyományos könyvkiadók három kitartó előnye az (i) presztízs, (ii) hozzáférés a nagy médiához és (iii) hozzáférés a könyvesbolti terjesztéshez. Ez nem vonatkozik egyformán minden hagyományos kiadóra - a legnagyobbak mindegyikből többel rendelkeznek: több presztízzsel, jobb hozzáféréssel a nagy médiához és jobb lehetőségekkel, hogy könyveik a legtöbb könyvesbolt előtérasztalára kerüljenek. De együttvéve ezek a hagyományos könyvkiadói ipar jellegzetes előnyei.

Egy másik érték, amit a kiadók kínálhatnak, egy gondosan összeállított, egymást kiegészítő címek listája, ahol minden egyes cím a társaitól profitál. Gondoljunk egy olyan kiadóra, mint a Fox Chapel, amely kézműves könyvekre specializálódott: ha élvezed egyik címüket, jó eséllyel közelebbről megvizsgálod más könyveiket (és magazinjaikat) ugyanazon a témán, még akkor is, ha más szerzők írták őket.

Ez átnyúlik valami olyasmire, amit csak néhány kiadó tudott kifejleszteni, egy eladható márka. Gondoljunk a Wiley “For Dummies” vagy az Oxford “Very Short Introductions” sorozatára. A márka egy szerkesztői megközelítés és minőség következetességét közvetíti, ami arra ösztönzi az olvasókat, hogy több címet is megvásároljanak. Az önkiadók gyakran indítanak saját rövid sorozatokat, főleg fikcióhoz, bár nem tudják lefedni ezeknek a nagyobb kiadó katalógusoknak a szélességét.

Minden más szolgáltatás, amit a hagyományos kiadók nyújtanak, megvásárolható a nyílt piacon, hasonló minőséggel, megfizethető áron (például szerkesztés, tervezés, gyártás és alapvető marketing funkciók). Az önkiadók számára pedig a könyvenként eladott jövedelem ötször vagy több mint a hagyományos jogdíj ütemezések.

Egy rövid függelékben részletesebben is kifejtem ezt a könyv végén. De gyorsan leértékelem a három legnagyobb előny értékét. A presztízs jó a dicsekvésre, de szerény pénzbeli értéke van. A könyvismertetők és más nagy médiamegjelenések már jelentősen csökkentek a könyveladásokra gyakorolt hatásukban. A könyvesboltok pedig az iparági eladások körülbelül 15%-át képviselik (és sokkal kevesebbet az önkiadó szerzők esetében) - már nem kulcsfontosságúak egy könyv sikeréhez.

A dolgok megváltoztak.

Önkiaadás

Az önkiadás volt a fogyasztói (kereskedelmi) könyvkiadás fő növekedési hajtóereje az elmúlt évtizedben és még tovább. Az önkiadás körüli pontos eladási adatok rejtve maradnak - könnyű figyelmen kívül hagyni fontosságát. De az elérhető adatok azt mutatják, hogy az önkiadás a kereskedelmi könyvkiadási piac jelentős részét követeli magának.

Ahogy a Kobo vezérigazgatója, Michael Tamblyn (nagyjából) híresen megjegyezte, “Az általunk eladott könyvek közül minden negyedik egy önkiadó cím, ami azt jelenti, hogy számunkra az önkiadás olyan, mintha egy teljesen másik Penguin Random House ülne a piacon, amit senki sem lát. Olyan, mint a könyvkiadás sötét anyaga.”

Az önkiadási piac trendjei vitathatatlanul az egyetlen jelentős trendek a kereskedelmi könyvkiadásban. Az önkiadó szerzők mutatják az utat. Kalandvágyóak és nem korlátozzák őket a hagyományos iparág szokásai. Sokan jártasak a közösségi médiában. Közel állnak olvasóikhoz, vásárlóikhoz. Ha meg akarod tanulni a legújabb marketing technikákat, kövesd a szerzői fórumokat, blogokat és hírleveleket.

Merülj el mélyen a szerzői jövedelmi statisztikákban, az írás gazdaságtanában, és hasonlítsd össze a hagyományosan kiadott szerzők jövedelemcsökkenését az önkiadó szerzők jövedelemnövekedésével. Egy nemzetközi felmérésben és jelentésben, amelyet Steve Sieck társaságában készítettem az ALLi számára 2023-ban (pdf), felfedeztük, hogy “a válaszadó összes önkiadó szerző medián írói és önkiadási jövedelme 2022-ben 12 749 dollár volt, 53%-os növekedés az előző évhez képest. Az átlagos (átlagos) jövedelmek sokkal magasabbra tolódtak: 82 600 dollár 2022-ben, 34%-os növekedés.”

Külön felmérésben, amelyet Peter Hildick-Smith végzett az Authors Guild számára, “azok a teljes munkaidőben dolgozó önálló kiadású szerzők, akik legalább 2018 óta publikálnak, átlagosan 24 000 dolláros jövedelmet jelentettek, szemben a 2018-as 13 700 dollárral, ami 76 százalékos növekedést jelent.”

Hibrid kiadók

Az alapos vizsgálat érdekében szeretném megemlíteni a hibrid kiadókat is. Egyre lelkesebb vagyok a hibrid modell iránt, és a hibrid kiadói szegmens jelentős és növekvő. Senki sem becsüli meg külön a hibrid eladásokat. De a hatásuk leginkább két kategóriában mutatkozik meg: hírességek könyvei és népszerű üzleti könyvek. Ezek a kategóriák régóta megbízható bevételi forrást jelentenek a kereskedelmi kiadók számára, de a hibrid kiadók “koncierzs szolgáltatásai” és sokkal kedvezőbb jövedelemelosztása sok magas profilú szerző számára ellenállhatatlanok.

A közelmúltban történt esetek, mint például az Authors Equity profitmegosztási kapcsolata szerzőivel, és Keila Shaheen 50/50 profitmegosztása a Simon & Schusterrel, azt sugallják, hogy a hibrid modell normalizálódása felé tartunk. Ez jó hír a szerzők számára; kevésbé ígéretes a hagyományos kiadók számára.

Kiadás a kiadókon túl

Egy jelentést társszerzünk Rüdiger Wischenbarttal, az eredeti tanulmánya alapján: “Publishing Beyond Publishers.” Arra törekszünk, hogy megértsük és amennyire csak lehet, számszerűsítsük az összes könyvkiadási tevékenységet világszerte, amit be kellene vonni a modern kiadói ökoszféra átfogóbb megértésébe.

Amint túllépünk a könyves tartályon, megpillanthatjuk, hol tudná az AI igazán hatást gyakorolni.

Projektünk példaképe a Wattpad, ahol “97 millió ember havonta több mint 23 milliárd percet tölt eredeti történetekkel.” A történeteket online, főleg okostelefonokon, rövid szakaszokban élik át. Kevés válik kiadott könyvvé. Ugyanolyan valószínű, hogy a “Wattpad WEBTOON Stúdiókhoz, a vállalat TV-, film- és kiadói társaikhoz” jutnak.

A fiatalabb olvasók jobban ráhangolódtak az online digitális olvasásra, mint idősebb társaik. Egy 2024 januári Wattpad felmérés szerint “a digitális formátumok egyre népszerűbbek a fiatalabb generációk körében, a Z generáció 65%-a és a Millenniumiak 71%-a használja a webnovellákat, e-könyveket és webképregényeket, míg az X generáció és a Boomer generáció kevesebb mint fele mondja ugyanezt.”

És természetesen, ahogy a hagyományos kiadói ipar most tanulja: “A sokszínűség kulcsfontosságú a digitális formátumok elfogadásában: a Z generáció 61%-a és a Millenniumiak 70%-a egyetért abban, hogy az e-könyvek, webnovellák és webképregények hozzáférést biztosítanak olyan tartalmakhoz, amelyek nehezebben találhatók meg könyvesboltokban és könyvtárakban, beleértve az LMBTQ+ és kisebbségekre fókuszáló tartalmakat.”

A Wattpadnak vannak versenytársai, köztük az Inkitt, amely a Publishers Weekly szerint nemrég 37 millió dollárt gyűjtött befektetőktől, “köztük Stefan von Holtzbrinck, a Holtzbrinck Publishing Group tulajdonosa, amely a Macmillant birtokolja, és Michael Lynton, a Penguin volt vezérigazgatója; eddig összesen 117 millió dollár befektetést szerzett. 2023 februárjában a Financial Times azt mondta, hogy az Inkitt volt a nyolcadik leggyorsabban növekvő vállalat Európában, és az első Németországban.” Egy július 9-i Esquire cikk részletezte az Inkitt AI használatát és annak szerepét a sikerükben.

Hányan hallottak már az Inkitt-ről, látogatták meg a kiadói platformját, vagy töltötték le a Galatea olvasó alkalmazását?

De a “Publishing Beyond Publishers” jelentésünk túlmegy az online történetplatformokon, hogy megvizsgálja, hogyan lehet “a tartalmat különböző formátumokban (nyomtatott, digitális), médiumokban (könyvek, hangoskönyvek, filmek, játékok), terjesztési csatornákon (közösségek, platformok, stream-ek) és üzleti modellekben (termékeladások, előfizetések, streaming, freemium, fizetős modellek) létrehozni és terjeszteni, többnyire digitálisan meghatározott ellátási és marketingláncokban.” Hány lehetőséget hagynak ki a könyvkiadók, mert nem illenek bele a jelenlegi üzleti modelljükbe?

Innováció, technológia és könyvkiadás

Az e-könyveket kivéve, a modern kiadás soha nem nézett szembe fenyegetéssel a technológia részéről. (A digitális hangoskönyveket inkább örömmel fogadták, mint aggodalommal.) Az internet korszakának hajnalán a kiadók több lehetőséget kaptak, mint fenyegetést; csupán egyetlen kiskereskedő, az Amazon, amelyet az internet tett lehetővé, borította fel az almáskocsi.

Soha nem láttam tanulmányt arról, hogy az Amazon (minden működési és hatási tényező teljes figyelembevétele mellett) nettó pozitív volt-e a könyvkiadási ipar számára. Olyan vásárlókat ér el, akiket a hagyományos boltok nem szolgálnak ki, és hajlandó feláldozni a marginális hasznot, hogy alacsonyan tartsa az árakat. Az e-könyvek és hangoskönyvek nagy mennyiségben kerülnek szállításra. De az Amazon képes árat csökkenteni részben azért, mert magas kedvezményeket és díjakat követel a beszállítóktól, és megfojt más kiskereskedelmi csatornákat. Fájdalmas kompromisszumok vannak.

Mégis, ne próbálj kritikát megfogalmazni az Amazonnal szemben egy önállóan kiadott szerző előtt. Nem lennének üzletben The Everything Store nélkül.

Az innovátorok dilemmája

Ahhoz, hogy perspektívát szerezzünk az AI könyvkiadásra gyakorolt hatásáról, ajánlom Clayton Christensen The Innovator’s Dilemma: When New Technologies Cause Great Firms to Fail című könyvét, amelyet először 1997-ben adott ki a Harvard Business Review Press.

Christensen azt vizsgálja, hogy a meglévő (jelenlegi) cégek hogyan engedhetnek az innováció erőinek.

A sikeres, jól vezetett cégek gyakran megbuknak, amikor zavaró változások jönnek az iparukba. A hagyományos vezetési gyakorlatok, amelyek segítettek nekik iparági vezetővé válni, megnehezítik ezeknek a cégeknek, hogy rugalmasan reagáljanak a zavaró technológiákra, amelyek kannibalizálhatják piacaikat.

Figyelmen kívül hagyják a zavaró technológiák által létrehozott termékeket, mert első pillantásra rosszabbnak tűnnek a meglévő termékeikhez képest. Legnyereségesebb ügyfeleik általában nem tudják használni az állítólagos innovációkat, és nem is akarják azokat. A cégek megpróbálják kivédeni a zavaró fenyegetéseket azáltal, hogy megduplázzák meglévő termékeik és szolgáltatásaik kínálatát.

Christensen kulcsfontosságú felismerése az, hogy azáltal, hogy a látszólag “helyes” dolgot teszik, beleértve az ügyfelek meghallgatását, a sikeres cégek szélesre nyitják magukat a zavaró innováció előtt. Jelenlegi ügyfeleikre koncentrálnak, és figyelmen kívül hagyják a fontos új technológiákat - amelyek kezdetben kis, kevésbé nyereséges piacokat céloznak meg. Ez nyitja meg az utat az agilis startupok számára, hogy megzavarják a vezetőket.

Chris Dixon, a könyv megvitatása során, rámutat arra, hogy “azért kerülhetik el a jelenlegi cégek a nagy új dolgokat, mert a következő nagy dolog mindig úgy kezdődik, hogy ‘játékszernek’ tekintik.” Hmm, igen, sokan játékszernek tekintik a Chat AI-t.

A kiadók nem ismerik fel, hogy a generatív mesterséges intelligenciával épített innovációk megzavarhatják törékeny üzleti modelljüket?

Szépirodalom kontra ismeretterjesztő irodalom

Az AI könyvkiadásra gyakorolt hatása biztosan drámaian eltérő hatással lesz a szépirodalmi kiadásra, mint az ismeretterjesztő irodalomra.

A könyvkiadási ipart nem elég gyakran elemzik, mint két különálló ipart, az egyiket, amely szépirodalmi könyveket ad ki, és a másikat, amely ismeretterjesztő könyveket ad ki.

Míg a legtöbb kereskedelmi kiadó mind szépirodalmi, mind ismeretterjesztő címeket kínál, az iparág széles szakadékot mutat a két forma között mind a kiadott címek számában, mind a könyveladásokban. A becslések változnak, de a szépirodalmi címek csak körülbelül az évenként kiadott könyvek 10%-át teszik ki. Az eladások azonban nagy mértékben kedveznek a szépirodalomnak. Ismét vannak évről évre változások, de a szépirodalom az éves kereskedelmi könyveladások körülbelül felét foglalja el. Tavaly a top 25 bestsellerből 21 szépirodalom volt. A Wikipedia összeállítása alapján az angol nyelvű könyvek közül, amelyek valaha 20 millió példányban vagy többet adtak el, 84% szépirodalmi cím.

A könyveladási trendek hírhedten szeszélyesek, de úgy tűnik, hogy a szépirodalmi eladások folyamatosan emelkednek. Miután 2019-ben 32%-ra zuhantak, 2022-ben az felnőtt piac 40%-át szerezték meg, és 2023-ban ismét kissé növekedtek. A felnőtt szépirodalmi eladások 2024 első felében további 6,3%-kal emelkedtek.

Miközben a mesterséges intelligenciát egyre inkább használni fogják a szépirodalmi szerzők az alkotási folyamat segítésére, ahogyan azt máshol tárgyaljuk, kevés esély van arra, hogy az AI által generált történetek átvegyék a bestseller polcokat. Elképzelhető egy “elég jó” szint elérése néhány zsáner szépirodalom esetében, de ez semmi olyan, ami álmatlan éjszakákat okozna a szerzőknek és kiadóknak.

Az ismeretterjesztő irodalom írása és kiadása ezzel szemben minden területen a mesterséges intelligencia által lesz segítve és támogatva. Ez már most is történik. Az ismeretterjesztő szerzők kihasználják a Chat AI sokoldalú tehetségét mind kutatási asszisztensként, mind írói segédként. Az ismeretterjesztő kiadók pedig egyre inkább igénybe veszik a Chat AI segítségét a kéziratfejlesztés, tényellenőrzés, szerkesztés, marketing és terjesztés terén.

Jelent-e létfontosságú fenyegetést a szerzőkre?

Beszéltem egy nagyon okos szerzői ügynökkel, aki sokat gondolkodott azon, hogy mit jelent a mesterséges intelligencia az ő ügyfelei és minden hivatásos szerző számára. A beszélgetésünk során a könyv mint ‘tartály’ ötlete került előtérbe, és megkértem, hogy fejtse ki ezt az elképzelést. Válasza így hangzott:

“Az alapgondolat az, hogy amikor a szerzők/ügynökök egy könyvet helyeznek el egy kiadónál, az éppen csak az: egy könyv. Van egy megértés, hogy később az ismert számtalan származékos műformák egyikévé válhat (fordítás, drámai adaptáció, képregény stb.), de mindez másodlagos a ‘Mű’ magához képest. A Mű nem egy zsák szavakból, kifejezésekből vagy tényekből áll, hanem valami, amit a szerző egyedülálló módon szerkesztett. A tartály megtörése, a Scrabble betűtáska megrázása és egy véletlenszerű kiválasztás (ami nem teljesen véletlenszerű, mert egy Scrabble táskáról van szó, amely az adott szerző szintaxisából, szemantikájából és stílusából áll), nem az, amit figyelembe veszünk, amikor jogokat adunk egy kiadónak.

“A könyv az az integrált egész, amely több, mint részeinek összessége. Ez egy kreatív epifánia (és rengeteg kreatív szellemi munka) terméke, amely mindezt egy könyvként hozta össze, nem csak ‘egy’ könyvként, hanem az adott szerző könyveként.”

A könyvek kincseket tartalmaznak

Amikor az ismeretterjesztő könyvekre gondolok, a tartály megtörése az AI korszakának egyik előnye. Megtöröd a tartályt, és mint a Fabergé tojások, kincsek rejtőznek benne.

A tartály korlátai egyszerre jelentenek előnyt és hátrányt. Egyrészt “a Mű nem csak egy zsák szavakból, kifejezésekből vagy tényekből áll, hanem valami, amit a szerző egyedülálló módon szerkesztett.” Másrészt, a tartály létrehozása során a szerző a könyves tartály belső korlátai miatt kénytelen volt csökkenteni, elutasítani, újraírni és újrakonfigurálni. A munka csiszolt, de desztillált, és néhány dolog elveszett (míg mások nyertek) az út során.

Az emberek részben azért nem olvasnak hosszú ismeretterjesztő könyveket, mert hozzászoktak ahhoz, hogy az interneten található összes szöveget átfutják - beleértve az e-maileiket is. Még a “könyvösszefoglaló” modell is kudarcot vall - egy emészthetetlen 250 oldalas ismeretterjesztő könyv helyett egy emészthetetlen 8 oldalas összefoglalót kapsz a könyvről.

A könyvek olyanok, mint az uzsonnás dobozok - minden egy helyen van. De én csak a sütit akarom.

Nem lesz könnyű a megalapozott szerzőknek levetni láncaikat. De meg kell tanulniuk ezt megtenni, vagy kockáztatják, hogy egy új generációs ügyes kutatók és írók elhomályosítják őket, akik képesek formális tartályokkal vagy anélkül kifejezni magukat, ahogy az alkalom kívánja. A tartályok túl sok korlátot és korlátozást szabnak.

Végül is az írás üzlete visszavonhatatlanul megváltozott. Ez olyan, mint az írnokok végzete. Ebben az esetben szerzőinknek ki kell bújniuk asztaluk mögül és a könyv tartályos nézetéből, és kapcsolatba kell lépniük a formával és közönségükkel.

Ó igen, jól ismerem a szerzői ellenvetéseket: De én író vagyok, nem promóter. Nem vagyok jelen a közösségi médiában. Nem érdekel, hogy ténylegesen kapcsolatba lépjek olvasóimmal, kivéve a munkámmal és esetleges e-mailekkel, valamint még ritkább megjelenésekkel. Van egy weboldalam (de, hogy őszinte legyek, soha nem frissítem). A munkám az ajándékom az olvasóknak. Elfogadhatják a munkámat, vagy elutasíthatják a munkámat, de nem csatlakozom hozzájuk a nappalijukban.

Nos, elteheted a tekercseket és a hermelin véréből készült tintát. Az “író” foglalkozás ma már azt követeli meg, hogy kijöjj az íróasztal mögül, és találkozz olvasóiddal ott, ahol élnek, a nappalijukban és a Facebook oldalukon. Sajnálhatod, amennyit csak akarod, miközben bezárjuk a támogatásaidat, a státuszodat és a publikációs lehetőségeidet. Ez az írók és olvasók bátor új világa, kiadók nélkül, azok a szörnyű közvetítők, akik keményen dolgoznak, hogy javítsák a munkádat, de folyamatosan megszakítják a közvetlen kapcsolatodat az olvasókkal, azokkal az emberekkel, akik a legjobban értékelik.

Ez semmiképpen sem zárja ki, hogy nagyszerű narratív non-fiction könyvek eljussanak egy érzékeny közönséghez. Épp ellenkezőleg. Ezek a könyvek továbbra is ragyoghatnak. Még mindig lesznek bestseller non-fiction könyvek, bár a gazdasági feltételek lehetetlenné válnak mindenki számára, kivéve a legjobban eladott írókat. A jelenlegi modellnek nem kell eltűnnie ahhoz, hogy az új modell virágozzon.

Ezeket a nagyszerű non-fiction könyveket “gyönyörűnek” tartom. “Gyönyörűnek” abban az értelemben, hogy gyönyörűen írtak, gondosan szerkesztettek, gondosan tervezettek és FSC-tanúsítvánnyal rendelkező papírra nyomtatottak, díszes széllel. Boutique-okban árulják őket.

A butikokat ‘könyvesboltoknak’ hívják, de minden jellemzőjük megvan a butik kiskereskedelemnek – szép tárgyak, amelyeket gondosan választanak ki a tulajdonos és a menedzserek, kicsit drágák, de azok számára, akik értékelik az ilyen tárgyakat, megéri az árukat.

A legtöbb non-fiction szerző feladata most az, hogy túllépjen a tartályon, valamint a kiadón, mint kapuőrön.

Tartályok több médiában

Az olvasóközönség, különösen a fiatalabb tagjai, egyre inkább “média-agnosztikusak”. Szórakozást vagy tudást keresve nézhetnek YouTube vagy TikTok videót, Netflix sorozatot, hallgathatnak Spotify-on, görgethetnek az Instagramon (“Insta”), követhetik a híreket, vagy néha olvashatnak egy könyvet.

(A BookTok nyomtatott könyveket simogató lakói értékes befolyásolók csoportját alkotják, de összességében szerény piaci hatásuk van.)

Mégis a piaci modell még mindig az egyedi tartályra összpontosít. A kiadói ipar. A filmipar. A televíziós ipar. A zeneipar.

A filmek nem könyvek. A YouTube videók nem filmek. A podcastok nem hangoskönyvek.

Ezek a silók nem voltak történelmi elkerülhetetlenségek, hanem erős szervezetek által idővel hozott üzleti döntések eredményei.

Nem nehéz megzavarni egy üzleti modellt, amely egyetlen tartályra épül.

Minden nyelvi készségük ellenére a jelenlegi generatív mesterséges intelligencia még nagyobb bátorsággal varázsol hangokat, képeket és videókat. A mesterséges intelligencia lehetővé teszi ennek a könyvnek a hangoskönyveit, több nyelven, az ebook 31 fordítása mellett. Mindez nem lenne lehetséges mesterséges intelligencia nélkül - a hagyományos produkció gazdasági szempontból nem érné meg nekem.

Tartály silók

A tartalomkészítőket hagyományosan úgy képezték, hogy csak egyetlen tartály silóban jeleskedjenek. Vannak írói programjaink, filmes programjaink és zenei programjaink. Ritkán fordul elő, hogy a kreatív írók “kisebb” tantárgyként filmet vagy zenét tanuljanak. Vagy számítógépes programozást vagy alkalmazásfejlesztést.

Mi történt a transzmédiával? Hol vannak azok a programok, amelyek a kreatívokat úgy oktatják, mint ahogy az Apple egyszer megfogalmazta, “a digitális média mestereivé”?

A legjobb tartalom mindig nyerni fog. De idővel a tartályok egyre kevésbé számítanak. A digitális generáció lehet, hogy nem tartály-agnosztikus. De mindenképpen tartály-rugalmasak. A legtöbb tartalmat digitálisan találják meg, okostelefonokon keresztül. A nyomtatott kiadványok továbbra is megtalálják a közönségüket, de soha többé nem lesznek a központban.

A “jövő kiadójának” is tartály-rugalmasnak kell lennie. A tartalomterjesztés növekedése nem papírra nyomtatott tintán vagy EPUB fájlokban található szavakon keresztül történik. A hangoskönyvek növekedése nem véletlen, ahogy a YouTube és a TikTok népszerűsége sem.

A nagyobb kihívás abban rejlik, hogy az új és meglévő tartalmakat felfedezhetővé tegyük, bármilyen formában is legyenek, és a felfedezés után a tudatosságot vásárlási döntéssé alakítsuk.

Felfedezés és konverzió

Az online felfedezési probléma már egy ideje velünk van; a mesterséges intelligencia nem hozta létre. A probléma, amelyet az iparági veterán Mike Shatzkin többször is kiemelt. Olyan sok cím elérhető nyomtatásban, és a digitális formátumok lehetővé teszik, hogy folyamatosan nyomtatásban maradjanak. Milliókban találhatók meg az antikvár könyvek a használt könyvkereskedőktől. Ezen felül évente több mint kétmillió új könyv jelenik meg, csak angolul. A mesterséges intelligencia tovább súlyosbítja a telítettségi problémát, de már most is kezelhetetlen.

Az Amazon algoritmusai nem önzetlenek - nagyon jól megmutatják, mi eladható, melyik könyvet fogod legvalószínűbben megvásárolni. Ez a könyv nem csak az eladási adatai alapján jellemezhető. Azért fogyott a legjobban, mert ez volt a legjobb, és a lelkes olvasók elmondták másoknak, hogy vegyék meg, mind online, mind személyesen. (Az Amazon ösztönözte a reklámokat, amelyek torzítják algoritmusait, ami a platform elrontásához vezetett.)

Korábban beszéltem a metaadatokról. Az átváltás éppoly bosszantó, mint a felfedezés. Segíthet-e a mesterséges intelligencia az íróknak, hogy az érdeklődőkből vásárlókat csináljanak?

A szerzői jog jövője

A szerzői jog fogalma abszurddá vált a mesterséges intelligencia által. Nem arról van szó, hogy az emberek nem akarnak vagy nem érdemelnek védelmet a munkájukért - vitathatatlanul jobban megérdemlik, mint valaha. És nem arról van szó, hogy a mesterséges intelligencia használhatatlanná teszi a szerzői jogot (legalábbis valamilyen formában, ha nem is a jelenlegi formában).

Az a helyzet, hogy a “szerzői jog védelme” egyben az a fátyol is, amely mögött a műved eltűnik. Ha a könyvedet nem lehet hivatkozni egy beszélgetés során a ChatGPT-vel, akkor de facto nem létezik. A mesterséges intelligencia cégek csak a tartalom crème de la crème-jét fogják licencelni. Nincs szükségük a lefölözött tejre.

Miért védenénk azt, ami nem található meg?

Ez az a pont, ahol a felfedezési probléma katasztrófává válhat. A Google nagyszerű munkát végez a könyvek felfedezésében csak a metaadataik alapján. A mesterséges intelligencia az egész enchiladát akarja. A hagyományos keresőmotorokkal ellentétben a mesterséges intelligencia nemcsak a művek absztrakt metaadatai alapján válaszol a felhasználói kérdésekre.

Ugyanakkor a tartalomtárolók változtatása, a teljes könyveken kívüli tárolók különböző szerzői jogi kihívásokat vetnek fel. Ha egy könyv szövege a felhasználói bemenetek alapján menet közben változhat, akkor mi lesz a szöveg szerzői joga?

Írók és olvasók

A kiadóknak szükségük van szerzőkre; a szerzőknek nincs szükségük kiadókra.

A kiadás jövője az írók és az olvasók közötti intim kapcsolat. Ez sokkal erősebb, mint az írók és a kiadók, valamint az olvasók és a kiadók közötti kapcsolat. A kiadók útakadályt jelenthetnek az írók és az olvasók közötti kapcsolatban. Sok esetben nem támogatják a kapcsolatot; akadályozzák azt.

Hosszú ideig az egyetlen módja a magas színvonalú írott tartalom elérésének a könyvek vagy egy szerény választékú folyóiratok révén volt. Ez már biztosan nem így van. Teljesen eltekintve a más médiumok által okozott figyelemeltereléstől, most már annyi különböző mód van a (nem tárolt) magas színvonalú írott tartalom elérésére. A könyvek már nem élvezik azt a kiváltságot, amit korábban.

A mesterséges intelligencia kommunikálni tud

“Mi a tökéletes könyv, amit elolvashatok legközelebb?” A generatív mesterséges intelligencia olyan elokvenciával és precizitással tud válaszolni erre a kérdésre, amely eddig soha nem volt lehetséges. Ahogy a mesterséges intelligencia megbízható ajánló motorrá válik, a szerzőknek ezen a motoron keresztül kell kommunikálniuk. (Az Amazon természetesen dolgozik ezen, és előnye, hogy tudja, mit vásároltál korábban.)

Következtetés

Hol hagy ez minket?

Szükségesnek éreztem, hogy katalogizáljam a kiadás előtt álló kihívásokat. A Chat AI egy olyan időszakban érkezik, amikor a kereskedelmi kiadás problémás. Nem egy olyan időszakban érkezik, amikor az ipar robusztus, és képes azt mondani: “nincs szükségünk valami új technológiára; jól vagyunk.”

Korábban beszéltem a kiadás legégetőbb kihívásairól: a növekvő költségekről és a zsugorodó árrésekről.

A farkasok soha nem lesznek elégedettek az egyre meredekebb kedvezmények iránti követeléseikkel; az árrések nem fognak javulni. A kiskereskedelmi árak közel vannak a plafonhoz. A jelenlegi kereskedelmi kiadási modell jövője a költségcsökkentésben rejlik.

A fizetések nem mehetnek alacsonyabbra, ezért a termelési ciklusban kell költségeket csökkenteni.

De a kiadók évtizedek óta próbálják csökkenteni a termelési költségeket. Voltak néhány figyelemre méltó sikerek, de a jelenlegi lehetőségeket már kimerítettük.

Megmutattam, hogy a mesterséges intelligencia hatékonyságot hozhat a kiadásba, a munkafolyamat során. Ezek nem azonnaliak és nem könnyűek: dolgozni kell a mesterséges intelligencián. De a lehetőség ott van.

A kiadók nem keresik a személyzet csökkentését, így a cél az, hogy több könyv kerüljön gyorsabban a piacra a jelenlegi személyzeti erőforrások alapján. A mesterséges intelligencia eszközök segíthetnek ezen cél elérésében.

És természetesen mindig van cél több példány eladására a kiadott könyvekből. A mesterséges intelligencia ebben is segíthet.

Leírtam fentebb, hogy a mesterséges intelligencia hogyan lehet átalakító a kiadás jövője számára.

Ne aggódj emiatt. Tegyél rendet a házadban, és beszéljünk tovább.

Egyetlen forrás

Most már szinte végtelen mennyiségű anyag áll rendelkezésre, hogy informáljon téged a mesterséges intelligenciáról, túl sok, természetesen. Válaszd ki a preferált médiumodat: könyvek, blogok, hírlevelek, videók, podcastok, kurzusok és pszichikai jövendölés. Néhány kulcsfontosságú forrásra hivatkoztam ezen a könyvön keresztül, érdemes rákattintani néhány véletlenszerű linkre, hogy lássuk, hova vezetnek.

Csak egy kiváló mesterséges intelligencia könyv van kezdőknek, Ethan Mollick Co-Intelligence, amely 2024 áprilisának elején jelent meg. Egyformán kiváló hírleveléből, a “One Useful Thing”-ből származik.

Mellékjegyzet: a könyv írásához szükséges képesítések

Nem akartam az előszót ezzel az információval terhelni, de tisztában vagyok vele, hogy sokan szkeptikusak az AI-ról író emberekkel szemben, gyanakodva, hogy ezek az írók mai AI szakértőknek állítják be magukat. Kétségtelenül vannak ilyenek is. Remélem, hogy elfogadható képesítéseim vannak ahhoz, hogy ezt a projektet vállaljam.

1988-ban olvastam az első könyvemet a mesterséges intelligenciáról, egy két évvel korábban megjelent könyvet, Terry Winograd és Fernando Flores Understanding Computers and Cognition: A New Foundation for Design című művét. A könyv sűrű volt - sok része meghaladta a megértésemet - de ez volt az első alkalom, amikor izgatott lettem a mesterséges intelligencia lehetőségei miatt a könyvkiadásban.

Ekkor már mélyen belemélyedtem a kiadványszerkesztés digitalizálásába, amit az asztali kiadványszerkesztés, az Apple számítógépek, a PageMaker és hasonlók robbanása idézett elő. 1986-ban felügyeltem a Page One automatizált könyvkiadási szoftver fejlesztését, egy olyan programot, amely egy könyv kéziratát Microsoft Word fájlként fel tudta tördelni egy egész könyvvé percek alatt. Ma ez nagyon könnyű; akkoriban nem volt az.

Ezt követően is a kiadástechnológiában dolgoztam, mint tanácsadó és elemző, együttműködve néhány vezető szoftver- és hardvergyártóval, köztük az Adobe-val, az Apple-lel és a Microsofttal. Emellett résztulajdonosa lettem egy Enfocus nevű szoftvercégnek. Automatizált rendszert hoztunk létre előkészítő munkafolyamatokhoz.

Akkor még nem volt hozzáférésünk AI-hoz, de nagyon jók lettünk a teljesen automatizált kiadási rendszerek bevezetésében. Ahogy a mesterséges intelligencia varázslatnak tűnhet, úgy a legjobb automatizálás is AI-nek látszhat.

Gyors előretekintés 2016-ra, amikor kollégám, Cliff Guren segített összpontosítani az AI-ra a könyvkiadásban: úgy tűnt, hogy végre valami történik. 2016 szeptemberében megjelent The Bestseller Code (Archer és Jockers), amely világossá tette, hogy a számítógépek nagy fokú betekintéssel és pontossággal képesek értelmezni az irodalom textúráját.

Ekkorra már szorosan figyeltem a könyvkiadási startupokat, és néhány közülük valamilyen AI technológiát is beépített a szoftver kínálatába.

Újabb gyors előretekintés 2022 októberére.

Hónapokkal azelőtt, hogy mindenki erről beszélt volna a kiadási iparban, Tim O’Reilly előadást tartott a PageBreak Konferencián “AI és a kiadás átalakulása” címmel. O’Reilly jól ismert a kiadói közösségben, mind az O’Reilly Media, mind a Tools of Change konferencia révén. Ő az egyik legnagyobb vízionárius a tech világban.

O’Reilly nem csupán lelkes volt az AI új fejleményeivel kapcsolatban, hanem túltett minden várakozáson. “Olyan ponton vagyunk, amely nagyon hasonlít arra az érzésre, amikor 1992-ben felfedeztük a Világhálót,” mondta, és hozzátette: “ez olyan átalakító erejű, mint a VisiCalc, a PC és a webböngésző.”

Beismerte, hogy (akkoriban) az esettanulmány még homályos volt, és néhány pilot projektet említett az O’Reilly Media-nál. De azt mondta: “ez ijesztően gyorsan javul. A gépi tanulás már nem a jövő dolga. Ez az AI demokratizálásáról szól.”

O’Reilly arról beszélt, hogyan kell a kiadóknak megközelíteni ezeket az új technológiákat, mondván, hogy “tudniuk kell, mikor kell felégetni a hajókat és teljesen elköteleződni. Van egy idő, amikor el kell köteleződni.”

A ChatGPT csak egy hónappal később jelent meg. A PageBreak volt az első kiadói konferencia, amely ezt központi témává tette Tim meglátásai révén.

Közlemények

Ennek a könyvnek öt szponzora van. Amikor a könyvet írtam, tudtam, hogy kevés gazdagságot fogok találni, és úgy döntöttem, hogy szponzorokat hívok meg, hogy támogassák az erőfeszítéseimet.

Ahogy weboldalamon jelzem, tanácsadóként, elemzőként és újságíróként dolgozom, támogatva a Nemzetközi Újságíró Szövetség Globális Etikai Chartáját. A 13. bekezdés világosan fogalmaz az összeférhetetlenség vagy “tevékenységem és a reklám vagy propaganda közötti bármilyen zavar elkerülésének” kötelezettségéről.

Szponzorok bevonása érdekkonfliktust és reklámmal kapcsolatos zavart jelent. Ha a New York Times-nál dolgoznék, egyszerű lenne: “Nem.” Saját magamnak dolgozva a nyilvánosságra hozatal az én fegyverem ezeknek a kötelezettségeknek a kielégítésére: Leírom a kapott ellenszolgáltatást, és Ön megítélheti a munkámból, hogy befolyásoltak-e.

Azokat a szponzorokat választottam, akiket meghívtam ebbe a projektbe, mert nem csak a munkájukkal voltam tisztában, hanem az egyénekkel is, akik az ő szervezeteikben dolgoznak. Ők kollégák és barátok. Elmondtam nekik, hogy a termékeikről szó eshet a könyv szövegében, és nem lesz beleszólásuk ezekbe a szavakba. Amit irányíthatnak, azok a könyv végén található hirdetések - ezeket úgy teszem közzé, ahogy kaptam. Ezt tettem.

Másoktól is kaptam kifizetéseket, amelyek befolyásolhatták a könyvön végzett munkámat - a következőket tudom felsorolni:

  • Nem végeztem fizetett tanácsadói munkát a könyvben leírt AI szállítóknak, beleértve a szponzorokat is.

  • Nyereségrészesedési bevételt kaptam a Publishers Weekly-től az AI webináriumokért 2023 szeptemberében.

  • Szokásos díjat kapok a Publishers Weekly cikkeimért.

Kérem, értesítsenek, ha bármilyen részrehajlást észlelnek, amit ezek az elkötelezettségek okozhattak. Az AI iránti elfogultságom még azelőtt alakult ki, hogy a hatalmas gazdagságok áramlani kezdtek volna.

Köszönetnyilvánítás

Nem tudnék hitelesen beszélni az AI-ról, ha nem lenne a Publishers Weekly támogatása, beleértve az emeritus szerkesztőt, Jim Milliot-t és a vezérigazgatót, Cevin Bryerman-t. Jim támogatta korai AI-ról szóló írásaimat, és Cevin (Krista Rafanellóval és a csapat többi tagjával együtt) elengedhetetlen volt a múlt őszi konferencia, AI and the Revolution in Book Publishing sikeréhez. Andrew Albanese most a PW ügyvezető szerkesztője; Ed Nawotka, vezető szerkesztő. Szerencsés vagyok, hogy velük dolgozhatok.

És további köszönet számos kollégának…

  • Peter Brantley

  • Cliff Guren, régi vitapartner és éleslátó olvasója a vázlataimnak

  • Két másik ‘béta’ verzió olvasó, értékes visszajelzést nyújtott: Joe Wikert és Brad Farmer

  • A Publishing Technology Partners csapattagjaimnak, Ken Brooks, Bill Kasdorf, Bill Rosenblatt, Bill Trippe, Steve Sieck, és az új partnereinknek, Lettie Conrad és Linda Secondari.

  • Nővéremnek, Anne Pashley-nek, aki segít naprakészen tartani a kiadói startup adatbázisomat, és folyamatosan energiát ad a törekvéseimhez.

  • Az AI webináriumaim havi partnereinek: Brooke Horn és Brian O’Leary a BISG-től.

  • Bill Kasdorf segített a könyvem hozzáférhetőségi kérdéseinek részletes vizsgálatában.

  • Peter Armstrong és Len Epp a Leanpub-nál türelmesen kezelték a problémáimat, és segítettek a Leanpub platformon a lehető legjobb eredmény elérésében.

  • Hugo Rayne az ElevenLabs-nál az audiokönyv támogatásáért.

  • Jó barátomnak és a írásaim és érveléseim hibáinak megbízható észlelőjének, Bob McArthur-nak.

Függelék: A hagyományos kiadás fennmaradó előnyeinek felfedezése

A hagyományos kiadás presztízse az oka annak, hogy legtöbben csatlakoztunk az iparhoz. Könyveket szerettünk gyermekkorunkban, angol vagy hasonló szakot tanultunk az egyetemen, egy ideig próbálkoztunk, talán könyvesboltban dolgoztunk, talán Kiadási Mesterdiplomát szereztünk, majd egy kiadónál gyakornokoskodtunk, és ma itt vagyunk. Szereted a munkádat, bár a fizetés rossz és a munkakörülmények nem mindig kellemesek.

Ugyanez a presztízs táplálja a kiadási ellátási láncot. Az ellátási lánc bemeneti oldala: sokat jelent sok szerző számára. Mindig látjuk. A hagyományos kiadás gazdaságtana nem logikus, és négyszer annyi időbe telik, hogy kinyomtassanak, de talán, csak talán, én leszek a következő debütáló nyertes, mint Delia Owens (Ahol a folyami rákok énekelnek) vagy másodszor is megasiker, Amor Towles (Egy úr Moszkvában).

Ez olyan, mint Vegas: kivéve, hogy Nevadában jobbak az esélyek. Játssz egyetlen számra a rulettben, és az esélyed 36 az 1-hez. Játssz a hagyományos kiadással, és az esélyeid… sokkal rosszabbak.

Az esélye annak, hogy szerződést köss bármelyik hagyományos kereskedelmi kiadóval, nem is beszélve a nagy 5-ről, rosszak. De ez a legkisebb problémája egy szerzőnek. Valójában az olvasók megtalálása az igazi kihívás.

Egy dolog, ami segíthet, az az, ha felkerülsz egy bestseller listára.

Nézzük meg a PRH-t, vagyis a Penguin Random House-t. A cég évente mindössze 15,000 új címet ad ki. 2021-ben sikerült 196 könyvet feljuttatniuk a Publishers Weekly bestseller listájára. Ahogy a kapcsolódó cikk kiemeli: “PW négy felnőtt bestseller listát közöl, mindegyik 20 címmel: keménytáblás szépirodalom, keménytáblás ismeretterjesztő, kereskedelmi papírkötésű és tömegpiaci papírkötésű. Ez azt jelenti, hogy egy év alatt 2,080 keménytáblás és 2,080 papírkötésű pozíció van a listáinkon.

Nem minden bestseller volt abban az évben újonnan kiadott – tegyük fel nagylelkűen, hogy 90%-uk volt, azaz 1870 hely.

Eközben a The New York Times 15 bestseller helyet biztosít hetente könyvkategóriánként (szépirodalom, ismeretterjesztő, gyerekeknek szóló; külön listák YA és how-to könyvekre; keménytáblás külön a papírkötésűektől, plusz kombinált listák). Egy egyéni szerző számára ez évente 780 elérhető helyet jelent, bár ezek többségét ismétlődő eladók töltik meg. (A test mindent számon tart című könyv Bessel van der Kolk már öt és fél éve szerepel a papírkötésű listán!) Tehát osszuk el ezt felére, 390 elérhető hely. Sokat kell eladni egy könyvből, hogy egy ilyen helyet megszerezz.

Mi a helyzet a New York Times Könyvszemlében való megjelenéssel? 2016-ban Pamela Paul, a Szemle akkori szerkesztője azt állította, hogy “A Könyvszemle az Times-ban évente megjelenő könyvek körülbelül 1%-át véleményezi.” Nyilvánvalóan a legnagyobb kiadók könyveire gondol – nem gondolhat kisebb kiadókra vagy önkiadott szerzőkre. Így talán évente 150 a PRH 15,000 új címe közül kerül áttekintésre.

A legtöbb megfigyelő egyetért abban, hogy bár a vezető médiumoktól való figyelem még mindig fontos és lehet erőteljes, a vélemények hatása már nem olyan, mint régen, ha már csak azért is, mert kevesebb könyvolvasó lép kapcsolatba a főbb véleménycsatornákkal.

Fordítsuk figyelmünket az ellátási lánc lefelé irányuló részére, az elosztásra. Míg a kiadói márkák nagy súlyt képviselnek a szerzőknél, mindig is igaz volt, hogy a fogyasztási cikkekkel ellentétben a kiadói márkák szinte semmilyen súlyt nem képviselnek a könyvvásárlóknál és olvasóknál. De sok súlyt képviselnek az elosztóknál és könyvkereskedőknél. Ez tükrözi a kiadás történelmileg üzletről-üzletre (B2B) természetét (szemben a fogyasztói B2C-vel). A kiadói presztízs az elosztási és kiskereskedelmi csatornákon keresztül kerül terjesztésre: a Barnes & Noble azért viszi a könyvet, mert a PRH adta ki, és így helyezi az olvasók elé; így terjesztik a presztízst az olvasókhoz.

Támogatók

Egy banner, amelyen az áll: 'BOOK ADVISORS LLC Tranzakciós szolgáltatások és tanácsadás kiadók számára'.

David Lamb és Susan Reich 2016-ban alapították a Book Advisors LLC-t, hogy tanácsot adjanak a kiadói egyesülések és felvásárlások terén. Több mint egy tucat tranzakciót hajtottunk végre, valamint különféle pénzügyi, elosztási és működési tanácsadási projekteket, beleértve a piaci értékbecsléseket is. Örömmel dolgoztunk együtt a Clarke & Esposito-val; Thad McIlroy-val a The Future of Publishing-től; és Kuo-Yu Liang-gal a Ku Worldwide-tól.

Büszkék vagyunk kapcsolatainkra, szorgalmunkra és diszkréciónkra. Akár vásárolni, eladni, finanszírozni vagy tanácsot kérni szeretne, kérjük, lépjen kapcsolatba velünk egy bizalmas megbeszélésre.

bookadvisorsllc.com | bookadvisors@gmail.com

Egy 3x2-es banner rács: Egy banner, mely bejelenti, hogy a Papercutz-ot a Mad Cave Studios felvásárolta 2022 augusztusában, a Ku Worldwide LLC közreműködésével; Egy banner, mely bejelenti, hogy a DAW Books-ot az Astra Publishing House felvásárolta 2022 júliusában, a Ku Worldwide LLC közreműködésével; Egy banner, mely bejelenti, hogy a Caslon Publishing-ot a Brookes Publishing Co. felvásárolta 2022 áprilisában, Thad McIlroy közreműködésével; Egy banner, mely bejelenti, hogy a B.E.S. Publishing-ot a Sourcebooks felvásárolta 2021 novemberében; Egy banner, mely bejelenti, hogy az Applewood Books-ot az Arcadia Publishing felvásárolta 2023 áprilisában; Egy banner, mely bejelenti, hogy az Erewhon Books-ot a Kensington Publishing felvásárolta 2022 októberében
A Firebrand Technologies és a NetGalley logója.

Firebrand Technologies egy szoftver- és szolgáltató cég, amely több mint 35 éve segíti a könyvkiadókat adat- és munkafolyamat-kezelési megoldásokkal.

NetGalley egy online platform, amely összeköti a kiadókat és szerzőket a recenzensekkel, könyvtárosokkal, könyvkereskedőkkel, médiával és oktatókkal, akik felfedezik az új könyveket a NetGalley-n és ajánlják őket közönségüknek.

Szoftver- és digitális megoldások fejlesztőiként a Firebrand Technologies és a NetGalley iparági szakértők és aktív tagjai a kiadói közösségnek. Megoldásaink a kiadási folyamat minden aspektusát támogatják, a beszerzésektől egészen az értékesítésig és marketingig.

  • NetGalley segít a kiadóknak hírverést kelteni a címek körül, gyors visszajelzéseket és értékeléseket kapni, valamint korai trendeket felfedezni.

  • Title Management Enterprise a kompakt verziójával együtt, Title Management Lite, a Firebrand alap szoftveralkalmazása, amely fejlett kiadói munkafolyamat-kezelést biztosít az egész kiadási folyamat során.

  • Eloquence on Demand a kiadói ipar legnagyobb teljesítményű ONIX terjesztési platformja, amely metaadatokat és digitális eszközöket terjeszt több mint 600 kereskedelmi partnernek ONIX és más formátumokban.

  • Flywheel egy hátsólistás marketing szolgáltatás, amely rejtett lehetőségeket azonosít a hátsólistában a nagyobb felfedezhetőség és értékesítés érdekében.

  • Eloquence on Alert élő címadatokat és piaci trendeket figyel és értesíti a kiadókat kritikus hibákról és lehetőségekről, amelyek befolyásolhatják az értékesítést (hiányzó vásárlási gombok, harmadik féltől származó eladók stb.).

  • FlightDeck a legfejlettebb EPUB Érvényesítő és Tesztelő eszköz, ami elérhető.

Egy infografika, amely a NetGalley által kínált különféle szolgáltatásokat mutatja be, beleértve a könyv promóciót, kiadói munkafolyamat-kezelést, metaadatok terjesztését, értékesítést és hátsólistás marketinget, valamint az EPUB tesztelést.
Banner a Perfect Bound számára, amely összekapcsolja a kiadókat és nyomdákat világszerte.

Üdvözöljük a könyvnyomtatás jobb módjában.

A Perfect Bound-ot 2022-ben hozták létre, hogy segítsenek az évek óta sújtó ellátási lánc problémák megoldásában a könyvkiadási iparban. A nyomdákban fennálló túlkapacitási időszakokat az ellátási szűkösség miatti késedelmek rövid időszakai követik. A Perfect Bound célja, hogy megnyissa a nyomtatási piacot a független kiadók és szerzők előtt, lehetővé téve a nyomdáknak a világ minden tájáról, hogy könnyen kapcsolatba léphessenek és üzletelhessenek kiadókkal, akik új és dinamikus beszállítókat keresnek.

Mi az a Perfect Bound?

A Perfect Bound egy kétoldalú piactér, amely összekapcsolja a független könyvkiadókat az Egyesült Államokban, Kanadában, Kolumbiában, Brazíliában, Törökországban, Kínában, Malajziában, Indiában stb. található nyomdákkal.

Illusztráció egy nyomdagépről, amely különféle típusú könyveket és kiadványokat gyárt.

Fedezze fel új kiadói partnereit egy kattintással

Robusztus platformunk lehetővé teszi, hogy egyszerűen készítsen termékajánlatokat, küldjön ki kéréseket több száz nyomdának egy gombnyomással, tárgyaljon és véglegesítse a nyomtatási futamokat, és kövesse nyomon a termékeket a nyomdától a raktárig. Nyomdászként soha nem volt könnyebb vagy biztonságosabb új kiadókkal kapcsolatba lépni, pályázni a közelgő projektekre és fizetést kapni.

Kapcsolódjon új kiadói partnerekhez azonnal

  • Küldjön és fogadjon nyomtatási kéréseket a világ minden tájáról

  • Vezérelje és kövesse a nyomtatási futamokat a nyomdától a raktárig

  • Végezzen zökkenőmentes tranzakciókat ACH fizetésekkel a Stripe-on keresztül anélkül, hogy elhagyná a platformot

Egy Shimmr-hirdetés, amely automatizált reklámozást mutat be, amely könyveket értékesít, 35%-os értékesítési növekedést és kétszer jobb hirdetési megtérülést említve.
Egy Shimmr-hirdetés példahirdetésekkel, árképzési információkkal és QR-kóddal egy bemutató lefoglalásához.

Ismerje meg az Insightot, egy kifejezetten kiadók számára készült AI platformot

Egy közeli kép egy könyvet tartó emberről, amelyből ragyogó elemek sugároznak ki.

“Az Insight bevezetése a kiadónknál olyan volt, mintha bicikliről Ferrarira váltottunk volna. Hirtelen minden gyorsabban megy.”

—-Német gyermekkönyvkiadó és Insight ügyfél

Dolgozz okosabban, érj el többet

A Veristage által fejlesztett Insight lehetővé teszi a kiadók számára, hogy boldoguljanak a fejlődő MI területén. Az MI és egy robusztus digitális eszközkészlet segítségével az Insight elemzi és megérti a dokumentumait és könyveit, hogy segítse Önt:

  • Metaadatok létrehozása, javítása és frissítése

  • Felgyorsítani a cím-specifikus marketing, nyilvánosság és értékesítési anyagok létrehozását

  • Azonosítani és értékelni egy könyv fő üzeneteit, egyedi eladási pontjait, célközönségét, versenytársait és még sok mást

  • Optimalizálni marketing és értékesítési tartalmát a maximális elérés, elkötelezettség és növekvő eladások érdekében

Az általános MI platformokkal ellentétben az Insight a kiadási munkafolyamatokban működik, és segít kiadás-specifikus információk és eszközök létrehozásában.

Hogyan működik

  1. Töltse fel könyvét az Insight platformra

  2. Az Insight MI eszközei elemzik és megértik könyvét

  3. Néhány perc alatt az Insight számos metaadatot és kulcsinformációt generál könyvéről a szerkesztőségi, marketing, nyilvánossági, értékesítési és jogi osztályok számára

  4. Manuálisan szerkesztheti ezeket az információkat közvetlenül a platformon. Könyvét és az MI által generált tartalmat az Insight megőrzi, így bármikor hozzáférhet hozzá.

  5. Használja dokumentum-tudatos MI csevegésünket, hogy optimalizálja címadatait, kommunikáljon könyveivel, és integrálja a könyv részleteit a kommunikációkba és egyéb anyagokba

Biztonság és Szerzői Jog

A Veristage csapata elkötelezett amellett, hogy biztonságos MI szolgáltatásokat nyújtson, és védje a kiadók szellemi tulajdonát. Platformunk fejlett információbiztonsági rendszerekkel rendelkezik, és csak olyan MI modellekkel dolgozunk, amelyek nem tárolják vagy használják fel az adatait a jövőbeli modellek képzéséhez.

Megoldások minden méretű kiadónak

Az Insight úgy lett kialakítva, hogy mindenféle méretű kiadóknak megfeleljen, a fogyasztói és akadémiai kiadóktól kezdve a háromfős csapatoktól a multinacionális szervezetekig. Versenyképes árakat és skálázható megoldásokat kínálunk.

Beszéljen velünk, hogy megtudja, hogyan segíthet az Insight az Ön vállalkozásának:

A Veristage kék logója absztrakt dizájnnal.