AI-revolutionen inden for bogudgivelse (Dansk Udgave)
AI-revolutionen inden for bogudgivelse (Dansk Udgave)
Thad McIlroy
Buy on Leanpub

Indholdsfortegnelse

Indledning

“Den næste revolution vil overraske os alle, som de altid gør. Med andre ord: hvis folkemængden forventer revolutionen, kan det ikke være revolutionen.” —Doc Searls, 2002

Det er nu over et og et halvt år siden, at OpenAI introducerede ChatGPT til en offentlighed, der for det meste var ukendt med kunstig intelligens. I starten så det ikke ud til at have nogen åbenlys relevans for bogudgivelse. Siden da har alt ændret sig. Og intet har ændret sig. Forlagene er begyndt at dykke ned i de nye AI-værktøjer, udforske grænserne og engagere sig i forsigtige chats med ChatGPT. Men der er ingen tegn på en reel revolution i udgivelsespraksis; det er simpelthen for tidligt.

Der er en overflod af usikkerhed omkring AI i skrivning og udgivelse. Store kontroverser omgiver brugen af AI. Alligevel er der for mange spænding omkring mulighederne.

Jeg vil her fokusere mere på mulighederne end på farerne, men jeg inkluderer en oversigt over bekymringerne og risiciene ved AI, især som de gælder for forfattere og forlag. Jeg søger ikke at nedgøre bekymringerne. De er bare ikke, hvad denne bog handler om.

Er det en bog?

Jeg betragter denne publikation mere som et ‘hæfte’ end en bog. UNESCO’s definition af en bog er “mindst 49 sider” (hvorfor ikke 50?), og med 300 ord pr. side kunne denne ikke kvalificere sig. Men vigtigere er det ikke meningen, at det skal være det definitive ord om noget—det er mere en statusrapport. Kunstig intelligens og dens rolle i bogudgivelse ændrer sig i et rasende tempo, som ikke viser tegn på at aftage. Så denne bog(let), denne rapport, er blot et øjebliksbillede.

Ved at bruge Leanpub-platformen har jeg udgivet min forskning og analyse som et igangværende arbejde—det revideres som et levende dokument. Jeg har aldrig forsøgt dette før. Mine grunde er to: at tilbyde noget nyttigt på kort sigt og at have muligheden for at revidere det efter behov. AI-historien er langt fra slut.

Jeg håber, at min tilgang vil vise sig nyttig for læserne, selvom jeg er klar over, at for mange opdateringer hurtigt kan blive irriterende. Jeg har forsøgt at reducere aktualiteten af denne bog for at mindske fokus på de ting, der ændrer sig hurtigst.

Den version, der har været (stille) tilgængelig siden april 2024, markerede jeg som “75% færdig” og blev tilbudt gratis til læsere. 23. juli er den officielle udgivelsesdato for den “100% færdige” version, som også vil finde vej til større distribution uden for Leanpub. Jeg vil fortsætte med at opdatere 100%-versionen: men de opdateringer vil kun være tilgængelige for Leanpub-købere—det er uhåndterligt at opdatere trykte bøger, e-bøger og lydbøger, der er i bredere distribution, konstant.

Forlagets smerte med AI selv

Jeg hører dagligt om den smerte, som folk i forlagsbranchen oplever, når de prøver at komme overens med AI. Hvorfor er det så smertefuldt? Her er tre grunde, som jeg ser:

  • Teknologien er kompleks og mystisk, for kompleks til at ikke-videnskabsfolk kan forstå. (Der er en fascinerende undersøgelse, der postulerer en “AI angstskala (AIAS)”, der måler 21 forskellige grunde til, at folk er ængstelige over AI.)

  • AI er blevet enormt kontroversielt i udgivelse, hovedsageligt på grund af ophavsretlige spørgsmål, der rammer kernen af forfatterskab og udgivelse.

  • Alligevel er der også en atmosfære af FOMO—Fear Of Missing Out. På trods af AI’s mange fejl, som med mange lokkende teknologier (Apple-uret? Smarte højttalere?), står vi over for den nagende følelse: hvad nu hvis jeg går glip af den næste virkelig store ting, som jeg gjorde med et par af de sidste virkelig store ting. Jeg følte mig dum dengang; jeg vil ikke føle mig dum igen. Det gør ondt.

Okay: Det giver mening, at folk i forlagsbranchen føler AI-smerte.

Så hvad er brugssagen for denne bog?

Brugssagen er, at du arbejder i bogudgivelse, eller du er en forfatter, der prøver at forstå bogudgivelse bedre, og du er træt af at føle dig dum og forvirret omkring AI. For mange af dine kolleger ser ud til at forstå det bedre end dig, og du er træt af ikke at kunne deltage intelligent i samtalen.

Mit mål for læserne er, at de ved slutningen af denne bog vil føle sig i stand til at deltage i samtalen, til at udtrykke en informeret mening. Jeg vil have, at du føler dig rustet til at træffe personlige valg omkring teknologien og have en vej til at lære, hvordan du bruger AI, hvis du vælger at gøre det.

Jeg ønsker ikke at overvælde læserne med en masse snak om grundlaget for AI-teknologi—jeg vil ikke tale meget om AI i abstrakt forstand. I stedet vil jeg give dig en grundlæggende forståelse af AI specifikt til bogforfatning og udgivelse. Hvis nogen spørger dig, hvad betyder naturlig sprogbehandling egentlig, kan du svare som jeg gør: Jeg er ikke en AI-ekspert. Men jeg ved, hvordan AI bliver brugt i min branche.

Vil det være præcis det, du har brug for at vide?

Jeg bryder mig ikke om udtrykket “hvad du har brug for at vide”, fordi det så sjældent lever op til dets løfter, ofte rammer det langt forbi målet, enten langt mere end du behøver at vide, eller langt mindre. Vil jeg få det rigtigt? Jeg er seriøs omkring at forsøge at formidle det minimale. Jeg tror, jeg ved, hvad forlæggere har brug for at vide om AI, da jeg har talt med mange af dem, mens jeg har afholdt seminarer og webinarer designet meget specifikt til kun at levere det nødvendige.

An icon of a key

I stedet for at gentage udtrykket “hvad du har brug for at vide” uendeligt, vil jeg bruge et nøglelogo med noget indrykket tekst.

Efter resuméerne, der introducerer mange sektioner, vil jeg uddybe hovedkoncepterne. Jeg har også holdt disse så korte som muligt, selvom, sandheden skal frem, nogle gange går jeg i detaljer.

En kortform jeg vil bruge er “Chat AI.” Da OpenAI først udgav ChatGPT, var det det eneste på markedet, men nu er der flere vigtige konkurrenter. Jeg vil komme ind på specifikationerne om lidt, men du har sikkert allerede hørt om nogle af dem, åbenlyst Google og Microsoft. De (og flere andre virksomheder) tilbyder nu online AI chat-software, der ligner ChatGPT. Og så i stedet for at sige “ChatGPT og dets konkurrenter” vil jeg blot referere til hele kategorien som “Chat AI.” Hvis jeg skriver “ChatGPT” vil jeg henvise specifikt til OpenAI’s software.

Bogen er mest praktisk, men i den sidste sektion fremsætter jeg et essay om, hvad der kan være de virkelige konsekvenser af AI på bogudgivelsesindustrien, sammen med nogle andre spekulative overvejelser.

Hvem er denne bog til?

Den primære målgruppe for denne bog er handelsbogsforlæggere. Den sekundære målgruppe er alle andre bogforlæggere (videnskabelige, uddannelsesmæssige…) i det omfang, der er overlap i disse branchesektorer. Min tredje målgruppe er forfattere med en interesse i spillet og de mange andre, der er fascinerede af bogudgivelse.

Undertitlen angiver, at dette er en guide til AI for både forfattere og forlæggere. Delvist fordi jeg ønsker, at forlæggere også forstår, hvad forfattere gør med denne teknologi. Jeg synes, det er vigtigt. Ved deres seneste årlige møde indikerede BISG (Book Industry Study Group), som for det meste repræsenterer handelsforlæggere, at “det ser ud til at trække på en bredere pulje, herunder litterære agenter og forfattere.” Det er et velkomment træk.

Jeg ønsker, at forfattere læser denne bog, fordi den kan hjælpe dem med at forstå, hvad forlæggere gør med deres manuskripter. Selvudgivne forfattere holder altid et øje på traditionel udgivelse, delvist fordi de de facto er forlæggere selv, og derfor kan AI-teknologien, der interesserer forlæggere, også være af interesse for dem.

Men gør ingen fejl, dette er ikke en hands-on vejledning til forfattere om at bruge AI til at blive bedre og mere produktive skribenter. Der er talrige bøger om det emne (desværre, mange af dem bare svindelagtige Amazon-plagiater). Og masser af YouTube-videoer (af varierende kvalitet).

Inden for handelsbogsudgivelse er min ideelle læser ikke nødvendigvis en beslutningstager, men snarere en af de mange mennesker, der arbejder på tværs af branchen hver dag, skaber bøger og finder læsere. Jeg vil tale om alle de vigtige udgivelsesfunktioner i denne bog, fra redaktion til salg og distribution. Og om forfatternes møde med læserne.

Selvom jeg voksede op i Canada og begyndte min udgivelseskarriere der, er jeg baseret i San Francisco, USA, og derfor tænker jeg som standard på den amerikanske udgivelsesindustri. Men næsten alt i denne bog bør være lige så relevant for en forlægger i Madagaskar som for en forlægger i Manhattan. Mens forlæggere i mindre lande står over for udfordringer med skala, gør små forlæggere i Amerika også, og denne bog er tiltænkt virksomheder af alle størrelser.

Når jeg taler med små forlæggere om AI, og når jeg taler med meget store forlæggere om AI, er den store forskel, jeg bemærker, begrebet forlagsvirksomhed. De største forlæggere er ofte en del af (eller tæt på) offentlige virksomheder, og når man først er en offentlig virksomhed, bliver spørgsmål omkring omdømme og sikkerhed så meget større end for en almindelig forlægger, der ikke er ansvarlig på samme måde over for aktionærer og nyhedsmedier. Mens en redaktør hos en af de store 5 forlæggere har samme brug for AI-værktøjer som en freelance redaktør, der arbejder for mindre firmaer, er konteksten, hvori de bruger værktøjerne, ganske forskellig.

Hvor meget behøver du at vide om AI for at læse denne bog?

Jeg antager, at mit publikum har omtrent ingen viden om AIs indre, men at de er kloge læsere. Så jeg vil balancere mellem ingen viden og ikke at tale ned til læseren.

Jeg forestiller mig, at næsten alle har hørt om den nye generation af AI: en YouGov-undersøgelse fra marts 2024 antyder, at kun 7% af amerikanerne ved “intet overhovedet” om AI. Forfattere og forlag har næsten helt sikkert hørt om nogle af ophavsretsklagerne, men har sandsynligvis ikke en forståelse af problemerne. Så jeg behøver ikke at forklare, at AI står for “kunstig intelligens”. Men jeg vil ikke antage, at læserne kan definere, hvad AI er, hvad det betyder, dets potentielle indvirkning osv. Det er derfor, du er her.

Tilgængelighed, både bredt og specifikt

Mit mantra for udgivelsen af denne bog er ‘tilgængelighed.’

For de fleste mennesker betyder det blot noget i stil med ‘tilgængelighed,’ og jeg har faktisk til hensigt at gøre denne bog tilgængelig i så mange former og formater, som jeg kan forestille mig. Jeg vil udvide beholderen. Jeg forsøger at gøre min bog til en eksemplarisk udgivelse, der fremhæver hele spektret af, hvad der kan opnås i dag, når man udgiver en enkelt bog.

På Leanpub finder du bogen tilgængelig som en PDF-fil, en EPUB-fil og som en gratis webbaseret udgivelse. Du finder oversættelser til 31 sprog, herunder de vigtigste asiatiske og europæiske sprog. Der vil være flere lydbøger på større sprog.

Jeg vil også gøre bogen tilgængelig, i trykt og digitalt format, på alle de e-handelsplatforme, der kan tilgås via Ingram og Amazon. Det inkluderer de fleste bog online detailwebsteder, i store dele af verden. På denne måde vil biblioteker også kunne købe bogen, selvom de forståeligt nok har begrænset plads til selvudgivne værker. (Jeg vil donere trykte og digitale kopier til ethvert bibliotek i verden, der anmoder om dem.)

Udover den gratis webversion af hele bogen, vil jeg skabe gratis uddrag, en Q&A og infografikker, for dem der bare vil smage eller prøve. De vil være tilgængelige via min blog.

Det giver ikke mening at optage en video af hele bogen, når lydbøger er tilgængelige. Men nogle mennesker foretrækker at tilgå indhold via video. Så jeg vil tilbyde forkortede videoversioner i flere længder.

Og hvad med den menneskelige kontakt? Jeg vil også være tilgængelig via webinarer eller en-til-en online konsultationer via min hjemmeside og blog. Jeg kan endda hyres til at møde op personligt!

‘Tilgængelighed’ betyder meget mere end dens ordbogsdefinition. Som folkene hos Canadian National Network for Equitable Library Service (NNELS) siger, “En tilgængelig bog er en, der kan bruges og forstås af alle.” Og så opfylder min engelske EPUB-fil W3C 1.1 anbefalingen for print-handicappede, inklusive robuste alt-tekst beskrivelser af billeder. Vi forventer at opfylde denne tilgængelighedsstandard for fremmedsprogsoversættelserne også.

Alt-teksten blev skabt med ChatGPT. Jeg redigerede ikke ChatGPT’s version, så alle, der læser EPUB, kan se, hvor god den er, og hvor den stadig mangler. Som min kollega, Bill Kasdorf, minder mig om, beskriver god alt-tekst, hvad en seende læser får ud af et billede, ikke bare hvad det ser ud til at være.

For bogudgivere er tilgængelighed ikke længere en mulighed: det er en standardindstilling.

(Jeg har to mea culpas at dele: På grund af begrænsninger inden for udgivelsesplatformene vil standard PDF-filen desværre ikke opfylde PDF/UA-specifikationen, og jeg vil heller ikke kunne tilbyde en stortrykversion af bogen på e-handelswebsteder. Men begge dele er tilgængelige efter anmodning.)

Noget husarbejde

Som nævnt er denne bog (relativt) kort. Når du kalder et kort dokument ‘en bog,’ risikerer du, at købere protesterer, “Jeg troede, jeg købte en bog, men den er kun 50 sider lang!” Jeg har gjort alt, hvad jeg kan, for at gøre det klart på salgssiden, at dette ikke er en fuldlængde bog, men hvis du er skuffet, så husk, at Leanpub tilbyder en 60-dages pengene-tilbage-garanti, og jeg udvider gerne den refusionspolitik til ‘for altid.’ Jeg ønsker, at læserne skal være glade, ikke skuffede. (Hvis du købte bogen på en anden platform, så send mig en e-mail: Jeg sender en check!)

Bogen er stærkt hyperlinked (disse vises på forskellige måder i forskellige formater, men ofte som fodnoter). Jeg har altid troet på at linke til originale kilder i mit arbejde, så læserne kan verificere mine sommetider store påstande. Men jeg er bevidst om, at hyperlinks og fodnoter kan være distraherende, især hvis du bruger en e-læseenhed. Jeg undskylder for det. Det bedste er at ignorere linksene, mens du læser, og vende tilbage til dem, hvis du vil dykke dybere ned i et emne.

Jeg ved ikke, i hvilket format du læser (eller lytter til) lige nu. Eller på hvilket sprog. Jeg har forsøgt at gøre bogens “ergonomi” så brugervenlig som muligt, men links og fodnoter er ikke altid optimale fra det perspektiv.

Denne bog har sponsorer, noget som jeg ved er usædvanligt for ‘en bog’. Jeg forklarer, hvordan sponsoreringen fungerer i min ‘afsløringer’ sektion i slutningen af teksten.

Hvorfor AI nu?

An icon of a key

Når jeg taler med forlag, hører jeg om presserende, øjeblikkelige bekymringer. Og AI er normalt ikke en af dem.

De stigende omkostninger ved trykproduktion har været irriterende i flere år, selvom det nu ser ud til at stabilisere sig. Øgede distributionsomkostninger er udfordrende for alle aktører. Disse fører til prispres - der er bevis for, at læserne begynder at gnide sig mod de nuværende priser for nye hardcovers og trade paperbacks. Jeg klassificerer disse som ‘analoge’ problemer - digitale teknologier bringer lidt til bordet for at løse dem.

Derefter er der de bredere ‘eksistentielle’ problemer, der er af stadig stigende bekymring, men de er uklare problemer uden åbenlyse løsninger. Herunder er:

  • Indholdsopdagelse og publikumsengagement via online og sociale medier.

  • Ændring af forbrugeradfærd og læsevaner.

  • Konkurrence fra andre digitale medier.

Jeg tror, at AI kunne være enormt hjælpsom for forlagene på disse områder, men metoderne er ikke åbenlyse og vil tage tid at implementere. Jeg vil beskrive dette i senere kapitler af bogen.

AI: Kom i gang

Før jeg går ind i den kedelige tekniske baggrund, inviterer jeg dig bare til at hoppe direkte ind i online software. De bedste værktøjer er gratis at lege med. Der er ChatGPT. Og Claude.ai. Du kan dally med Microsoft Copilot. Eller prøve Googles Gemini.

Det er sådan, de fleste starter med AI - jeg vedder på, at du allerede har prøvet en eller flere af disse legetøj. Jeg vedder også på, at du ikke har prøvet dem i særlig lang tid. De fleste, jeg taler med, bruger kun et par minutter. De prøver et par spørgsmål, får nogle ret åbenlyse svar og går videre.

Forkert tilgang.

Jeg er enig med Ethan Mollick, hvis arbejde jeg vil beskrive flere gange i denne bog. I hans blog og i et nyligt interview taler Mollick om sin ‘10 timers regel’:

“Jeg vil indikere, at 10 timer er lige så vilkårlige som 10.000 skridt. Der er ingen videnskabelig basis for det. Dette er en observation. Men det flytter dig også forbi det, jeg rodede med dette en aften, og det bringer dig mod at bruge dette på en seriøs måde. Jeg ved ikke, om 10 timer er den rigtige grænse, men det synes at være noget transformativt. Nøglen er at bruge det i et område, hvor du har ekspertise, så du kan forstå, hvad det er godt eller dårligt til, kan lære formen af dets kapaciteter.”

En anden kommentator, der anmeldte Mollicks seneste bog om AI, påpegede en lige så sand ‘regel om ti’: “En times eksperimentering med disse værktøjer er værd ti timer at læse om dem.”

Du forstår pointen. Dette handler om at gøre, ikke fundere. Min bog er en fundering. Du skal have hænderne beskidte.

AI: En meget kort historie

An icon of a key

Indtil et par år siden hørte den gennemsnitlige person kun om AI som en abstraktion, enten som science fiction eller som noget, der kunne slå en stormester i skak eller Go. Pludselig er AI overalt, hvilket skaber det falske indtryk, at det er nyt. Selv det nye er ikke præcis nyt. Men det er et irrelevant punkt. AI betød lidt for bogudgivelse før ChatGPT. Nu betyder det meget.

At forstå den cirka 70-årige udvikling af AI kan være fascinerende, men det er på ingen måde nødvendigt for at sætte pris på, hvad der foregår i dag.

Our World In Data gør et godt stykke arbejde med kort at registrere historien—jeg overlader det til dem.

Den nuværende generation af AI blev udviklet hovedsageligt over det sidste årti. Så dukkede ChatGPT pludselig op den 30. november 2022. To måneder senere havde det 100 millioner månedlige brugere, den hurtigste teknologi, der nogensinde er kommet ind i forbrugerområdet (til sammenligning tog det over to år for Facebook at nå 100 millioner brugere).

Hvorfor den hurtige adoption? For det første er det fascinerende og sjovt. For det andet er det gratis. For det tredje, du behøver ikke købe en ny enhed for at bruge det. Og for det fjerde, du behøver ikke nogen træning for at få adgang til ChatGPT (eller dets Chat AI konkurrenter). Men de samme faktorer gjaldt også for Facebook, så hvorfor ChatGPT?

Som Arthur C. Clarke berømt bemærkede, “Enhver tilstrækkeligt avanceret teknologi er uadskillelig fra magi.” Chat AI er magi. Oplevelsen af at ‘tale’ i dagligdags sprog til en maskine… det er magisk. Oplevelsen af at sige “Jeg vil have et billede af en bog i en ballon i en sky nær solen,” og, sekunder senere,

En åben bog med en varmluftsballon, der kommer ud af dens sider, svævende blandt skyerne.

… også magisk. GPT-genererede billeder begynder at ligne hinanden i stil, farverige og fantasifulde. Så jeg sendte en anden prompt “nu i en stil, der ligner en illustration fra det 15. århundrede.” Og således:

En kunstnerisk illustration af en varmluftsballon med indviklede mønstre, svævende blandt skyer med en sol i baggrunden.

Hvis jeg vil have en video af en bog i en ballon i en sky nær solen, er der over et dusin værktøjer at vælge imellem, og vupti. Og et musikalsk soundtrack til at gå sammen med videoen. Nå, hvordan lyder det? Det er ligesom magi.

Af frygt for at virke nedladende over for AI’s ekstraordinære evner ved at henføre det til kategorien af uigennemskuelig “magi,” er det sjovt at lære, at mange af de forskere, der er ansvarlige for den nuværende generation af AI, indrømmer, at de virkelig ikke forstår præcis, hvordan det virker. Som en rapport i et nyligt nummer af MIT Technology Review bemærkede, “for al dens løbske succes, ved ingen præcis hvordan—-eller hvorfor—-det virker.” Spændende, men lidt skræmmende.

Forståelse af AI og nogle nøglebegreber

An icon of a key

AI kommer med en overflod af teknologi og terminologi, hvoraf meget er uigennemskueligt for alle undtagen dataspecialister. Brugere af Chat AI behøver ikke en dybdegående viden om AI-terminologi eller de tekniske begreber, der er involveret. Systemets samtaleprægede natur tillader intuitive interaktioner uden specialiseret baggrundsviden om, hvordan tingene fungerer. At fokusere på, hvad Chat AI faktisk kan gøre, er vigtigere.

I forberedelsen af denne bog har jeg kæmpet med, hvad der er det ‘ansvarlige’ at gøre som forfatter af en bog om AI. Den konventionelle tilgang er at give en kort forklaring af videnskaben og en gennemgang af ofte brugte termer.

Det vil jeg ikke gøre.

Jeg vil her tilbyde nogle få eksterne links til, hvad jeg synes er nogle rimeligt forståelige korte beskrivelser af AI-grundlæggende.

Hvad er fremtiden for AI?: McKinsey & Co. (april 2024) har et godt sæt forklaringer.

Ligeledes er Gartners Generativ AI (udateret) ikke dårligt.

Futurepedia tilbyder et ikke-dårligt resumé af AI Fundamentals (maj 2024)

Efter at have fjernet hvordan-til, vil jeg nu introducere nogle termer, som jeg mener er værdifulde at forstå. Ikke fordi du behøver at kende dem for at bruge softwaren. Kun fordi dette sæt af termer refererer til nogle nøgleaspekter af, hvordan den nuværende generation af AI faktisk fungerer.

Min brugssag for at tackle disse termer og begreber er forfattere og udgivere, der (i) ønsker at gå et niveau dybere med AI, af hvilken som helst årsag, eller (ii) ønsker at forstå konteksten af den nuværende kritik af AI, eller (iii) ønsker at bidrage til strategiske diskussioner om, hvordan deres kolleger eller organisationer skal tilgå AI.

Med andre ord, dette er ikke hvad du behøver at vide, men snarere hvad du måske gerne vil vide. Her er de, i ikke-alfabetisk rækkefølge:

Prompter og Prompting

Du kan åbne Chat AI-software og bare skrive et spørgsmål, meget som du gør på Google i øjeblikket.

Stor Sproglig Model (LLM)

Store Sproglige Modeller fungerer ved at analysere enorme mængder af (for det meste) skriftligt materiale, hvilket giver dem mulighed for at forudsige, hvilke ord eller sætninger der bør komme næste i en samtale eller et stykke skrift. De ‘forstår’ ikke sprog i menneskelig forstand, men bearbejder tekst ved at bryde den ned i mindre stykker (kaldet tokens) og derefter konvertere tokens til tal. De bearbejder teksten som tal, gentager flere tal, som derefter konverteres tilbage til tekst ved output. Det er en overforenklet forklaring af, hvorfor Chat AI ikke ‘indeholder’ ophavsretligt beskyttet arbejde: det er bygget med tal, der repræsenterer en enorm abstraktion fra de underliggende tekster.

LLM’er er trænet i, hvordan sprog typisk bruges og genererer derefter svar baseret på denne forståelse. Vi har en tendens til at undervurdere, hvor forudsigeligt mest sprog er. Chat AI kan generere tekst, der er (nogle gange chokerende) lignende eksisterende litteratur, men det har ikke kapacitet til at hente specifikke uddrag eller kopier af ophavsretligt beskyttede tekster. (Jeg ved, mange af jer har hørt om New York Times retssag mod OpenAI—Times var i stand til at få ChatGPT til at gentage nogle dele af tidligere offentliggjorte artikler ordret).

Generativ AI

Det vigtigste at forstå ved dette udtryk er “generativ” delen. Generativ AI genererer ny tekst.

Generativ Forudtrænet Transformer (GPT)

Dette, det nørdede af terminologien her, beskriver en specifik type LLM udviklet af OpenAI. “Generativ” angiver dens evne til at skabe tekst, “forudtrænet” betyder, at den er blevet trænet på en stor mængde tekstdata, og “transformer” henviser til softwaren, den bruger. At vide, hvad GPT står for, er kun nyttigt, så du forstår, hvad GPT i ChatGPT repræsenterer.

ChatGPT

ChatGPT er den software, du ser; GPT er, hvad der ligger bag softwaren. Brugere oplever ChatGPT, ikke GPT’en bag det. Som nævnt ovenfor, er ChatGPT blot en af flere online Chat AI-software systemer med lignende funktionalitet.

Et andet udtryk, du ofte vil støde på, som er ukendt for mange, er:

Korpus

Ordbogens definition af korpus er “en samling af skriftlige tekster” (selvom det faktisk ikke altid er tekst). Udtrykket bruges i forhold til, hvad GPT’er er trænet på: enorme korpusser af (for det meste) tekst. Vi får at vide, at de største korpusser indeholder hundreder af milliarder af ord. For almindelige dødelige er det umuligt at forstå. Tænker du ikke på Wikipedia som enorm, indeholdende et stort antal ord? Nå, der er kun 4,5 milliarder ord i Wikipedia—GPT-4 blev trænet på langt over en billion.

Jeg synes, det er vigtigt at overveje denne skala. Forfattere er forståeligt nok bekymrede over, at de 75.000 ord, plus eller minus, i deres bog muligvis er blevet suget ind i en stor sproglig model. Måske er de (mere nedenfor). Men hvis dette er tilfældet, så overvej, hvor lidt værdi en enkelt bog har for den samlede styrke af nutidens store sproglige modeller. Det er virkelig ubetydeligt. Udover ubetydeligt. Selv 10.000 bøger er småpenge.

AI-software: Systemets Tungvægtere

An icon of a key

Jeg nævnte ovenfor de fire Chat AI-tungvægtere: ChatGPT, Claude.ai, Microsoft Copilot og Google Gemini.

De fungerer hver især mere eller mindre ens og leverer lignende resultater. Så hvilken er bedst? Det spørgsmål fører dig ned i et kaninhul. Det er lidt som at spørge, hvilken by der tilbyder den bedste strandferie, eller hvilken SUV der er bedst for familier. Der er en enorm mængde nuance i problematikkerne og en enorm mængde stolthed og fordomme, der filtrerer vores svar.

Sådan er det også med denne tilsyneladende enkle, men enormt komplekse software. Folk argumenterer for, at Claude har mere nuancerede færdigheder med sprog, og at ChatGPT er bedre med softwarekode. Microsoft Copilot integrerer med Microsofts softwaresuite. Google Gemini kan tilsluttes Gmail, Google Maps og YouTube. Nogle af forskellene er betydelige; mange er små. Og de ændrer sig konstant med hver ny softwareudgivelse.

An icon of a key

‘Den bedste’ software vil ikke blive afgjort i nogen tid endnu. Hvis du eksperimenterer med nok af de tilgængelige værktøjer, vil du finde nogle favoritter.

Der er to øverste niveauer af AI-software. Det første er, hvad der kunne kaldes den grundlæggende software, software som ChatGPT og dets konkurrenter (Chat AI). Det er sådan, de fleste mennesker oplever AI i dag.

Det næste niveau er al den anden software, der giver, hvad der essentielt set er et vindue ind i den grundlæggende software. Nybegyndere inden for AI-chat har for det meste ikke stødt på denne software, selvom den ikke er sjælden eller ukendt. Nogle kender Jasper (marketing software) eller Perplexity (søgning). Denne software ville simpelthen ikke eksistere uden ChatGPT og dens fæller.

Husk, at mainstream software fra Adobe, Microsoft, Grammarly, Zoom m.fl. nu inkorporerer AI-værktøjer, men dette er anderledes end software, der er bygget fra bunden baseret på chatbot-grænseflader. (Andre som Otter (transskriptioner) er ældre end ChatGPT, men er nu præget af teknologi fra store sprogmodeller.)

Nedenfor vil vi se på software specifikt til udgivelse, der udnytter generativ AI’s evner.

Software Paradigmer

For længe siden var software kode, og kun ingeniører forstod, hvordan det virkede. Det, der gjorde personlige computere succesfulde, udover deres relativt lave omkostninger, var software, der var (relativt) let at bruge. Vi tænker ikke meget over alt dette; det omgiver os bare.

Men overvej, for et øjeblik, Microsoft Word, et program, som jeg trygt kan antage, at 99% af læserne af denne bog bruger. Det tager omkring 10 minutter at vise nogen, hvordan man skriver et afsnit tekst i Word. Derefter kan du vise dem, hvordan man laver fed skrift og kursiv, og hvordan man ændrer basisfonten, måske fra Calibri til Arial eller Times Roman. Så, hvordan man gemmer filen og udskriver filen. Hvordan man søger og erstatter.

Og så lader du dem være på egen hånd.

År senere finder du ud af, at de stadig formaterer deres Word-afsnit med mellemrum og tabulatorer. Og stadig glemmer at gemme deres filer eller bliver forvirrede over, hvilken version de gemte, nogle gange er nødt til at genskabe tekst fra bunden. Men de “ved, hvordan man bruger Word.”

Word har hundredvis af funktioner, men en tredjedel af tiden bruger brugerne kun 5 kommandoer: Indsæt, Gem, Kopiér, Fortryd og Fed. Det tager flere ugers træning at lære Words avancerede funktioner korrekt; funktioner, der kunne hjælpe en udgiver med at spare mange hundrede timers tid. Men de fleste gør det aldrig. Jeg har brugt Word siden 1985, næsten fyrre år, og jeg har aldrig taget et kursus. Jeg ved ikke engang, hvad jeg ikke ved om, hvordan man udnytter den fulde kraft fra softwaren.

Jeg går så meget op i dette, fordi det er en nyttig måde at få hovedet omkring, hvorfor AI-software er så meget anderledes end noget software, du nogensinde har arbejdet med. Det kommer ikke med en manual, ikke engang en Quick Start-guide. Det kommer med en tom skærm og et spørgsmål: “Hvordan kan jeg hjælpe dig.”

En velkomstbesked på en samtale-AI-grænseflade adresseret til Thaddeus, der spørger, hvordan den kan hjælpe.

Der er ingen menulinje, ingen knap at trykke på, ingen tastaturgenveje. Du stiller et spørgsmål, starter en samtale, og du får nogle svar.

En samtale-AI-grænseflade med en brugerinput, der spørger, hvordan man forklarer forskellen mellem nye generationers samtale-AI og traditionelle værktøjer som Microsoft Word eller Excel.

Claudes svar:

“Der er flere nøgleforskelle mellem at arbejde med moderne samtale-AI som mig selv sammenlignet med traditionelle værktøjer som Microsoft Word eller Excel:

“1. Naturlig sproginteraktion: Med samtale-AI kan du kommunikere din hensigt ved hjælp af dagligdags sprog i stedet for at skulle lære og navigere i komplekse menuer og funktioner. Du forklarer simpelthen, hvad du vil opnå, på en samtaleagtig måde.

“2. Kontekstuel forståelse: AI-assistenter opretholder konteksten og forstår samtalens flow, hvilket tillader mere naturlig frem-og-tilbage dialog. Traditionel software har ingen kontekstuel bevidsthed fra den ene kommando til den næste.

“3. Tilpasningsevne: AI kan dynamisk tilpasse sig og reagere på en lang række forespørgsler, mens traditionelle værktøjer er begrænset til et foruddefineret sæt funktioner. En AI-assistent kan hjælpe med skrivning, analyse, matematik, kodning, ideation og mere inden for en enkelt grænseflade.”

Det var nyttigt, men jeg ønskede noget nemmere at forstå. Så jeg spurgte:

En brugerforespørgsel på en samtale-AI-grænseflade, der beder om en simpel forklaring til et ikke-teknisk publikum.

Claude:

“Her er en simpel måde at forklare forskellen til nogen uden en teknisk baggrund:

“Tænk på traditionel software som Microsoft Word eller Excel som et værktøj, som en hammer eller en lommeregner. Det har et fast sæt funktioner, som det kan udføre, og du skal lære at bruge det korrekt for at få det resultat, du ønsker.

“På den anden side, tænk på moderne konverserende AI som en smart assistent, ligesom en vidende kollega eller ven. Du kan bare tale til det på almindeligt engelsk, og det forstår, hvad du prøver at gøre. Det kan hjælpe dig med alle mulige opgaver, fra skrivning til matematik til idéudvikling.

“Du behøver ikke at lære nogen specielle kommandoer eller teknikker—bare chat med det naturligt. Det tilpasser sig dine behov og husker konteksten af din samtale. Over tid lærer det dig og dine præferencer at kende.

“Så mens traditionel software er som et statisk værktøj, du bruger, er konverserende AI mere som en intelligent partner, du interagerer naturligt med for at få tingene gjort. Det er en mere fleksibel, personlig og effektiv måde at arbejde på.”

Hmm. Ikke helt det, jeg ønskede. Så jeg fortsatte samtalen:

Et svar fra en konverserende AI, der rådgiver om at undgå teknisk jargon og referencer, som ikke-tekniske personer måske ikke forstår.

Claude:

“Sikkert, lad mig prøve igen uden at bruge tekniske termer:

“Forestil dig, at du taler med en ven, der er virkelig vidende og ivrig efter at hjælpe dig. Du kan bare tale til dem på almindeligt engelsk om, hvad du prøver at gøre, hvad enten det er at skrive en opgave, løse et matematikproblem eller idéudvikling til et projekt.

“I stedet for at skulle lære og huske en masse specifikke trin eller kommandoer, kan du bare forklare, hvad du har brug for i dine egne ord. Din ven forstår konteksten og tilpasser deres hjælp baseret på, hvad I allerede har diskuteret.

“Det er en frem-og-tilbage samtale, hvor du kan stille spørgsmål, få afklaring og få råd. Og jo mere du taler med denne ven, jo bedre forstår de dine unikke behov og kommunikationsstil.

“Nu, forestil dig, hvis du kunne have den samme type hjælpsomme, nemme interaktion, men med et computerprogram. Det er den grundlæggende idé bag nye typer software, du måske hører om.

“I stedet for den gamle stil af software, hvor du har et rigidt sæt funktioner og skal lære den rigtige måde at bruge det på, er denne nye software mere som en vidende ven. Du kan bare tale til det konverserende, og det finder ud af, hvordan det kan hjælpe dig baseret på den naturlige flow i din samtale.

“Så det er en smartere, mere personlig og nemmere måde at få hjælp til alle mulige opgaver på din computer, bare ved at tale til det, som du ville gøre til en person. Det er den nøgleforskel fra den ældre, mere rigide stil af software.”

Sammenfatning: Jeg forsøgte at gøre to ting med disse eksempler. Den ene var at tilbyde et meget simpelt eksempel på, hvorfor chatbot-software er så forskellig fra nogen software, vi nogensinde har brugt. Og den anden var at illustrere, hvordan en enkelt chat kan udvikle sig. Det er ikke bare et enkelt spørgsmål og et enkelt svar. Det er en samtale. Det er en stor del af gennembruddet.

Chat-AI’er er en slags kombination af praktikant og vidende konsulent. Du kan ikke antage, at de ved, hvad du mener. Du skal forklare, hvad du vil, hvorfor du vil have det, og hvordan de kan være mest hjælpsomme.

Tre slags AI-software

An icon of a key

Med brede penselstrøg er der tre slags AI-software tilgængelige i dag. Den første er AI-grundlæggende platforme, som ChatGPT, den kerne AI-teknologi. Den anden er, lad os kalde det, AI-tilføjelser, software, der er nybygget oven på de grundlæggende platforme. Du har sikkert ikke hørt om mange af disse, værktøjer som Jasper eller Rewind.

Min tredje kategori er software med AI-værktøjer boltet på det eksisterende produkt. For eksempel har Microsoft suite af software nye AI-værktøjer i Word, Excel og PowerPoint. Adobe har tilføjet AI-teknologi til Photoshop og Acrobat. Grammarly bliver genopbygget omkring den nye generation af LLM-baseret teknologi. Det er stort set det samme produkt, men med AI tilføjet.

Det bliver klart, at næsten al den software, du bruger i dag, snart vil inkorporere AI-funktioner. Du skal selv vurdere, om disse værktøjer er virkelig nyttige, eller om de bare er AI-dækvinduer.

Jeg er mere interesseret i de nye værktøjer, bygget fra bunden op for at levere den værdi, som kun AI kan frembringe. Det er den næste generation af software.

Arbejde med AI-software

Jeg er desværre en Windows-fyr (det er en lang historie hvorfor), og derfor taler jeg om mine oplevelser med adgang til AI-software via en Windows-computer, ikke en Mac. Fordi al softwaren her er browserbaseret, burde der ikke være nogen forskel ved at bruge disse værktøjer på en Mac. Men jeg giver ingen garantier.

Du vil have brug for nogle penge for at spille AI-spillet, men ikke en helvedes masse. Som beskrevet ovenfor, kan meget af den grundlæggende software tilgås via gratis versioner. Men du vil normalt have et betalt abonnement, mens du tester det, og abonnementet bør være omkring $20/måned. Annuller efter du har prøvet det (glem det ikke!). Hvis du ser noget, der er $79/måned eller, gud forbyde, $159/måned, kan du ignorere det. De tænker ikke på dig som en potentiel bruger; de tænker på store mainstream virksomhedskunder.

Træning til Chat AI

An icon of a key

Dagens AI er bedragerisk enkel. Enhver, der kan skrive et spørgsmål, kan bruge det. Men at bruge det godt er kompliceret, hvilket ikke giver nogen åbenbar mening, før du dykker ned i kompleksiteterne omkring “prompt” og relaterede begreber.

For at få adgang til dens intelligens skal du nogle gange tale til den, som om den var en idiot. Eller måske en idiot savant. Det er lidt som karakteren spillet af Dustin Hoffman i Rain Man.

Enhver kan bruge ChatGPT. Gå blot til chat.openai.com, og du kan få adgang til den nyeste version, GPT-4, gratis (der er nogle premium-funktioner tilgængelige for ekstra $20/måned).

Når du går til ChatGPT, finder du i bund og grund en tom skærm og det implicitte spørgsmål “Hvordan kan jeg hjælpe dig i dag?”

Du kan stille den spørgsmål. Endnu bedre, du kan uploade en stor PDF og stille spørgsmål om filen. Du kan også uploade billeder, som den kan beskrive, eller en scannet side: den kan genkende teksten, selvom den er håndskrevet.

Det, der er dukket op som et afgrænsningsproblem for den vellykkede brug af Chat AI, er at lære at ‘tale’ med det (hvilket du bogstaveligt talt kan gøre i den nyeste mobilappversion). På Chat AI-sprog kaldes det at skabe “prompt” eller “at give prompts.” Brugere har opdaget, at jo mere præcise og detaljerede deres prompt er, jo bedre svar får de fra ChatGPT. Desuden er prompt ikke bare en engangsforeteelse. Chat AI kan fortsætte en samtale i et stykke tid (dog ikke uendeligt), og hvis du ikke får det svar, du leder efter, kan du revidere og forfine dine prompt. Dette kræver meget tilvænning og har udløst en række vejledninger, skriftlige og online, til at træne brugere i, hvordan de får mest muligt ud af prompt.

Prøv at bede nogen af Chat AI-software om at forklare et begreb som udviklingsredigering. Bed den derefter om at udforme en forklaring, som en 12-årig kan forstå. Resultaterne er dramatisk forskellige. Morsomt nok ser det ud til, at Chat AI også reagerer på følelsesmæssige appeller. Tilføjelse af “dette er meget vigtigt for min karriere” til en prompt kan fremkalde mere nyttige svar.

(Dette er så godt et tidspunkt som nogen til at tilføje en parentes: Det er både beroligende og dybt foruroligende, at de bedste forskere, der arbejder med sprogbaseret AI, ikke er i stand til at forklare, hvorfor ting som dette sker.)

Hvordan man giver prompts

An icon of a key

“At give prompts” er en specifik færdighed, der er essentiel for effektiv brug af Chat AI.

Af den forskellige adopterede terminologi, der er blevet grebet under AI-guldfeberen, er “prompt” og “at give prompts” så gode som det bliver. Du “taler” ikke rigtig til en Chat AI. Du “stiller” den ikke spørgsmål (eller, det bør du ikke—det er ikke sådan, det fungerer). Du giver disse motorer prompts til svar, ikke til enkle svar.

Først tænkte jeg, at en analogi kunne være teaterprompt. Prompteren stikker en skuespiller, der mister tråden i en replik, hvilket får dem til at springe tilbage i handlingen. Men dette er ikke nøjagtigt, fordi en AI-prompt ikke løsner en bid af memoreret tekst—det er ikke sådan, generativ AI fungerer. Giv en AI-motor en enkelt prompt gentagne gange, og svarene vil altid være mindst lidt forskellige.

Lige nu bad jeg ChatGPT om at “liste de vigtigste elementer i effektiv prompting.” Jeg spurgte en anden gang, og svarene var tematisk konsistente, men ganske forskellige i detaljerne. Fremhævede emner inkluderede:

  • Vær specifik

  • Undgå tvetydighed

  • Giv baggrundsinformation

  • Brug klare instruktioner

På en måde er det ret underligt: AI har et godt greb om sprog—burde det ikke have en fornemmelse af, hvad du mener uden pedantisk prompting? Men det er netop den beherskelse af sprog, der gør prompting mest kraftfuldt. Fortæl det præcis, hvad du mener, ikke omtrent.

Tal til det som den hjælpsomme assistent, den lærde rådgiver, du ønsker, det skal være, ikke som en fyr fra gaden.

Konklusionen her er, at i det mindste for tiden kræver effektiv brug af LLM-baserede AI-værktøjer i det mindste kendskab til bedste praksis for prompting. En mesterskab i prompting vil blive passende belønnet.

Hallucinationer: En flue i salven

An icon of a key

AI, baseret på store sprogmodeller, finder på ting. Det gør det bare. Dette kaldes generelt “hallucinationer.” Det er et reelt problem, et alvorligt problem. Du er nødt til at forstå hallucinationer, hvis du skal arbejde med AI.

Cambridge Dictionary’s Word of the Year for 2023 var “Hallucinate,” hvis definition er blevet udvidet til at omfatte “Når en kunstig intelligens… hallucinerer, producerer den falsk information.” (Andre tilføjelser til 2023-ordbogen inkluderer “prompt engineering,” “large language model,” og “GenAI.”)

AI-hallucinationer, bemærker Cambridge, “fremstår nogle gange som nonsens. Men de kan også virke helt plausible–selvom de er faktuelt unøjagtige eller ultimativt ulogiske.” Dette er desværre ganske sandt, og pr. juli 2024 forbliver det en dramatisk begrænsning for brugen af generativ AI til missionkritiske opgaver. Det er en af de flere store ejendommeligheder ved AI, og det tager folk et stykke tid at forstå det. Husk, generativ AI er for det meste en næste ord forudsigelsesmaskine, ikke en faktadatabase. Deraf behovet for HITLs, Mennesker-i-Loop, som vi nu er kendt, der dobbelt-tjekker AI-output. Og igen, det er bemærkelsesværdigt, at vi kan få sådan en ekstraordinær værdi fra en teknologi, der kan producere beviseligt unøjagtige output. Sådan er det.

Gary Marcus, en erfaren og velinformeret AI-kritiker, sammenligner AI-hallucinationer med ødelagte ure, som er rigtige to gange om dagen. “Det er rigtigt noget af tiden,” siger han, “men du ved ikke hvilken del af tiden, og det mindsker meget dens værdi.”

Ethan Mollick, hovedtaler ved Publishers Weekly konferencen i september 2023, bemærker, at folk, der bruger AI, forventer 100% nøjagtighed. Hallucinationer, siger han, er ligesom “menneskelige fejlrater,” som vi tolererer dagligt.

Andrej Karpathy, en kendt forsker, der specialiserer sig i AI, og som i øjeblikket arbejder hos OpenAI, skriver om hallucinationer:

“Jeg kæmper altid lidt, når jeg bliver spurgt om ‘hallucinationsproblemet’ i LLMs. For i en vis forstand er hallucination alt, hvad LLMs gør. De er drømmemaskiner.

“Vi styrer deres drømme med prompts. Prompts starter drømmen, og baseret på LLM’s tågede erindring om sine træningsdokumenter, går resultatet for det meste et nyttigt sted hen.

“Det er kun, når drømmene går ind i det, der betragtes som faktuelt ukorrekt område, at vi mærker det som en ‘hallucination.’ Det ser ud som en fejl, men det er bare LLM, der gør, hvad den altid gør.”

Det er ikke kun problemet med at finde på ting. Chat AI er dybt fejlbehæftet software.

For mange forespørgsler, især fra begyndere, er svarene trivielle, off-target eller simpelthen ubrugelige. Chat AI har problemer med at tælle: Bed den om et blogindlæg på 500 ord, og du vil være heldig at få 150.

Og hver af AI-virksomhederne, for at reducere bias og undgå at besvare “hvordan-man-bygger-en-bombe” forespørgsler, har opstillet stramme svarbeskyttelser omkring deres produkter: alt for ofte er svaret på et spørgsmål i det væsentlige, “Nej, jeg vil ikke svare på det.” Jeg bad Google Gemini om at gennemgå et udkast til denne tekst og blev advaret om, at “det er essentielt at få forfatterens godkendelse før udgivelse.”

Faktatjek

An icon of a key

Jeg argumenterer, for det meste for døve ører, at hallucinationer er et teknologiproblem, som vil finde en teknologiløsning. Ja, de er endemiske for LLMs, men de kan omgås.

Overvej dette: Jeg bad fire Chat AI’er om at faktatjekke følgende udsagn:

  • Pr. 2024 er der 6 store multinationale forlag baseret i New York City. De er kendt som de Store 6.

  • E-bøger fortsætter med at dominere bogsalget i USA.

  • Borders og Barnes & Noble er de to største boghandlerkæder i USA.

  • Efter et fald i salget under Covid, vokser bogsalget i USA igen med tocifrede vækstrater.

Alle af dem opdagede fejlene i de første tre udsagn. Hver af dem blev lidt forvirret over det fjerde, usikre på omfanget af Covid-salgsstigningen og efterfølgende salgsmønstre. Det er et lille, ikke-repræsentativt eksperiment, men disse Chat AI’er, som ikke er beregnet til at være faktabaserede, kan gøre et troværdigt arbejde med at vurdere fakta, de fleste almindelige observatører ville overse.

Hvad med billeder og video?

An icon of a key

Fordi fagbogsudgivelse afhænger mere af tekst end af billeder, har forlag en tendens til at overse de banebrydende AI-baserede værktøjer til billeder og video.

De er relevante for enhver forståelse af AI-revolutionen. Men diskussionen er for stor til den tilgængelige plads: Jeg ville simpelthen ikke kunne gøre det retfærdighed.

Anbefalet til forfattere og forlag: leg med billedgenereringsfunktionerne i ChatGPT—de er gratis og sjove at bruge. Lav derefter en søgning under “video og AI” og forbløffes over nogle af de eksempler, du finder på de linkede sider. Selvom værktøjet endnu ikke er offentligt tilgængeligt, giver OpenAI’s Sora nogle fantastiske eksempler på videoer genereret blot fra tekstprompts.

Software til bogudgivere

Der er lidt AI-software bygget fra bunden specifikt til bogudgivere (selvom der er meget tilgængeligt for forfattere).

Videnskabelige udgivere har flere muligheder med en række AI-værktøjer til forskning, skrivning og udgivelse.

For handelsudgivere relaterer de fleste muligheder til AI og lyd. Udenfor lyd samler valgmulighederne sig om redigerings- og markedsføringsværktøjer. Der er også flere AI indhold-detektionsværktøjer og indholdstilladelsesværktøjer og tjenester.

Redigeringssoftwaren er rettet mod forfattere, ikke professionelle redaktører - der er mange flere forfattere end redaktører, og den kvalitet, som professionelle redaktører kræver, er langt mere byrdefuld end for (hovedsageligt selvudgivne) forfattere.

Markedsføringsværktøjerne sigter ligeledes bredere end blot bogudgivere, men til markedsførere overalt, med værktøjer til webindhold, tekstgenerering og SEO. Jasper.ai er en leder i denne kategori og hævder at have HarperCollins som kunde.

Shimmr, en sponsor af denne bog, er et AI-drevet annonceringsværktøj specifikt til bogudgivere. Virksomheden og dens grundlægger, Nadim Sadek, blev profileret i en artikel i Publishers Weekly fra maj 2024.

“Hvad vi gør, er at bruge AI til at overveje den psykologiske profil af en bog og matche den til sindsstemningen hos et specifikt publikum, hvilket sikrer en mere effektiv forbindelse mellem læsere og bøger,” fortalte Sadek til PW. “Vi kalder det ‘Book DNA,’ og det indebærer ikke kun at kende karaktererne og plottet i en bog, men også værdierne, interesserne og følelserne i bogen.”

Ved at trække på Book DNA skaber Shimmrs AI-værktøjer derefter målrettede annoncer til søge- og sociale mediekanaler (i øjeblikket Google og Meta). Annoncerne tager form af displayannoncer, der indeholder AI-genererede billeder ledsaget af slogans.

Jeg påpeger til udgivere, der evaluerer Shimmr, at det kan give inkrementel indtægt, hvilket er, hvad vi forventer, at et nyt annoncerings-/markedsføringsværktøj bringer på bordet.

Hvis du vil opleve et andet “kun med AI” softwareværktøj, så tjek Hypnovels, som animerer kapitler i fiktive bøger. “Fortælling, billede og bevægelse, alt genereret af AI, kommer sammen med stor historiefortælling på en måde, der er mindre bogstavelig end traditionel animation (deraf ‘hypno’) og mere sanseligt engagerende end en lydbog, i en stil, der gør kapitlet unikt og fængslende.”

En anden ny leverandør, der er født ud af muligheden med AI, er Veristage (også en sponsor af denne bog). Veristage tilbyder Insight, deres “AI Publishing Assistant,” en opgave-specifik front-end på tværs af flere udgivelsesfunktioner.

Insight-rejsen starter med manuskriptet. Upload af en tidlig version låser op for en række værktøjer, nogle mere værdifulde for redaktionelt arbejde, andre mere værdifulde for markedsføring. Efter at have arbejdet med en eller alle funktionerne, kan du downloade en PDF-rapport, der inkluderer redaktionelle aspekter som skrivestil, troper, klicheer og brug af adverbier og adjektiver, og derefter markedsføringsindhold som beskrivelser, metadata, unikke salgsargumenter, sammenligninger, Amazon-optimeret indhold og foreslåede sociale medieopslag.

Det, jeg bedst kan lide ved Insight, er, at det tager en holistisk tilgang til at anvende AI til udgivelsesprocessen, i stedet for at skulle samle flere softwareværktøjer, hver til en anden funktion.

Jeg vil også fremhæve min udgivelsesplatform, Leanpub, her. De har været fantastiske at arbejde med. Lille er smukt: de tager chancer med teknologi og tjenester, som større virksomheder ville undgå. Af største interesse for forfattere og mindre udgivere er deres nye TranslateWord-tjeneste, hvor du kan oversætte en bog skrevet i Microsoft Word til op til 31 sprog via GPT-4o API’en (som driver ChatGPT). Det er det, jeg bruger til at oversætte denne bog.

Jeg kiggede andre steder for at finde en tjeneste til bogoversættelse. Der er masser af oversættelsesfirmaer, nogle med AI. Den eneste, jeg kunne finde, der tilbyder bogoversættelse, er DeepL. Men det er ikke et fokus for virksomheden. Lige nu er Leanpub stedet at gå hen.

Forretningssoftware til bogudgivelse

An icon of a key

De eksisterende forretningssystemleverandører, der betjener udgivelsesindustrien, begynder at lægge AI-teknologier ind, som vi har set hos virksomhedsskala-virksomheder som Salesforce og Oracle.

Jeg har talt med flere af udgivelsessystemsoftwareleverandørerne, inklusive Firebrand, og alle ser på mulighederne, men træder varsomt.

Jeg ser frem til muligheden for at tale om AI med en forskelligartet gruppe af deltagere på Firebrand’s Publishing Innovation Forum i september 2024 i Nashville, TN.

knk har afholdt to webinarer om AI og udgivet et hvidbog, men (pr. 26. juni 2024) har de endnu ikke annonceret nogen AI-funktioner i deres produkter.

Virtusales har for nylig lanceret deres første sæt af AI-understøttede værktøjer, herunder billedtagging, generering af alt-tekst, korrekturlæsningsværktøjer, generering af salgs- og markedsføringstekster og oversættelser af disse tekster.

Jeg talte med Klopotek på deres Klopotek Publishing Radio. De har “startet et AI-initiativ inden for kundeservice,” selvom der ikke er tilgængelige detaljer.

Supadu, som tilbyder forlag “webdesign, e-handel og dataløsninger,” har nu “Supadu Smart AI,” (pdf) med “avatar-ledet titelvideoreview med Smart Buy,” “avatar-videodrevet reklamemateriale til marketing- og salgsteam,” og “nem flersproget oversættelse af forfatter- og titelvideoer.”

AI-software til bogudgivere: startups

Nogle mennesker er bekendt med det arbejde, jeg har udført omkring bogudgivelsesteknologi-baserede startups. Der er en rapport i Publishers Weekly, der beskriver arbejdet, og linker til databasen.

Som du vil se i rapporten, ser jeg ret bredt på startups på tværs af bogudgivelsesspektret. Jeg inkluderer ikke nye bogudgivelsesfirmaer, medmindre de gør noget usædvanligt med teknologi. De grundlæggende kriterier er: bruger du teknologi til at forsøge at vitalisere en eller anden aspekt af bogudgivelsesprocessen? Jeg har over 1.600 virksomheder i databasen, de fleste lanceret efter Amazon udgav den første Kindle i 2007.

Når du får en generel fornemmelse af databasen, kan du begynde at dykke dybere ned. På fanen længst til højre ser du en måde at sortere kun efter de AI-relaterede bogudgivelses-startups.

Et skærmbillede af en tabel, der viser værktøjer og tjenester med et filter for AI valgt, fremhæver en tælling på 243.

Som du kan se i illustrationen, er der over 240 AI-relaterede bogudgivelses-startups (pr. begyndelsen af juli 2024). Vi tæller de lydbogsudgivelses-startups, der anvender AI som en separat kategori, og det samlede antal af de to er over 300 virksomheder. Flertallet, over 280, blev lanceret efter ChatGPT først dukkede op i november 2022. Denne mængde af nye forretningsstartups er uden fortilfælde inden for bogudgivelse. Det er forbløffende.

Som det er karakteristisk for hele databasen, retter disse AI-startups sig mest mod forfattere (70%). Nogle 13% søger, per se, at betjene forlag. 10% er børnebogsudgivelses-fokuserede.

Omkring 50 af startupsene retter sig mod læsere med en række opfindsomme tilbud. Flere er fortællingsplatforme. Der er en del summeringsværktøjer. Der er flere opdagelsessider, “Brug AI til at finde din nye yndlingsbog.” Hurtigt forbedrende AI-genererede stemmer har ført til et udvalg af “læs det for mig” værktøjer.

Og nogle interessante ideer, der ikke ville være mulige uden AI.

Bookshelf: Reading Tracker er en kombination af bogopdagelse og personlig bibliotek-app, der inkluderer “automatisk tidssporing, læsemål og påmindelser og indsigtsfulde statistikker og tendenser.” Dens AI-bibliotekar “kan generere resuméer og flashkort, diskutere nøgleideer og takeaway-punkter og meget mere.”

Min ven Ron Martinez lancerede for nylig et site kaldet Inventionarts.ai, som introducerer “et nyt samtalemedium.” Som sitet forklarer, “Tal med flere AI-personligheder, hver med deres egen identitet, ekspertise og bevidsthed. Inviter forskellige personaer til at slutte sig til dig i scenarier. Og du kan også spille en fiktiv rolle!” En litterær leg, på en måde.

Som det er karakteristisk for den større startup-kohorte, er mange af disse startups små til mikroskopiske, kun en person med et websted og en halvfærdig idé. Jeg inkluderer dem alle - hvem ved, hvor de er på vej hen.

Jeg opfordrer dig stærkt til at lege med databasen. Klik på nogle få links. Jeg tror, du vil blive begejstret over innovationen og vovemodet hos mange af disse organisationer.

En af sponsorerne af denne bog, Book Advisors, specialiserer sig i fusioner og opkøb i forlagsbranchen. Jeg anbefaler altid innovative startups at finde partnere, og Book Advisors er der, jeg sender dem hen for at gennemgå processen. Bogudgivelse har flere respekterede M&A-virksomheder at henvende sig til, herunder The Fisher Company og Oaklins DeSilva+Phillips. Book Advisors er den eneste virksomhed, jeg kender, der også arbejder med teknologistartups.

AI og Bogudgivelse: Hvad Gør Branchen i Øjeblikket?

An icon of a key

De AI-relaterede aktiviteter i mange af de fremtrædende faglige forlagsgrupper synes at lægge deres stemmer til koret af copyright-bekymrede. The Association of American Publishers “indgav svarbemærkninger i den amerikanske copyright-kontors undersøgelse af krydspunktet mellem copyright-lovgivning og kunstig intelligens (AI)...”

Den britiske forlæggerforening bemærker, at “det er af største vigtighed, at regeringen hurtigst muligt indfører konkrete løsninger for at beskytte den menneskelige kreativitet og viden, der understøtter sikker og pålidelig AI.”

På den anden side tilbyder Independent Publishers Guild (IPG), med mere end 600 medlemmer, AI-vejledning og træning til sine medlemmer, herunder sin “Praktiske Guide til AI i Forlagsbranchen,” udført af en kendt AI- og forlagsbranchenekspert, George Walkley.

Her i USA er jeg privilegeret at være en del af Book Industry Study Group’s (BISG) AI Working Group, der rapporterer til Workflow Committee. Arbejdsgruppen har skitseret flere potentielle strategiske initiativer:

  • Udvikling af Bedste Praksis og Standarder: Anbefaling af bedste praksis i forbindelse med AI-brug, knyttet til etiske retningslinjer, eksisterende reguleringer og love. Dette inkluderer gennemsigtighed i AI-genereret indhold og dets oplysning til forbrugerne.

  • Brancheundersøgelser og Definitioner: Gennemføre undersøgelser for at indsamle brede brancheindsigter om nuværende og potentielle AI-brug og etablere klare definitioner og omfang af, hvad AI betyder i sammenhæng med bogudgivelse.

  • Periodisk Rapportering og Evalueringer: Tilbyde periodiske rapporter for at hjælpe branchen med at forudse og tilpasse sig de hurtige ændringer, som AI-teknologier medfører.

Andre skrive- og forlagsforeninger forsøger at komme foran emnet. Nogle tager stilling imod AI; andre forsøger bare at hjælpe deres medlemmer med at forstå teknologien og måske eksperimentere med den.

AI og Bogudgivelse: Hvad Gør Forlagene?

For et år siden var svaret på, hvad forlagene i øjeblikket gjorde, “ikke meget.” Der er ikke sket meget siden da, men der har været en smule aktivitet. Jeg vil fokusere på forlagsforlag; videnskabelige og akademiske forlag er mere aktive. Her er noget af det, jeg har fundet ud af.

Hachette: Ifølge en rapport fra november 2023 i The Bookseller i Storbritannien har Hachette offentliggjort en holdningserklæring om AI, der skelner mellem ‘operationelle’ brug og ‘kreative’ brug. Virksomheden “gjorde det klart, at den opmuntrer til ‘ansvarlig eksperimentering’ for operationelle brug, men er imod ‘maskinel kreativitet... for at beskytte originalt kreativt indhold produceret af mennesker’.”

HarperCollins: Ifølge en rapport fra april 2023 i Publishers Weekly af Andrew Albanese og Ed Nawotka sagde HarperCollins CEO Brian Murray:

“Vi ved, at det bliver vigtigt, og det kommer til at have en stor indvirkning på vores branche over de næste tre til fem år. Og så tror jeg, at mange af os forsøger at finde ud af, hvordan og at sikre, at vi anvender det på en etisk, moralsk måde, der hjælper os med at tjene forfattere og levere professionelle tjenester til forfattere og ikke konkurrerer med forfattere og historiefortælling.

“Og det er, tror jeg, en udfordring. Måske ikke så meget for alle de forlag, der er her, men jeg garanterer, at der er mange små teknologiteams rundt om i verden, der måske kommer efter vores forretning. De er ikke forlag, de er ikke redaktører. De er teknologerne, og de ser en mulighed.”

Penguin Random House (PRH): Bertelsmann, moderselskabet til PRH, tilbyder et white paper kaldet State of Play: Exploring Generative AI’s Transformative Effects on the Media & Entertainment Industry, som inkluderer en sektion om bogudgivelse.

Ifølge en rapport i Publishers Lunch, har virksomheden “introduceret sin egen interne AI-applikation, kaldet PRH ChatGPT.”

Artiklen siger, at PRH’s interne dokumenter forklarer, at programmet “‘kan bruges til at strømline processer, forbedre kreativitet og give datainsigter’ på tværs af afdelinger. Virksomheden foreslår, at blandt anvendelserne af app’en er at opsummere bøger og dokumenter; revidere e-mails; udforme blogindlæg eller jobbeskrivelser; analysere tekstbaserede data, og “generere ideer til indhold.’”

Simon & Schuster: Virksomhedens administrerende direktør Jonathan Karp fik en omtale i New York Times “Most Memorable Literary Moments of the Last 25 Years” med et citat rapporteret i Publishers Weekly fra deres U.S. Book Show i maj 2024. Han sagde, at AI ikke var “elefanten i rummet” men snarere, “mere som cikaden i verden. Du ved, masser af summen og masser af parring.”

Han anerkendte, at AI “definitivt er et værdifuldt værktøj. Det vil helt sikkert gøre os mere effektive. Det vil hjælpe os med at behandle og indsamle information bedre, og forhåbentlig tillade arbejdstagere at udføre et højere niveau af arbejde, der er mere interessant og kreativt.”

I marts, på London Book Fair, som rapporteret i The Bookseller, sagde Karp, at virksomheden også ville kigge på fremmedsprogede versioner af AI-genererede lydbøger “i områder, hvor [denne forfatters] værker ellers aldrig ville have en chance på grund af omkostningerne ved [lydproduktion].”

AI og bogudgivelse: Anvendelsestilfælde

An icon of a key

De specifikke anvendelsestilfælde for AI og bogudgivelse, på tværs af forskellige funktioner, er nemme at beskrive konceptuelt. Men der er ikke meget information tilgængelig om, hvad udgivere faktisk gør.

Keith Riegert, administrerende direktør for Ulysses Press og Perfect Bound, præsenterede på Publishers Weekly U.S. Book Show i maj 2024, og bød på den mest omfattende oversigt, jeg har set om AI-anvendelsestilfælde inden for forlagsvirksomheder. Perfect Bound er sponsor af denne rapport; jeg står ved denne udtalelse. Han tilbyder “20 praktiske måder, du som forlagsprofessionel kan begynde at bruge AI lige nu.”

Hans præsentation, Kom i gang med AI, kan ses og downloades fra Perfect Bounds hjemmeside.

Hvad sker der, når AI læser en bog?

Jeg låner denne sektionstitel fra Ethan Mollicks nyhedsbrev med vilje—der er ingen grund til at forsøge at forbedre den. Mollick er professor ved Wharton School of the University of Pennsylvania, hvor han studerer entreprenørskab og innovation. Hans nyhedsbrev, som jeg ofte anbefaler, er roligt, forfriskende og unikt indsigtsfuldt.

Blandt de ting, der kvalificerer Mollick som kommentator, er, at han ikke har nogen egeninteresser. Han behøver ikke sælge AI, ej heller nedgøre den. Han har blot forpligtet sig til at udforske AI i dens mange påvirkninger, hovedsageligt på uddannelse, kultur, skrivning og udgivelse. Og han er en fin, klar skribent.

Hvis du gennemgår Mollicks nyhedsbrevsarkiver, vil du se, at han ikke begyndte at fokusere på AI før december 2022. Det var ikke hans område—som de fleste af os, dukkede AI op i hans daglige arbejde, og han kunne ikke tage øjnene fra det.

I dette indlæg falder hans indsigt tættest på vores interesse som udgivelsesprofessionelle. “Måske AI,” spørger han, “ændrer måden vi interagerer med bøger på?”

For at besvare spørgsmålet bemærker Mollick, “har vi brug for både en AI med en hukommelse stor nok til at rumme en bog, og en forfatter, der kender sin egen bog godt nok til at vurdere AI’s resultater.” Mollick tester en af sine flere titler (han specificerer ikke hvilken, men fra chats er det klart The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors, en bog der er blevet positivt anmeldt på Amazon, selvom den ikke er en aktuel bestseller).

Mollick overvejer forskellige aspekter af AI’s potentielle værdi for en forfatter, udgiver eller læser, inklusive “AI som læser og redaktør,” og “en praktisk anvendelse: hjælp til undervisere.” Han beder en LLM—stor sprogmodel—ikke ChatGPT—om at opsummere bogen. Det lykkes til Mollicks tilfredshed.

Derefter en sværere udfordring: “Giv mig eksempler på metaforer i bogen.” Metafor, påpeger han, “er udfordrende selv for menneskelige læsere, da det involverer brugen af figurativt sprog uden klare markører (i modsætning til en simile, er der ingen “som” eller “ligesom”).” Resultaterne, noterer han, “er imponerende, selvom der er mindre fejl.”

LLM’en er mindre succesfuld som redaktør: dens mangler på dette område illustrerer, bemærker Mollick, “noget, der er blevet klart om den nuværende tilstand af AI: hvis du er en meget god forfatter eller redaktør, er du bedre end nuværende AI…”

Ikke desto mindre, “AIs har, eller i det mindste har udseendet af at have, en forståelse af konteksten og betydningen af et stykke tekst.” Som et resultat mener Mollick, at “hvordan vi forholder os til bøger sandsynligvis vil ændre sig som et resultat af AI.”

Jeg tror det også.

AI og bogdesign & produktion

An icon of a key

Ekspertsystemer og procesautomatisering er stadig foran AI, når det kommer til bogdesign og produktion.

Software til automatisk satsning af bøger går tilbage til mindst 1970’erne. I midten af 1980’erne overvågede jeg et softwareprojekt kaldet PageOne, baseret på Donald Knuth’s TeX, som kunne sætte en bog på få minutter. SGML dukkede op omkring samme tid, baseret på en dokumentstandard introduceret i 1969. Det blev stort set afløst af XML, introduceret i 1996. Disse robuste markup-sprog skaber solide strukturer for automatisering.

Desktop publishing indvarslede en ny runde af automatisering for QuarkXPress og Adobe InDesign, såvel som Adobe Illustrator og Adobe Photoshop. Udgivelsesarbejdsgange kan styres med forskellige programmer og systemer.

En organisation at holde øje med er Coko Foundation. De tilbyder en suite af open source produktions- og udgivelsesstyringsværktøjer, inklusive Kotahi, en platform for videnskabelig udgivelse, og Ketty til bogproduktion, som inkluderer en AI-assistent. Kotahi AI PDF Designer, “transformerer PDF-design til en ligetil, interaktiv proces.”

Der er nogle tidlige initiativer for at bringe AI ind i InDesign arbejdsgange. I april 2024 annoncerede Adobe en Text to Image feature. Tredjepartsudbydere kan være foran Adobe her: de innovative prepress- og produktionsleverandører i Indien, såsom Hurix Digital og Integra, viser mere initiativ end Adobe i at udnytte AI til produktion.

AI & bogmarkedsføring

An icon of a key

AI’s indvirkning på bogmarkedsføring vil være overfladisk på kort sigt, men på lang sigt langt mere dybtgående. Meget afhænger af, hvad du opfatter “bogmarkedsføring” som; det ændrer sig.

Den ‘lavthængende frugt’ er åbenlys. Bed Chat AI om at hjælpe med en produktbeskrivelse eller en pressemeddelelse. Bed den om at foreslå nogle nøgleord. Dette kan den gøre uden problemer. Men de fleste fagfolk inden for udgivelse kan gøre det samme med kun lidt sved på panden.

Keith Riegerts brugssager, linket ovenfor, inkluderer forslag til brainstorming af titler, udarbejdelse af en digital markedsføringsrapport og oprettelse af en digital markedsføringskampagnesporer i Google Sheets.

Shimmr-software, beskrevet ovenfor, antyder formen på automatiseret markedsføring, der kommer.

AI og metadata

An icon of a key

Hvad har AI at gøre med metadata, og omvendt? Dens rolle synes indtil videre beskeden; forvent nogle store ændringer.

Metadata er kernen i bogens synlighed. Du har hørt det nok gange til at blive kvalm af formaningen. Det er frastødende hovedsageligt fordi “metadata” forbliver undvigende for de fleste ikke-teknikere. Hvis du siger, “det er bare grundlæggende info om bogen, titlen, beskrivelsen, prisen, emnekategorierne, den slags,” ånder folk lettet op. Det er de trygge ved. Men det er stort set det.

Jeg beklager at minde dig om, at der faktisk er meget mere ved metadata end blot nogle få detaljer om bogen. Der er så meget mere. Meget mere, end jeg kan omfatte i denne lille bog. Jeg har medforfattet en hel bog om emnet. Ingram udgiver Metadata Essentials, et fremragende kort bind. Jeg vil sige det her, og ikke for sidste gang: forfattere og forlag ignorerer deres metadata på egen risiko.

AI kan hjælpe med generering af metadata. For eksempel tilbyder selvudgivelsesleverandøren PublishDrive, en “AI-Powered Book Metadata Generator”, som tilbyder AI-anbefalinger til bogtitler, blurb, Amazon-kategorier, BISAC-kategorier og nøgleord.

Insight, fra Veristage, beskrevet ovenfor, kan generere beskrivelser, nøgleord, BISAC-kategorier og definere målgrupper.

Angivelse af AI-brug i metadata

An icon of a key

Du tænker måske, at den statelige verden af metadata ville være langsom til at omfavne AI. Men sådan er det ikke! Sidste november udgav EDItEUR, vogteren af ONIX-standarden, en kort applikationsnote kaldet “Aspects of AI in ONIX.” (pdf)

Med sin typiske dybe visdom bemærker Graham Bell, organisationens direktør, at “en reaktion på (kontroverserne omkring teknologien) er at frasværge brugen af AI eller undgå handel med AI-skabte produkter. En mere realistisk mulighed er simpelthen at være gennemsigtig med handelspartnere og læsere, når AI er blevet brugt. Og da nogle forhandlere begrænser eller forbyder AI-baseret indhold fra deres platforme, er det vigtigt for anerkendte forlag at fremhæve de produkter, der bruger generative AI-teknikker til at skabe indhold.”

Bell skitserer måder, hvorpå forlag kan specificere i metadata:

  • AI-bidragsydere

  • AI-baserede stemmer i lydbøger

… samt en metode til at angive i metadata for digitale produkter, at forlaget eksplicit fravælger tekst- og datamining (TDM) til andre formål end forskning. Der er også en måde at specificere en separat licens, der dækker kommerciel eller ikke-forskningsmæssig TDM.

Som det ofte er tilfældet, kan det, der er specificeret i ONIX, måske ikke opdages længere nede i fødekæden, men i det mindste er der gjort en bedste indsats.

Strategier til integration af AI i forlagsdrift

An icon of a key

Der er få ting, som forlag er mindre komfortable med at gøre end at integrere komplekse digitale teknologier i deres daglige drift. Det er forståeligt. AI, i særdeleshed, forårsager angst for alle, og ikke kun i forlagsbranchen. Det er nyt, det er mystisk, det er personligt, det er kraftfuldt. Folk føler sig truede af AI af adskillige grunde. Ændring af holdninger tager tid.

Men det er ikke et godt tidspunkt at være bange for teknologi.

Der findes rolige og rationelle tilgange til at integrere AI i din forlagsdrift, uanset størrelsen på din organisation.

Drivkraften skal komme fra toppen. Den øverste top. Seniorledere skal omfavne en vision om AI’s potentielt transformative indvirkning og kommunikere et program til personalet på tværs af organisationen. Programmet kan blot være “eksperimenter, dokumenter dine eksperimenter, og del.” Det er en god start.

The Economist nævnte for nylig en organisatorisk taktik til adoption af ny teknologi kaldet “fyrtårnsmetoden.” Du skaber et fyrtårn ved at vælge et højt profileret proof of concept, der kan implementeres hurtigt, som alle kan relatere til.

Forlagsvirksomheder er hæmmet af postyret omkring ophavsret: forfattere er oprørte. En undersøgelse fra Authors Guild i maj 2023 fandt, at “90 procent af forfatterne mener, at forfattere bør kompenseres, hvis deres arbejde bruges til at træne generative AI-teknologier,” og 67 procent sagde, at de “ikke var sikre på, om deres forlagskontrakter eller platformenes vilkår og betingelser inkluderer tilladelser eller rettigheder til at bruge deres arbejde til AI-relaterede formål.” Disse usikre forfattere spørger nu deres forlag, om AI bruges i redigeringen eller produktionen af deres arbejde, og nogle magtfulde forfattere insisterer på, at det ikke bliver det. De leder efter AI-ækvivalenten til et bageri uden jordnødder.

Dette er et tornet problem for forlag - hvis du ikke kan bruge AI på de bøger, du planlægger at udgive, hvad kan du så bruge det til?

Udvikling og kommunikation af AI-politikker

På trods af dens udbredte brug har få forlag offentligt defineret deres AI-politikker og kommunikeret deres tilgange til AI til offentligheden. Udtrykket ‘offentligheden’ har en glidende betydning her, når du overvejer de forskellige offentligheder, der er adresseret af handels-, videnskabelige og uddannelsesforlag.

For handelsforlag er den vigtigste målgruppe forfattere og deres agenter. Videnskabelige forlag står over for forskellige forhindringer, når de overvejer AI’s lovende indvirkning på forskning og derefter AI’s mere problematiske indvirkning på at konvertere forskning til narrativ (Avi Staiman skrev et tankevækkende indlæg om dette emne). For uddannelsesforlag er det udfordrende at etablere politikker, da AI’s indtrængen i undervisningspraksis, i uddannelse, er mangefacetteret og kompleks.

Jeg mener, at forlag står over for to store udfordringer, når de går videre med AI-teknologier. Den første er at udvikle en virksomhedsposition om, hvordan man generelt skal tilgå AI, om hvordan man integrerer AI i deres arbejdsgange. Den anden udfordring er at kommunikere denne position klart og entydigt til deres interessenter.

De forlagspolitikker, jeg har set, er for det meste fejlbehæftede. Nogle af dem er faktisk politikker rettet eksternt, mod forfattere, med en række formaninger om, hvad der er acceptabel praksis (ikke meget) og hvad der ikke er acceptabelt (meget). O’Reilly’s “AI Use Policy for Talent Developing Content for O’Reilly” fortsætter side efter side med esoterisk vejledning, såsom “DO NOT use any OSS GenAI Models that produce software Output that is subject to the terms of a copyleft or network viral open source license.”

På den anden side inkluderer det videnskabelige forlag Elsevier, i afsnittet “Elsevier Policies” på deres hjemmeside, erklæringer om “Ansvarlige AI-principper,” “Tekst- og datamining,” og “Brugen af generativ AI og AI-assisterede teknologier i skrivning for Elsevier.”

De få interne, upublicerede, forlagspolitikker, jeg har set, er konservative, alt for meget. Disse forlag reagerede for hurtigt på rækken af opfattede og mulige trusler og på deres forfatteres bekymringer og har hæmmet deres egen evne til at engagere sig robust med denne hurtigt udviklende, hurtigt skiftende teknologi.

Det er en selvfølge, at de vil bruge AI ‘ansvarligt’, hvad det end betyder. Det er en selvfølge, at de har den største bekymring for forfatteres intellektuelle ejendom og for aggressivt at beskytte forfatteres ophavsretligt beskyttede arbejde. (Selvfølgelig skal disse brede principper erklæres offentligt og ofte gentages.)

Men hvad ellers?

  • Vil de tillade, at AI har en rolle i redaktionelle erhvervelser? Kan AI kigge på slush-pilen?

  • Vil de tillade, at AI har en rolle i udviklingsredigering, linjeredigering og korrekturlæsning?

  • Vil de tillade, at AI har en rolle i at bestemme oplag og allokeringer?

  • I at skabe tilgængelige e-bogs filer, inklusiv alternativ tekst?

  • I at hjælpe med lydproduktion af bøger i tilfælde, hvor det ikke er økonomisk realistisk at ansætte talentfulde menneskelige oplæsere?

  • I at hjælpe med oversættelse til fremmedsprog på markeder, hvor rettigheder aldrig ville blive solgt?

  • I at udvikle markedsføringsmateriale i stor skala?

  • I at kommunikere med forhandlere?

Hvis ja, skal de gøre dette klart og klart forklare tankegangen bag disse politikker. Forlag skal være modige i at imødegå de mange indvendinger fra de fleste forfattere i denne tid af frygt og tvivl.

Jobovervejelser

An icon of a key

Kun de største forlag vil være i stand til at ansætte dedikeret personale til at arbejde med AI-software og -systemer. Den gennemsnitlige forlag vil ønske at udsætte alle deres medarbejdere for AI-værktøjer, idet de forventer, at hver enkelt kan udforske brugen af AI for at finde effektiviseringer i deres arbejde.

På PubWest-konferencen i februar 2024 i Arizona foreslog en taler fra en anden industri, at en af anvendelserne af AI vil være at erstatte praktikanter. Rummet eksploderede. Hun mente det godt – faktisk beskriver en rapport i New York Times den 10. april 2024, hvordan Wall Street investeringsbanker ser på at erstatte mange af deres praktikanter med AI. Ligesom tilfældet er i forlagsbranchen, er en åbenlys bekymring: hvordan finder man senioranalytikere, hvis de ikke kan starte som junioranalytikere?

Forlagsbranchen har altid været afhængig af praktikophold. En undersøgelse fra 2019 fandt, at 80 procent af de mennesker, der havde arbejdet i forlagsbranchen i mindre end femten år, tidligere havde været praktikanter.

Delvis er det en måde at få det grove arbejde udført til en rimelig pris. Men det blegner i forhold til den større virkelighed, at ingen forlagsskole kan udstyre nogen til at slutte sig til et forlag på mellemlederniveau. Den eneste måde at udvikle de dygtige medarbejdere i morgen på er at træne praktikanter og lærlinge i dag.

Målet her er ikke at søge at erstatte praktikanter med AI, men i stedet at gøre deres arbejde mere produktivt og givende ved hjælp af AI-værktøjer, til gavn for både praktikant og forlag.

AI for Lydbøger

An icon of a key

AI for lydbøger fungerer virkelig godt. Det er ikke perfekt, men det fungerer. Forfattere og forlag bruger nu rutinemæssigt AI-værktøjer i produktionen af lydbøger, primært for bøger, hvor fuldskala lydbogproduktion med fokus på fortællere ikke er økonomisk muligt. Og ikke kun for engelsksprogede lydbøger, men også lydbøger i oversættelse.

Brugen af AI til lydbøger er ikke nyt; jeg rapporterede første gang om tendensen i Publishers Weekly i 2021. Men de nyere store sproglige modeller har genoplivet teknologien til automatiseret lydbogsfortælling.

Tilbage i 2021 bemærkede jeg: “Er det perfekt? Bestemt ikke. Kan det være godt nok? Sandsynligvis, hvis et forlag er villig til at bruge den nødvendige tid i stemmeredigeringfasen af projektet.” To og et halvt år senere, ifølge mange beretninger, er AI-stemmer uigenkendelige fra menneskestemmer, medmindre man lytter meget nøje.

Sidste november introducerede Meta (Facebook) “Seamless,” som er i stand til at “overføre toner, følelsesudtryk og vokalstil kvaliteter” til oversættelsen af 200 sprog. En lydbog kan straks oversættes til flere sprog med ekstraordinær kvalitet.

Også i 2021 rapporterede jeg, at “Audibles blokering af distributionen af lydbøger med ikke-menneskelige fortællere er et reelt problem, der kan tage noget tid at løse.” I mellemtiden har både Google og Apple annonceret programmer, der tillader forfattere at skabe lydbøger med AI-genererede stemmer. Den 5. december begyndte Findaway Voices af Spotify at acceptere “digitalt stemmefortalte lydbøger fra Google Play Bøger til distribution til udvalgte detailpartnere.”

I begyndelsen af november 2023 annoncerede Amazon, at Kindle Direct Publishing (KDP) forfattere snart ville få adgang til en service, der ville tillade dem at “hurtigt og nemt producere en lydbogsversion af deres e-bog ved hjælp af virtuel stemmefortælling, en syntetisk taleteknologi.” I januar 2024 rapporterede Jane Friedman (betalingsmur) “Audible begyndte stille og roligt at tillade AI-fortalte lydbøger at komme ind i deres butik sidst på efteråret, længe efter at andre forhandlere havde gjort det samme.”

Og selvfølgelig bruger jeg AI til lydbogsversionerne af denne bog.

AI til Bogoversættelse

An icon of a key

AI til bogoversættelse fungerer. Måske ikke så godt som det fungerer til automatiseret lydbogsskabelse. Men det kommer meget tæt på, meget hurtigt. Ikke-litterær fiktion kunne være først. Litterær fiktion kan følge. Nonfiction udgør et andet sæt udfordringer.

Jeg var vært for et webinar om AI til bogoversættelse, sponsoreret af BISG, i juni 2024. Videoen er online på YouTube. Jane Friedman beskrev også programmet i sit Hot Sheet nyhedsbrev.

Emnet er komplekst og nuanceret. En ting, jeg finder fascinerende, er hvor længe folk har forsøgt at automatisere oversættelse. Det er en påmindelse om, at bøger, der fylder vores univers, er en så lille del af skriftlig kommunikation, endnu mere i denne online tidsalder.

Warren Weaver, krediteret som maskinoversættelsens (MT) fader, bemærkede til en kollega: “Når jeg ser på en artikel på russisk, siger jeg: ‘Dette er virkelig skrevet på engelsk, men det er blevet kodet i nogle mærkelige symboler. Jeg vil nu fortsætte med at afkode.’” For en maskine er sprog bare kode. Det er ikke kultur og følelser og den skrevne sprogs storhed. Det er en opgave med tal og kode.

Klart vil skellet mellem fiktion/nonfiction blive stort i AI-oversættelse. Chat AI er stærk på stil, men det mangler på fakta. Det er meget tidlige dage, men jeg er tilbøjelig til at tro, at Chat AI vil skinne med fiktion, men komme til kort med nonfiction. (Ikke desto mindre fortsætter jeg med at maskinoversætte denne faktaspækkede bog!)

Litterær fiktion er meget elefanten i rummet. Det er dyrebart og værdsat, og med rette. Oversættere kan bruge timer på at diskutere et enkelt ord eller udtryk. Chat AI skal træde varsomt i disse farvande.

Men dette er frugtbart terræn. Så vidt jeg kan fastslå (ud fra få data), var der kun 9.500 handelsbogsoversættelser i 2023. Selv hvis jeg tager fejl med en stor faktor, er det klart, at få bøger bliver oversat fra fremmede sprog til engelsk.

Tilsvarende fandt jeg en statistik, der indikerer, at der i 2023 kun var 7.230 oversættelser fra engelsk til spansk (i spanske bogmarkeder). Det virker latterligt lille.

Der er en enorm mulighed her.

Det meste af brugen af AI til bogoversættelse vil være for bøger, hvor oversættelse aldrig blev anset som økonomisk gennemførlig. Der vil utvivlsomt være en jobpåvirkning på oversættere af “mid-market” bøger; jobvæksten vil være i projektledelse og kvalitetskontrol. Vil det opveje jobtabet? Usandsynligt.

Som med de fleste aspekter af AI, er der udfordrende problemer at tage fat på, og ingen nemme løsninger.

Som jeg bemærker i softwareafsnittet, er Leanpub og DeepL de to virksomheder, der tilbyder AI-assisterede bogoversættelsestjenester til forfattere og udgivere.

AI til videnskabelig udgivelse

An icon of a key

Handelsudgivere og forfattere af alle slags ville gøre klogt i at holde øje med AI’s bane i det videnskabelige udgivelsesmiljø. Det avancerer langt hurtigere end i forbrugerudgivelser.

Jeg ser to grunde til fremgangen. For det første er forfatterne inden for videnskabelig udgivelse akademikere af profession, og i STM-sektoren (videnskabelig, teknisk og medicinsk) er de ofte forskere med avancerede grader. Helt uafhængigt af udgivelse, undersøger de ofte og omfavner AI i deres arbejde. De ville være mere overraskede over at opdage, at deres udgiver ikke udforsker brugen af AI i redigering og udgivelse af deres arbejde.

Dette flyder op til det videnskabelige udgivelsesøkosystem, hvor redaktørerne ofte selv er forskere. For dem er teknologi ikke skræmmende.

Jeg vil ikke bore dybere ned i detaljerne i denne bog; jeg vil rapportere om det mere detaljeret på min blog.

AI for forfattere

Forfattere og udgivere ser ofte sig selv som boende i to ensomheder, forbundne, men essentielt adskilte. Det har stort set været sandt i moderne udgivelse.

Tiderne ændrer sig. Hvor udgivere engang var urørlige, bestemmer topforfatterne nu. Som jeg diskuterer andetsteds, er selvudgivne forfattere pionererne. De bærer lidt af den bagage, der tynger traditionel udgivelse.

Når udgivere ser på AI, ser de få muligheder. Når jeg taler med forfattere om AI, er verden deres østers. Mulighederne er nærmest uendelige:

Forfatterskab og redigering

  • Forsøger at skrive & udgive hele bøger

  • Forsøger at få ideer til et nyt projekt

  • Forsøger at få ideer inden for en ny bog

  • Finjustering af historien

  • Forskning

  • Fakta-tjek

  • Skrive ledsager

  • Udviklingsredigering

  • Korrekturlæsning

  • Stavekontrol og grammatikkontrol

  • Korrekturlæsning

Illustration/billedbehandling

  • Skabe illustrationer og diagrammer

  • Forsidedesign udkast

  • Videopromovering

Markedsføring

  • Automatisere indsendelser til agenter, udgivere, konkurrencer, venner, anmodninger om blurbs

  • Generere markedsføringsmateriale: pressemeddelelser, blogindlæg, sociale medier osv.

  • Hjemmeside generation

Forfattere vil drive meget af ændringen i industriens adoption af AI, hvad enten det er for eller imod.

De er modtagere af meget af startup-innovationen omkring AI i forfatterskab og udgivelse — omkring 70% af startups ser efter at arbejde med forfattere på deres rejser.

Bekymringer og risici omkring AI

An icon of a key

Bekymringerne omkring AI er alvorlige. Risikoen er reel. Nogle gange udtrykkes de på hysteriske måder, men når man dykker ned i det, har AI potentialet til at være enormt destruktiv.

Der er så mange problemer og bekymringer omkring AI, at de fylder bind alene. Her er en ordsky af de emner, jeg overvåger. Jeg er sikker på, at jeg mangler et par stykker.

En ordsky centreret omkring termen 'AI', med relaterede termer som 'bekymringer', 'etik' og 'menneskelighed' omkring det.

Der er masser af information tilgængelig om hvert af disse emner, og jeg opfordrer dig til at læse så dybt som muligt. Det er muligt, at du vil konkludere, at risikoen opvejer fordelene, og at du ikke vil forfølge brugen af AI, hvad enten det er personligt eller inden for din organisation. Den beslutning medfører sine egne risici; de sædvanlige, ved at blive efterladt. Men det er et personligt valg.

Hvis du googler “bøger om risikoen ved AI” vil du finde et udvalg af værdifulde bind. En nylig podcast, som jeg fandt særligt skræmmende, var Ezra Kleins samtale med Dario Amodei, medstifter og CEO af Anthropic (virksomheden, der udvikler Claude.ai). Du lærer, at disse virksomheder er opmærksomme på risiciene. Amodei henviser til et internt risikovurderingssystem kaldet A.S.L., for “AI Safety Levels” (ikke American Sign Language). Vi er i øjeblikket på ASL 2, “systemer, der viser tidlige tegn på farlige kapaciteter—for eksempel evnen til at give instruktioner om, hvordan man bygger bio-våben.” Han beskriver ASL 4 som “at muliggøre statslige aktører at øge deres kapacitet betydeligt… hvor vi ville bekymre os om, at Nordkorea eller Kina eller Rusland kunne øge deres offensive kapaciteter betydeligt inden for forskellige militære områder med AI på en måde, der ville give dem en væsentlig fordel på det geopolitiske niveau.” Skræmmende ting.

Inden for denne dystre kontekst vil jeg fremhæve de mest relevante emner for forfattere og udgivere.

Ophavsret krænket?

An icon of a key

Ophavsretsproblemerne er en tåge af kompleksitet og tvetydighed. Det synes sikkert, at nogle bøger, der stadig er under ophavsret, blev inkluderet i træningen af nogle LLM’er. Men det er bestemt ikke tilfældet, som nogle forfattere frygter, at alt deres arbejde blev støvsuget op i hver og en af de store sprogmodeller.

Ophavsretsproblemerne er både specifikke og brede. Det er velkendt, at alle LLM’er er trænet på det åbne web—alt, hvad der kan skrabes fra de 1,5 milliarder sider på nettet i dag, hvad enten det er avisartikler, sociale medieindlæg, webblogs og tilsyneladende udskrifter af YouTube-videoer.

Det er beviseligt, at mindst én af LLM’erne indtog den faktiske tekst af tusinder af bøger, der ikke er i det offentlige domæne.

Var det lovligt at indtage al denne tekst for at hjælpe med at bygge milliard-dollar AI-virksomheder uden nogen kompensation til forfatterne? AI-virksomhederne argumenterer omkring rimelig brug; domstolene vil til sidst afgøre det. Selv hvis det var lovligt, var det da etisk eller moralsk? Etikken synes mindre kompleks end de juridiske overvejelser. Du bestemmer.

Lovene omkring ophavsret forudså åbenlyst ikke de unikke udfordringer, som AI bringer til spørgsmålet, og det vil tage tid at finde juridiske løsninger, måske år. (Hvis du ønsker at dykke dybere ned i, hvorfor lovene er uegnede til det specifikke problem, læs det fremragende papir af A. Feder Cooper og James Grimmelmann kaldet “The Files are in the Computer: Copyright, Memorization, and Generative AI.”)

Her er en liste over tretten af de mest fremtrædende retssager, ikke alle har at gøre med bøger; også billeder og musik. Og her er en anden liste, der opdaterer status for alle retssagerne.

Ophavsret og AI for forfattere

An icon of a key

Forfattere står over for yderligere problemer omkring ophavsretligheden af AI-genereret indhold.

Den amerikanske ophavsretskontors holdning til ophavsretligheden af AI-genereret indhold fastslår, at AI alene ikke kan have ophavsret, fordi det mangler en juridisk status som forfatter. Det giver mening. Men dette forudsætter, at 100% af arbejdet er AI-genereret. Som diskuteret andetsteds vil få forfattere lade AI generere en hel bog. Mere sandsynligt vil det være 5%, eller 10% eller… Og her snubler Ophavsretskontoret (som jeg ville).

I en mere nylig afgørelse konkluderede kontoret, at en grafisk roman bestående af menneskeskrevet tekst kombineret med billeder genereret af AI-tjenesten Midjourney udgjorde et ophavsretligt beskyttet værk, men at de individuelle billeder selv ikke kunne beskyttes af ophavsret.“ Jeez!

An icon of a key

Det er nok at sige, at forfattere og udgivere skal være opmærksomme på de udviklende ophavsretsproblemer på flere fronter.

Hvad er de langsigtede implikationer?

Nogle sammenligner den nuværende retssag med Google bøger retssagen, som tog 10 år at løse juridisk. Hvem ved, hvor længe appelsagen vil trække ud for disse sager. I mellemtiden er det klogt for udgivere at handle, som om AI-virksomhederne vil tabe, hvilket, i det mindste teoretisk, udsætter enhver, der licenserer eller måske endda bruger Chat AI, for en slags betinget ansvar.

Men det er ikke udgiverens mest alvorlige problem. Det er opfattelsen. For mange forfattere, nogle fremtrædende, nogle obskure, er brønden blevet forgiftet. AI er radioaktivt inden for skrive- og udgivelsessamfundet. Alt, der endda lugter af AI, tiltrækker intens kritik.

Der er mange eksempler. I en nylig hændelse med Angry Robot, en britisk udgiver “dedikeret til det bedste inden for moderne voksen science fiction, fantasy og WTF,” blev det annonceret, at de ville bruge AI-software, kaldet Storywise, til at sortere gennem en forventet stor mængde manuskriptindsendelser. Det tog kun fem timer for virksomheden at droppe planen og vende tilbage til den “gamle indbakke.

Den ulidelige dilemma for handelsforlag ved at bruge AI-værktøjer internt: Hvis dine forfattere finder ud af det, vil du have svært ved at klare den efterfølgende storm. Jeg tror, at forlagene ikke har noget valg andet end at være modige, at tage (i det mindste nogle af) værktøjerne i brug, forklare klart, hvordan disse værktøjer er trænet og hvordan de anvendes, og fortsætte fremad.

I Storbritannien tager The Society of Authors en hård linje: “Bed dit forlag om at bekræfte, at det ikke vil gøre væsentlig brug af AI til noget formål i forbindelse med dit arbejde - såsom korrekturlæsning, redigering (inklusive autenticitetslæsninger og faktatjek), indeksering, juridisk gennemgang, design og layout eller noget andet uden dit samtykke. Du kan ønske at forbyde lydbogsnarration, oversættelse og omslagsdesign udført af AI.”

Authors Guild ser ud til at acceptere, at “forlagene begynder at udforske brugen af AI som et værktøj i den sædvanlige forløb af deres operationer, herunder redaktionelle og markedsføringsmæssige anvendelser.” Jeg tror ikke, at mange medlemmer af Guild er så forstående.

Licensering af indhold til AI-firmaer

De fleste forlag og mange forfattere søger måder at licensere indhold til AI-firmaer. Alle har forskellige ideer om, hvad licensbetingelserne skal være, og hvor meget deres indhold er værd, men i det mindste er diskussionerne i gang.

Der er flere startups, der ser ud til at arbejde med forlag (og i nogle tilfælde individuelle forfattere). Calliope Networks og Created by Humans er begge interessante i denne henseende.

I midten af juli annoncerede Copyright Clearance Center, længe branchens hovedaktør inden for kollektiv ophavsretslicensering, tilgængeligheden“af “kunstig intelligens (AI) genbrugsrettigheder inden for sine årlige ophavsretslicenser (ACL), en virksomhedsomfattende indholdslicenseringsløsning, der tilbyder rettigheder fra millioner af værker til virksomheder, der abonnerer.”

Publishers Weekly dækkede annonceringen, og citerede Tracey Armstrong, præsident og CEO for CCC, der sagde “Det er muligt at være pro-AI og pro-ophavsret, og at koble AI med respekt for skabere.”

Selvom det ikke er altomfattende, er dette sandsynligvis et gennembrud i at bringe udgivelse tættere på en grad af samarbejde med de store sprogmodeludviklere.

Det er for sent at undgå AI

An icon of a key

For forfattere og forlag, der foretrækker ikke at blive besudlet med AI, er nyhederne dårlige: du bruger AI i dag og har brugt det i årevis.

Kunstig intelligens, i forskellige former, er allerede integreret i de fleste af de softwareværktøjer og tjenester, vi bruger hver dag. Folk stoler på AI-drevet stave- og grammatik-kontrol i programmer som Microsoft Word eller Gmail. Microsoft Word og PowerPoint anvender AI til at give skrivesuggestions, tilbyde design- og layoutanbefalinger og mere. Virtuelle assistenter som Siri og Alexa bruger naturlig sprogbehandling til at forstå stemmekommandoer og besvare spørgsmål. Email-tjenester udnytter AI til at filtrere beskeder, opdage spam og sende advarsler. AI driver kundeservicechatbots og genererer produktanbefalinger baseret på din købshistorik.

Og meget af dette er baseret på store sprogmodeller, som det er med ChatGPT.

For en forfatter eller redaktør at sige, “Jeg vil ikke have AI brugt på mit manuskript,” er, generelt set, næsten umuligt, medmindre både de og deres redaktører arbejder med skrivemaskiner og blyanter.

De kunne prøve at sige, “Jeg vil ikke have generativ AI” brugt på deres bog. Men det er en svær en at skære og skære. Grammatik-kontrol software blev ikke oprindeligt bygget på generativ AI. Grammarly har tilføjet det som en ingrediens til sit produkt, som alle andre stave- og grammatik-kontroller vil. Generativ AI er også centralt for den markedsføringssoftware, der tilbydes.

Når forfattere bruger AI

En anden aspekt af forfattere og brugen af AI har ligheder med ophavsretsproblemet diskuteret ovenfor. I ekstremen ser vi 100% AI-genereret indhold blive udgivet på Amazon. Det meste af det (alt sammen?) er af forfærdelig kvalitet, men det forhindrer ikke, at det bliver udgivet. (Se også Amazon-afsnittet.) Mere bekymrende for forlag er AI-genererede indsendelser. Ja, AI øger kvantiteten, men store forlag har allerede et filter for kvantitet. Filtrene kaldes agenter. Det er dem, der skal finde ud af, hvordan man håndterer kvantitetsproblemet, og tilsyneladende skal de finde en løsning, der ikke bruger AI.

Det er noget af et eksistentielt problem—vil jeg udgive en bog skrevet af ‘en maskine’? For de fleste forlag er det et utvetydigt ‘nej.’ Nemt nok. Men hvad med en bog, hvor 50% af indholdet blev genereret af en LLM, under en dygtig forfatters tilsyn? Hmm, lad os prøve et ‘nej’ på det også. OK: hvad så med 25%, eller 10%, eller 5%? Hvor trækker man grænsen?

Og nu, hvor du er begyndt at trække grænser, hvordan løser du dilemmaet, at stavekontrol og grammatikværktøjer nu i det mindste delvist er afhængige af generativ AI? Hvad med AI-drevne transskriptionsværktøjer, som Otter.ai, eller transskriptionsfunktionen indbygget i Microsoft Word?

Jeg kan ikke finde noget handelsforlag, der har erklæret, at de ikke vil udgive et værk med en forudbestemt mængde AI-genereret tekst. Her er hvad Authors Guild siger om emnet:

“Hvis en mærkbar mængde AI-genereret tekst, karakterer eller plot er inkorporeret i dit manuskript, skal du oplyse det til din udgiver og bør også oplyse det til læseren. Vi mener ikke, det er nødvendigt for forfattere at oplyse om brugen af generativ AI, når det blot anvendes som et værktøj til brainstorming, idéudvikling eller til copyediting.”

Det siger sig selv, at ‘mærkbar’ ikke er defineret (Oxford definerer det som “stor nok til at blive bemærket eller anset for vigtig”), men indlægget fortsætter med at forklare, at inkluderingen af mere end “de minimis AI-genereret tekst” vil krænke de fleste udgivelseskontrakter. De minimis er i juridiske termer ikke præcist specificeret, men betyder generelt det samme som mærkbar.

Kan AI opdages i skrivning?

Jeg var vært for et webinar om AI-detektion, sponsoreret af BISG, i maj 2024. Optagelsen er online på YouTube. Jane Friedman tilbød en omfattende beskrivelse af webinaret i hendes Hot Sheet nyhedsbrev.

For mange forfattere betyder AI’s toksicitet, at de holder det langt væk fra deres ord. Forlag bærer en særlig byrde—de skaber ikke teksten, men når den først er udgivet, påtager de sig en betydelig forpligtelse over for teksten. Vi har set mange dynamit sprænge nær brandfarlige bøger, uanset om det er omkring de sociale implikationer af indholdet, eller den plagierende tilegnelse af andre forfatteres ord og idéer. Nu står vi med AI over for et helt nyt sæt etiske og juridiske problemer, som ingen af dem blev beskrevet på udgivelsesskolen.

En del af det virker som det, folk bekymrer sig om for studerende, at brug af AI på en eller anden måde er snyd, svarende til at kopiere fra en Wikipedia-artikel, eller måske bare bede en ven om at skrive din opgave.

En af vores webinar-talere, en underviser, José Bowen, delte sin oplysningsskabelon for studerende. Det er ikke præcist, hvad du bruger til en forfatter, men det viser nogle former for “risikoniveauer” for AI-brug.

Skabelon for oplysningsaftale for studerende

  • Jeg har udført alt dette arbejde selv uden hjælp fra venner, værktøjer, teknologi eller AI.

  • Jeg lavede første udkast, men spurgte derefter venner/familie, AI omskrivning-/grammatik-/plagiatsoftware om at læse det og komme med forslag. Jeg lavede følgende ændringer efter denne hjælp:

    • Rettede stavefejl og grammatik

    • Ændrede strukturen eller rækkefølgen

    • Omskrev hele sætninger/afsnit

  • Jeg gik i stå med problemer og brugte en synonymordbog, ordbog, ringede til en ven, gik til hjælpecentret, brugte Chegg eller en anden løsningsudbyder.

  • Jeg brugte AI/venner/tutor til at hjælpe mig med at generere idéer.

  • Jeg brugte hjælp/værktøjer/AI til at lave en disposition/første udkast, som jeg derefter redigerede. (Beskriv arten af dit bidrag.)

Og så kunne et forlag udarbejde noget lignende for deres forfattere. Lad os sige, at forfatteren oplyser det øverste niveau: Jeg brugte AI omfattende, og redigerede derefter resultaterne. Hvad så? Afviser du automatisk manuskriptet? Hvis ja, hvorfor?

Og i mellemtiden, hvis du er opmærksom, lærer du, at det manuskript, du lige har læst og elsket, som forfatteren svor ikke engang blev stavekontrolleret af Grammarly, faktisk kunne have været 90% genereret af AI, af en forfatter ekspert i at skjule dens brug.

Du bliver derefter tvunget til at genoverveje spørgsmålet. Det bliver til, “Hvorfor er jeg så forbandet opsat på at opdage denne ting, som er uopdagelig?”

Delvis skyldes det den alarmistiske bekymring omkring ophavsretlig beskyttelse af AI-genereret tekst. Ophavsretskontoret vil ikke tilbyde ophavsretlig beskyttelse til 100% AI-genereret tekst (eller musik, eller billeder osv.). Men hvad med 50% AI-genereret tekst? Nå, vi ville kun dække de 50%, der er genereret af forfatteren. Og hvordan ville du vide, hvilken halvdel? Vi vender tilbage til dig om det.

Ville det ikke være fantastisk, hvis du bare kunne fodre hvert manuskript ind i en software, der fortalte dig, om AI var blevet brugt til at skabe teksten?

Ser bort fra problemet, at den eneste måde at gøre dette på ville være ved at anvende AI-værktøjer, er det vigtigere spørgsmål, om softwaren ville være (tilstrækkelig) nøjagtig? Kunne jeg stole på, at den fortalte mig, om AI var blevet brugt til at skabe et manuskript? Og kunne jeg stole på, at den ikke producerede “falske positiver” - at indikere, at AI var blevet brugt, når det faktisk ikke var?

Der er nu masser af software på markedet, der tackler disse udfordringer. Mange af de akademiske studier, der evaluerer denne software peger på dens upålidelighed. AI-genereret tekst slipper igennem. Værre, tekst, der ikke blev genereret af en AI, bliver fejlagtigt mærket som forurenet.

Men bogudgivere vil gerne have nogle former for sikkerhedsforanstaltninger på plads. Det ser ud til, at disse værktøjer i bedste fald kunne advare dig om mulige bekymringer, men du ville altid skulle dobbelt tjekke. Så måske kunne det advare dig om tekster, der skal undersøges mere omhyggeligt end andre? Er dette en effektivitet?

Ægte effektivitet vil blive fundet i at komme videre fra bekymringer omkring en teksts oprindelse og i stedet opretholde vores eksisterende kriterier for dens kvalitet.

Tab af job

“Du bliver ikke erstattet af AI. Du bliver erstattet af nogen, der ved, hvordan man bruger AI.” —Anonym

Tab af job som følge af AI-adoption kunne være alvorligt. Estimater varierer, men tallene er dystre. Der er åbenlyse eksempler: San Franciscos førerløse taxaer eliminerer… taxa- og ridesharedrivere. AI-understøttede diagnoser kunne reducere behovet for medicinske teknikere.

Optimisten i mig peger på, som et eksempel, introduktionen af regnearket og dets indvirkning på beskæftigelsen. Som du ser i diagrammet nedenfor, er beskæftigelsen inden for “Regnskab, Skat Forberedelse, Bogføring og Lønservice” næsten fordoblet siden 1990 - næppe en anklage mod regneark og andre teknologier, der stort set har automatiseret disse opgaver.

En linjediagram, der viser antallet af ansatte i regnskab, skatteforberedelse, bogføring og lønservice fra 1990 til 2020.

Ethan Mollicks studie med Boston Consulting Group (BCG) var et eksperiment, der sigtede mod bedre at forstå AI’s indvirkning på arbejde, især på komplekse og videnintensive opgaver. Undersøgelsen involverede 758 BCG-konsulenter, tilfældigt tildelt til at bruge eller ikke bruge OpenAI’s GPT-4 til to opgaver: kreativ produktinnovation og forretningsproblemløsning. Undersøgelsen målte deltagernes præstation, adfærd og holdninger samt kvaliteten og egenskaberne af AI-outputtet.

Blandt resultaterne var, at “AI fungerer som en færdighedsudjævner. De konsulenter, der scorede dårligst, da vi vurderede dem i begyndelsen af eksperimentet, havde det største spring i deres præstation, 43%, når de fik lov til at bruge AI. De bedste konsulenter fik stadig et løft, men mindre af en.” Hele artiklen er afslørende, og som med alt Mollicks arbejde, provokerende men tilgængeligt.

Uddannelse

Uddannelse har været i centrum i debatterne om AI. Introduktionen af AI i klasseværelserne ses stort set som en forbandelse, eller i det mindste en udfordring. Andre undervisere, som PW’s hovedtaler Ethan Mollick, omfavner AI som et bemærkelsesværdigt nyt værktøj for undervisere; Mollick insisterer på, at hans studerende arbejder med ChatGPT.

Den bedste bog om emnet er Teaching with AI: A Practical Guide to a New Era of Human Learning af José Antonio Bowen og C. Edward Watson.

Jeg vil ikke dykke ned i uddannelsesudgivelse i denne bog - det er et stort emne, der kræver en separat rapport. Argumentet kan være, at udgivelse bliver af sekundær interesse inden for uddannelse: AI-værktøjer er software, ikke indhold, per se.

Fremtiden for søgning

An icon of a key

Søgning er et problematisk emne i AI. Jeg opfordrer dig til at besøge perplexity.ai og You.com for at få et indblik i, hvor tingene er på vej hen. De næste par gange du tænker på at starte en Google-søgning, gå over til Perplexity i stedet. Det vil ikke virke dramatisk anderledes - det ligner de vidensgrafer, som Google ofte popper op i højre side af en søgeskærm, eller nogle gange øverst på søgeresultatlisten. I stedet for at skulle klikke på et link, er informationen lige der for dig.

Perpleksitet går et skridt videre og omformulerer de oplysninger, den samler fra flere kilder, så du virkelig ikke behøver at klikke på et link. Den giver links til sine kilder, men at klikke på dem er normalt unødvendigt - du har allerede fået svaret på dit spørgsmål.

Denne tilsyneladende beskedne ændring har enorme implikationer for enhver virksomhed og ethvert produkt, der i det mindste delvist er afhængig af at blive opdaget gennem søgemaskiner. Hvis søgende ikke længere bliver sendt til dit site, hvordan kan du engagere dem og konvertere dem til kunder? Enkelt svar, det kan du ikke.

Joanna Penn er på forkant med at tænke over indvirkningen af nye teknologier på skrivning og udgivelse. Hun tog fat på dette komplekse emne på sin podcast og blog sidste december.

Det er stadig tidlige dage for AI og transformationen af søgning.

Skraldebøger på Amazon

An icon of a key

AI-genererede skraldebøger på Amazon er et problem, selvom deres alvor måske er mere følelsesmæssig end bogstavelig. På den ene side spammer disse bøger den online boghandel med lavkvalitets og plagieret indhold, nogle gange ved at bruge rigtige forfatteres navne for at bedrage kunder og udnytte deres omdømme. Bøgerne er ikke kun en irritation for læsere, men også en trussel for forfattere, da de potentielt kan fratage dem hårdt tjente royalties. AI-genererede bøger påvirker også rangeringen og synligheden af rigtige bøger og forfattere på Amazons site, da de konkurrerer om de samme nøgleord, kategorier og anmeldelser.

En sød killing, der sidder på en strand med blomster omkring den og en billedtekst, der siger 'Sjove og søde kattebilleder kan ikke ses i verden'.

Amazon kræver nu, at forfattere skal afsløre detaljer om deres brug af AI i oprettelsen af deres bøger. Der er ingen tvivl om, at dette kan misbruges.

Prøv at søge på Amazon efter “AI-genererede bøger.” Der er mange. Nogle af resultaterne er how-to bøger om brugen af AI til at skabe bøger. Men andre er, uden skam, AI-genererede. “Sjove og Søde kattebilleder - Du kan ikke se denne type fotos i verden - DEL-1” (stet) er krediteret Rajasekar Kasi. Der er ingen detaljer om hans (?) bio på en forfatterside, men seks andre titler er krediteret navnet. Bogen, udgivet den 26. august 2023, har ingen anmeldelser og ingen salgsrang. Den ugrammatiske titel på e-bogen matcher ikke den ugrammatiske titel på omslaget af trykbogen.

Men andre forfattere bruger klart AI i vid udstrækning i oprettelsen af deres bøger og afslører det ikke. Som jeg diskuterer ovenfor, er det næsten umuligt at opdage AI-brug med dygtige ‘forfalskere.’ Malebøger, dagbøger, rejsebøger og kogebøger bliver genereret med AI-værktøjer på en brøkdel af den tid og indsats, som traditionel udgivelse kræver.

Søg efter “koreansk vegansk kogebog”, og du vil finde den nummer et titel, af Joanne Lee Molinaro, på førstepladsen. Men lige bag den er andre titler, der er åbenlyse kopier. “Den Koreanske Veganske Kogebog: Enkle og Lækre Traditionelle og Moderne Opskrifter for Koreansk Køkken Elskere” har to anmeldelser, herunder en, der bemærker “Dette er ikke en vegansk kogebog. Alle opskrifterne har kød- og æggredienser.” Men bogen er #5,869,771 i salgsrang, i forhold til originalen, som står på #2,852 på listen.

Det er svært at bestemme omfanget af den forårsagede skade. Intet godt kan komme ud af dette, men hvor slemt er det?

Amazon har politikker på plads, der tillader det at fjerne enhver bog, der ikke “giver en positiv kundeoplevelse.” Kindle-indhold retningslinjer forbyder “beskrivende indhold, der er beregnet til at vildlede kunder eller som ikke nøjagtigt repræsenterer indholdet af bogen.” De kan også blokere “indhold, der typisk skuffer kunder.” Er det det rene volumen, der besejrer Amazons observatører? Eller er der en anden grund?

Bias

LLM’er er trænet på det, der allerede er blevet offentliggjort online. Det, der er blevet offentliggjort online, er fyldt med bias, og derfor afspejler LLM’er denne bias. Og selvfølgelig ikke kun bias, men had, afspejlet i dets læring og nu en potentiel output i AI-genererede ord og billeder. Porno er en anden naturlig modtager af AI’s bemærkelsesværdige evne til billeder, og der er nylige bekymrende historier om unge kvinder, der finder fabrikerede nøgenbilleder, deres mandlige klassekammerater som sandsynlige mistænkte. The New York Times rapporterede separat om en stigning i online billeder af seksuelt misbrug af børn.

Forfattere og udgivere skal være opmærksomme på disse indbyggede begrænsninger, når de bruger AI-værktøjer.

Kreativitet kan være en kliché

An icon of a key

Spørgsmålet om, hvorvidt maskiner virkelig kan være kreative, er stadig et emne for heftig debat. Det afhænger delvist af, hvordan vi definerer kreativitet.

“AI vil aldrig være kreativ.” Det er et velkendt mantra.

Vi ved alle, hvad kreativitet er, ikke?

Cambridge: “evnen til at producere eller bruge originale og usædvanlige ideer.”

Britannica: “evnen til at skabe eller på anden måde bringe noget nyt til eksistens, hvad enten det er en ny løsning på et problem, en ny metode eller enhed, eller et nyt kunstnerisk objekt eller form.”

Jeg bestrider ikke, at kreativitet i denne forstand ligger langt ud over LLM’ernes rækkevidde.

Mit argument er, at det meste af det, der udgives som kreativt - og ofte ser ret kreativt ud - faktisk er iterativt. Hvilket fungerer perfekt til mange ting, inklusive de fleste reklamer.

Men at hæve ‘kreativitets’-stangen og derefter nedbryde LLM’er er at sætte en umuligt høj barriere, som AI uundgåeligt fejler ved. Så afviser folk det som “nå, jeg sagde jo, at det ikke er kreativt.”

Og dermed går de glip af det iterative, som det er meget godt til.

Jeg vil poste et langt essay om dette emne i den nærmeste fremtid, efter jeg har læst:

The Creativity Code, af Marcus du Sautoy, og

The Artist in the Machine, af Athur I. Miller

Litterær Teori for Robotter, af Dennis Yi Tenen

En anden tanke

Jeremiah Owyang er en brancheanalytiker baseret i Silicon Valley. Han er en AI-tilhænger, men han har oplevet hype før. Han bemærker, at han “aldrig har set en så hurtig udvikling på så kort tid.”

Som Owyang udtrykker det, kan små teams af programmører nu bruge LLM’er til at samle “sansende væsener” - som en 4-årig - på to dage. De er i stand til:

  • At ‘se’ med computer vision, hvad der sker i den virkelige verden,

  • At ‘høre’ via stemmekommandoer og omgivelseslyde i den virkelige verden,

  • At ‘tænke’ gennem behandling af ovenstående input fra den virkelige verden,

  • At ‘lære’ ved at få adgang til de forudtrænede data,

  • At ‘referere’ eksklusive datasæt,

  • At ‘tale’ med livagtige stemmer, der har betoning og tone på ethvert sprog,

  • At ‘skrive’ gennem tekstkommunikation i ethvert format eller stil, der kræves,

  • At ‘tegne’ ved spontant at skabe billeder, og

  • At ‘interagere’: det kan proaktivt engagere sig i dialog, stille spørgsmål eller tildele AI-agenter til at udføre opgaver selvstændigt.

Dette er ekstraordinært og uden fortilfælde. Vil det have betydning for udgivelse? Du bestemmer.

Gode ting uden for udgivelse

AI ligger bag nogle banebrydende præstationer uden for udgivelse. Medicin er AI’s plakatbarn, men der er også stærke historier fra andre industrier. Relevansen for udgivelse stammer fra et retorisk spørgsmål: AI kan redde liv. Men du tror ikke, det kan hjælpe udgivere?

Formålet med denne korte sektion er blot at imødegå argumentet, at hvis man ikke er overbevist om, at AI vil hjælpe udgivelse, kan AI overhovedet hjælpe nogen?

AI og medicin

Mens jeg læste et nummer fra marts 2024 af The Economist, dykkede jeg ned i deres teknologitillæg om sundhed og AI. Over de sidste par år har medicin konsekvent været fremhævet som kunstig intelligens’ lyspunkt. De fleste rapporter er positive. Men The Economist funktionen vil stadig imponere dig. De udtrykker mange velartikulerede forbehold. Men du vil også læse, at AI i medicin “repræsenterer en mulighed for at forbedre livet for hundredvis af millioner, endda milliarder.”

Endnu et retorisk spørgsmål til dem, der enten vil forbyde AI-teknologi eller i det mindste sætte en pause på dens udvikling: ville du ofre dens potentielle værdi for helbredet af millioner for at tilfredsstille din angst for en usikker fremtid?

AI og TSA i lufthavne

Vi har alle været der: de endeløse køer, den langsomme bevægelse af vores håndbagage gennem røntgenscannerne.

TSA’s detektionsfejl er veldokumenterede, men ikke meget diskuterede.

Hvad der bekymrer mig mest, er de triste arbejdere, der stirrer på deres skærme i timevis. For hvad? Ikke alene er det et elendigt job, men som blot dødelige, er de ikke særligt gode til det.

Enter AI. Hvis det kan opdage svære at finde tumorer i lungerne, er jeg sikker på, det kan opdage smuglergods i håndbagage. Og aflaste mennesker fra en utaknemmelig opgave, som de er dårligt egnet til at håndtere.

Ifølge denne beretning, er det nye TSA AI-assisterede screeningsprogram i gang.

Essay: AI’s Indvirkning på Bogudgivelsesindustrien

Jeg talte for nylig med Peter Brantley, min partner i AI-webinar junglen, om hvordan vi kunne forme kommende AI-programmer. Peter arbejder meget af tiden inden for bibliotekssamfundet og var netop vendt tilbage fra en heldagsbegivenhed i Los Angeles med omkring 150 af sine bibliotekskolleger, hvor de personligt udforskede AI’s potentielle indvirkning på deres sektor. Samtalen var livlig og dybdegående. Hvorfor, undrede han sig, har handelsbogudgivere ikke sådanne samlinger? AI er et emne ved hver udgivelsesbegivenhed: hvorfor er det ikke emnet?

De virkelige konsekvenser af AI

Svaret, han kom frem til, er, at handelsbogudgivere endnu ikke har konkluderet, at AI vil have nogen virkelige konsekvenser for deres forretning. På kernen af deres forretning. På deres evne til at drive forretning. Sikkert, det kan måske hjælpe med at skrive en pressemeddelelse eller et manuskript afvisningsbrev, men de antager, at udgivelse stadig vil trisse videre, som det har gjort i årtier, med den gennemsnitlige tid fra kontrakt til trykt bog trækkende ud i op til to år.

Samtidig står udgivere naturligvis over for nærmere udfordringer, der er mere presserende end AI. Papirpriser. Forsendelsesomkostninger. Krympende marginer. Salg stort set fladt overalt. Med alle disse presser, hvem har så tid eller overskud til at bekymre sig om AI?

Men de andre kreative industrier forstår det. Kunst og design forstår det. Reklame forstår det. Hollywood ser, hvad der kommer, ligesom musikindustrien. Journalister ser med frygt.

Andre bogudgivelsessektorer begynder at få styr på AI’s indvirkning. Videnskabelig udgivelse er dybt inde i teknologien. Men handelsudgivere opfører sig, som om der vil være få virkelige konsekvenser fra AI.

Hvad kunne de virkelige konsekvenser være? Vil det påvirke udbuddet af bøger? Eller efterspørgslen efter bøger?

Udbud: Ja, AI er skyld i en masse nye skraldebøger på Amazon. Hundredvis? Sikkert. Tusinder? Måske. Millioner? Nej. Hvor mange bøger er der på Amazon? Over 50 millioner. Det er allerede meget overfyldt.

Bortset fra det, er det klart, at i den nærmeste fremtid vil AI ikke skrive hele bøger, som folk rent faktisk vil læse. Dens værdi indtil videre er som en skrivekammerat—kritiserende, foreslående, lejlighedsvis spindende et par brugbare afsnit ud. Nej, i den nærmeste fremtid vil AI ikke radikalt ændre udgivelsernes output, udbuddet af nye bøger.

Efterspørgsel: Nej, ingen kræver AI-genererede bøger. Det er ikke en faktor. Og jeg kan ikke forestille mig et scenarie, hvor AI vil påvirke efterspørgslen efter bøger bredere set.

Hvad med udgivelsesprocessen? Ja, den vil ændre sig. I det mindste lidt. Som vi opdagede ved vores Publishers Weekly AI-begivenhed sidste efterår, søger udgivere AI til hjælp her og der: marketing, redaktionelt, lidt af dette og lidt af hint.

Er det muligt, at der vil være få reelle konsekvenser af AI på tradebogsudgivelse? Måske er det bare et legetøj.

Så lad os træde et skridt tilbage fra AI-detaljerne og genoverveje den vanskelige situation for tradeudgivelse, og gennem det, dykke ned i, hvor AI sandsynligvis vil have sin største indflydelse.

Forlagsbranchen har været i økonomisk nedgang i årtier

Ifølge forskellige skøn har hele forlagsbranchen i USA årlige salg på under $35 milliarder. Selv hvis det var $40 milliarder, er Apples Computers årlige salg alene 10 gange højere. Apples bruttofortjeneste er 44% af salget, sammen med nettofortjenester på 25% af salget. Forlagsbranchen tør ikke engang drømme om sådanne margener.

Tradebogsudgivelse har været i en blid økonomisk nedgang i årtier, nogle år op et par procent, nogle år ned. Ved midten af 2024 ser salget solidt ud år-til-år, men det er den slags sommerromance, forlæggere er bekendt med. Vi vinder nogle, vi taber nogle, men samlet set er tradebogsudgivelse ikke en vækstindustri.

I 2023, ifølge AAP’s StatShot “var tradeindtægterne faldet med 0,3%, til $8,9 milliarder for kalenderåret.” Så vidt jeg kan se, tager AAP’s data ikke højde for inflation. Ved 3,4% inflation ville salgsnedgangen være 3,6%, tættere på det 2,6% fald i enhedssalg rapporteret af Circana.

Uden væksten af alternative formater, e-bøger og lydbøger, kunne branchen være i meget dårlig form. E-bøger var en vækstmotor i årevis. Salget af lydbøger fortsætter med at stige, op næsten 15% i 2022 og yderligere 9% i 2023. Ja, noget af det er substitueret salg, men mange af kunderne til e-bøger og lydbøger er nye kunder, ikke nødvendigvis regelmæssige boglæsere. E-bøger og lydbøger tegnede sig for 21% af trade-salget sidste år. Ville alle disse kunder købe trykte bøger, hvis tryk var alt, der var tilgængeligt?

Detailprissætning bliver et stigende problem, da omkostninger og detail- og engrosrabatter presser forlæggerens margener. Akademiske studier tyder på, at der er en vis grad af priselasticitet for bøger, men vi når sikkert modstandspunktet: hardcover bestsellere støder mod, hvad der kan være en $35 prisloft. “Abonnementsmæthed” får video-on-demand kunder til at droppe tjenester, fokuseret på de stigende omkostninger ved hver. Netflix’s Premium plan koster nu op til $22.99/måned; Disney Plus Duo Premium er $19.99/måned. Som en kollega for nylig bemærkede over for mig, hvor mange abonnenter med stram økonomi vil sige, åh, lad os opsige vores Netflix-abonnement, så jeg kan købe en bog næste måned?

Forlagslønninger

Jeg vil ikke malke dette til døde: det er ikke kun forfattere, der kæmper for at tjene til livets ophold—forlagspersonale er groft underbetalt sammenlignet med tilsvarende professioner.

Jeg holder en repræsentativ smagsprøve af nylige jobopslag i forlagsbranchen. Jeg kigger på et, for en Marketing Manager hos en tradeudgiver, der rapporterede 2023-salg på lige over $30 millioner. Stillingen betaler mellem $60,000 og $70,000 per år. Her er en anden, for en Publicity Manager hos et af forlagets imprint, der rapporterer $750 millioner i årligt salg. “Denne rolle vil have en årlig løn på $74,000–$79,000,” bemærker opslaget.

Ifølge U.S. Bureau of Labor Statistics National Occupational Employment and Wage Estimates, tjener marketingchefer i gennemsnit på tværs af alle industrier $166,410. “PR-chefer” har en gennemsnitlig indtjening på $159,420.

Bogudgivelse er slet ikke i nærheden af disse tal. Dette er ikke nogen nyhed for nogen, der arbejder inden for udgivelse. Det har altid været sådan. Men kan udgivelse opretholde sig selv ved disse lønniveauer? En manglende evne til at tilbyde kandidater selv halvdelen af lønstandarden lover ikke godt for en industri, der bliver stadig mere digital.

I en tidsalder med TikTok, YouTube, sociale medier, SEO, metadata og forfatterplatforme, hvad i alverden er en “publicity manager” egentlig?

De tre (og en halv) tilbageværende fordele for traditionelle bogudgivere

Tre vedvarende fordele for traditionelle bogudgivere er (i) cachet, (ii) adgang til større medier, og (iii) adgang til boghandlerdistribution. Dette gælder ikke lige meget for alle traditionelle udgivere—de største har mere af hver: mere cachet, bedre adgang til større medier og bedre muligheder for at få deres bøger på de forreste borde i det største antal boghandlere. Men, samlet set, er dette de karakteristiske fordele ved den traditionelle bogudgivelsesindustri.

En anden værdi, som udgivere kan tilbyde, er en kurateret liste af komplementære titler, hvor hver enkelt titel drager fordel af sine ledsagere. Tænk på en udgiver som Fox Chapel, der specialiserer sig i bøger om håndværk: hvis du nyder en af deres titler, er der en rimelig chance for, at du vil se nærmere på deres andre bøger (og magasiner) om samme emne, selvom de er skrevet af andre forfattere.

Dette krydser over til noget, som kun få udgivere har formået at udvikle, et markedsførbart brand. Tænk på serier som Wiley’s “For Dummies” eller Oxfords “Very Short Introductions.” Brandet formidler en konsistens af redaktionel tilgang og kvalitet, der opmuntrer læsere til at købe flere titler. Selvudgivere lancerer ofte deres egne korte serier, mest for fiktion, selvom de ikke kan dække bredden af disse større udgiverkataloger.

Alle de andre tjenester, som traditionelle udgivere tilbyder, kan købes på det åbne marked med lignende kvalitet til overkommelige priser (for eksempel redaktionelle, design, produktion og essentielle markedsføringsfunktioner). Og for selvudgivere er indtægten pr. solgt bog fem gange eller mere større end traditionelle royaltyordninger.

Jeg vil gå lidt dybere ind i dette i et kort appendiks i slutningen af denne bog. Men lad mig hurtigt nedsætte værdien af de tre største fordele. Cachet er godt for pral, men har beskeden kontant værdi. Boganmeldelser og anden større medieeksponering har nu en stærkt reduceret indvirkning på bogsalget. Og boghandlere repræsenterer omtrent 15% af industrisalget (og langt mindre for selvudgivne forfattere)—de er ikke længere kerne til en bogs succes.

Tingene har ændret sig.

Selvudgivelse

Selvudgivelse har været den primære drivkraft for vækst i forbrugerudgivelse (trade publishing) i det seneste årti og mere. Præcise salgsdata omkring selvudgivelse forbliver skjult—det er let at ignorere dens betydning. Men de tilgængelige data viser, at selvudgivelse kræver en betydelig del af markedet for forbrugerudgivelse.

Som Kobo CEO Michael Tamblyn (noget) berømt bemærkede, “En ud af 4 bøger, vi sælger på engelsk, er en selvudgivet titel, hvilket betyder, at for os, er selvudgivelse som at have et helt andet Penguin Random House, der sidder ude på markedet, som ingen ser. Det er som den mørke materie af udgivelse.”

Tendenserne inden for selvudgivelsesmarkedet er uden tvivl de eneste betydelige tendenser i forbrugerudgivelse. Selvudgivne forfattere viser vejen. De er eventyrlystne og uhæmmet af den traditionelle industris skikke. Mange er flydende med sociale medier. De er tæt på deres læsere, deres kunder. Hvis du vil lære de nyeste markedsføringsteknikker, så følg forfatter fora, blogs og nyhedsbreve.

Dykk dybt ned i forfatterindkomststatistikker, økonomien ved at skrive, og sammenlign derefter indtægtsnedgangen for traditionelt udgivne forfattere med indkomststigningerne for selvudgivne forfattere. I en international undersøgelse og rapport, som jeg foretog sammen med Steve Sieck for ALLi i 2023 (pdf), opdagede vi, at “den mediane indkomst fra skrivning og selvudgivelsesrelaterede aktiviteter i 2022 for alle selvudgivere, der svarede, var $12,749, en stigning på 53% i forhold til det foregående år. Gennemsnitlige (mean) indtægter var meget højere: $82,600 i 2022, en stigning på 34%.”

I en separat undersøgelse, udført af Peter Hildick-Smith for Forfatterforeningen, rapporterede “fuldtids selvudgivne forfattere, der havde udgivet siden mindst 2018, en gennemsnitsindkomst på $24.000 sammenlignet med $13.700 i 2018, en stigning på 76 procent.”

Hybridforlag

For grundighedens skyld vil jeg også nævne hybridforlag. Jeg er blevet stadig mere begejstret for hybridmodellen, og hybridforlagssegmentet er betydeligt og voksende. Ingen estimerer hybrid salg separat. Men effekten ses tydeligst i deres dominans af to kategorier: bøger af berømtheder og i populære erhvervsbøger. Disse kategorier har længe været pålidelige indtægtskilder for traditionelle forlag, men hybridforlags “conciergetjenester” og meget mere favorable indtægtsfordelinger er uimodståelige for mange højprofilerede forfattere.

Nylige eksempler, som Authors Equity’s profitdelingsforhold med sine forfattere, og Keila Shaheen’s 50/50 profitdeling med Simon & Schuster, antyder en tendens mod normalisering af hybridmodellen. Dette er gode nyheder for forfattere; mindre lovende for traditionelle forlag.

Udgivelse ud over forlag

Jeg er medforfatter til en rapport med Rüdiger Wischenbart, baseret på hans originale studie “Publishing Beyond Publishers.” Vi forsøger at forstå og kvantificere, så godt vi kan, al den bog-relaterede udgivelsesaktivitet, verden over, der kunne (og burde) inkluderes som en del af en mere omfattende opfattelse af det moderne udgivelsesøkosystem.

Når du bevæger dig ud over den boglige beholder, finder du antydninger af, hvor AI virkelig kunne gøre en forskel.

Eksemplet for vores projekt er Wattpad, hvor “97 millioner mennesker tilbringer over 23 milliarder minutter om måneden engageret i originale historier.” Historierne opleves online, mest på smartphones, i korte bidder. Få bliver til udgivne bøger. De finder lige så sandsynligt vej til “Wattpad WEBTOON Studios, firmaets TV-, film- og udgivelsesmodstykker.”

Yngre læsere er mere tilpasset online digital læsning end deres ældre kolleger. Ifølge en januar 2024 Wattpad-undersøgelse, “digitale formater er stadig mere populære blandt yngre generationer, med 65% af Generation Z og 71% af Millennials, der omfavner webromaner, e-bøger og webcomics, mens mindre end halvdelen af Generation X og Boomer-generationerne siger det samme.”

Og selvfølgelig, som den traditionelle udgivelsesindustri nu lærer: “Mangfoldighed er en nøglefaktor for at omfavne digitale formater: 61% af Generation Z og 70% af Millennials er enige i, at e-bøger, webromaner og webcomics giver dem adgang til indhold, der er sværere at finde i boghandlere og biblioteker, herunder LGBTQ+ og minoritetsfokuseret indhold.”

Wattpad har konkurrenter, herunder Inkitt, som ifølge Publishers Weekly for nylig rejste $37 millioner fra investorer “herunder Stefan von Holtzbrinck, ejeren af Holtzbrinck Publishing Group, som ejer Macmillan, og tidligere Penguin CEO Michael Lynton; det har nu samlet i alt $117 millioner i investeringer. I februar 2023 sagde Financial Times, at Inkitt var det ottende hurtigst voksende firma i Europa, og #1 i Tyskland.” En 9. juli artikel i Esquire skitserede Inkitts brug af AI, dens rolle i deres succes.

Hvor mange af jer har nogensinde hørt om Inkitt, besøgt deres udgivelsesplatform, eller downloadet deres Galatea læseapp?

Men vores rapport “Publishing Beyond Publishers” går ud over online historieplatforme for at overveje, hvordan “indhold kan skabes og distribueres i en række forskellige formater (print, digital), medier (bøger, lyd, film, spil), distributionskanaler (fællesskaber, platforme, streams) og forretningsmodeller (salg af produkter, abonnementer, streaming, freemium, betalte modeller) i stort set digitalt definerede forsynings- og markedsføringskæder.” Hvor mange muligheder går bogudgivere glip af, fordi de ikke passer ind i deres nuværende forretningsmodel?

Innovation, teknologi og bogudgivelse

Med undtagelse af e-bøger har moderne udgivelse aldrig stået over for en trussel fra teknologi. (Digitale lydbøger blev mødt med mere glæde end bekymring.) Internettets æra gav udgivere flere muligheder end trusler; det er blot en enkelt forhandler, Amazon, muliggjort af Internettet, der væltede æblevognen.

Jeg har aldrig set en undersøgelse af, om Amazon har været (når alle aspekter af dets drift og indvirkning er fuldt ud medregnet) en nettofordel for bogudgivelsesindustrien. De når mange købere, der ikke betjenes af fysiske butikker, og er villige til at ofre margin for at holde priserne lave. E-bøger og lydbøger leveres i stor skala. Men Amazon kan sænke priserne delvist, fordi de kræver høje rabatter og gebyrer fra leverandører, og de kvæler andre detailkanaler. Der er smertefulde afvejninger.

Men prøv ikke at kritisere Amazon foran en selvudgivet forfatter. De ville ikke være i forretning uden The Everything Store.

Innovatorens dilemma

For at få et perspektiv på AI’s kommende indvirkning på bogudgivelse anbefaler jeg Clayton Christensens The Innovator’s Dilemma: When New Technologies Cause Great Firms to Fail, først udgivet i 1997 af Harvard Business Review Press.

Christensen ser på, hvordan eksisterende (etablerede) virksomheder kan bukke under for innovationskræfterne.

Succesfulde, veladministrerede virksomheder fejler ofte, når disruptive ændringer kommer til deres industri. Konventionelle ledelsespraksisser, som havde hjulpet dem til at blive industriledere, gør det svært for disse virksomheder at være fleksible i mødet med de disruptive teknologier, der kunne kannibalisere deres markeder.

De ignorerer produkterne skabt af de disruptive teknologier, fordi de ved første øjekast sammenlignes dårligt med deres eksisterende produkter. Deres mest rentable kunder kan generelt ikke bruge de påståede innovationer og ønsker dem ikke. Virksomheder forsøger at bekæmpe disruptive trusler ved at fordoble deres eksisterende produkter og tjenester.

Christensens nøgleindsigt er, at ved at gøre det tilsyneladende ‘rigtige’, inklusive at lytte til kunderne, efterlader succesfulde virksomheder sig vidt åbne for disruptiv innovation. De fokuserer på deres nuværende kunder og ignorerer vigtige nye teknologier – som i første omgang retter sig mod små, mindre rentable markeder. Det skaber en åbning for agile startups til at forstyrre lederne.

Chris Dixon, i diskussionen af bogen, påpeger, at “årsagen til, at store nye ting sniger sig forbi etablerede virksomheder, er, at den næste store ting altid starter med at blive afvist som et ‘legetøj.’” Hmm, ja, mange mennesker ser Chat AI som et legetøj.

Er udgivere ude af stand til at genkende, at innovationer bygget med generativ AI kan forstyrre deres skrøbelige forretningsmodel?

Fiktion versus nonfiktion

Indvirkningen af AI på bogudgivelse vil helt sikkert have en dramatisk anderledes indvirkning på fiktionudgivelse end på nonfiktion.

Bogudgivelsesindustrien analyseres ikke ofte nok som to opdelt industrier, hvor den ene udgiver fiktionsbøger og den anden udgiver nonfiktionsbøger.

Mens de fleste handelsforlag tilbyder både fiktion og nonfiktion titler, er kløften mellem de to former slående både i antallet af udgivne titler og i bogsalg. Estimater varierer, men fiktions titler repræsenterer kun cirka 10% af de bøger, der udgives hvert år. Salget favoriserer dog i høj grad fiktion. Igen er der år-til-år skift, men fiktion fanger cirka halvdelen af det årlige bogsalg. Sidste år var 21 af de top 25 bestsellere fiktion. Brug af Wikipedias samling, af bøger på engelsk, der nogensinde har solgt 20 millioner eksemplarer eller mere, er 84% fiktions titler.

Bogsalgstrends er notorisk lunefulde, men salg af skønlitteratur ser ud til at være på en fortsat opadgående kurve. Efter at være faldet til 32% i 2019, krævede de 40% af voksenmarkedet i 2022 og voksede lidt igen i 2023. Voksen skønlitteratur salg steg yderligere 6,3% i første halvdel af 2024.

Mens AI i stigende grad vil blive brugt af skønlitterære forfattere til at hjælpe i skabelsesprocessen, som diskuteret andre steder, synes der at være ringe sandsynlighed for, at AI-genererede historier vil overtage bestseller-hylderne. En “god-nok” rækkevidde for noget genre-fiktion er tænkelig, men igen ikke noget, der bør holde forfattere og forlag vågne om natten.

Skrivning og udgivelse af faglitteratur, derimod, vil blive hjulpet og fremmet af AI på tværs af hele linjen. Det sker allerede. Faglitterære forfattere drager fordel af Chat AI’s mange talenter både som forskningsassistent og som skrivehjælp. Og faglitterære forlag vil i stigende grad bruge Chat AI til hjælp i manuskriptudvikling, faktatjek, redigering, markedsføring og distribution.

Er der en eksistentiel trussel mod forfattere?

Jeg talte med en meget klog forfatteragent, som har tænkt meget over, hvad AI betyder for hendes klienter og for alle professionelle forfattere. Samtalen drejede sig om ideen om bogen som en ‘beholder’, og jeg bad hende uddybe den idé. Hendes svar:

“Den grundlæggende idé er, at når forfattere/agenter placerer en bog hos en udgiver, er det lige præcis det: en bog. Der er en forståelse af, at den senere kan blive en af de utallige former for afledte værker, vi kender (oversættelse, dramatisk tilpasning, grafisk roman osv.), men alt dette er sekundært i forhold til ‘værket’ selv. Værket er ikke en pose af ord eller sætninger eller fakta, det er noget struktureret af forfatteren på en måde, der er unik for den pågældende forfatter. At bryde beholderen, ryste Scrabble-posen med bogstaver og trække en tilfældig udvælgelse (som ikke er helt tilfældig, fordi det er en Scrabble-pose lavet af syntaks og semantik og stil fra den specifikke forfatter), er ikke, hvad der overvejes, når vi giver rettigheder til en udgiver.

“Bogen er den integrerede helhed, der er større end summen af dens dele. Det er produktet af en kreativ åbenbaring (og en masse kreativ intellektuel arbejde), der bragte det hele sammen som en bog, ikke bare ‘en’ bog, men bogen af den pågældende forfatter.”

Bøger indeholder skatte

Når jeg tænker på faglitterære bøger, er det en af fordelene ved AI-æraen at bryde beholderen. Du bryder beholderen, og ligesom Fabergé-æg, er der skatte indeni.

Begrænsningerne ved beholderen er både en fordel og en ulempe. På den ene side “værket er ikke blot en pose af ord eller sætninger eller fakta, det er noget struktureret af forfatteren på en måde, der er unik for den pågældende forfatter.” På den anden side, i skabelsen af beholderen, blev forfatteren, på grund af de iboende begrænsninger af bogbeholderen, tvunget til at reducere, afvise, omskrive og omkonfigurere. Værket er poleret, men det er destilleret, og nogle ting gik tabt (mens andre blev vundet) undervejs.

Folk læser ikke lange faglitterære bøger, delvis fordi de er blevet konditioneret til at skimme alt den tekst, de støder på på nettet—inklusive i deres emails. Selv “bogopsummerings”-modellen fejler—i stedet for en ufordøjelig 250-siders faglitterær bog får du en ufordøjelig 8-siders opsummering af bogen.

Bøger er som madkasser–alt indholdet på ét sted. Men jeg vil kun have småkagerne.

Det bliver ikke nemt for etablerede forfattere at kaste deres lænker. Men de må måske lære at gøre det, eller risikere at blive overskygget af en ny generation af dygtige forskere og forfattere, der kan udtrykke sig med eller uden formelle beholdere, når lejligheden kræver det. Beholdere pålægger alt for mange begrænsninger og begrænsninger.

Det, det kommer ned til, er, at forfatterbranchen uigenkaldeligt har ændret sig. Det er som slutningen på skriverne. I dette tilfælde skal vores munkeforfattere ud fra deres skriveborde og deres containeriserede syn på bogen og engagere sig med formen og deres publikum.

Åh ja, jeg kender godt forfatterens indvendinger: Men jeg er en forfatter, jeg er ikke en promoter. Jeg er ikke på sociale medier. Jeg har ingen interesse i faktisk at kommunikere med mine læsere andet end gennem mit arbejde og med lejlighedsvise emails og stadig sjældnere optrædener. Jeg har en hjemmeside (men, sandt at sige, opdaterer jeg den aldrig). Mit arbejde er min gave til læserne. De kan acceptere mit arbejde eller afvise mit arbejde, men jeg vil ikke slutte mig til dem i deres stuer.

Nå, du kan lægge rullerne og blækket lavet af hermeliners blod væk. Beskæftigelsen som ‘forfatter’ kræver nu, at du kommer væk fra dit skrivebord og møder dine læsere, hvor de bor, i deres stuer og på deres Facebook-sider. Du kan beklage det alt det, du vil, mens vi lukker dine tilskud og dit professorat og dine udgivelsesmuligheder. Dette er den modige nye verden for forfattere og læsere, uden forlagene, de frygtelige mellemmænd, der arbejder hårdt for at forbedre dit arbejde, men konstant afbryder din direkte forbindelse til læserne, de personer, der værdsætter det mest.

Intet af dette forhindrer store narrative faglitterære bøger i at nå et indstillet publikum. Tværtimod. Disse bøger kan fortsætte med at skinne. Der vil stadig være bestseller faglitteratur, selvom økonomien vil vise sig at være umulig for alle undtagen de mest sælgende forfattere. Den nuværende model behøver ikke at forsvinde, for at den nye model kan trives.

Jeg tænker på disse store faglitterære bøger som ‘smukke.’ ‘Smukke’ som i smukt skrevne, omhyggeligt redigerede, designet med omhu og overvejelse og trykt med frynsede kanter på FSC-certificeret papir. De sælges i butikker.

Butikkerne kaldes ‘boghandlere,’ men de har alle karakteristika af boutique detailhandel—dejlige genstande, valgt med omhu af ejeren og lederne, lidt dyre, men for dem, der værdsætter sådanne genstande, er de vel værd prisen.

Opgaven for de fleste faglitterære forfattere er nu at bevæge sig ud over beholderen såvel som forlaget som portvagt.

Indholdsbeholdere i flere medier

Læsepublikummet, især dets yngre medlemmer, er i stigende grad ‘medie-agnostisk.’ På jagt efter underholdning eller viden kan de se en YouTube- eller TikTok-video, en Netflix-serie, lytte på Spotify, rulle gennem Instagram (“Insta”), holde sig opdateret med nyhederne eller, lejlighedsvis, læse en bog.

(Bogkærlig befolkning på BookTok er en værdsat gruppe af influencere, men har en beskeden markedsindflydelse samlet set.)

Alligevel er markedsmodellen stadig fokuseret på den unikke beholder. Forlagsindustrien. Filmindustrien. Tv-industrien. Musikindustrien.

Film er ikke bøger. YouTube-videoer er ikke film. Podcasts er ikke lydbøger.

Disse siloer var ikke en historisk uundgåelighed, men et resultat af en række forretningsbeslutninger truffet af magtfulde organisationer over tid.

Det er ikke svært at forstyrre en forretningsmodel bygget på en enkelt beholder.

For al dens facilitet med sprog, virker den nuværende generation af generativ AI sin magi med endnu mere bravado ved at producere lyde, billeder og video. AI giver denne bog lydbøger på flere sprog sammen med de 31 oversættelser af e-bogen. Intet af dette ville være overhovedet muligt uden AI—økonomien ved traditionel produktion giver ingen mening for mig.

Beholdersiloer

Indholdsskabere er traditionelt uddannet til at udmærke sig i kun en enkelt beholdersilo. Vi har skriveprogrammer og filmprogrammer og musikprogrammer. Det forekommer os sjældent, at kreative forfattere også kunne tage en ‘mindre’ i film eller musik. Eller i computerprogrammering eller i app-udvikling.

Hvad skete der med transmedia? Hvor er programmerne, der lærer kreative at være, som Apple engang formulerede det, “Masters of Digital Media”?

Det bedste indhold vil altid vinde. Men over tid betyder indholdsbeholderne mindre og mindre. Den digitale generation er måske ikke beholder-agnostisk. Men de er beholder-fleksible. De møder det meste af deres indhold digitalt via smartphones. Print vil fortsat finde et publikum, men det vil aldrig igen kommandere centrum.

“Fremtidens udgiver” skal også være beholder-fleksibel. Det meste af væksten i indholdsdistribution sker ikke via blæk på papir eller ord i EPUB-filer. Væksten af lydbøger er ingen tilfældighed, heller ikke populariteten af YouTube og TikTok.

Den større udfordring ligger i nødvendigheden af at gøre nyt og eksisterende indhold opdageligt, uanset dets form, og derefter ved opdagelse at omdanne bevidsthed til en købsbeslutning.

Opdagelse og konvertering

Online opdagelsesproblemet har været med os i nogen tid; AI skabte det ikke. Problemet er et, som brancheveteran Mike Shatzkin har fremhævet mere end én gang. Der er så mange titler tilgængelige i print, og digitale formater tillader dem at forblive kontinuerligt i print. Millioner af udgåede bøger kan findes fra brugte boghandlere. Oven i det udgives der to millioner eller flere nye bøger hvert år, kun på engelsk. AI vil gøre mæthedsproblemet værre, men det er allerede ude af kontrol.

Amazons algoritmer er ikke uselviske—de gør et meget godt stykke arbejde med at fremhæve det, der er salgbar, den bog du sandsynligvis vil købe næste gang. Den bog er ikke kun karakteriseret ved sine salgstal. Den solgte bedst ikke fordi en eller anden svindler optimerede online-listingen. Den solgte bedst fordi den var den bedste, og glade læsere fortalte andre om at købe den, både online og personligt. (Amazon har tilskyndet til annoncering, der forvrænger dets algoritmer, en del af enshittification af platformen.)

Jeg talte ovenfor om metadata. Konvertering er lige så irriterende som opdagelse. Kan AI hjælpe forfattere med at omdanne browsere til købere?

Ophavsrettens fremtid

Begrebet ophavsret er blevet absurd af AI. Det er ikke fordi folk ikke ønsker eller fortjener beskyttelse for deres arbejde - man kan endda argumentere for, at de fortjener det mere end nogensinde. Og det er ikke fordi AI gør ophavsret uigennemførlig (i det mindste i en eller anden form, omend ikke i den nuværende form).

Det er fordi “beskyttelsen af ophavsret” også bliver et slør, bag hvilket dit arbejde forsvinder. Hvis din bog ikke kan refereres via en samtale med ChatGPT, så eksisterer den de facto ikke. AI-virksomhederne vil kun licensere crème de la crème af indhold. De har ikke brug for skummetmælken.

Hvorfor beskytte det, der ikke kan findes?

Dette er, hvor opdagelsesproblemet kan blive en katastrofe. Google gør et godt stykke arbejde med at opdage bøger kun gennem deres metadata. AI vil have hele enchiladaen. I modsætning til traditionelle søgemaskiner reagerer AI ikke på brugerforespørgsler udelukkende baseret på de abstrakte metadata om et værk.

Samtidig antyder skiftende indholdsbeholdere, beholdere andre end hele bøger, forskellige slags ophavsretsudfordringer. Hvis teksten i en bog kan ændre sig løbende som svar på læserinput, hvad er så ophavsretten til teksten?

Forfattere & læsere

Forlag har brug for forfattere; forfattere har ikke brug for forlag.

Forlagets fremtid er det intime forhold mellem forfattere & læsere. Det er langt stærkere end forholdet mellem forfattere og forlag og læsere og forlag. Forlag kan være en hindring i forholdet mellem forfattere & læsere. I mange tilfælde muliggør de ikke forholdet; de hæmmer det.

I lang tid var den eneste måde at få adgang til indhold af høj kvalitet gennem bøger eller via et beskedent udvalg af tidsskrifter. Det er bestemt ikke længere tilfældet. Helt bortset fra distraktionerne fra andre medier, er der nu så mange forskellige måder at få adgang til (ikke-kontaineriseret) indhold af høj kvalitet. Bøger har ikke længere den primære rolle, de engang nød.

AI kan kommunikere

“Hvad er den perfekte bog for mig at læse næste gang?” Generativ AI kan besvare det spørgsmål med en elokvens og præcision, der aldrig før har været mulig. Efterhånden som AI bliver en pålidelig anbefalingsmotor, vil forfattere skulle kommunikere via den motor. (Amazon arbejder naturligvis på dette, og har fordelen af at vide, hvad du tidligere har købt.)

Konklusion

Så hvor efterlader det os?

Jeg følte det nødvendigt at katalogisere de udfordringer, som udgivelse står overfor. Chat AI ankommer på et tidspunkt, hvor handelsudgivelse er i problemer. Det ankommer ikke på et tidspunkt, hvor branchen er robust og i stand til at sige: “vi har ikke brug for noget nyt teknologi; vi klarer os fint.”

Jeg talte ovenfor om de mest presserende udfordringer, som udgivelse står overfor: stigende omkostninger og faldende margener.

Ulvene vil aldrig blive mætte i deres krav om stadig stejlere rabatter; margenerne vil ikke forbedre sig. Detailpriserne er næsten ved et loft. Fremtiden for den nuværende handelsudgivelsesmodel ligger i omkostningsreduktion.

Lønningerne kan ikke blive lavere, så vi bliver nødt til at skære omkostninger inden for produktionscyklussen.

Men forlag har forsøgt at skære produktionsomkostninger i årtier. Der har været nogle bemærkelsesværdige succeser, men vi har udtømt de nuværende muligheder.

Jeg har vist, at AI kan bringe effektivitet til udgivelse på tværs af arbejdsgangen. De er ikke øjeblikkelige, og de er ikke nemme: du skal arbejde med AI. Men muligheden er der.

Forlag ønsker ikke at reducere personalet, så målet må være at få flere bøger hurtigere på markedet baseret på de nuværende personaleressourcer. AI-værktøjer kan fremme det mål.

Og selvfølgelig er der altid målet om at sælge flere eksemplarer af de bøger, der udgives. AI kan også hjælpe der.

Jeg beskriver ovenfor, hvordan AI også kan være transformerende for udgivelsens fremtid.

Bare rolig med det. Få orden i huset, og så taler vi videre.

En enkelt ressource

Der er nu et næsten uendeligt udbud af materiale til rådighed for at informere dig om AI, alt for meget, selvfølgelig. Vælg dit foretrukne medium: bøger, blogs, nyhedsbreve, videoer, podcasts, kurser og psykisk spådom. Jeg har linket til nogle nøglekilder gennem denne bog, det er værd at klikke på nogle tilfældige links for at se, hvor de fører dig hen.

Der er kun en fremragende AI-bog for begyndere, Ethan Mollicks Co-Intelligence, som blev udgivet i begyndelsen af april 2024. Den er hentet fra hans lige så fremragende nyhedsbrev, “One Useful Thing.”

Side note: credentials for writing this book

Jeg ønskede ikke at belaste introduktionen med denne information, men jeg er klar over, at mange mennesker er skeptiske over for folk, der skriver om AI i dag, mistænksomme over, at disse forfattere fremstiller sig selv som nutidens AI-eksperter. Ingen tvivl om, at nogle er. Jeg håber, at jeg har acceptable kvalifikationer til at gennemføre dette projekt.

Jeg læste min første bog om kunstig intelligens i 1988, en bog udgivet to år tidligere, Understanding Computers and Cognition: A New Foundation for Design af Terry Winograd og Fernando Flores. Bogen er tæt—meget af det var uden for min forståelse—men det var første gang, jeg blev begejstret over mulighederne for kunstig intelligens i bogudgivelse.

På det tidspunkt var jeg dybt inde i digitaliseringen af udgivelse, foranlediget af eksplosionen af desktop publishing, Apple-computere, PageMaker og lignende. I 1986 overvågede jeg udviklingen af Page One automatiseret bogudgivelsessoftware, et program, der kunne tage et bogmanuskript som en Microsoft Word-fil og sætte det op til en hel bog på få minutter. Det er meget nemt at gøre i dag; det var ikke nemt dengang.

Jeg fortsatte med at arbejde inden for udgivelsesteknologi derefter, som konsulent og analytiker, og arbejdede med nogle af de førende software- og hardwareleverandører, herunder Adobe, Apple og Microsoft. Jeg blev også involveret i, og medejer af, et softwarefirma kaldet Enfocus. Vi skabte et automatiseret system til prepress-workflows.

Vi havde ikke adgang til AI på det tidspunkt, men vi blev meget gode til at frigøre fuldautomatiske udgivelsesproduktionssystemer. Som AI kan være uadskillelig fra magi, så kan den bedste automatisering også synes at ligne AI.

Spol frem til 2016, og min kollega Cliff Guren hjalp mig med at fokusere på AI i bogudgivelse: det begyndte at se ud, som om der endelig skete noget. The Bestseller Code (Archer og Jockers) dukkede op i september 2016, hvilket gjorde det klart, at computere kunne fortolke tekstur af litteratur med en høj grad af indsigt og præcision.

På det tidspunkt fulgte jeg nøje med i bogudgivelsesstartups, og et lille antal dukkede op med en vis grad af AI-teknologi indarbejdet i deres softwaretilbud.

Spol frem igen til oktober 2022.

Måneder før det blev emnet, alle i udgivelse talte om, præsenterede Tim O’Reilly på PageBreak Conference om “AI og Udgivelsestransformation.” O’Reilly er velkendt i udgivelsesfællesskabet, både for O’Reilly Media og for Tools of Change-konferencen. Han er en af tech-verdenens topvisionære.

O’Reilly var ikke bare entusiastisk omkring de nye fremskridt inden for AI, han var helt oppe at køre. “Vi er på et punkt, der minder meget om, hvordan jeg havde det, da vi opdagede World Wide Web i 1992,” sagde han og fulgte op med “dette er lige så transformerende som VisiCalc, PC’en og webbrowseren.”

Han indrømmede, at brugssagen (på det tidspunkt) stadig var uklar, og pegede på et par pilotprojekter hos O’Reilly Media. Men, sagde han, “dette bliver skræmmende hurtigt bedre. Maskinlæring er ikke længere en fremtidsting. Dette handler om demokratisering af AI.”

O’Reilly talte om, hvordan udgivere bør nærme sig disse nye teknologier, og sagde, at de skal “vide, hvornår de skal brænde bådene og gå all in. Der er et tidspunkt, hvor du er nødt til at forpligte dig.”

ChatGPT blev ikke frigivet før en måned senere. PageBreak var den første udgivelseskonference, der satte det i centrum, via Tims indsigter.

Offentliggørelser

Denne bog har fem sponsorer. Jeg vidste, da jeg skrev bogen, at der ville være få rigdomme at finde, og jeg besluttede at finansiere mine bestræbelser ved at invitere sponsorer til at deltage.

Som jeg angiver på min hjemmeside, arbejder jeg som konsulent, analytiker og som journalist, jeg støtter International Federation of Journalists’ Global Charter of Ethics for Journalists. Afsnit 13 er klar over forpligtelsen til at undgå interessekonflikter eller “enhver forvirring mellem (min) aktivitet og den for reklame eller propaganda.”

At have sponsorer indebærer en interessekonflikt og en forvirring omkring reklame. Hvis jeg arbejdede for New York Times ville det være enkelt: “Nej.” Når jeg arbejder for mig selv, er offentliggørelse mit våben til at opfylde disse forpligtelser: Jeg vil beskrive den modydelse, jeg har modtaget, og du kan bedømme, i mit arbejde, om jeg er blevet kompromitteret.

Jeg valgte de sponsorer, jeg inviterede til dette projekt, fordi jeg ikke kun kendte deres arbejde, men også de personer, der var involveret i deres organisationer. De er kolleger og venner. Jeg fortalte dem, at deres produkter måske ville blive diskuteret i bogens tekst, og at de ikke ville have kontrol over disse ord. Hvad de kunne kontrollere, var deres reklamer i slutningen af bogen - jeg ville poste dem som leveret. Det er, hvad jeg har gjort.

Jeg har modtaget betalinger fra andre, der kan have påvirket mit arbejde på denne bog - jeg kan katalogisere følgende:

  • Jeg har ikke udført noget betalt konsulentarbejde for de AI-leverandører, der er beskrevet i denne bog, inklusive sponsorerne.

  • Jeg modtog nogle overskudsdelingsindtægter fra Publishers Weekly for AI-webinarerne i september 2023.

  • Jeg får betalt en standard sats for mine Publishers Weekly artikler.

Venligst lad mig vide, hvis du opdager nogen favorisering, som du mener kan være resultatet af disse engagementer. Min bias til fordel for AI blev dannet før de store rigdomme strømmede ind.

Tak

Jeg ville ikke være i stand til at tale med nogen troværdighed om AI, hvis det ikke var for støtten fra Publishers Weekly, inklusive den tidligere redaktør, Jim Milliot, og CEO’en, Cevin Bryerman. Jim støttede min tidlige skrivning om AI, og Cevin (sammen med Krista Rafanello og resten af teamet) var instrumentale for succesen af sidste efterårs konference, AI and the Revolution in Book Publishing. Andrew Albanese er nu administrerende redaktør hos PW; Ed Nawotka, en seniorredaktør. Jeg er heldig at arbejde sammen med dem.

Og yderligere tak til adskillige kolleger…

  • Peter Brantley

  • Cliff Guren, mangeårig sparringspartner og indsigtsfuld læser af mine udkast

  • To andre ‘beta’-version læsere, der gav værdifuld feedback: Joe Wikert og Brad Farmer

  • Mine Publishing Technology Partners, Ken Brooks, Bill Kasdorf, Bill Rosenblatt, Bill Trippe, Steve Sieck, og vores nyeste partnere, Lettie Conrad og Linda Secondari.

  • Min søster, Anne Pashley, som hjælper mig med at holde databasen for opstart af udgivelse opdateret, og konstant energiserer mine bestræbelser.

  • Mine partnere i mine månedlige AI-webinarer: Brooke Horn og Brian O’Leary hos BISG.

  • Bill Kasdorf hjalp mig med at dykke ned i tilgængelighedsspørgsmål for min bog.

  • Peter Armstrong og Len Epp hos Leanpub var tålmodige med mine småkneb og hjalp mig gennem processen med at tilbyde det bedst mulige resultat på Leanpub-platformen.

  • Hugo Rayne hos ElevenLabs for lydbogssupport.

  • Min gode ven og pålidelige detektor af mine skrive- og ræsonneringsfejl, Bob McArthur.

Appendix: Udforskning af traditionelle udgivelsers resterende fordele

Den prestige ved traditionel udgivelse er grunden til, at de fleste af os gik ind i branchen. Vi voksede op med at elske bøger, studerede engelsk eller noget lignende på universitetet, prøvede forskellige ting, måske fik et job i en boghandel, måske en Master of Publishing-certifikat, arbejdede derefter som praktikant hos et udgivelsesfirma, og her er vi i dag. Du elsker dit job, selvom lønnen er elendig, og arbejdsvilkårene ikke altid er behagelige.

Den samme prestige nærer udgivelseskæden. På input-siden af forsyningskæden: det betyder meget for mange forfattere. Vi ser det hele tiden. Økonomien i traditionel udgivelse giver ingen mening, og det tager fire gange så lang tid at komme i trykken, men måske, bare måske, vil jeg være den næste debutvinder, ligesom Delia Owens (Hvor flodkrebs synger) eller anden gang megastjerne, Amor Towles (En gentleman i Moskva).

Det er som Vegas: bortset fra at oddsene er bedre i Nevada. Spil på et enkelt nummer i roulette, og oddsene imod dig er 36 til 1. Spil på traditionel udgivelse, og oddsene imod dig er… langt værre.

Oddsene for at få en kontrakt med nogen af de traditionelle forlag, endda et af de store 5, er ringe. Men det er det mindste af en forfatters problem. Det er faktisk at finde læsere, der er den store udfordring.

En ting, der kan hjælpe, er at lande en plads på en bestsellerliste.

Lad os overveje PRH, Penguin Random House. Virksomheden udgiver kun 15.000 nye titler hvert år. I 2021 lykkedes det dem at få 196 bøger på Publishers Weekly’s bestsellerliste. Som den linkede artikel fremhæver: “PW udgiver fire voksen bestsellerlister, hver med 20 titler: hardcover fiktion, hardcover non-fiktion, trade paperback, og mass market paperback. Det betyder, at der over et år er 2.080 hardcover positioner på vores lister og 2.080 paperback positioner.

Ikke alle bestsellere var nyudgivelser det år—lad os gætte generøst, at 90% var, 1870 pladser.

I mellemtiden har The New York Times 15 bestsellerpladser pr. uge for hver kategori af bog (fiktion, non-fiktion, børnebøger; separate lister for YA og how-to; hardcover adskilt fra paperback, plus kombinerede lister). For en individuel forfatter betyder det 780 tilgængelige pladser pr. år, selvom de fleste af disse pladser er fyldt med gentagne sælgere. (The Body Keeps the Score af Bessel van der Kolk har været på paperback-listen i fem og et halvt år!) Så lad os dele det i to, 390 tilgængelige pladser. Du skal sælge mange bøger for at få fat i en af dem.

Hvad med dækning i New York Times Book Review? I 2016 påstod Pamela Paul, dengang redaktør af Review, atThe Book Review hos Times anmelder omkring 1% af de bøger, der udkommer i et givet år.” Klart mener hun 1% af bøgerne fra de største forlag—hun kan ikke tænke på små forlag eller selvudgivne forfattere. Og så bliver måske 150 af PRH’s 15.000 nye titler anmeldt hvert år.

De fleste observatører er enige om, at mens opmærksomhed fra topmedier stadig er vigtig, og kan være magtfuld, er indflydelsen af anmeldelser ikke, hvad den engang var, hvis ikke af nogen anden grund, at færre boglæsere interagerer med de store anmeldelsessteder.

Lad os vende vores opmærksomhed mod forsyningskæden nedstrøms, mod distribution. Mens forlagsmærker bærer vægt med forfattere, har det altid været en sandhed, at, i modsætning til mange forbrugsvarer, bærer forlagsmærker næsten ingen vægt med bogkøbere og læsere. Men de bærer meget vægt med distributører og boghandlere. Dette afspejler den historiske business-to-business karakter af forlagsvirksomhed (snarere end B2C—til forbrugere). Forlags cachet spredes via distributions- og detailkanaler: Barnes & Noble bærer en bog, fordi den er fra PRH, og placerer den derefter foran købernes ansigter; således spredes cachet til læserne.

Sponsorer

Et banner der siger 'BOOK ADVISORS LLC Transaktionsservices og rådgivning for forlag'.

David Lamb og Susan Reich dannede Book Advisors LLC i 2016 for at rådgive om fusioner og opkøb i forlagsbranchen. Vi har gennemført mere end et dusin transaktioner samt en række finansielle, distributions- og operationelle rådgivningsprojekter, herunder vurderinger til markedspris. Vi er glade for for nylig at have arbejdet i samarbejde med Clarke & Esposito; Thad McIlroy fra The Future of Publishing; og Kuo-Yu Liang fra Ku Worldwide.

Vi er stolte af vores relationer, omhu og diskretion. Uanset om du er interesseret i at købe, sælge, finansiere eller rådgive, så kontakt os for en fortrolig samtale.

bookadvisorsllc.com | bookadvisors@gmail.com

En 3x2 gitter med bannere: Et banner, der annoncerer, at Papercutz er blevet opkøbt af Mad Cave Studios i august 2022, i samarbejde med Ku Worldwide LLC; Et banner, der annoncerer, at DAW Books er blevet opkøbt af Astra Publishing House i juli 2022, i samarbejde med Ku Worldwide LLC; Et banner, der annoncerer, at Caslon Publishing er blevet opkøbt af Brookes Publishing Co. i april 2022, i samarbejde med Thad McIlroy; Et banner, der annoncerer, at B.E.S. Publishing er blevet opkøbt af Sourcebooks i november 2021; Et banner, der annoncerer, at Applewood Books er blevet opkøbt af Arcadia Publishing i april 2023; Et banner, der annoncerer, at Erewhon Books er blevet opkøbt af Kensington Publishing i oktober 2022
Logo af Firebrand Technologies og NetGalley.

Firebrand Technologies er en software- og servicevirksomhed, der i mere end 35 år har hjulpet bogudgivere med data- og arbejdsgangsstyringsløsninger.

NetGalley er en online platform, der forbinder udgivere og forfattere med anmeldere, bibliotekarer, boghandlere, medier og undervisere, som opdager nye bøger på NetGalley og anbefaler dem til deres publikum.

Som udviklere af software og digitale løsninger er Firebrand Technologies og NetGalley også brancheeksperter og aktive medlemmer af udgivermiljøet. Vores løsninger gavner alle aspekter af udgivelsesprocessen, fra erhvervelse til salg og markedsføring.

  • NetGalley hjælper udgivere med at skabe buzz om titler, modtage hurtig feedback og anmeldelser samt opdage tidlige trends.

  • Title Management Enterprise sammen med dens kompakte version, Title Management Lite, er Firebrands kerne softwareapplikation, der tilbyder avanceret arbejdsgangsstyring i hele udgivelsesprocessen.

  • Eloquence on Demand er udgivelsesindustriens mest kraftfulde ONIX distribution platform, der distribuerer metadata og digitale aktiver til over 600 handelspartnere i ONIX og andre formater.

  • Flywheel er en backlist markedsføringstjeneste, der identificerer skjulte muligheder i backlisten for øget synlighed og salg.

  • Eloquence on Alert overvåger live titeldata og trends på markedet og advarer udgivere om kritiske fejl og muligheder, der kan påvirke salget (manglende købsknapper, tredjepartssælgere osv.).

  • FlightDeck er det mest avancerede EPUB validerings- og testværktøj, der findes.

En infografik, der viser forskellige tjenester, der tilbydes af NetGalley, herunder bogfremme, arbejdsgangsstyring i udgivelse, metadata-distribution, salg og backlist markedsføring samt EPUB testning.
Banner for Perfect Bound, et markedsplads, der forbinder udgivere med trykkerier verden over.

Velkommen til en bedre måde at trykke bøger på.

Perfect Bound blev oprettet i 2022 for at hjælpe med at løse de forsyningskædeproblemer, der har plaget bogudgivelsesindustrien i årevis. Perioder med overskydende kapacitet hos trykkerierne efterfølges af korte perioder med forsinkelser på grund af forsyningsproblemer. Perfect Bound søger at åbne trykmarkedet for uafhængige udgivere og forfattere ved at lade trykkerier fra hele verden nemt forbinde og handle med udgivere, der søger nye og dynamiske leverandører.

Hvad er Perfect Bound?

Perfect Bound er en tosidet markedsplads, der forbinder uafhængige bogudgivere med trykkerier i USA, Canada, Colombia, Brasilien, Tyrkiet, Kina, Malaysia, Indien og mere.

Illustration af en trykpresse med forskellige typer bøger og publikationer, der bliver produceret.

Opdag nye udgivelsespartnere med et klik

Vores robuste platform giver dig mulighed for nemt at oprette produkt tilbud, sende anmodninger til hundreder af trykkerier med et enkelt klik, forhandle og færdiggøre dine trykopgaver og spore produkter fra trykpressen til lageret. Som trykker har det aldrig været nemmere eller mere sikkert at forbinde med nye udgivere, byde på kommende projekter og få betaling.

Forbind dig med nye udgivelsespartnere øjeblikkeligt

  • Send og modtag trykanmodninger fra hele verden

  • Udfør og spore trykopgaver fra trykpressen til lageret

  • Transact problemfrit ved hjælp af ACH-betalinger gennem Stripe uden at forlade platformen

En annonce for Shimmr, der viser automatiseret reklame, der sælger bøger, og nævner en 35% stigning i salg og 2x bedre afkast på annonceudgifter.
En annonce for Shimmr med eksempler på annoncer, prisoplysninger og en QR-kode til at booke en demo.

Mød Insight, en AI-platform bygget specielt til udgivere

Et nærbillede af en person, der holder en åben bog med lysende elementer, der udspringer fra siderne.

“At adoptere Insight for vores forlag var som at skifte en cykel ud med en Ferrari. Pludselig går alt hurtigere.”

—-Tysk børnebogsforlag og Insight-kunde

Arbejd smartere, opnå mere

Udviklet af Veristage, giver Insight forlæggere mulighed for at trives i det udviklende AI-landskab. Ved hjælp af AI og en robust pakke af digitale værktøjer analyserer og forstår Insight dine dokumenter og bøger for at hjælpe dig med at:

  • Oprette, forbedre og opdatere metadata

  • Fremskynde oprettelsen af titelspecifik markedsføring, offentlighed og salgsmaterialer

  • Identificere og evaluere en bogs nøglebudskaber, unikke salgsargumenter, målgruppe, sammenlignelige titler og mere

  • Optimere din marketing- og salgsindhold for maksimal rækkevidde, engagement og øget salg

I modsætning til generiske AI-platforme er Insight udviklet til at fungere inden for forlagsarbejdsgange og hjælpe dig med at skabe forlagsspecifik information og aktiver.

Sådan fungerer det

  1. Upload din bog til Insight-platformen

  2. Insights AI-værktøjer analyserer og forstår din bog

  3. På få minutter genererer Insight en bred vifte af metadata og nøgleinformation om din bog til redaktion, markedsføring, offentlighed, salg og rettighedsafdelinger

  4. Indtast manuelle redigeringer af nogen af disse oplysninger direkte på platformen. Din bog og AI-indhold gemmes inden for Insight, så du kan få adgang til det når som helst.

  5. Brug vores dokumentbevidste AI Chat til at optimere dine titeloplysninger, interagere med dine bøger og inkorporere bogdetaljer i kommunikation og andet materiale

Sikkerhed og Ophavsret

Veristage-teamet er forpligtet til at levere AI-tjenester, der er sikre og beskytter forlæggeres intellektuelle ejendom. Vores platform har avancerede informationssikkerhedssystemer på plads, og vi arbejder kun med AI-modeller, der ikke gemmer eller bruger dine data til at træne fremtidige modeller.

Løsninger til forlæggere af alle størrelser

Insight er designet til at fungere for forlæggere af alle former og størrelser, fra forbruger- til akademiske forlag, fra tre-personers teams til multinationale organisationer. Vi tilbyder konkurrencedygtige priser og skalerbare løsninger.

Tal med os for at finde ud af, hvordan Insight kan gavne din virksomhed:

Veristage logo i blå med et abstrakt design.