AI-revolusjonen innen bokutgivelse (Norsk Utgave)
AI-revolusjonen innen bokutgivelse (Norsk Utgave)
Thad McIlroy
Buy on Leanpub

Innhold

Introduksjon

“Den neste revolusjonen vil overraske oss alle, som de alltid gjør. Sagt på en annen måte: hvis folkemengden forventer revolusjonen, kan det ikke være revolusjonen.” —Doc Searls, 2002

Det har gått over ett og et halvt år siden OpenAI introduserte ChatGPT til en offentlighet som stort sett var ukjent med kunstig intelligens. I starten så det ut til å ikke ha noen åpenbar relevans for bokutgivelser. Siden da har alt forandret seg. Og ingenting har forandret seg. Forlagene begynner å utforske de nye AI-verktøyene, undersøker grensene, og engasjerer seg i forsiktige samtaler med ChatGPT. Men det er ingen tegn til en ekte revolusjon i praksisen med utgivelse; det er bare for tidlig.

Det er en overflod av usikkerhet rundt AI i skriving og utgivelse. Store kontroverser omgir bruken av AI. Likevel er mange begeistret for mulighetene.

Jeg vil fokusere mer på løftene enn på farene, men jeg inkluderer en oversikt over bekymringene og risikoene rundt AI, spesielt slik de gjelder forfattere og forlag. Jeg prøver ikke å bagatellisere bekymringene. De er bare ikke det denne boken handler om.

Er det en bok?

Jeg anser denne publikasjonen for å være mer et ‘hefte’ enn en bok. UNESCOs definisjon av en bok er “minst 49 sider” (hvorfor ikke 50?), og med 300 ord per side, kan denne mislykkes i å kvalifisere. Men, viktigere, det er ikke ment å være det endelige ordet om noe—det er mer en fremdriftsrapport. Kunstig intelligens, og dens rolle i bokutgivelse, endrer seg i et halsbrekkende tempo, som ikke viser noen tegn til å sakke ned. Så denne boken(hefte), denne rapporten, er bare et øyeblikksbilde.

Ved å bruke Leanpub-plattformen, har jeg utgitt min forskning og analyse som et arbeid under utvikling—det revideres som et levende dokument. Jeg har aldri forsøkt dette før. Mine grunner er to-delte: å tilby noe nyttig på kort sikt, og å ha muligheten til å revidere det etter behov. AI-historien er langt fra over.

Jeg håper min tilnærming vil vise seg nyttig for leserne, selv om jeg er klar over at for mange oppdateringer snart kan bli irriterende. Jeg har prøvd å redusere aktualiteten til denne boken, for å redusere fokuset på det som kommer til å endre seg raskest.

Versjonen som har vært (stille) tilgjengelig siden april 2024 merket jeg som “75% fullført” og ble tilbudt gratis til leserne. 23. juli er den offisielle utgivelsesdatoen for den “100% fullførte” versjonen, som også vil finne sin vei inn i større distribusjon utenfor Leanpub. Jeg vil fortsette å oppdatere 100%-versjonen: men de oppdateringene vil kun være tilgjengelige for Leanpub-kjøpere—det er tungvint å stadig oppdatere trykte bøker, e-bøker og lydbøker som er i bredere distribusjon.

Forlagsproblemer med AI selv

Jeg hører daglig om smerten som folk i forlagsbransjen står overfor når de prøver å forstå AI. Hvorfor er det så smertefullt? Her er tre grunner jeg ser:

  • Teknologien er kompleks og mystisk, for kompleks for ikke-forskere å forstå. (Det er en fascinerende studie som foreslår en “AI-angst-skala (AIAS)” som måler 21 forskjellige grunner til at folk er engstelige for AI.)

  • AI har blitt svært kontroversielt i forlagsbransjen, hovedsakelig på grunn av opphavsrettsproblemer som slår til kjernen av forfatterskap og utgivelse.

  • Likevel er det også en atmosfære av FOMO—frykt for å gå glipp av noe. Til tross for AIs mange feil, som med mange fristende teknologier (Apple-klokken? Smarte høyttalere?), står vi overfor den gnagende følelsen: hva om jeg går glipp av den neste virkelig store tingen, som jeg gjorde med et par av de siste virkelig store tingene. Jeg følte meg dum da; jeg vil ikke føle meg dum igjen. Det gjør vondt.

Greit: Det gir mening at folk i forlagsbransjen føler AI-smerte.

Så hva er bruksområdet for denne boken?

Bruksområdet er at du jobber i bokutgivelse, eller du er en forfatter som prøver å forstå bokutgivelse bedre, og du er lei av å føle deg dum og forvirret rundt AI. For mange av dine kolleger ser ut til å forstå det bedre enn deg, og du er lei av å ikke kunne delta intelligent i samtalen.

Mitt mål for leserne er at de ved slutten av denne boken vil føle seg i stand til å delta i samtalen, til å uttrykke en informert mening. Jeg vil at du skal føle deg rustet til å ta personlige valg rundt teknologien, og ha en vei for å lære hvordan du bruker AI, hvis du velger å gjøre det.

Jeg vil ikke oversvømme leserne med masse bla-bla om grunnlaget for AI-teknologi—jeg skal ikke snakke mye om AI i det abstrakte. I stedet vil jeg gi deg en innføring i AI spesifikt for bokskriving og publisering. Hvis noen spør deg, hva betyr naturlig språkbehandling egentlig, kan du svare, som jeg gjør: Jeg er ikke en AI-ekspert. Men jeg vet hvordan AI brukes i min bransje.

Vil det være akkurat det du trenger å vite?

Jeg misliker uttrykket “det du trenger å vite” fordi det så sjelden lever opp til forventningene, ofte bommer det helt, enten mye mer enn du trenger å vite, eller mye mindre. Vil jeg klare å treffe riktig? Jeg er seriøs om å forsøke å formidle minimumet. Jeg tror jeg vet hva forlag trenger å vite om AI, da jeg har snakket med mange av dem, mens jeg har arrangert seminarer og webinarer som er designet veldig spesifikt for å gi bare det grunnleggende.

An icon of a key

I stedet for å gjenta uttrykket “det du trenger å vite” hele tiden, vil jeg bruke et nøkkelsymbol med noe innrykket tekst.

Etter oppsummeringene som innleder mange avsnitt, vil jeg utdype hovedkonseptene. Jeg har også holdt disse så korte som mulig, selv om jeg av og til går litt videre.

En kortform jeg kommer til å bruke er “Chat AI.” Da OpenAI først lanserte ChatGPT, var det den eneste aktøren, men nå er det flere viktige konkurrenter. Jeg vil gå inn på detaljene snart, men du har sikkert hørt om noen av dem allerede, åpenbart Google og Microsoft. De (og flere andre selskaper) tilbyr nå online AI-chatprogramvare som ligner på ChatGPT. Så i stedet for å si “ChatGPT og dets konkurrenter” vil jeg bare referere til hele kategorien som “Chat AI.” Hvis jeg skriver “ChatGPT” refererer jeg spesifikt til OpenAIs programvare.

Boken er mest praktisk, men i den siste delen legger jeg fram et essay om hva som kan være de reelle konsekvensene av AI på bokbransjen, sammen med noen andre spekulative betraktninger.

Hvem er denne boken for?

Den primære målgruppen for denne boken er forbrukerbokforlag. Den sekundære målgruppen er alle andre bokforlag (akademiske, pedagogiske…) i den grad det er overlappinger i disse bransjesektorene. Min tredje målgruppe er forfattere med en interesse i dette, og de mange andre som er fascinerte av bokpublisering.

Undertittelen sier at dette er en guide til AI for både forfattere og forleggere. Delvis er det fordi jeg vil at forleggere også skal forstå hva forfattere gjør med denne teknologien. Jeg synes det er viktig. På sitt nylige årsmøte, BISG (Book Industry Study Group), som for det meste representerer forbrukerforlag, antydet at “det ser etter å trekke fra en bredere pool inkludert litterære agenter og forfattere.” Det er et velkomment trekk.

Jeg vil at forfattere skal lese denne boken, fordi den kan hjelpe dem å forstå hva forleggere gjør med manuskriptene deres. Selvpubliserte forfattere holder alltid et øye med tradisjonell publisering, delvis fordi de de facto er forleggere selv, og derfor kan AI-teknologi som interesserer forlag også være interessant for dem.

Men, gjør ingen feil, dette er ikke en praktisk håndbok for forfattere om å bruke AI for å bli bedre og mer produktive skribenter. Det finnes mange bøker om det emnet (dessverre, mange av dem bare svindel på Amazon). Og mange YouTube-videoer (av varierende kvalitet).

Innen forbrukerbokpublisering er min ideelle leser ikke nødvendigvis en beslutningstaker, men en av de mange som jobber i bransjen hver dag, skaper bøker og finner lesere. Jeg vil snakke om alle de viktige funksjonene i forlagsbransjen i denne boken, fra redaksjon til salg og distribusjon. Og om samspillet mellom forfattere og lesere.

Selv om jeg vokste opp i Canada, og begynte min forlagskarriere der, er jeg basert i San Francisco, i USA, og derfor tenker jeg automatisk på den amerikanske forlagsbransjen. Men nesten alt i denne boken skal være like relevant for en forlegger på Madagaskar som for en forlegger på Manhattan. Mens forleggere i mindre land møter utfordringer med skala, gjør også små forleggere i Amerika det, og denne boken er ment for selskaper av alle størrelser.

Når jeg snakker med små forleggere om AI, og når jeg snakker med veldig store forleggere om AI, er den store forskjellen jeg merker begrepet forlags ‘virksomhet.’ De største forlagene er ofte en del av (eller tilstøtende til) offentlige selskaper, og når du først er et offentlig selskap, blir spørsmål rundt omdømme og sikkerhet så mye større enn de gjør for en hverdagsforlegger, som ikke er ansvarlig på samme måte overfor aksjonærer og nyhetsmedier. Mens en redaktør hos et av de fem store forlagene har samme bruk for AI-verktøy som en frilansredaktør som jobber for mindre selskaper, er konteksten de bruker verktøyene i ganske forskjellig.

Hvor mye trenger du å vite om AI for å lese denne boken?

Jeg antar at mitt publikum har omtrent null kunnskap om AI’s indre, men at de er smarte lesere. Så jeg vil balansere mellom null kunnskap og å ikke snakke ned til leseren.

Jeg forestiller meg at nesten alle har hørt om den nye generasjonen av AI: en YouGov-undersøkelse i mars 2024 antyder at bare 7% av amerikanerne vet “ingenting i det hele tatt” om AI. Forfattere og utgivere har nesten helt sikkert hørt om noen av opphavsrettsklagene, men har sannsynligvis ikke forståelse for problemene. Så jeg trenger ikke å forklare at AI står for “Kunstig Intelligens”. Men jeg vil ikke anta at leserne kan definere hva AI er, hva det betyr, dets potensielle innvirkning, og så videre. Det er derfor du er her.

Tilgjengelighet, både bredt og spesifikt

Min mantra for utgivelsen av denne boken er ‘tilgjengelighet.’

For de fleste betyr det bare noe som ligner på ‘tilgjengelighet’, og faktisk har jeg til hensikt å gjøre denne boken tilgjengelig i så mange former og formater som jeg kan forestille meg. Jeg vil utvide beholderen. Jeg prøver å gjøre min bok til en eksemplarisk publikasjon, som fremhever hele spekteret av hva som kan oppnås i dag når man publiserer en enkelt bok.

På Leanpub vil du finne boken tilgjengelig som en PDF-fil, en EPUB-fil og som en gratis nettbasert publikasjon. Du vil finne oversettelser til 31 språk, inkludert de store asiatiske og europeiske språkene. Det vil være flere lydbøker på de viktigste språkene.

Jeg vil også gjøre boken tilgjengelig, i trykte og digitale formater, på alle e-handelsplattformer som kan nås via Ingram og Amazon. Det inkluderer de fleste bokhandelsnettstedene, i store deler av verden. På denne måten vil biblioteker også kunne kjøpe boken, selv om de forståelig nok har begrenset plass for selvpubliserte verk. (Jeg vil donere trykte og digitale kopier til ethvert bibliotek i verden som ber om dem.)

Foruten den gratis nettversjonen av hele boken, vil jeg lage gratis utdrag, en Q&A, og infografikk, for de som bare vil smake, eller prøve. De vil være tilgjengelige via min blogg.

Det gir ikke mening å spille inn en video av hele boken, når lydbøker er tilgjengelige. Men noen foretrekker å få tilgang til innhold via video. Så jeg vil tilby forkortede videoversjoner, i flere lengder.

Og hva med den menneskelige kontakten? Jeg vil også være tilgjengelig via webinarer eller en-til-en online konsultasjoner, via mitt nettsted og blogg. Jeg kan til og med leies til å møte personlig!

‘Tilgjengelighet’ betyr mye mer enn dens ordbokdefinisjon. Som folkene hos Canadian National Network for Equitable Library Service (NNELS) uttrykker det, “En tilgjengelig bok er en som kan brukes og forstås av alle.” Og derfor oppfyller min engelske EPUB-fil W3C 1.1 anbefalingen for trykkefunksjonshemmede, inkludert robuste alt tekst beskrivelser for bilder. Vi forventer å oppfylle denne tilgjengelighetsstandarden for oversettelsene til fremmedspråk også.

Alt-teksten ble laget med ChatGPT. Jeg redigerte ikke ChatGPTs versjon, slik at alle som leser EPUB-filen kan se hvor god den er, og hvor den fortsatt mangler. Som min kollega, Bill Kasdorf, minner meg om, god alt-tekst beskriver hva en seende leser får ut av et bilde, ikke bare hva det ser ut til å være.

For bokutgivere er tilgjengelighet ikke lenger et alternativ: det er en standardinnstilling.

(Jeg har to mea culpas å dele: På grunn av begrensninger innenfor publiseringsplattformene, vil den standard PDF-filen dessverre ikke oppfylle PDF/UA-spesifikasjonen, og jeg vil heller ikke kunne tilby en stor skriftversjon av boken på e-handelsnettsteder. Men begge er tilgjengelige på forespørsel.)

Litt husarbeid

Som indikert, er denne boken (relativt) kort. Når du kaller et kort dokument ‘en bok’ risikerer du at kjøpere protesterer, “Jeg trodde jeg kjøpte en bok, men den er bare 50 sider lang!” Jeg har gjort alt jeg kan for å gjøre det klart på salgssiden at dette ikke er en fullengdes bok, men hvis du er skuffet, husk at Leanpub tilbyr en 60-dagers pengene-tilbake-garanti, og jeg vil gjerne utvide det refusjonstilbudet til ‘for alltid.’ Jeg vil at leserne skal være fornøyde, ikke skuffede. (Hvis du kjøpte boken på en annen plattform, send meg en e-post: jeg sender en sjekk!)

Boken er sterkt hyperlenket (disse vises på forskjellige måter i forskjellige formater, men ofte som fotnoter). Jeg har alltid trodd på å lenke til originale kilder i mitt arbeid, slik at leserne kan verifisere mine noen ganger store påstander. Men jeg er klar over at hyperlenker og fotnoter kan være distraherende, spesielt hvis du bruker en e-leserenhet. Jeg beklager det. Det beste er å ignorere lenkene mens du leser, og gå tilbake til dem hvis du vil dykke dypere inn i et emne.

Jeg vet ikke i hvilket format du leser (eller lytter til) akkurat nå. Heller ikke på hvilket språk. Jeg har forsøkt å gjøre “ergonomien” til boken så brukervennlig som mulig, men lenker og fotnoter er ikke alltid optimale fra det perspektivet.

Denne boken har sponsorer, noe jeg vet er uvanlig for ‘en bok.’ Jeg forklarer hvordan sponsoratet fungerer i min ‘avsløringer’ seksjon på slutten av teksten.

Hvorfor AI nå?

An icon of a key

Når jeg snakker med forleggere hører jeg om presserende, umiddelbare bekymringer. Og AI er vanligvis ikke en av dem.

De økende kostnadene for trykkproduksjon har vært plagsomme i flere år, selv om det nå ser ut til å stabilisere seg. Økte distribusjonskostnader er utfordrende for alle aktører. Disse fører til pristrykk—det er bevis på at lesere begynner å irritere seg over dagens priser for nye innbundne bøker og papirbacks. Jeg klassifiserer disse som ‘analoge’ problemer—digitale teknologier bringer lite til bordet for å adressere dem.

Så er det de bredere ‘eksistensielle’ problemene som er av stadig økende bekymring, men de er uformelige spørsmål, uten åpenbare løsninger. Inkludert her er:

  • Innholdsoppdagelse og publikumsengasjement via nettet og sosiale medier.

  • Endrede forbrukeratferd og lesevaner.

  • Konkurranse fra andre digitale medier.

Jeg tror at AI kunne være enormt nyttig for forleggere på disse områdene, men metodene er ikke åpenbare og vil ta tid å implementere. Jeg vil beskrive dette i senere kapitler av boken.

AI: Komme i gang

Før jeg går inn på den kjedelige tekniske bakgrunnen, inviterer jeg deg til bare å hoppe rett inn i online-programvaren. De beste verktøyene er gratis å leke med. Det er ChatGPT. Og Claude.ai. Du kan prøve Microsoft Copilot. Eller prøve Googles Gemini.

Det er slik de fleste begynner med AI—jeg vedder på at du allerede har prøvd en eller flere av disse lekene. Jeg vedder også på at du ikke har prøvd dem særlig lenge. De fleste jeg snakker med bruker bare noen få minutter. De prøver noen spørsmål, får tilbake noen ganske åpenbare svar, og så går de videre.

Feil tilnærming.

Jeg er enig med Ethan Mollick, hvis arbeid jeg vil beskrive flere ganger i denne boken. I sin blogg og i et nylig intervju, snakker Mollick om sin ‘10-timers regel’:

“Jeg vil påpeke at 10 timer er like vilkårlig som 10 000 skritt. Det er ingen vitenskapelig basis for det. Dette er en observasjon. Men det flytter deg også forbi, jeg pirket på dette en kveld, og det flytter deg mot å bruke dette på en seriøs måte. Jeg vet ikke om 10 timer er den virkelige grensen, men det ser ut til å være noe transformerende. Nøkkelen er å bruke det på et område der du har ekspertise, slik at du kan forstå hva det er godt eller dårlig på, kan lære formen på dets kapasiteter.”

En annen kommentator, som vurderte Mollicks siste bok om AI, påpekte en like sann ‘regel om ti’: “En time med eksperimentering med disse verktøyene er verdt ti timer med å lese om dem.”

Du forstår poenget. Dette handler om å gjøre, ikke fundere. Min bok er en fundering. Du må skitne til hendene dine.

AI: En veldig kort historikk

An icon of a key

Inntil et par år siden hørte den gjennomsnittlige personen bare om AI som en abstraksjon, enten som science fiction eller som noe som kunne slå en stormester i sjakk eller Go. Plutselig er AI overalt, og skaper det falske inntrykket av at det er nytt. Selv det nye er ikke akkurat nytt. Men det er et irrelevant poeng. AI betydde lite for bokutgivelse før ChatGPT. Nå betyr det mye.

Å forstå den omtrent 70 år lange utviklingen av AI kan være fascinerende, men det er på ingen måte nødvendig for å sette pris på hva som skjer i dag.

Our World In Data gjør en god jobb med å kort registrere historien—jeg overlater det til dem.

Den nåværende generasjonen av AI ble utviklet for det meste i løpet av det siste tiåret. Så, plutselig, dukket ChatGPT opp den 30. november 2022. To måneder senere hadde det 100 millioner månedlige brukere, det raskeste noen teknologi noensinne har beveget seg inn i forbrukermarkedet (til sammenligning tok det over to år for Facebook å nå 100 millioner brukere).

Hvorfor den raske adopsjonen? For det første er det fascinerende og morsomt. For det andre er det gratis. For det tredje trenger du ikke å kjøpe en ny enhet for å bruke det. Og for det fjerde trenger du ingen opplæring for å få tilgang til ChatGPT (eller dets chat-AI-konkurrenter). Men de samme faktorene gjaldt også for Facebook, så hvorfor ChatGPT?

Som Arthur C. Clarke berømt bemerket, “Enhver tilstrekkelig avansert teknologi er uatskillelig fra magi.” Chat-AI er magi. Opplevelsen av å ‘snakke’ i hverdagslig språk med en maskin… det er magisk. Opplevelsen av å si “Jeg vil ha et bilde av en bok i en ballong i en sky nær solen,” og, sekunder senere,

En åpen bok med en varmluftsballong som stiger opp fra sidene, svevende blant skyene.

… også magisk. GPT-genererte bilder begynner å se like ut i stil, fargerike og fantasifulle. Så jeg sendte en annen prompt “nå i en stil som ser ut som en illustrasjon fra 1400-tallet.” Og så:

En kunstnerisk illustrasjon av en varmluftsballong med intrikate mønstre, svevende blant skyer med en sol i bakgrunnen.

Hvis jeg vil ha en video av en bok i en ballong i en sky nær solen, finnes det over et dusin verktøy å velge mellom, og presto. Og et musikalsk lydspor til å følge videoen. Vel, hvordan høres dette ut? Det er akkurat som magi.

For frykt for å virke nedsettende overfor AI’s ekstraordinære evner ved å relegere det til kategorien av uforklarlig “magi”, er det morsomt å lære at mange av forskerne som er ansvarlige for den nåværende generasjonen av AI innrømmer at de egentlig ikke forstår nøyaktig hvordan det fungerer. Som en rapport i en nylig utgave av MIT Technology Review bemerket, “for all sin enorme suksess, vet ingen nøyaktig hvordan—-eller hvorfor—-det fungerer.” Spennende, men litt skummelt.

Forstå AI og noen viktige begreper

An icon of a key

AI kommer med en mengde teknologi og terminologi, mye av det uforståelig for alle unntatt dataforskere. Brukere av chat-AI krever ikke en inngående kunnskap om AI-terminologi eller de tekniske konseptene som er involvert. Systemets samtalenatur tillater intuitive interaksjoner uten spesialisert bakgrunnskunnskap om hvordan ting fungerer. Å fokusere på hva chat-AI faktisk kan gjøre er viktigere.

I forberedelsen av denne boken har jeg slitt med hva som er ‘ansvarlig’ for meg å gjøre som forfatter av en bok om AI. Den konvensjonelle tilnærmingen er å gi en kort forklaring av vitenskapen og en gjennomgang av ofte brukte termer.

Jeg kommer ikke til å gjøre det.

Jeg vil her tilby noen eksterne lenker til det jeg synes er noen rimelig forståelige korte beskrivelser av AI-grunnleggende.

Hva er fremtiden for AI?: McKinsey & Co. (april, 2024) har en god sett med forklaringer.

Likeledes er Gartners Generativ AI (udatert) ikke dårlig.

Futurepedia tilbyr en ikke-dårlig oppsummering av AI Fundamentals (mai, 2024)

Etter å ha fjernet hvordan-til, skal jeg nå introdusere noen termer som jeg tror er verdifulle å forstå. Ikke fordi du trenger å vite dem for å bruke programvaren. Bare at dette settet med termer refererer til noen nøkkelaspekter av hvordan den nåværende generasjonen av AI faktisk fungerer.

Min brukssak for å takle disse termene og konseptene er forfattere og utgivere som (i) ønsker å gå et nivå dypere på AI, av en eller annen grunn, eller (ii) ønsker å forstå konteksten til den nåværende kritikken av AI, eller (iii) ønsker å bidra til strategiske diskusjoner om hvordan deres kolleger eller organisasjoner bør nærme seg AI.

Med andre ord, dette er ikke hva du trenger å vite, men heller hva du kanskje vil vite. Her er de, i ikke-alfabetisk rekkefølge:

Spørsmål og spørsmålstilling

Du kan åpne Chat AI-programvare og bare skrive inn et spørsmål, omtrent som du gjør i dag på Google.

Stor språkmodell (LLM)

Store språkmodeller fungerer ved å analysere enorme mengder (for det meste) skriftlig materiale, noe som gjør at de kan forutsi hvilke ord eller setninger som bør komme neste i en samtale eller et stykke skrift. De ‘forstår’ ikke språk i menneskelig forstand, men behandler tekst ved å bryte det ned i mindre biter (kalt tokens), og deretter konvertere tokens til tall. De behandler teksten som tall, gulper opp flere tall, som deretter konverteres tilbake til tekst ved utdata. Det er en overforenklet forklaring på hvorfor Chat AI ikke ‘inneholder’ opphavsrettsbeskyttet arbeid: det er bygget med tall som representerer en stor abstraksjon fra underliggende tekster.

LLMs er trent på hvordan språk vanligvis brukes og genererer deretter svar basert på denne forståelsen. Vi har en tendens til å undervurdere hvor forutsigbart de fleste språk er. Chat AI kan generere tekst som er (noen ganger sjokkerende) lik eksisterende litteratur, men, etter design, har det ikke evnen til å hente spesifikke utdrag eller kopier av opphavsrettsbeskyttede tekster. (Jeg vet, mange av dere har hørt om New York Times søksmålet mot OpenAI—Times klarte å få ChatGPT til å gulpe opp noen deler av tidligere publiserte artikler ordrett.

Generativ AI

Det viktigste å forstå med dette begrepet er “generativ”-delen. Generativ AI genererer ny tekst.

Generativ forhåndstrent transformator (GPT)

Dette, det nerdeaktigste av terminologien her, beskriver en spesifikk type LLM utviklet av OpenAI. “Generativ” indikerer dens evne til å lage tekst, “forhåndstrent” betyr at den er trent på en stor mengde tekstdata, og “transformator” refererer til programvaren den bruker. Å vite hva GPT står for er nyttig bare slik at du forstår hva GPT i ChatGPT representerer.

ChatGPT

ChatGPT er programvaren du ser; GPT er det som ligger bak programvaren. Brukere opplever ChatGPT, ikke GPT som ligger bak. Som nevnt ovenfor er ChatGPT bare en av flere Chat AI-programvaresystemer, med lignende funksjonalitet.

Et annet begrep du ofte vil støte på som er ukjent for mange er:

Korpus

Ordbokdefinisjonen av korpus er “en samling av skriftlige tekster” (selv om det faktisk ikke alltid er tekst). Begrepet brukes i referanse til hva GPT-er er trent på: enorme korpuser av (for det meste) tekst. Vi får vite at de største korpusene inneholder hundrevis av milliarder ord. For vanlige dødelige er det umulig å forstå. Tenker du ikke på Wikipedia som enorm, inneholdende et stort antall ord? Vel, det er bare 4,5 milliarder ord i Wikipedia—GPT-4 ble trent på godt over en billion.

Jeg synes det er viktig å vurdere denne skalaen. Forfattere er forståelig nok bekymret for at de 75 000 ordene, pluss eller minus, i deres bok kan ha blitt sugd inn i en stor språkmodell. Kanskje de har det (mer nedenfor). Men hvis vi antar at dette er tilfelle, tenk på hvor lite verdi en enkelt bok har for den totale kraften til dagens store språkmodeller. Det er virkelig ubetydelig. Over ubetydelig. Selv 10 000 bøker er småpenger.

AI-programvare: Systemets tungvektere

An icon of a key

Jeg listet opp ovenfor de fire Chat AI-tungvekterne: ChatGPT, Claude.ai, Microsoft Copilot og Google Gemini.

De fungerer mer eller mindre på samme måte og leverer lignende resultater. Så hvilken er best? Det spørsmålet tar deg ned i et kaninhull. Det er litt som å spørre hvilken by som tilbyr den beste strandferien, eller hvilken SUV som er best for familier. Det er en enorm mengde nyanser i problemene og en stor mengde stolthet og fordommer som filtrerer våre svar.

Slik er det også med denne tilsynelatende enkle, men enormt komplekse programvaren. Folk argumenterer for at Claude har mer nyanserte ferdigheter med språk, og at ChatGPT er bedre med programvarekode. Microsoft Copilot integreres med Microsoft-programvaresuiten. Google Gemini kan kobles til Gmail, Google Maps og YouTube. Noen av forskjellene er meningsfulle; mange er små. Og de endrer seg stadig med hver nye programvareutgivelse.

An icon of a key

‘Den beste’ programvaren vil ikke bli avgjort på en stund ennå. Hvis du eksperimenterer med nok av de tilgjengelige verktøyene, vil du finne noen favoritter.

Det er to øverste nivåer av AI-programvare. Det første er det som kan kalles det grunnleggende programvare, programvare som ChatGPT og dens konkurrenter (Chat AI). Slik opplever de fleste AI i dag.

Det neste nivået er all annen programvare som gir det som i hovedsak er et vindu inn i den grunnleggende programvaren. Nykommere til AI-chat vil for det meste ikke ha støtt på denne programvaren, selv om den verken er sjelden eller ukjent. Noen er kjent med Jasper (markedsføringsprogramvare) eller Perplexity (søk). Denne programvaren ville rett og slett ikke eksistert uten ChatGPT og dens slektninger.

Husk at mainstream programvare fra Adobe, Microsoft, Grammarly, Zoom, og andre nå inneholder AI-verktøy, men dette er forskjellig fra programvare som er bygget fra grunnen av basert på chatbot-grensesnitt. (Andre som Otter (transkripsjoner) eksisterte før ChatGPT, men er nå beriket med teknologi fra store språkmodeller.)

Nedenfor vil vi se på publiseringsspesifikk programvare som utnytter evnene til generativ AI.

Programvareparadigmer

En gang i tiden var programvare kode, og bare ingeniører forsto hvordan det fungerte. Det som gjorde personlige datamaskiner vellykkede, utover deres relativt lave kostnad, var programvare som var (relativt) enkel å bruke. Vi tenker ikke mye over alt dette; det bare omgir oss.

Men vurder, for et øyeblikk, Microsoft Word, et program som jeg trygt kan anta blir brukt av 99% av leserne av denne boken. Det tar omtrent 10 minutter å vise noen hvordan man skriver et avsnitt med tekst i Word. Deretter kan du vise dem hvordan de lager fet tekst, og kursiv, og hvordan de endrer standardfonten, kanskje fra Calibri til Arial eller Times New Roman. Deretter, hvordan man lagrer filen og skriver ut filen. Hvordan søke og erstatte.

Og så lar du dem være alene.

År senere finner du ut at de fortsatt formaterer Word-avsnittene sine med mellomrom og faner. Og fortsatt glemmer å lagre filene sine, eller blir forvirret om hvilken versjon de lagret, noen ganger må de gjenskape tekst fra bunnen av. Men de “vet hvordan de bruker Word.”

Word har hundrevis av funksjoner, men en tredjedel av tiden bruker brukerne bare 5 kommandoer: Lim inn, Lagre, Kopier, Angre og Fet. Det tar flere uker med opplæring for å lære seg Word’s avanserte funksjoner ordentlig; funksjoner som kan hjelpe en utgiver å spare mange hundre timer. Men de fleste gjør det aldri. Jeg har brukt Word siden 1985, nesten førti år, og jeg har aldri tatt et kurs. Jeg vet ikke engang hva jeg ikke vet om hvordan man får full nytte av programvaren.

Jeg går inn på dette fordi det er en nyttig måte å få hodet rundt hvorfor AI-programvare er så veldig annerledes enn noen programvare du noen gang har jobbet med. Den kommer ikke med en manual, ikke engang en hurtigstartguide. Den kommer med en blank skjerm og et spørsmål: “Hva kan jeg hjelpe deg med.”

En velkomstmelding på et konversasjonelt AI-grensesnitt adressert til Thaddeus, som spør hvordan det kan hjelpe.

Det er ingen menylinje, ingen knapp å trykke på, ingen hurtigtaster. Du stiller et spørsmål, starter en chat, og du får noen svar.

Et konversasjonelt AI-grensesnitt med en brukerinnføring som spør hvordan man skal forklare forskjellen mellom ny generasjons konversasjonelle AI og tradisjonelle verktøy som Microsoft Word eller Excel.

Claude’s svar:

“Det er flere viktige forskjeller mellom å jobbe med moderne konversasjonell AI som meg selv sammenlignet med tradisjonelle verktøy som Microsoft Word eller Excel:

“1. Naturlig språkinteraksjon: Med konversasjonell AI kan du kommunisere din hensikt ved å bruke hverdagslig språk i stedet for å måtte lære og navigere komplekse menyer og funksjoner. Du forklarer ganske enkelt hva du vil oppnå på en samtalemessig måte.

“2. Kontekstuell forståelse: AI-assistenter opprettholder kontekst og forstår flyten i samtalen, noe som tillater mer naturlig frem og tilbake dialog. Tradisjonell programvare har ingen kontekstuell bevissthet fra en kommando til den neste.

“3. Tilpasningsevne: AI kan dynamisk tilpasse seg og svare på et bredt spekter av forespørsler, mens tradisjonelle verktøy er begrenset til et forhåndsdefinert sett med funksjoner. En AI-assistent kan hjelpe med skriving, analyse, matematikk, koding, ideer og mer innenfor et enkelt grensesnitt.”

Dette var nyttig, men jeg ønsket noe enklere å forstå. Så jeg spurte:

En brukerspørsmål på et konversasjonelt AI-grensesnitt som ber om en enkel forklaring for et ikke-teknisk publikum.

Claude:

“Her er en enkel måte å forklare forskjellen til noen uten teknisk bakgrunn:

“Tenk på tradisjonell programvare som Microsoft Word eller Excel som et verktøy, som en hammer eller en kalkulator. Det har et fast sett med funksjoner som det kan utføre, og du må lære hvordan du bruker det riktig for å få det resultatet du ønsker.

“På den annen side, tenk på moderne konversasjons-AI som en smart assistent, som en kunnskapsrik kollega eller venn. Du kan bare snakke med den på vanlig engelsk, og den forstår hva du prøver å gjøre. Den kan hjelpe deg med alle slags oppgaver, fra skriving til matte til å komme opp med ideer.

“Du trenger ikke å lære noen spesielle kommandoer eller teknikker—bare snakk med den naturlig. Den tilpasser seg dine behov og husker konteksten i samtalen din. Over tid blir den kjent med deg og dine preferanser.

“Så mens tradisjonell programvare er som et statisk verktøy du bruker, er konversasjons-AI mer som en intelligent partner du naturlig interagerer med for å få ting gjort. Det er en mer fleksibel, personlig og effektiv måte å jobbe på.”

Hmm. Ikke helt det jeg ønsket. Så jeg fortsatte samtalen:

En konversasjons-AI respons som råder til å unngå teknisk sjargong og referanser som ikke-tekniske personer kanskje ikke forstår.

Claude:

“Selvfølgelig, la meg prøve igjen uten å bruke tekniske termer:

“Tenk deg at du snakker med en venn som er veldig kunnskapsrik og ivrig etter å hjelpe deg. Du kan bare snakke med dem på vanlig engelsk om hva du prøver å gjøre, enten det er å skrive en oppgave, løse et matteproblem, eller brainstorme ideer til et prosjekt.

“I stedet for å måtte lære og huske en rekke bestemte trinn eller kommandoer, kan du bare forklare hva du trenger med dine egne ord. Vennen din forstår konteksten og tilpasser hjelpen basert på det dere allerede har diskutert.

“Det er en frem og tilbake samtale, hvor du kan stille spørsmål, klargjøre ting, og få råd. Og jo mer du snakker med denne vennen, jo bedre forstår de dine unike behov og kommunikasjonsstil.

“Nå, tenk deg at du kunne ha den samme typen nyttig, enkel interaksjon, men med et dataprogram. Det er grunnideen bak nye typer programvare du kanskje har hørt om.

“I stedet for den gamle stilen av programvare, hvor du har et rigid sett med funksjoner og må lære den riktige måten å bruke den på, er denne nye programvaren mer som en kunnskapsrik venn. Du kan bare snakke med den på en konversasjonell måte, og den finner ut hvordan den kan hjelpe deg basert på den naturlige flyten i diskusjonen din.

“Så det er en smartere, mer personlig og enklere måte å få hjelp med alle slags oppgaver på datamaskinen, bare ved å snakke med den som du ville gjort med en person. Det er hovedforskjellen fra den eldre, mer rigide stilen av programvare.”

Sammendrag: Jeg prøvde å gjøre to ting med disse eksemplene. Den ene var å tilby et døds enkelt eksempel på hvorfor chatbot-programvare er så forskjellig fra noe programvare vi noen gang har brukt. Og den andre var å illustrere hvordan en samtale kan utvikle seg. Det er ikke bare et enkelt spørsmål og et enkelt svar. Det er en samtale. Det er en stor del av gjennombruddet.

Chat-AIer er en slags kombinasjon av praktikant og kunnskapsrik konsulent. Du kan ikke anta at de vet hva du mener. Du må forklare hva du vil, hvorfor du vil ha det, og hvordan de kan være mest nyttige.

Tre typer AI-programvare

An icon of a key

Med brede strøk er det tre typer AI-programvare tilgjengelig i dag. Den første er AI grunnleggende plattformer, som ChatGPT, kjernek AI-teknologien. Den andre er, la oss kalle det, AI-tillegg, programvare som er nybygget på toppen av kjerneplattformene. Du har nok ikke hørt om mange av disse, verktøy som Jasper eller Rewind.

Min tredje kategori er programvare som har AI-verktøy boltet på det eksisterende produktet. For eksempel har Microsoft-pakken med programvare nye AI-verktøy i Word, Excel og PowerPoint. Adobe har lagt til AI-teknologi i Photoshop og Acrobat. Grammarly blir bygd om rundt den nye generasjonen av LLM-basert teknologi. Det er stort sett det samme produktet, men med AI lagt til.

Det blir klart at nesten all programvare du bruker i dag snart vil inkorporere AI-funksjoner. Du må selv vurdere om de verktøyene faktisk er nyttige eller bare AI-vinduspynt.

Jeg er mer interessert i de nye verktøyene, bygget fra grunnen av for å gi den verdien som bare AI kan skape. Det er neste generasjon programvare.

Arbeide med AI-programvare

Jeg er en Windows-fyr, dessverre (det er en lang historie hvorfor), og derfor snakker jeg om mine erfaringer med å få tilgang til AI-programvare via en Windows-datamaskin, ikke en Mac. Fordi all programvare her er nettleserbasert, bør det ikke være noen forskjell å bruke disse verktøyene på en Mac. Men jeg gir ingen garantier.

Du vil trenge litt penger for å spille AI-spillet, men ikke veldig mye. Som beskrevet ovenfor, kan mye av den grunnleggende programvaren nås via gratisversjoner. Men du vil vanligvis ha et betalt abonnement mens du tester det, og abonnementet bør være rundt $20/måned. Avslutt etter at du har prøvd det (ikke glem det!). Hvis du ser noe som er $79/måned eller, gud forby, $159/måned, kan du ignorere det. De tenker ikke på deg som en potensiell bruker; de tenker på store mainstream bedriftsbrukere.

Opplæring for Chat AI

An icon of a key

Dagens AI er bedragersk enkel. Hvem som helst som kan skrive et spørsmål kan bruke den. Men å bruke den godt er komplisert, noe som ikke gir noen åpenbar mening før du dykker ned i kompleksitetene rundt “stikkord” og relaterte konsepter.

For å få tilgang til intelligensen må du noen ganger snakke med den som om den var en idiot. Eller kanskje en idiot savant. Det er litt som karakteren spilt av Dustin Hoffman i Rain Man.

Hvem som helst kan bruke ChatGPT. Bare gå til chat.openai.com, og du kan få tilgang til den nyeste versjonen, GPT-4o, gratis (det er noen premium-funksjoner tilgjengelig for 20 dollar ekstra per måned).

Når du går til ChatGPT, finner du i hovedsak en blank skjerm og det implisitte spørsmålet “Hvordan kan jeg hjelpe deg i dag?”

Du kan stille den spørsmål. Enda bedre, du kan laste opp en stor PDF og stille spørsmål om filen. Du kan også laste opp bilder som den kan beskrive, eller en skannet side: den kan gjenkjenne teksten, selv om den er håndskrevet.

Det som har vist seg å være en flaskehals for vellykket bruk av Chat AI, er å lære seg hvordan man skal ‘snakke’ med den (noe du bokstavelig talt kan gjøre i den nyeste mobilappversjonen). På Chat AI-språk kalles dette å lage “stikkord” eller “forespørsel.” Brukere har oppdaget at jo mer presise og detaljerte stikkordene deres er, desto bedre svar får de fra ChatGPT. Videre er ikke stikkord bare engangsbruk. Chat AI kan fortsette en samtale en stund (selv om ikke ubegrenset), og hvis du ikke får svaret du leter etter, kan du revidere og finjustere stikkordene dine. Dette krever mye tilvenning og har ført til en rekke veiledninger, både skriftlige og online, for å trene brukere i å få mest mulig ut av forespørslene.

Prøv å be noen av Chat AI-programvarene om å forklare et konsept som utviklingsredigering. Be så om en forklaring som en 12-åring kan forstå. Resultatene er dramatisk forskjellige. Morsomt nok ser det ut til at Chat AI også reagerer på følelsesmessige appeller. Å legge til “dette er veldig viktig for min karriere” til en forespørsel kan lokke frem mer nyttige svar.

(Dette er et like godt tidspunkt som noe annet å legge til en parentes: Det er både beroligende og dypt foruroligende at de fremste forskerne som jobber med språkbasert AI ikke er i stand til å forklare hvorfor slike ting skjer.)

Hvordan gi stikkord

An icon of a key

“Å gi stikkord” er en spesifikk ferdighet som er essensiell for å bruke Chat AI effektivt.

Av de forskjellige terminologiene som ble fanget opp under AI-gullrushet, er “stikkord” og “forespørsel” blant de beste. Du “snakker” egentlig ikke med en Chat AI. Du “stiller” den ikke spørsmål (eller, du bør ikke—det er ikke slik det fungerer). Du gir disse motorene stikkord for svar, ikke for enkle svar.

Først tenkte jeg at en analogi kunne være teaterstikk. Prompteren gir en skuespiller som mister tråden et puff, slik at de hopper tilbake i handlingen. Men dette er ikke nøyaktig fordi et AI-stikkord ikke løsner en bit av memorert tekst—det er ikke slik generativ AI fungerer. Gi en AI-motor et enkelt stikkord gjentatte ganger, og svarene vil alltid være minst litt forskjellige.

Akkurat nå spurte jeg ChatGPT om å “liste opp nøkkelingrediensene for effektiv stikkordgivning.” Jeg spurte en gang til, og svarene var tematisk konsistente, men ganske forskjellige i detaljene. Temaer som ble fremhevet inkluderte:

  • Vær spesifikk

  • Unngå tvetydighet

  • Gi bakgrunnsinformasjon

  • Bruk klare instruksjoner

På en måte er det ganske merkelig: AI har en god forståelse av språk—burde den ikke ha en forståelse av hva du mener uten pedantisk stikkordgivning? Men det er nettopp den mestringen av språk som gjør stikkordgivning mest kraftfull. Fortell den nøyaktig hva du mener, ikke omtrent.

Snakk til den som den hjelpsomme assistenten, den lærde rådgiveren, som du vil at den skal være, ikke som en gutt fra gata.

Poenget her er at, i det minste foreløpig, krever effektiv bruk av LLM-baserte AI-verktøy minst en viss innsikt i beste praksis for stikkordgivning. En mesterlighet i stikkordgivning vil bli passende belønnet.

Hallusinasjoner: En flue i salven

An icon of a key

AI, basert på store språkmodeller, finner på ting. Det gjør det bare. Dette kalles generelt “hallusinasjoner.” Det er et reelt problem, et alvorlig problem. Du må forstå hallusinasjoner hvis du skal jobbe med AI.

Cambridge Dictionary’s Word of the Year for 2023 var “Hallucinere,” hvis definisjon har blitt utvidet til å inkludere “Når en kunstig intelligens… hallusinerer, produserer den falsk informasjon.” (Andre tillegg til 2023-ordboken inkluderer “promptingeniørkunst,” “stor språkmodell,” og “GenAI.”)

AI-hallusinasjoner, bemerker Cambridge, “fremstår noen ganger som meningsløse. Men de kan også virke helt plausible - selv om de er faktuelt unøyaktige eller til slutt ulogiske.” Dette er dessverre ganske sant, og fra juli 2024 er det fortsatt en dramatisk begrensning for å bruke generativ AI til oppgaver der nøyaktighet er kritisk. Det er en av flere store særegenheter ved AI, og det tar folk en stund å forstå det. Husk, generativ AI er for det meste en neste ord-forutsigelsesmotor, ikke en database av fakta. Derfor behovet for HITLs, Mennesker-i-løkken, som vi nå er kjent som, for å dobbeltsjekke AI-resultater. Og igjen, det er bemerkelsesverdig at vi kan få så ekstraordinær verdi fra en teknologi som kan produsere påviselig unøyaktig informasjon. Sånn går det.

Gary Marcus, en erfaren og velinformert AI-kritiker, sammenligner AI-hallusinasjoner med ødelagte klokker, som er riktige to ganger om dagen. “Det er riktig noen av gangene,” sier han, “men du vet ikke hvilken del av tiden, og det reduserer verdien betydelig.”

Ethan Mollick, en hovedtaler på Publishers Weekly konferansen i september 2023, bemerker at folk som bruker AI forventer 100% nøyaktighet. Hallusinasjoner, sier han, er lik “menneskelige feilrater” som vi tåler daglig.

Andrej Karpathy, en kjent forsker som spesialiserer seg på AI, og som for tiden jobber hos OpenAI, skriver om hallusinasjoner:

“Jeg strever alltid litt når jeg blir spurt om ‘hallusinasjonsproblemet’ i stor språkmodell. Fordi, på en måte, er hallusinasjon alt stor språkmodell gjør. De er drømmemaskiner.

“Vi styrer deres drømmer med prompt. Promptene starter drømmen, og basert på stor språkmodells uklare erindring av treningsdokumentene, går resultatet for det meste til et nyttig sted.

“Det er bare når drømmene går inn i ansett faktuelt ukorrekt territorium at vi merker det som en ‘hallusinasjon.’ Det ser ut som en feil, men det er bare stor språkmodell som gjør det den alltid gjør.”

Det er ikke bare problemet med å finne på ting. Chat AI er dypt feilaktig programvare.

For mange forespørsler, spesielt fra nybegynnere, er svarene hverdagslige, utenfor mål eller rett og slett ubrukelige. Chat AI har problemer med å telle: Be den om et blogginnlegg på 500 ord, og du vil være heldig å få 150.

Og hvert av AI-selskapene, for å redusere skjevhet og for å unngå å svare på “hvordan bygge en bombe” spørsmål, har satt opp stramme svarbeskyttelser rundt sine produkter: altfor ofte er svaret på et spørsmål, i hovedsak, “Nei, jeg vil ikke svare på det.” Jeg ba Google Gemini om å gjennomgå et utkast til denne teksten og ble advart om at “det er viktig å få godkjenning fra forfatteren før publisering.”

Faktasjekking

An icon of a key

Jeg argumenterer, for det meste for døve ører, at hallusinasjoner er et teknologiproblem, som vil finne en teknologiløsning. Ja, de er endemiske for stor språkmodell, men de kan omgås.

Tenk på dette: Jeg ba fire Chat AI-er om å faktasjekke følgende påstander:

  • Fra 2024 er det 6 store multinasjonale forlag basert i New York City. De er kjent som de Store 6.

  • E-bøker fortsetter å dominere boksalget i USA.

  • Borders og Barnes & Noble er de to største bokhandelkjeder i USA.

  • Etter et salgsfall under Covid, vokser igjen boksalget i USA med tosifrede tall.

Alle oppdaget feilene i de tre første påstandene. Hver av dem ble litt forvirret om den fjerde, usikker på omfanget av Covid-salgsbumpen, og av etterfølgende salgsmønstre. Det er et lite, ikke-representativt eksperiment, men disse Chat AI-ene, som ikke er ment å være faktabaserte, kan gjøre en troverdig jobb med å vurdere fakta de fleste vanlige observatører ville gå glipp av.

Hva med bilder og video?

An icon of a key

Fordi bokutgivelse er mer avhengig av tekst enn av bilder, har forleggere en tendens til å overse de banebrytende AI-baserte verktøyene for bilder og video.

De er relevante for enhver forståelse av AI-revolusjonen. Men diskusjonen er for stor for plassen tilgjengelig: Jeg ville bare ikke gjøre det rettferdighet.

Anbefalt for forfattere og forleggere: lek med bildegenereringsfunksjonene i ChatGPT—de er gratis og morsomme å bruke. Gjør deretter et søk på “video og AI” og forundre deg over noen av eksemplene du finner på de lenkede nettstedene. Selv om verktøyet ennå ikke er offentlig tilgjengelig, gir OpenAI’s Sora noen fantastiske eksempler på videoer generert bare fra tekstprompt.

Programvare for bokforlag

Det finnes lite AI-programvare bygget fra bunnen av spesifikt for bokforlag (selv om det finnes mye for forfattere).

Vitenskapelige utgivere har flere alternativer, med en rekke AI-verktøy for forskning, skriving og publisering.

For kommersielle utgivere er de fleste alternativene knyttet til AI og lyd. Utenfor lyd samler valgene seg rundt redigerings- og markedsføringsverktøy. Det finnes også flere AI-verktøy for innholdsdeteksjon og verktøy og tjenester for innholdslisensiering.

Redigeringsprogramvaren er rettet mot forfattere, ikke profesjonelle redaktører — det finnes mange flere forfattere enn redaktører, og kvaliteten som kreves av profesjonelle redaktører er mye strengere enn for (for det meste selvpubliserte) forfattere.

Markedsføringsverktøyene retter seg også bredere enn bare bokforlag, men til markedsførere overalt, med verktøy for nettinnhold, tekstgenerering og SEO. Jasper.ai er en leder i denne kategorien, og hevder å ha HarperCollins som kunde.

Shimmr, en sponsor av denne boken, er et AI-drevet annonseskaperverktøy spesifikt for bokforlag. Selskapet og dets grunnlegger, Nadim Sadek, ble profilert i en artikkel fra mai 2024 i Publishers Weekly.

“Det vi gjør er å bruke AI til å vurdere den psykologiske profilen til en bok og matche den til sinnstilstanden til et spesifikt publikum, og dermed sikre en mer effektiv forbindelse mellom lesere og bøker,” fortalte Sadek til PW. “Vi kaller det ‘Book DNA,’ og det innebærer ikke bare å kjenne karakterene og handlingen i en bok, men også verdiene, interessene og følelsene i boken.”

Ved å bruke Book DNA skaper Shimmrs AI-verktøy deretter målrettede annonser for søke- og sosiale mediekanaler (for tiden Google og Meta). Annonsene tar form av displayannonser, med AI-genererte bilder ledsaget av slagord.

Jeg påpeker til forleggere som vurderer Shimmr at det kan gi ekstra inntekter, som er det vi forventer at et nytt annonserings-/markedsføringsverktøy skal bringe til bordet.

Hvis du vil oppleve et annet “kun med AI”-programvareverktøy, sjekk ut Hypnovels, som animerer kapitler i skjønnlitterære bøker. “Fortelling, bilde og bevegelse, alt generert av AI, kommer sammen med stor fortellerkunst på en måte som er mindre bokstavelig enn tradisjonell animasjon (derav “hypno”) og mer sansemessig engasjerende enn en lydbok, i en stil som gjør kapittelet unikt og fengslende.”

En annen ny leverandør som har oppstått fra muligheten med AI, er Veristage (også en sponsor av denne boken). Veristage tilbyr Insight, sin “AI Publishing Assistant”, en oppgave-spesifikk front-end på tvers av flere forlagsfunksjoner.

Insight-reisen starter med manuskriptet. Opplasting av en tidlig versjon låser opp en rekke verktøy, noen mer verdifulle for redaksjonelle formål, andre mer verdifulle for markedsføring. Etter å ha jobbet med alle funksjonene, kan du laste ned en PDF-rapport som inkluderer redaksjonelle aspekter, som skrivetone, tropes, klisjeer og bruk av adverb og adjektiver, og deretter markedsføringsinnhold, som beskrivelser, metadata, unike salgsargumenter, sammenligninger, Amazon-optimalisert innhold, og foreslåtte innlegg til sosiale medier.

Det jeg liker best med Insight er at det tar en helhetlig tilnærming til å anvende AI i forlagsprosessen, i stedet for å måtte samle flere programvareverktøy, hver for en annen funksjon.

Jeg vil også fremheve her min publiseringsplattform, Leanpub. Det har vært fantastisk å jobbe med dem. Smått er vakkert: de tar sjanser med teknologi og tjenester som større selskaper ville ha styrt unna. Av stor interesse for forfattere og mindre forlag er deres nye TranslateWord-tjeneste, hvor du kan oversette en bok skrevet i Microsoft Word til opptil 31 språk, via GPT-4o API (som driver ChatGPT). Det er det jeg bruker for å oversette denne boken.

Jeg så andre steder for å prøve å finne en tjeneste for bokoversettelse. Det finnes mange oversettelsesfirmaer, noen bruker AI. Den eneste jeg kunne finne som tilbyr bokoversettelse er DeepL. Men det er ikke et fokus for selskapet. Akkurat nå er Leanpub stedet å gå.

Forretningsprogramvare for bokutgivelse

An icon of a key

De eksisterende forretningssystemleverandørene som betjener forlagsbransjen begynner å legge til AI-teknologier, som vi har sett hos selskaper i stor skala, som Salesforce og Oracle.

Jeg har snakket med flere av programvareleverandørene for forlagssystemer, inkludert Firebrand, og alle ser på mulighetene, men går forsiktig frem.

Jeg ser frem til muligheten til å snakke om AI med en mangfoldig gruppe deltakere på Firebrand’s Publishing Innovation Forum i september 2024 i Nashville, TN.

knk har kjørt to webinarer om AI, og utgitt et whitepaper, men (per 26. juni 2024) har ennå ikke annonsert noen AI-funksjoner i sine produkter.

Virtusales har nylig lansert sitt første sett med AI-aktiverte verktøy, inkludert bildemerking, generering av alt-tekst, verktøy for tekstredigering, generering av salgs- og markedsføringstekst, og oversettelser av denne teksten.

Jeg snakket med Klopotek på deres Klopotek Publishing Radio. De har “startet et AI-initiativ innen kunde service,” selv om ingen detaljer er tilgjengelige.

Supadu, som tilbyr forlag “webdesign, e-handel og dataløsninger,” har nå “Supadu Smart AI,” (pdf) med “avatar-ledet tittel videovurdering med Smart Buy,” “avatar videodrevet markedsføringsmateriell for markedsførings- og salgsteam,” og “enkel oversettelse av forfatter- og titelvideoer til flere språk.”

AI-programvare for bokforlag: oppstartsselskapene

Noen kjenner til arbeidet jeg har gjort rundt teknologi-baserte oppstartsselskaper innen bokpublisering. Det finnes en rapport i Publishers Weekly som beskriver arbeidet, og lenker til databasen.

Som du vil se i rapporten, ser jeg ganske bredt på oppstartsselskaper over hele spekteret av bokpublisering. Jeg inkluderer ikke nye bokforlag, med mindre de gjør noe uvanlig med teknologi. De grunnleggende kriteriene er: bruker du teknologi for å forsøke å revitalisere et eller annet aspekt av bok(ish) publiseringsprosessen? Jeg har over 1 600 selskaper i databasen, de fleste startet etter at Amazon lanserte den første Kindle i 2007.

Etter at du får en generell følelse av databasen, kan du begynne å dykke dypere. På fanen helt til høyre vil du se en måte å sortere kun etter AI-relaterte oppstartsselskaper.

Et skjermbilde av en tabell som viser verktøy og tjenester med et filter for AI valgt, som fremhever et antall på 243.

Som du kan se på illustrasjonen, er det over 240 AI-relaterte oppstartsselskaper (per begynnelsen av juli 2024). Vi teller lydpubliseringsselskaper som bruker AI som en egen kategori, og det totale antallet av de to er over 300 selskaper. Flertallet, over 280, ble startet etter at ChatGPT først dukket opp i november 2022. Dette volumet av nye forretningsoppstarter er uten sidestykke innen bokpublisering. Det er forbløffende.

Som er karakteristisk for hele databasen, retter disse AI-oppstartene seg mest mot forfattere (70%). Omtrent 13% ser ut til å tjene forlag. 10% er rettet mot barnebøker.

Omtrent 50 av oppstartene retter seg mot lesere med et utvalg av oppfinnsomme tilbud. Flere er fortellerplattformer. Det er ganske mange oppsummeringsverktøy. Det er flere oppdagelsessider, “Bruk AI for å finne din nye favorittbok.” Raskt forbedrede AI-genererte stemmer har ført til et utvalg av “les det for meg”-verktøy.

Og noen interessante ideer som ikke ville vært mulig uten AI.

Bookshelf: Reading Tracker er en kombinasjon av bokoppdagelse og personlig bibliotekapp som inkluderer “automatisk tidssporing, lesemål og påminnelser, og innsiktsfulle statistikker og trender.” Dens AI-bibliotekar “kan generere oppsummeringer og flashcards, diskutere nøkkelideer og innsikter, og mye mer.”

Min venn Ron Martinez lanserte nylig et nettsted kalt Inventionarts.ai som introduserer “et nytt samtalemedium.” Som nettstedet forklarer, “Snakk med flere AI-personligheter, hver med sin egen identitet, ekspertise og bevissthet. Inviter forskjellige personas til å bli med deg i scenarier. Og du kan også spille en fiktiv rolle!” Et litterært spill, på en måte.

Som er karakteristisk for den større oppstartsgruppen, er mange av disse oppstartene mellom små og mikroskopiske, bare én person med en nettside og en halvferdig idé. Jeg inkluderer dem alle—hvem vet hvor de er på vei.

Jeg oppfordrer sterkt til å leke med databasen. Klikk på noen lenker. Jeg tror du vil bli fornøyd med innovasjonen og dristigheten til mange av disse organisasjonene.

En av sponsorene av denne boken, Book Advisors, spesialiserer seg på fusjoner og oppkjøp i forlagsbransjen. Jeg anbefaler alltid innovative startups å lete etter partnere, og Book Advisors er stedet jeg sender dem for å diskutere prosessen. Bokutgivelse har flere anerkjente M&A-firmaer å henvende seg til, inkludert The Fisher Company og Oaklins DeSilva+Phillips. Book Advisors er det eneste firmaet jeg kjenner til som også arbeider med teknologistartups.

AI og Bokutgivelse: Hva Gjør Bransjen Akkurat Nå?

An icon of a key

De AI-relaterte aktivitetene til mange av de fremtredende bransjegruppene innen forlagsvirksomhet ser ut til å legge til sine stemmer til koret av de som er bekymret for opphavsrett. The Association of American Publishers “leverte svarkommentarer i den amerikanske opphavsrettskontorets undersøkelse om skjæringspunktet mellom opphavsrettslovgivning og kunstig intelligens (AI)...”

Den britiske forleggerforeningen bemerkes at “det er av største viktighet at regjeringen innfører konkrete løsninger så snart som mulig for å beskytte den menneskelige kreativiteten og kunnskapen som ligger til grunn for sikker og pålitelig AI.”

På den annen side tilbyr Independent Publishers Guild (IPG), med mer enn 600 medlemmer, AI-veiledning og opplæring til sine medlemmer, inkludert sin “Praktiske guide til AI i forlagsvirksomhet,” utført av en kjent AI- og forlagsekspert, George Walkley.

Her i USA er jeg privilegert å være en del av Book Industry Study Groups (BISG) AI Working Group, som rapporterer til Workflow Committee. Arbeidsgruppen har skissert flere potensielle strategiske initiativer:

  • Utvikling av Beste Praksis og Standarder: Anbefale beste praksis knyttet til AI-bruk, knyttet til etiske retningslinjer, eksisterende forskrifter og lover. Dette inkluderer åpenhet i AI-generert innhold og dets avsløring til forbrukere.

  • Bransjeundersøkelser og Definisjoner: Gjennomføre undersøkelser for å samle brede bransjeinnsikter om nåværende og potensielle AI-bruker og etablere klare definisjoner og omfang for hva AI betyr innenfor konteksten av bokutgivelse.

  • Periodisk Rapportering og Gjennomganger: Tilby periodiske rapporter for å hjelpe bransjen å forutse og tilpasse seg de raske endringene som AI-teknologier medfører.

Andre skrive- og forlagsforeninger prøver å komme foran emnet. Noen tar standpunkt mot AI; andre prøver bare å hjelpe sine medlemmer med å forstå teknologien og kanskje eksperimentere med den.

AI og Bokutgivelse: Hva Gjør Forlagene?

For et år siden var svaret på hva forlagene gjør for tiden, “ikke mye.” Ikke mye har endret seg siden, men det har vært noe aktivitet. Jeg vil fokusere på forlag for handelsbøker; vitenskapelige og akademiske forlag er mer aktive. Her er noe av det jeg har avdekket.

Hachette: I følge en rapport fra november 2023 i The Bookseller i Storbritannia har Hachette publisert en posisjonserklæring om AI, som tilbyr et skille mellom ‘operative’ bruksområder og ‘kreative’ bruksområder. Selskapet “gjorde det klart at det oppmuntrer til ‘ansvarlig eksperimentering’ for operative bruksområder, men er imot ‘maskinkreativitet... for å beskytte originalt kreativt innhold produsert av mennesker’.”

HarperCollins: Ifølge en rapport fra april 2023 i Publishers Weekly av Andrew Albanese og Ed Nawotka, sa HarperCollins administrerende direktør Brian Murray:

“Vi vet at det kommer til å være viktig, og at det kommer til å ha en stor innvirkning på vår bransje i løpet av de neste tre til fem årene. Og derfor tror jeg mange av oss prøver å finne ut hvordan vi kan bruke det på en etisk og moralsk måte som hjelper oss å betjene forfattere og tilby profesjonelle tjenester til forfattere og ikke konkurrerer med forfattere og historiefortelling.

“Og det er, tror jeg, en utfordring. Kanskje ikke så mye for alle forlagene som er her, men jeg garanterer deg at det er mange små teknologiteam rundt om i verden som kanskje kommer etter vår virksomhet. De er ikke forleggere, de er ikke redaktører. De er teknologene, og de ser en mulighet.”

Penguin Random House (PRH): Bertelsmann, morselskapet til PRH, tilbyr et white paper kalt State of Play: Exploring Generative AI’s Transformative Effects on the Media & Entertainment Industry, som inkluderer en seksjon om bokutgivelser.

Ifølge en rapport i Publishers Lunch, har selskapet “introdusert sin egen interne AI-applikasjon, kalt PRH ChatGPT.”

Artikkelen sier at interne dokumenter fra PRH forklarer at programmet “‘kan brukes til å strømlinjeforme prosesser, øke kreativiteten, og gi data innsikt’ på tvers av avdelinger. Selskapet foreslår at blant bruksområdene for appen er å oppsummere bøker og dokumenter; revidere e-poster; utarbeide blogginnlegg eller stillingsbeskrivelser; analysere tekstbaserte data, og ‘generere ideer til innhold.’”

Simon & Schuster: Selskapets administrerende direktør Jonathan Karp ble nevnt i New York Times “Mest Minneverdige Litterære Øyeblikk de Siste 25 Årene” med et sitat rapportert i Publishers Weekly fra sin U.S. Book Show i mai 2024. Han sa at AI ikke var “elefanten i rommet” men heller, “mer som sikaden i verden. Du vet, mye summing og mye parring.”

Han erkjente at AI “definitivt er et verdifullt verktøy. Det vil definitivt gjøre oss mer effektive. Det vil hjelpe oss å behandle og samle informasjon bedre, og forhåpentligvis tillate arbeidere å gjøre et høyere nivå av arbeid som er mer interessant og kreativt.”

I mars, på London Book Fair, som rapportert i The Bookseller, sa Karp at selskapet også ville se på utenlandske versjoner av AI-genererte lydbøker “i områder hvor [den forfatterens] verk ellers aldri ville ha en sjanse på grunn av kostnadene ved [lydproduksjon].”

AI og bokutgivelse: Bruksområdene

An icon of a key

De spesifikke bruksområdene for AI og bokutgivelse, på tvers av forskjellige funksjoner, er enkle å beskrive konseptuelt. Men det er ikke mye informasjon tilgjengelig om hva forlag faktisk gjør.

Keith Riegert, administrerende direktør for Ulysses Press og Perfect Bound, presenterte på Publishers Weekly U.S. Book Show i mai 2024, og ga den mest omfattende oversikten jeg har sett om AI-bruksområder innenfor forlag. Perfect Bound er en sponsor av denne rapporten; jeg står ved den uttalelsen. Han tilbyr “20 praktiske måter du, som en forlagsprofesjonell, kan begynne å bruke AI akkurat nå.”

Hans presentasjon, Getting Started with AI, kan ses og lastes ned fra Perfect Bound-nettstedet.

Hva skjer når AI leser en bok?

Jeg låner denne seksjonstittelen fra Ethan Mollicks nyhetsbrev med vilje–det er ingen grunn til å prøve å forbedre den. Mollick er professor ved Wharton School ved University of Pennsylvania, som studerer entreprenørskap og innovasjon. Hans nyhetsbrev, som jeg ofte anbefaler, er rolig, forfriskende og unikt innsiktsfullt.

Blant det som kvalifiserer Mollick som en kommentator er at han ikke har noen egeninteresser. Han trenger verken å selge AI eller å rakke ned på det. Han har forpliktet seg til å utforske AI i dets mange påvirkninger, for det meste på utdanning, kultur, skriving og publisering. Og han er en god, klar skribent.

Hvis du blar gjennom Mollicks nyhetsbrevarkiv, vil du se at han ikke begynte å fokusere på AI før i desember 2022. Det var ikke hans felt–som for de fleste av oss, falt AI inn i hans daglige arbeid, og han kunne ikke ta øynene fra det.

I dette innlegget faller hans innsikter nærmest vår interesse som forlagsprofesjonelle. “Kan AI,” spør han, “endre måten vi interagerer med bøker på?”

For å svare på spørsmålet, bemerker Mollick, “trenger vi både en AI med en nok minne til å holde en bok, og en forfatter som kjenner sin egen bok godt nok til å vurdere AI’s resultater.” Mollick tester en av sine flere titler (han spesifiserer ikke hvilken, men ut fra samtalene er det tydelig The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors, en bok som er positivt anmeldt på Amazon, men ikke en aktuell bestselger).

Mollick vurderer ulike aspekter av AI’s potensielle verdi for en forfatter, utgiver eller leser, inkludert “AI som leser og redaktør,” og “en praktisk bruk: hjelp for instruktører.” Han ber en LLM—stor språkmodell—ikke ChatGPT—om å oppsummere boken. Den lykkes til Mollick’s tilfredsstillelse.

Så en tøffere utfordring: “Gi meg eksempler på metaforer i boken.” Metafor, påpeker han, “er utfordrende selv for menneskelige lesere, da det innebærer å finne bruk av billedspråk uten klare markører (i motsetning til en simile, er det ingen “liker” eller “som”).” Resultatene, rapporterer han, “er imponerende, selv om det er mindre feil.”

LLM’en er mindre vellykket som redaktør: dens feil på dette området, bemerker Mollick, illustrerer “noe som har blitt klart om den nåværende tilstanden av AI: hvis du er en veldig god skribent eller redaktør, er du bedre enn dagens AI…”

Likevel, “AI’er har, eller ser ut til å ha, en forståelse av konteksten og meningen med en tekst.” Som et resultat, tror Mollick at “hvordan vi forholder oss til bøker sannsynligvis vil endres som et resultat av AI.”

Jeg tror det også.

AI og bokdesign & produksjon

An icon of a key

Ekspertsystemer og prosessautomatisering ligger fortsatt foran AI når det gjelder bokdesign og produksjon.

Programvare for automatisk typografi av bøker dateres tilbake til minst 1970-tallet. På midten av 1980-tallet ledet jeg et programvareprosjekt kalt PageOne, basert på Donald Knuth’s TeX, som kunne typografere en bok på minutter. SGML dukket opp omtrent på samme tid, basert på en dokumentstandard introdusert i 1969. Den ble i stor grad erstattet av XML, introdusert i 1996. Disse robuste markup-språkene skaper solide strukturer for automatisering.

Desktop-publisering innledet en ny runde automatisering for QuarkXPress og Adobe InDesign, samt Adobe Illustrator og Adobe Photoshop. Publiseringsarbeidsflyter kan administreres med ulike programmer og systemer.

En organisasjon å følge med på er Coko Foundation. De tilbyr en serie med open source produksjons- og publiseringsverktøy, inkludert Kotahi, en vitenskapelig publiseringsplattform, og Ketty for bokproduksjon, som inkluderer en AI-assistent. Kotahi AI PDF Designer, “transformerer PDF-design til en enkel, interaktiv prosess.”

Det er noen tidlige initiativer for å bringe AI inn i InDesign-arbeidsflyter. I april 2024 annonserte Adobe en Text to Image-funksjon. Tredjeparter kan være i forkant av Adobe her: de innovative prepress- og produksjonsleverandørene i India, som Hurix Digital og Integra, viser mer initiativ enn Adobe i å utnytte AI for produksjon.

AI & bokmarkedsføring

An icon of a key

AI’s innvirkning på bokmarkedsføring vil være overfladisk på kort sikt, men langt mer dyptgående på lang sikt. Mye avhenger av hva du oppfatter som ‘bokmarkedsføring’; det er i endring.

De ‘lavthengende fruktene’ er åpenbare. Be Chat AI om hjelp med en produktbeskrivelse eller en pressemelding. Be den foreslå noen nøkkelord. Dette kan den gjøre, uten å svette. Men de fleste profesjonelle innenfor publisering kan gjøre det samme, med bare litt fukt på pannen.

Keith Riegert’s brukstilfeller, nevnt ovenfor, inkluderer forslag til brainstorming av titler, utarbeidelse av en digital markedsføringsrapport, og opprettelse av en digital markedsføringskampanjesporer i Google Sheets.

Shimmr-programvare, beskrevet ovenfor, antyder formen av automatisert markedsføring som kommer.

AI og metadata

An icon of a key

Hva har AI å gjøre med metadata, og vice versa? Dens rolle virker beskjeden så langt; forvent noen store endringer.

Metadata er kjernen i bokoppdagbarhet. Du har hørt det nok ganger til å bli kvalm av advarselen. Det er frastøtende hovedsakelig fordi “metadata” forblir unnvikende for de fleste ikke-teknikere. Hvis du sier, “det er bare grunnleggende info om boken, tittelen, beskrivelsen, prisen, emnekategoriene, den slags ting,” så puster folk ut. Det er de komfortable med. Men det er omtrent alt.

Jeg beklager å minne deg på at det faktisk er mye mer til metadata enn bare noen få detaljer om boken. Det er så mye mer. Mye mer enn jeg kan omfatte i denne lille boken. Jeg har vært medforfatter av en hel bok om emnet. Ingram publiserer Metadata Essentials, et utmerket lite bind. Jeg vil si det her, og ikke for siste gang: forfattere og forlag ignorerer metadataene sine på egen risiko.

KI kan hjelpe med generering av metadata. For eksempel tilbyr selvpubliseringsleverandøren PublishDrive, en “KI-drevet bokmetadata-generator” som gir KI-anbefalinger for boktittel, beskrivelse, Amazon-kategorier, BISAC-kategorier og nøkkelord.

Insight, fra Veristage, beskrevet ovenfor, kan generere beskrivelser, nøkkelord, BISAC-kategorier, og definere målgrupper.

Erklære bruk av KI i metadata

An icon of a key

Du tror kanskje at den ærverdige verdenen av metadata ville være langsom til å forstå KI. Ikke så! I november i fjor ga EDItEUR, forvalteren av ONIX-standarden, ut et kort anvendelsesnotat kalt “Aspects of AI in ONIX.” (pdf)

Med sin typiske dype visdom, bemerker Graham Bell, organisasjonens direktør, at “en reaksjon på (kontroversene rundt teknologien) er å frasi seg bruken av KI eller unngå handel med KI-skapt innhold. Et mer realistisk alternativ er rett og slett å være åpen med handelspartnere og lesere når KI har vært brukt. Og ettersom noen forhandlere begrenser eller forbyr KI-basert innhold fra sine plattformer, er det viktig for anerkjente forlag å fremheve de produktene som bruker generative KI-teknikker for å skape innhold.”

Bell fortsetter med å skissere måter som forlag kan spesifisere i metadata:

  • KI-bidragsytere

  • KI-baserte stemmer i lydbøker

… samt en metode for å indikere i metadata for digitale produkter at forlaget eksplisitt frasier seg tekst- og datamining (TDM) for andre formål enn forskning. Det finnes også en måte å spesifisere en separat lisens som dekker kommersiell eller ikke-forsknings TDM.

Som ofte er tilfelle, kan det som er spesifisert i ONIX ikke bli avdekket nedover i næringskjeden, men i det minste er det gjort en beste innsats.

Strategier for å integrere KI i forlagsdriften

An icon of a key

Det er få ting som forlag er mindre komfortable med å gjøre enn å integrere komplekse digitale teknologier i deres daglige drift. Det er forståelig. KI, spesielt, forårsaker angst for alle, og ikke bare i forlagsbransjen. Det er nytt, det er mystisk, det er personlig, det er kraftig. Folk føler seg truet av KI av mange grunner. Endring av holdninger tar tid.

Men dette er ikke en god tid for å være redd for teknologi.

Det finnes rolige og rasjonelle tilnærminger tilgjengelig for å integrere KI i din forlagsdrift, uavhengig av størrelsen på organisasjonen din.

Impulsen må komme fra toppen. Helt fra toppen. Seniorledere må omfavne en visjon om KIs potensielt transformative innvirkning og kommunisere et program til ansatte over hele organisasjonen. Programmet kan være lite mer enn “eksperimenter, dokumenter eksperimentene dine, og del.” Det er en god start.

The Economist nevnte nylig en organisasjonstaktikk for ny teknologiadopsjon kalt “fyrtårnsmetoden.” Du skaper et fyrtårn ved å velge ett høyprofils bevis på konsept som kan implementeres raskt, som alle kan relatere til.

Forlag er handikappet av oppstyret rundt opphavsrett: forfattere er i harnisk. En undersøkelse fra Authors Guild i mai 2023 fant at “90 prosent av forfattere mener at forfattere bør kompenseres hvis deres arbeid brukes til å trene generative KI-teknologier,” og 67 prosent sa at de “ikke var sikre på om deres forlagskontrakter eller plattformens tjenestevilkår inkluderer tillatelser eller rettigheter til å bruke deres arbeid for noen KI-relaterte formål.” Disse usikre forfatterne spør nå sine forlag om KI blir brukt i redigeringen eller produksjonen av deres arbeid, og noen mektige forfattere insisterer på at det ikke skal være det. De ser etter KI-ekvivalenten av et peanøttfritt bakeri.

Dette er et vanskelig problem for forlag—hvis du ikke kan bruke KI på bøkene du planlegger å utgi, hva kan du bruke det til?

Utvikle og kommunisere KI-retningslinjer

Til tross for utstrakt bruk, har få forlag offentlig definert sine KI-retningslinjer og kommunisert sine tilnærminger til KI til offentligheten. Begrepet ‘offentligheten’ har en vanskelig betydning her, når du vurderer de forskjellige publikummene som adresseres av handels-, vitenskapelige og utdanningsforlag.

For forlag som driver med handel, er den viktigste målgruppen forfattere og deres agenter. Vitenskapelige forlag står overfor forskjellige hindringer når de vurderer AI’s lovende innvirkning på forskning, og deretter AI’s mer problematiske innvirkning på å konvertere forskning til fortelling (Avi Staiman skrev et tankevekkende innlegg om dette emnet). For utdanningsforlag er det utfordrende å etablere retningslinjer, da AI’s inntog i undervisningspraksisen er mangesidig og kompleks.

Jeg tror at forlag står overfor to store utfordringer når de går videre med AI-teknologier. Den første er å utvikle en selskapsposisjon om hvordan man generelt skal nærme seg AI, og hvordan man skal innlemme AI i arbeidsflytene sine. Den andre utfordringen er å kommunisere denne posisjonen klart og entydig til sine interessenter.

Forlagspolicyene jeg har sett er for det meste mangelfulle. Noen av dem er faktisk policyer rettet eksternt, mot forfattere, med en rekke advarsler om hva som er akseptabel praksis (ikke mye) og hva som ikke er akseptabelt (mye). O’Reilly’s “AI Use Policy for Talent Developing Content for O’Reilly” fortsetter side etter side, med esoterisk veiledning, som “DO NOT use any OSS GenAI Models that produce software Output that is subject to the terms of a copyleft or network viral open source license.”

På den andre siden inkluderer det vitenskapelige forlaget Elsevier, i “Elsevier Policies”-seksjonen på sin nettside, uttalelser om “Responsible AI Principles,” “Text and Data Mining,” og “The use of generative AI and AI-assisted technologies in writing for Elsevier.”

De få interne, upubliserte, forlagspolicyene jeg har sett er konservative, i overkant. Disse forlagene reagerte for raskt på en rekke oppfattede og mulige trusler, og på forfatternes bekymringer, og har hindret sin egen evne til å engasjere seg robust med denne raskt utviklende, raskt skiftende teknologien.

Det er en selvfølge at de vil bruke AI “ansvarlig,” hva nå det betyr. Det er en selvfølge at de har den største bekymring for forfatternes intellektuelle eiendom og for aggressivt å beskytte forfatterens opphavsrettsbeskyttede verk. (Selvfølgelig må disse brede prinsippene erklæres offentlig, og ofte gjentas.)

Men hva annet?

  • Vil de tillate at AI har en rolle i redaksjonelle anskaffelser? Kan AI ta en titt på slush-haugen?

  • Vil de tillate at AI har en rolle i utviklingsredigering, linjeredigering og kopiredigering?

  • Vil de tillate at AI har en rolle i å bestemme trykkopplag og allokeringer?

  • I å lage tilgjengelige e-bokfiler, inkludert alternativ tekst?

  • I å hjelpe til med lydbokproduksjon i tilfeller der det ikke er økonomisk realistisk å ansette talentfulle menneskelige fortellere?

  • I å hjelpe til med oversettelse til fremmedspråk i markeder der rettigheter aldri ville blitt solgt?

  • I å utvikle markedsføringsmateriale i stor skala?

  • I å kommunisere med forhandlere?

I så fall må de gjøre dette klart, og tydelig forklare tankegangen bak disse policyene. Forlag må være modige i å motvirke de mange innvendingene fra de fleste forfattere i denne tiden av frykt og tvil.

Jobb hensyn

An icon of a key

Bare de største forlagene vil kunne ansette dedikert personale for å jobbe med AI-programvare og -systemer. Gjennomsnittlig forlag vil ønske å eksponere hele sitt personale for AI-verktøy, med forventning om at hver enkelt kan utforske å bruke AI for å finne effektivitet i sitt arbeid.

På PubWest-konferansen i februar 2024 i Arizona foreslo en foredragsholder utenfor forlagsbransjen at en av bruksområdene for AI vil være å erstatte praktikanter. Rommet eksploderte. Hun mente det godt—faktisk beskriver en 10. april 2024 rapport i New York Times hvordan Wall Street investeringsbanker ser på å erstatte mange av sine praktikanter med AI. I likhet med tilfellet i forlagsbransjen, er en åpenbar bekymring: hvordan finner du senioranalytikere hvis de ikke kan starte som junioranalytikere?

Forlagsbransjen har alltid stolt på praksisplasser. En studie fra 2019 fant at 80 prosent av de som hadde jobbet i forlag i mindre enn femten år tidligere hadde vært praktikanter.

Delvis er det en måte å få gjort drittjobben til en rimelig kostnad. Men det blekner mot den større virkeligheten at ingen forlagsskole kan utstyre noen til å bli med i et forlag på nivå med mellomleder. Den eneste måten å utvikle dyktige ansatte på i morgen er å trene praktikanter og lærlinger i dag.

Målet her er ikke å søke å erstatte praktikanter med AI, men i stedet gjøre arbeidet deres mer produktivt og givende ved hjelp av AI-verktøy, til fordel for både praktikanten og forlaget.

AI for Lydbøker

An icon of a key

AI for lydbøker fungerer veldig bra. Det er ikke perfekt, men det fungerer. Forfattere og forlag bruker nå rutinemessig AI-verktøy i produksjon av lydbøker, hovedsakelig for bøker hvor fullskala produksjon av lydbøker med fokus på forteller ikke er økonomisk gjennomførbart. Og ikke bare for engelskspråklige lydbøker, men også lydbøker i oversettelse.

Bruken av AI for lydbøker er ikke nytt; jeg rapporterte først om trenden i Publishers Weekly i 2021. Men de nyere store språkmodellene har revitalisert teknologien for automatisert lydbokfortelling.

Tilbake i 2021 bemerket jeg “Er det perfekt? Absolutt ikke. Kan det være godt nok? Sannsynligvis, hvis et forlag er villig til å bruke nødvendig tid i stemmeredigeringsfasen av prosjektet.” To og et halvt år senere, ifølge mange beretninger, er AI-stemmer uoppdagelige fra menneskelige stemmer, med mindre du lytter veldig nøye.

I november i fjor introduserte Meta (Facebook) “Seamless,” som er i stand til å “overføre toner, følelsesuttrykk og vokalstil-kvaliteter” inn i oversettelsen av 200 språk. En lydbok kan umiddelbart oversettes til flere språk med ekstraordinær kvalitet.

Også i 2021 rapporterte jeg at “Audibles blokkering av distribusjon av lydbøker med ikke-menneskelige fortellere er et reelt problem som kan ta tid å løse.” I mellomtiden kunngjorde både Google og Apple programmer som tillater forfattere å lage lydbøker med AI-genererte stemmer. 5. desember begynte Findaway Voices av Spotify å akseptere “digitalt stemmefortalte lydbøker fra Google Play Books for distribusjon til utvalgte detaljhandelspartnere.”

Tidlig i november 2023 kunngjorde Amazon at Kindle Direct Publishing (KDP) forfattere snart ville få tilgang til en tjeneste som tillater dem å “raskt og enkelt produsere en lydbokversjon av eboken deres ved bruk av virtuell stemmefortelling, en syntetisk taleteknologi.” I januar 2024 rapporterte Jane Friedman (betalingsmur) “Audible begynte stille å tillate AI-fortalte lydbøker å komme inn i deres butikkfront sent i fjor høst, lenge etter at andre forhandlere hadde gjort det samme.”

Og selvfølgelig bruker jeg AI for lydbokversjonene av denne boken.

AI for Bokoversettelse

An icon of a key

AI for bokoversettelse fungerer. Kanskje ikke like bra som det fungerer for automatisert lydbokproduksjon. Men det nærmer seg veldig raskt. Ikke-skjønnlitteratur kan være først. Skjønnlitteratur kan følge. Sakprosa byr på et annet sett med utfordringer.

Jeg arrangerte et webinar om AI for bokoversettelse, sponset av BISG, i juni 2024. Videoen er online på YouTube. Jane Friedman beskrev også programmet i sitt nyhetsbrev Hot Sheet.

Emnet er komplekst og nyansert. En ting jeg finner fascinerende er hvor lenge folk har prøvd å automatisere oversettelse. Det er en påminnelse om at bøker, som fyller vårt univers, er en så liten andel av skriftlig kommunikasjon, enda mer i denne online-alderen.

Warren Weaver, kreditert som faren til maskinoversettelse (MT), bemerket til en kollega, “Når jeg ser på en artikkel på russisk, sier jeg: ‘Dette er egentlig skrevet på engelsk, men det har blitt kodet i noen merkelige symboler. Jeg skal nå begynne å dekode.’” For en maskin er språk bare kode. Det er ikke kultur og følelse og storheten av skriftlig språk. Det er en oppgave med tall og kode.

Klart vil skillet mellom skjønnlitteratur og sakprosa veie tungt i AI-oversettelse. Chat AI er sterk på stil, men den faller kort på fakta. Det er veldig tidlige dager, men jeg er tilbøyelig til å tro at Chat AI vil skinne med skjønnlitteratur, men komme til kort med sakprosa. (Likevel fortsetter jeg med å maskinoversette denne faktatunge boken!)

Skjønnlitteratur er veldig mye elefanten i rommet. Det er dyrebart og ærverdig og med rette. Oversettere kan bruke timer på å diskutere et enkelt ord eller uttrykk. Chat AI må trå forsiktig i disse farvannene.

Men dette er fruktbart territorium. Så langt jeg kan fastslå (fra knappe data), var det bare 9 500 oversettelser av fagbøker i 2023. Selv om jeg tar feil med en stor faktor, er det klart at få bøker blir oversatt fra fremmedspråk til engelsk.

På samme måte fant jeg en statistikk som indikerer at det i 2023 bare var 7 230 oversettelser fra engelsk til spansk (i spanske bokmarkeder). Det virker latterlig lite.

Det er en stor mulighet her.

Mesteparten av bruken av AI for bokoversettelse vil være for bøker hvor oversettelse aldri ble ansett som økonomisk gjennomførbart. Det vil sannsynligvis ha en innvirkning på jobber for oversettere av “midtmarked”-bøker; jobbveksten vil være i prosjektledelse og QA. Vil det oppveie tapet av jobber? Lite sannsynlig.

Som med de fleste aspekter av AI, er det utfordrende spørsmål som må adresseres, og ingen enkle svar.

Som jeg bemerker i programvareseksjonen, er Leanpub og DeepL de to selskapene som tilbyr AI-assisterte bokoversettelsestjenester til forfattere og forlag.

AI for vitenskapelig publisering

An icon of a key

Handelsforlag og forfattere av alle slag bør følge nøye med på AIs utvikling i det vitenskapelige publiseringsmiljøet. Det avanserer langt raskere enn i forbrukerpublisering.

Jeg ser to grunner til fremgangen. For det første er forfatterne innen vitenskapelig publisering akademikere av yrke, og i STM-sektoren (vitenskapelig, teknisk og medisinsk), er de ofte forskere med avanserte grader. Helt bortsett fra publisering, undersøker de og omfavner ofte AI i sitt arbeid. De ville bli mer overrasket over å finne at deres forlag ikke utforsker bruken av AI i redigering og publisering av deres arbeid.

Dette flyter opp til det vitenskapelige publiseringsøkosystemet, hvor, så ofte som ikke, redaktørene er forskere selv. For dem er teknologi ikke skremmende.

Jeg kommer ikke til å gå dypere inn på detaljene i denne boken; jeg vil rapportere om det mer inngående på bloggen min.

AI for forfattere

Forfattere og forlag ser ofte på seg selv som å leve i to ensomheter, forbundet, men egentlig adskilt. Dette har stort sett vært sant i moderne publisering.

Tider endres. Der forlagene en gang var urørlige, er det nå toppforfatterne som bestemmer. Som jeg diskuterer andre steder, er selvpubliserte forfattere pionerene. De bærer lite av den bagasjen som tynger tradisjonell publisering.

Når forlag ser på AI, ser de få muligheter. Når jeg snakker med forfattere om AI, er verden deres østers. Mulighetene er nærmest endeløse:

Forfatterskap og redigering

  • Prøve å skrive og publisere hele bøker

  • Prøve å få ideer til et nytt prosjekt

  • Prøve å få ideer innenfor en ny bok

  • Finjustering av historien

  • Forskning

  • Faktasjekk

  • Skrivepartner

  • Utviklende redigering

  • Korrekturlesing

  • Stavekontroll og grammatikkontroll

  • Korrekturlesing

Illustrasjon/bildebehandling

  • Lage illustrasjoner og diagrammer

  • Omslagsdesignskisser

  • Videopromoteringer

Markedsføring

  • Automatisere innsendinger til agenter, forlag, konkurranser, venner, forespørsler om blurb

  • Generere markedsføringsmateriale: pressemeldinger, blogginnlegg, sosiale medier, etc.

  • Lage nettsteder

Forfattere vil drive mye av forandringen i industrien adopsjon av AI, enten for eller mot.

De er mottakerne av mye av startup-innovasjonen rundt AI i forfatterskap og publisering — noen 70% av startupene ønsker å jobbe med forfattere på deres reise.

Bekymringer og risikoer rundt AI

An icon of a key

Bekymringene rundt AI er alvorlige. Risikoene er reelle. Noen ganger blir de uttrykt på hysteriske måter, men når du ser nærmere på det, har AI potensialet til å være enormt destruktivt.

Det er så mange spørsmål og bekymringer rundt AI at de fyller bind på egen hånd. Her er en ordsky av temaene jeg overvåker. Jeg er sikker på at jeg mangler noen.

En ordsky sentrert rundt begrepet 'AI', med relaterte begreper som 'bekymringer', 'etikk' og 'menneskelighet' rundt det.

Det er mye informasjon tilgjengelig om hvert av disse temaene, og jeg oppfordrer deg til å lese så dypt du kan. Det er mulig du vil konkludere med at risikoene oppveier fordelene, og at du ikke ønsker å forfølge bruken av AI, enten personlig eller innen din organisasjon. Den avgjørelsen bringer sine egne risikoer; den vanlige, å bli etterlatt. Men det er et personlig valg.

Hvis du googler “bøker om risikoen ved AI” vil du finne et utvalg av verdifulle bind. En nylig podcast som jeg fant spesielt skremmende var Ezra Kleins samtale med Dario Amodei, medgrunnlegger og administrerende direktør i Anthropic (selskapet som utvikler Claude.ai). Du lærer at disse selskapene er klar over risikoene. Amodei refererer til et internt risikoklassifiseringssystem kalt A.S.L., for “AI Safety Levels” (ikke American Sign Language). Vi er for øyeblikket på ASL 2, “systemer som viser tidlige tegn på farlige kapasiteter — for eksempel evnen til å gi instruksjoner om hvordan man bygger biologiske våpen.” Han beskriver ASL 4 som “muliggjøre for statlige aktører å øke sine kapasiteter betydelig … hvor vi ville bekymre oss for at Nord-Korea eller Kina eller Russland kunne øke deres offensive kapasiteter betydelig på forskjellige militære områder med AI på en måte som ville gi dem en betydelig fordel på geopolitisk nivå.” Skremmende saker.

Innenfor denne dystre konteksten vil jeg fremheve de mest relevante problemene for forfattere og utgivere.

Opphavsrett krenket?

An icon of a key

Opphavsrettsproblemene er en kompleks og uklar suppe. Det virker sikkert at noen bøker som fortsatt er under opphavsrett ble inkludert i treningen av noen LLM-er. Men det er absolutt ikke tilfelle, slik noen forfattere frykter, at alt deres arbeid ble sugd opp i hver eneste av de store språkmodellene.

Opphavsrettsproblemene er både spesifikke og brede. Det er velkjent at alle LLM-ene er trent på det åpne nettet—alt som kan skrapes fra de 1,5 milliarder nettstedene på nettet i dag, enten det er avisartikler, innlegg på sosiale medier, nettlogger og, tilsynelatende, transkripsjoner av YouTube-videoer.

Det er beviselig at minst én av LLM-ene inntok den faktiske teksten til tusenvis av bøker som ikke er i det offentlige domenet.

Var det lovlig å innta all denne teksten for å hjelpe til med å bygge milliard-dollar KI-selskaper, uten noen kompensasjon til forfatterne? KI-selskapene argumenterer for rimelig bruk; domstolene vil til slutt avgjøre. Selv om det var lovlig, var det etisk eller moralsk riktig? Etikken virker mindre kompleks enn de juridiske hensynene. Du bestemmer.

Lovene rundt opphavsrett forutså åpenbart ikke de unike utfordringene som KI bringer til problemet, og å lete etter juridiske løsninger vil ta tid, kanskje år. (Hvis du ønsker å dykke dypere inn i hvorfor lovene er uegnede til det spesielle problemet, les det utmerkede papiret av A. Feder Cooper og James Grimmelmann kalt “The Files are in the Computer: Copyright, Memorization, and Generative AI.”)

Her er en liste over tretten av de mest fremtredende søksmålene, ikke alle av dem har å gjøre med bøker; også bilder og musikk. Og her er en annen liste som oppdaterer statusen for alle søksmålene.

Opphavsrett og KI for forfattere

An icon of a key

Forfattere står overfor ytterligere problemer rundt opphavsretten til KI-generert innhold.

Den amerikanske opphavsrettskontorets posisjon om opphavsretten til KI-generert innhold sier at KI alene ikke kan inneha opphavsrett fordi det mangler den juridiske statusen til en forfatter. Det gir mening. Men dette forutsetter at 100% av arbeidet er KI-generert. Som diskutert andre steder, er det få forfattere som kommer til å la KI generere en hel bok. Mer sannsynlig er det 5%, eller 10% eller… Og her snubler opphavsrettskontoret (som jeg ville gjort).

I en nyere avgjørelse konkluderte kontoret med at en grafisk roman bestående av menneskeskrevet tekst kombinert med bilder generert av KI-tjenesten Midjourney utgjorde et opphavsrettsbeskyttet verk, men at de individuelle bildene i seg selv ikke kunne beskyttes av opphavsrett. Hjelpe meg!

An icon of a key

Det er nok å si at forfattere og utgivere må være våkne for de utviklende opphavsrettsproblemene, på flere fronter.

Hva er de langsiktige implikasjonene?

Noen sammenligner den nåværende rettsforfølgelsen med Google-bøker-søksmålet, som tok 10 år å løse juridisk. Hvem vet hvor lenge ankeprosessen vil dra ut for disse sakene. I mellomtiden er det klokt av utgivere å handle som om KI-selskapene vil tape, noe som, i det minste teoretisk, utsetter alle som lisensierer, eller kanskje til og med bruker Chat KI, for en slags betinget ansvar.

Men det er ikke det mest alvorlige problemet for utgivere. Det er oppfatning. For mange forfattere, noen fremtredende, noen obskure, er brønnen blitt forgiftet. KI er radioaktivt innen skrive- og utgivermiljøet. Alt som til og med lukter av KI tiltrekker seg intens kritikk.

Det finnes mange eksempler. I en nylig hendelse annonserte Angry Robot, en britisk utgiver “dedikert til det beste innen moderne voksen science fiction, fantasy og WTF,” at de ville bruke KI-programvare, kalt Storywise, for å sortere gjennom en forventet stor mengde manusinnsendelser. Det tok bare fem timer for selskapet å droppe planen og gå tilbake til “den gamle innboksen.

Det uutholdelige dilemmaet for forlag som bruker AI-verktøy internt: hvis forfatterne dine finner ut av det, vil du ha vanskelig for å tåle den påfølgende stormen. Jeg tror at forlagene ikke har noe valg annet enn å være modige, å ta i bruk (i det minste noen av) verktøyene, forklare tydelig hvordan disse verktøyene er trent og hvordan de brukes, og fortsette fremover.

I Storbritannia tar Society of Authors en hard linje: “Be din utgiver bekrefte at den ikke vil gjøre betydelig bruk av AI til noe formål i forbindelse med arbeidet ditt - for eksempel korrekturlesing, redigering (inkludert autentisitetslesing og faktasjekking), indeksering, juridisk vurdering, design og layout, eller noe annet uten ditt samtykke. Du kan ønske å forby lydbokopplesning, oversettelse og omslagsdesign utført av AI.”

Authors Guild ser ut til å akseptere at “forlagene begynner å utforske bruken av AI som et verktøy i den vanlige driften, inkludert redaksjonelle og markedsføringsmessige formål.” Jeg tror ikke at mange medlemmer av Guild er like forståelsesfulle.

Lisensiering av innhold til AI-selskaper

De fleste forlag, og mange forfattere, leter etter måter å lisensiere innhold til AI-selskaper. Alle har forskjellige ideer om hva lisensvilkårene skal være, og hvor mye innholdet deres er verdt, men i det minste er diskusjonene i gang.

Det er flere oppstartsbedrifter som ønsker å samarbeide med forlag (og i noen tilfeller individuelle forfattere). Calliope Networks og Created by Humans er begge interessante i denne sammenhengen.

I midten av juli annonserte Copyright Clearance Center, som lenge har vært bransjens hovedaktør innen kollektiv opphavsrettslisensiering, tilgjengeligheten av “rettigheter til gjenbruk av kunstig intelligens (AI) innenfor sine årlige opphavsrettslisenser (ACL), en innholdslisensieringsløsning for hele virksomheten som tilbyr rettigheter fra millioner av verk til virksomheter som abonnerer.”

Publishers Weekly dekket kunngjøringen og siterte Tracey Armstrong, president og administrerende direktør i CCC, som sa “Det er mulig å være pro-AI og pro-oppdrett, og å kombinere AI med respekt for skapere.”

Selv om dette ikke er altomfattende, er det sannsynligvis et gjennombrudd for å bringe forlagsbransjen nærmere en viss grad av samarbeid med utviklerne av store språkmodeller.

Det er for sent å unngå AI

An icon of a key

For forfattere og forlag som foretrekker å ikke bli besudlet med AI, er nyheten dårlig: du bruker AI i dag, og har brukt det i årevis.

Kunstig intelligens, i forskjellige former, er allerede integrert i de fleste programvareverktøyene og tjenestene vi bruker hver dag. Folk stoler på AI-drevet stave- og grammatikkontroll i programmer som Microsoft Word eller Gmail. Microsoft Word og PowerPoint bruker AI til å gi skriveforslag, tilby design- og layoutanbefalinger, og mer. Virtuelle assistenter som Siri og Alexa bruker naturlig språkbehandling for å forstå talekommandoer og svare på spørsmål. E-posttjenester bruker AI til å filtrere meldinger, oppdage spam og sende varsler. AI driver kundeservicechatboter og genererer produktanbefalinger basert på kjøpshistorikken din.

Og mye av dette er basert på store språkmodeller, slik det er med ChatGPT.

For en forfatter eller redaktør å si, “Jeg vil ikke at AI skal brukes på manuskriptet mitt,” er, generelt sett, nesten umulig, med mindre både de og redaktørene deres jobber med skrivemaskiner og blyanter.

De kan prøve å si, “Jeg vil ikke at generativ AI” skal brukes på boka deres. Men det er vanskelig å skjære gjennom. Grammatikkontrollprogramvare ble ikke opprinnelig bygget på generativ AI. Grammarly har lagt det til som en ingrediens i produktet sitt, som alle andre stave- og grammatikkontrollere vil gjøre. Generativ AI er også kjernen i markedsføringsprogramvaren som tilbys.

Når forfattere bruker AI

En annen side ved forfattere og bruken av AI har likheter med opphavsrettsspørsmålet som ble diskutert ovenfor. I ytterste konsekvens ser vi 100% AI-generert innhold bli publisert på Amazon. Det meste av det (alt?) er av forferdelig kvalitet, men det hindrer ikke at det blir publisert. (Se også Amazon-seksjonen.) Mer bekymringsfullt for forlag er AI-genererte innleveringer. Ja, AI øker mengden, men store forlag har allerede et filter for mengde. Filtrene kalles agenter. De er de som må finne ut hvordan de skal håndtere mengdeproblemet, og tilsynelatende må de finne en løsning som ikke bruker AI.

Det er noe av et eksistensielt problem – vil jeg utgi en bok skrevet av ‘en maskin’? For de fleste forlag er det et utvetydig ‘nei.’ Enkelt og greit. Vel, hva med en bok hvor 50% av innholdet ble generert av en LLM, under tilsyn av en dyktig forfatter? Hmm, la oss prøve et ‘nei’ på det også. OK: hva med 25%, eller 10%, eller 5%? Hvor trekker du grensen?

Og, nå som du har begynt med å trekke grenser, hvordan løser du dilemmaet at stave- og grammatikkverktøy nå delvis er avhengige av generativ AI? Hva med AI-drevne transkriberingsverktøy, som Otter.ai, eller transkripsjonsfunksjonen innebygd i Microsoft Word?

Jeg kan ikke finne noe forlag som har erklært at de ikke vil publisere et verk med en forhåndsbestemt mengde AI-generert tekst. Her er hva Authors Guild sier om emnet:

“Hvis en betydelig mengde AI-generert tekst, karakterer eller plott er innlemmet i manuskriptet ditt, må du opplyse dette til forlaget ditt og bør også informere leseren. Vi mener ikke at det er nødvendig for forfattere å opplyse om bruk av generativ AI når det kun brukes som et verktøy for idémyldring, idegenerering eller for språkvask.”

Unødvendig å si, ‘betydelig’ er ikke definert (Oxford definerer det som “stort nok til å bli lagt merke til eller ansett som viktig”), men innlegget forklarer videre at inkluderingen av mer enn “de minimis AI-generert tekst” vil bryte de fleste forlagskontrakter. De minimis, i juridiske termer, er ikke presist spesifisert, men betyr generelt sett mer eller mindre det samme som betydelig.

Kan AI oppdages i skriving?

Jeg holdt et webinar om AI-deteksjon, sponset av BISG, i mai 2024. Opptaket er tilgjengelig på YouTube. Jane Friedman ga en omfattende oppsummering av webinaret i sitt nyhetsbrev Hot Sheet.

For mange forfattere betyr AI’s toksisitet at de holder det langt unna sine ord. Forlag har en spesiell byrde – de skaper ikke teksten, men, når den er publisert, bærer de en betydelig forpliktelse til teksten. Vi har sett mange dynamitt eksplodere nær brannfarlige bøker, enten det gjelder de sosiale implikasjonene av innholdet, eller plagiering av andre forfatteres ord og ideer. Nå med AI står vi overfor et helt nytt sett med etiske og juridiske spørsmål, ingen av dem ble skissert på forlagsskolen.

En del av det virker likt det folk bekymrer seg for hos studenter, at bruk av AI på en eller annen måte er juks, likt å kopiere fra en Wikipedia-artikkel, eller kanskje bare be en venn om å skrive essayet ditt.

En av våre webinarforedragsholdere, en pedagog, José Bowen, delte sin avsløring for studenter. Det er ikke akkurat det du bruker for en forfatter, men det demonstrerer noen slags “risikonivåer” av AI-bruk.

Malfasjonsavtale for studenter

  • Jeg gjorde alt dette arbeidet på egen hånd uten hjelp fra venner, verktøy, teknologi eller AI.

  • Jeg gjorde første utkast, men ba deretter venner/familie, AI omskriving-/grammatikk-/plagiatprogramvare om å lese det og komme med forslag. Jeg gjorde følgende endringer etter denne hjelpen:

    • Fikset stave- og grammatikkfeil

    • Endret struktur eller rekkefølge

    • Skrev om hele setninger/avsnitt

  • Jeg satt fast på problemer og brukte en synonymordbok, ordbok, ringte en venn, gikk til hjelpesenteret, brukte Chegg eller annen løsningsleverandør.

  • Jeg brukte AI/venner/tutor til å hjelpe meg med å generere ideer.

  • Jeg brukte assistanse/verktøy/AI til å lage en disposisjon/første utkast, som jeg deretter redigerte. (Beskriv naturen av ditt bidrag.)

Og så kan et forlag utarbeide noe som dette for sine forfattere. La oss si at forfatteren avslører det øverste nivået: Jeg brukte AI i stor grad, og redigerte deretter resultatene. Hva da? Avviser du automatisk manuskriptet? I så fall, hvorfor?

Og, samtidig, hvis du følger med, lærer du at det manuskriptet du nettopp leste og elsket, som forfatteren sverget ikke engang ble stavekontrollert av Grammarly, faktisk kunne ha vært 90% generert av AI, av en forfatter som er ekspert på å skjule bruken.

Du blir da tvunget til å revurdere spørsmålet. Det blir, “Hvorfor er jeg så fordømt bestemt på å oppdage denne tingen som er uoppdagelig?”

Delvis skyldes det den alarmistiske bekymringen rundt opphavsrettslighet for AI-generert tekst. Opphavsrettskontoret vil ikke tilby opphavsrettsbeskyttelse til 100 % AI-generert tekst (eller musikk, eller bilder, osv.). Men hva med 50 % AI-generert tekst? Vel, vi vil kun dekke de 50 % som er generert av forfatteren. Og hvordan vil du vite hvilken halvdel? Vi kommer tilbake til deg om det.

Ville det ikke vært flott om du bare kunne mate hvert manuskript inn i en programvare som ville fortelle deg om AI hadde blitt brukt i å skrive teksten?

Hvis vi ser bort fra problemet med at den eneste måten å gjøre dette på ville være å bruke AI-verktøy, er det viktigste spørsmålet, ville programvaren være (tilstrekkelig) nøyaktig? Kunne jeg stole på at den forteller meg om AI hadde blitt brukt til å skrive et manuskript? Og kunne jeg stole på at den ikke produserte “falske positiver” - å indikere at AI hadde blitt brukt, når det faktisk ikke hadde blitt det?

Det finnes nå mye programvare på markedet som tar for seg disse utfordringene. Mange av de akademiske studiene som evaluerer denne programvaren peker på dens upålitelighet. AI-generert tekst slipper gjennom. Verre, tekst som ikke var generert av AI blir feilaktig merket som forurenset.

Men bokutgivere vil ha noen form for sikkerhetsforanstaltninger på plass. Det ser ut til at, i beste fall, kan disse verktøyene varsle deg om mulige bekymringer, men du må alltid dobbeltsjekke. Så kanskje det kan varsle deg om tekster som trenger å bli undersøkt mer nøye enn andre? Er dette en effektivitet?

Ekte effektivitet vil bli funnet i å gå utover bekymringer rundt opprinnelsen til en tekst, i stedet for å opprettholde våre eksisterende kriterier for dens kvalitet.

Jobbtap

“Du kommer ikke til å bli erstattet av AI. Du kommer til å bli erstattet av noen som vet hvordan man bruker AI.” —Anonym

Jobbtap fra AI-adopsjon kan bli alvorlig. Estimatene varierer, men tallene er dystre. Det finnes åpenbare eksempler: San Franciscos førerløse taxier eliminerer… taxi- og ridesjåfører. AI-støttet diagnostikk kan redusere behovet for medisinske teknikere.

Optimisten i meg peker på, som ett eksempel, innføringen av regnearket og dets innvirkning på sysselsettingen. Som du ser i diagrammet nedenfor, har sysselsettingen i “Regnskap, skatteforberedelse, bokføring og lønnstjenester” nesten doblet seg siden 1990 - neppe en anklage mot regneark og andre teknologier som i stor grad har automatisert disse oppgavene.

En linjegraf som viser antall ansatte i regnskap, skatteforberedelse, bokføring og lønnstjenester fra 1990 til 2020.

Ethan Mollicks studie med Boston Consulting Group (BCG) var et eksperiment som hadde som mål å bedre forstå AIs innvirkning på arbeid, spesielt på komplekse og kunnskapsintensive oppgaver. Studien involverte 758 BCG-konsulenter, tilfeldig tildelt til å bruke eller ikke bruke OpenAIs GPT-4 for to oppgaver: kreativ produktinnovasjon og forretningsproblemløsning. Studien målte ytelsen, atferden og holdningene til deltakerne, samt kvaliteten og egenskapene til AI-utgangen.

Blant funnene var at “AI fungerer som en ferdighetsnivåutjevner. Konsulentene som scoret dårligst da vi vurderte dem i starten av eksperimentet, hadde det største hoppet i ytelsen, 43 %, da de fikk bruke AI. De beste konsulentene fikk fortsatt et løft, men mindre av et.” Hele artikkelen er avslørende, og som med alt Mollicks arbeid, provoserende, men likevel tilgjengelig.

Utdanning

Utdanning har vært i sentrum av debattene om AI. Innføringen av AI i klasserom sees stort sett som en forbannelse, eller i det minste en utfordring. Andre lærere, som PW’s hovedtaler Ethan Mollick, omfavner AI som et bemerkelsesverdig nytt verktøy for lærere; Mollick insisterer på at studentene hans arbeider med ChatGPT.

Den beste boken om emnet er Teaching with AI: A Practical Guide to a New Era of Human Learning av José Antonio Bowen og C. Edward Watson.

Jeg kommer ikke til å gå i dybden på utdanningspublisering i denne boken - det er et enormt tema, som krever en egen rapport. Det kan argumenteres for at publisering blir av sekundær interesse innen utdanning: AI-verktøy er programvare, ikke innhold, per se.

Søkingens fremtid

An icon of a key

Søking er et betent tema i AI. Jeg oppfordrer deg til å besøke perplexity.ai og You.com for å få et glimt inn i hvor ting er på vei. Neste gang du tenker på å starte et Google-søk, gå over til Perplexity i stedet. Det vil ikke virke dramatisk annerledes - det ligner på kunnskapsgrafene som Google ofte plasserer på høyre side av en søkeskjerm, eller noen ganger på toppen av søkeresultatoppføringene. I stedet for å måtte klikke på en lenke, er informasjonen rett der for deg.

Perpleksitet går et skritt videre ved å omformulere informasjonen den samler fra flere kilder slik at du virkelig ikke trenger å klikke på en lenke. Den gir lenker til sine kilder, men å klikke på dem er vanligvis unødvendig—du har allerede fått svaret på spørsmålet ditt.

Denne tilsynelatende beskjedne endringen har enorme implikasjoner for alle selskaper og alle produkter som delvis er avhengige av å bli oppdaget gjennom søkemotorer. Hvis søkere ikke lenger blir sendt til nettstedet ditt, hvordan kan du engasjere dem og konvertere dem til kunder? Enkelt svar, det kan du ikke.

Joanna Penn er i forkant av å tenke på innvirkningen av ny teknologi på skriving og publisering. Hun tok opp dette komplekse emnet på sin podcast og blogg i desember i fjor.

Det er fortsatt tidlige dager for AI og transformasjonen av søk.

Søppel bøker på Amazon

An icon of a key

AI-genererte søppel bøker på Amazon er et problem, selv om deres alvor kan være mer visceral enn bokstavelig. På den ene siden spammer disse bøkene den nettbaserte bokhandelen med innhold av lav kvalitet og plagiert innhold, noen ganger ved å bruke navnene til ekte forfattere for å lure kunder og dra nytte av deres omdømme. Bøkene er ikke bare en plage for lesere, men også en trussel for forfattere, potensielt frarøvende dem hardt opptjente royalties. AI-genererte bøker påvirker også rangeringen og synligheten til ekte bøker og forfattere på Amazons nettsted, da de konkurrerer om de samme nøkkelordene, kategoriene og anmeldelsene.

En søt kattunge som sitter på en strand med blomster rundt seg og en bildetekst som sier 'Morsomme og søte kattebilder kan ikke sees i verden'.

Amazon krever nå at forfattere avslører detaljer om deres bruk av AI i opprettelsen av bøkene sine. Det er ingen tvil om at dette kan misbrukes.

Prøv å søke på Amazon etter “AI-genererte bøker.” Det er mange. Noen av resultatene er instruksjonsbøker om bruk av AI for å lage bøker. Men andre er, uten skam, AI-genererte. “Funny and Cute cat images-You are can’t see this types of photos in the world-PART-1” (stet) er kreditert Rajasekar Kasi. Det er ingen detaljer om hans (?) bio på en forfatterside, men seks andre titler er kreditert til navnet. Boken, utgitt 26. august 2023, har ingen anmeldelser og ingen salgsrangering. Den ugrammatiske tittelen på e-boken samsvarer ikke med den ugrammatiske tittelen på omslaget til trykkeboken.

Men andre forfattere bruker klart AI omfattende i opprettelsen av bøkene sine, og avslører det ikke. Som jeg diskuterer ovenfor, er det nesten umulig å oppdage AI-bruk med dyktige ‘forfalskere.’ Fargeleggingsbøker, dagbøker, reisebøker og kokebøker blir generert med AI-verktøy på en brøkdel av tiden og innsatsen til tradisjonell publisering.

Søk “korean vegan cookbook” og du vil finne den beste tittelen, av Joanne Lee Molinaro, på førsteplass. Men like bak den er det andre titler som er åpenbare kopier. “The Korean Vegan Cookbook: Simple and Delicious Traditional and Modern Recipes for Korean Cuisine Lovers” har to anmeldelser, inkludert en som bemerker “Dette er ikke en vegansk kokebok. Alle oppskriftene har kjøtt- og eggeingredienser.” Men boken er #5,869,771 i salgsrangering, mot originalen, som står på #2,852 på listen.

Det er vanskelig å fastslå omfanget av skaden forårsaket. Ingenting godt kan komme ut av dette, men hvor ille er det?

Amazon har retningslinjer på plass som gjør det mulig å fjerne enhver bok som ikke klarer å “gi en positiv kundeopplevelse.” Kindles innholdsretningslinjer forbyr “beskrivende innhold ment å villede kunder eller som ikke nøyaktig representerer innholdet i boken.” De kan også blokkere “innhold som vanligvis er skuffende for kunder.” Er det det rene volumet som overvelder Amazons voktere? Eller er det en annen grunn?

Skjevhet

LLMer er trent på det som allerede er publisert på nettet. Det som er publisert på nettet er fullt av skjevheter, og derfor reflekterer LLMene den skjevheten. Og selvfølgelig ikke bare skjevhet, men hat, reflektert i læringen deres, og nå en potensiell utgang i AI-genererte ord og bilder. Porno er en annen naturlig mottaker av AIens bemerkelsesverdige evne med bilder, og det er nylig bekymringsfulle historier om unge kvinner som finner fabrikerte nakenbilder, med deres mannlige klassekamerater som sannsynlige mistenkte. The New York Times rapporterte separat om en økning i nettbilder av seksuelt misbruk av barn.

Forfattere og utgivere må være oppmerksomme på disse innebygde begrensningene når de bruker AI-verktøy.

Kreativitet kan være en Klisjé

An icon of a key

Spørsmålet om maskiner kan være virkelig kreative er fortsatt et hett diskusjonstema. Det avhenger delvis av hvordan vi definerer kreativitet.

“KI vil aldri være kreativ.” Det er et kjent mantra.

Vi vet alle hva kreativitet er, gjør vi ikke?

Cambridge: “evnen til å produsere eller bruke originale og uvanlige ideer.”

Britannica: “evnen til å skape eller på annen måte bringe til eksistens noe nytt, enten en ny løsning på et problem, en ny metode eller enhet, eller et nytt kunstnerisk objekt eller form.”

Jeg bestrider ikke at kreativitet, i denne forstanden, er langt utenfor rekkevidden til LLM-er.

Min argumentasjon er at det meste av det som fremstår som kreativt—og ofte virker ganske kreativt—faktisk er iterativt. Noe som fungerer utmerket for mange ting, inkludert de fleste annonser.

Men å heve ’kreativitets’stangen, og deretter redusere LLM-er, er å sette en umulig høy barriere som KI uunngåelig feiler. Så avviser folk det som “vel, jeg sa jo at det ikke er kreativt.”

Og dermed går de glipp av det iterative som det er veldig bra på.

Jeg vil legge ut en lang essay om dette emnet i nær fremtid, etter at jeg har fullført å lese:

The Creativity Code, av Marcus du Sautoy, og

The Artist in the Machine, av Athur I. Miller

Litteraturteori for Roboter, av Dennis Yi Tenen

En Annen Tanke

Jeremiah Owyang er en bransjeanalytiker basert i Silicon Valley. Han er en KI-tilhenger, men han har sett hype før. Han bemerker at han “aldri har sett så rask utvikling på så kort tid.”

Som Owyang sier det, små team av programmerere kan nå bruke LLM-er til å samle “følende skapninger”—som en 4-åring—på to dager. De er i stand til å:

  • ‘Se’ med datamaskinsyn hva som skjer i den virkelige verden,

  • ‘Høre’ via stemmekommandoer og omgivende lyder i den virkelige verden,

  • ‘Tenke’ gjennom å prosessere den ovennevnte virkelige verdens input,

  • ‘Lære’ ved å få tilgang til de forhåndstrente dataene,

  • ‘Referere’ eksklusive datasett,

  • ‘Snakke’ med livaktige stemmer som har betoning og tone på alle språk,

  • ‘Skrive’ gjennom tekstkommunikasjon, i alle formater eller stiler som kreves,

  • ‘Tegne’ ved å lage bilder spontant, og

  • ‘Interagere’: den kan proaktivt engasjere seg i dialog, stille spørsmål, eller tildele KI-agenter til å fullføre oppgaver på egen hånd.

Dette er ekstraordinært og uten sidestykke. Vil det ha betydning for utgivelse? Du bestemmer.

Gode Ting Utenfor Utgivelse

KI ligger bak noen banebrytende prestasjoner utenfor utgivelse. Medisin er KIs reklameplakat, men det finnes også kraftfulle historier fra andre bransjer. Relevansen til utgivelse stammer fra et retorisk spørsmål: KI kan redde liv. Men du tror ikke det kan hjelpe forlagene?

Målet med denne korte delen er bare å tilbakevise argumentet om at, hvis man er overbevist om at KI ikke kommer til å hjelpe utgivelse, kan KI muligens hjelpe noen i det hele tatt?

KI og medisin

Ved å lese mars 2024-utgaven av The Economist, fordypet jeg meg i deres teknologitillegg om helse og KI. Over de siste årene har medisin konsekvent blitt trukket fram som kunstig intelligens’ lyspunkt. De fleste rapportene er positive. Men fortsatt vil The Economist artikkelen slå deg i bakken. De uttrykker mange velartikulerte forbehold. Men du vil også lese at KI i medisin “representerer en mulighet til å forbedre livene til hundrevis av millioner, til og med milliarder.”

Et annet retorisk spørsmål for de som ønsker enten å forby KI-teknologi, eller i det minste sette et moratorium på utviklingen: ville du ofret dens potensielle verdi for helsen til millioner for å tilfredsstille din bekymring for en usikker fremtid?

KI og TSA på flyplasser

Vi har vært der: de endeløse køene, den sakte bevegelsen av håndbagasjen gjennom røntgenskannerne.

TSA sine deteksjonsfeil er godt dokumentert, men ikke mye diskutert.

Det som plager meg mest er de triste arbeiderne, som stirrer på skjermene sine i timevis. For hva? Ikke bare er det en miserabel jobb, men som vanlige dødelige, er de ikke særlig flinke til det.

Enter AI. Hvis det kan oppdage vanskelig å oppdage svulster i lungene, er jeg sikker på at det kan oppdage smuglergods i håndbagasjen. Og avlaste mennesker fra en utakknemlig oppgave som de ikke passer til å håndtere.

Ifølge denne rapporten er det nye TSA AI-støttede screeningprogrammet i gang.

Essay: AI’s innvirkning på bokutgivelsesindustrien

Jeg snakket nylig med Peter Brantley, min partner i AI-webinarene, om hvordan vi kan forme kommende AI-programmer. Peter jobber mye innen bibliotekmiljøet, og hadde nettopp kommet tilbake fra et heldagsarrangement i Los Angeles med rundt 150 av sine bibliotekskolleger, hvor de utforsket, personlig, AI’s potensielle påvirkning på deres sektor. Samtalen var livlig og grundig. Hvorfor, undret han, har ikke forlag som utgir handelsbøker slike samlinger? AI er et tema på hver utgivelseskonferanse: hvorfor er det ikke hovedtemaet?

De virkelige konsekvensene av AI

Svaret han kom frem til er at forlag som utgir handelsbøker ennå ikke har konkludert med at AI kommer til å ha noen virkelige konsekvenser for deres virksomhet. På kjernen av deres virksomhet. På deres evne til å drive virksomhet. Joda, det kan kanskje hjelpe med å skrive en pressemelding eller forfatte et avvisningsbrev for manuskript, men de antar at utgivelsesindustrien fortsatt vil trekke seg fremover som den har gjort i flere tiår, med gjennomsnittlig tid fra kontrakt til trykt bok som strekker seg opp til to år.

Samtidig står forlag selvfølgelig overfor nærmere utfordringer som er mer presserende enn AI. Papirpriser. Fraktkostnader. Krympende marginer. Salget er stort sett flatt totalt sett. Med alle disse pressene, hvem har tid eller kapasitet til å bry seg om AI?

Men de andre kreative industriene forstår det. Kunst og design forstår det. Reklame forstår det. Hollywood ser hva som kommer, og det gjør også musikkindustrien. Journalister ser på med frykt.

Andre bokutgivelsesektorer begynner å få grep om AI’s innvirkning. Akademisk publisering er dypt inne i teknologien. Men forlag for handelsbøker oppfører seg som om det vil være få virkelige konsekvenser fra AI.

Hva kan de virkelige konsekvensene være? Vil det påvirke tilgangen på bøker? Eller etterspørselen etter bøker?

Tilgang: Ja, AI er skyld i en mengde nye søppel-bøker på Amazon. Hundrevis? Sikkert. Tusenvis? Kanskje. Millioner? Nei. Hvor mange bøker er på Amazon? Mer enn 50 millioner. Det er allerede veldig overfylt.

Uansett, det er klart at på kort sikt kommer ikke AI til å skrive hele bøker som folk faktisk vil lese. Dets verdi hittil er som en skrivenkompis—kritiserer, foreslår, av og til spinner ut noen få avsnitt med brukbar tekst. Nei, på kort sikt kommer ikke AI til å radikalt endre utgivelsesproduktene, tilgangen på nye bøker.

Etterspørsel: Nei, ingen etterspør AI-genererte bøker. Det er ikke en faktor. Og jeg kan ikke se for meg noe scenario der AI vil påvirke etterspørselen etter bøker bredere.

Hva med utgivelsesprosessen? Ja, det vil endre seg. I det minste litt. Som vi oppdaget på vårt Publishers Weekly AI-arrangement i fjor høst, ser forlag etter hjelp fra AI her og der: markedsføring, redaksjonelt arbeid, litt av det ene og litt av det andre.

Er det mulig at det vil være få reelle konsekvenser av AI på utgivelse av skjønnlitteratur? Kanskje det bare er en leketing.

La oss derfor ta et skritt tilbake fra AI-diskusjonen og se på den vanskelige situasjonen innen skjønnlitterær utgivelse, og gjennom det, dykke ned i hvor AI sannsynligvis vil ha størst innvirkning.

Forlagsbransjen har vært i økonomisk nedgang i flere tiår

Ifølge ulike estimater har hele bokutgivelsesindustrien i USA en årlig omsetning på under 35 milliarder dollar. Selv om de skulle være 40 milliarder dollar, er Apple Computers årlige omsetning alene 10 ganger høyere. Apples bruttofortjeneste er 44% av salget, sammen med nettofortjenester på 25% av salget. Forlagsbransjen tør ikke engang å drømme om slike marginer.

Utgivelse av skjønnlitteratur har vært i en mild økonomisk nedgang i flere tiår, noen år opp noen prosent, andre år ned. Midtveis i 2024 ser salget solid ut år for år, men det er den slags sommerromanse forlagene er kjent med. Vi vinner noen, vi taper noen, men totalt sett er ikke skjønnlitterær utgivelse en vekstindustri.

I 2023, ifølge AAPs StatShot “var handelsinntektene ned 0,3%, på 8,9 milliarder dollar for kalenderåret.” Så vidt jeg kan se, tar ikke AAPs data hensyn til inflasjon. Med en inflasjon på 3,4% ville salgsnedgangen være 3,6%, nærmere 2,6% nedgang i enhetssalg rapportert av Circana.

Uten veksten av alternative formater, e-bøker og lydbøker, kunne industrien vært i svært dårlig form. E-bøker var en vekstmotor i mange år. Salget av lydbøker fortsetter å stige, opp nesten 15% i 2022 og ytterligere 9% i 2023. Ja, noe av det er substitusjonssalg, men mange av kundene for e-bøker og lydbøker er nye kunder, ikke nødvendigvis vanlige boklesere. E-bøker og lydbøker utgjorde 21% av handelssalget i fjor. Ville alle disse kundene kjøpe trykte bøker hvis trykk var alt som var tilgjengelig?

Detaljhandelspriser blir en økende bekymring ettersom kostnader og rabatter til forhandlere og grossister presser forlagsmarginene. Akademiske studier antyder at det er en viss grad av priselastisitet for bøker, men vi når sikkert motstandspunktet: bestselgende innbundne bøker nærmer seg en prisgrense på 35 dollar. “Abonnementsutmattelse” får kunder av video-on-demand til å avslutte tjenester, fokusert på de økende kostnadene for hver. Netflix sin Premium-plan koster nå 22,99 dollar i måneden; Disney Plus Duo Premium er 19,99 dollar i måneden. Som en kollega nylig bemerket, hvor mange abonnenter med stramme budsjetter vil si, å, la oss avslutte vårt Netflix-abonnement slik at jeg kan kjøpe en bok neste måned?

Bokutgivelse lønninger

Jeg skal ikke overdrive dette: det er ikke bare forfattere som strever med å tjene til livets opphold—forlagspersonell er grovt underbetalt sammenlignet med tilsvarende yrker.

Jeg holder et representativt utvalg av nylige jobbannonser i forlagsbransjen. Jeg ser på en, for en markedsføringssjef hos et forlag som rapporterte salg på litt over 30 millioner dollar i 2023. Stillingen betaler mellom 60 000 og 70 000 dollar per år. Her er en annen, for en PR-sjef hos et av forlagene som rapporterer 750 millioner dollar i årlig salg. “Denne rollen vil ha en årslønn på 74 000–79 000 dollar,” bemerker annonsen.

Ifølge U.S. Bureau of Labor Statistics National Occupational Employment and Wage Estimates, tjener markedsføringssjefer i gjennomsnitt, på tvers av alle bransjer, $166,410. “Ledere for PR” tjener i gjennomsnitt $159,420.

Bokforlag er ikke engang i nærheten. Dette er ikke nyheter for noen som jobber i forlagsbransjen. Det har alltid vært slik. Men kan forlagsindustrien opprettholde seg selv på disse lønnsnivåene? En manglende evne til å tilby kandidater selv halve lønnsstandarden lover ikke godt for en bransje som blir stadig mer digital.

I en tid med TikTok, YouTube, sosiale medier, SEO, metadata og forfatterplattformer, hva i all verden er en “PR-sjef” uansett?

De tre (og en halv) gjenværende fordelene for tradisjonelle bokforlag

Tre vedvarende fordeler for tradisjonelle bokforlag er (i) status, (ii) tilgang til store medier og (iii) tilgang til bokhandeldistribusjon. Dette gjelder ikke likt for alle tradisjonelle forlag - de største har mer av hver: mer status, bedre tilgang til store medier og bedre muligheter for å få bøkene sine på frontbordene i flest mulig bokhandler. Men samlet sett er dette de karakteristiske fordelene ved den tradisjonelle bokforlagsindustrien.

En annen verdi som forlag kan tilby er en kuratert liste over komplementære titler, hvor hver enkelt tittel drar nytte av sine følgesvenner. Tenk på et forlag som Fox Chapel, som spesialiserer seg på bøker om håndverk: hvis du liker en av deres titler, er det en rimelig sjanse for at du vil se nærmere på deres andre bøker (og magasiner) om samme emne, selv om de er skrevet av andre forfattere.

Dette krysser over til noe som bare noen få forlag har klart å utvikle, et markedsførbart merke. Tenk på serier som Wiley’s “For Dummies,” eller Oxford’s “Very Short Introductions.” Merket formidler en konsistens i redaksjonell tilnærming og kvalitet som oppmuntrer leserne til å kjøpe flere titler. Selvpubliserende forfattere lanserer ofte sine egne korte serier, hovedsakelig for skjønnlitteratur, men de kan ikke dekke bredden av disse større forlagskatalogene.

Alle de andre tjenestene som tradisjonelle forlag tilbyr kan kjøpes på det åpne markedet, med tilsvarende kvalitet, til rimelige priser (for eksempel redaksjon, design, produksjon og essensielle markedsføringsfunksjoner). Og for selvpubliserende forfattere er inntekten per solgte bok fem ganger eller mer større enn tradisjonelle royaltysatser.

Jeg vil gå litt dypere inn på dette i en kort appendiks på slutten av denne boken. Men la meg raskt nedvurdere verdien av de tre største fordelene. Status er bra for skryterettigheter, men har beskjeden kontantverdi. Bokomtaler og annen stor medieeksponering har nå en sterkt redusert innvirkning på boksalg. Og bokhandlere representerer omtrent 15% av bransjens salg (og langt mindre for selvpubliserende forfattere) - de er ikke lenger kjerne til en boks suksess.

Ting har forandret seg.

Egenpublisering

Egenpublisering har vært den viktigste drivkraften for vekst i forbrukerpublisering de siste ti årene og mer. Nøyaktige salgsdata rundt egenpublisering forblir skjult - det er lett å ignorere dens betydning. Men de tilgjengelige dataene viser at egenpublisering utgjør en betydelig del av forbrukerpubliseringsmarkedet.

Som Kobo CEO Michael Tamblyn (noe) berømt bemerket, “En av fire bøker vi selger på engelsk er en egenpublisert tittel, noe som betyr at for oss er egenpublisering som å ha en helt annen Penguin Random House ute i markedet som ingen ser. Det er som den mørke materien i publisering.”

Trendene innen egenpubliseringsmarkedet er sannsynligvis de eneste betydelige trendene innen forbrukerpublisering. Selvpubliserende forfattere viser veien. De er eventyrlystne og uhindret av den tradisjonelle industriens skikker. Mange er flytende med sosiale medier. De er nær sine lesere, sine kunder. Hvis du vil lære de nyeste markedsføringsteknikkene, følg forfatter fora, blogger, og nyhetsbrev.

Grav dypt i forfatterinntektsstatistikker, økonomien i skriving, og sammenlign deretter inntektsnedgangen for tradisjonelt publiserte forfattere mot inntektsøkningen for egenpubliserende forfattere. I en internasjonal undersøkelse og rapport som jeg gjennomførte med Steve Sieck for ALLi, i 2023 (pdf), oppdaget vi at “medianen for skrive- og egenpubliseringsrelaterte inntekter i 2022 for alle egenpubliserende forfattere som svarte var $12,749, en økning på 53% fra året før. Gjennomsnittlige (mean) inntekter var betydelig høyere: $82,600 i 2022, en økning på 34%.”

I en separat undersøkelse, utført av Peter Hildick-Smith for Authors Guild, “rapporterte fulltids selvpubliserte forfattere, som hadde publisert siden minst 2018, en gjennomsnittlig inntekt på $24,000 sammenlignet med $13,700 i 2018, en økning på 76 prosent.”

Hybridforlag

For grundighetens skyld vil jeg også nevne hybridforlag. Jeg har blitt stadig mer entusiastisk over hybridmodellen, og hybridforlagssegmentet er betydelig og voksende. Ingen estimerer hybridsalg separat. Men innflytelsen sees tydeligst i deres dominans av to kategorier: bøker av kjendiser og populære forretningsbøker. Disse kategoriene har lenge vært pålitelige inntektskilder for tradisjonelle forlag, men hybridforlagenes “conciergetjenester” og langt gunstigere inntektsdeling er uimotståelige for mange høyt profilerte forfattere.

Nylige eksempler, som Authors Equitys resultatdelingsforhold med sine forfattere, og Keila Shaheens 50/50 resultatdeling med Simon & Schuster, antyder en trend mot normalisering av hybridmodellen. Dette er gode nyheter for forfattere, mindre lovende for tradisjonelle forlag.

Publisering utenfor forlagene

Jeg er medforfatter av en rapport med Rüdiger Wischenbart, basert på hans originale studie “Publishing Beyond Publishers.” Vi prøver å forstå, og kvantifisere, så godt vi kan, all den bokaktige publiseringsaktiviteten verden over som kunne (og burde) inkluderes som en del av en mer omfattende oppfatning av det moderne publiseringsøkosystemet.

Når du beveger deg utenfor den bokaktige beholderen, finner du glimt av hvor AI virkelig kunne gjøre en forskjell.

Vårt prosjekt sitt plakatbarn er Wattpad, hvor “97 millioner mennesker bruker over 23 milliarder minutter i måneden på originale historier.” Historiene oppleves online, mest på smarttelefoner, i korte biter. Få blir til publiserte bøker. De er like sannsynlig å finne veien til “Wattpad WEBTOON Studios, selskapets TV-, film- og publiseringsmotparter.”

Yngre lesere er mer innstilt på digital lesing enn deres eldre motstykker. Ifølge en Wattpad-undersøkelse fra januar 2024, “digitale formater er stadig mer populære blant yngre generasjoner, med 65% av Gen Z og 71% av Millennials som omfavner webnoveller, e-bøker og webkomikker, mens mindre enn halvparten av Gen X og Boomer-generasjonene sier det samme.”

Og selvfølgelig, som den tradisjonelle forlagsbransjen nå lærer: “Mangfold er en viktig driver for å omfavne digitale formater: 61% av Gen Z og 70% av Millennials er enige om at e-bøker, webnoveller og webkomikker gir dem tilgang til innhold som er vanskeligere å finne i bokhandlere og biblioteker, inkludert LGBTQ+ og minoritetsfokusert innhold.”

Wattpad har konkurrenter, inkludert Inkitt, som ifølge Publishers Weekly nylig samlet inn $37 millioner fra investorer “inkludert Stefan von Holtzbrinck, eieren av Holtzbrinck Publishing Group, som eier Macmillan, og tidligere Penguin-sjef Michael Lynton; det har nå hentet inn totalt $117 millioner i investeringer. I februar 2023 sa Financial Times at Inkitt var det åttende raskest voksende selskapet i Europa, og #1 i Tyskland.” En artikkel i Esquire 9. juli beskrev Inkitts bruk av AI, og dens rolle i deres suksess.

Hvor mange av dere har i det hele tatt hørt om Inkitt, besøkt deres publiseringsplattform, eller lastet ned deres Galatea-leseapp?

Men vår “Publishing Beyond Publishers”-rapport går utover nettbaserte historiefortellingsplattformer for å vurdere hvordan “innhold kan skapes og formidles i en rekke formater (trykt, digitalt), medier (bøker, lyd, filmer, spill), distribusjonskanaler (samfunn, plattformer, strømmer) og forretningsmodeller (produkt salg, abonnementer, streaming, freemium, betalte modeller) i hovedsak digitalt definerte forsynings- og markedsføringskjeder.” Hvor mange muligheter går bokutgivere glipp av fordi de ikke passer tydelig inn i deres nåværende forretningsmodell?

Innovasjon, teknologi og bokutgivelse

Med unntak av e-bøker, har moderne publisering aldri stått overfor en trussel fra teknologi. (Digitale lydbøker ble møtt med glede mer enn bekymring.) Internettalderen ga forleggere flere muligheter enn trusler; det er bare en enkelt forhandler, Amazon, muliggjort av Internett, som veltet lasset.

Jeg har aldri sett en studie på om Amazon har vært (når alle aspekter av deres virksomhet og innvirkning er fullt ut vurdert) en netto positiv for bokutgivelsesindustrien. Det når mange kjøpere som ikke betjenes av fysiske butikker, og er villig til å ofre margin for å holde prisene lave. E-bøker og lydbøker leveres i stor skala. Men Amazon er i stand til å kutte priser delvis fordi det krever høye rabatter og avgifter fra leverandører, og det kveler andre detaljhandelskanaler. Det er smertefulle avveininger.

Likevel, ikke prøv å kritisere Amazon foran en selvpublisert forfatter. De ville ikke vært i virksomhet uten The Everything Store.

Innovatørens dilemma

For å få et perspektiv på AI’s kommende innvirkning på bokutgivelse, anbefaler jeg Clayton Christensens The Innovator’s Dilemma: When New Technologies Cause Great Firms to Fail, først utgitt i 1997 av Harvard Business Review Press.

Christensen ser på hvordan eksisterende (etablerte) selskaper kan bukke under for innovasjonskreftene.

Velstående, godt styrte selskaper mislykkes ofte når forstyrrende endringer kommer til deres bransje. Konvensjonelle ledelsespraksiser, som hadde hjulpet dem til å bli bransjeledere, gjør det vanskelig for disse selskapene å være smidige i møte med de forstyrrende teknologiene som kan kannibalisere deres markeder.

De ignorerer produktene som er født av de forstyrrende teknologiene, fordi de, ved første øyekast, sammenlignes dårlig med deres eksisterende produkter. Deres mest lønnsomme kunder kan generelt ikke bruke de påståtte innovasjonene og ønsker dem ikke. Selskaper prøver å bekjempe forstyrrende trusler ved å satse på eksisterende produkter og tjenester.

Christensens viktigste innsikt er at ved å gjøre det tilsynelatende ‘riktige’, inkludert å lytte til kunder, åpner suksessrike selskaper seg for forstyrrende innovasjon. De fokuserer på sine nåværende kunder og ignorerer viktige nye teknologier – som i utgangspunktet retter seg mot små, mindre lønnsomme markeder. Det skaper en åpning for smidige oppstartsbedrifter til å forstyrre lederne.

Chris Dixon, i diskusjon om boken, påpeker at “grunnen til at de store nye tingene sniker seg forbi etablerte selskaper er at den neste store tingen alltid starter med å bli avfeid som en ‘leke’.” Hmm, ja, mange ser Chat AI som en leke.

Unnlater utgivere å innse at innovasjoner bygget med generativ AI kan forstyrre deres skjøre forretningsmodell?

Fiksjon versus sakprosa

Innvirkningen av AI på bokutgivelse vil helt sikkert ha en dramatisk ulik innvirkning på fiksjonsutgivelse enn den vil på sakprosa.

Bokutgivelsesindustrien blir ikke ofte nok analysert som to bifurkerte industrier, en som utgir fiksjonsbøker og en annen som utgir sakprosa.

Mens de fleste handelsforlag tilbyr både fiksjons- og sakprosatitler, er den bransjeomspennende kløften mellom de to formene skarp både i antall utgitte titler og i boksalg. Estimater varierer, men fiksjonstitler representerer bare omtrent 10% av bøkene som utgis hvert år. Salget favoriserer imidlertid fiksjon i stor grad. Igjen er det årlige skift, men fiksjon fanger omtrent halvparten av årlige handelsboksalg. I fjor var 21 av de 25 mest solgte bøkene fiksjon. Ved hjelp av Wikipedias samling, av bøkene på engelsk som noen gang har solgt 20 millioner eksemplarer eller mer, er 84% fiksjonstitler.

Boksalgstrender er notorisk ustabile, men salg av skjønnlitteratur ser ut til å være på en fortsatt oppadgående kurve. Etter å ha krateret på 32 % i 2019, tok de 40 % av voksenmarkedet i 2022, og vokste litt igjen i 2023. Salget av voksen skjønnlitteratur økte med ytterligere 6,3 % i første halvdel av 2024.

Selv om kunstig intelligens i økende grad vil bli brukt av skjønnlitterære forfattere for å hjelpe i skapelsesprosessen, som diskutert andre steder, virker det lite sannsynlig at AI-genererte historier vil ta over bestselgerhyllene. En “godt nok” rekkevidde for noen sjangerlitteratur er tenkelig, men igjen, ikke noe som skulle gi forfattere og forleggere søvnløse netter.

Skriving og publisering av sakprosa, derimot, vil bli hjulpet og assistert av AI over hele linja. Det skjer allerede. Sakprosaforfattere drar nytte av Chat AI’s mange talenter både som forskningsassistent og skrivehjelp. Og sakprosaforleggere vil i økende grad påkalle Chat AI for hjelp i manuskriptutvikling, faktasjekking, redigering, markedsføring og distribusjon.

Er det en eksistensiell trussel mot forfattere?

Jeg snakket med en veldig smart forfatteragent, som har tenkt mye på hva AI betyr for hennes kunder og for alle profesjonelle forfattere. Samtalen dreide seg om ideen om boken som en ‘beholder,’ og jeg ba henne utdype den ideen. Hennes svar:

“Den grunnleggende ideen er at når forfattere/agenter plasserer en bok hos en forlegger, er det nettopp det: en bok. Det er en forståelse av at den senere kan bli en av de utallige former for avledede verk vi har blitt kjent med (oversettelse, dramatisk tilpasning, grafisk roman, etc.), men alt dette er sekundært til ‘Verket’ selv. Verket er ikke en pose med ord eller setninger eller fakta, det er noe strukturert av forfatteren på en måte som er unik for den forfatteren. Å bryte beholderen, riste Scrabble-posen med bokstaver og trekke ut et tilfeldig utvalg (som ikke er helt tilfeldig fordi det er en Scrabble-pose laget av syntaksen og semantikken og stilen til den spesifikke forfatteren), er ikke det som vurderes når vi gir rettigheter til en forlegger.

“Boken er den integrerte helheten som er større enn summen av dens deler. Det er produktet av en kreativ åpenbaring (og en masse kreativt intellektuelt arbeid) som samlet det hele som en bok, ikke bare ‘en’ bok, men boken av den spesifikke forfatteren.”

Bøker inneholder skatter

Når jeg tenker på sakprosabøker, er det å bryte beholderen en av fordelene ved AI-æraen. Du bryter beholderen, og som Fabergé-egg, er det skatter inni.

Begrensningene ved beholderen er både en funksjon og en ulempe. På den ene siden “Verket er ikke bare en pose med ord eller setninger eller fakta, det er noe strukturert av forfatteren på en måte som er unik for den forfatteren.” På den andre siden, ved å skape beholderen, ble forfatteren, på grunn av de iboende begrensningene ved den boklige beholderen, tvunget til å redusere, avvise, omskrive og rekonfigurere. Verket er polert, men det er destillert, og noen ting gikk tapt (mens andre ble vunnet) underveis.

Folk leser ikke lange sakprosabøker delvis fordi de har blitt betinget til å skumme gjennom all teksten de møter på nettet – inkludert i e-postene sine. Til og med “boksammendrag”-modellen mislykkes – i stedet for en ufordøyelig 250-siders sakprosabok får du et ufordøyelig 8-siders sammendrag av boken.

Bøker er som matbokser – alt i én pakke. Men jeg vil bare ha informasjonskapslene.

Det blir ikke lett for etablerte forfattere å kaste av seg lenkene. Men de må kanskje lære seg å gjøre det, eller risikere å bli overskygget av en ny generasjon dyktige forskere og forfattere som kan uttrykke seg med eller uten formelle beholdere, etter behov. Beholdere pålegger altfor mange begrensninger.

Det det koker ned til er at forfattervirksomheten har forandret seg uopprettelig. Det er som slutten på skriverne. I dette tilfellet må våre munkaktige forfattere komme seg ut fra bak skrivebordene sine og deres containeriserte syn på boken, og engasjere seg med form og med sitt publikum.

Å ja, jeg kjenner godt til forfatternes innvendinger: Men jeg er en forfatter, jeg er ikke en promotør. Jeg er ikke på sosiale medier. Jeg har ingen interesse i å faktisk kommunisere med leserne mine annet enn gjennom arbeidet mitt og med sporadiske e-poster og stadig sjeldnere opptredener. Jeg har en nettside (men, for å være ærlig, jeg oppdaterer den aldri). Arbeidet mitt er min gave til leserne. De kan godta arbeidet mitt, eller avvise det, men jeg vil ikke være med dem i stuen deres.

Vel, du kan legge bort pergamentene og blekket laget av hermelinblod. Yrket som ‘forfatter’ krever nå at du kommer deg bort fra skrivebordet og møter leserne der de bor, i deres stuer og på deres Facebook-sider. Du kan klage så mye du vil, mens vi legger ned tilskuddene dine, tjenestene dine og publiseringsmulighetene dine. Dette er den modige nye verdenen for forfattere og lesere, uten forlag, de forferdelige mellomleddene som jobber hardt for å forbedre arbeidet ditt, men som stadig avbryter den direkte forbindelsen din til leserne, de som verdsetter det mest.

Ingenting av dette utelukker at flotte sakprosabøker når et innstilt publikum. Tvert imot. Disse bøkene kan fortsette å skinne. Det vil fortsatt være bestselgende sakprosa, selv om økonomien vil vise seg å være umulig for alle bortsett fra de mestselgende forfatterne. Den nåværende modellen trenger ikke å forsvinne for at den nye modellen skal blomstre.

Jeg tenker på disse flotte sakprosabøkene som ‘vakre.’ ‘Vakre’ som i vakkert skrevet, nøye redigert, designet med omsorg og overveielse, og trykt, med frynsete kanter, på FSC-sertifisert papir. De selges i butikker.

Butikkene kalles ‘bokhandlere,’ men de har alle kjennetegnene til boutique-detaljhandel—vakre objekter, valgt med omhu av eieren og lederne, litt dyre, men for de som skatter slike objekter, vel verdt kostnaden.

Oppgaven for de fleste sakprosaforfattere er nå å bevege seg utover beholderen, samt forlaget som portvokter.

Innholdsbeholdere i flere medier

Lesepublikummet, spesielt de yngre medlemmene, er stadig mer ‘media-agnostisk.’ På jakt etter underholdning eller kunnskap kan de se en YouTube- eller TikTok-video, en Netflix-serie, lytte på Spotify, bla gjennom Instagram (“Insta”), holde seg oppdatert på nyhetene, eller, av og til, lese en bok.

(Bokelskende innbyggere av BookTok er en verdsatt gruppe påvirkere, men har en beskjeden markedsinnvirkning totalt sett.)

Likevel er markedsmodellen fortsatt fokusert på den unike beholderen. Forlagsbransjen. Filmindustrien. TV-bransjen. Musikkindustrien.

Filmer er ikke bøker. YouTube-videoer er ikke filmer. Podcaster er ikke lydbøker.

Disse siloene var ikke en historisk uunngåelighet, men et resultat av en serie forretningsbeslutninger tatt av mektige organisasjoner over tid.

Det er ikke vanskelig å forstyrre en forretningsmodell bygget på en enkelt beholder.

Til tross for sin språklige dyktighet, fungerer den nåværende generasjonen av generativ AI med enda mer bravur når det gjelder å produsere lyder, bilder og video. AI gir denne boken lydbøker, på flere språk, sammen med de 31 oversettelsene av e-boken. Ingenting av dette ville vært i det hele tatt mulig uten AI—økonomien ved tradisjonell produksjon gir ingen mening for meg.

Beholdersiloer

Innholdsskapere er tradisjonelt opplært til å utmerke seg innen bare en enkelt beholdersilo. Vi har skriveprogrammer og filmprogrammer og musikkprogrammer. Det faller oss sjelden inn at kreative forfattere også kan ta en ‘mindre grad’ i film eller musikk. Eller i dataprogrammering eller apputvikling.

Hva skjedde med transmedia? Hvor er programmene som lærer kreative å bli, som Apple en gang formulerte det, “Masters of Digital Media”?

Det beste innholdet vil alltid vinne. Men over tid betyr innholdsbeholderne mindre og mindre. Den digitale generasjonen er kanskje ikke beholder-agnostisk. Men de er beholder-fleksible. De møter mesteparten av innholdet sitt digitalt, via smarttelefoner. Trykk vil fortsette å finne et publikum, men det vil aldri igjen ha sentrum.

Den “fremtidige forleggeren” må også være beholder-fleksibel. Mesteparten av veksten i innholdsdistribusjon skjer ikke via blekk på papir, heller ikke ord i EPUB-filer. Veksten av lydbøker er ingen tilfeldighet, og heller ikke populariteten til YouTube og TikTok.

Den større utfordringen ligger i nødvendigheten av å gjøre nytt og eksisterende innhold oppdagbart, uansett form, og deretter ved oppdagelse, å omgjøre bevissthet til en kjøpsbeslutning.

Oppdagelse og konvertering

Problemet med online oppdagelse har vært med oss en stund; AI skapte det ikke. Problemet er ett som bransjeveteran Mike Shatzkin har fremhevet mer enn en gang. Det er så mange titler tilgjengelig på trykk, og digitale formater lar dem forbli kontinuerlig i trykk. Millioner av utgåtte bøker kan finnes fra brukte bokhandlere. På toppen av det publiseres to millioner eller flere nye bøker hvert år, bare på engelsk. AI vil gjøre metningsproblemet verre, men det er allerede ute av kontroll.

Amazons algoritmer er ikke uselviske—de gjør en veldig god jobb med å fremheve det som er salgbar, den boken du mest sannsynlig vil kjøpe neste gang. Den boken kjennetegnes ikke bare av salgsfigurene. Den solgte best, ikke fordi en svindler optimaliserte den elektroniske oppføringen. Den solgte best fordi den var den beste, og fornøyde lesere fortalte andre å kjøpe den, både online og personlig. (Amazon har oppmuntret til annonsering som forvrenger algoritmene deres, en del av forverringen av plattformen.)

Jeg snakket tidligere om metadata. Konvertering er like utfordrende som oppdagelse. Kan AI hjelpe forfattere med å gjøre lesere om til kjøpere?

Fremtiden for opphavsrett

Konseptet med opphavsrett har blitt absurd på grunn av AI. Det er ikke det at folk ikke ønsker eller fortjener beskyttelse for sitt arbeid—de fortjener det kanskje mer enn noen gang. Og det er ikke det at AI gjør opphavsrett uhandhevelig (i det minste i en eller annen form, om ikke i nåværende form).

Det er at “beskyttelsen av opphavsrett” også blir et slør hvor arbeidet ditt forsvinner bak. Hvis boken din ikke kan refereres til gjennom en samtale med ChatGPT, så eksisterer den de facto ikke. AI-selskapene kommer bare til å lisensiere crème de la crème av innhold. De trenger ikke skummet melk.

Hvorfor beskytte noe som ikke kan finnes?

Dette er hvor oppdagelsesproblemet kan bli en katastrofe. Google gjør en god jobb med å oppdage bøker bare gjennom deres metadata. AI vil ha hele pakka. I motsetning til tradisjonelle søkemotorer svarer ikke AI på brukerforespørsler basert kun på abstrakt metadata om et verk.

Samtidig antyder endrede innholdsbeholdere, beholdere andre enn hele bøker, forskjellige typer opphavsrettsutfordringer. Hvis teksten i en bok kan endres på direkten, som svar på leserens input, hva er da opphavsretten til teksten?

Forfattere & lesere

Forleggere trenger forfattere; forfattere trenger ikke forleggere.

Fremtiden for forlagsbransjen er det intime forholdet mellom forfattere og lesere. Det er langt sterkere enn forholdet mellom forfattere og forleggere og lesere og forleggere. Forleggere kan være en hindring i forholdet mellom forfattere og lesere. I mange tilfeller muliggjør de ikke forholdet; de hindrer det.

I lang tid var den eneste måten å få tilgang til høykvalitets skriftlig innhold gjennom bøker eller via et beskjedent utvalg av tidsskrifter. Det er absolutt ikke lenger tilfelle. Helt bortsett fra distraksjonene fra andre medier, er det nå så mange forskjellige måter å få tilgang til (ikke-beholderbasert) høykvalitets skriftlig innhold. Bøker har ikke lenger den dominansen de en gang hadde.

AI kan kommunisere

“Hva er den perfekte boken for meg å lese neste gang?” Generativ AI kan svare på det spørsmålet med en elokvens og presisjon som aldri før har vært mulig. Etter hvert som AI blir en pålitelig anbefalingsmotor, vil forfattere måtte kommunisere via den motoren. (Amazon jobber selvsagt med dette, og har fordelen av å vite hva du tidligere har kjøpt.)

Konklusjon

Så hvor etterlater dette oss?

Jeg følte det nødvendig å katalogisere utfordringene som forlagsbransjen står overfor. Chat AI kommer på et tidspunkt da skjønnlitterær forlagsvirksomhet er i trøbbel. Det kommer ikke på et tidspunkt da bransjen er robust, og kan si: “vi trenger ikke noe nymotens teknologi; vi klarer oss helt fint.”

Jeg snakket tidligere om de mest presserende utfordringene forlagsbransjen står overfor: økende kostnader og krympende marginer.

Ulvene vil aldri bli mette i deres krav om stadig brattere rabatter; marginene vil ikke forbedre seg. Utsalgsprisene er nær en takhøyde. Fremtiden for den nåværende modellen for skjønnlitterær forlagsvirksomhet ligger i kostnadsreduksjon.

Lønningene kan ikke bli lavere, så vi må kutte kostnader innen produksjonssyklusen.

Men forleggere har prøvd å kutte produksjonskostnader i flere tiår. Det har vært noen bemerkelsesverdige suksesser, men vi har uttømt de nåværende alternativene.

Jeg har vist at AI kan bringe effektivitet til forlagsbransjen, på tvers av arbeidsflyten. De er ikke umiddelbare og de er ikke enkle: du må jobbe med AI. Men muligheten er der.

Forleggere ser ikke etter å redusere bemanningen, så målet må være flere bøker som kommer raskere på markedet basert på nåværende personalressurser. AI-verktøy kan fremme det målet.

Og, selvfølgelig, er det alltid et mål å selge flere eksemplarer av bøkene som blir utgitt. AI kan også hjelpe der.

Jeg beskriver tidligere hvordan AI også kan være transformerende for fremtiden til forlagsbransjen.

Ikke bekymre deg for det. Få orden i huset ditt, og vi vil snakke videre.

En enkelt ressurs

Det er nå en nærmest endeløs mengde materiale tilgjengelig for å informere deg om AI, alt for mye, selvfølgelig. Velg ditt foretrukne medium: bøker, blogger, nyhetsbrev, videoer, podcaster, kurs og psykisk spådom. Jeg har lenket til noen nøkkelkilder gjennom denne boken, det er verdt å klikke på noen tilfeldige lenker for å se hvor de tar deg.

Det er bare én utmerket AI-bok for nybegynnere, Ethan Mollicks Co-Intelligence, som ble utgitt i begynnelsen av april 2024. Den er hentet fra hans like utmerkede nyhetsbrev, “One Useful Thing.”

Side note: credentials for writing this book

Jeg ønsket ikke å belaste introduksjonen med denne informasjonen, men jeg er klar over at mange er skeptiske til folk som skriver om AI i dag, mistenksomme for at disse forfatterne fremstiller seg som moderne AI-eksperter. Noen er utvilsomt det. Jeg håper at jeg har akseptable kvalifikasjoner til å gjennomføre dette prosjektet.

Jeg leste min første bok om kunstig intelligens i 1988, en bok utgitt to år tidligere, Understanding Computers and Cognition: A New Foundation for Design av Terry Winograd og Fernando Flores. Boken er tettpakket—mye av den var utenfor min forståelse—men det var første gang jeg ble begeistret for mulighetene til kunstig intelligens i bokutgivelse.

På den tiden var jeg dypt inne i digitaliseringen av utgivelse, forårsaket av eksplosjonen av skrivebordsutgivelse, Apple-datamaskiner, PageMaker og lignende. I 1986 overvåket jeg utviklingen av Page One automatisert bokutgivelsesprogramvare, et program som kunne ta et bokmanuskript som en Microsoft Word-fil og sette det om til en hel bok på minutter. Det er veldig lett å gjøre i dag; det var ikke lett da.

Jeg fortsatte å jobbe innen utgivelsesteknologi etter det, som konsulent og analytiker, og jobbet med noen av de ledende programvare- og maskinvareleverandørene, inkludert Adobe, Apple og Microsoft. Jeg ble også involvert i, og medeier, av et programvareselskap kalt Enfocus. Vi skapte et automatisert system for prepress-arbeidsflyter.

Vi hadde ikke tilgang til AI på det tidspunktet, men vi ble veldig gode på å frigjøre fullt automatiserte utgivelsesproduksjonssystemer. Akkurat som AI kan være uatskillelig fra magi, kan også den beste automatiseringen virke som AI.

Spenne frem til 2016, og min kollega Cliff Guren hjalp meg med å fokusere på AI i bokutgivelse: det begynte å se ut som noe endelig skjedde. The Bestseller Code (Archer og Jockers) dukket opp i september 2016, og gjorde det klart at datamaskiner kunne tolke teksturen i litteraturen med høy grad av innsikt og presisjon.

På det tidspunktet fulgte jeg nøye med på bokutgivelsesstartups, og et lite antall dukket opp med en viss grad av AI-teknologi innvevd i deres programvaretilbud.

Spenne frem igjen til oktober 2022.

Måneder før det ble temaet alle i utgivelse snakket om, presenterte Tim O’Reilly til PageBreak-konferansen om “AI og publiseringstransformasjon.” O’Reilly er godt kjent i utgivelsesmiljøet, både for O’Reilly Media og for Tools of Change-konferansen. Han er en av teknologibransjens toppvisjonærer.

O’Reilly var ikke bare entusiastisk om de nye fremskrittene innen AI, han var over toppen. “Vi er på et punkt som er veldig likt hvordan jeg følte det da vi oppdaget World Wide Web i 1992,” sa han, og fulgte opp med “dette er like transformerende som VisiCalc, PC-en og nettleseren.”

Han innrømmet at (på det tidspunktet) bruksområdet fortsatt var uklart, og pekte på et par pilotprosjekter hos O’Reilly Media. Men, sa han, “dette blir skummelt bedre raskt. Maskinlæring er ikke lenger en fremtidig ting. Dette handler om demokratiseringen av AI.”

O’Reilly snakket om hvordan utgivere bør nærme seg disse nye teknologiene, og sa at de må “vite når de skal brenne båtene og satse alt. Det er en tid da du må forplikte deg.”

ChatGPT ble ikke utgitt før en måned senere. PageBreak var den første utgivelseskonferansen som satte det i sentrum, via Tims innsikter.

Avsløringer

Denne boken har fem sponsorer. Jeg visste da jeg skrev boken at det ville være få rikdommer å finne, og jeg bestemte meg for å finansiere mine anstrengelser ved å invitere sponsorer til å delta.

Som jeg indikerer på nettstedet mitt, jobber jeg som konsulent, analytiker og journalist, og jeg støtter International Federation of Journalists’ Global Charter of Ethics for Journalists. Avsnitt 13 er klar på forpliktelsen til å unngå interessekonflikter eller “enhver forvirring mellom (min) aktivitet og reklame eller propaganda.”

Å ha sponsorer innebærer en interessekonflikt og forvirring rundt reklame. Hvis jeg jobbet for New York Times, ville det vært enkelt: “Nei.” Når jeg jobber for meg selv, er åpenhet mitt våpen for å tilfredsstille disse forpliktelsene: Jeg vil beskrive vederlaget jeg har mottatt, og dere kan vurdere, i mitt arbeid, om jeg har blitt kompromittert.

Jeg valgte sponsorene jeg inviterte til dette prosjektet fordi jeg kjente ikke bare deres arbeid, men også individene involvert i deres organisasjoner. De er kolleger og venner. Jeg fortalte dem at produktene deres kanskje ville bli diskutert i teksten til denne boken, og at de ikke ville ha noen kontroll over disse ordene. Det de kunne kontrollere var reklamene deres på slutten av boken—jeg ville poste dem som levert. Det er hva jeg har gjort.

Jeg har mottatt betalinger fra andre som kan ha påvirket mitt arbeid med denne boken—jeg kan katalogisere følgende:

  • Jeg har ikke gjort noe betalt konsulentarbeid for AI-leverandørene beskrevet i denne boken, inkludert sponsorene.

  • Jeg mottok noen inntekter fra overskuddsdeling fra Publishers Weekly for AI-webinarene i september 2023.

  • Jeg betales en standard sats for mine Publishers Weekly-artikler.

Gi meg beskjed hvis du oppdager noen favorisering som du tror kan ha resultert fra disse engasjementene. Min skjevhet i favør av AI ble dannet før de store rikdommene strømmet inn.

Takk

Jeg ville ikke vært i stand til å snakke med noen troverdighet om AI hvis det ikke var for støtten fra Publishers Weekly, inkludert redaktør emeritus, Jim Milliot, og administrerende direktør, Cevin Bryerman. Jim støttet mine tidlige skrifter om AI, og Cevin (sammen med Krista Rafanello og resten av teamet) var viktige for suksessen til fjorårets konferanse, AI and the Revolution in Book Publishing. Andrew Albanese er nå sjefredaktør i PW; Ed Nawotka, seniorredaktør. Jeg er heldig som jobber med dem.

Og videre takk til mange kolleger…

  • Peter Brantley

  • Cliff Guren, langvarig sparringspartner og innsiktsfull leser av mine utkast

  • To andre ‘beta’ versjonslesere, tilbød verdifull tilbakemelding: Joe Wikert og Brad Farmer

  • Mine Publishing Technology Partners, Ken Brooks, Bill Kasdorf, Bill Rosenblatt, Bill Trippe, Steve Sieck, og våre nyeste partnere, Lettie Conrad og Linda Secondari.

  • Min søster, Anne Pashley, som hjelper meg med å holde databasen for oppstart av forlag oppdatert, og som konstant gir meg energi i mine anstrengelser.

  • Mine partnere i mine månedlige AI-webinarer: Brooke Horn og Brian O’Leary i BISG.

  • Bill Kasdorf hjalp meg med å gå i dybden på tilgjengelighetsproblemer for boken min.

  • Peter Armstrong og Len Epp hos Leanpub var tålmodige med mine innvendinger og hjalp meg gjennom prosessen med å tilby det best mulige resultatet på Leanpub-plattformen.

  • Hugo Rayne hos ElevenLabs for støtte til lydbok.

  • Min gode venn og pålitelige detektor av mine skrive- og resonneringsfeil, Bob McArthur.

Vedlegg: Utforske Tradisjonell Forlagsbransje Gjenværende Fordeler

Anseelsen til tradisjonell forlagsvirksomhet er grunnen til at de fleste av oss ble med i bransjen. Vi vokste opp med å elske bøker, studerte engelsk eller noe lignende på universitetet, drev omkring en stund, kanskje fikk en jobb i en bokhandel, kanskje et Master of Publishing-sertifikat, deretter jobbet som intern i et forlag, og her er vi i dag. Du elsker jobben din, selv om lønnen er dårlig og arbeidsforholdene ikke alltid er hyggelige.

Den samme anseelsen gir næring til forsyningskjeden for forlagsbransjen. På innsiden av forsyningskjeden: det betyr mye for mange forfattere. Vi ser det hele tiden. Økonomien til tradisjonell forlagsvirksomhet gir ingen mening, og det tar fire ganger så lang tid å komme i trykk, men kanskje, bare kanskje, vil jeg bli den neste debutvinneren, som Delia Owens (Der krepsene synger) eller den andre gangens megastjerne, Amor Towles (En gentleman i Moskva).

Det er som Vegas: bortsett fra at oddsene er bedre i Nevada. Spill et enkelt tall i roulette, og oddsene mot deg er 36 til 1. Spill tradisjonell forlagsvirksomhet, og oddsene mot deg er… langt verre.

Sjansene for å få en kontrakt med en av de tradisjonelle handelsforlagene, for ikke å snakke om en av de fem store, er dårlige. Men det er det minste av et forfatters problem. Det er faktisk å finne lesere som er den store utfordringen.

En ting som kan hjelpe er å lande en plass på en bestselgerliste.

La oss vurdere PRH, Penguin Random House. Selskapet utgir bare 15 000 nye titler hvert år. I 2021 klarte de å få 196 bøker på Publishers Weekly sin bestselgerliste. Som den lenkede artikkelen fremhever: “PW publiserer fire bestselgerlister for voksne, hver med 20 titler: innbundet skjønnlitteratur, innbundet sakprosa, pocketbok, og massemarked pocketbok. Det betyr at i løpet av et år er det 2 080 innbundet posisjoner på våre lister og 2 080 pocketbok posisjoner.

Ikke alle bestselgerne var nyutgivelser det året—la oss gjette generøst at 90 % var, 1870 plasser.

I mellomtiden har The New York Times 15 bestselgerplasser per uke for hver kategori av bok (skjønnlitteratur, sakprosa, barn; separate lister for YA og hvordan-til; innbundet skilt fra pocket, pluss kombinerte lister). For en individuell forfatter betyr det 780 tilgjengelige plasser per år, selv om de fleste av disse plassene er fylt av gjentatte selgere. (The Body Keeps the Score av Bessel van der Kolk har vært på pocketboklisten i fem og et halvt år!) Så la oss dele det på halv, 390 tilgjengelige plasser. Du må selge mange bøker for å få en av disse.

Hva med dekningen i New York Times Book Review? I 2016 hevdet Pamela Paul, daværende redaktør av Review, atThe Book Review hos Times anmelder omtrent 1 % av bøkene som kommer ut hvert år.” Tydeligvis mener hun 1 % av bøkene fra de største forlagene—hun kan ikke tenke på små forlag eller selvpubliserte forfattere. Og så kanskje 150 av PRH’s 15 000 nye titler blir anmeldt hvert år.

De fleste observatører er enige om at selv om det fortsatt er viktig å få oppmerksomhet fra topp media, og kan være kraftfullt, er virkningen av anmeldelser ikke hva den en gang var, om ikke for noen annen grunn enn at færre boklesere samhandler med de store anmeldelsesstedene.

La oss vende oppmerksomheten vår nedstrøms i leverandørkjeden, til distribusjon. Mens forlagsmerker har vekt hos forfattere, har det alltid vært en sannhet at, i motsetning til mange forbrukervarer, har forlagsmerker nesten ingen vekt hos bokkjøpere og lesere. Men de har mye vekt hos distributører og bokhandlere. Dette gjenspeiler den historiske business-to-business naturen til forlagsvirksomhet (i stedet for B2C—til forbrukere). Forlagsstatus blir spredd gjennom distribusjons- og detaljhandelskanaler: Barnes & Noble fører en bok fordi den er fra PRH, og plasserer den deretter foran kjøpernes ansikter; slik blir status spredd til leserne.

Sponsorer

En banner som sier 'BOOK ADVISORS LLC Transaksjonstjenester og rådgivning for forlag'.

David Lamb og Susan Reich dannet Book Advisors LLC i 2016 for å konsultere om fusjoner og oppkjøp i forlagsbransjen. Vi har fullført mer enn et dusin transaksjoner, samt en rekke finansielle, distribusjons- og operasjonelle rådgivningsprosjekter, inkludert rettferdige markedsvurderinger. Vi er glade for nylig å ha jobbet i samarbeid med Clarke & Esposito; Thad McIlroy fra The Future of Publishing; og Kuo-Yu Liang fra Ku Worldwide.

Vi er stolte av våre relasjoner, grundighet og diskresjon. Enten du er interessert i å kjøpe, selge, finansiere eller konsultere, vennligst ta kontakt for en konfidensiell diskusjon.

bookadvisorsllc.com | bookadvisors@gmail.com

Et 3x2 rutenett av bannere: En banner som kunngjør at Papercutz har blitt kjøpt opp av Mad Cave Studios i august 2022, i samarbeid med Ku Worldwide LLC; En banner som kunngjør at DAW Books har blitt kjøpt opp av Astra Publishing House i juli 2022, i samarbeid med Ku Worldwide LLC; En banner som kunngjør at Caslon Publishing har blitt kjøpt opp av Brookes Publishing Co. i april 2022, i samarbeid med Thad McIlroy; En banner som kunngjør at B.E.S. Publishing har blitt kjøpt opp av Sourcebooks i november 2021; En banner som kunngjør at Applewood Books har blitt kjøpt opp av Arcadia Publishing i april 2023; En banner som kunngjør at Erewhon Books har blitt kjøpt opp av Kensington Publishing i oktober 2022
Logo for Firebrand Technologies og NetGalley.

Firebrand Technologies er et programvare- og tjenesteselskap som har hjulpet bokutgivere med data- og arbeidsflytstyringsløsninger i mer enn 35 år.

NetGalley er en online plattform som kobler forlag og forfattere til anmeldere, bibliotekarer, bokhandlere, media og lærere som oppdager nye bøker på NetGalley og anbefaler dem til sine publikummere.

Som utviklere av programvare og digitale løsninger er Firebrand Technologies og NetGalley også bransjeeksperter og aktive medlemmer av utgivermiljøet. Våre løsninger gagner alle aspekter av utgivelsesprosessen, fra anskaffelser til salg og markedsføring.

  • NetGalley hjelper forlag med å bygge oppmerksomhet rundt titler, motta rask tilbakemelding og anmeldelser, og oppdage tidlige trender.

  • Title Management Enterprise, sammen med sin kompakte versjon, Title Management Lite, er Firebrands kjerneprogramvare som tilbyr avansert publiseringsarbeidsflytstyring gjennom hele utgivelsesprosessen.

  • Eloquence on Demand er forlagsbransjens mest kraftfulle ONIX distribusjonsplattform, som distribuerer metadata og digitale eiendeler til over 600 handelspartnere i ONIX og andre formater.

  • Flywheel er en markedsføringstjeneste for backlist som identifiserer skjulte muligheter i backlisten for økt synlighet og salg.

  • Eloquence on Alert overvåker live titteldata og trender i markedet og varsler forlag om kritiske feil og muligheter som kan påvirke salget (manglende kjøpsknapper, tredjepartsselgere, osv.).

  • FlightDeck er det mest avanserte verktøyet for EPUB validering og testing som er tilgjengelig.

En infografikk som viser ulike tjenester tilbudt av NetGalley inkludert bokpromotering, publiseringsarbeidsflytstyring, metadata distribusjon, salg og backlist markedsføring, og EPUB testing.
Banner for Perfect Bound, en markedsplass som kobler forlag med trykkerier over hele verden.

Velkommen til en bedre måte å trykke bøker på.

Perfect Bound ble opprettet i 2022 for å bidra til å løse forsyningskjedespørsmålene som har plaget forlagsbransjen i årevis. Perioder med overkapasitet hos trykkerier etterfølges av korte vinduer med forsinkelser på grunn av forsyningsmangel. Perfect Bound søker å åpne trykkemarkedet for uavhengige utgivere og forfattere ved å la trykkerier fra hele verden enkelt koble seg til og gjøre forretninger med forlag som leter etter nye og dynamiske leverandører.

Hva er Perfect Bound?

Perfect Bound er en tosidig markedsplass som kobler uavhengige bokutgivere med trykkerier i USA, Canada, Colombia, Brasil, Tyrkia, Kina, Malaysia, India og mer.

Illustrasjon av en trykkpresse med ulike typer bøker og publikasjoner som produseres.

Oppdag nye publiseringspartnere med ett klikk

Vår robuste plattform lar deg enkelt bygge ut produktpriser, sende forespørsler til hundrevis av trykkerier med et klikk, forhandle og fullføre trykkserier og spore produkter fra pressen til lageret. Som trykker har det aldri vært enklere eller sikrere å koble seg til nye forlag, by på kommende prosjekter og få betalt.

Koble deg til nye publiseringspartnere umiddelbart

  • Send og motta trykkforespørsler fra hele verden

  • Utfør og spor trykkserier fra pressen til lageret

  • Utfør transaksjoner sømløst ved bruk av ACH-betalinger gjennom Stripe uten å forlate plattformen

En annonse for Shimmr som viser automatisert annonsering som selger bøker, og nevner en økning på 35 % i salg og 2x bedre avkastning på annonsekostnader.
En annonse for Shimmr med eksempler på annonser, prisinformasjon og en QR-kode for å bestille en demo.

Møt Insight, en AI-plattform bygget spesielt for forlag

Et nærbilde av en person som holder en åpen bok med glødende elementer som stråler ut fra sidene.

“Å ta i bruk Insight for vårt forlag var som å bytte ut en sykkel med en Ferrari. Plutselig går alt raskere.”

—-Tysk barnebokforlag og Insight-kunde

Jobb smartere, oppnå mer

Utviklet av Veristage, gir Insight forlagene mulighet til å blomstre i det utviklende AI-landskapet. Ved å bruke AI og en robust pakke med digitale verktøy, analyserer og forstår Insight dine dokumenter og bøker for å hjelpe deg med å:

  • Skape, forbedre og oppdatere metadata

  • Fremskynde opprettelsen av tittelspesifikk markedsføring, publisitet og salgs materiell

  • Identifisere og evaluere en boks nøkkelbudskap, unike salgsargumenter, målgruppe, konkurrenttitler og mer

  • Optimalisere din markedsførings- og salgskontent for maksimal rekkevidde, engasjement og økt salg

I motsetning til generiske AI-plattformer, er Insight utviklet for å fungere innenfor forlagsarbeidsflyter og for å hjelpe deg med å skape forlagsspesifikk informasjon og ressurser.

Slik fungerer det

  1. Last opp boken din til Insight-plattformen

  2. Insights AI-verktøy analyserer og forstår boken din

  3. I løpet av få minutter genererer Insight et bredt spekter av metadata og nøkkelinformasjon om boken din for redaksjon, markedsføring, publisitet, salg og rettighetsavdelinger

  4. Gjør manuelle redigeringer av denne informasjonen direkte i plattformen. Boken din og AI-innholdet lagres innenfor Insight, slik at du kan få tilgang til det når som helst.

  5. Bruk vår dokumentbevisste AI-chat for å optimalisere tittelinformasjonen din, samhandle med bøkene dine, og innlemme bokdetaljer i kommunikasjon og annet materiell

Sikkerhet og opphavsrett

Veristage-teamet er forpliktet til å tilby AI-tjenester som er sikre og beskytter forlagenes immaterielle rettigheter. Vår plattform har avanserte sikkerhetssystemer på plass, og vi jobber kun med AI-modeller som ikke lagrer eller bruker dataene dine til å trene fremtidige modeller.

Løsninger for forlag av alle størrelser

Insight er designet for å fungere for forlag av alle former og størrelser, fra konsument- til akademiske forlag, fra tre-personers team til multinasjonale organisasjoner. Vi tilbyr konkurransedyktige priser og skalerbare løsninger.

Snakk med oss for å finne ut hvordan Insight kan være til nytte for din virksomhet:

Logo av Veristage i blått med et abstrakt design.