AI-revolutionen inom bokutgivning (Svensk Utgåva)
AI-revolutionen inom bokutgivning (Svensk Utgåva)
Thad McIlroy
Buy on Leanpub

Innehållsförteckning

Introduktion

“Nästa revolution kommer att överraska oss alla, som de alltid gör. Sagt på ett annat sätt: om folkmassan förutspår revolutionen kan det inte vara revolutionen.” —Doc Searls, 2002

Det har gått över ett och ett halvt år sedan OpenAI introducerade ChatGPT till en allmänhet som mestadels var obekant med artificiell intelligens. Initialt verkade det inte ha någon uppenbar relevans för bokutgivning. Sedan dess har allt förändrats. Och inget har förändrats. Förlag börjar nu dyka in i de nya AI-verktygen, utforska kanterna och engagera sig i försiktiga samtal med ChatGPT. Men det finns inga tecken på en verklig revolution inom utgivningspraxis; det är helt enkelt för tidigt.

Det råder en överflöd av osäkerhet kring AI inom skrivande och utgivning. Stora kontroverser omger användningen av AI. Ändå finns det för många en spänning kring möjligheterna.

Jag kommer att fokusera mer på löftena än på farorna här, men jag inkluderar en översikt över de bekymmer och risker som omger AI, särskilt när det gäller författare och förlag. Jag försöker inte förringa bekymren. De är helt enkelt inte vad den här boken handlar om.

Är det en bok?

Jag betraktar denna publikation mer som en ‘häfte’ än en bok. UNESCO:s definition av en bok är “minst 49 sidor” (varför inte 50?), och vid 300 ord per sida kan denna misslyckas med att kvalificera sig. Men, viktigare, det är inte tänkt att vara det definitiva ordet om något—det är mer av en lägesrapport. Artificiell intelligens, och dess roll inom bokutgivning, förändras i en rasande takt som inte visar några tecken på att sakta ner. Så denna bok(let), denna rapport, är bara en ögonblicksbild.

Genom att använda Leanpub-plattformen har jag släppt min forskning och analys som ett pågående arbete—det revideras som ett levande dokument. Jag har aldrig försökt detta tidigare. Mina skäl är två: att erbjuda något användbart på kort sikt och att ha möjligheten att revidera det vid behov. AI-historien är långt ifrån över.

Jag hoppas att min metod kommer att vara användbar för läsare, även om jag är medveten om att för många uppdateringar snart kan bli irriterande. Jag har försökt minska aktualiteten i denna bok, för att minska fokus på de saker som kommer att förändras snabbast.

Den version som (tyst) varit tillgänglig sedan april 2024 markerade jag som “75% komplett” och erbjöds gratis till läsare. Den 23 juli är det officiella publiceringsdatumet för den “100% kompletta” versionen, som också kommer att hitta sin väg till större distribution utanför Leanpub. Jag kommer att fortsätta att uppdatera den 100% versionen: men de uppdateringarna kommer endast att vara tillgängliga för Leanpub-köpare—det är otympligt att ständigt uppdatera tryckta böcker, e-böcker och ljudböcker som är i bredare distribution.

Förlagsproblem med AI i sig

Jag hör dagligen om smärtan som människor inom förlagsbranschen upplever när de försöker förstå AI. Varför är det så smärtsamt? Här är tre anledningar som jag ser:

  • Tekniken är komplex och mystisk, för komplex för icke-vetenskapsmän att förstå. (Det finns en fascinerande studie som föreslår en “AI-ångestskala (AIAS)” som mäter 21 olika anledningar till att människor är oroliga för AI.)

  • AI har blivit enormt kontroversiellt inom utgivning, främst på grund av upphovsrättsfrågor som slår i hjärtat av författarskap och utgivning.

  • Ändå finns det också en atmosfär av FOMO—Fear Of Missing Out. Trots AI:s många brister, som med många lockande teknologier (Apple Watch? Smart högtalare?), står vi inför den gnagande känslan: tänk om jag missar den nästa riktigt stora saken, som jag gjorde med ett par av de senaste riktigt stora sakerna. Jag kände mig dum då; jag vill inte känna mig dum igen. Det gör ont.

All right: Det är logiskt att personer inom utgivning känner AI-smärta.

Så vad är då användningsfallet för denna bok?

Användningsfallet är att du arbetar inom bokutgivning, eller att du är en författare som försöker förstå bokutgivning bättre, och du är trött på att känna dig dum och förvirrad kring AI. För många av dina kollegor verkar förstå det bättre än du gör, och du är trött på att inte kunna engagera dig intelligent i ämnet.

Mitt mål för läsarna är att de, i slutet av denna bok, ska känna sig kapabla att delta i konversationen, att uttrycka en informerad åsikt. Jag vill att du ska känna dig utrustad att göra personliga val kring teknologin och ha en väg för att lära dig hur man använder AI, om du väljer att göra det.

Jag vill inte överösa läsarna med massor av prat om grunderna i AI-teknologi—jag tänker inte prata mycket om AI i abstrakt bemärkelse. Istället vill jag ge dig en grundläggande förståelse för AI specifikt för bokförfattande och publicering. Om någon frågar dig, vad betyder naturlig språkbehandling verkligen, kan du svara, som jag gör: Jag är ingen AI-expert. Men jag vet hur AI används i min bransch.

Kommer det att vara precis vad du behöver veta?

Jag ogillar uttrycket “vad du behöver veta” eftersom det sällan lever upp till sina förväntningar, ofta missar målet brett, antingen mycket mer än du behöver veta, eller mycket mindre. Kommer jag att lyckas? Jag är seriös med att försöka förmedla det minsta. Jag tror att jag vet vad förläggare behöver veta om AI, eftersom jag har pratat med många av dem, samtidigt som jag har hållit seminarier och webbinarier utformade mycket specifikt för att tillhandahålla bara grunderna.

An icon of a key

Istället för att ständigt upprepa frasen “vad du behöver veta” kommer jag att använda en nyckelikon med lite indragen text.

Efter sammanfattningarna som introducerar många avsnitt kommer jag att utveckla huvudkoncepten. Jag har också hållit dessa så korta som möjligt, men sanningen att säga, ibland drar jag ut på det.

En kortform jag kommer att använda är “Chat AI.” När OpenAI först släppte ChatGPT var det den enda på marknaden, men nu finns det flera viktiga konkurrenter. Jag kommer snart att gå in på detaljerna, men du har redan hört talas om några av dem, uppenbarligen Google och Microsoft. De (och flera andra företag) erbjuder nu online AI-chattmjukvara som liknar ChatGPT. Och istället för att säga “ChatGPT och dess konkurrenter” kommer jag bara att referera till hela kategorin som “Chat AI.” Om jag skriver “ChatGPT” syftar jag specifikt på OpenAIs mjukvara.

Boken är mestadels praktisk, men i den sista delen tar jag upp en essä om vad de verkliga konsekvenserna av AI på bokförlagsindustrin kan vara, tillsammans med några andra spekulativa funderingar.

Vem är den här boken för?

Den primära målgruppen för denna bok är allmänna bokförläggare (konsument). Den sekundära målgruppen är alla andra bokförläggare (vetenskapliga, utbildnings…) i den mån det finns överlappningar i dessa branscher. Min tredje målgrupp är författare med ett intresse i ämnet, och de många andra som är fascinerade av bokförläggning.

Undertiteln säger att detta är en guide till AI för både författare och förläggare. Delvis för att jag vill att förläggare också ska förstå vad författare gör med denna teknologi. Jag tycker att det är viktigt. Vid sitt senaste årsmöte indikerade BISG (Book Industry Study Group), som mestadels representerar allmänna bokförläggare, att “de vill dra från en bredare pool inklusive litterära agenter och författare.” Det är ett välkommet drag.

Jag vill att författare ska läsa denna bok, eftersom den kan hjälpa dem att förstå vad förläggare gör med deras manuskript. Självpublicerade författare håller alltid ett öga på traditionell publicering, delvis för att de, de facto, själva är förläggare, och därför kan AI-teknologin som intresserar förläggare också vara av intresse för dem.

Men, var säker, detta är inte en praktisk hur-man-gör för författare om hur man använder AI för att bli bättre och mer produktiva skribenter. Det finns många böcker om det ämnet (tyvärr, många av dem bara skräpiga Amazon-bedrägerier). Och massor av YouTube-videor (av varierande kvalitet).

Inom allmän bokförläggning är min idealiska läsare inte nödvändigtvis en beslutsfattare, utan snarare en av de många människor som arbetar över hela branschen varje dag, skapar böcker och hittar läsare. Jag kommer att tala om alla viktiga publiceringsfunktioner i denna bok, från redaktionellt arbete till försäljning och distribution. Och om skärningspunkten mellan författare och läsare.

Även om jag växte upp i Kanada, och började min publiceringskarriär där, är jag baserad i San Francisco, USA, och därför tänker jag främst på den amerikanska förlagsbranschen. Men just om allt i denna bok ska vara lika relevant för en förläggare i Madagaskar som för en förläggare i Manhattan. Medan förläggare i mindre länder står inför utmaningar med skala, gör det också små förläggare i Amerika, och denna bok är avsedd för företag av alla storlekar.

När jag pratar med små förläggare om AI, och när jag pratar med mycket stora förläggare om AI, är den stora skillnaden som jag märker, begreppet ‘publiceringsföretag.’ De största förläggarna är ofta en del av (eller nära) börsnoterade företag, och när du är ett börsnoterat företag, blir frågor kring rykte och säkerhet mycket större än de gör för en vardaglig förläggare, inte ansvarig på samma sätt för aktieägare och nyhetsmedia. Medan en redaktör på ett av de stora 5-förlagen har samma användning för AI-verktyg som en frilansredaktör som arbetar för mindre företag, är sammanhanget i vilket de använder verktygen ganska olika.

Hur mycket behöver du veta om AI för att läsa den här boken?

Jag antar att min publik har ungefär noll kunskap om AI:s inre arbete, men att de är smarta läsare. Så jag kommer att balansera mellan noll kunskap och att inte tala ner till läsaren.

Jag föreställer mig att nästan alla har hört om den nya generationen av AI: en YouGov-undersökning i mars 2024 antyder att bara 7% av amerikanerna vet “ingenting alls” om AI. Författare och förläggare har nästan säkert hört om några av upphovsrättsklagomålen, men har förmodligen ingen uppfattning om problemen. Så jag behöver inte förklara att AI står för “Artificiell Intelligens.” Men jag kommer inte att anta att läsarna kan definiera vad AI är, vad det betyder, dess potentiella påverkan osv. Det är därför du är här.

Tillgänglighet, både bred och specifik

Min mantra för publiceringen av denna bok är ‘tillgänglighet.’

För de flesta människor betyder det bara något i stil med ‘tillgänglighet,’ och jag tänker faktiskt göra denna bok tillgänglig i så många former och format som jag kan tänka mig. Jag vill utöka behållaren. Jag försöker göra min bok till en exemplifierande publikation, som belyser hela spektrumet av vad som kan uppnås idag när man publicerar en enda bok.

På Leanpub hittar du boken tillgänglig som en PDF-fil, en EPUB-fil och som en gratis webbaserad publikation. Du hittar översättningar till 31 språk, inklusive de stora asiatiska och europeiska språken. Det kommer att finnas flera ljudböcker på stora språk.

Jag kommer också att göra boken tillgänglig, i tryckta och digitala format, på alla e-handelsplattformar som kan nås via Ingram och Amazon. Det inkluderar de flesta av bokhandlarna online, i stora delar av världen. På detta sätt kommer även bibliotek att kunna köpa boken, även om de förstår att de har begränsat utrymme för självpublicerade verk. (Jag kommer att donera tryckta och digitala kopior till alla bibliotek i världen som begär dem.)

Förutom den gratis webversionen av hela boken, kommer jag att skapa gratis utdrag, en Q&A, och infografik, för de som bara vill smaka eller prova. De kommer att vara tillgängliga via min blogg.

Det är inte meningsfullt att spela in en video av hela boken när ljudböcker finns tillgängliga. Men vissa människor föredrar att ta del av innehåll via video. Så jag kommer att erbjuda förkortade videoversioner, i flera längder.

Och vad sägs om den mänskliga touchen? Jag kommer också att vara tillgänglig via webbinarier eller en-mot-en onlinekonsultationer, via min webbplats och blogg. Jag kan till och med anlitas för att dyka upp personligen!

‘Tillgänglighet’ betyder mycket mer än dess ordboksdefinition. Som folket på Canadian National Network for Equitable Library Service (NNELS) säger, “En tillgänglig bok är en som kan användas och förstås av alla.” Och så uppfyller min engelska EPUB-fil W3C 1.1-rekommendationen för personer med trycknedsättning, inklusive robusta alt-text beskrivningar för bilder. Vi förväntar oss att uppfylla denna tillgänglighetsstandard för de utländska språköversättningarna också.

Alt-texterna skapades med ChatGPT. Jag redigerade inte ChatGPT:s version, så att alla som läser EPUB-filen kan se hur bra den är och var den fortfarande brister. Som min kollega Bill Kasdorf påminner mig, beskriver bra alt-text vad en seende läsare får ut av en bild, inte bara vad den verkar vara.

För bokförläggare är tillgänglighet inte längre ett alternativ: det är en standardinställning.

(Jag har två mea culpas att dela: På grund av begränsningar inom publiceringsplattformarna kommer standard-PDF-filen tyvärr inte att uppfylla PDF/UA-specifikationen, och jag kommer inte att kunna erbjuda en stortrycksversion av boken på e-handelsplatser. Men båda är tillgängliga på begäran.)

Lite städning

Som nämnts är denna bok (relativt) kort. När du kallar ett kort dokument för ‘en bok’ riskerar du att köpare protesterar, “Jag trodde jag köpte en bok, men den är bara 50 sidor lång!” Jag har gjort allt jag kan för att göra det klart på försäljningssidan att detta inte är en fullängdsbok, men om du är besviken, kom ihåg att Leanpub erbjuder en 60-dagars pengarna-tillbaka-garanti, och jag förlänger gärna det återbetalningserbjudandet till ‘för alltid.’ Jag vill att läsarna ska vara glada, inte besvikna. (Om du köpte boken på en annan plattform, mejla mig: jag skickar en check!)

Boken är kraftigt hyperlänkad (dessa visas på olika sätt i olika format, men ofta som fotnoter). Jag har alltid trott på att länka till originalkällor i mitt arbete, så att läsarna kan verifiera mina ibland stora påståenden. Men jag är medveten om att hyperlänkar och fotnoter kan vara distraherande, särskilt om du använder en e-läsningsenhet. Jag ber om ursäkt för det. Det bästa är att ignorera länkarna medan du läser och återvända till dem om du vill fördjupa dig i ett ämne.

Jag vet inte i vilket format du läser (eller lyssnar på) just nu. Inte heller på vilket språk. Jag har försökt göra bokens “ergonomi” så användarvänlig som möjligt, men länkar och fotnoter är inte alltid optimala ur det perspektivet.

Denna bok har sponsorer, något som jag vet är ovanligt för ’en bok’. Jag förklarar hur sponsringen fungerar i min ‘disclosures’ sektion i slutet av texten.

Varför AI nu?

An icon of a key

När jag pratar med förläggare hör jag om pressande, omedelbara bekymmer. Och AI är vanligtvis inte ett av dem.

De stigande kostnaderna för tryckproduktion har varit bekymrande i flera år, även om de nu verkar stabiliseras. Ökade distributionskostnader är utmanande för alla aktörer. Dessa leder till pristryck—det finns bevis på att läsare börjar irritera sig på nuvarande priser för nya inbundna böcker och pocketböcker. Jag klassificerar dessa som ‘analoga’ problem—digitala teknologier tillför lite för att lösa dem.

Sedan finns det de bredare ‘existentiella’ problemen som blir allt mer oroande, men de är otydliga frågor, utan uppenbara lösningar. Här ingår:

  • Innehållsupptäckt och publikengagemang via nätet och sociala medier.

  • Förändrat konsumentbeteende och läsvanor.

  • Konkurrens från andra digitala medier.

Jag tror att AI kan vara oerhört hjälpsamt för förläggare inom dessa områden, men metoderna är inte uppenbara och kommer att ta tid att implementera. Jag kommer att beskriva detta i senare kapitel i boken.

AI: Komma igång

Innan jag går in på den tråkiga tekniska bakgrunden, inbjuder jag dig att bara hoppa rakt in i den onlineprogramvaran. De bästa verktygen är gratis att leka med. Det finns ChatGPT. Och Claude.ai. Du kan leka med Microsoft Copilot. Eller prova Googles Gemini.

Det är så de flesta börjar med AI—jag slår vad om att du redan har provat en eller flera av dessa leksaker. Jag slår också vad om att du inte har provat dem särskilt länge. De flesta jag pratar med ägnar bara några minuter. De ställer några frågor, får tillbaka ganska uppenbara svar, och går vidare.

Fel tillvägagångssätt.

Jag håller med Ethan Mollick, vars arbete jag kommer att beskriva några gånger i denna bok. I sin blogg och i en nyligen intervju, talar Mollick om sin ‘10 timmars regel’:

“Jag vill ange att 10 timmar är lika godtyckligt som 10 000 steg. Det finns ingen vetenskaplig grund för det. Detta är en observation. Men det får dig också att gå bortom, jag petade på detta en kväll, och det får dig att använda detta på ett seriöst sätt. Jag vet inte om 10 timmar är den verkliga gränsen, men det verkar vara något transformativt. Nyckeln är att använda det inom ett område där du har expertis, så att du kan förstå vad det är bra eller dåligt på, kan lära dig dess kapaciteter.”

En annan kommentator, som recenserar Mollicks senaste bok om AI, påpekade en lika sann ‘regel av tio’: “En timmes experimenterande med dessa verktyg är värt tio timmars läsning om dem.”

Du förstår idén. Detta handlar om att göra, inte fundera. Min bok är en fundering. Du behöver smutsa ner händerna.

AI: En mycket kort historia

An icon of a key

Fram till för ett par år sedan hörde genomsnittspersonen bara om AI som en abstraktion, antingen som science fiction eller som något som kunde besegra en stormästare i schack eller Go. Plötsligt är AI överallt, vilket skapar det falska intrycket att det är nytt. Även de nya sakerna är inte exakt nya. Men det är en akademisk fråga. AI betydde lite för bokutgivning före ChatGPT. Nu betyder det mycket.

Att förstå AI:s ungefär 70-åriga utveckling kan vara fascinerande, men det är på inget sätt nödvändigt för att uppskatta vad som händer idag.

Our World In Data gör ett bra jobb med att kortfattat dokumentera historien—jag överlåter det till dem.

Den nuvarande generationen av AI utvecklades mestadels under det senaste decenniet. Sen, plötsligt, dök ChatGPT upp den 30 november 2022. Två månader senare hade det 100 miljoner månatliga användare, det snabbaste som någon teknologi någonsin har rört sig in i konsumentområdet (till jämförelse tog det Facebook över två år att nå 100 miljoner användare).

Varför den snabba adoptionen? För det första, det är fascinerande och roligt. För det andra, det är gratis. För det tredje, du behöver inte köpa en ny enhet för att använda det. Och för det fjärde, du behöver ingen utbildning för att få tillgång till ChatGPT (eller dess Chat AI-konkurrenter). Men samma faktorer gällde även för Facebook, så varför ChatGPT?

Som Arthur C. Clarke berömt noterade, “Any sufficiently advanced technology is indistinguishable from magic.” Chat AI är magi. Upplevelsen av att ‘tala’ på vardagsspråk med en maskin… det är magiskt. Upplevelsen av att säga “Jag vill ha en bild av en bok i en ballong i ett moln nära solen,” och, sekunder senare,

En öppen bok med en luftballong som stiger upp från sidorna, svävande bland molnen.

… också magiskt. GPT-genererade bilder börjar se likadana ut i stil, färgglada och fantasifulla. Så jag skickade en andra prompt “nu i en stil som ser ut som en 1400-tals illustration.” Och så:

En konstnärlig illustration av en luftballong med intrikata mönster, svävande bland molnen med en sol i bakgrunden.

Om jag vill ha en video av en bok i en ballong i ett moln nära solen, finns det över ett dussin verktyg att välja mellan, och vips. Och ett musikaliskt soundtrack till videon. Tja, hur låter detta? Det är precis som magi.

För att inte verka avfärdande av AI:s extraordinära förmågor genom att hänvisa det till kategorin av outgrundlig “magi,” är det roligt att lära sig att många av forskarna som är ansvariga för den nuvarande generationen av AI erkänner att de verkligen inte förstår exakt hur det fungerar. Som en rapport i ett nyligen nummer av MIT Technology Review noterade, “trots all dess enorma framgång, vet ingen exakt hur—-eller varför—-det fungerar.” Spännande, men lite skrämmande.

Att förstå AI och några viktiga termer

An icon of a key

AI kommer med en mängd teknologi och terminologi, mycket av det outgrundligt för alla utom dataspecialister. Användare av Chat AI behöver inte ha en djupgående kunskap om AI-terminologi eller de tekniska koncept som är involverade. Systemets konversativa natur tillåter intuitiva interaktioner utan specialiserad bakgrundskunskap om hur saker fungerar. Att fokusera på vad Chat AI faktiskt kan göra är viktigare.

När jag förberedde den här boken kämpade jag med vad som är det ‘ansvariga’ att göra som författare av en bok om AI. Den konventionella metoden är att ge en kort förklaring av vetenskapen och en översikt över ofta använda termer.

Det kommer jag inte att göra.

Jag kommer här att erbjuda några externa länkar till vad jag tycker är några rimligt begripliga korta beskrivningar av AI-grunder.

Vad är AI:s framtid?: McKinsey & Co. (april 2024) har en bra uppsättning förklaringar.

Likaså är Gartners Generativ AI (odaterad) inte dålig.

Futurepedia erbjuder en inte så dålig sammanfattning av AI-grunder (maj 2024)

Efter att ha avhandlat hur-man-gör, ska jag nu introducera några termer som jag tycker är värdefulla att förstå. Inte för att du behöver känna till dem för att använda programvaran. Bara för att detta uppsättning termer refererar till några nyckelaspekter av hur den nuvarande generationen av AI faktiskt fungerar.

Mitt användningsfall för att ta itu med dessa termer och koncept är författare och utgivare som (i) vill gå ett steg djupare inom AI, av vilken anledning som helst, eller (ii) vill förstå sammanhanget för den nuvarande kritiken av AI, eller (iii) vill bidra till strategiska diskussioner om hur deras kollegor eller organisationer bör närma sig AI.

Med andra ord är detta inte vad du behöver veta, utan snarare vad du kanske vill veta. Här är de, i icke-alfabetisk ordning:

Uppmaningar och Uppmanande

Du kan öppna upp Chat AI-programvara och bara skriva in en fråga, precis som du gör för närvarande på Google.

Stora språkmodeller (LLM)

Stora språkmodeller fungerar genom att analysera enorma mängder (mestadels) skrivet material, vilket gör det möjligt för dem att förutsäga vilka ord eller meningar som bör komma härnäst i en konversation eller ett skriftligt stycke. De ‘förstår’ inte språk i mänsklig bemärkelse, utan bearbetar text genom att bryta ner den i mindre delar (kallade tokens) och sedan konvertera tokens till siffror. De bearbetar texten som siffror, återger fler siffror, som sedan konverteras tillbaka till text vid utmatning. Det är en överdrivet förenklad förklaring till varför Chat AI inte ‘innehåller’ upphovsrättsskyddat arbete: den byggs med siffror som representerar en omfattande abstraktion från de underliggande texterna.

LLM:er tränas på hur språk vanligtvis används och genererar sedan svar baserat på denna förståelse. Vi tenderar att underskatta hur förutsägbart språk faktiskt är. Chat AI kan generera text som är (ibland chockerande) lik befintlig litteratur, men av design har den inte förmågan att hämta specifika utdrag eller kopior av upphovsrättsskyddade texter. (Jag vet, många av er har hört talas om New York Times stämning mot OpenAI—Times kunde få ChatGPT att återge vissa delar av tidigare publicerade artiklar ordagrant.)

Generativ AI

Det viktigaste att förstå med denna term är den “generativa” delen. Generativ AI genererar ny text.

Generativ Förtränad Transformer (GPT)

Detta, den nördigaste av termerna här, beskriver en specifik typ av LLM utvecklad av OpenAI. “Generativ” indikerar dess förmåga att skapa text, “förtränad” betyder att den har tränats på en stor mängd textdata, och “transformer” refererar till den programvara som den använder. Att veta vad GPT står för är bara hjälpsamt så att du förstår vad GPT i ChatGPT representerar.

ChatGPT

ChatGPT är den programvara du ser; GPT är vad som finns bakom programvaran. Användare upplever ChatGPT, inte GPT bakom det. Som nämnts ovan är ChatGPT bara en av flera Chat AI online-programvarusystem, med liknande funktionalitet.

En annan term som du ofta kommer att stöta på och som är obekant för många är:

Korpus

Ordboksdefinitionen av korpus är “en samling skrivna texter” (även om det faktiskt inte alltid är text). Termen används i referens till vad GPT:er tränas på: stora korpora av (mestadels) text. Vi får höra att de största korpora innehåller hundratals miljarder ord. För vanliga dödliga är det omöjligt att förstå. Tänker du inte på Wikipedia som enormt, innehållande ett stort antal ord? Nåväl, det finns bara 4,5 miljarder ord i Wikipedia—GPT-4 tränades på långt över en biljon.

Jag tycker att det är viktigt att överväga denna skala. Författare, med rätta, är oroliga för att de 75,000 orden, plus eller minus, i deras bok kan ha sugits in i en stor språkmodell. Kanske har de det (mer nedan). Men om detta är fallet, överväg hur lite värde en enda bok har för den totala kraften hos dagens stora språkmodeller. Det är verkligen obetydligt. Utöver obetydligt. Även 10,000 böcker är småpotatis.

AI-programvara: Systemets Tunga Viktar

An icon of a key

Jag listade ovan de fyra Chat AI-tungviktarna: ChatGPT, Claude.ai, Microsoft Copilot och Google Gemini.

De fungerar alla mer eller mindre likadant och levererar liknande resultat. Så vilken är bäst? Den frågan tar dig ner i ett kaninhål. Det är lite som att fråga vilken stad som erbjuder den bästa strandsemestern, eller vilken SUV som är bäst för familjer. Det finns en enorm mängd nyanser i frågorna och en stor mängd stolthet och fördomar som filtrerar våra svar.

Samma sak med denna till synes enkla men enormt komplexa programvara. Folk hävdar att Claude har mer nyanserade språkkunskaper, och att ChatGPT är bättre med programkod. Microsoft Copilot integreras med Microsofts programvarupaket. Google Gemini kan ansluta till Gmail, Google Maps och YouTube. Vissa av skillnaderna är meningsfulla; många är små. Och de förändras ständigt med varje ny programvaruversion.

An icon of a key

‘Den bästa’ programvaran kommer inte att avgöras på ett tag. Om du experimenterar med tillräckligt många av de tillgängliga verktygen kommer du att hitta några favoriter.

Det finns två toppnivåer av AI-programvara. Den första är vad som kan kallas den grundläggande programvaran, programvara som ChatGPT och dess konkurrenter (Chat AI). Det är så de flesta upplever AI idag.

Nästa nivå är all annan programvara som i huvudsak ger ett fönster till den grundläggande programvaran. Nybörjare i AI-chatten kommer för det mesta inte ha stött på denna programvara, även om den inte är sällsynt eller okänd. Vissa är bekanta med Jasper (marknadsföringsprogramvara) eller Perplexity (sökning). Denna programvara skulle helt enkelt inte existera utan ChatGPT och dess likar.

Kom ihåg att mainstreamprogramvara från Adobe, Microsoft, Grammarly, Zoom, med flera, nu inkorporerar AI-verktyg, men detta skiljer sig från programvara som är byggd från grunden baserat på chatbotgränssnitt. (Andra som Otter (transkriptioner) föregår ChatGPT men är nu försedda med teknik från stora språkmodeller.)

Nedan kommer vi att titta på publiceringsspecifik programvara som drar nytta av generativ AI:s förmågor.

Programvaruparadigm

För länge sedan var programvara kod och endast ingenjörer förstod hur den fungerade. Det som gjorde persondatorer framgångsrika, utöver deras relativt låga kostnad, var programvara som var (relativt) lätt att använda. Vi tänker inte mycket på allt detta; det omger oss bara.

Men tänk, för ett ögonblick, på Microsoft Word, ett program som jag tryggt kan anta används av 99% av läsarna av denna bok. Det tar cirka 10 minuter att visa någon hur man skriver ett stycke text i Word. Sedan kan du visa dem hur man skapar fetstil, kursiv stil och hur man ändrar basfonten, kanske från Calibri till Arial eller Times Roman. Sedan, hur man sparar filen och skriver ut filen. Hur man söker och ersätter.

Och sedan lämnar du dem ensamma.

År senare får du reda på att de fortfarande formaterar sina Word-stycken med hjälp av mellanslag och tabbar. Och fortfarande glömmer att spara sina filer, eller blir förvirrade om vilken version de sparade, ibland måste de återskapa text från början. Men de “vet hur man använder Word.”

Word har hundratals funktioner, men en tredjedel av tiden använder användare endast 5 kommandon: Klistra in, Spara, Kopiera, Ångra och Fetstil. Det tar flera veckors utbildning att ordentligt lära sig Words avancerade funktioner; funktioner som skulle kunna hjälpa en utgivare att spara många hundratals timmar av tid. Men de flesta gör det aldrig. Jag har använt Word sedan 1985, nästan fyrtio år, och jag har aldrig gått en kurs. Jag vet inte ens vad jag inte vet om hur man utnyttjar programmets fulla kraft.

Jag går vidare om detta eftersom det är ett hjälpsamt sätt att få grepp om varför AI-programvara är så väldigt annorlunda från all annan programvara du någonsin har arbetat med. Det följer inte med en manual, inte ens en Snabbstartsguide. Det kommer med en tom skärm och en fråga: “Vad kan jag hjälpa dig med.”

Ett välkomstmeddelande på ett konversations-AI-gränssnitt riktat till Thaddeus, som frågar hur det kan hjälpa.

Det finns ingen menyrad, ingen knapp att trycka på, inga kortkommandon. Du ställer en fråga, startar en chatt, och du får några svar.

Ett konversations-AI-gränssnitt med en användarinmatning som frågar hur man förklarar skillnaden mellan ny generations konversations-AI och traditionella verktyg som Microsoft Word eller Excel.

Claudes svar:

“Det finns flera nyckelskillnader mellan att arbeta med modern konversations-AI som mig själv jämfört med traditionella verktyg som Microsoft Word eller Excel:

“1. Naturligt språkinteraktion: Med konversations-AI kan du kommunicera din avsikt med vardagligt språk istället för att behöva lära dig och navigera genom komplexa menyer och funktioner. Du förklarar helt enkelt vad du vill uppnå på ett konversationellt sätt.

“2. Kontextuell förståelse: AI-assistenter behåller kontext och förstår flödet av konversationen, vilket möjliggör en mer naturlig dialog fram och tillbaka. Traditionell programvara har ingen kontextuell medvetenhet från ett kommando till nästa.

“3. Anpassningsförmåga: AI kan dynamiskt anpassa sig och svara på en mängd olika förfrågningar, medan traditionella verktyg är begränsade till en fördefinierad uppsättning funktioner. En AI-assistent kan hjälpa till med att skriva, analysera, matematik, kodning, idéutveckling och mer inom ett enda gränssnitt.”

Det var användbart, men jag ville ha något lättare att förstå. Så jag frågade:

En användarfråga på ett konversations-AI-gränssnitt som ber om en enkel förklaring för en icke-teknisk publik.

Claude:

“Här är ett enkelt sätt att förklara skillnaden för någon utan teknisk bakgrund:

“Tänk på traditionell programvara som Microsoft Word eller Excel som ett verktyg, som en hammare eller en miniräknare. Det har en fast uppsättning funktioner som det kan utföra, och du måste lära dig hur du använder det ordentligt för att få det resultat du vill ha.

“Å andra sidan, tänk på modern konverserande AI som en smart assistent, likt en kunnig kollega eller vän. Du kan bara prata med den på vanlig engelska, och den förstår vad du försöker göra. Den kan hjälpa dig med alla möjliga uppgifter, från att skriva till matematik till att komma på idéer.

“Du behöver inte lära dig några speciella kommandon eller tekniker—bara prata naturligt. Den anpassar sig efter dina behov och kommer ihåg kontexten av din konversation. Med tiden lär den känna dig och dina preferenser.

“Så medan traditionell programvara är som ett statiskt verktyg som du använder, är konverserande AI mer som en intelligent partner som du interagerar med naturligt för att få saker gjorda. Det är ett mer flexibelt, personligt och effektivt sätt att arbeta.”

Hmm. Inte riktigt vad jag ville ha. Så jag fortsatte konversationen:

Ett svar från en konverserande AI som råder att undvika teknisk jargong och referenser som icke-tekniska personer kanske inte relaterar till.

Claude:

“Visst, låt mig försöka igen utan att använda tekniska termer:

“Tänk dig att du pratar med en vän som är riktigt kunnig och ivrig att hjälpa dig. Du kan bara prata med dem på vanlig engelska om vad du försöker göra, vare sig det är att skriva en uppsats, lösa ett matematikproblem, eller brainstorma idéer för ett projekt.

“Istället för att behöva lära och komma ihåg en massa specifika steg eller kommandon, kan du bara förklara vad du behöver med dina egna ord. Din vän förstår kontexten och anpassar sin hjälp baserat på vad ni redan har diskuterat.

“Det är en fram-och-tillbaka-konversation, där du kan ställa frågor, klargöra saker och få råd. Och ju mer du pratar med denna vän, desto bättre förstår de dina unika behov och din kommunikationsstil.

“Nu, tänk om du kunde ha samma typ av hjälpsam, enkel interaktion, men med ett datorprogram. Det är grundidén bakom nya typer av programvara du kanske hör talas om.

“Istället för den gamla stilen av programvara, där du har en stel uppsättning funktioner och måste lära dig rätt sätt att använda den, är denna nya programvara mer som en kunnig vän. Du kan bara prata med den konverserande och den räknar ut hur den ska hjälpa dig baserat på det naturliga flödet av din diskussion.

“Så det är ett smartare, mer personligt och enklare sätt att få hjälp med alla möjliga uppgifter på din dator, bara genom att prata med den som du skulle med en person. Det är den huvudsakliga skillnaden från den äldre, mer stela stilen av programvara.”

Sammanfattning: Jag försökte göra två saker med dessa exempel. En var att erbjuda ett dödsenkelt exempel på varför chatbot-programvara är så annorlunda från någon programvara vi någonsin använt. Och den andra var att illustrera hur en enda chatt kan utvecklas. Det är inte bara en enda fråga och ett enda svar. Det är en konversation. Det är en stor del av genombrottet.

Chatt-AI är någon sorts kombination av praktikant och kunnig konsult. Du kan inte anta att de vet vad du menar. Du behöver förklara vad du vill, varför du vill ha det, och hur de kan vara mest hjälpsamma.

Tre typer av AI-programvara

An icon of a key

Med breda penseldrag finns det tre typer av AI-programvara tillgänglig idag. Den första är AI-grundläggande plattformar, som ChatGPT, kärn-AI-teknologin. Den andra är, låt oss kalla det, AI-tillägg, programvara som nyligen har byggts ovanpå de grundläggande plattformarna. Du har förmodligen inte hört talas om många av dessa, verktyg som Jasper eller Rewind.

Min tredje kategori är programvara som innehåller AI-verktyg som har bultats på den befintliga produkten. Till exempel har Microsofts svit av programvara nya AI-verktyg i Word, Excel och PowerPoint. Adobe har lagt till AI-teknologi till Photoshop och Acrobat. Grammarly byggs om kring den nya generationen av LLM-baserad teknologi. Det är mestadels samma produkt, men med AI tillagt.

Det börjar bli klart att nästan all programvara du använder idag snart nog kommer att innehålla AI-funktioner. Du måste själv bedöma om dessa verktyg är verkligen användbara eller bara AI-fasad.

Jag är mer intresserad av de nya verktygen, byggda från grunden för att erbjuda det värde som bara AI kan skapa. Det är nästa generations programvara.

Arbeta med AI-programvara

Jag är en Windows-kille, tyvärr (det är en lång historia varför), och därför pratar jag om mina erfarenheter av att komma åt AI-programvara via en Windows-dator, inte en Mac. Eftersom all programvara här är webbläsarbaserad, borde det inte vara någon skillnad att använda dessa verktyg på en Mac. Men jag ger inga garantier.

Du kommer att behöva lite pengar för att spela AI-spelet, men inte så mycket. Som beskrivs ovan kan mycket av grundläggande programvara nås via gratisversioner. Men du vill oftast ha en betald beskrivning medan du testar det, och prenumerationen borde vara cirka 20 USD/månad. Avbryt efter att du har provat det (glöm inte!). Om du ser något som kostar 79 USD/månad eller, gud förbjude, 159 USD/månad, kan du ignorera det. De tänker inte på dig som en potentiell användare; de tänker på stora mainstream-företagsanvändare.

Träning för Chat AI

An icon of a key

Dagens AI är bedrägligt enkel. Alla som kan skriva en fråga kan använda den. Men att använda den väl är komplicerat, vilket inte verkar logiskt förrän du dyker ner i komplexiteten kring “uppmaningar” och relaterade koncept.

För att få tillgång till dess intelligens måste du ibland prata med den som om den vore en idiot. Eller kanske en idiot savant. Det är lite som karaktären spelad av Dustin Hoffman i Rain Man.

Vem som helst kan använda ChatGPT. Gå bara till chat.openai.com och du kan få tillgång till den senaste versionen, GPT-4 gratis (det finns några premiumfunktioner tillgängliga för ytterligare $20/månad).

När du går till ChatGPT hittar du i princip en tom skärm och den underförstådda frågan “Hur kan jag hjälpa dig idag?”

Du kan ställa frågor. Ännu bättre, du kan ladda upp en stor PDF och ställa frågor om filen. Du kan också ladda upp bilder, som den kan beskriva, eller en skannad sida: den kan känna igen texten, även om den är handskriven.

Vad som har visat sig vara ett hinder för framgångsrik användning av Chat AI är att lära sig hur man ‘talar’ med den (vilket du bokstavligen kan göra i den senaste mobilappsversionen). I Chat AI-ese kallas detta att skapa “uppmaningar” eller “uppmana”. Användare har upptäckt att ju mer precisa och detaljerade deras uppmaningar är, desto bättre svar får de från ChatGPT. Vidare är uppmaningar inte bara engångsföreteelser. Chat AI kan fortsätta en konversation ganska länge (dock inte obegränsat), och om du inte får det svar du söker kan du revidera och förfina dina uppmaningar. Detta tar tid att vänja sig vid och har skapat en serie av hur-till, skrivna och online, för att träna användare i hur man får ut det mesta av uppmaningarna.

Försök att be något av Chat AI-programvarorna att förklara ett koncept som utvecklingsredigering. Be sedan att den skapar en förklaring som en 12-åring kan förstå. Resultaten är dramatiskt olika. Lustigt nog verkar Chat AI också reagera på känslomässiga vädjanden. Att lägga till “detta är mycket viktigt för min karriär” till en uppmaning kan locka fram mer användbara svar.

(Detta är en bra tidpunkt att lägga till en parentes: Det är både lugnande och djupt oroande att de främsta forskarna som arbetar med språkbaserad AI inte kan förklara varför sådana saker sker.)

Hur man uppmanar

An icon of a key

“Uppmaning” är en specifik färdighet som är nödvändig för att använda Chat AI effektivt.

Av de olika kapade terminologier som har fångats upp under AI-guldruschen är “uppmaningar” och “uppmana” så bra som det blir. Du “talar” egentligen inte med en Chat AI. Du “ställer” inte frågor till den (eller, du borde inte—det är inte så det fungerar). Du uppmanar dessa motorer för svar, inte för enkla svar.

Först trodde jag att en analogi kunde vara teateruppmaningar. Uppmanaren påminner en skådespelare som tappar bort en replik, vilket får dem att hoppa tillbaka in i handlingen. Men detta är inte korrekt eftersom en AI-uppmaning inte lossar en bit memorerad text—det är inte så generativ AI fungerar. Ge en AI-motor en enda uppmaning upprepade gånger, och svaren kommer alltid att vara åtminstone lite annorlunda.

Just nu bad jag ChatGPT att “lista de viktigaste elementen för effektiv uppmaning.” Jag bad en andra gång och svaren var tematiskt konsekventa, men ganska olika i detaljerna. Ämnen som betonades inkluderade:

  • Var specifik

  • Undvik tvetydighet

  • Ge bakgrund

  • Använd tydliga instruktioner

På ett sätt är det ganska märkligt: AI har en bra förståelse för språk—borde den inte ha en känsla för vad du menar utan pedantisk uppmaning? Men det är just denna behärskning av språk som gör uppmaning mest kraftfull. Berätta exakt vad du menar, inte ungefär.

Prata med den som den hjälpsamma assistent, den lärda rådgivare, som du vill att den ska vara, inte som ett barn från gatan.

Poängen här är att, åtminstone för tillfället, kräver effektiv användning av LLM-baserade AI-verktyg åtminstone kännedom med bästa praxis för uppmaning. En mästare i uppmaning kommer att belönas lämpligt.

Hallucinationer: En fluga i salvan

An icon of a key

AI, baserad på stora språkmodeller, hittar på saker. Det gör den bara. Detta kallas allmänt “hallucinationer.” Det är ett verkligt problem, ett allvarligt problem. Du behöver förstå hallucinationer om du ska arbeta med AI.

Cambridge Dictionary’s Word of the Year for 2023 was “Hallucinate,” whose definition has been expanded to include “When an artificial intelligence… hallucinates, it produces false information.” (Other additions to the 2023 dictionary include “prompt engineering,” “large language model,” and “GenAI.”)

AI-hallucinationer, påpekar Cambridge, “kan ibland verka nonsensiska. Men de kan också verka helt plausibla–även om de är faktamässigt felaktiga eller slutligen ologiska.” Detta är tyvärr ganska sant, och i juli 2024 är det fortfarande en dramatisk begränsning för att använda generativ AI för uppdragskritiska uppgifter. Det är en av de flera stora underligheterna med AI, och det tar ett tag för folk att förstå det. Kom ihåg, generativ AI är mestadels en nästa ord-förutsägelsemotor, inte en faktadatabas. Därav behovet av Människor-i-loopen, som vi nu kallas, för att dubbelkolla AI-utdata. Och återigen, det är anmärkningsvärt att vi kan få så extraordinärt värde från en teknik som kan producera bevisligen felaktigt innehåll. Så är det.

Gary Marcus, en erfaren och välinformad AI-kritiker, jämför AI-hallucinationer med trasiga klockor, som är rätt två gånger om dagen. “Det är rätt ibland,” säger han, “men du vet inte vilken del av tiden, och det minskar dess värde avsevärt.”

Ethan Mollick, en huvudtalare på Publishers Weekly’s konferens i september 2023, noterar att människor som använder AI förväntar sig 100% noggrannhet. Hallucinationer, säger han, är liknande “mänskliga felnivåer” som vi tolererar dagligen.

Andrej Karpathy, en känd forskare specialiserad på AI, som för närvarande arbetar på OpenAI, skriver om hallucinationer:

“Jag har alltid lite svårt när jag blir frågad om ‘hallucinationsproblemet’ i LLMs. För i någon mening är hallucination allt LLMs gör. De är drömmaskiner.

“Vi styr deras drömmar med prompts. Prompterna startar drömmen, och baserat på LLM:s vaga minne av dess träningsdokument, går resultatet oftast till en användbar plats.

“Det är bara när drömmarna går in i faktamässigt felaktigt territorium som vi kallar det en ‘hallucination.’ Det ser ut som en bugg, men det är bara LLM som gör vad det alltid gör.”

Det är inte bara problemet med att hitta på saker. Chat AI är djupt bristfällig mjukvara.

För många förfrågningar, särskilt från nybörjare, är svaren triviala, utanför ämnet eller helt enkelt onyttiga. Chat AI har problem med att räkna: Be den om ett 500-ords blogginlägg och du har tur om du får 150.

Och var och en av AI-företagen, för att minska bias och undvika att besvara “hur-man-bygger-en-bomb”-förfrågningar, har satt upp strikta svarsspärrar runt sina produkter: alltför ofta är svaret på en fråga i huvudsak “Nej, jag kommer inte att svara på det.” Jag bad Google Gemini att granska ett utkast av denna text och blev varnad att “det är viktigt att få författarens godkännande innan publicering.”

Faktakontroll

An icon of a key

Jag argumenterar, mestadels för döva öron, att hallucinationer är ett teknologiproblem, som kommer att hitta en teknologisk lösning. Ja, de är endemiska för LLMs, men de kan kringgås.

Tänk på detta: Jag bad fyra Chat AI:s att faktakontrollera följande uttalanden:

  • Från och med 2024 finns det 6 stora multinationella förlag baserade i New York City. De kallas Big 6.

  • E-böcker fortsätter att dominera bokförsäljningen i USA.

  • Borders och Barnes & Noble är de två största bokhandelskedjorna i USA.

  • Efter en försäljningsnedgång under Covid, växer USA:s bokförsäljning återigen med tvåsiffriga tal.

Alla upptäckte felen i de första tre uttalandena. Var och en blev lite förvirrad om det fjärde, osäkra på omfattningen av Covid-försäljningsökningen, och efterföljande försäljningsmönster. Det är ett litet, icke-representativt experiment, men dessa Chat AI:s, som inte är menade att vara faktabaserade, kan göra ett trovärdigt jobb med att bedöma fakta som de flesta vanliga observatörer skulle missa.

Vad sägs om bilder och video?

An icon of a key

Eftersom utgivning av handelsböcker är mer beroende av text än bilder, tenderar förlag att förbise de banbrytande AI-baserade verktygen för bilder och video.

De är relevanta för någons förståelse av AI-revolutionen. Men diskussionen är för stor för det tillgängliga utrymmet: Jag skulle helt enkelt inte göra det rättvisa.

Rekommenderas för författare och förlag: lek med bildgenereringsfunktionerna i ChatGPT—de är gratis och roliga att använda. Sök sedan under “video och AI” och förundras över några av exemplen du hittar på de länkade sajterna. Även om verktyget ännu inte är offentligt tillgängligt, OpenAI’s Sora visar några fantastiska exempel på videor som genererats bara från textprompter.

Programvara för bokförlag

Det finns lite AI-programvara byggd från grunden specifikt för bokförlag (även om det finns mycket tillgängligt för författare).

Vetenskapliga förlag har fler alternativ, med en mängd AI-verktyg för forskning, skrivande och publicering.

För kommersiella förlag är de flesta alternativen relaterade till AI och ljud. Utanför ljudområdet samlas valen kring redigerings- och marknadsföringsverktyg. Det finns också flera AI-verktyg för innehållsdetektering och verktyg och tjänster för innehållslicensiering.

Redigeringsprogrammen är riktade mot författare, inte professionella redaktörer — det finns många fler författare än redaktörer, och den kvalitet som professionella redaktörer kräver är mycket högre än för (mestadels självpublicerade) författare.

Marknadsföringsverktygen riktar sig också bredare än bara bokförlag, men till marknadsförare överallt, med verktyg för webbplatsinnehåll, textgenerering och SEO. Jasper.ai är en ledare inom denna kategori och hävdar att HarperCollins är en kund.

Shimmr, en sponsor av denna bok, är ett AI-drivet verktyg för annonsutformning specifikt för bokförlag. Företaget och dess grundare, Nadim Sadek, profilerades i en artikel i Publishers Weekly i maj 2024.

“Vad vi gör är att använda AI för att överväga den psykologiska profilen av en bok och matcha den till sinnesstämningen hos en specifik publik, vilket säkerställer en mer effektiv koppling mellan läsare och böcker,” berättade Sadek för PW. “Vi kallar det ‘Bok-DNA’, och det involverar inte bara att känna till karaktärerna och handlingen i en bok, utan även bokens värderingar, intressen och känslor.”

Genom att använda Bok-DNA skapar Shimmrs AI-verktyg sedan riktade annonser för sök- och sociala mediekanaler (för närvarande Google och Meta). Annonserna tar formen av displayannonser, med AI-genererade bilder åtföljda av slogans.

Jag påpekar för förlag som utvärderar Shimmr att det kan ge extra intäkter, vilket är vad vi förväntar oss att ett nytt annons-/marknadsföringsverktyg ska bidra med.

Om du vill uppleva ett annat “endast med AI” mjukvaruverktyg, kolla in Hypnovels, som animerar kapitel i fiktionsböcker. “Berättelse, bild och rörelse, allt genererat av AI, kommer samman med fantastisk berättelsekonst på ett sätt som är mindre bokstavligt än traditionell animation (därav “hypno”) och mer sensoriskt engagerande än en ljudbok, i en stil som gör kapitlet unikt och fängslande.”

En annan ny leverantör som föddes ur möjligheten med AI är Veristage (även en sponsor av denna bok). Veristage erbjuder Insight, deras “AI Publiceringsassistent,” ett uppgiftsspecifikt gränssnitt över flera publiceringsfunktioner.

Insight-resan börjar med manuskriptet. Genom att ladda upp en tidig version låses en rad verktyg upp, vissa mer värdefulla för redaktionellt arbete, andra mer värdefulla för marknadsföring. Efter att ha arbetat med alla funktioner kan du ladda ner en PDF-rapport som inkluderar redaktionella aspekter, som skrivton, troper, klichéer och användning av adverb och adjektiv, och sedan marknadsföringsinnehåll, som beskrivningar, metadata, unika säljargument, jämförelser, Amazon-optimerat innehåll, och föreslagna inlägg för sociala medier.

Det jag gillar bäst med Insight är att det tar ett holistiskt grepp på att tillämpa AI i publiceringsprocessen, istället för att behöva samla flera programvaruverktyg, var och en för en annan funktion.

Jag vill också lyfta fram min publiceringsplattform, Leanpub. De har varit fantastiska att arbeta med. Litet är vackert: de tar chanser med teknik och tjänster som större företag skulle undvika. Av stort intresse för författare och mindre förlag är deras nya TranslateWord-tjänst, där du kan översätta en bok skriven i Microsoft Word till upp till 31 språk, via GPT-4o API (som driver ChatGPT). Det är vad jag använder för att översätta denna bok.

Jag sökte på andra håll för att försöka hitta en tjänst för boköversättning. Det finns massor av översättningsfirmor, några som använder AI. Den enda jag kunde hitta som erbjuder boköversättning är DeepL. Men det är inte ett fokus för företaget. Just nu är Leanpub platsen att gå till.

Affärsprogramvara för bokpublicering

An icon of a key

De befintliga affärssystemleverantörerna som betjänar publiceringsindustrin börjar lägga till AI-teknologier, som vi har sett hos företag i företagsstorlek, som Salesforce och Oracle.

Jag har pratat med flera av leverantörerna av publiceringssystemprogramvara, inklusive Firebrand, och alla tittar på möjligheterna men går försiktigt fram.

Jag ser fram emot möjligheten att prata om AI med en mångfaldig grupp deltagare vid Firebrand’s Publishing Innovation Forum i september 2024 i Nashville, TN.

knk har hållit två webbinarier om AI och släppt en vitbok, men har (per 26 juni, 2024) ännu inte annonserat några AI-funktioner i sina produkter.

Virtusales har nyligen lanserat sitt första set av AI-aktiverade verktyg, inklusive bildtaggning, alt-text generation, verktyg för copyediting, generering av försäljnings- och marknadsföringstexter, samt översättningar av dessa texter.

Jag talade med Klopotek på deras Klopotek Publishing Radio. De har “startat ett AI-initiativ inom området kundtjänst,” även om inga detaljer är tillgängliga.

Supadu, som erbjuder förlag “webbdesign, e-handel och dataslösningar,” har nu “Supadu Smart AI,” (pdf) med “avatar-ledd titelvideorecension med Smart Buy,” “avatar videodriven marknadsföringsmaterial för marknadsförings- och försäljningsteam,” och “enkel flerspråkig översättning av författar- och titelvideor.”

AI-programvara för bokförlag: startups

Vissa människor är bekanta med det arbete jag har gjort kring teknikbaserade startups inom bokförlagsvärlden. Det finns en rapport i Publishers Weekly som beskriver arbetet, och länkar till databasen.

Som du kommer att se i rapporten, tittar jag ganska brett på startups över hela bokförlagsspektrumet. Jag inkluderar inte nya bokförlag, om de inte gör något ovanligt med teknik. De grundläggande kriterierna är: använder du teknik för att försöka vitalisera någon aspekt av bok(publicerings)processen? Jag har över 1 600 företag i databasen, de flesta lanserades efter att Amazon släppte den första Kindle 2007.

Efter att du har fått en översikt av databasen, kan du börja dyka djupare. På den längst till höger fliken ser du ett sätt att sortera endast efter AI-relaterade förlagsstartups.

En skärmdump av en tabell som listar verktyg och tjänster med ett filter för AI valt, som visar en räkning på 243.

Som du kan se i illustrationen, finns det över 240 AI-relaterade förlagsstartups (från och med tidigt i juli 2024). Vi räknar ljudförlagsstartups som använder AI som en separat kategori och totalt är det över 300 företag. Majoriteten, över 280, lanserades efter att ChatGPT först dök upp i november 2022. Denna mängd nya affärsstartups är utan motstycke inom bokförlagsvärlden. Det är häpnadsväckande.

Som är karakteristiskt för hela databasen, riktar sig dessa AI-startups mestadels till författare (70%). Ungefär 13% är inriktade på att betjäna förlagsföretag. 10% är fokuserade på barnförlagsverksamhet.

Omkring 50 av startups riktar sig till läsare med en rad uppfinningsrika erbjudanden. Flera är berättarplattformar. Det finns ganska många sammanfattare. Det finns flera upptäcktssajter, “Använd AI för att hitta din nya favoritbok.” Snabbt förbättrade AI-genererade röster har lett till ett urval av “läs det för mig”-verktyg.

Och några intressanta idéer som inte skulle vara möjliga utan AI.

Bookshelf: Reading Tracker är en kombination av bokupptäckt och personlig biblioteksapp som inkluderar “automatisk tidsspårning, läsmål och påminnelser, och insiktsfull statistik och trender.” Dess AI-bibliotekarie “kan generera sammanfattningar och flashkort, diskutera nyckelidéer och slutsatser, och mycket mer.”

Min vän Ron Martinez lanserade nyligen en webbplats kallad Inventionarts.ai som introducerar “ett nytt samtalsmedium.” Som webbplatsen förklarar, “Prata med flera AI-personligheter, var och en med sin egen identitet, expertis och medvetenhet. Bjud in olika personas att delta i scenarier. Och du kan också spela en fiktiv roll!” Ett litterärt spel, på ett sätt.

Som är karakteristiskt för den större startupkohorten, är många av dessa startups mellan små och pyttesmå, bara en person med en webbplats och en halvbakat idé. Jag inkluderar dem alla—vem vet vart de är på väg.

Jag rekommenderar starkt att du leker med databasen. Klicka på några länkar. Jag tror att du kommer att bli road av innovationen och djärvheten hos många av dessa organisationer.

En av sponsorerna för denna bok, Book Advisors, specialiserar sig på fusioner och förvärv inom förlagsbranschen. Jag förespråkar alltid för innovativa startups att de ska leta efter partners, och Book Advisors är dit jag skickar dem för att diskutera processen. Bokförlagsindustrin har flera respekterade M&A-företag att vända sig till, inklusive The Fisher Company och Oaklins DeSilva+Phillips. Book Advisors är det enda företaget jag känner till som också arbetar med teknologiska startups.

AI och bokförlagsbranschen: Vad gör branschen för närvarande?

An icon of a key

De AI-relaterade aktiviteterna hos många av de framstående förlagsgrupperna verkar lägga sina röster till kören av upphovsrättsbekymrade. The Association of American Publishers “lämnade in svarskommentarer i U.S. Copyright Office förfrågan om korsningen mellan upphovsrättslag och artificiell intelligens (AI)...”

The U.K. Publishers Association noterar att “det är av största vikt att regeringen inför konkreta lösningar så snart som möjligt för att skydda den mänskliga kreativiteten och kunskapen som ligger till grund för säker och pålitlig AI.”

Å andra sidan erbjuder Independent Publishers Guild (IPG), med mer än 600 medlemmar, AI-råd och utbildning till sina medlemmar, inklusive sin “Praktisk guide till AI i förlagsbranschen,” genomförd av en känd AI- och förlagsexpert, George Walkley.

Här i USA har jag förmånen att vara en del av Book Industry Study Group’s (BISG) AI Working Group, som rapporterar till Workflow Committee. Arbetsgruppen har skisserat flera potentiella strategiska initiativ:

  • Utveckling av bästa praxis och standarder: Rekommendera bästa praxis relaterade till AI-användning, kopplade till etiska riktlinjer, befintliga regler och lagar. Detta inkluderar transparens i AI-genererat innehåll och dess avslöjande för konsumenter.

  • Branschundersökningar och definitioner: Genomföra undersökningar för att samla breda branschinsikter om nuvarande och potentiella AI-användningar och upprätta tydliga definitioner och omfattningar för vad AI betyder inom ramen för bokförlagsbranschen.

  • Periodisk rapportering och granskning: Erbjuda periodiska rapporter för att hjälpa branschen att förutse och anpassa sig till de snabba förändringar som AI-teknologier innebär.

Andra skriv- och förlagsföreningar försöker ligga steget före ämnet. Vissa tar ställning mot AI; andra försöker bara hjälpa sina medlemmar att förstå tekniken och, kanske, experimentera med den.

AI och bokförlagsbranschen: Vad gör förlagsföretagen?

För ett år sedan var svaret på frågan om vad förlagsföretagen gör för närvarande, “inte mycket.” Inte mycket har förändrats sedan dess, men det har funnits viss aktivitet. Jag kommer att fokusera på handelsbokförlag; vetenskapliga och akademiska förlag är mer aktiva. Här är något av vad jag har upptäckt.

Hachette: Enligt en rapport från november 2023 i The Bookseller i Storbritannien, har Hachette publicerat ett positioneringsuttalande om AI, där man gör en åtskillnad mellan ‘operativa’ användningar och ‘kreativa’ användningar. Företaget “gjorde det klart att det uppmuntrar ‘ansvarig experimentering’ för operativa användningar men är emot ‘maskinkreativitet... för att skydda originalkreativt innehåll producerat av människor’.”

HarperCollins: Enligt en rapport i Publishers Weekly av Andrew Albanese och Ed Nawotka från april 2023, sa HarperCollins VD Brian Murray:

“Vi vet att det kommer att vara viktigt och det kommer att ha en stor inverkan på vår bransch under de kommande tre till fem åren. Och så tror jag att många av oss försöker räkna ut hur och att se till att vi använder det på ett etiskt, moraliskt sätt som hjälper oss att betjäna författare och tillhandahålla professionella tjänster till författare och inte konkurrerar med författare och berättande.

“Och det är, tror jag, en utmaning. Kanske inte så mycket för alla förläggare som är här, men jag garanterar att det finns många små tekniska team runt om i världen som kanske är ute efter vår verksamhet. De är inte förläggare, de är inte redaktörer. De är teknologer och de ser en möjlighet.”

Penguin Random House (PRH): Bertelsmann, moderbolaget till PRH, erbjuder ett white paper kallat State of Play: Exploring Generative AI’s Transformative Effects on the Media & Entertainment Industry, som inkluderar ett avsnitt om bokutgivning.

Enligt en rapport i Publishers Lunch, har företaget “introducerat sin egen interna AI-applikation, kallad PRH ChatGPT.”

Artikeln säger att PRH interna dokument förklarar att programmet “‘kan användas för att effektivisera processer, förbättra kreativiteten och tillhandahålla dataanalyser’ över avdelningarna. Företaget föreslår att bland användningsområdena för appen är att sammanfatta böcker och dokument; revidera e-postmeddelanden; skriva blogginlägg eller jobböbeskrivningar; analysera textbaserad data, och ‘generera idéer för innehåll.’”

Simon & Schuster: Företagets VD Jonathan Karp fick ett omnämnande i New York Times “Most Memorable Literary Moments of the Last 25 Years” med ett citat rapporterat i Publishers Weekly från maj 2024 U.S. Book Show. Han sa att AI inte var “elefanten i rummet” utan snarare, “mer som cikadan i världen. Du vet, mycket surr och mycket parning.”

Han erkände att AI “är definitivt ett värdefullt verktyg. Det kommer definitivt att göra oss mer effektiva. Det kommer att hjälpa oss att bearbeta och samla in information bättre och förhoppningsvis tillåta arbetare att utföra ett högre nivå av arbete som är mer intressant och kreativt.”

I mars, på London Book Fair, enligt The Bookseller, sa Karp att företaget också skulle titta på utländska språkversioner av AI-genererade ljudböcker “i territorier där [den författarens] verk annars aldrig skulle ha en chans på grund av kostnaden för [ljudproduktion].”

AI och bokutgivning: Användningsfall

An icon of a key

De specifika användningsfallen för AI och bokutgivning, över olika funktioner, är lätta att beskriva konceptuellt. Men det finns inte mycket information tillgänglig om vad förläggare faktiskt gör.

Keith Riegert, VD för Ulysses Press och Perfect Bound, presenterade på Publishers Weekly U.S. Book Show i maj 2024, och erbjöd den mest omfattande översikten jag har sett om AI-användningsfall inom förlagsbranschen. Perfect Bound är sponsor av denna rapport; jag står fast vid det uttalandet. Han erbjuder “20 praktiska sätt du, som professionell inom bokutgivning, kan börja använda AI just nu.”

Hans presentation, Getting Started with AI, kan ses och laddas ner från Perfect Bound webbplats.

Vad händer när AI läser en bok?

Jag lånar denna avsnittstitel från Ethan Mollicks nyhetsbrev medvetet—det finns ingen anledning att försöka förbättra den. Mollick är professor vid Wharton School of the University of Pennsylvania, som studerar entreprenörskap & innovation. Hans nyhetsbrev, som jag ofta rekommenderar, är lugnt, uppfriskande och unikt insiktsfullt.

Bland de saker som kvalificerar Mollick som kommentator är att han inte har något egenintresse i spelet. Han behöver inte sälja AI, eller förstöra det. Han har helt enkelt åtagit sig att utforska AI i dess många effekter, mestadels på utbildning, kultur, skrivande och publicering. Och han är en fin, tydlig skribent.

Om du bläddrar igenom Mollicks nyhetsbrevarkiv kommer du att se att han inte började fokusera på AI förrän i december 2022. Det var inte hans område—som för de flesta av oss, AI dök upp i hans dagliga arbete, och han kunde inte ta blicken ifrån det.

I detta inlägg ligger hans insikter närmast vårt intresse som publiceringsproffs. “Kan AI,” frågar han, “ändra sättet vi interagerar med böcker?”

För att svara på frågan noterar Mollick, “vi behöver både en AI med ett minne stort nog att hålla en bok, och en författare som känner sin egen bok tillräckligt väl för att bedöma AI:s resultat.” Mollick testar en av sina flera titlar (han specificerar inte vilken, men från chattarna är det klart The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors, en bok som fått positiva recensioner på Amazon, men inte en nuvarande bästsäljare).

Mollick överväger olika aspekter av AI:s potentiella värde för en författare, förläggare eller läsare, inklusive “AI som läsare och redaktör,” och “en praktisk användning: hjälp för instruktörer.” Han ber en LLM–stor språkmodell–inte ChatGPT–att sammanfatta boken. Den lyckas till Mollicks belåtenhet.

Sedan en svårare utmaning: “Ge mig exempel på metaforer i boken.” Metafor, påpekar han, “är utmanande även för mänskliga läsare, eftersom det innebär att hitta användning av bildligt språk utan några tydliga markörer (till skillnad från en liknelse, finns det inga “som” eller “liksom”).” Resultaten, noterar han, “är imponerande, även om det finns mindre fel.”

LLM:n är mindre framgångsrik som redaktör: dess brister på detta område, påpekar Mollick, illustrerar “något som har blivit tydligt om det nuvarande tillståndet för AI: om du är en mycket bra författare eller redaktör, är du bättre än nuvarande AI…”

Trots detta, “AI:er har, eller åtminstone verkar ha, en förståelse för kontexten och betydelsen av en text.” Som ett resultat tror Mollick att “hur vi relaterar till böcker sannolikt kommer att förändras som ett resultat av AI.”

Jag tror det också.

AI och bokdesign & produktion

An icon of a key

Expertssystem och processautomatisering ligger fortfarande före AI när det gäller bokdesign och produktion.

Programvara för automatisk sättning av böcker går tillbaka till åtminstone 1970-talet. I mitten av 1980-talet övervakade jag ett mjukvaruprojekt kallat PageOne, baserat på Donald Knuth’s TeX, som kunde sätta en bok på några minuter. SGML dök upp ungefär samtidigt, baserat på en dokumentstandard introducerad 1969. Den ersattes till stor del av XML, introducerad 1996. Dessa robusta markeringsspråk skapar solida strukturer för automation.

Desktop publishing inledde en annan omgång av automation för QuarkXPress och Adobe InDesign, samt Adobe Illustrator och Adobe Photoshop. Publiceringsarbetsflöden kan hanteras med olika program och system.

En organisation att hålla ögonen på är Coko Foundation. De erbjuder en svit av open source-verktyg för produktion och publiceringshantering, inklusive Kotahi, en plattform för vetenskaplig publicering, och Ketty för bokproduktion, som inkluderar en AI Assistant. Kotahi AI PDF Designer, “omvandlar PDF-design till en enkel, interaktiv process.”

Det finns några tidiga initiativ för att integrera AI i InDesign arbetsflöden. I april 2024 tillkännagav Adobe en Text to Image-funktion. Tredje parter kan ligga före Adobe här: de innovativa prepress- och produktionsleverantörerna i Indien, såsom Hurix Digital och Integra, visar mer initiativ än Adobe när det gäller att utnyttja AI för produktion.

AI & bokmarknadsföring

An icon of a key

AI:s påverkan på bokmarknadsföring kommer att vara ytlig på kort sikt, men på lång sikt mycket mer djupgående. Mycket beror på vad du uppfattar som ‘bokmarknadsföring’; det förändras.

Den ‘lågt hängande frukten’ är uppenbar. Be Chat AI hjälpa till med en produktbeskrivning eller ett pressmeddelande. Be den föreslå några nyckelord. Detta kan den göra, utan att svettas. Men de flesta professionella inom förlagsbranschen kan göra samma sak, med bara lite fukt på pannan.

Keith Riegert’s användningsfall, länkade ovan, inkluderar förslag för brainstorming av titlar, utarbetande av en digital marknadsföringsrapport och skapande av en digital marknadsföringskampanjspårare i Google Sheets.

Shimmr programvara, beskrivet ovan, antyder formen av automatiserad marknadsföring som kommer.

AI och metadata

An icon of a key

Vad har AI att göra med metadata, och vice versa? Dess roll verkar blygsam hittills; förvänta dig stora förändringar.

Metadata är centralt för bokupptäckbarhet. Du har hört det tillräckligt många gånger för att bli illamående av uppmaningen. Det är avskräckande främst för att “metadata” förblir svårfångat för de flesta icke-tekniker. Om du säger, “det är bara grundläggande information om boken, titeln, beskrivningen, priset, ämneskategorier, den typen av saker,” andas folk ut. Det är de bekväma med. Men det är ungefär allt.

Jag beklagar att påminna dig om att det faktiskt finns mycket mer till metadata än bara några få detaljer om boken. Det finns så mycket mer. Mycket mer än vad jag kan omfatta i denna lilla bok. Jag har varit medförfattare till en hel bok om ämnet. Ingram publicerar Metadata Essentials, en utmärkt kort volym. Jag säger det här, och inte för sista gången: författare och förläggare ignorerar sin metadata på egen risk.

AI kan hjälpa till med metadata-generering. Till exempel erbjuder självpubliceringsleverantören PublishDrive, en “AI-drivet bokmetadata-generator” som ger AI-rekommendationer för boktiteln, beskrivningen, Amazon-kategorier, BISAC-kategorier, och nyckelord.

Insight, från Veristage, som beskrivs ovan, kan generera beskrivningar, nyckelord, BISAC-kategorier, och definiera målgrupper.

Deklarera AI-användning i metadata

An icon of a key

Du kanske tror att den värdiga världen av metadata skulle vara långsam med att anamma AI. Inte så! I november förra året släppte EDItEUR, förvaltaren av ONIX-standarden, en kort Applikationsnot kallad “Aspects of AI in ONIX.” (pdf)

Med sin typiska djupa visdom noterar Graham Bell, organisationens direktör, att “en reaktion på (kontroverserna kring teknologin) är att avstå från att använda AI eller att undvika att handla med AI-skapade produkter. Ett mer realistiskt alternativ är helt enkelt att vara transparent med handelspartners och läsare när AI har använts. Och eftersom vissa återförsäljare begränsar eller förbjuder AI-baserat innehåll på sina plattformar, är det viktigt för respekterade förläggare att framhäva de produkter som använder generativ AI-teknik för att skapa innehåll.”

Bell fortsätter med att beskriva sätt som förläggare kan specificera i metadata:

  • AI-bidragande

  • AI-baserade röster i ljudböcker

… samt en metod för att indikera i metadata för digitala produkter att förläggaren uttryckligen avstår från text- och datautvinning (TDM) för andra användningar än forskning. Det finns också ett sätt att specificera en separat licens som täcker kommersiell eller icke-forsknings TDM.

Som ofta är fallet, vad som specificeras i ONIX kanske inte uppdagas längre ner i kedjan, men åtminstone har en bästa ansträngning gjorts.

Strategier för att integrera AI i förlagsverksamhet

An icon of a key

Det finns få saker som förlag är mindre bekväma med än att integrera komplex digital teknik i sin dagliga verksamhet. Det är förståeligt. AI, i synnerhet, orsakar ångest för alla, och inte bara i förlagsvärlden. Det är nytt, det är mystiskt, det är personligt, det är kraftfullt. Människor känner sig hotade av AI av många skäl. Att förändra attityder tar tid.

Men detta är inte en bra tid att vara försiktig med tekniken.

Det finns lugna och rationella tillvägagångssätt för att integrera AI i din förlagsverksamhet, oavsett storleken på din organisation.

Drivkraften måste komma från toppen. Högsta toppen. Seniorledningen måste omfamna en vision om AI:s potentiellt transformativa inverkan och kommunicera ett program till personalen över hela organisationen. Programmet kan vara lite mer än “experimentera, dokumentera dina experiment och dela.” Det är en bra början.

The Economist refererade nyligen till en organisatorisk taktik för att anta ny teknik kallad “fyrmetoden.” Du skapar ett fyrtorn genom att välja ett högprofiligt bevis på koncept som kan implementeras snabbt, som alla kan relatera till.

Förlag är handikappade av rabalderet kring upphovsrätt: författare är upprörda. En undersökning av Authors Guild i maj 2023 fann att “90 procent av författarna anser att de bör kompenseras om deras arbete används för att träna generativa AI-teknologier,” och 67 procent sa att de “inte var säkra på om deras förlagskontrakt eller plattforms användarvillkor inkluderar tillstånd eller rättigheter att använda deras arbete för några AI-relaterade syften.” Dessa osäkra författare frågar nu sina förläggare om AI används i redigeringen eller produktionen av deras arbete, och några mäktiga författare insisterar på att det inte ska vara det. De söker efter AI-ekvivalenten till ett jordnötsfritt bageri.

Detta är ett besvärligt problem för förlag—om du inte kan använda AI på böckerna du planerar att publicera, vad kan du då använda det för?

Utveckla och kommunicera AI-policyer

Trots dess utbredda användning har få förlag offentligt definierat sina AI-policyer och kommunicerat sina tillvägagångssätt för AI till allmänheten. Termen ‘allmänheten’ har en hal betydelse här, när du betänker de olika allmänheter som adresseras av kommersiella, akademiska och utbildningsförlag.

För handelspublicister är den viktigaste målgruppen författare och deras agenter. Vetenskapliga publicister står inför olika hinder när de överväger AI:s lovande inverkan på forskning och sedan AI:s mer problematiska inverkan på att omvandla forskning till berättelse (Avi Staiman skrev ett tankeväckande inlägg om detta ämne). För utbildningsförlag är det knepigt att fastställa riktlinjer, eftersom AI:s intrång i undervisningspraktiken, utbildning, är mångfacetterad och komplex.

Jag tror att publicister står inför två stora utmaningar när de går framåt med AI-teknologier. Den första är att utveckla en företagsposition om hur man ska närma sig AI generellt, om hur man ska integrera AI i sina arbetsflöden. Den andra utmaningen är att kommunicera den positionen, klart och tydligt, till sina intressenter.

De publicistiska riktlinjer jag har sett är mestadels bristfälliga. Vissa av dem är faktiskt riktlinjer riktade externt, till författare, med en rad förmaningar om vad som är acceptabel praxis (inte mycket) och vad som inte är acceptabelt (mycket). O’Reillys “AI Use Policy for Talent Developing Content for O’Reilly” fortsätter sida efter sida med esoterisk vägledning, såsom “ANVÄND INTE några OSS GenAI-modeller som producerar programvaruoutput som är föremål för villkoren i en copyleft- eller nätverksviral open source-licens.”

Å andra sidan inkluderar vetenskapliga publicisten Elsevier, i avsnittet “Elsevier Policies” på sin webbplats, uttalanden om “Ansvariga AI-principer,” “Text- och datautvinning,” och “Användningen av generativ AI och AI-assisterade teknologier i skrivande för Elsevier.”

De få interna, opublicerade, publicistiska riktlinjerna som jag har sett är konservativa, alltför mycket så. Dessa publicister reagerade för snabbt på de olika uppfattade och möjliga hoten och på sina författares ångest, och har hindrat sin egen förmåga att engagerat interagera med denna snabbutvecklande, snabbt föränderliga teknologi.

Det är en självklarhet att de kommer att använda AI ‘ansvarsfullt,’ vad nu det betyder. Det är en självklarhet att de har största omsorg om författares immateriella rättigheter och för att aggressivt skydda författares upphovsrättsskyddade verk. (Även om, naturligtvis, dessa breda principer måste deklareras offentligt, och ofta upprepas.)

Men vad mer?

  • Kommer de att tillåta att AI har en roll i redaktionella förvärv? Kan AI ta en titt på slushhögen?

  • Kommer de att tillåta att AI har en roll i utvecklingsredigering, manusredigering och korrekturläsning?

  • Kommer de att tillåta att AI har en roll i att bestämma upplagor och allokeringar?

  • I att skapa tillgängliga e-bokfiler, inklusive alternativtext?

  • I att hjälpa till med skapandet av ljudböcker i fall där det inte är ekonomiskt realistiskt att anställa talangfulla mänskliga berättare?

  • I att hjälpa till med översättning till främmande språk på marknader där rättigheterna aldrig skulle säljas?

  • I att utveckla marknadsföringsmaterial i stor skala?

  • I att kommunicera med återförsäljare?

Om så är fallet måste de göra detta klart, och tydligt förklara, tänkandet bakom dessa riktlinjer. Publicister måste vara modiga i att möta de många invändningarna från de flesta författare i denna tid av rädsla och tvivel.

Arbetsöverväganden

An icon of a key

Endast de största publicisterna kommer att kunna anställa dedikerad personal för att arbeta med AI-program och system. Den genomsnittliga publicisten kommer att vilja exponera all sin personal för AI-verktyg, med förväntningen att var och en kan utforska att använda AI för att hitta effektiviseringar i sitt arbete.

Vid PubWest-konferensen i februari 2024 i Arizona föreslog en talare utanför förlagsbranschen att en av användningarna för AI kommer att vara att ersätta praktikanter. Rummet exploderade. Hon menade väl–faktiskt beskriver en rapport den 10 april 2024 i New York Times hur Wall Street-investeringsbanker planerar att ersätta många av sina praktikanter med AI. Liknande fallet inom förlagsbranschen är en uppenbar oro: hur hittar du seniora analytiker om de inte kan börja som junioranalytiker?

Förlagsbranschen har alltid förlitat sig på praktikplatser. En studie från 2019 fann att 80 procent av de personer som hade arbetat inom förlagsbranschen i mindre än femton år tidigare hade varit praktikanter.

Delvis är det ett sätt att få undan det tråkiga arbetet till en rimlig kostnad. Men det bleknar i jämförelse med den större verkligheten att ingen förlagsskola kan utrusta någon att börja på ett förlag på nivån av mellanchef. Det enda sättet att utveckla morgondagens skickliga personal är att utbilda praktikanter och lärlingar idag.

Målet här är inte att försöka ersätta praktikanter med AI, utan istället att göra deras arbete mer produktivt och givande med hjälp av AI-verktyg, till förmån för både praktikanten och förlaget.

AI för ljudböcker

An icon of a key

AI för ljudböcker fungerar riktigt bra. Det är inte perfekt, men det fungerar. Författare och förlag använder nu rutinmässigt AI-verktyg i produktionen av ljudböcker, främst för böcker där fullskalig berättarfokuserad ljudboksproduktion inte är ekonomiskt genomförbar. Och inte bara för engelskspråkiga ljudböcker, utan även ljudböcker i översättning.

Att använda AI för ljudböcker är inte nytt; jag rapporterade först om trenden i Publishers Weekly 2021. Men de nyare stora språkmodellerna har återupplivat teknologin för automatiserad ljudbokberättelse.

Tillbaka 2021 noterade jag “Är det perfekt? Absolut inte. Kan det vara tillräckligt bra? Förmodligen, om ett förlag är villigt att spendera den nödvändiga tiden i röstredigeringsfasen av projektet.” Två och ett halvt år senare, enligt många rapporter, är AI-röster omöjliga att skilja från mänskliga röster, om du inte lyssnar mycket noga.

Förra november introducerade Meta (Facebook) “Seamless,” som kan “överföra toner, känslouttryck och röststilskvaliteter” i översättningen av 200 språk. En ljudbok kan omedelbart översättas till flera språk med enastående kvalitet.

Också 2021 rapporterade jag att “Audibles blockering av distributionen av ljudböcker med icke-mänskliga berättare är ett verkligt problem som kan ta tid att lösa.” Under tiden har både Google och Apple tillkännagett program som tillåter författare att skapa ljudböcker med AI-genererade röster. Den 5 december började Findaway Voices av Spotify acceptera “digitalt röstberättade ljudböcker från Google Play Böcker för distribution till utvalda återförsäljarpartners.”

I början av november 2023 tillkännagav Amazon att Kindle Direct Publishing (KDP) författare snart skulle ha tillgång till en tjänst som skulle tillåta dem att “snabbt och enkelt producera en ljudboksversion av sin e-bok med virtuell röstberättelse, en syntetisk talteknologi.” I januari 2024 rapporterade Jane Friedman (betalvägg) att “Audible tyst började tillåta AI-berättade ljudböcker att komma in i deras butik i slutet av förra hösten, långt efter att andra återförsäljare hade gjort detsamma.”

Och självklart använder jag AI för ljudboksversionerna av denna bok.

AI för boköversättning

An icon of a key

AI för boköversättning fungerar. Kanske inte lika bra som det fungerar för automatiserad ljudboksskapande. Men det kommer mycket nära, mycket snabbt. Icke-litterär fiktion kan vara först. Litterär fiktion kan följa efter. Facklitteratur utgör en annan uppsättning utmaningar.

Jag var värd för ett webbinarium om AI för boköversättning, sponsrat av BISG, i juni 2024. Videon finns online på YouTube. Jane Friedman beskrev också programmet i sitt nyhetsbrev Hot Sheet.

Ämnet är komplext och nyanserat. En sak jag finner fascinerande är hur länge människor har försökt automatisera översättning. Det påminner oss om att böcker, som fyller vårt universum, är en så liten del av skriftlig kommunikation, ännu mer i denna onlineålder.

Warren Weaver, krediterad som maskinöversättningens (MT) fader, noterade till en kollega, “När jag tittar på en artikel på ryska säger jag: ‘Detta är egentligen skrivet på engelska, men det har kodats i några konstiga symboler. Jag kommer nu att fortsätta avkoda.’” För en maskin är språk bara kod. Det är inte kultur och känsla och den storslagna skriftens prakt. Det är en uppgift med siffror och kod.

Det är tydligt att fiktions/facklitteraturuppdelningen kommer att spela en stor roll i AI-översättning. Chat AI är stark på stil, men det brister när det gäller fakta. Det är väldigt tidiga dagar, men jag är benägen att tro att Chat AI kommer att lysa med fiktion, men komma till korta med facklitteratur. (Trots detta fortsätter jag att maskinöversätta denna faktaspäckade bok!)

Litterär fiktion är verkligen elefanten i rummet. Den är dyrbar och aktad och med rätta. Översättare kan spendera timmar med att argumentera om ett enda ord eller fras. Chat AI måste vara försiktig i dessa vatten.

Men detta är bördig mark. Såvitt jag kan avgöra (från knapphändiga data) fanns det bara 9 500 handelboköversättningar 2023. Även om jag är helt fel, är det klart att få böcker översätts från främmande språk till engelska.

På samma sätt fann jag en statistik som indikerar att det 2023 bara fanns 7 230 översättningar från engelska till spanska (på spanska bokmarknader). Det verkar löjligt litet.

Det finns en enorm möjlighet här.

Mest användning av AI för boköversättning kommer att vara för böcker där översättning aldrig ansågs ekonomiskt genomförbar. Det kommer att påverka jobb för översättare av “mellanklass”-böcker; jobbtillväxten kommer att ligga inom projektledning och kvalitetskontroll. Kommer det att kompensera för jobbförlusten? Osannolikt.

Som med de flesta aspekter av AI finns det utmanande frågor att hantera, och inga enkla svar.

Som jag nämner i mjukvarusektionen erbjuder Leanpub och DeepL AI-assisterade boköversättningstjänster till författare och förlag.

AI för akademisk publicering

An icon of a key

Kommersiella förlag och författare av alla slag bör hålla ett öga på AI:s utveckling inom den akademiska publiceringssfären. Den utvecklas mycket snabbare än inom konsumentpublicering.

Jag ser två skäl till framsteget. För det första är författarna inom akademisk publicering akademiker till yrket, och inom STM-sektorn (vetenskap, teknik och medicin) är de ofta forskare med avancerade examina. Helt bortsett från publicering undersöker de, och omfamnar ofta, AI inom sitt arbete. De skulle bli mer förvånade över att deras förlag inte utforskade användningen av AI i redigering och publicering av deras arbete.

Detta flödar upp till det akademiska publiceringssystemet, där redaktörerna ofta själva är forskare. För dem är teknik inte skrämmande.

Jag kommer inte att gå djupare in på detaljerna i denna bok; jag kommer att rapportera om det mer ingående på min blogg.

AI för författare

Författare och förlag ser ofta sig själva som lever i två ensamheter, anslutna, men i huvudsak åtskilda. Det har till stor del varit sant i modern publicering.

Tiderna förändras. Där förlag en gång var oantastliga, är det nu toppförfattarna som bestämmer. Som jag diskuterar på annat håll, är självpublicerade författare pionjärerna. De bär lite av den bagage som tynger traditionell publicering.

När förlag tittar på AI ser de få möjligheter. När jag pratar med författare om AI är världen deras ostron. Möjligheterna är nästan oändliga:

Författande och redigering

  • Försöka skriva och publicera hela böcker

  • Försöka hitta idéer för ett nytt projekt

  • Försöka hitta idéer inom en ny bok

  • Finjustera berättelsen

  • Forskning

  • Faktakontroll

  • Skriva följeslagare

  • Utvecklingsredigering

  • Korrekturläsning

  • Stavnings- och grammatikgranskning

  • Korrekturläsning

Illustration/avbildning

  • Skapa illustrationer och diagram

  • Omslagsdesignutkast

  • Videopromotioner

Marknadsföring

  • Automatisera inskick till agenter, förlag, tävlingar, vänner, blurbförfrågningar

  • Generera marknadsföringsmaterial: pressmeddelanden, blogginlägg, sociala medier, etc.

  • Webbplatsgenerering

Författare kommer att driva mycket av förändringen i branschens antagande av AI, vare sig det är för eller emot.

De är förmånstagare av mycket av startup-innovationerna kring AI inom författande och publicering - cirka 70% av startup-företagen vill arbeta med författare på deras resor.

Bekymmer och risker kring AI

An icon of a key

Bekymren kring AI är allvarliga. Riskerna är verkliga. Ibland uttrycks de på hysteriska sätt, men när man går ner på djupet har AI:s inverkan potential att vara enormt destruktiv.

Det finns så många frågor och bekymmer kring AI att de fyller volymer på egen hand. Här är ett ordmoln över de ämnen jag övervakar. Jag är säker på att jag missar några.

Ett ordmoln centrerat kring termen 'AI', med relaterade termer som 'bekymmer', 'etik' och 'mänsklighet' runt omkring.

Det finns massor av information tillgänglig om vart och ett av dessa ämnen, och jag uppmuntrar dig att läsa så djupt du kan. Det är möjligt att du kommer att dra slutsatsen att riskerna överväger fördelarna, och att du inte vill använda AI, vare sig personligen eller inom din organisation. Det beslutet medför sina egna risker; den vanliga, att bli lämnad bakom. Men det är ett personligt val.

Om du googlar “böcker om riskerna med AI” hittar du ett urval av värdefulla volymer. En nylig podcast som jag fann särskilt skrämmande var Ezra Kleins samtal med Dario Amodei, medgrundare och VD för Anthropic (företaget som utvecklar Claude.ai). Du lär dig att dessa företag är medvetna om riskerna. Amodei hänvisar till ett internt risksystem kallat A.S.L., för “AI Safety Levels” (inte American Sign Language). Vi är för närvarande på ASL 2, “system som visar tidiga tecken på farliga kapaciteter - till exempel förmåga att ge instruktioner om hur man bygger biovapen.” Han beskriver ASL 4 som “möjliggörande för statliga aktörer att avsevärt öka sin kapacitet… där vi skulle oroa oss för att Nordkorea eller Kina eller Ryssland kraftigt skulle kunna förbättra sina offensiva förmågor inom olika militära områden med AI på ett sätt som skulle ge dem en betydande fördel på geopolitisk nivå.” Skrämmande saker.

Inom denna dystra kontext kommer jag att lyfta fram de mest relevanta frågorna för författare och förläggare.

Upphovsrätt kränkt?

An icon of a key

Upphovsrättsfrågorna är en dimma av komplexitet och tvetydighet. Det verkar säkert att vissa böcker som fortfarande har upphovsrätt inkluderades i träningen av vissa LLM:er. Men det är definitivt inte så, som vissa författare fruktar, att allt deras arbete har dammsugits upp i varje och alla stora språkmodeller.

Upphovsrättsfrågorna är både specifika och breda. Det är allmänt känt att alla LLM:er tränas på det öppna nätet – allt som kan skrapas från de 1,5 miljarder webbplatserna på nätet idag, vare sig det är tidningsartiklar, inlägg på sociala medier, webbloggar och, tydligen, avskrifter av YouTube-videor.

Det är bevisbart att åtminstone en av LLM:erna tog in den faktiska texten från tusentals böcker som inte var i public domain.

Var det lagligt att ta in all denna text för att hjälpa till att bygga miljarddollar-AI-företag, utan någon ersättning till författarna? AI-företagen argumenterar kring skälig användning; domstolarna kommer så småningom att avgöra. Även om det var lagligt, var det etiskt eller moraliskt? Etiken verkar mindre komplex än de juridiska övervägandena. Du bestämmer.

Lagarna kring upphovsrätt förutsåg uppenbarligen inte de unika utmaningar som AI medför, och att söka efter juridiska lösningar kommer att ta tid, kanske år. (Om du vill fördjupa dig i varför lagarna är olämpliga för det specifika problemet, läs den utmärkta artikeln av A. Feder Cooper och James Grimmelmann kallad “The Files are in the Computer: Copyright, Memorization, and Generative AI.”)

Här är en lista över tretton av de mest framstående stämningarna, inte alla har att göra med böcker; även bilder och musik. Och här är en annan lista som uppdaterar statusen för alla stämningar.

Upphovsrätt och AI för författare

An icon of a key

Författare står inför ytterligare frågor kring möjligheten att få upphovsrätt på AI-genererat innehåll.

Den amerikanska upphovsrättsmyndighetens ståndpunkt om möjligheten att få upphovsrätt på AI-genererat innehåll säger att AI ensam inte kan hålla upphovsrätt eftersom den saknar den juridiska statusen av en författare. Det är logiskt. Men detta förutsätter att 100% av arbetet är AI-genererat. Som diskuterats på andra ställen kommer få författare att låta AI generera en hel bok. Mer troligt är att det blir 5%, eller 10% eller… Och här snubblar upphovsrättsmyndigheten (liksom jag skulle göra).

I ett mer nyligen beslut drog myndigheten slutsatsen att en grafisk roman bestående av mänskligt författad text kombinerad med bilder genererade av AI-tjänsten Midjourney utgjorde ett upphovsrättsskyddat verk, men att de enskilda bilderna själva inte kunde skyddas av upphovsrätt.“ Jeez!

An icon of a key

Det räcker att säga att författare och förläggare måste vara uppmärksamma på utvecklande upphovsrättsfrågor, på flera fronter.

Vilka är de långsiktiga konsekvenserna?

Vissa jämför den nuvarande rättstvisten med Google-boksstämningen, som tog 10 år att lösa juridiskt. Vem vet hur länge överklagandeprocessen kommer att dra ut på dessa inlagor. Under tiden är förläggare kloka att agera som om AI-företagen kommer att förlora, vilket, åtminstone teoretiskt, utsätter alla som licensierar, eller kanske till och med använder Chat AI, för någon form av villkorligt ansvar.

Men det är inte en förläggares allvarligaste fråga. Det är uppfattningen. För många författare, några framstående, några obskyra, har källan blivit förgiftad. AI är radioaktivt inom skriv- och förlagsgemenskapen. Allt som ens luktar AI drar intensiv kritik.

Det finns många exempel. I en nyligen inträffad incident med Angry Robot, en brittisk förläggare “dedikerad till det bästa inom modern vuxen science fiction, fantasy och WTF,” meddelade att de skulle använda AI-programvara, kallad Storywise, för att sortera igenom en förväntad stor mängd manuskriptinlämningar. Det tog bara fem timmar för företaget att överge planen och återgå till den “gamla inkorgen.

Det outhärdliga dilemmat för handelspublicister när de använder AI-verktyg internt: om dina författare får reda på det, kommer du att ha svårt att klara av den resulterande stormen. Jag tror att publicister inte har något annat val än att vara modiga, att anta (åtminstone några av) verktygen, förklara tydligt hur dessa verktyg tränas och hur de används, och fortsätta framåt.

I Storbritannien har The Society of Authors en hård linje: “Be din förläggare att bekräfta att den inte kommer att använda AI i betydande utsträckning för något ändamål i samband med ditt arbete – såsom korrekturläsning, redigering (inklusive äkthetsläsning och faktakontroll), indexering, juridisk granskning, design och layout, eller något annat utan ditt samtycke. Du kanske vill förbjuda ljudbokinläsning, översättning och omslagsdesign gjorda av AI.”

The Authors Guild verkar acceptera att “förläggare börjar utforska användningen av AI som ett verktyg i sina vanliga verksamheter, inklusive redaktionella och marknadsföringsmässiga användningar.” Jag tror inte att många medlemmar av Guild är lika förstående.

Licensiering av innehåll till AI-företag

De flesta förläggare och många författare söker efter sätt att licensiera innehåll till AI-företag. Alla har olika uppfattningar om vad licensvillkoren bör vara och hur mycket deras innehåll är värt, men åtminstone är diskussionerna igång.

Det finns flera startups som vill arbeta med förläggare (och i vissa fall, enskilda författare). Calliope Networks och Created by Humans är båda intressanta i detta avseende.

Publishers Weekly täcker meddelandet, och citerar Tracey Armstrong, president och VD för CCC, som säger “Det är möjligt att vara pro-AI och pro-upphovsrätt, och att koppla AI med respekt för skapare.”

Även om detta inte omfattar allt är det troligen ett genombrott för att föra publicering närmare en viss grad av samarbete med utvecklare av stora språkmodeller.

Det är för sent att undvika AI

An icon of a key

För författare och förläggare som föredrar att inte bli befläckade med AI, är nyheterna dåliga: du använder AI idag, och har använt det i åratal.

Artificiell intelligens, i olika former, har redan integrerats i de flesta av de mjukvaruverktyg och tjänster vi använder varje dag. Människor förlitar sig på AI-drivna stavnings- och grammatikgranskningar i program som Microsoft Word eller Gmail. Microsoft Word och PowerPoint använder AI för att ge skrivförslag, erbjuda design- och layoutrekommendationer, och mer. Virtuella assistenter som Siri och Alexa använder naturlig språkbehandling för att förstå röstkommandon och svara på frågor. E-posttjänster använder AI för att filtrera meddelanden, upptäcka skräppost och skicka varningar. AI driver kundtjänstchatbots och genererar produktrekommendationer baserat på din köp- och sökhistorik.

Och mycket av detta baseras på stora språkmodeller, som det är med ChatGPT.

För en författare eller redaktör att säga, “Jag vill inte att AI används på mitt manuskript,” är, generellt sett, i stort sett omöjligt, om de inte både de och deras redaktörer arbetar med skrivmaskiner och pennor.

De skulle kunna försöka säga, “Jag vill inte att generativ AI” används på deras bok. Men det är svårt att dra gränsen. Grammatikgranskningsprogram var inte ursprungligen byggda på generativ AI. Grammarly har lagt till det som en ingrediens i sin produkt, liksom alla andra stavnings- och grammatikgranskare. Generativ AI är också kärnan i marknadsföringsprogramvaran som erbjuds.

När författare använder AI

En annan aspekt av författare och användningen av AI har likheter med upphovsrättsfrågan som diskuterades ovan. I extrema fall ser vi 100% AI-genererat innehåll som publiceras på Amazon. Det mesta (allt?) är av fruktansvärd kvalitet, men det hindrar det inte från att publiceras. (Se även Amazon-sektionen.) Mer oroande för förläggare är AI-genererade inlämningar. Ja, AI ökar mängden, men stora förläggare har redan ett filter för mängd. Filtrerna kallas agenter. De är de som måste hitta ett sätt att hantera kvantitetsproblemet, och tydligen måste de hitta en lösning som inte använder AI.

Det är något av ett existentiellt problem – vill jag publicera en bok skriven av “en maskin”? För de flesta förlag är det ett otvetydigt “nej.” Enkelt. Men vad sägs om en bok där 50% av innehållet genererades av en LLM, under överinseende av en kapabel författare? Hmm, låt oss försöka med ett “nej” på det också. Okej: vad sägs då om 25%, eller 10%, eller 5%? Var drar man gränsen?

Och nu när du har börjat dra gränser, hur löser du dilemmat att stavnings- och grammatikverktyg nu delvis förlitar sig på generativ AI? Vad sägs om AI-drivna transkriptionsverktyg, som Otter.ai, eller transkriptionsfunktionen inbyggd i Microsoft Word?

Jag kan inte hitta något förlag som har deklarerat att de inte kommer att publicera ett verk med en förutbestämd mängd AI-genererad text. Här är Författarförbundet om ämnet:

“Om en märkbar mängd AI-genererad text, karaktärer eller handlingar är inkluderade i ditt manuskript, måste du informera ditt förlag och bör också informera läsaren. Vi anser inte att det är nödvändigt för författare att avslöja användningen av generativ AI när den endast används som ett verktyg för brainstorming, idéutveckling eller för korrekturläsning.”

Självklart är “märkbar” inte definierat (Oxford definierar det som “stor nog för att märkas eller anses viktig”), men inlägget fortsätter med att förklara att inkluderingen av mer än “de minimis AI-genererad text” skulle bryta mot de flesta publiceringskontrakt. De minimis, i juridiska termer, är inte exakt specificerat, men, generellt sett, betyder det mer eller mindre samma sak som märkbar.

Kan AI upptäckas i skrivande?

Jag höll ett webbseminarium om AI-upptäckt, sponsrat av BISG, i maj 2024. Återspelningen är online på YouTube. Jane Friedman erbjöd en omfattande sammanfattning av webbseminariet i sitt Hot Sheet nyhetsbrev.

För många författare innebär AI:s toxicitet att hålla det långt borta från deras ord. Förlag har en särskild börda – de skapar inte texten, men, när den väl är publicerad, bär de ett betydande ansvar för texten. Vi har sett mycket dynamit explodera nära eldfängda böcker, vare sig det handlar om de sociala implikationerna av innehållet, eller plagiering av andra författares ord och idéer. Nu med AI står vi inför en helt ny uppsättning etiska och juridiska frågor, ingen av vilka var beskrivna i förlagsskolan.

En del av det verkar likna vad folk oroar sig för när det gäller studenter, att använda AI på något sätt är fusk, liknande att kopiera från en Wikipedia-artikel, eller kanske bara be en vän att skriva din uppsats.

En av våra webbseminarietalare, en pedagog, José Bowen, delade sin avslöjande för studenter. Det är inte exakt vad man använder för en författare, men det demonstrerar någon sorts “risknivåer” av AI-användning.

Mall för avslöjandeavtal för studenter

  • Jag gjorde allt detta arbete på egen hand utan hjälp från vänner, verktyg, teknik eller AI.

  • Jag gjorde första utkastet, men bad sedan vänner/familj, AI parafrasering/grammatik/plagiatprogram att läsa det och komma med förslag. Jag gjorde följande ändringar efter denna hjälp:

    • Fixade stavning och grammatik

    • Ändrade struktur eller ordning

    • Omskrev hela meningar/paragrafer

  • Jag fastnade på problem och använde en synonymordbok, ordbok, ringde en vän, gick till hjälpcentret, använde Chegg eller annan lösningsleverantör.

  • Jag använde AI/vänner/handledare för att hjälpa mig generera idéer.

  • Jag använde hjälp/verktyg/AI för att göra en disposition/första utkast, som jag sedan redigerade. (Beskriv naturen av ditt bidrag.)

Och så kan ett förlag utarbeta något liknande för sina författare. Låt oss säga att författaren avslöjar den översta nivån: Jag använde AI omfattande, sedan redigerade resultaten. Vad gör man då? Avvisar du automatiskt manuskriptet? I så fall, varför?

Och under tiden, om du är uppmärksam, lär du dig att det manuskriptet du just läst och älskat, vilket författaren svor inte ens stavningskollades av Grammarly, faktiskt kunde ha varit 90% genererat av AI, av en författare expert på att dölja dess användning.

Du tvingas då tänka om frågan. Det blir, “Varför är jag så förbaskat bestämd på att upptäcka denna sak som är oupptäckbar?”

Delvis handlar det om den alarmistiska oron kring upphovsrättsligheten av AI-genererad text. Upphovsrättskontoret kommer inte att erbjuda upphovsrättsskydd för 100% AI-genererad text (eller musik, eller bilder, etc.). Men vad sägs om 50% AI-genererad text? Tja, vi skulle bara täcka den 50% som genererats av författaren. Och hur skulle du veta vilken hälft? Vi återkommer om det.

Skulle det inte vara fantastiskt om du bara kunde mata in varje manuskript i någon mjukvara som skulle tala om för dig om AI hade använts för att skapa texten?

Om vi lämnar åt sidan frågan att det enda sättet att göra detta skulle vara att använda AI-verktyg, är den viktigare frågan, skulle mjukvaran vara (tillräckligt) noggrann? Kunde jag lita på att den talade om för mig om AI hade använts för att skapa ett manuskript? Och kunde jag lita på att den inte producerade “falska positiva” - att indikera att AI hade använts, när det i själva verket inte hade det?

Det finns nu massor av mjukvara på marknaden som tar itu med dessa utmaningar. Många av de akademiska studier som utvärderar denna mjukvara pekar på dess opålitlighet. AI-genererad text slinker igenom. Värre, text som inte genererades av en AI märks falskt som kontaminerad.

Men bokförläggare kommer att vilja ha någon form av skydd på plats. Det verkar som att, i bästa fall, dessa verktyg kan varna dig för möjliga bekymmer, men du skulle alltid behöva dubbelkolla. Så kanske det kan varna dig för texter som behöver granskas mer noggrant än andra? Är detta en effektivitet?

Sann effektivitet kommer att hittas i att gå bortom bekymmer om textens ursprung, istället bibehålla våra befintliga kriterier för dess kvalitet.

Arbetsförlust

“Du kommer inte att ersättas av AI. Du kommer att ersättas av någon som vet hur man använder AI.” —Anonym

Arbetsförlust från AI-adoption kan vara allvarlig. Uppskattningarna varierar, men siffrorna är dystra. Det finns uppenbara exempel: San Franciscos förarlösa taxibilar eliminerar… taxi- och rideshare-förare. AI-stödda diagnostikverktyg kan minska behovet av medicinska tekniker.

Optimisten i mig pekar på, som ett exempel, införandet av kalkylblad och dess inverkan på sysselsättningen. Som du ser i diagrammet nedan har sysselsättningen inom “Redovisning, Skatteförberedelse, Bokföring och Lönerättstjänster” nästan fördubblats sedan 1990 - knappast en anklagelse mot kalkylblad och annan teknik som till stor del automatiserat dessa uppgifter.

En linjediagram som visar antalet anställda inom redovisning, skatteförberedelse, bokföring och lönerättstjänster från 1990 till 2020.

Ethan Mollicks studie med Boston Consulting Group (BCG) var ett experiment som syftade till att bättre förstå AIs inverkan på arbete, särskilt på komplexa och kunskapsintensiva uppgifter. Studien involverade 758 BCG-konsulter, slumpmässigt tilldelade att använda eller inte använda OpenAIs GPT-4 för två uppgifter: kreativ produktinnovation och affärsproblem lösning. Studien mätte deltagarnas prestation, beteende och attityder, samt kvaliteten och egenskaperna hos AI-outputen.

Bland fynden var att “AI fungerar som en kompetensutjämnare. De konsulter som presterade sämst när vi bedömde dem i början av experimentet hade den största ökningen i deras prestation, 43%, när de fick använda AI. De bästa konsulterna fick fortfarande ett lyft, men ett mindre sådant.” Hela artikeln är avslöjande, och som med allt av Mollicks arbete, provocerande men ändå tillgängligt.

Utbildning

Utbildning har varit i centrum för de för- och nackdelar debatterna om AI. Införandet av AI i klassrummen ses i stor utsträckning som en förbannelse, eller åtminstone en utmaning. Andra pedagoger, som PWs huvudtalare Ethan Mollick, omfamnar AI som ett anmärkningsvärt nytt verktyg för pedagoger; Mollick insisterar på att hans studenter arbetar med ChatGPT.

Den bästa boken om ämnet är Teaching with AI: A Practical Guide to a New Era of Human Learning av José Antonio Bowen och C. Edward Watson.

Jag kommer inte att gå in på utbildningspublicering i denna bok - det är ett stort ämne som kräver en separat rapport. Argumentet är att publicering blir av sekundärt intresse inom utbildning: AI-verktyg är mjukvara, inte innehåll, per se.

Sökningens framtid

An icon of a key

Sökning är ett laddat ämne inom AI. Jag uppmuntrar dig att besöka perplexity.ai och You.com för att få en glimt av vart saker är på väg. Nästa gång du tänker på att starta en Google-sökning, gå istället till Perplexity. Det kommer inte att verka dramatiskt annorlunda - det liknar de kunskapsgrafer som Google ofta poppar upp på höger sida av en sökskärm, eller ibland ovanpå sökresultatlistorna. Istället för att behöva klicka på en länk finns informationen där direkt för dig.

Perplexity går ett steg längre och omformulerar informationen den samlar in från flera källor så att du verkligen inte behöver klicka på en länk. Den tillhandahåller länkar till sina källor, men att klicka på dem är vanligtvis onödigt—du har redan fått svaret på din fråga.

Denna till synes blygsamma förändring har enorma konsekvenser för varje företag och varje produkt som, åtminstone delvis, förlitar sig på att bli upptäckt genom sökmotorer. Om sökare inte längre skickas till din webbplats, hur kan du engagera dem och omvandla dem till kunder? Enkelt svar, det kan du inte.

Joanna Penn är i framkant när det gäller att tänka på påverkan av ny teknik på skrivande och publicering. Hon tog upp detta komplexa ämne på sin podcast och blogg i december förra året.

Det är fortfarande tidiga dagar för AI och omvandlingen av sökning.

Skräpböcker på Amazon

An icon of a key

AI-genererade skräpböcker på Amazon är ett problem, även om deras allvarlighet kan vara mer visceral än bokstavlig. Å ena sidan spammar dessa böcker den online bokhandeln med innehåll av låg kvalitet och plagierat innehåll, ibland med hjälp av riktiga författares namn för att lura kunder och dra nytta av deras rykte. Böckerna är inte bara en olägenhet för läsare utan också ett hot mot författare, vilket potentiellt berövar dem hårt förtjänta royalties. AI-genererade böcker påverkar också rankningen och synligheten för riktiga böcker och författare på Amazons webbplats, eftersom de konkurrerar om samma nyckelord, kategorier och recensioner.

En söt kattunge som sitter på en strand med blommor runt omkring och en bildtext som säger 'Roliga och söta kattfoton du inte kan se i världen'.

Amazon kräver nu att författare ska avslöja detaljer om deras användning av AI vid skapandet av deras böcker. Det råder ingen tvekan om att detta kan missbrukas.

Försök att söka på Amazon efter “AI-genererade böcker.” Det finns många. Några av resultaten är handböcker om användning av AI för att skapa böcker. Men andra är, utan skam, AI-genererade. “Funny and Cute cat images-You are can’t see this types of photos in the world-PART-1” (stet) är tillskriven Rajasekar Kasi. Det finns inga detaljer om hans (?) bio på en författarsida, men sex andra titlar är tillskrivna namnet. Boken, publicerad den 26 augusti 2023, har inga recensioner och ingen försäljningsrankning. Den ogrammatiska titeln på e-boken stämmer inte överens med den ogrammatiska titeln på omslaget till tryckboken.

Men andra författare använder tydligt AI i stor utsträckning vid skapandet av sina böcker och avslöjar det inte. Som jag diskuterar ovan är det nästa till omöjligt att upptäcka AI-användning med skickliga ‘förfalskare’. Färgböcker, journaler, reseböcker och kokböcker genereras med AI-verktyg på en bråkdel av tiden och ansträngningen av traditionell publicering.

Sök “korean vegan cookbook” och du hittar den första titeln, av Joanne Lee Molinaro, på första plats. Men tätt bakom den finns andra titlar som är uppenbara plagiat. “The Korean Vegan Cookbook: Simple and Delicious Traditional and Modern Recipes for Korean Cuisine Lovers” har två recensioner, inklusive en som noterar “This is not a vegan cookbook. All the recipes have meat and eggs ingredients.” Men boken är #5,869,771 i försäljningsrankning, jämfört med originalet, som står på #2,852 på listan.

Det är svårt att fastställa omfattningen av den skada som orsakats. Inget gott kan komma av detta, men hur illa är det?

Amazon har policyer som tillåter dem att ta bort vilken bok som helst som inte “ger en positiv kundupplevelse.” Kindle-innehållsriktlinjer förbjuder “beskrivande innehåll avsett att vilseleda kunder eller som inte exakt representerar innehållet i boken.” De kan också blockera “innehåll som vanligtvis gör kunder besvikna.” Är det den stora volymen som övervinner Amazons övervakare? Eller finns det en annan anledning?

Fördom

LLM:er tränas på det som redan har publicerats online. Det som har publicerats online är fullt av fördomar och så LLM:er reflekterar dessa fördomar. Och naturligtvis inte bara fördomar, utan hat, som reflekteras i dess lärande, och nu en potentiell output i AI-genererade ord och bilder. Pornografi är en annan naturlig förmånstagare av AI:s anmärkningsvärda förmåga med bilder, och det finns nyligen oroande berättelser om unga kvinnor som hittar fabricerade nakenbilder, deras manliga klasskamrater som troliga misstänkta. The New York Times rapporterade separat om en ökning av onlinebilder av sexuella övergrepp på barn.

Författare och förläggare behöver vara medvetna om dessa inbyggda begränsningar när de använder AI-verktyg.

Kreativitet kan vara en Kliché

An icon of a key

Frågan om huruvida maskiner verkligen kan vara kreativa kvarstår som ett hett diskussionsämne. Det beror delvis på hur vi definierar kreativitet.

“AI kommer aldrig att vara kreativ.” Det är ett välbekant mantra.

Vi vet alla vad kreativitet är, eller hur?

Cambridge: “förmågan att producera eller använda originella och ovanliga idéer.”

Britannica: “förmågan att skapa eller på annat sätt få något nytt att existera, vare sig det är en ny lösning på ett problem, en ny metod eller enhet, eller ett nytt konstnärligt objekt eller form.”

Jag ifrågasätter inte att kreativitet, i denna mening, ligger långt bortom räckhåll för LLMs.

Mitt argument är att det mesta som framställs som kreativt—och ofta verkar ganska kreativt—är i själva verket iterativt. Vilket fungerar utmärkt för många saker, inklusive de flesta annonser.

Men att höja ‘kreativitets’ flaggan, och sedan förminska LLMs, är att sätta en omöjligt hög ribba, som AI oundvikligen misslyckas med. Då avfärdar folk det som “ja, jag sa ju att det inte är kreativt.”

Och missar därmed det iterativa som det är mycket bra på.

Jag kommer att posta en lång essä om detta ämne inom en snar framtid, efter att jag har läst:

The Creativity Code, av Marcus du Sautoy, och

The Artist in the Machine, av Athur I. Miller

Litterär Teori för Robotar, av Dennis Yi Tenen

En Annan Tanke

Jeremiah Owyang är en branschanalytiker baserad i Silicon Valley. Han är en AI-förespråkare, men han har varit med om hype tidigare. Han noterar att han “aldrig sett en sådan snabb utveckling på så kort tid.”

Som Owyang uttrycker det, kan små team av programmerare nu använda LLMs för att skapa “kännande varelser”—som en 4-åring—på två dagar. De är kapabla att:

  • ‘Se’ med datorseende, vad som händer i den verkliga världen,

  • ‘Höra’ via röstkommandon och omgivande ljud i den verkliga världen,

  • ‘Tänka’ genom att bearbeta ovanstående verkliga input,

  • ‘Lära’ genom att tillgå förtränade data,

  • ‘Referera’ exklusiva datasätt,

  • ‘Tala’ med livliknande röst, som har betoning och ton på vilket språk som helst,

  • ‘Skriva’ genom textkommunikation, i vilket format eller stil som krävs,

  • ‘Rita’ genom att spontant skapa bilder, och

  • ‘Interagera’: det kan proaktivt engagera sig i dialog, ställa frågor, eller tilldela AI-agenter att utföra uppgifter på egen hand.

Detta är extraordinärt och utan motstycke. Kommer det att spela någon roll för publicering? Du bestämmer.

Bra Saker Utanför Publicering

AI ligger bakom några banbrytande prestationer utanför publicering. Medicin är AIs affischnamn, men det finns också kraftfulla berättelser från andra industrier. Relevansen till publicering kommer från en retorisk fråga: AI kan rädda liv. Men du tror inte att det kan hjälpa förläggare?

Syftet med denna korta sektion är endast att motverka argumentet att, om man är tveksam till att AI kommer att hjälpa publicering, kan AI möjligtvis hjälpa någon alls?

AI och medicin

När jag läste ett mars 2024-nummer av The Economist, fördjupade jag mig i dess teknologitillägg om hälsa och AI. Under de senaste åren har medicin konsekvent framställts som artificiell intelligens ljuspunkt. De flesta rapporterna är positiva. Men ändå kommer The Economist artikel att slå dig med häpnad. De uttrycker många välformulerade reservationer. Men du kommer också att läsa att AI inom medicin “representerar en möjlighet att förbättra livet för hundratals miljoner, till och med miljarder.”

En annan retorisk fråga för dem som skulle vilja förbjuda AI-teknik, eller åtminstone införa ett moratorium på dess utveckling: skulle du offra dess potentiella värde för hälsan hos miljoner för att stilla din oro om en osäker framtid?

AI och TSA på flygplatser

Vi har varit där: de oändliga köerna, den långsamma rörelsen av våra handbagage genom röntgenskannrarna.

Detektionmisslyckandena hos TSA är väl dokumenterade, men inte mycket diskuterade.

Vad som bekymrar mig mest är de ledsna arbetarna, som stirrar på sina skärmar timme efter timme. För vad? Inte bara är det ett miserabelt jobb, utan som enkla dödliga är de inte särskilt bra på det.

Enter AI. Om det kan upptäcka svårupptäckta tumörer i lungorna, är jag säker på att det kan upptäcka smuggelgods i handbagage. Och befria människor från en otacksam uppgift som de är dåligt lämpade att hantera.

Enligt denna rapport, är det nya TSA AI-stödprogrammet för screening igång.

Essä: AI:s påverkan på bokförlagsindustrin

Jag pratade nyligen med Peter Brantley, min partner i AI-webinarier, om hur vi kan utforma kommande AI-program. Peter arbetar mycket av tiden inom bibliotekssamhället och hade just återvänt från ett heldagsevenemang i Los Angeles med cirka 150 av sina bibliotekskollegor, där de utforskade AI:s potentiella påverkan på deras sektor. Samtalet var livligt och ingående. Varför, undrade han, har inte kommersiella bokförläggare sådana sammankomster? AI är ett ämne vid varje förlagsarrangemang: varför är det inte huvudämnet?

De verkliga konsekvenserna av AI

Svaret han kom fram till är att kommersiella bokförläggare ännu inte har dragit slutsatsen att AI kommer att ha några verkliga konsekvenser för deras verksamhet. På kärnan av deras verksamhet. På deras förmåga att bedriva verksamhet. Visst, det kanske kan hjälpa till att skriva ett pressmeddelande eller skriva ett manuskriptavslagsbrev, men de antar att förlagsverksamheten fortfarande kommer att puttra på som den har gjort i årtionden, med den genomsnittliga tiden från kontrakt till tryckt bok som drar ut på upp till två år.

Samtidigt står förläggarna naturligtvis inför kortsiktiga utmaningar som är mer pressande än AI. Papperspriser. Fraktkostnader. Krympande marginaler. Försäljningen är mestadels platt överlag. Med alla dessa påfrestningar, vem har tid eller bandbredd att bry sig om AI?

Men andra kreativa industrier förstår det. Konst och design förstår det. Reklam förstår det. Hollywood ser vad som kommer, liksom musikindustrin. Journalister tittar med fasa.

Andra bokförlagssektorer börjar få grepp om AI:s påverkan. Vetenskaplig publicering är djupt inne i teknologin. Men kommersiella förläggare agerar som om det skulle vara få verkliga konsekvenser av AI.

Vilka kan de verkliga konsekvenserna bli? Kommer det att påverka utbudet av böcker? Eller efterfrågan på böcker?

Utbud: Ja, AI är boven bakom en massa nya skräpböcker på Amazon. Hundratals? Absolut. Tusentals? Kanske. Miljoner? Nej. Hur många böcker finns det på Amazon? Mer än 50 miljoner. Det är redan mycket trångt.

Bortsett från det är det klart att på kort sikt kommer AI inte att skriva hela böcker som folk faktiskt vill läsa. Dess värde hittills är som en skrivkamrat – kritiserar, föreslår, snurrar ibland ut några användbara textstycken. Nej, på kort sikt kommer AI inte att radikalt förändra bokförlagens produktion, utbudet av nya böcker.

Efterfrågan: Nej, ingen efterfrågar AI-genererade böcker. Det är inte en faktor. Och jag kan inte se något scenario där AI kommer att påverka efterfrågan på böcker bredare.

Vad sägs om publiceringsprocessen? Ja, det kommer att förändras. Åtminstone lite. Som vi upptäckte vid vår Publishers Weekly AI-evenemang förra hösten, söker förläggare hjälp från AI här och där: marknadsföring, redaktionellt arbete, lite av det ena och det andra.

Är det möjligt att det kommer att bli få verkliga konsekvenser av AI på handelsbokpublicering? Kanske är det bara en leksak.

Låt oss därför ta ett steg tillbaka från AI-djungeln och återbesöka det bekymrade tillståndet för handelsbokpublicering, och genom det, borra ner i var AI troligen kommer att ha sin största påverkan.

Publicering har varit i ekonomisk nedgång i årtionden

Enligt olika uppskattningar har hela bokpubliceringsindustrin i USA årliga försäljningar på under 35 miljarder dollar. Även om de skulle vara 40 miljarder dollar är Apple Computers årliga försäljning tio gånger högre. Apples bruttovinst är 44 % av försäljningen, tillsammans med nettovinster på 25 % av försäljningen. Publicering vågar inte ens drömma om sådana marginaler.

Handelsbokpublicering har varit i en mild ekonomisk nedgång i årtionden, vissa år upp några procent, vissa år ner. I mitten av 2024 ser försäljningen stabil ut år för år, men det är den typen av sommarromans som förläggare är bekanta med. Vi vinner några, vi förlorar några, men överlag är handelsbokpublicering inte en tillväxtindustri.

År 2023, enligt AAP:s StatShot “var handelsintäkterna ner 0,3 %, på 8,9 miljarder dollar för kalenderåret.” Så vitt jag kan se, tar inte AAP:s data hänsyn till inflationen. Vid 3,4 % inflation skulle försäljningsminskningen vara 3,6 %, närmare den 2,6 % minskning i enhetsförsäljning rapporterad av Circana.

Utan tillväxten av alternativa format, e-böcker och ljudböcker, skulle industrin kunna vara i mycket dåligt skick. E-böcker var en tillväxtmotor i åratal. Ljudboksförsäljningen fortsätter att stiga, upp nästan 15 % 2022 och ytterligare 9 % 2023. Ja, en del av det är substitutförsäljning, men många av kunderna för e-böcker och ljudböcker är nya kunder, inte nödvändigtvis regelbundna bokläsare. E-böcker och ljudböcker stod för 21 % av handelsförsäljningen förra året. Skulle alla dessa kunder köpa tryckta böcker om tryck var allt som fanns tillgängligt?

Detaljhandelsprissättning blir en allt större oro när kostnader och återförsäljar- och grossistrabatter pressar förläggarmarginalerna. Akademiska studier tyder på att det finns en viss grad av priselasticitet för böcker, men vi når säkert motståndspunkten: inbundna bästsäljare närmar sig vad som kan vara en prisgräns på 35 dollar. “Prenumerationströtthet” får videokunder att säga upp tjänster, med fokus på de ökande kostnaderna för varje. Netflix Premium-plan kostar nu 22,99 dollar/månad; Disney Plus Duo Premium kostar 19,99 dollar/månad. Som en kollega nyligen påpekade för mig, hur många kontantstrama prenumeranter kommer att säga, åh, låt oss säga upp vår Netflix-prenumeration så att jag kan köpa en bok nästa månad?

Löner inom bokpublicering

Jag tänker inte slå ihjäl detta: det är inte bara författare som kämpar för att försörja sig - publiceringspersonal är grovt underbetalda jämfört med jämförbara yrken.

Jag håller en representativ blandning av senaste jobbutlysningar inom publicering. Jag tittar på en, för en Marketing Manager på en handelsförläggare som rapporterade försäljning på strax över 30 miljoner dollar 2023. Positionen betalar mellan 60 000 och 70 000 dollar per år. Här är en annan, för en Publicity Manager på ett av förlagen som rapporterar 750 miljoner dollar i årlig försäljning. “Denna roll kommer att ha en årlig lön på 74 000 - 79 000 dollar,” noterar annonsen.

Enligt U.S. Bureau of Labor Statistics National Occupational Employment and Wage Estimates, tjänar marknadschefer i genomsnitt $166,410 över alla branscher. “PR-chefer” har en genomsnittlig lön på $159,420.

Bokförlag är inte ens i närheten. Detta är ingen nyhet för någon som arbetar inom förlagsbranschen. Det har alltid varit så här. Men kan förlagsbranschen överleva med dessa lönenivåer? Oförmågan att erbjuda kandidater ens hälften av lönenivån bådar inte gott för en bransch som blir allt mer digital.

I en tid av TikTok, YouTube, sociala medier, SEO, metadata och författarplattformar, vad är egentligen en “publicitetschef”?

De tre (och en halv) kvarvarande fördelarna för traditionella bokförlag

Tre bestående fördelar för traditionella bokförlag är (i) prestige, (ii) tillgång till stora medier och (iii) tillgång till bokhandelsdistribution. Detta gäller inte lika mycket för alla traditionella förlag - de största har mer av varje: mer prestige, bättre tillgång till stora medier och bättre möjligheter att få sina böcker på frontborden i flest antal bokhandlar. Men tillsammans utgör dessa de karakteristiska fördelarna för den traditionella bokförlagsbranschen.

En annan värde som förlag kan erbjuda är en kuraterad lista med kompletterande titlar, där varje enskild titel drar nytta av sina följeslagare. Tänk på ett förlag som Fox Chapel, specialiserat på böcker om hantverk: om du gillar en av deras titlar finns det en rimlig chans att du noggrant granskar deras andra böcker (och tidskrifter) om samma ämne, även om de är skrivna av andra författare.

Detta övergår till något som bara några få förlag har lyckats utveckla, ett säljande varumärke. Tänk på serier som Wiley’s “For Dummies,” eller Oxford’s “Very Short Introductions.” Varumärket förmedlar en konsekvens i redaktionell inställning och kvalitet som uppmuntrar läsarna att köpa flera titlar. Självpublicerare lanserar ofta sina egna korta serier, främst för skönlitteratur, även om de inte kan omfatta bredden av dessa större förlagskataloger.

Alla andra tjänster som traditionella förlag tillhandahåller kan köpas på den öppna marknaden, med liknande kvalitet, till överkomliga priser (t.ex. redaktionella tjänster, design, produktion och grundläggande marknadsföringsfunktioner). Och för självpublicerare är inkomsten per såld bok fem gånger eller mer större än traditionella royaltyscheman.

Jag kommer att gräva lite djupare i detta i en kort bilaga i slutet av denna bok. Men låt mig snabbt förminska värdet av de tre främsta fördelarna. Prestige är bra för skryträttigheter, men har begränsat kontantvärde. Bokrecensioner och annan stor medieexponering har nu en avsevärt minskad inverkan på bokförsäljningen. Och bokhandlar representerar ungefär 15% av branschförsäljningen (och mycket mindre för självpublicerade författare) - de är inte längre centrala för en boks framgång.

Saker och ting har förändrats.

Självpublicering

Självpublicering har varit den huvudsakliga drivkraften för tillväxt inom konsumentförlagssektorn (trade publishing) under det senaste decenniet och mer. Exakta försäljningsdata kring självpublicering förblir dolda - det är lätt att ignorera dess betydelse. Men tillgängliga data visar att självpublicering tar en avsevärd del av marknaden för handelsförlag.

Som Kobo VD Michael Tamblyn (något) berömt noterade, “En av fyra böcker vi säljer på engelska är en självpublicerad titel, vilket innebär att för oss är självpublicering som att ha ett helt annat Penguin Random House ute på marknaden som ingen ser. Det är som publiceringens mörka materia.”

Trenderna inom självpubliceringsmarknaden är troligen de enda betydande trenderna inom handelsförlagssektorn. Självpublicerade författare visar vägen. De är äventyrliga och obehindrade av den traditionella branschens seder. Många är flytande på sociala medier. De är nära sina läsare, sina kunder. Om du vill lära dig de senaste marknadsföringsteknikerna, följ författarforum, bloggar och nyhetsbrev.

Gräv djupt i författarinkomststatistik, ekonomin kring skrivande, och jämför sedan inkomstnedgången för traditionellt publicerade författare mot inkomstökningarna för självpublicerade författare. I en internationell undersökning och rapport som jag genomförde med Steve Sieck för ALLi 2023 (pdf), upptäckte vi att “den medianintäkt från skrivande och självpubliceringsrelaterade aktiviteter 2022 för alla självpublicerade författare som svarade var $12,749, en ökning med 53% jämfört med föregående år. Genomsnittliga (medel) inkomster försköts mycket högre: $82,600 år 2022, en ökning med 34%.”

I en separat enkät, genomförd av Peter Hildick-Smith för Authors Guild, rapporterade “heltids självpublicerade författare, som hade publicerat sedan åtminstone 2018, en genomsnittlig inkomst på $24,000 jämfört med $13,700 år 2018, en ökning med 76 procent.”

Hybridförlag

För noggrannhetens skull vill jag också nämna hybridförlag. Jag har blivit alltmer entusiastisk över hybridmodellen, och segmentet för hybridförlag är betydande och växande. Ingen uppskattar hybridförsäljningen separat. Men påverkan syns tydligast i deras dominans av två kategorier: böcker av kändisar och populära affärsböcker. Dessa kategorier har länge varit pålitliga inkomstkällor för handelsförlag, men hybridförlagens “conciergetjänster” och mycket mer gynnsamma inkomstdelning är oemotståndliga för många högprofilerade författare.

Nyliga exempel, som Authors Equity’s vinstdelningsrelation med sina författare, och Keila Shaheens 50/50 vinstdelning med Simon & Schuster, antyder en trend mot normalisering av hybridmodellen. Detta är goda nyheter för författare; mindre lovande för traditionella förlag.

Publicering bortom förlag

Jag är medförfattare till en rapport med Rüdiger Wischenbart, baserad på hans ursprungliga studie “Publishing Beyond Publishers.” Vi försöker förstå och kvantifiera, så gott vi kan, all bokrelaterad publiceringsaktivitet, världen över, som skulle kunna (och borde) inkluderas som en del av en mer omfattande syn på det moderna publiceringsekosystemet.

När du rör dig bortom bokbehållaren får du en inblick i var AI verkligen kan göra en inverkan.

Affischnamnet för vårt projekt är Wattpad, där “97 miljoner människor spenderar över 23 miljarder minuter per månad engagerade i originalhistorier.” Berättelserna upplevs online, mestadels på smartphones, i korta bitar. Få blir publicerade böcker. De är lika sannolika att hitta sin väg till “Wattpad WEBTOON Studios, företagets TV-, film- och publiceringsmotsvarigheter.”

Yngre läsare är mer inställda på digital läsning än sina äldre motsvarigheter. Enligt en Wattpad-undersökning från januari 2024, “digitala format blir alltmer populära bland yngre generationer, där 65% av Generation Z och 71% av millenniegenerationen omfamnar webromaner, e-böcker och webbserier, medan mindre än hälften av Generation X och boomergenerationerna säger samma sak.”

Och naturligtvis, som den traditionella förlagsindustrin nu lär sig: “Mångfald är en nyckelfaktor för att omfamna digitala format: 61% av Generation Z och 70% av millenniegenerationen håller med om att e-böcker, webromaner och webbserier ger dem tillgång till innehåll som är svårare att hitta i bokhandlar och bibliotek, inklusive HBTQ+ och minoritetsfokuserat innehåll.”

Wattpad har konkurrenter, inklusive Inkitt, som enligt Publishers Weekly nyligen tog in $37 miljoner från investerare “inklusive Stefan von Holtzbrinck, ägare av Holtzbrinck Publishing Group, som äger Macmillan, och tidigare Penguin-VD Michael Lynton; det har nu samlat in totalt $117 miljoner i investeringar. I februari 2023, sade Financial Times att Inkitt var det åttonde snabbast växande företaget i Europa, och nummer ett i Tyskland.” En artikel i Esquire den 9 juli beskrev Inkitts användning av AI, dess roll i deras framgång.

Hur många av er har ens hört talas om Inkitt, besökt dess publiceringsplattform, eller laddat ner dess Galatea-läsapp?

Men vår rapport “Publishing Beyond Publishers” går bortom online-berättelseplattformar för att överväga hur “innehåll kan skapas och spridas i en mångfald av format (tryck, digitalt), medier (böcker, ljud, filmer, spel), distributionskanaler (gemenskaper, plattformar, strömmar) och affärsmodeller (försäljning av produkter, prenumerationer, streaming, freemium, betalmodeller) i mestadels digitalt definierade leverans- och marknadsföringskedjor.” Hur många möjligheter missar bokförläggare för att de inte är en uppenbar passform inom deras nuvarande affärsmodell?

Innovation, teknik och bokpublicering

Med undantag för eböcker har modern publicering aldrig stått inför ett hot från tekniken. (Digitala ljudböcker togs emot mer med glädje än med oro.) Internetepokens gryning gav förläggare fler möjligheter än hot; det är bara en enda återförsäljare, Amazon, möjliggjord av internet, som ställde till med oreda.

Jag har aldrig sett en studie om huruvida Amazon har varit (när alla aspekter av dess verksamhet och påverkan är fullt beaktade) en nettofördel för bokpubliceringsindustrin. Det når många köpare som inte betjänas av fysiska butiker, och är villig att offra marginaler för att hålla priserna låga. Eböcker och ljudböcker levereras i stor skala. Men Amazon kan sänka priserna delvis för att det kräver höga rabatter och avgifter från leverantörer, och det kväver andra återförsäljningskanaler. Det finns smärtsamma kompromisser.

Försök dock inte kritisera Amazon framför en självpublicerad författare. De skulle inte vara i affärer utan The Everything Store.

Innovatörens dilemma

För att få ett perspektiv på AI:s kommande påverkan på bokpublicering rekommenderar jag Clayton Christensens The Innovator’s Dilemma: When New Technologies Cause Great Firms to Fail, först publicerad 1997 av Harvard Business Review Press.

Christensen undersöker hur befintliga (etablerade) företag kan falla offer för innovationskrafterna.

Framgångsrika, välskötta företag misslyckas ofta när omstörtande förändringar kommer till deras bransch. Konventionella ledningsmetoder, som hade hjälpt dem att bli branschledare, gör det svårt för dessa företag att vara snabba när de konfronteras med de omstörtande teknologier som kan kannibalisera deras marknader.

De ignorerar produkterna som skapats av de omstörtande teknologierna, eftersom de vid första anblicken jämförs dåligt med deras befintliga produkter. Deras mest lönsamma kunder kan generellt sett inte använda de påstådda innovationerna och vill inte ha dem. Företag försöker bekämpa omstörtande hot genom att satsa på befintliga produkter och tjänster.

Christensens viktigaste insikt är att genom att göra det till synes ‘rätta’ inklusive att lyssna på kunder, lämnar sig framgångsrika företag vida öppna för omstörtande innovation. De fokuserar på sina nuvarande kunder och ignorerar viktiga nya teknologier—som initialt riktar sig mot små, mindre lönsamma marknader. Det skapar en öppning för smidiga startups att störa ledarna.

Chris Dixon, i diskussion om boken, påpekar att “anledningen till att stora nya saker smyger förbi etablerade företag är att nästa stora sak alltid börjar med att avfärdas som en ‘leksak.’” Hmm, ja, många ser Chat AI som en leksak.

Misslyckas förläggare med att inse att innovationer byggda med generativ AI kan störa deras bräckliga affärsmodell?

Skönlitteratur kontra facklitteratur

AI:s påverkan på bokpublicering kommer säkerligen att ha en dramatiskt annan påverkan på skönlitteraturpublicering än på facklitteratur.

Bokpubliceringsindustrin analyseras inte tillräckligt ofta som två kluvna industrier, en som publicerar skönlitterära böcker och en annan som publicerar facklitteratur.

Medan de flesta allmänna förlag erbjuder både skön- och facklitterära titlar, är den branschövergripande klyftan mellan de två formerna tydlig både i antalet publicerade titlar och i bokförsäljning. Uppskattningar varierar, men skönlitterära titlar representerar endast ungefär 10% av böckerna som publiceras varje år. Försäljningen favoriserar dock starkt skönlitteratur. Återigen, det finns år-till-år förändringar, men skönlitteratur står för ungefär hälften av den årliga försäljningen av allmänna böcker. Förra året var 21 av de 25 bästsäljarna skönlitteratur. Med hjälp av Wikipedias sammanställning, av de böcker på engelska som någonsin sålt 20 miljoner exemplar eller mer, är 84% skönlitterära titlar.

Bokförsäljningstrender är notoriskt nyckfulla, men försäljningen av skönlitteratur verkar vara på en fortsatt uppåtgående kurva. Efter att ha rasat till 32 % 2019, tog de 40 % av den vuxna marknaden 2022 och ökade något igen 2023. Försäljningen av vuxen skönlitteratur ökade med ytterligare 6,3 % under första halvåret 2024.

Även om AI kommer att användas alltmer av skönlitterära författare för att hjälpa till i skapandeprocessen, som diskuterats på andra ställen, verkar det osannolikt att AI-genererade berättelser kommer att ta över bästsäljarhyllorna. En “good-enough” räckvidd för viss genrefiktion är tänkbar, men återigen inte något som borde ge författare och förläggare sömnlösa nätter.

Skrivandet och utgivningen av facklitteratur, å andra sidan, kommer att främjas och understödjas av AI på alla områden. Det händer redan. Facklitterära författare utnyttjar Chat AI:s många talanger både som forskningsassistent och som skrivarhjälpmedel. Och facklitterära förläggare kommer alltmer att kalla på Chat AI för hjälp med manuskriptutveckling, faktakontroll, redigering, marknadsföring och distribution.

Finns det ett existentiellt hot mot författare?

Jag pratade med en mycket smart författaragent som har funderat mycket på vad AI betyder för hennes klienter och för alla professionella författare. Samtalet vände sig till idén om boken som en ‘behållare’, och jag bad henne utveckla den idén. Hennes svar:

“Den grundläggande idén är att när författare/agenter placerar en bok hos en förläggare, är det just det: en bok. Det finns en förståelse för att den senare kan bli en av de otaliga former av derivatverk vi har lärt känna (översättning, dramatisk anpassning, grafisk roman, etc.), men allt detta är sekundärt till ‘Verket’ självt. Verket är inte en påse med ord eller fraser eller fakta, det är något som är strukturerat av författaren på ett sätt som är unikt för den författaren. Att bryta behållaren, skaka Scrabble-påsen med bokstäver och dra ut ett slumpmässigt urval (som inte är helt slumpmässigt eftersom det är en Scrabble-påse gjord av syntaxen och semantiken och stilen hos den specifika författaren), är inte vad som övervägs när vi ger rättigheter till en förläggare.

“Boken är den integrerade helheten som är större än summan av dess delar. Det är produkten av en kreativ insikt (och en massa kreativt intellektuellt arbete) som förde allt samman som en bok, inte bara ‘en’ bok, utan boken av den specifika författaren.”

Böcker innehåller skatter

När jag tänker på facklitterära böcker är att bryta behållaren en av fördelarna med AI-eran. Du bryter behållaren, och som Fabergéägg, finns det skatter inuti.

Begränsningarna av behållaren är både en funktion och en nackdel. Å ena sidan “Verket är inte bara en påse med ord eller fraser eller fakta, det är något som är strukturerat av författaren på ett sätt som är unikt för den författaren.” Å andra sidan, genom att skapa behållaren, tvingades författaren, genom de inneboende begränsningarna av den bokliga behållaren, att reducera, avvisa, skriva om och omkonfigurera. Verket är polerat, men det är destillerat, och vissa saker gick förlorade (medan andra vanns) längs vägen.

Folk läser inte långa facklitterära böcker delvis för att de har blivit betingade att skumma igenom all text de stöter på på webben – inklusive i sina e-postmeddelanden. Även “boksammanfattningsmodellen” misslyckas – istället för en osmältbar 250-sidig facklitterär bok får du en osmältbar 8-sidig sammanfattning av boken.

Böcker är som lunchlådor – allt är på ett ställe. Men jag vill bara ha kakorna.

Det kommer inte att vara lätt för etablerade författare att kasta av sig sina kedjor. Men de kan behöva lära sig att göra det, eller riskera att bli överskuggade av en ny generation skickliga forskare och författare som kan uttrycka sig med eller utan formella behållare, beroende på tillfälle. Behållare inför alldeles för många begränsningar och restriktioner.

Vad det handlar om är att skrivandets affär har oåterkalleligt förändrats. Det är som slutet för skrivarna. I det här fallet måste våra munkförfattare ta sig ut från sina skrivbord och sin containeriserade syn på boken, och engagera sig med formen och med sina läsare.

Åh ja, jag känner väl till författarens invändningar: Men jag är en författare, jag är ingen marknadsförare. Jag är inte på sociala medier. Jag har inget intresse av att faktiskt kommunicera med mina läsare annat än genom mitt verk och med tillfälliga e-postmeddelanden och alltmer sällsynta framträdanden. Jag har en webbplats (men, sanningen att säga, jag uppdaterar den aldrig). Mitt arbete är min gåva till läsarna. De kan acceptera mitt arbete, eller avvisa mitt arbete, men jag kommer inte att ansluta mig till dem i deras vardagsrum.

Tja, du kan lägga undan rullarna och bläcket gjort av hermeliners blod. Yrket “författare” kräver nu att du lämnar ditt skrivbord och möter dina läsare där de bor, i deras vardagsrum och på deras Facebook-sidor. Du kan beklaga det så mycket du vill, när vi stänger ner dina bidrag, din tjänst och dina publiceringsmöjligheter. Detta är den nya modiga världen för författare och läsare, utan förläggare, dessa fruktansvärda mellanhänder som arbetar hårt för att förbättra ditt arbete, men ständigt avbryter din direkta kontakt med läsarna, de personer som värderar det mest.

Inget av detta utesluter att stora narrativa facklitterära böcker når en uppmärksam publik. Tvärtom. Dessa böcker kan fortsätta att lysa. Det kommer fortfarande att finnas bästsäljande facklitteratur, även om ekonomin kommer att visa sig vara omöjlig för alla utom de mest säljande författarna. Den nuvarande modellen behöver inte försvinna för att den nya modellen ska frodas.

Jag tänker på dessa stora facklitterära böcker som “vackra”. “Vackra” i betydelsen vackert skrivna, noggrant redigerade, utformade med omsorg och övervägande och tryckta, med räfflade kanter, på FSC-certifierat papper. De säljs i butiker.

Butikerna kallas “bokhandlar”, men de har alla egenskaper hos butikshandel—vackra föremål, utvalda med omsorg av ägaren och cheferna, lite dyra, men för dem som värdesätter sådana föremål, väl värda kostnaden.

Uppgiften för de flesta facklitterära författare är nu att gå bortom behållaren, samt förläggaren som grindvakt.

Innehållsbehållare i flera medier

Läsarpubliken, särskilt dess yngre medlemmar, är alltmer “media-agnostisk.” I jakt på underhållning eller kunskap kan de titta på en YouTube- eller TikTok-video, en Netflix-serie, lyssna på Spotify, bläddra genom Instagram (“Insta”), ta del av nyheterna eller, ibland, läsa en bok.

(De tryckt-bok-kramande invånarna på BookTok är en uppskattad grupp av influencers, men har en blygsam marknadspåverkan totalt sett.)

Ändå är marknadsmodellen fortfarande fokuserad på den unika behållaren. Förlagsbranschen. Filmindustrin. Tv-industrin. Musikindustrin.

Filmer är inte böcker. YouTube-videor är inte filmer. Podcasts är inte ljudböcker.

Dessa silor var inte en historisk oundviklighet utan resultatet av en serie affärsbeslut fattade av mäktiga organisationer över tid.

Det är inte svårt att störa en affärsmodell byggd på en enda behållare.

Trots all sin språkkunskap fungerar den nuvarande generationens generativa AI med ännu mer bravur genom att producera ljud, bilder och video. AI förser denna bok med ljudböcker, på flera språk, tillsammans med de 31 översättningarna av e-boken. Inget av detta skulle vara ens avlägset möjligt utan AI—ekonomin för traditionell produktion är inte meningsfull för mig.

Behållarsilor

Innehållsskapare är traditionellt utbildade att excellera i bara en enda behållarsilo. Vi har skrivprogram och filmprogram och musikprogram. Det förekommer sällan att kreativa författare också tar en “biämne” i film eller musik. Eller i datorprogrammering eller apputveckling.

Vad hände med transmedia? Var finns programmen som lär kreativa att vara, som Apple en gång uttryckte det, “Masters of Digital Media”?

Det bästa innehållet kommer alltid att vinna. Men med tiden spelar innehållsbehållarna mindre och mindre roll. Den digitala generationen kanske inte är behållar-agnostisk. Men de är behållar-flexibla. De möter det mesta av sitt innehåll digitalt, via smartphones. Tryckt material kommer att fortsätta att hitta en publik, men det kommer aldrig igen att dominera.

“Framtidens förläggare” behöver också vara behållar-flexibel. Det mesta av tillväxten i innehållsdistribution sker inte via bläck på papper, eller ord i EPUB-filer. Tillväxten av ljudböcker är ingen slump, inte heller populariteten av YouTube och TikTok.

Den större utmaningen ligger i nödvändigheten av att göra nytt och befintligt innehåll upptäckbart, oavsett dess form, och sedan vid upptäckt, att omvandla medvetenheten till ett köpbeslut.

Upptäckt och konvertering

Problemet med upptäckt online har funnits med oss ett tag; AI skapade det inte. Problemet är något som branschveteranen Mike Shatzkin har lyft fram mer än en gång. Det finns så många titlar tillgängliga i tryckt form, och digitala format gör att de förblir kontinuerligt i tryck. Miljontals utgångna böcker kan hittas från begagnade bokhandlare. Ovanpå detta publiceras två miljoner eller fler nya böcker varje år, bara på engelska. AI kommer att förvärra mättnadsproblemet, men det är redan utom kontroll.

Amazons algoritmer är inte osjälviska—de gör ett mycket bra jobb med att lyfta fram vad som är säljbar, boken som du sannolikt kommer att köpa nästa gång. Den boken kännetecknas inte bara av sina försäljningssiffror. Den sålde bäst inte för att någon skojare optimerade den online-listan. Den sålde bäst för att den var bäst, och förtjusta läsare berättade för andra att köpa den, både online och personligen. (Amazon har uppmuntrat reklam som förvrider dess algoritmer, en del av enshittification av plattformen.)

Jag pratade ovan om metadata. Konvertering är lika besvärlig som upptäckt. Kan AI hjälpa författare att omvandla webbläsare till köpare?

Upphovsrättens framtid

Konceptet upphovsrätt har blivit absurt med AI. Det är inte så att människor inte vill ha eller förtjänar skydd för sitt arbete – man kan hävda att de förtjänar det mer än någonsin. Och det är inte så att AI gör upphovsrätten ogenomförbar (åtminstone i någon form, om än inte i den nuvarande formen).

Det är att “skyddet av upphovsrätt” också blir en slöja bakom vilken ditt arbete försvinner. Om din bok inte kan refereras via en konversation med ChatGPT, då existerar den de facto inte. AI-företagen kommer bara att licensiera crème de la crème av innehåll. De behöver inte skummjölken.

Varför bry sig om att skydda det som inte kan hittas?

Detta är där upptäcktsproblemet kan bli en katastrof. Google gör ett utmärkt jobb med att upptäcka böcker bara genom deras metadata. AI vill ha hela enchiladan. Till skillnad från traditionella sökmotorer svarar AI inte på användarfrågor baserat endast på den abstrakta metadata om ett verk.

Samtidigt antyder föränderliga innehållsbehållare, behållare andra än hela böcker, olika typer av upphovsrättsutmaningar. Om texten i en bok kan ändras på flykt, som svar på läsarens inmatning, vad är då upphovsrätten för texten?

Författare & läsare

Förläggare behöver författare; författare behöver inte förläggare.

Förlagsverksamhetens framtid är den intima relationen mellan författare & läsare. Den är mycket starkare än relationen mellan författare och förläggare och läsare och förläggare. Förläggare kan vara ett hinder i relationen mellan författare & läsare. I många fall möjliggör de inte relationen; de hindrar den.

Under lång tid var det enda sättet att få tillgång till högkvalitativt skriftligt innehåll genom böcker eller via ett blygsamt urval av tidskrifter. Det är definitivt inte längre fallet. Helt bortsett från distraktionerna från andra medier finns det nu så många olika sätt att få tillgång till (icke-behållariserat) högkvalitativt skriftligt innehåll. Böcker har inte längre den primat de en gång åtnjöt.

AI kan kommunicera

“Vad är den perfekta boken för mig att läsa härnäst?” Generativ AI kan svara på den frågan med en vältalighet och precision som aldrig tidigare varit möjlig. Allteftersom AI blir en pålitlig rekommendationsmotor, kommer författare att behöva kommunicera via den motorn. (Amazon arbetar självklart på detta, och har fördelen av att veta vad du tidigare har köpt.)

Slut

Så var lämnar detta oss?

Jag kände det nödvändigt att katalogisera de utmaningar som förlagsverksamheten står inför. Chat AI anländer vid en tidpunkt då handelsförlagsverksamheten är bekymrad. Den anländer inte vid en tidpunkt då industrin är robust och kan säga: “vi behöver inga nya påfund; vi klarar oss utmärkt.”

Jag pratade ovan om de mest akuta utmaningarna som förlagsverksamheten står inför: stigande kostnader och minskande marginaler.

Vargarna kommer aldrig att bli mätta på sina krav på allt brantare rabatter; marginalerna kommer inte att förbättras. Detaljhandelspriserna är nära ett tak. Framtiden för den nuvarande handelsförlagsmodellen ligger i kostnadsreducering.

Lönerna kan inte bli lägre, så vi måste minska kostnaderna inom produktionscykeln.

Men förläggare har försökt att minska produktionskostnaderna i årtionden. Det har varit några anmärkningsvärda framgångar, men vi har uttömt de nuvarande alternativen.

Jag har visat att AI kan ge effektivitet i förlagsverksamheten, över arbetsflödet. De är inte omedelbara och de är inte lätta: du måste arbeta med AI. Men möjligheten finns där.

Förläggare ser inte att minska personalen, så målet måste vara fler böcker som kommer snabbare till marknaden baserat på nuvarande personalresurser. AI-verktyg kan främja det målet.

Och, självklart, det finns alltid ett mål att sälja fler exemplar av de böcker som publiceras. AI kan hjälpa till där också.

Jag beskriver ovan hur AI också kan vara transformativ för förlagsverksamhetens framtid.

Oroa dig inte för det. Få ordning på ditt hus, och vi kommer att prata vidare.

En enda resurs

Det finns nu en nästan oändlig tillgång på material tillgängligt för att informera dig om AI, alldeles för mycket, självklart. Välj ditt föredragna medium: böcker, bloggar, nyhetsbrev, videor, podcaster, kurser och psykisk spådom. Jag har länkat till några nyckelkällor genom denna bok, det är värt att klicka på några slumpmässiga länkar för att se var de tar dig.

Det finns bara en utmärkt AI-bok för nybörjare, Ethan Mollicks Co-Intelligence, som släpptes i början av april 2024. Den är hämtad från hans lika utmärkta nyhetsbrev, “One Useful Thing.”

Sidonot: kredentialer för att skriva denna bok

Jag ville inte belasta introduktionen med denna information, men jag är medveten om att många är skeptiska till de personer som skriver om AI idag, misstänksamma att dessa författare utger sig för att vara moderna AI-experter. Utan tvekan är några det. Jag hoppas att jag har acceptabla kredentialer för att genomföra detta projekt.

Jag läste min första bok om artificiell intelligens 1988, en bok som publicerades två år tidigare, Understanding Computers and Cognition: A New Foundation for Design av Terry Winograd och Fernando Flores. Boken är tät–mycket av den gick över mitt förstånd–men det var första gången jag blev exalterad över möjligheterna med artificiell intelligens inom bokpublicering.

Vid den tiden var jag djupt inne i digitaliseringen av publicering, vilket orsakades av explosionen av skrivbordspublicering, Apple-datorer, PageMaker och liknande. År 1986 övervakade jag utvecklingen av Page One automatiserad bokpubliceringsprogramvara, ett program som kunde ta ett bokmanuskript som en Microsoft Word-fil och sätta det i en hel bok på några minuter. Det är väldigt lätt att göra idag; det var inte lätt då.

Jag fortsatte att arbeta inom publiceringsteknik därefter, som konsult och analytiker, och arbetade med några av de ledande mjukvaru- och hårdvaruleverantörerna, inklusive Adobe, Apple och Microsoft. Jag blev också involverad i, och delägare i, ett mjukvaruföretag kallat Enfocus. Vi skapade ett automatiserat system för prepress-arbetsflöden.

Vi hade inte tillgång till AI vid den tidpunkten, men vi blev mycket bra på att frigöra fullt automatiserade publiceringsproduktionssystem. Precis som AI kan vara oskiljaktigt från magi, så kan också den bästa automatiseringen verka likna AI.

Snabbspola fram till 2016, och min kollega Cliff Guren hjälpte mig att fokusera på AI inom bokpublicering: det började se ut som om något äntligen hände. The Bestseller Code (Archer och Jockers) dök upp i september 2016, vilket gjorde det klart att datorer kunde tolka litteraturens textur med en hög grad av insikt och precision.

Vid den tiden följde jag noga bokpubliceringsstartups, och ett fåtal dök upp med någon grad av AI-teknologi insvept i sina mjukvaruerbjudanden.

Snabbspola igen till oktober 2022.

Månader innan det blev ämnet alla inom publicering talade om, Tim O’Reilly presenterade på PageBreak Conference om “AI och publiceringstransformation.” O’Reilly är välkänd i publiceringsvärlden, både för O’Reilly Media och för Tools of Change-konferensen. Han är en av teknikens främsta visionärer.

O’Reilly var inte bara entusiastisk över de nya framstegen inom AI, han var överväldigad. “Vi är vid en punkt som påminner mycket om hur jag kände när vi upptäckte World Wide Web 1992,” sa han, och följde det med “detta är lika omvälvande som VisiCalc, PC:n och webbläsaren.”

Han medgav att (vid den tidpunkten) användningsfallet fortfarande var oklart, och pekade på ett par pilotprojekt hos O’Reilly Media. Men, sade han, “detta blir skrämmande snabbt bättre. Maskininlärning är inte längre en framtida sak. Detta handlar om demokratisering av AI.”

O’Reilly pratade om hur förläggare borde närma sig dessa nya teknologier, och sade att de behöver “veta när de ska bränna båtarna och satsa allt. Det finns en tid när man måste engagera sig.”

ChatGPT släpptes inte förrän en månad senare. PageBreak var den första publiceringskonferensen att sätta det i centrum, via Tims insikter.

Utlämnanden

Denna bok har fem sponsorer. Jag visste när jag skrev boken att det skulle vara få rikedomar att hitta, och jag bestämde mig för att finansiera mina ansträngningar genom att bjuda in sponsorer att delta.

Som jag anger på min webbplats, arbetar jag som konsult, analytiker och journalist, och jag stödjer International Federation of Journalists’ Global Charter of Ethics for Journalists. Paragraf 13 är tydlig på skyldigheten att undvika intressekonflikter eller “någon förväxling mellan (min) aktivitet och reklam eller propaganda.”

Att ha sponsorer innebär en intressekonflikt och en förvirring kring reklam. Om jag arbetade för New York Times skulle det vara enkelt: “Nej.” När jag arbetar för mig själv är avslöjande mitt vapen för att uppfylla dessa skyldigheter: jag kommer att beskriva den ersättning jag har fått och du kan bedöma, i mitt arbete, om jag har blivit komprometterad.

Jag valde de sponsorer som jag bjöd in till detta projekt eftersom jag kände till inte bara deras arbete utan även individerna i deras organisationer. De är kollegor och vänner. Jag berättade för dem att deras produkter kanske skulle diskuteras i texten i denna bok och att de inte skulle ha någon kontroll över dessa ord. Det de kunde kontrollera var deras annonser i slutet av boken—jag skulle lägga upp dem som de levererades. Det är vad jag har gjort.

Jag har mottagit betalningar från andra som kan ha påverkat mitt arbete med denna bok—jag kan katalogisera följande:

  • Jag har inte gjort några betalda konsultuppdrag för AI-leverantörerna som beskrivs i denna bok, inklusive sponsorerna.

  • Jag fick en del vinstdelningsintäkter från Publishers Weekly för AI-webbseminarierna i september, 2023.

  • Jag får betalt en standardtaxa för mina Publishers Weekly-artiklar.

Vänligen låt mig veta om du upptäcker någon favorisering som du tror kan ha resulterat från dessa engagemang. Min förkärlek för AI formades innan de stora rikedomarna flödade in.

Tack

Jag skulle inte kunna tala med någon trovärdighet om AI om det inte vore för stödet från Publishers Weekly, inklusive redaktören emeritus, Jim Milliot, och VD:n, Cevin Bryerman. Jim stödde mitt tidiga skrivande om AI, och Cevin (tillsammans med Krista Rafanello och resten av teamet) var avgörande för framgången med förra höstens konferens, AI and the Revolution in Book Publishing. Andrew Albanese är nu verkställande redaktör på PW; Ed Nawotka, en seniorredaktör. Jag har turen att arbeta med dem.

Och vidare tack till många kollegor…

  • Peter Brantley

  • Cliff Guren, långvarig sparringspartner och insiktsfull läsare av mina utkast

  • Två andra ‘beta’-version läsare, som erbjöd värdefull feedback: Joe Wikert och Brad Farmer

  • Mina Publishing Technology Partners, Ken Brooks, Bill Kasdorf, Bill Rosenblatt, Bill Trippe, Steve Sieck, och våra nyaste partners, Lettie Conrad och Linda Secondari.

  • Min syster, Anne Pashley, som hjälper mig att hålla förlagsstartdatabasen aktuell och ständigt ger energi åt mina ansträngningar.

  • Mina partners i mina månatliga AI-webbseminarier: Brooke Horn och Brian O’Leary på BISG.

  • Bill Kasdorf hjälpte mig att fördjupa mig i tillgänglighetsfrågor för min bok.

  • Peter Armstrong och Len Epp på Leanpub var tålmodiga med mina invändningar och hjälpte mig genom processen att erbjuda det bästa möjliga resultatet på Leanpubs plattform.

  • Hugo Rayne på ElevenLabs för stöd med ljudboken.

  • Min goda vän och pålitliga upptäckare av mina skriv- och resonemangsmissar, Bob McArthur.

Bilaga: Utforska traditionella förlags kvarvarande fördelar

Traditionella förlags status är anledningen till att de flesta av oss gick med i branschen. Vi växte upp med att älska böcker, studerade engelska eller något liknande på universitetet, drev runt ett tag, kanske fick ett jobb i en bokhandel, kanske en Masters of Publishing-certifikat, sedan arbetade som praktikant på ett förlag, och här är vi idag. Du älskar ditt jobb, även om lönen suger och arbetsförhållandena inte alltid är trevliga.

Den samma statusen matar förlagsförsörjningskedjan. På insidan av försörjningskedjan: det betyder mycket för många författare. Vi ser det hela tiden. Ekonomin för traditionella förlag är ologisk, och det tar fyra gånger så lång tid att komma i tryck, men, kanske, bara kanske, jag kommer att bli nästa debutvinnare, som Delia Owens (Där kräftorna sjunger) eller andra gången megastjärna, Amor Towles (En gentleman i Moskva).

Det är som Vegas: förutom att oddsen är bättre i Nevada. Spela på ett enda nummer i roulette och oddsen mot dig är 36 mot 1. Spela på traditionella förlag och oddsen mot dig är… mycket sämre.

Oddsen att få ett kontrakt med någon av de traditionella handelsförlagen, än mindre en av de stora 5, är dåliga. Men det är det minsta av en författares problem. Det är faktiskt att hitta läsare som är den stora utmaningen.

En sak som kan hjälpa är att landa en plats på en bästsäljarlista.

Låt oss överväga PRH, Penguin Random House. Företaget publicerar bara 15 000 nya titlar varje år. År 2021 lyckades de få 196 böcker på Publishers Weekly bästsäljarlista. Som den länkade artikeln framhäver: “PW publicerar fyra bästsäljarlistor för vuxna, var och en med 20 titlar: inbunden skönlitteratur, inbunden facklitteratur, trade paperback och massmarknadspocket. Det betyder att det under ett år finns 2 080 inbundna positioner på våra listor och 2 080 pocketpositioner.

Inte alla bästsäljare var nyutgivna det året - låt oss gissa generöst att 90% var det, 1870 platser.

Samtidigt har The New York Times 15 bästsäljarplatser per vecka för varje kategori av bok (skönlitteratur, facklitteratur, barn; separata listor för ungdom och hur-man-gör; inbunden separat från pocket, plus kombinerade listor). För en enskild författare betyder det 780 tillgängliga platser per år, även om de flesta av dessa platser är fyllda med återkommande bästsäljare. (The Body Keeps the Score av Bessel van der Kolk har varit på pocketlistan i fem och ett halvt år!) Så låt oss dela det på hälften, 390 tillgängliga platser. Du måste sälja mycket böcker för att ta en av dessa.

Vad sägs om täckningen i The New York Times Book Review? År 2016 hävdade Pamela Paul, då redaktör för Review, attThe Book ReviewTimes recenserar ungefär 1% av de böcker som kommer ut under ett givet år.” Tydligt menar hon 1% av böckerna från de största förlagen - hon kan inte tänka på små förlag eller självpublicerade författare. Och så kanske 150 av PRH:s 15 000 nya titlar recenseras varje år.

De flesta observatörer är överens om att medan uppmärksamhet från toppmedia fortfarande är viktig och kan vara kraftfull, är effekten av recensioner inte vad den en gång var, om av ingen annan anledning än att färre bokläsare interagerar med de stora recensionskanalerna.

Låt oss vända vår uppmärksamhet till försörjningskedjan nedströms, till distribution. Medan förlagsmärken har tyngd med författare, har det alltid varit en sanning att, till skillnad från många konsumentvaror, har förlagsmärken nästan ingen tyngd med bokköpare och läsare. Men de har mycket tyngd med distributörer och bokhandlare. Detta återspeglar den historiska business-to-business-naturen av förlagsverksamhet (snarare än B2C - till konsumenter). Förlagsglans sprids via distributions- och detaljhandelskanaler: Barnes & Noble bär en bok eftersom den kommer från PRH, och placerar den sedan framför köpares ansikten; så sprids glansen till läsare.

Sponsorer

En banner som säger 'BOOK ADVISORS LLC Transaktionstjänster och konsultation för förlag'.

David Lamb och Susan Reich bildade Book Advisors LLC 2016 för att konsultera om fusioner och förvärv inom förlagsbranschen. Vi har slutfört mer än ett dussin transaktioner, samt en mängd finansiella, distributions- och operativa konsultprojekt, inklusive rättvisa marknadsvärderingar. Vi är glada att nyligen ha arbetat i samarbete med Clarke & Esposito; Thad McIlroy från The Future of Publishing; och Kuo-Yu Liang från Ku Worldwide.

Vi är stolta över våra relationer, flit och diskretion. Oavsett om du är intresserad av att köpa, sälja, finansiera eller konsultera, vänligen kontakta oss för en konfidentiell diskussion.

bookadvisorsllc.com | bookadvisors@gmail.com

Ett 3x2 rutnät av banners: En banner som tillkännager att Papercutz har förvärvats av Mad Cave Studios i augusti 2022, i samarbete med Ku Worldwide LLC; En banner som tillkännager att DAW Books har förvärvats av Astra Publishing House i juli 2022, i samarbete med Ku Worldwide LLC; En banner som tillkännager att Caslon Publishing har förvärvats av Brookes Publishing Co. i april 2022, i samarbete med Thad McIlroy; En banner som tillkännager att B.E.S. Publishing har förvärvats av Sourcebooks i november 2021; En banner som tillkännager att Applewood Books har förvärvats av Arcadia Publishing i april 2023; En banner som tillkännager att Erewhon Books har förvärvats av Kensington Publishing i oktober 2022
Logotyp för Firebrand Technologies och NetGalley.

Firebrand Technologies är ett mjukvaru- och tjänsteföretag som har hjälpt bokförläggare med data- och arbetsflödeshanteringslösningar i mer än 35 år.

NetGalley är en onlineplattform som kopplar samman förlag och författare med recensenter, bibliotekarier, bokhandlare, media och lärare som upptäcker nya böcker på NetGalley och rekommenderar dem till sina målgrupper.

Som utvecklare av mjukvara och digitala lösningar är Firebrand Technologies och NetGalley också branschexperter och aktiva medlemmar i förlagsvärlden. Våra lösningar gynnar alla delar av förlagsprocessen, från förvärv till försäljning och marknadsföring.

  • NetGalley hjälper förlag att skapa efterfrågan för titlar, få snabb feedback och recensioner, samt upptäcka tidiga trender.

  • Title Management Enterprise tillsammans med dess kompakta version, Title Management Lite, är Firebrands kärnmjukvaruapplikation som erbjuder avancerad arbetsflödeshantering genom hela förlagsprocessen.

  • Eloquence on Demand är förlagsbranschens mest kraftfulla ONIX-distributionsplattform, som distribuerar metadata och digitala tillgångar till över 600 handelspartners i ONIX och andra format.

  • Flywheel är en backlist-marknadsföringstjänst som identifierar dolda möjligheter i backlisten för ökad synlighet och försäljning.

  • Eloquence on Alert övervakar levande titeldata och trender på marknaden och varnar förlag om kritiska misstag och möjligheter som kan påverka försäljningen (saknade köpknappar, tredjepartssäljare, etc.).

  • FlightDeck är det mest avancerade verktyget för EPUB-validering och testning som finns tillgängligt.

En infografik som visar olika tjänster som erbjuds av NetGalley inklusive bokpromotion, arbetsflödeshantering för förlag, metadata distribution, försäljning och backlist-marknadsföring, och EPUB-testning.
Banner för Perfect Bound, en marknadsplats som kopplar samman förläggare med tryckerier världen över.

Välkommen till ett bättre sätt att trycka böcker.

Perfect Bound skapades 2022 för att hjälpa till att lösa de leveranskedjeproblem som har plågat förlagsbranschen i åratal. Perioder med överkapacitet hos tryckerier följs av korta perioder av förseningar på grund av leveransbrister. Perfect Bound syftar till att öppna upp tryckmarknaden för oberoende förlag och författare genom att låta tryckerier från hela världen enkelt ansluta och göra affärer med förlag som letar efter nya och dynamiska leverantörer.

Vad är Perfect Bound?

Perfect Bound är en tvåsidig marknadsplats som kopplar samman oberoende bokförlag med tryckerier i USA, Kanada, Colombia, Brasilien, Turkiet, Kina, Malaysia, Indien och fler.

Illustration av en tryckpress med olika typer av böcker och publikationer som produceras.

Upptäck nya förlagspartners med ett klick

Vår robusta plattform låter dig enkelt bygga ut produktofferter, skicka förfrågningar till hundratals tryckerier med ett klick, förhandla och slutföra dina tryckserier och spåra produkter från tryckpressen till lagret. Som tryckare har det aldrig varit enklare eller säkrare att ansluta med nya förlag, bjuda på kommande projekt och få betalt.

Anslut med nya förlagspartners omedelbart

  • Skicka och ta emot tryckförfrågningar från hela världen

  • Utför och spåra tryckserier från tryckpressen till lagret

  • Transaktioner sömlöst med ACH-betalningar via Stripe utan att lämna plattformen

En annons för Shimmr som visar automatiserad annonsering som säljer böcker, nämner en 35% ökning i försäljning och dubbelt så bra avkastning på annonsutgifter.
En annons för Shimmr med exempelannonser, prisinformation och en QR-kod för att boka en demo.

Möt Insight, en AI-plattform byggd specifikt för förlag

En närbildsbild av en person som håller en öppen bok med lysande element som kommer ut från sidorna.

“Att anta Insight för vårt förlag var som att byta en cykel mot en Ferrari. Plötsligt går allt snabbare.”

—-Tysk barnboksförläggare och Insight-kund

Arbeta Smartare, Uppnå Mer

Utvecklad av Veristage, Insight ger förläggare möjlighet att blomstra i det utvecklande AI-landskapet. Med hjälp av AI och en robust uppsättning digitala verktyg analyserar och förstår Insight dina dokument och böcker, för att hjälpa dig:

  • Skapa, förbättra och uppdatera metadata

  • Snabba upp skapandet av titel-specifik marknadsföring, publicitet och försäljningsmaterial

  • Identifiera och utvärdera en boks nyckelbudskap, unika försäljningsargument, målgrupp, jämförelseobjekt och mer

  • Optimera ditt marknadsförings- och försäljningsinnehåll för maximal räckvidd, engagemang och ökad försäljning

Till skillnad från generiska AI-plattformar är Insight konstruerad för att fungera inom förlagsarbetsflöden och hjälpa dig att skapa förlagsspecifik information och material.

Hur Det Fungerar

  1. Ladda upp din bok till Insight-plattformen

  2. Insights AI-verktyg analyserar och förstår din bok

  3. Inom några minuter genererar Insight ett brett spektrum av metadata och nyckelinformation om din bok för redaktionella, marknadsförings-, publicitets-, försäljnings- och rättighetsavdelningar

  4. Gör manuella redigeringar av någon av denna information direkt i plattformen. Din bok och AI-innehåll sparas inom Insight, så du kan komma åt det när som helst.

  5. Använd vår dokumentmedvetna AI-chat för att optimera din titelinformation, interagera med dina böcker och inkludera bokdetaljer i kommunikation och annat material

Säkerhet och Upphovsrätt

Veristage-teamet är engagerat i att tillhandahålla AI-tjänster som är säkra och skyddar förläggarnas immateriella egendom. Vår plattform har avancerade informationssäkerhetssystem på plats, och vi arbetar endast med AI-modeller som inte lagrar eller använder din data för att träna framtida modeller.

Lösningar För Förlag av Alla Storlekar

Insight är utformad för att fungera för förlag av alla former och storlekar, från konsument till akademisk, från tre-personers team till multinationella organisationer. Vi erbjuder konkurrenskraftiga priser och skalbara lösningar.

Prata med oss för att ta reda på hur Insight kan gynna ditt företag:

Veristages logotyp i blått med en abstrakt design.