Indice
- Introduzione
- Perché l’IA ora?
- IA: Come iniziare
- IA: Una storia molto breve
- Comprendere l’IA e Alcuni Termini Chiave
- Software AI: I Pesi Massimi del Sistema
- Lavorare con il Software IA
- Formazione per Chat AI
- Allucinazioni: Una Mosca nel Latte
- E per quanto riguarda immagini e video?
- Software per editori di libri
- IA e Editoria: Cosa sta facendo attualmente il settore?
- IA e Editoria: Cosa stanno facendo le Case Editrici?
- AI e l’editoria di libri: I casi d’uso
- Strategie per integrare l’IA nelle operazioni editoriali
- IA per Audiolibri
- IA per la Traduzione di Libri
- IA per l’Editoria Accademica
- IA per gli Autori
-
Preoccupazioni e Rischi Intorno all’IA
- Diritti d’autore violati?
- Diritti d’autore e IA per autori
- Quali sono le implicazioni a lungo termine?
- Licenza dei contenuti alle aziende di AI
- È troppo tardi per evitare l’AI
- Quando gli autori usano l’AI
- L’IA può essere rilevata nella scrittura?
- Perdita di posti di lavoro
- Istruzione
- Il futuro della ricerca
- Libri spazzatura su Amazon
- Bias
- La Creatività può essere un Cliché
- Un Altro Pensiero
- Cose Buone al di Fuori dell’Editoria
-
Saggio: L’Impatto dell’AI sull’Industria dell’Editoria
- Le conseguenze nel mondo reale dell’AI
- L’editoria è in declino economico da decenni
- Stipendi nell’editoria libraria
- I tre (e mezzo) vantaggi rimanenti per gli editori di libri tradizionali
- Auto-pubblicazione
- Editori ibridi
- Pubblicare oltre gli editori
- Innovazione, tecnologia e pubblicazione di libri
- Il dilemma dell’innovatore
- Narrativa versus saggistica
- Esiste una minaccia esistenziale per gli autori?
- I libri contengono tesori
- Contenitori di contenuti in media multipli
- Silos di contenitori
- Scoperta e conversione
- Il futuro del diritto d’autore
- Scrittori e lettori
- L’IA può comunicare
- Conclusione
- Una Sola Risorsa
- Nota a margine: credenziali per scrivere questo libro
- Appendice: Esplorare i Vantaggi Rimanenti dell’Editoria Tradizionale
- Sponsor
Introduzione
“La prossima rivoluzione ci sorprenderà tutti, come sempre accade. In altre parole: se la massa anticipa la rivoluzione, non può essere la rivoluzione.” —Doc Searls, 2002
È trascorso più di un anno e mezzo da quando OpenAI ha introdotto ChatGPT a un pubblico per lo più poco familiare con l’intelligenza artificiale. Inizialmente sembrava non avere alcuna rilevanza evidente per l’editoria. Da allora, tutto è cambiato. E niente è cambiato. Gli editori stanno iniziando a esplorare i nuovi strumenti di IA, esplorando i confini e intraprendendo conversazioni tentate con ChatGPT. Ma non c’è segno di una vera rivoluzione nella pratica editoriale; è semplicemente troppo presto.
C’è una grande incertezza attorno all’IA nella scrittura e nell’editoria. Grandi controversie circondano l’uso dell’IA. Tuttavia, per molti, c’è entusiasmo per le possibilità.
Mi concentrerò più sulla promessa che sul pericolo, ma includo una panoramica delle preoccupazioni e dei rischi associati all’IA, in particolare per quanto riguarda autori ed editori. Non intendo minimizzare le preoccupazioni. Semplicemente non è di questo che tratta questo libro.
È un libro?
Considero questa pubblicazione più un ‘opuscolo’ che un libro. La definizione UNESCO di un libro è “almeno 49 pagine” (perché non 50?), e, con 300 parole per pagina, questo potrebbe non qualificarsi. Ma, cosa più importante, non è inteso come la parola definitiva su nulla—è più un rapporto di progresso. L’intelligenza artificiale e il suo ruolo nell’editoria stanno cambiando a un ritmo vertiginoso, che non mostra segni di rallentamento. Quindi questo libro(let), questo rapporto, è solo un’istantanea.
Utilizzando la piattaforma Leanpub, ho rilasciato le mie ricerche e analisi come un lavoro in corso—è revisionato come un documento vivente. Non ho mai tentato questo prima d’ora. Le mie ragioni sono due: offrire qualcosa di utile a breve termine e avere la possibilità di rivederlo secondo necessità. La storia dell’IA è tutt’altro che finita.
Spero che il mio approccio si riveli utile per i lettori, anche se sono consapevole che troppi aggiornamenti potrebbero presto diventare fastidiosi. Ho cercato di ridurre l’attualità di questo libro, per ridurre il focus sulle cose che cambieranno più velocemente.
La versione che è stata (silenziosamente) disponibile da aprile 2024 l’ho contrassegnata come “completa al 75%” ed è stata offerta gratuitamente ai lettori. Il 23 luglio è la data di pubblicazione ufficiale per la versione “completa al 100%”, che troverà anche la sua strada in una distribuzione più ampia al di fuori di Leanpub. Continuerò ad aggiornare la versione al 100%: ma quegli aggiornamenti saranno disponibili solo per gli acquirenti di Leanpub—è scomodo aggiornare costantemente libri stampati, ebook e audiolibri che sono in distribuzione più ampia.
Dolore degli editori con l’IA stessa
Ogni giorno sento parlare del dolore che le persone in tutta l’industria editoriale stanno affrontando cercando di venire a patti con l’IA. Perché è così doloroso? Ecco tre ragioni che sto vedendo:
La tecnologia è complessa e misteriosa, troppo complessa per essere compresa dai non scienziati. (C’è uno studio affascinante che propone una “scala di ansia per l’IA (AIAS)” che misura 21 diverse ragioni per cui le persone sono ansiose riguardo all’IA.)
L’IA è diventata enormemente controversa nell’editoria, principalmente a causa delle questioni di copyright che colpiscono al cuore della scrittura e dell’editoria.
Tuttavia, c’è anche un’atmosfera di FOMO—paura di perdersi qualcosa. Nonostante i molti difetti dell’IA, come con molte tecnologie allettanti (l’orologio Apple? Gli altoparlanti intelligenti?), affrontiamo quella sensazione snervante: e se mi stessi perdendo la prossima grande cosa, come ho fatto con un paio delle ultime grandi cose. Mi sono sentito stupido allora; non voglio sentirmi stupido di nuovo. Fa male.
Va bene: ha senso che le persone nell’editoria provino dolore per l’IA.
Allora qual è il caso d’uso per questo libro?
Il caso d’uso è che lavori nell’editoria, o sei un autore che cerca di capire meglio l’editoria dei libri, e sei stanco di sentirti stupido e confuso riguardo all’IA. Troppi dei tuoi colleghi sembrano capirla meglio di te, e sei stanco di non poter parlare in modo intelligente sull’argomento.
Il mio obiettivo per i lettori è che, alla fine di questo libro, si sentano in grado di unirsi alla conversazione, di esprimere un’opinione informata. Voglio che ti senta attrezzato per fare scelte personali riguardo alla tecnologia e avere un percorso per imparare a usare l’IA, se scegli di farlo.
Non voglio inondare i lettori con tante chiacchiere sui fondamenti della tecnologia AI—non parlerò molto di intelligenza artificiale in astratto. Invece, voglio fornirti una base sull’AI specificamente per l’autore e la pubblicazione di libri. Se qualcuno ti chiede, cosa significa davvero l’elaborazione del linguaggio naturale, puoi rispondere, come faccio io: non sono un esperto di AI. Ma so come l’AI viene utilizzata nella mia industria.
Sarà proprio ciò che devi sapere?
Non mi piace la frase “ciò che devi sapere” perché raramente mantiene ciò che promette, spesso mancando il bersaglio, sia molto più di quello che devi sapere, sia molto meno. Riuscirò a farlo bene? Sono serio nel cercare di trasmettere il minimo indispensabile. Penso di sapere cosa devono sapere gli editori sull’AI, poiché ho parlato con molti di loro, ospitando seminari e webinar progettati molto specificamente per fornire solo le basi.
Piuttosto che ripetere all’infinito la frase “ciò che devi sapere” userò un’icona chiave con del testo indentato. |
Dopo i riassunti che introducono molte sezioni, approfondirò i concetti principali. Ho anche cercato di mantenerli il più breve possibile, anche se, a dire il vero, a volte mi dilungo.
Una forma abbreviata che userò è “Chat AI”. Quando OpenAI ha rilasciato per la prima volta ChatGPT, era l’unico sul mercato, ma ora ci sono diversi concorrenti importanti. Entrerò nei dettagli a breve, ma alcuni di loro li conosci già, ovviamente Google e Microsoft. Loro (e diverse altre aziende) ora offrono software di chat AI online simile a ChatGPT. E quindi piuttosto che dire “ChatGPT e i suoi concorrenti” mi riferirò all’intera categoria come “Chat AI”. Se scrivo “ChatGPT” mi riferirò specificamente al software di OpenAI.
Il libro è principalmente pratico, ma nella sezione finale propongo un saggio su quelli che potrebbero essere le conseguenze reali dell’AI sull’industria editoriale, insieme ad alcune altre speculazioni.
A chi è rivolto questo libro?
Il pubblico principale di questo libro è costituito dagli editori di libri di commercio (consumer). Il pubblico secondario sono tutti gli altri editori di libri (scientifici, educativi…) nella misura in cui vi sono sovrapposizioni in questi settori industriali. Il mio terzo pubblico sono gli autori con un interesse diretto e i molti altri affascinati dall’editoria.
Il sottotitolo afferma che questa è una guida all’AI sia per gli scrittori che per gli editori. In parte è perché voglio che gli editori capiscano anche cosa stanno facendo gli scrittori con questa tecnologia. Penso che sia importante. Alla sua recente riunione annuale, il BISG (Book Industry Study Group), che rappresenta principalmente gli editori di commercio, ha indicato che “sta cercando di attingere da un bacino più ampio includendo, agenti letterari e autori.” È una mossa benvenuta.
Voglio che gli scrittori leggano questo libro, perché può aiutarli a capire cosa stanno facendo gli editori con i loro manoscritti. Gli autori autopubblicati tengono sempre un occhio sulla pubblicazione tradizionale, in parte perché sono, de facto, editori stessi, e quindi la tecnologia AI di interesse per gli editori può essere di interesse anche per loro.
Ma, non sbagliarti, questo non è un manuale pratico per gli autori su come usare l’AI per essere scrittori migliori e più produttivi. Ci sono numerosi libri su quel tema (purtroppo, molti di essi sono solo truffe su Amazon). E molti video su YouTube (di qualità variabile).
Nell’editoria di libri di commercio il mio lettore ideale non è necessariamente un decisore, ma piuttosto una delle tante persone che lavorano nell’industria ogni giorno, creando libri e trovando lettori. Parlerò di tutte le funzioni chiave dell’editoria in questo libro, dall’editoriale alla vendita e distribuzione. E dell’intersezione tra scrittori e lettori.
Anche se sono cresciuto in Canada e ho iniziato la mia carriera editoriale lì, risiedo a San Francisco, negli Stati Uniti, e quindi tendo a pensare all’industria editoriale statunitense. Ma quasi tutto in questo opuscolo dovrebbe essere rilevante per un editore in Madagascar quanto lo è per un editore a Manhattan. Mentre gli editori in paesi più piccoli affrontano sfide di scala, lo fanno anche i piccoli editori in America, e questo libro è destinato a aziende di tutte le dimensioni.
Quando parlo con piccoli editori di AI, e quando parlo con editori molto grandi di AI, la grande differenza che noto è la nozione di ‘impresa’ editoriale. I più grandi editori sono spesso parte di (o adiacenti a) aziende pubbliche, e una volta che sei una società pubblica, le questioni di reputazione e sicurezza diventano molto più rilevanti rispetto a un editore quotidiano, non responsabile allo stesso modo nei confronti degli azionisti e dei media. Mentre un editore presso uno dei principali cinque editori ha lo stesso uso degli strumenti AI di un editore freelance che lavora per organizzazioni più piccole, il contesto in cui usano gli strumenti è piuttosto diverso.
Quanto devi sapere sull’IA per leggere questo libro?
Presumo che il mio pubblico abbia approssimativamente zero conoscenze sui meccanismi interni dell’IA, ma che sia composto da lettori intelligenti. Quindi camminerò su quella linea sottile tra zero conoscenze e non parlare in modo condiscendente al lettore.
Immagino che quasi tutti abbiano sentito parlare della nuova generazione di IA: un sondaggio YouGov, nel marzo 2024, suggerisce che solo il 7% degli americani non sa “assolutamente nulla” sull’IA. Scrittori ed editori hanno quasi certamente sentito parlare di alcune delle controversie sul copyright, ma probabilmente non hanno una chiara comprensione delle questioni. Quindi non devo spiegare che IA sta per “Intelligenza Artificiale”. Ma non presumerò che i lettori possano definire cosa sia l’IA, cosa significhi, il suo impatto potenziale e così via. Ecco perché sei qui.
Accessibilità, sia in generale che nello specifico
Il mio mantra per la pubblicazione di questo libro è ‘accessibilità.’
Per la maggior parte delle persone, questo significa semplicemente qualcosa di simile a ‘disponibilità,’ e, in effetti, intendo rendere questo libro disponibile in quante più forme e formati possibili. Voglio espandere il contenitore. Sto cercando di fare del mio libro una pubblicazione esemplare, mettendo in evidenza la gamma completa di ciò che può essere realizzato oggi quando si pubblica un singolo libro.
Su Leanpub troverai il libro disponibile come file PDF, file EPUB e come pubblicazione web gratuita. Troverai traduzioni in 31 lingue, incluse le principali lingue asiatiche ed europee. Ci saranno più audiolibri nelle lingue principali.
Renderò inoltre il libro disponibile, in formato cartaceo e digitale, su tutte le piattaforme di ecommerce accessibili tramite Ingram e Amazon. Ciò include la maggior parte dei siti di vendita di libri online, in gran parte del mondo. In questo modo anche le biblioteche potranno acquistare il libro, sebbene, comprensibilmente, abbiano poco spazio disponibile per lavori autopubblicati. (Donerò copie stampate e digitali a qualsiasi biblioteca nel mondo che le richieda.)
Oltre alla versione web gratuita del libro completo, creerò estratti gratuiti, un Q&A e infografiche, per coloro che vogliono solo assaggiare o fare una prova. Saranno disponibili tramite il mio blog.
Non ha senso registrare un video dell’intero libro, quando sono disponibili gli audiolibri. Ma alcune persone preferiscono accedere ai contenuti tramite video. Quindi offrirò versioni video ridotte, di diverse lunghezze.
E il tocco umano? Sarò disponibile anche tramite webinar o consulenze online individuali, tramite il mio sito web e blog. Posso persino essere assunto per partecipare di persona!
‘Accessibilità’ significa molto più della sua definizione da dizionario. Come dicono gli amici della Canadian National Network for Equitable Library Service (NNELS) qui, “Un libro accessibile è uno che può essere utilizzato e compreso da tutti.” E così il mio file EPUB in inglese soddisfa la raccomandazione W3C 1.1 per le persone con disabilità visive, inclusi robusti descrizioni di testo alternativo per le immagini. Ci aspettiamo di soddisfare questo standard di accessibilità anche per le traduzioni in lingue straniere.
Il testo alternativo è stato creato con ChatGPT. Non ho modificato la versione di ChatGPT, in modo che chiunque legga l’EPUB possa vedere quanto sia buono e dove manchi ancora. Come mi ricorda il mio collega, Bill Kasdorf, un buon testo alternativo descrive ciò che un lettore vedente ricava da un’immagine, non solo ciò che appare.
Per gli editori di libri, l’accessibilità non è più un’opzione: è un’impostazione predefinita.
(Ho due mea culpa da condividere: a causa delle limitazioni delle piattaforme di pubblicazione, il file PDF predefinito purtroppo non soddisferà le specifiche PDF/UA, né sarò in grado di offrire una versione a caratteri grandi del libro sui siti di ecommerce. Ma entrambi sono disponibili su richiesta.)
Alcune comunicazioni di servizio
Come indicato, questo libro è (relativamente) breve. Quando chiami un documento piuttosto corto ‘un libro’ corri il rischio che gli acquirenti protestino, “Pensavo di comprare un libro, ma è lungo solo 50 pagine!” Ho fatto tutto il possibile per renderlo chiaro nella pagina di vendita che non si tratta di un libro a lunghezza intera, ma se sei deluso, tieni presente che Leanpub offre una garanzia di rimborso di 60 giorni, e io estenderò volentieri quella offerta di rimborso a ‘per sempre.’ Voglio che i lettori siano deliziati, non delusi. (Se hai acquistato il libro su un’altra piattaforma, scrivimi: ti invierò un assegno!)
Il libro è fortemente ipercollegato (questi appaiono in modi diversi in formati diversi, ma spesso come note a piè di pagina). Ho sempre creduto nel collegare alle fonti originali nel mio lavoro, in modo che i lettori possano verificare le mie affermazioni talvolta grandiose. Ma sono consapevole che i collegamenti ipertestuali e le note a piè di pagina possono essere distraenti, in particolare se si utilizza un dispositivo di lettura elettronica. Mi scuso per questo. La cosa migliore è ignorare i collegamenti mentre leggi, e tornare a loro se vuoi approfondire un argomento.
Non so in quale formato stai leggendo (o ascoltando) in questo momento. Né in quale lingua. Ho cercato di rendere l’“ergonomia” del libro il più user-friendly possibile, ma i collegamenti e le note a piè di pagina non sono sempre ottimali da questa prospettiva.
Questo libro ha sponsor, cosa che so essere insolita per ‘un libro’. Spiego come funziona la sponsorizzazione nella mia sezione ‘disclosures’ alla fine del testo.
Perché l’IA ora?
Quando parlo con gli editori sento preoccupazioni urgenti e immediate. E l’IA di solito non è una di queste. |
L’aumento dei costi di produzione della stampa è stato fastidioso per diversi anni, anche se ora sembra stabilizzarsi. I costi di distribuzione aumentati sono una sfida per tutti i giocatori. Questi portano a pressioni sui prezzi—ci sono prove che i lettori stanno iniziando a irritarsi per i prezzi attuali dei nuovi copertine rigide e tascabili commerciali. Classifico questi come problemi ‘analogici’—le tecnologie digitali portano poco sul tavolo per affrontarli.
Poi ci sono i problemi più ampi ‘esistenziali’ che sono di crescente preoccupazione, ma sono questioni incerte, senza soluzioni evidenti. Inclusi qui sono:
Scoperta dei contenuti e coinvolgimento del pubblico tramite online e social media.
Cambiamento del comportamento dei consumatori e delle abitudini di lettura.
Competizione da altri media digitali.
Credo che l’IA potrebbe essere tremendamente utile agli editori in queste aree, ma i metodi non sono ovvi e richiederanno tempo per essere implementati. Descriverò questo nei capitoli successivi del libro.
IA: Come iniziare
Prima di entrare nel noioso background tecnico, ti invito a saltare subito nel software online. Gli strumenti principali sono gratuiti da provare. C’è ChatGPT. E Claude.ai. Puoi dilettarti con Microsoft Copilot. O provare Gemini di Google.
È così che la maggior parte delle persone inizia con l’IA—scommetto che hai già provato uno o più di questi giocattoli. Scommetto anche che non li hai provati per molto tempo. La maggior parte delle persone con cui parlo dedica solo pochi minuti. Provano alcune domande, ricevono risposte piuttosto ovvie e passano oltre.
Approccio sbagliato.
Sto dalla parte di Ethan Mollick, il cui lavoro descriverò alcune volte in questo libro. Nel suo blog e in una recente intervista, Mollick parla della sua ‘regola delle 10 ore’:
“Voglio indicare che 10 ore sono arbitrarie quanto 10.000 passi. Non c’è una base scientifica per questo. Questa è un’osservazione. Ma ti porta anche oltre, ho dato un’occhiata a questo per una serata, e ti porta a usarlo in modo serio. Non so se 10 ore sono il limite reale, ma sembra essere in qualche modo trasformativo. La chiave è usarlo in un’area in cui hai competenza, così puoi capire a cosa è buono o cattivo, puoi imparare la forma delle sue capacità.”
Un altro commentatore, recensendo il recente libro di Mollick sull’IA, ha sottolineato una ‘regola del dieci’ altrettanto vera: “Un’ora di sperimentazione con questi strumenti vale dieci ore di lettura su di essi.”
Hai capito l’idea. Questo riguarda il fare, non il riflettere. Il mio libro è una riflessione. Devi sporcarti le mani.
IA: Una storia molto breve
Fino a un paio di anni fa, la persona media sentiva parlare dell’IA solo come un’astrazione, o come fantascienza o come qualcosa che poteva battere un grande maestro a scacchi o Go. Improvvisamente l’IA è ovunque, creando l’impressione falsa che sia nuova. Anche le cose nuove non sono esattamente nuove. Ma questo è un punto controverso. L’IA significava poco per l’editoria libraria prima di ChatGPT. Ora significa molto. |
Comprendere lo sviluppo di circa 70 anni dell’IA può essere affascinante, ma non è affatto necessario per apprezzare ciò che sta accadendo oggi.
Our World In Data fa un buon lavoro nel registrare brevemente la storia—lascerò a loro questo compito.
La generazione attuale di IA è stata sviluppata principalmente nell’ultimo decennio. Poi, improvvisamente, ChatGPT è apparso il 30 novembre 2022. Due mesi dopo aveva 100 milioni di utenti mensili, il più rapido ingresso nel mercato dei consumatori mai visto per una tecnologia (per confronto, Facebook ha impiegato più di due anni per raggiungere 100 milioni di utenti).
Perché questa rapida adozione? Primo, è affascinante e divertente. Secondo, è gratuito. Terzo, non è necessario acquistare un nuovo dispositivo per usarlo. E quarto, non è necessaria alcuna formazione per accedere a ChatGPT (o ai suoi concorrenti di Chat AI). Ma quegli stessi fattori si applicavano anche a Facebook, quindi perché ChatGPT?
Come ha notato famosamente Arthur C. Clarke, “Qualsiasi tecnologia sufficientemente avanzata è indistinguibile dalla magia.” Chat AI è magia. L’esperienza di ‘parlare’ in linguaggio quotidiano con una macchina… è magico. L’esperienza di dire “Voglio un’immagine di un libro in un pallone in una nuvola vicino al sole,” e, pochi secondi dopo,
… anche questo è magico. Le immagini generate da GPT iniziano a sembrare simili nello stile, colorate e fantasiose. Così ho inviato un secondo prompt “ora in uno stile che sembri un’illustrazione del XV secolo.” Ed ecco:
Se voglio un video di un libro in un pallone in una nuvola vicino al sole, ci sono oltre una dozzina di strumenti tra cui scegliere, e voilà. E una colonna sonora musicale da abbinare al video. Bene, come suona? È proprio come magia.
Per paura di sembrare sprezzante delle straordinarie capacità dell’IA relegandola alla categoria dell’ “magia” indecifrabile, è divertente sapere che molti degli scienziati responsabili della generazione attuale di IA ammettono di non comprendere esattamente come funziona. Come ha notato un rapporto in un numero recente di MIT Technology Review, “nonostante il suo enorme successo, nessuno sa esattamente come—-o perché—-funzioni.” Eccitante, ma un po’ spaventoso.
Comprendere l’IA e Alcuni Termini Chiave
L’IA viene fornita con una miriade di tecnologie e terminologie, molte delle quali incomprensibili a tutti tranne che agli scienziati dei dati. Gli utenti di Chat AI non necessitano di una conoscenza approfondita della terminologia dell’IA né dei concetti tecnici coinvolti. La natura conversazionale del sistema consente interazioni intuitive senza una conoscenza specialistica di come funzionano le cose. Concentrarsi su ciò che Chat AI può effettivamente fare è più importante. |
Nel preparare questo libro ho lottato con ciò che è ‘responsabile’ per me fare come autore di un libro sull’IA. L’approccio convenzionale è fornire una breve spiegazione della scienza e una revisione dei termini frequentemente usati.
Non lo farò.
Offrirò qui alcuni link esterni a quelle che penso siano alcune descrizioni brevi e ragionevolmente comprensibili dei fondamenti dell’IA.
Qual è il futuro dell’IA?: McKinsey & Co. (aprile 2024) ha una buona serie di spiegazioni.
Allo stesso modo, IA Generativa di Gartner (senza data) non è male.
Futurepedia offre un riassunto non male di Fondamenti di IA (maggio 2024)
Essendomi liberato del come-fare, ora introdurrò alcuni termini che penso sia utile comprendere. Non perché necessiti di conoscerli per usare il software. Solo che questo set di termini fa riferimento ad alcuni aspetti chiave di come funziona effettivamente la generazione attuale di IA.
Il mio caso d’uso per affrontare questi termini e concetti è per autori ed editori che (i) vogliono approfondire l’IA, per qualsiasi motivo, o (ii) vogliono comprendere il contesto delle critiche attuali all’IA, o (iii) vogliono contribuire alle discussioni strategiche su come i loro colleghi o organizzazioni dovrebbero approcciare l’IA.
In altre parole, non è ciò che devi sapere, ma piuttosto ciò che potresti voler sapere. Eccoli, in ordine non alfabetico:
Prompt e Prompting
Puoi aprire un software di Chat AI e semplicemente digitare una domanda, proprio come fai attualmente su Google.
Modello Linguistico di Grandi Dimensioni (LLM)
I Modelli Linguistici di Grandi Dimensioni funzionano analizzando enormi quantità di materiale (principalmente) scritto, permettendo loro di prevedere quali parole o frasi dovrebbero seguire in una conversazione o in un pezzo di scrittura. Non ‘comprendono’ il linguaggio nel senso umano, ma elaborano il testo scomponendolo in pezzi più piccoli (chiamati token), e poi convertendo i token in numeri. Elaborano il testo come numeri, rigurgitando altri numeri, che poi vengono riconvertiti in testo in output. Questa è una spiegazione eccessivamente semplificata del perché Chat AI non ‘contiene’ opere protette da copyright: è costruito con numeri che rappresentano una vasta astrazione dai testi sottostanti.
Gli LLM sono addestrati su come il linguaggio è tipicamente usato e poi generano risposte basate su questa comprensione. Tendiamo a sottovalutare quanto sia prevedibile la maggior parte del linguaggio. Chat AI può generare testi che sono (a volte sorprendentemente) simili alla letteratura esistente, ma, per progetto, non ha la capacità di recuperare estratti specifici o copie di testi protetti da copyright. (Lo so, molti di voi hanno sentito parlare della causa del New York Times contro OpenAI—il Times è riuscito a far rigurgitare a ChatGPT alcune porzioni di articoli precedentemente pubblicati alla lettera).
Intelligenza Artificiale Generativa
La cosa più importante da capire di questo termine è la parte “generativa”. L’Intelligenza Artificiale Generativa genera nuovo testo.
Trasformatore Generativo Pre-addestrato (GPT)
Questo, il termine più nerd della terminologia qui, descrive un tipo specifico di LLM sviluppato da OpenAI. “Generativo” indica la sua capacità di creare testo, “pre-addestrato” significa che è stato addestrato su un ampio corpo di dati testuali, e “trasformatore” si riferisce al software che utilizza. Sapere cosa significa GPT è utile solo per capire cosa rappresenta il GPT in ChatGPT.
ChatGPT
ChatGPT è il software che vedi; GPT è ciò che sta dietro al software. Gli utenti sperimentano ChatGPT, non il GPT dietro di esso. Come notato sopra, ChatGPT è solo uno dei diversi sistemi software di Chat AI online, con funzionalità simili.
Un altro termine che incontrerai frequentemente e che è sconosciuto a molti è:
Corpus
La definizione del dizionario di corpus è “una raccolta di testi scritti” (anche se, in realtà, non è sempre testo). Il termine è usato in riferimento a ciò su cui sono addestrati i GPT: vasti corpora di (principalmente) testo. Ci viene detto che i più grandi corpora contengono centinaia di miliardi di parole. Per i comuni mortali è impossibile da comprendere. Non pensi che Wikipedia sia enorme, contenente un vasto numero di parole? Bene, ci sono solo 4,5 miliardi di parole in Wikipedia—GPT-4 è stato addestrato su ben oltre un trilione.
Penso che sia importante considerare questa scala. Gli autori, comprensibilmente, sono preoccupati che le 75.000 parole, più o meno, nel loro libro possano essere state aspirate in un modello linguistico di grandi dimensioni. Forse lo sono state (più avanti). Ma assumendo che sia così, considera quanto poco valore ha qualsiasi singolo libro per la potenza totale dei modelli linguistici di oggi. È veramente insignificante. Oltre l’insignificante. Anche 10.000 libri sono una sciocchezza.
Software AI: I Pesi Massimi del Sistema
Ho elencato sopra i quattro pesi massimi della Chat AI: ChatGPT, Claude.ai, Microsoft Copilot e Google Gemini. |
Ognuno di essi funziona più o meno allo stesso modo e fornisce risultati simili. Quindi quale è il migliore? Questa domanda ti porta in un vicolo cieco. È un po’ come chiedere quale città offre la migliore vacanza in spiaggia, o quale SUV è il migliore per le famiglie. C’è una enorme quantità di sfumature nelle questioni e un vasto numero di orgoglio e pregiudizio che filtrano le nostre risposte.
Così anche con questo software apparentemente semplice ma enormemente complesso. Le persone sostengono che Claude ha competenze più sfumate con il linguaggio, e che ChatGPT è migliore con il codice software. Microsoft Copilot si integra con la suite software di Microsoft. Google Gemini può collegarsi a Gmail, Google Maps e YouTube. Alcune delle differenze sono significative; molte sono lievi. E stanno cambiando costantemente con ogni nuova versione del software.
‘Il migliore’ software non sarà deciso per qualche tempo. Se sperimenti abbastanza degli strumenti disponibili, ti stabilirai su alcuni preferiti. |
Ci sono due livelli superiori di software AI. Il primo è quello che potrebbe essere chiamato il software fondamentale, software come ChatGPT e i suoi concorrenti (Chat AI). È così che la maggior parte delle persone sperimenta l’AI oggi.
Il livello successivo comprende tutto il software che fornisce essenzialmente una finestra sul software di base. I nuovi arrivati al chat AI non avranno probabilmente incontrato questo software, anche se non è raro o oscuro. Alcuni sono familiari con Jasper (software di marketing) o Perplexity (ricerca). Questo software semplicemente non esisterebbe senza ChatGPT e i suoi simili.
Tieni presente che il software mainstream di Adobe, Microsoft, Grammarly, Zoom, ecc., ora incorpora strumenti di IA, ma questo è diverso dal software costruito da zero basato su interfacce chatbot. (Altri come Otter (trascrizioni) precedono ChatGPT ma ora sono dotati di tecnologia di modelli linguistici avanzati.)
Di seguito esamineremo il software specifico per la pubblicazione che capitalizza sulle abilità dell’IA generativa.
Paradigmi del Software
Tanto tempo fa, il software era codice e solo gli ingegneri capivano come funzionava. Ciò che ha fatto sì che i computer personali avessero successo, oltre al loro costo relativamente basso, era il software che era (relativamente) facile da usare. Non ci pensiamo molto; ci circonda semplicemente.
Ma considera, per un momento, Microsoft Word, un programma che posso tranquillamente assumere è utilizzato dal 99% dei lettori di questo libro. Ci vogliono circa 10 minuti per mostrare a qualcuno come scrivere un paragrafo di testo in Word. Poi puoi mostrargli come creare testo in grassetto, corsivo e come cambiare il carattere di base, magari da Calibri a Arial o Times Roman. Poi, come salvare il file e stampare il file. Come cercare e sostituire.
E poi li lasci soli.
Anni dopo scopri che stanno ancora formattando i loro paragrafi in Word con spazi e tabulazioni. E ancora dimenticano di salvare i loro file, o si confondono su quale versione hanno salvato, a volte dovendo ricreare il testo da zero. Ma “sanno come usare Word.”
Word ha centinaia di funzionalità, ma un terzo delle volte gli utenti utilizzano solo 5 comandi: Incolla, Salva, Copia, Annulla e Grassetto. Ci vogliono diverse settimane di formazione per apprendere correttamente le funzionalità avanzate di Word; funzionalità che potrebbero aiutare un editore a risparmiare molte centinaia di ore di tempo. Ma la maggior parte non lo fa mai. Uso Word dal 1985, quasi quarant’anni, e non ho mai seguito un corso. Non so nemmeno cosa non so su come estrarre tutta la potenza dal software.
Insisto su questo perché è un modo utile per comprendere perché il software di IA è così diverso da qualsiasi software con cui tu abbia mai lavorato. Non viene fornito con un manuale, nemmeno una guida rapida. Viene fornito con uno schermo vuoto e una domanda: “Come posso aiutarti?”
Non c’è una barra dei menu, nessun pulsante da premere, nessuna scorciatoia da tastiera. Fai una domanda, inizi una chat e ottieni alcune risposte.
La risposta di Claude:
“Ci sono diverse differenze fondamentali tra lavorare con AI conversazionale moderna come me rispetto agli strumenti tradizionali come Microsoft Word o Excel:
“1. Interazione in linguaggio naturale: Con l’AI conversazionale, puoi comunicare le tue intenzioni usando il linguaggio quotidiano piuttosto che dover imparare e navigare tra menu complessi e funzioni. Spieghi semplicemente cosa vuoi ottenere in modo conversazionale.
“2. Comprensione contestuale: Gli assistenti AI mantengono il contesto e comprendono il flusso della conversazione, permettendo un dialogo più naturale. Il software tradizionale non ha consapevolezza contestuale da un comando all’altro.
“3. Adattabilità: L’AI può adattarsi dinamicamente e rispondere a una vasta gamma di richieste, mentre gli strumenti tradizionali sono limitati a un insieme predefinito di funzioni. Un assistente AI può aiutare con scrittura, analisi, matematica, codifica, ideazione e altro ancora all’interno di un’unica interfaccia.”
Questo era utile, ma volevo qualcosa di più facile da comprendere. Quindi ho chiesto:
Claude:
“Ecco un modo semplice per spiegare la differenza a qualcuno senza un background tecnico:
“Pensa al software tradizionale come Microsoft Word o Excel come a uno strumento, come un martello o una calcolatrice. Ha un insieme fisso di funzioni che può eseguire, e devi imparare come usarle correttamente per ottenere il risultato che desideri.
“D’altra parte, pensa all’IA conversazionale moderna come a un assistente intelligente, come un collega o un amico esperto. Puoi semplicemente parlarci usando l’inglese comune, e capisce cosa stai cercando di fare. Può aiutarti con tutti i tipi di compiti, dalla scrittura alla matematica fino ad arrivare a trovare idee.
“Non devi imparare comandi o tecniche speciali—basta chattare con esso naturalmente. Si adatta alle tue esigenze e ricorda il contesto della tua conversazione. Col tempo, arriva a conoscerti e a sapere le tue preferenze.
“Quindi, mentre il software tradizionale è come uno strumento statico che usi, l’IA conversazionale è più come un partner intelligente con cui interagisci naturalmente per portare a termine le cose. È un modo più flessibile, personalizzato ed efficiente di lavorare.”
Hmm. Non è proprio quello che volevo. Così ho continuato la conversazione:
Claude:
“Certo, lascia che ci provi di nuovo senza usare termini tecnici:
“Immagina di parlare con un amico che è davvero esperto e desideroso di aiutarti. Puoi semplicemente parlarne in inglese comune su cosa stai cercando di fare, che sia scrivere un saggio, risolvere un problema di matematica o fare brainstorming per un progetto.
“Invece di dover imparare e ricordare una serie di passaggi o comandi specifici, puoi semplicemente spiegare ciò di cui hai bisogno con le tue parole. Il tuo amico capisce il contesto e adatta il suo aiuto in base a ciò di cui hai già discusso.
“È una conversazione a due vie, dove puoi fare domande, chiarire le cose e ottenere consigli. E più parli con questo amico, meglio capisce le tue esigenze uniche e il tuo stile di comunicazione.
“Ora, immagina se potessi avere lo stesso tipo di interazione utile e facile, ma con un programma per computer. Questa è l’idea di base dietro i nuovi tipi di software di cui potresti aver sentito parlare.
“Invece dello stile vecchio del software, dove hai un insieme rigido di funzioni e devi imparare il modo giusto per usarlo, questo nuovo software è più come un amico esperto. Puoi semplicemente parlarci in modo conversazionale e capisce come aiutarti in base al flusso naturale della tua discussione.
“Quindi è un modo più intelligente, personalizzato e semplice per ottenere aiuto con tutti i tipi di compiti sul tuo computer, semplicemente parlando come faresti con una persona. Questa è la differenza chiave rispetto allo stile più rigido del software di una volta.”
Riepilogo: stavo cercando di fare due cose con questi esempi. Uno era offrire un esempio molto semplice del perché il software chatbot è così diverso da qualsiasi software che abbiamo mai utilizzato. E l’altro era illustrare come una singola chat possa evolversi. Non è solo una domanda e una risposta singola. È una conversazione. Questa è una grande parte dell’innovazione.
Le IA di chat sono una sorta di combinazione tra un tirocinante e un consulente esperto. Non puoi presumere che sappiano cosa intendi. Devi spiegare cosa vuoi, perché lo vuoi e come possono essere più utili.
Tre tipi di software IA
In termini generali, ci sono tre tipi di software IA disponibili oggi. Il primo è costituito dalle piattaforme IA fondamentali, come ChatGPT, la tecnologia IA di base. Il secondo è, chiamiamolo così, componenti aggiuntivi IA, software che è stato costruito di recente sopra le piattaforme di base. Non avrai sentito parlare di molti di questi, strumenti come Jasper o Rewind. |
La mia terza categoria è il software che presenta strumenti IA aggiunti al prodotto esistente. Ad esempio, la suite di software di Microsoft presenta nuovi strumenti IA in Word, Excel e PowerPoint. Adobe ha aggiunto tecnologia IA a Photoshop e Acrobat. Grammarly è stato ricostruito attorno alla nuova generazione di tecnologia basata su LLM. È per lo più lo stesso prodotto, ma con IA aggiunta.
Sta diventando chiaro che quasi tutto il software che usi oggi presto incorporerà funzioni IA. Dovrai fare la tua valutazione personale se quegli strumenti siano davvero utili o solo una decorazione IA.
Sono più interessato ai nuovi strumenti, costruiti da zero per fornire il valore che solo l’IA può generare. Questa è la prossima generazione di software.
Lavorare con il Software IA
Sono un tipo da Windows, purtroppo (è una lunga storia il perché), e quindi parlo delle mie esperienze di accesso al software IA tramite un computer Windows, non un Mac. Poiché tutto il software qui è basato su browser, non dovrebbe esserci differenza nell’usare questi strumenti su un Mac. Ma non offro garanzie.
Avrai bisogno di un po’ di soldi per giocare al gioco dell’IA, ma non una fortuna. Come descritto sopra, gran parte del software di base può essere accessibile tramite versioni gratuite. Ma di solito vorrai una descrizione a pagamento mentre lo testi, e l’abbonamento dovrebbe costare circa 20 dollari al mese. Annulla dopo averlo provato (non dimenticare!). Se vedi qualcosa che costa 79 dollari al mese o, Dio non voglia, 159 dollari al mese, puoi ignorarlo. Non stanno pensando a te come potenziale utente; stanno pensando a grandi utenti aziendali mainstream.
Formazione per Chat AI
L’IA di oggi è ingannevolmente semplice. Chiunque sappia digitare una domanda può usarla. Ma usarla bene è complicato, il che non ha senso apparente, fino a quando non si approfondiscono le complessità relative ai “prompt” e ai concetti correlati. |
Per accedere alla sua intelligenza, a volte devi parlarci come se fosse un idiota. O forse un idiot savant. È un po’ come il personaggio interpretato da Dustin Hoffman in Rain Man.
Chiunque può usare ChatGPT. Basta andare su chat.openai.com e puoi accedere all’ultima versione, GPT-4o, gratuitamente (ci sono alcune funzionalità premium disponibili per un extra di $20 al mese).
Quando vai su ChatGPT trovi essenzialmente uno schermo vuoto e la domanda implicita “Come posso aiutarti oggi?”
Puoi fargli delle domande. Ancora meglio, puoi caricare un grande PDF e fare domande sul file. Puoi anche caricare immagini, che può descrivere, o una pagina scansionata: può riconoscere il testo, anche se scritto a mano.
Ciò che è emerso come un problema chiave per l’uso efficace di Chat AI è imparare a ‘parlare’ con esso (cosa che puoi letteralmente fare nell’ultima versione dell’app mobile). In Chat AI-ese si chiama creare “prompt” o “fare richieste.” Gli utenti hanno scoperto che più i loro prompt sono precisi e dettagliati, migliori sono le risposte che ricevono da ChatGPT. Inoltre, i prompt non sono solo una tantum. Chat AI può continuare una conversazione per un bel po’ (anche se non indefinitamente), e se non ottieni la risposta che stai cercando, puoi rivedere e affinare i tuoi prompt. Questo richiede un po’ di tempo per abituarsi, e ha generato una serie di guide, scritte e online, per addestrare gli utenti su come ottenere il massimo dai prompt.
Prova a chiedere a qualsiasi software di Chat AI di spiegare un concetto come l’editing dello sviluppo. Poi chiedigli di creare una spiegazione che un dodicenne possa comprendere. I risultati sono drasticamente diversi. Divertentemente, Chat AI sembra anche rispondere alle suppliche emotive. Aggiungere “questo è molto importante per la mia carriera” a un prompt può ottenere risposte più utili.
(Questo è un buon momento per aggiungere una parentesi: È sia rassicurante che profondamente inquietante che i migliori scienziati che lavorano sull’IA basata sul linguaggio non siano in grado di spiegare perché si verificano cose del genere.)
Come creare prompt
“Creare prompt” è una competenza specifica essenziale per usare Chat AI in modo efficace. |
Della variegata terminologia adottata durante la corsa all’oro dell’IA, “prompt” e “fare richieste” sono tra le migliori. Non parli davvero con una Chat AI. Non le fai domande (o meglio, non dovresti—non è così che funziona). Fai richieste a questi motori per ottenere risposte, non semplici risposte.
All’inizio pensavo che un’analogia potesse essere i prompt teatrali. Il suggeritore stimola un attore che perde il filo di una battuta, facendolo tornare in azione. Ma questo non è accurato perché un prompt di IA non sblocca un pezzo di testo memorizzato—non è così che funziona l’IA generativa. Dai a un motore di IA un singolo prompt ripetutamente, e le risposte saranno sempre almeno un po’ diverse.
Proprio ora ho chiesto a ChatGPT di “elencare gli elementi chiave di un prompt efficace.” Ho chiesto una seconda volta e le risposte erano tematicamente coerenti, ma piuttosto diverse nei dettagli. Gli argomenti evidenziati includevano:
Essere specifici
Evitare ambiguità
Fornire contesto
Usare istruzioni chiare
In un certo senso è piuttosto strano: l’IA ha una buona padronanza del linguaggio—non dovrebbe avere un’idea di cosa intendi senza prompt pedanti? Ma è proprio quella padronanza del linguaggio che rende i prompt più potenti. Digli esattamente cosa intendi, non approssimativamente.
Parlagli come l’assistente disponibile, il consulente esperto, che vuoi che sia, non come un ragazzo per strada.
La conclusione qui è che, almeno per il momento, l’uso efficace degli strumenti di IA basati su LLM richiede almeno una conoscenza delle migliori pratiche di creazione dei prompt. Una padronanza dei prompt sarà opportunamente ricompensata.
Allucinazioni: Una Mosca nel Latte
L’IA, basata su modelli linguistici di grandi dimensioni, inventa cose. Lo fa e basta. Questo è generalmente chiamato “allucinazioni.” È un vero problema, un problema serio. Devi capire le allucinazioni se intendi lavorare con l’IA. |
Il termine dell’anno 2023 del Cambridge Dictionary è stato “Hallucinate” (allucinare), la cui definizione è stata ampliata per includere “Quando un’intelligenza artificiale… allucina, produce informazioni false.” (Altre aggiunte al dizionario del 2023 includono “prompt engineering,” “large language model,” e “GenAI.”)
Le allucinazioni dell’IA, nota Cambridge, “a volte sembrano senza senso. Ma possono anche sembrare del tutto plausibili, pur essendo fattualmente inaccurate o ultimamente illogiche.” Questo, purtroppo, è molto vero e, a partire da luglio 2024, rimane una limitazione drammatica per l’uso dell’IA generativa per compiti critici. È una delle varie grandi stranezze dell’IA, e ci vuole un po’ di tempo perché le persone se ne rendano conto. Ricorda, l’IA generativa è per lo più un motore di previsione delle parole successive, non un database di fatti. Da qui la necessità di HITL, Humans-In-The-Loop, come siamo ora conosciuti, per controllare doppiamente l’output dell’IA. Ed è notevole che possiamo ottenere un valore così straordinario da una tecnologia che può produrre output dimostrabilmente inaccurato. Così va la vita.
Gary Marcus, un critico esperto e ben informato sull’IA, paragona le allucinazioni dell’IA agli orologi rotti, che sono giusti due volte al giorno. “A volte è giusto,” dice, “ma non sai quale parte del tempo, e questo ne riduce notevolmente il valore.”
Ethan Mollick, relatore principale alla conferenza di Publishers Weekly nel settembre 2023, nota che le persone che usano l’IA si aspettano il 100% di precisione. Le allucinazioni, dice, sono simili ai “tassi di errore umani” che tolleriamo quotidianamente.
Andrej Karpathy, un noto scienziato specializzato in IA, che attualmente lavora a OpenAI, scrive delle allucinazioni:
“Faccio sempre fatica quando mi chiedono del ‘problema dell’allucinazione’ negli LLM. Perché, in un certo senso, l’allucinazione è tutto ciò che fanno gli LLM. Sono macchine da sogno.
“Dirigiamo i loro sogni con i prompt. I prompt iniziano il sogno e, basandosi sulla vaga memoria degli LLM dei loro documenti di addestramento, la maggior parte delle volte il risultato va da qualche parte utile.
“È solo quando i sogni entrano in un territorio considerato fattualmente scorretto che lo etichettiamo come ‘allucinazione.’ Sembra un bug, ma è solo l’LLM che fa ciò che fa sempre.”
Non è solo il problema di inventare cose. L’IA di chat è un software profondamente difettoso.
Per molte query, particolarmente da parte di principianti, le risposte sono banali, fuori bersaglio o semplicemente non utili. L’IA di chat ha difficoltà a contare: chiedile un post di blog di 500 parole e sarai fortunato a ottenere 150.
E ciascuna delle aziende di IA, per ridurre i bias e per evitare di rispondere a domande su “come costruire una bomba,” ha eretto strette barriere di risposta attorno ai loro prodotti: troppo spesso, la risposta a una domanda è, essenzialmente, “No, non risponderò.” Ho chiesto a Google Gemini di rivedere una bozza di questo testo e mi è stato avvertito che “è essenziale ottenere l’approvazione dell’autore prima di pubblicare.”
Verifica dei fatti
Sostengo, per lo più a orecchie sorde, che le allucinazioni sono un problema tecnologico, che troverà una soluzione tecnologica. Sì, sono endemiche degli LLM, ma possono essere aggirate. |
Considera questo: ho chiesto a quattro IA di chat di verificare i seguenti affermazioni:
A partire dal 2024, ci sono 6 grandi editori multinazionali con sede a New York City. Sono conosciuti come i Big 6.
Gli ebook continuano a dominare le vendite di libri negli Stati Uniti.
Borders e Barnes & Noble sono le due più grandi catene di librerie negli Stati Uniti.
Dopo un calo delle vendite durante il Covid, le vendite di libri negli Stati Uniti stanno di nuovo crescendo a doppia cifra.
Tutti hanno individuato gli errori nelle prime tre affermazioni. Ciascuno di loro è diventato un po’ confuso sulla quarta, incerto sull’entità del rimbalzo delle vendite durante il Covid e sui successivi modelli di vendita. È un esperimento piccolo e non rappresentativo, ma queste IA di chat, che non sono pensate per essere basate sui fatti, possono fare un lavoro credibile nell’assessare fatti che la maggior parte degli osservatori casuali perderebbe.
E per quanto riguarda immagini e video?
Poiché l’editoria di libri commerciali dipende più dal testo che dalle immagini, gli editori tendono a trascurare gli strumenti innovativi basati sull’IA per immagini e video. |
Sono rilevanti per la comprensione della rivoluzione dell’IA da parte di chiunque. Ma la discussione è troppo ampia per lo spazio disponibile: semplicemente non le renderei giustizia.
Raccomandato per autori ed editori: giocate con le funzionalità di generazione di immagini in ChatGPT: sono gratuite e divertenti da usare. Poi fate una ricerca sotto “video e IA” e meravigliatevi di alcuni degli esempi che troverete nei siti linkati. Anche se lo strumento non è ancora disponibile al pubblico, Sora di OpenAI fornisce alcuni esempi sorprendenti di video generati solo da prompt di testo.
Software per editori di libri
Esiste poco software AI costruito da zero specificamente per editori di libri (anche se ce n’è molto disponibile per gli autori).
Gli editori accademici hanno più opzioni, con una varietà di strumenti AI per la ricerca, la scrittura e la pubblicazione.
Per gli editori di narrativa, la maggior parte delle opzioni riguarda l’AI e l’audio. Al di fuori dell’audio, le scelte si stanno concentrando su strumenti di editing e marketing. Ci sono anche diversi strumenti di rilevamento dei contenuti AI e strumenti e servizi di concessione di licenze di contenuti.
Il software di editing è rivolto agli autori, non agli editori professionisti — ci sono molti più autori che editori, e la qualità richiesta dagli editori professionisti è molto più onerosa rispetto a quella per gli autori (per lo più auto-pubblicati).
Gli strumenti di marketing allo stesso modo mirano più ampiamente non solo agli editori di libri, ma ai marketer ovunque, con strumenti per contenuti web, generazione di testi e SEO. Jasper.ai è un leader in questa categoria e afferma di avere HarperCollins come cliente.
Shimmr, uno sponsor di questo libro, è uno strumento di creazione di annunci alimentato dall’AI specificamente per editori di libri. L’azienda e il suo fondatore, Nadim Sadek, sono stati profilati in un articolo di maggio 2024 in Publishers Weekly.
“Quello che facciamo è usare l’AI per considerare il profilo psicologico di un libro e abbinarlo al quadro mentale di un pubblico specifico, garantendo una connessione più efficace tra lettori e libri,” ha detto Sadek a PW. “Lo chiamiamo ‘DNA del libro,’ e implica non solo conoscere i personaggi e la trama di un libro, ma anche i valori, gli interessi e le emozioni del libro.”
Richiamando il DNA del libro, gli strumenti AI di Shimmr creano quindi annunci mirati per i canali di ricerca e social media (attualmente Google e Meta). Gli annunci prendono la forma di annunci display, con immagini generate dall’AI accompagnate da slogan.
Segnalo agli editori che valutano Shimmr che può fornire entrate incrementali, che è ciò che ci aspettiamo che un nuovo strumento di pubblicità/marketing porti in tavola.
Se vuoi sperimentare un altro strumento software “solo con AI,” dai un’occhiata a Hypnovels, che anima capitoli in libri di narrativa. “Narrazione, immagine e movimento, tutti generati dall’AI, si uniscono a una grande narrazione in un modo meno letterale rispetto all’animazione tradizionale (da qui il “hypno”) e più coinvolgente sensorialmente rispetto a un audiolibro, in uno stile che rende il capitolo unico e avvincente.”
Un altro nuovo fornitore nato dall’opportunità con l’AI è Veristage (anche uno sponsor di questo libro). Veristage offre Insight, il suo “Assistente di Pubblicazione AI,” un front-end specifico per compiti attraverso molteplici funzioni di pubblicazione.
Il viaggio di Insight inizia con il manoscritto. Caricare una versione iniziale sblocca una gamma di strumenti, alcuni più preziosi per l’editoria, altri per il marketing. Dopo aver lavorato con tutte le funzionalità, puoi scaricare un rapporto PDF che include aspetti editoriali, come tono di scrittura, tropi, cliché e uso di avverbi e aggettivi, e poi contenuti di marketing, come descrizioni, metadata, punti di vendita unici, comparazioni, contenuti ottimizzati per Amazon e suggerimenti di post sui social media.
Quello che mi piace di più di Insight è che adotta un approccio olistico all’applicazione dell’AI al processo di pubblicazione, piuttosto che dover raccogliere più strumenti software, ciascuno per una funzione diversa.
Voglio anche evidenziare qui la mia piattaforma di pubblicazione, Leanpub. Sono stati fantastici con cui lavorare. Piccolo è bello: prendono rischi con tecnologia e servizi che le aziende più grandi eviterebbero. Di grande interesse per autori e piccoli editori è il loro nuovo servizio TranslateWord, dove puoi tradurre un libro scritto in Microsoft Word in fino a 31 lingue, tramite l’API GPT-4o (che alimenta ChatGPT). Questo è ciò che sto usando per tradurre questo libro.
Ho cercato altrove di trovare un servizio per la traduzione di libri. Ci sono tonnellate di aziende di traduzione, alcune delle quali impiegano AI. L’unica che ho trovato che offre la traduzione di libri è DeepL. Ma non è un focus per l’azienda. In questo momento Leanpub è il posto giusto.
Software aziendale per la pubblicazione di libri
I fornitori di sistemi aziendali esistenti che servono l’industria editoriale stanno iniziando a stratificare le tecnologie AI, come abbiamo visto nelle aziende a scala enterprise, come Salesforce e Oracle. |
Ho parlato con diversi fornitori di software di sistemi editoriali, inclusi Firebrand, e tutti stanno guardando alle opportunità, ma procedono con cautela.
Non vedo l’ora di avere l’opportunità di parlare di AI con un gruppo eterogeneo di partecipanti al Firebrand’s Publishing Innovation Forum a settembre 2024 a Nashville, TN.
knk ha condotto due webinar sull’IA e ha rilasciato un whitepaper, ma (a partire dal 26 giugno 2024) non ha ancora annunciato funzionalità di IA nei suoi prodotti.
Virtusales ha recentemente lanciato il suo primo set di strumenti abilitati all’IA, tra cui il tagging delle immagini, la generazione di testo alternativo, strumenti di copia e modifica, generazione di testi di vendita e marketing, e traduzioni di quei testi.
Ho parlato con Klopotek sul suo Klopotek Publishing Radio. Hanno “avviato un’iniziativa di IA nell’area dei Servizi Clienti,” anche se non sono disponibili dettagli.
Supadu, che offre ai publisher “soluzioni di progettazione web, e-commerce e dati”, ora presenta “Supadu Smart AI,” (pdf) con “recensione video del titolo guidata da avatar con Smart Buy”, “materiale promozionale video guidato da avatar per i team di marketing e vendite”, e “facile traduzione multilingue di video di autori e titoli.”
Software di IA per editori di libri: le startup
Alcune persone sono familiari con il lavoro che ho fatto riguardo alle startup basate sulla tecnologia per l’editoria di libri. C’è un rapporto in Publishers Weekly che descrive il lavoro, e link al database.
Come vedrai nel rapporto, guardo abbastanza ampiamente alle startup in tutto lo spettro dell’editoria di libri. Non includo nuove case editrici, a meno che non facciano qualcosa di insolito con la tecnologia. Il criterio di base è: usi la tecnologia per cercare di rinvigorire qualche aspetto del processo di pubblicazione di libri? Ho oltre 1.600 aziende nel database, la maggior parte lanciate dopo che Amazon ha rilasciato il primo Kindle nel 2007.
Dopo aver ottenuto una visione d’insieme del database, puoi iniziare a immergerti più a fondo. Nella scheda all’estrema destra vedrai un modo per ordinare solo per le startup legate all’IA.
Come puoi vedere nell’illustrazione, ci sono oltre 240 startup legate all’IA nell’editoria (a partire dai primi di luglio 2024). Contiamo le startup di editoria audio che impiegano l’IA come una categoria separata e il totale delle due è di oltre 300 aziende. La maggior parte, oltre 280, sono state lanciate dopo la prima apparizione di ChatGPT nel novembre del 2022. Questo volume di nuove startup è senza precedenti nell’editoria di libri. È stupefacente.
Come è caratteristico dell’intero database, queste startup di IA mirano principalmente agli autori (70%). Circa il 13% cercano, per così dire, di servire le case editrici. Il 10% sono focalizzate sull’editoria per bambini.
Circa 50 delle startup mirano ai lettori con una gamma di offerte inventive. Diverse sono piattaforme di narrazione. Ci sono parecchi riassuntori. Ci sono vari siti di scoperta, “Usa l’IA per trovare il tuo nuovo libro preferito.” Le voci generate dall’IA in rapido miglioramento hanno portato a una selezione di strumenti “leggilo per me”.
E alcune idee interessanti che non sarebbero possibili senza l’IA.
Bookshelf: Reading Tracker è una combinazione di scoperta di libri e app di biblioteca personale che include “tracciamento automatico del tempo, obiettivi di lettura e promemoria, e statistiche e tendenze approfondite.” Il suo bibliotecario IA “può generare riassunti e flash card, discutere idee chiave e takeaway, e molto altro.”
Il mio amico Ron Martinez ha recentemente lanciato un sito chiamato Inventionarts.ai che introduce “un nuovo mezzo conversazionale.” Come spiega il sito, “Parla con molteplici personalità IA, ciascuna con la propria identità, competenza e consapevolezza. Invita diverse personalità a unirsi a te in scenari. E puoi anche interpretare un ruolo fittizio!” Un gioco letterario, in un certo senso.
Come è caratteristico della coorte più ampia di startup, molte di queste startup sono tra minuscole e piccolissime, solo una persona con un sito web e un’idea a metà. Le includo tutte: chissà dove sono dirette.
Ti incoraggio vivamente a giocare con il database. Clicca su alcuni link. Penso che sarai divertito dall’innovazione e dall’audacia di molte di queste organizzazioni.
Uno degli sponsor di questo libro, Book Advisors, è specializzato in fusioni e acquisizioni nel settore editoriale. Sono sempre a favore delle startup innovative che cercano partner, e Book Advisors è dove le mando per discutere del processo. L’editoria ha diverse società di M&A rispettate a cui rivolgersi, tra cui The Fisher Company e Oaklins DeSilva+Phillips. Book Advisors è l’unica azienda che conosco che lavora anche con startup tecnologiche.
IA e Editoria: Cosa sta facendo attualmente il settore?
Le attività legate all’IA di molti dei principali gruppi commerciali editoriali sembrano aggiungere le loro voci al coro dei preoccupati per il diritto d’autore. The Association of American Publishers “ha presentato commenti di replica nell’inchiesta dell’Ufficio del Copyright degli Stati Uniti sull’intersezione tra la legge sul diritto d’autore e l’intelligenza artificiale (IA)...” |
La UK Publishers Association nota che “è di fondamentale importanza che il Governo metta in atto soluzioni tangibili il prima possibile per proteggere la creatività e la conoscenza umana che sono alla base di un’IA sicura e affidabile.”
D’altra parte, l’Independent Publishers Guild (IPG), con più di 600 membri, offre linee guida sull’IA e formazione ai suoi membri, incluso il suo “Practical Guide to AI in Publishing,” condotto da un noto esperto di IA ed editoria, George Walkley.
Qui negli Stati Uniti, ho il privilegio di far parte del Gruppo di Lavoro sull’IA del Book Industry Study Group (BISG), che riferisce al Comitato per il Workflow. Il Gruppo di Lavoro ha delineato diverse potenziali iniziative strategiche:
Sviluppo delle Migliori Pratiche e Standard: Raccomandare le migliori pratiche relative all’uso dell’IA, legate a linee guida etiche, regolamenti e leggi esistenti. Questo include la trasparenza nel contenuto generato dall’IA e la sua divulgazione ai consumatori.
Sondaggi del Settore e Definizioni: Condurre sondaggi per raccogliere ampie intuizioni del settore sugli usi attuali e potenziali dell’IA e stabilire definizioni e ambiti chiari per ciò che significa IA nel contesto dell’editoria.
Relazioni Periodiche e Revisioni: Offrire rapporti periodici per aiutare il settore a prevedere e adattarsi ai rapidi cambiamenti portati dalle tecnologie IA.
Altre associazioni di scrittura e editoria stanno cercando di affrontare l’argomento. Alcune prendono posizioni contrarie all’IA; altre stanno solo cercando di aiutare i loro membri a comprendere la tecnologia e, forse, a sperimentarla.
IA e Editoria: Cosa stanno facendo le Case Editrici?
Un anno fa la domanda su cosa stessero facendo attualmente le case editrici avrebbe avuto come risposta, “non molto.” Non è cambiato molto da allora, ma c’è stata qualche attività. Mi concentrerò sugli editori di libri trade; gli editori accademici e scientifici sono più attivi. Ecco alcune delle cose che ho scoperto.
Hachette: Secondo un rapporto di novembre 2023 su The Bookseller nel Regno Unito, Hachette ha pubblicato una dichiarazione di posizione sull’IA, offrendo una distinzione tra usi ‘operativi’ e usi ‘creativi’. La società “ha chiarito che incoraggia la ‘sperimentazione responsabile’ per gli usi operativi ma è contraria alla ‘creatività delle macchine... per proteggere il contenuto creativo originale prodotto dagli esseri umani’.”
HarperCollins: Secondo un rapporto di aprile 2023 su Publishers Weekly di Andrew Albanese e Ed Nawotka, il CEO di HarperCollins Brian Murray ha detto:
“Sappiamo che sarà importante e avrà un grande impatto sul nostro settore nei prossimi tre-cinque anni. E quindi penso che molti di noi stiano cercando di capire come e di assicurarci di impiegarla in modo etico e morale che ci aiuti a servire gli autori e fornire servizi professionali agli autori e non competere con gli autori e la narrazione.
“E questo, penso, è una sfida. Forse non tanto per tutti gli editori che sono qui, ma vi garantisco che ci sono molti piccoli team tecnologici in tutto il mondo che potrebbero cercare di entrare nel nostro business. Non sono editori, non sono editor. Sono i tecnologi e vedono un’opportunità.”
Penguin Random House (PRH): Bertelsmann, la società madre di PRH, offre un white paper intitolato State of Play: Exploring Generative AI’s Transformative Effects on the Media & Entertainment Industry, che include una sezione sull’editoria di libri.
Inoltre, secondo un rapporto in Publishers Lunch, l’azienda “ha introdotto la sua propria applicazione interna di AI, chiamata PRH ChatGPT.”
L’articolo afferma che i documenti interni di PRH spiegano che il programma “‘può essere utilizzato per semplificare i processi, migliorare la creatività e fornire approfondimenti sui dati’ attraverso i dipartimenti. L’azienda suggerisce che tra gli usi dell’app ci sono la sintesi di libri e documenti; la revisione di email; la redazione di post per blog o descrizioni di lavoro; l’analisi dei dati basati su testi e la “generazione[e] di idee per contenuti.’”
Simon & Schuster: Il CEO dell’azienda Jonathan Karp ha ottenuto una menzione nel New York Times “Most Memorable Literary Moments of the Last 25 Years” con una citazione riportata in Publishers Weekly dalla U.S. Book Show di maggio 2024. Ha detto che l’AI non era “l’elefante nella stanza” ma piuttosto, “più come la cicala nel mondo. Sai, tanti ronzii e tanti accoppiamenti.”
Ha riconosciuto che l’AI “è sicuramente uno strumento prezioso. Ci renderà sicuramente più efficienti. Ci aiuterà a processare e raccogliere informazioni meglio, e speriamo permetterà ai lavoratori di fare un lavoro di livello più alto che sia più interessante e creativo.”
A marzo, alla London Book Fair, come riportato in The Bookseller, Karp ha detto che l’azienda esaminerà anche le versioni in lingua straniera degli audiolibri generati da AI “nei territori dove [le opere di quell’autore] non avrebbero mai avuto una possibilità a causa del costo della [produzione audio].”
AI e l’editoria di libri: I casi d’uso
I casi d’uso specifici per l’AI e l’editoria di libri, attraverso diverse funzioni, sono facili da descrivere concettualmente. Ma non ci sono molte informazioni disponibili su ciò che gli editori stanno effettivamente facendo. |
Keith Riegert, CEO di Ulysses Press e Perfect Bound, ha presentato alla U.S. Book Show di Publishers Weekly a maggio 2024, offrendo la panoramica più completa che ho visto sui casi d’uso dell’AI all’interno delle aziende editoriali. Perfect Bound è uno sponsor di questo rapporto; confermo quella dichiarazione. Egli offre “20 modi pratici in cui tu, come professionista dell’editoria, puoi iniziare a usare l’AI subito.”
La sua presentazione, Getting Started with AI, può essere vista e scaricata dal sito web di Perfect Bound.
Cosa succede quando l’AI legge un libro?
Sto prendendo in prestito il titolo di questa sezione dalla newsletter di Ethan Mollick deliberatamente—non c’è bisogno di cercare di migliorarlo. Mollick è un professore presso la Wharton School dell’Università della Pennsylvania, che studia l’imprenditorialità e l’innovazione. La sua newsletter, che consiglio spesso, è calma, rinfrescante e unicamente perspicace.
Tra le cose che qualificano Mollick come commentatore c’è il fatto che non ha interessi in gioco. Non ha bisogno di vendere l’AI, né di demolirla. Si è semplicemente impegnato a esplorare l’AI nei suoi molti impatti, principalmente sull’istruzione, la cultura, la scrittura e l’editoria. Ed è un ottimo scrittore, chiaro e brillante.
Se sfogli gli archivi della newsletter di Mollick vedrai che non ha iniziato a concentrarsi sull’AI fino a dicembre 2022. Non era il suo campo—come la maggior parte di noi, l’AI si è intrufolata nel suo lavoro quotidiano, e non poteva distogliere lo sguardo.
In questo post le sue intuizioni sono più vicine al nostro interesse come professionisti dell’editoria. “L’AI,” si chiede, “potrebbe cambiare il modo in cui interagiamo con i libri?”
Per rispondere alla domanda, Mollick nota, “abbiamo bisogno sia di un’AI con una memoria abbastanza grande da contenere un libro, sia di un autore che conosca bene il proprio libro per giudicare i risultati dell’AI.” Mollick testa uno dei suoi numerosi titoli (non specifica quale, ma dalle conversazioni è chiaramente The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors, un libro favorevolmente recensito su Amazon, anche se non un bestseller attuale).
Mollick considera diversi aspetti del potenziale valore dell’IA per un autore, editore o lettore, inclusi “IA come lettore ed editor” e “un uso pratico: aiuto per gli istruttori.” Chiede a un modello di linguaggio di grandi dimensioni (LLM)—non ChatGPT—di riassumere il libro. Riesce a farlo con soddisfazione di Mollick.
Poi una sfida più difficile: “Dammi esempi di metafore nel libro.” La metafora, sottolinea, “è impegnativa anche per i lettori umani, poiché implica trovare un uso del linguaggio figurativo senza marcatori chiari (a differenza di una similitudine, non ci sono ‘come’ o ‘come’).” I risultati, registra, “sono impressionanti, anche se ci sono piccoli errori.”
Il LLM ha meno successo come editor: i suoi fallimenti in questo ambito, nota Mollick, illustrano “qualcosa che è diventato chiaro sullo stato attuale dell’IA: se sei un ottimo scrittore o editor, sei migliore dell’IA attuale…”
Tuttavia, “le IA hanno, o almeno hanno l’apparenza di avere, una comprensione del contesto e del significato di un pezzo di testo.” Come risultato, Mollick crede che “il modo in cui ci rapportiamo ai libri è destinato a cambiare a causa dell’IA.”
Anch’io la penso così.
IA e progettazione e produzione di libri
I sistemi esperti e l’automazione dei processi sono ancora avanti rispetto all’IA quando si tratta di progettazione e produzione di libri. |
Il software per la composizione tipografica automatizzata dei libri risale almeno agli anni ’70. A metà degli anni ’80 ho supervisionato un progetto software chiamato PageOne, basato su TeX di Donald Knuth, che poteva comporre un libro in pochi minuti. SGML è apparso nello stesso periodo, basato su uno standard documentale introdotto nel 1969. È stato ampiamente sostituito dall’XML, introdotto nel 1996. Questi robusti linguaggi di markup creano strutture solide per l’automazione.
La pubblicazione desktop ha inaugurato un’altra ondata di automazione per QuarkXPress e Adobe InDesign, così come Adobe Illustrator e Adobe Photoshop. I flussi di lavoro editoriali possono essere gestiti con vari programmi e sistemi.
Un’organizzazione da tenere d’occhio è la Coko Foundation. Offrono una suite di strumenti open source per la gestione della produzione e della pubblicazione, inclusi Kotahi, una piattaforma di pubblicazione accademica, e Ketty per la produzione di libri, che include un assistente IA. Il Kotahi AI PDF Designer, “trasforma il design dei PDF in un processo semplice e interattivo.”
Ci sono alcune iniziative iniziali per portare l’IA nei flussi di lavoro di InDesign. Nell’aprile 2024 Adobe ha annunciato una funzione Text to Image. Le terze parti potrebbero essere avanti rispetto ad Adobe qui: i fornitori innovativi di prestampa e produzione in India, come Hurix Digital e Integra, stanno mostrando più iniziativa di Adobe nell’usare l’IA per la produzione.
IA e marketing dei libri
L’impatto dell’IA sul marketing dei libri sarà superficiale nel breve termine, ma nel lungo termine molto più profondo. Molto dipende da ciò che si percepisce come ‘marketing del libro’; sta cambiando. |
Il ‘frutto a portata di mano’ è ovvio. Chiedi a Chat AI di aiutarti con una descrizione del prodotto o un comunicato stampa. Chiedigli di suggerire alcune parole chiave. Questo può farlo, senza sudare. Ma la maggior parte dei professionisti dell’editoria può fare la stessa cosa, con solo un po’ di sudore sulla fronte.
Gli utilizzi di Keith Riegert, collegati sopra, includono suggerimenti per il brainstorming dei titoli, la redazione di un rapporto di marketing digitale e la creazione di un tracker per campagne di marketing digitale in Google Sheets.
Il software Shimmr, descritto sopra, accenna alla forma che prenderà il marketing automatizzato in futuro.
IA e metadata
Cosa c’entra l’IA con i metadata, e viceversa? Il suo ruolo appare modesto finora; aspettati grandi cambiamenti. |
I metadata sono fondamentali per la scoperta dei libri. Lo hai sentito abbastanza volte da essere nauseato dall’ammonizione. È scoraggiante principalmente perché “metadata” rimane sfuggente per la maggior parte delle persone non tecniche. Se dici, “è solo le informazioni di base sul libro, il titolo, la descrizione, il prezzo, le categorie di soggetto, quel genere di cose,” la gente espira. Con quello sono a loro agio. Ma è tutto qui.
Mi dispiace ricordarti che in realtà c’è molto di più nei metadati che solo alcuni dettagli sul libro. C’è molto di più. Molto più di quanto possa comprendere in questo piccolo libro. Ho co-autore di un intero libro sull’argomento. Ingram pubblica Metadata Essentials, un eccellente volume breve. Lo dirò qui, e non per l’ultima volta: autori ed editori trascurano i loro metadati a loro rischio e pericolo.
L’IA può aiutare con la generazione di metadati. Ad esempio, il fornitore di auto-pubblicazione PublishDrive, offre un “Generatore di Metadati dei Libri Alimentato dall’IA” che offre raccomandazioni IA per il titolo del libro, la descrizione, le categorie Amazon, le categorie BISAC e le parole chiave.
Insight, di Veristage, descritto sopra, può generare descrizioni, parole chiave, categorie BISAC e definire il pubblico target.
Dichiarare l’uso dell’IA nei metadati
Potresti pensare che il mondo solenne dei metadati sarebbe lento ad avvolgere la sua testa confusa attorno all’IA. Non è così! Lo scorso novembre, EDItEUR, il custode dello standard ONIX, ha rilasciato una breve Nota Applicativa chiamata “Aspetti dell’IA in ONIX.” (pdf) |
Con la sua tipica profonda saggezza, Graham Bell, il direttore dell’organizzazione, nota che “una reazione alle (controversie che circondano la tecnologia) è rinunciare all’uso dell’IA o evitare di commerciare prodotti creati dall’IA. Un’opzione più realistica è semplicemente essere trasparenti con i partner commerciali e i lettori quando è stata utilizzata l’IA. E poiché alcuni rivenditori limitano o vietano i contenuti basati sull’IA dalle loro piattaforme, è importante per gli editori rispettabili evidenziare quei prodotti che utilizzano tecniche generative di IA per creare contenuti.”
Bell continua delineando i modi in cui gli editori possono specificare nei metadati:
Contributori IA
Voci basate su IA negli audiolibri
… così come un metodo per indicare nei metadati per i prodotti digitali che l’editore rinuncia esplicitamente all’estrazione di testo e dati (TDM) per usi diversi dalla ricerca. C’è anche un modo per specificare una licenza separata che copre la TDM commerciale o non di ricerca.
Come spesso accade, ciò che è specificato in ONIX potrebbe non essere scoperto lungo la catena alimentare, ma almeno è stato fatto un miglior sforzo.
Strategie per integrare l’IA nelle operazioni editoriali
Ci sono poche cose che le case editrici sono meno a loro agio a fare rispetto all’integrazione di tecnologie digitali complesse nelle loro operazioni quotidiane. È comprensibile. L’IA, in particolare, sta causando ansia a tutti, non solo nell’editoria. È nuova, è misteriosa, è personalizzata, è potente. Le persone si sentono minacciate dall’IA per numerosi motivi. Cambiare atteggiamenti richiede tempo. |
Ma questo non è un buon momento per essere timidi con la tecnologia.
Ci sono approcci calmi e razionali disponibili per integrare l’IA nella tua operazione editoriale, indipendentemente dalle dimensioni della tua organizzazione.
L’impulso deve venire dall’alto. Molto dall’alto. I dirigenti senior devono abbracciare una visione dell’impatto potenzialmente trasformativo dell’IA e comunicare un programma al personale in tutta l’organizzazione. Il programma potrebbe essere poco più di “sperimentare, documentare i tuoi esperimenti e condividere.” Questo è un buon inizio.
The Economist ha recentemente fatto riferimento a una tattica organizzativa per l’adozione di nuove tecnologie chiamata “l’approccio del faro.” Crei un faro selezionando un concetto dimostrativo di alto profilo che può essere implementato rapidamente e che tutti possono comprendere.
Le case editrici sono handicappate dal trambusto che circonda il copyright: gli autori sono in rivolta. Un sondaggio di maggio 2023 della Authors Guild ha rilevato che “il 90% degli scrittori crede che gli autori dovrebbero essere compensati se il loro lavoro viene utilizzato per addestrare tecnologie generative di IA,” e il 67% ha detto che “non era sicuro se i propri contratti editoriali o i termini di servizio della piattaforma includessero permessi o concessioni di diritti per utilizzare il proprio lavoro per scopi legati all’IA.” Quegli autori incerti ora chiedono ai loro editori se l’IA viene utilizzata nella modifica o produzione del loro lavoro, e alcuni autori potenti insistono che non lo sia. Stanno cercando l’equivalente IA di una panetteria senza arachidi.
Questo è un problema spinoso per gli editori: se non puoi usare l’IA sui libri che stai pianificando di pubblicare, per cosa puoi usarla?
Sviluppare e comunicare le politiche IA
Nonostante il suo uso diffuso, pochi editori hanno definito pubblicamente le loro politiche IA e comunicato i loro approcci all’IA al pubblico. Il termine ‘il pubblico’ ha un significato scivoloso qui, quando si considerano i diversi pubblici indirizzati dagli editori commerciali, accademici ed educativi.
Per gli editori commerciali, il pubblico più importante è costituito dagli autori e dai loro agenti. Gli editori accademici affrontano ostacoli diversi quando considerano l’impatto promettente dell’IA sulla ricerca e poi l’impatto più problematico dell’IA nel convertire la ricerca in narrativa (Avi Staiman ha scritto un post ponderato su questo argomento). Per gli editori educativi, stabilire politiche è complicato, poiché l’invasione dell’IA nella pratica dell’insegnamento e dell’istruzione è multifaccettata e complessa.
Penso che gli editori affrontino due grandi sfide mentre avanzano con le tecnologie IA. La prima è sviluppare una posizione aziendale su come affrontare l’IA in generale, su come incorporare l’IA nei loro flussi di lavoro. La seconda sfida è comunicare tale posizione, in modo chiaro e inequivocabile, ai loro stakeholder.
Le politiche editoriali che ho visto sono per lo più difettose. Alcune di esse sono infatti politiche dirette esternamente, agli autori, con una serie di ammonizioni su ciò che è pratica accettabile (non molto) e su ciò che non è accettabile (molto). La “Politica sull’uso dell’IA per i talenti che sviluppano contenuti per O’Reilly” di O’Reilly si estende per pagine e pagine, con linee guida esoteriche, come “NON UTILIZZARE modelli OSS GenAI che producono output software soggetti ai termini di una licenza open source copyleft o virale di rete.”
D’altra parte, l’editore accademico Elsevier, nella sezione “Politiche di Elsevier” del suo sito web, include dichiarazioni sui “Principi di IA responsabile,” “Text and Data Mining,” e “L’uso di tecnologie IA generative e assistite nella scrittura per Elsevier.”
Le poche politiche editoriali interne, non pubblicate, che ho visto sono conservative, eccessivamente così. Questi editori hanno reagito troppo rapidamente alla gamma di minacce percepite e possibili e alle ansie dei loro autori, e hanno paralizzato la loro capacità di impegnarsi robustamente con questa tecnologia in rapido sviluppo e cambiamento.
È dato per scontato che utilizzeranno l’IA ‘responsabilmente,’ qualunque cosa significhi. È dato per scontato che abbiano la massima preoccupazione per la proprietà intellettuale degli autori e per proteggere aggressivamente il lavoro protetto da copyright degli autori. (Anche se, ovviamente, questi principi generali devono essere dichiarati pubblicamente e spesso ribaditi.)
Ma cos’altro?
Permetteranno all’IA di avere un ruolo nelle acquisizioni editoriali? L’IA può dare uno sguardo al mucchio di manoscritti non richiesti?
Permetteranno all’IA di avere un ruolo nell’editing di sviluppo, nella revisione di linea e nella correzione di bozze?
Permetteranno all’IA di avere un ruolo nella determinazione delle tirature e delle allocazioni?
Nella creazione di file ebook accessibili, incluso il testo alternativo?
Nell’aiutare la creazione di audiolibri nei casi in cui non è economicamente realistico assumere narratori umani talentuosi?
Nell’aiutare la traduzione in lingua straniera in mercati dove i diritti non verrebbero mai venduti?
Nello sviluppo di materiale di marketing su larga scala?
Nella comunicazione con i rivenditori?
Se sì, devono chiarirlo e spiegare chiaramente il pensiero dietro queste politiche. Gli editori devono essere coraggiosi nel contrastare le numerose obiezioni della maggior parte degli autori in questo momento di paura e dubbio.
Considerazioni sul lavoro
Solo i più grandi editori saranno in grado di assumere personale dedicato a lavorare con software e sistemi IA. L’editore medio vorrà esporre tutto il proprio personale agli strumenti IA, aspettandosi che ciascuno possa esplorare l’uso dell’IA per trovare efficienza nel proprio lavoro. |
Alla conferenza PubWest di febbraio 2024 in Arizona, un oratore esterno all’industria editoriale ha suggerito che uno degli usi dell’IA sarà sostituire gli stagisti. La sala è esplosa. Aveva buone intenzioni - infatti, un rapporto del 10 aprile 2024 del New York Times descrive come le banche di investimento di Wall Street stanno cercando di sostituire molti dei loro stagisti con l’IA. Simile al caso nell’editoria, una preoccupazione ovvia è: come trovare analisti senior se non possono iniziare come analisti junior?
L’industria editoriale ha sempre fatto affidamento sugli stage. Uno studio del 2019 ha rilevato che l’80 percento delle persone che hanno lavorato nell’editoria per meno di quindici anni aveva precedentemente svolto uno stage.
In parte è un modo per sbrigare il lavoro di routine a un costo ragionevole. Ma ciò impallidisce di fronte alla realtà più ampia che nessuna scuola di editoria può equipaggiare qualcuno per unirsi a una casa editrice a livello di middle-manager. L’unico modo per sviluppare il personale qualificato di domani è formare stagisti e apprendisti oggi.
L’obiettivo qui non è cercare di sostituire gli stagisti con l’IA, ma piuttosto rendere il loro lavoro più produttivo e gratificante utilizzando strumenti IA, a vantaggio sia dello stagista che della casa editrice.
IA per Audiolibri
L’IA per gli audiolibri funziona davvero bene. Non è perfetta, ma funziona. Autori ed editori stanno ora utilizzando regolarmente strumenti di IA nella produzione di audiolibri, principalmente per libri dove la produzione di audiolibri con narratori a tempo pieno non è finanziariamente fattibile. E non solo per audiolibri in lingua inglese, ma anche per audiolibri tradotti. |
L’uso dell’IA per gli audiolibri non è nuovo; ho segnalato per la prima volta questa tendenza in Publishers Weekly nel 2021. Ma i nuovi grandi modelli di linguaggio hanno rinvigorito la tecnologia per la narrazione automatizzata degli audiolibri.
Nel 2021 ho notato “È perfetto? Certamente no. Può essere abbastanza buono? Probabilmente sì, se un editore è disposto a spendere il tempo necessario nella fase di editing della voce del progetto.” Due anni e mezzo dopo, secondo molti, le voci generate dall’IA sono indistinguibili dalle voci umane, a meno che non si ascolti molto attentamente.
Lo scorso novembre Meta (Facebook) ha introdotto “Seamless,” in grado di “trasferire toni, espressione emotiva e qualità dello stile vocale” nella traduzione di 200 lingue. Un audiolibro può essere immediatamente tradotto in più lingue con una qualità straordinaria.
Sempre nel 2021 ho riportato che “Il blocco di Audible sulla distribuzione di audiolibri con narratori non umani è un vero problema che potrebbe richiedere del tempo per essere risolto.” Nel frattempo, sia Google che Apple hanno annunciato programmi per permettere agli autori di creare audiolibri con voci generate dall’IA. Il 5 dicembre, Findaway Voices di Spotify ha iniziato ad accettare “audiolibri narrati con voce digitale da Google Play Books per la distribuzione a partner commerciali selezionati.”
All’inizio di novembre 2023 Amazon ha annunciato che gli autori di Kindle Direct Publishing (KDP) avrebbero presto avuto accesso a un servizio che avrebbe permesso loro di “produrre rapidamente e facilmente una versione audiolibro del loro ebook utilizzando la narrazione vocale virtuale, una tecnologia di sintesi vocale.” A gennaio 2024, Jane Friedman ha riportato (paywall) che “Audible ha silenziosamente iniziato a permettere l’ingresso di audiolibri narrati dall’IA nel suo negozio lo scorso autunno, molto tempo dopo che altri rivenditori avevano fatto lo stesso.”
E, naturalmente, sto usando l’IA per le versioni audiolibro di questo libro.
IA per la Traduzione di Libri
L’IA per la traduzione di libri funziona. Forse non così bene come funziona per la creazione automatizzata di audiolibri. Ma ci sta arrivando molto rapidamente. La narrativa non letteraria potrebbe essere la prima. La narrativa letteraria potrebbe seguire. La saggistica pone un diverso insieme di sfide. |
Ho ospitato un webinar sull’IA per la traduzione di libri, sponsorizzato da BISG, a giugno 2024. Il video è online su YouTube. Jane Friedman ha anche descritto il programma nella sua newsletter Hot Sheet.
L’argomento è complesso e sfaccettato. Una cosa che trovo affascinante è da quanto tempo le persone cercano di automatizzare la traduzione. È un promemoria che i libri, che riempiono il nostro universo, sono una piccola proporzione della comunicazione scritta, ancor di più in questa era online.
Warren Weaver, accreditato come il padre della traduzione automatica (MT), ha detto a un collega: “Quando guardo un articolo in russo, dico: ‘Questo è davvero scritto in inglese, ma è stato codificato in strani simboli. Ora procederò a decodificare.’” Per una macchina, la lingua è solo codice. Non è cultura e sentimento e la grandezza della lingua scritta. È un compito con numeri e codice.
Chiaramente il divario tra narrativa e saggistica sarà evidente nella traduzione con IA. La chat IA è forte nello stile, ma manca nei fatti. Sono i primi giorni, ma sono incline a pensare che la chat IA brillerà con la narrativa, ma sarà carente con la saggistica. (Tuttavia, procedo a tradurre automaticamente questo libro pieno di fatti!)
La narrativa letteraria è davvero l’elefante nella stanza. È preziosa e venerata, e giustamente. I traduttori possono passare ore a discutere su una singola parola o frase. La chat IA deve procedere con cautela in quelle acque.
Ma questo è un terreno fertile. Per quanto posso determinare (da dati scarsi), ci sono state solo 9.500 traduzioni di libri commerciali nel 2023. Anche se mi sbagliassi di un grande fattore, è chiaro che pochi libri vengono tradotti da lingue straniere in inglese.
Allo stesso modo, ho trovato una statistica che indica che nel 2023 ci sono state solo 7.230 traduzioni dall’inglese allo spagnolo (nei mercati dei libri spagnoli). Sembra incredibilmente poco.
C’è una vasta opportunità qui.
La maggior parte dell’uso dell’IA per la traduzione di libri sarà per libri la cui traduzione non è mai stata considerata economicamente fattibile. È inevitabile che ci sarà un impatto sul lavoro dei traduttori di libri di “mercato medio”; la crescita del lavoro sarà nella gestione dei progetti e nell’assicurazione della qualità. Questo compenserà la perdita di posti di lavoro? Improbabile.
Come per la maggior parte degli aspetti dell’IA, ci sono questioni difficili da affrontare e nessuna risposta facile.
Come noto nella sezione del software, Leanpub e DeepL sono le due aziende che offrono servizi di traduzione di libri assistiti dall’IA per autori ed editori.
IA per l’Editoria Accademica
Gli editori commerciali e gli autori di ogni tipo farebbero bene a tenere d’occhio la traiettoria dell’IA nella comunità editoriale accademica. Sta avanzando molto più rapidamente rispetto all’editoria per i consumatori. |
Vedo due motivi per questo avanzamento. In primo luogo, gli autori nell’editoria accademica sono accademici di professione e nel settore STM (scientifico, tecnico e medico), sono spesso scienziati con lauree avanzate. Al di là dell’editoria, stanno investigando e spesso abbracciando l’IA nel loro lavoro. Sarebbero più sorpresi di scoprire che il loro editore non stia esplorando l’uso dell’IA nella modifica e nella pubblicazione del loro lavoro.
Questo fluisce nell’ecosistema dell’editoria accademica, dove, spesso, gli editori sono essi stessi studiosi. Per loro, la tecnologia non è intimidatoria.
Non approfondirò ulteriormente i particolari in questo libro; ne parlerò in modo più dettagliato nel mio blog.
IA per gli Autori
Autori ed editori spesso si vedono come vivendo in due solitudini, connesse, ma sostanzialmente separate. Questo è stato in gran parte vero nell’editoria moderna.
I tempi cambiano. Dove una volta gli editori erano intoccabili, ora gli autori di punta dettano le regole. Come discuto altrove, gli autori autopubblicati sono i pionieri. Portano poco del bagaglio che appesantisce l’editoria tradizionale.
Quando gli editori guardano all’IA, vedono poche opportunità. Quando parlo con gli autori dell’IA, il mondo è la loro ostrica. Le possibilità sono quasi infinite:
Autore e modifica
Provare a scrivere e pubblicare interi libri
Provare a ideare un nuovo progetto
Provare a ideare all’interno di un nuovo libro
Affinare la storia
Ricerca
Verifica dei fatti
Compagno di scrittura
Editing dello sviluppo
Correzione di bozze
Controllo ortografico e grammaticale
Revisione finale
Illustrazione/Imaging
Creare illustrazioni e grafici
Bozze di design di copertine
Promozioni video
Marketing
Automatizzare le sottomissioni ad agenti, editori, concorsi, amici, richieste di blurb
Generare materiale di marketing: comunicati stampa, post sui blog, social media, ecc.
Generazione di siti web
Gli autori guideranno gran parte del cambiamento nell’adozione dell’IA nell’industria, sia a favore che contro.
Sono i beneficiari di gran parte dell’innovazione delle startup intorno all’IA nell’autore e nell’editoria — circa il 70% delle startup cercano di lavorare con gli autori nei loro percorsi.
Preoccupazioni e Rischi Intorno all’IA
Le preoccupazioni intorno all’IA sono serie. I rischi sono reali. A volte sono espressi in modi isterici, ma, quando si approfondisce, l’impatto dell’IA ha il potenziale per essere enormemente distruttivo. |
Ci sono così tante questioni e preoccupazioni intorno all’IA, che riempiono volumi da soli. Ecco una nuvola di parole dei temi che monitoro. Sono sicuro che me ne mancano alcuni.
C’è molta informazione disponibile su ciascuno di questi temi, e ti incoraggio a leggere il più approfonditamente possibile. È possibile che tu concluda che i rischi superano i benefici e che non vuoi perseguire l’uso dell’IA, sia personalmente che all’interno della tua organizzazione. Quella decisione porta i suoi rischi; il solito, di essere lasciato indietro. Ma è una scelta personale.
Se cerchi su Google “libri riguardanti i rischi dell’IA” troverai una selezione di volumi validi. Un recente podcast che ho trovato particolarmente inquietante è stato la chiacchierata di Ezra Klein con Dario Amodei, co-fondatore e CEO di Anthropic (l’azienda che sviluppa Claude.ai). Impari che queste aziende sono consapevoli dei rischi. Amodei si riferisce a un sistema di classificazione dei rischi interno chiamato A.S.L., per “AI Safety Levels” (non American Sign Language). Attualmente siamo a ASL 2, “sistemi che mostrano primi segni di capacità pericolose — per esempio la capacità di dare istruzioni su come costruire armi biologiche.” Descrive ASL 4 come “abilitare attori statali ad aumentare notevolmente la loro capacità… dove ci preoccuperemmo che Corea del Nord o Cina o Russia potrebbero aumentare notevolmente le loro capacità offensive in vari settori militari con l’IA in un modo che darebbe loro un vantaggio sostanziale a livello geopolitico.” Roba inquietante.
In questo contesto cupo, evidenzierò le questioni più pertinenti per scrittori ed editori.
Diritti d’autore violati?
Le questioni relative ai diritti d’autore sono un miasma di complessità e ambiguità. Sembra certo che alcuni libri ancora sotto diritti d’autore siano stati inclusi nell’addestramento di alcuni LLM. Ma non è certamente il caso, come temono alcuni autori, che tutto il loro lavoro sia stato aspirato in ciascuno e in tutti i modelli linguistici di grandi dimensioni. |
Le questioni relative ai diritti d’autore sono sia specifiche che ampie. È risaputo che tutti gli LLM sono addestrati sul web aperto—tutto ciò che può essere raschiato dai 1,5 miliardi di siti web oggi, che siano articoli di giornale, post sui social media, blog web e, apparentemente, trascrizioni di video di YouTube.
È dimostrabile che almeno uno degli LLM ha ingerito il testo effettivo di migliaia di libri non di pubblico dominio.
Era legale ingerire tutto questo testo per aiutare a costruire aziende di intelligenza artificiale da miliardi di dollari, senza alcun compenso per gli autori? Le aziende di intelligenza artificiale sostengono il loro argomento sull’uso equo; i tribunali decideranno alla fine. Anche se fosse legale, era etico o morale? L’etica sembra meno complessa delle considerazioni legali. Decidi tu.
Le leggi sui diritti d’autore ovviamente non hanno previsto le sfide uniche che l’IA porta alla questione, e cercare soluzioni legali richiederà tempo, forse anni. (Se desideri approfondire il motivo per cui le leggi sono inadatte al problema particolare in questione, leggi l’eccellente articolo di A. Feder Cooper e James Grimmelmann intitolato “The Files are in the Computer: Copyright, Memorization, and Generative AI.”)
Ecco un elenco di tredici delle cause più importanti, non tutte riguardanti i libri; anche immagini e musica. E qui c’è un altro elenco che aggiorna lo stato di tutte le cause legali.
Diritti d’autore e IA per autori
Gli autori affrontano ulteriori problemi riguardanti la possibilità di copyright dei contenuti generati dall’IA. |
La posizione dell’Ufficio del Copyright degli Stati Uniti sulla possibilità di copyright per i contenuti generati dall’IA afferma che l’IA da sola non può detenere diritti d’autore perché manca dello status legale di autore. Ha senso. Ma questo presuppone che il 100% del lavoro sia generato dall’IA. Come discusso altrove, pochi autori lasceranno che l’IA generi un intero libro. Più probabile che sia il 5%, o il 10% o… E qui l’Ufficio del Copyright inciampa (come farei io).
In una decisione più recente, l’Ufficio ha concluso che un romanzo grafico composto da testo scritto da umani combinato con immagini generate dal servizio IA Midjourney costituiva un’opera soggetta a copyright, ma che le singole immagini stesse non potevano essere protette dal diritto d’autore.“ Accidenti!
Basti dire che autori ed editori devono essere attenti alle questioni di copyright in evoluzione, su più fronti. |
Quali sono le implicazioni a lungo termine?
Alcuni paragonano l’attuale contenzioso alla causa sui libri di Google, che ha impiegato 10 anni per risolversi legalmente. Chi sa quanto tempo impiegherà il processo di appello per queste cause. Nel frattempo, gli editori fanno bene ad agire come se le aziende di IA perderanno, il che, almeno teoricamente, espone chiunque licenzi o forse anche utilizzi Chat AI, a qualche tipo di responsabilità contingente.
Ma non è questo il problema più serio di un editore. È la percezione. Per molti autori, alcuni prominenti, altri oscuri, il pozzo è stato avvelenato. L’IA è radioattiva all’interno della comunità degli scrittori e degli editori. Qualsiasi cosa che anche solo sembri IA attira intense critiche.
Ci sono numerosi esempi. In un recente incidente, Angry Robot, un editore del Regno Unito “dedicato al meglio della fantascienza moderna per adulti, fantasy e WTF,” ha annunciato che avrebbe utilizzato un software IA, chiamato Storywise, per esaminare un previsto grande lotto di manoscritti inviati. Ci sono volute solo cinque ore perché la compagnia abbandonasse il piano e tornasse alla “vecchia casella di posta.“
Il dilemma insopportabile per gli editori commerciali nell’utilizzo degli strumenti di AI internamente: se i vostri autori lo scoprono, avrete difficoltà a resistere alla tempesta risultante. Credo che gli editori non abbiano altra scelta che essere coraggiosi, adottare (almeno alcuni di) questi strumenti, spiegare chiaramente come sono addestrati e come vengono utilizzati, e andare avanti.
Nel Regno Unito, The Society of Authors adotta un approccio rigido: “Chiedi al tuo editore di confermare che non farà uso sostanziale di AI per qualsiasi scopo in connessione con il tuo lavoro - come la correzione di bozze, l’editing (inclusa la verifica dell’autenticità e il fact-checking), l’indicizzazione, la verifica legale, il design e il layout, o qualsiasi altra cosa senza il tuo consenso. Puoi anche vietare la narrazione di audiolibri, la traduzione e la progettazione di copertine realizzate da AI.”
The Authors Guild sembra accettare che “gli editori stanno iniziando a esplorare l’uso dell’AI come strumento nel corso normale delle loro operazioni, inclusi usi editoriali e di marketing.” Non credo che molti membri della Guild siano così comprensivi.
Licenza dei contenuti alle aziende di AI
La maggior parte degli editori e molti autori stanno cercando modi per concedere in licenza i contenuti alle aziende di AI. Ognuno ha un’idea diversa di quali dovrebbero essere i termini di licenza e di quanto valgono i propri contenuti, ma almeno le discussioni sono in corso.
Ci sono diverse startup che cercano di lavorare con gli editori (e, in alcuni casi, con singoli autori). Calliope Networks e Created by Humans sono entrambe interessanti a questo riguardo.
A metà luglio, Copyright Clearance Center, da tempo il principale attore del settore nella concessione collettiva di licenze di copyright, ha annunciato la disponibilità di “diritti di riutilizzo dell’intelligenza artificiale (AI) all’interno delle sue licenze annuali di copyright (ACL), una soluzione di licenza di contenuti a livello aziendale che offre diritti su milioni di opere alle aziende che si abbonano.”
Publishers Weekly ha coperto l’annuncio, citando Tracey Armstrong, presidente e CEO di CCC, che dice “È possibile essere pro-AI e pro-copyright, e accoppiare l’AI con il rispetto per i creatori.”
Anche se non del tutto esaustivo, questo è probabilmente un passo avanti nel portare l’editoria verso un certo grado di cooperazione con gli sviluppatori di modelli linguistici su larga scala.
È troppo tardi per evitare l’AI
Per gli autori e gli editori che preferiscono non essere contaminati con l’AI, le notizie sono pessime: stai usando l’AI oggi e lo stai facendo da anni. |
L’intelligenza artificiale, in diverse forme, è già stata integrata nella maggior parte degli strumenti software e dei servizi che usiamo ogni giorno. Le persone si affidano al controllo ortografico e grammaticale alimentato dall’AI in programmi come Microsoft Word o Gmail. Microsoft Word e PowerPoint applicano l’AI per fornire suggerimenti di scrittura, offrire raccomandazioni di design e layout e altro ancora. Assistenti virtuali come Siri e Alexa usano l’elaborazione del linguaggio naturale per comprendere i comandi vocali e rispondere alle domande. I servizi di posta elettronica sfruttano l’AI per filtrare i messaggi, rilevare lo spam e inviare avvisi. L’AI alimenta i chatbot del servizio clienti e genera raccomandazioni di prodotti basate sulla tua cronologia degli acquisti.
E gran parte di questo è basato su modelli linguistici su larga scala, come nel caso di ChatGPT.
Per un autore o un editore dire, “Non voglio che l’AI venga usato sul mio manoscritto,” è, in generale, quasi impossibile, a meno che sia loro che i loro editori non lavorino con macchine da scrivere e matite.
Potrebbero provare a dire, “Non voglio che l’AI generativa” venga usata sul loro libro. Ma è difficile da distinguere. Il software di controllo grammaticale non è stato originariamente costruito su AI generativa. Grammarly l’ha aggiunta come ingrediente al suo prodotto, come faranno tutti gli altri correttori ortografici e grammaticali. L’AI generativa è anche fondamentale per il software di marketing offerto.
Quando gli autori usano l’AI
Un altro aspetto degli autori e dell’uso dell’AI presenta somiglianze con la questione del copyright discussa sopra. In casi estremi, stiamo vedendo contenuti generati al 100% dall’AI pubblicati su Amazon. La maggior parte di essi (tutti?) è di qualità terribile, ma ciò non impedisce che vengano pubblicati. (Vedi anche la sezione Amazon.) Più preoccupante per gli editori sono le submission generate dall’AI. Sì, l’AI aumenta la quantità, ma i grandi editori hanno già un filtro per la quantità. I filtri sono chiamati agenti. Sono loro che dovranno capire come gestire il problema della quantità, e apparentemente dovranno trovare una soluzione che non implichi l’uso dell’AI.
È una sorta di problema esistenziale: voglio pubblicare un libro scritto da una ‘macchina’? Per la maggior parte degli editori, la risposta è un inequivocabile ‘no’. Facile, no? Bene, e che dire di un libro in cui il 50% del contenuto è stato generato da un LLM, sotto la supervisione di un autore capace? Hmm, proviamo con un ‘no’ anche su questo. OK: e se fosse il 25%, o il 10%, o il 5%? Dove si traccia la linea?
E, ora che sei entrato nel business di tracciare linee, come risolvi il dilemma che gli strumenti di ortografia e grammatica ora si affidano, almeno in parte, all’IA generativa? E gli strumenti di trascrizione guidati dall’IA, come Otter.ai, o la funzione di trascrizione integrata in Microsoft Word?
Non riesco a trovare nessun editore commerciale che abbia dichiarato di non voler pubblicare un’opera con una quantità predefinita di testo generato dall’IA. Ecco cosa dice l’Authors Guild sull’argomento:
“Se una quantità apprezzabile di testo, personaggi o trama generati dall’IA sono incorporati nel tuo manoscritto, devi divulgarlo al tuo editore e dovresti anche divulgarlo al lettore. Non pensiamo sia necessario che gli autori divulghino l’uso dell’IA generativa quando viene utilizzata solo come strumento per il brainstorming, la generazione di idee o per la copia.”
Inutile dire che ‘apprezzabile’ non è definito (Oxford lo definisce come “sufficientemente grande da essere notato o ritenuto importante”), ma il post continua spiegando che l’inclusione di più di un testo “de minimis generato dall’IA” violerebbe la maggior parte dei contratti di pubblicazione. De minimis, in termini legali, non è precisamente specificato, ma, in generale, significa più o meno lo stesso di apprezzabile.
L’IA può essere rilevata nella scrittura?
Ho ospitato un webinar sulla rilevazione dell’IA, sponsorizzato da BISG, a maggio 2024. Il replay è online su YouTube. Jane Friedman ha offerto una descrizione completa del webinar nella sua newsletter Hot Sheet.
Per molti autori, la tossicità dell’IA significa tenerla lontana dalle loro parole. Gli editori portano un peso speciale: non creano il testo, ma, una volta pubblicato, si assumono un obbligo sostanziale verso il testo. Abbiamo visto molte esplosioni vicino a libri incendiari, che siano per le implicazioni sociali del contenuto o per il furto plagiaristico delle parole e delle idee di altri scrittori. Ora, con l’IA, affrontiamo un nuovo insieme di questioni etiche e legali, nessuna delle quali era delineata nella scuola di editoria.
Parte di ciò sembra simile a ciò che le persone temono per gli studenti, che l’uso dell’IA sia in qualche modo barare, simile a copiare da un articolo di Wikipedia, o forse semplicemente chiedere a un amico di scrivere il tuo saggio.
Uno dei nostri relatori del webinar, un educatore, José Bowen, ha condiviso la sua divulgazione per gli studenti. Non è esattamente quello che si usa per un autore, ma dimostra una sorta di “livelli di rischio” dell’uso dell’IA.
Accordo di Divulgazione Modello per Studenti
Ho fatto tutto questo lavoro da solo senza assistenza da amici, strumenti, tecnologia o IA.
-
Ho fatto la prima bozza, ma poi ho chiesto ad amici/famiglia, software di parafrasi/grammatica/plagio IA di leggerla e fare suggerimenti. Ho apportato le seguenti modifiche dopo questo aiuto:
Corretto ortografia e grammatica
Cambiato la struttura o l’ordine
Riscritto intere frasi/paragrafi
Ho avuto problemi e ho usato un thesaurus, dizionario, chiamato un amico, sono andato al centro di aiuto, ho usato Chegg o altri fornitori di soluzioni.
Ho usato IA/amici/tutor per aiutarmi a generare idee.
Ho usato assistenza/strumenti/IA per fare una scaletta/prima bozza, che poi ho modificato. (Descrivi la natura del tuo contributo.)
E così un editore potrebbe redigere qualcosa del genere per i loro autori. Diciamo che l’autore divulga il livello più alto: ho usato ampiamente l’IA, poi ho modificato i risultati. E poi? Rifiuti automaticamente il manoscritto? Se sì, perché?
E, nel frattempo, se presti attenzione, scopri che il manoscritto che hai appena letto e amato, che l’autore ha giurato non fosse nemmeno stato controllato ortograficamente da Grammarly, potrebbe essere stato in realtà generato al 90% dall’IA, da un autore esperto nel nascondere il suo uso.
Sei quindi costretto a ripensare la domanda. Diventa, “Perché sono così dannatamente determinato a rilevare questa cosa che è irrilevabile?”
In parte è la preoccupazione allarmista che circonda la diritto d’autore del testo generato dall’IA. L’ufficio del diritto d’autore non offrirà protezione del diritto d’autore per il testo generato al 100% dall’IA (o musica, o immagini, ecc.). Ma che dire del testo generato al 50% dall’IA? Bene, copriremo solo il 50% generato dall’autore. E come sapresti quale metà? Ti faremo sapere.
Non sarebbe fantastico se potessi semplicemente inserire ogni manoscritto in un software che ti dicesse se è stata usata l’IA nella creazione del testo?
Lasciando da parte il problema che l’unico modo per farlo sarebbe l’impiego di strumenti di IA, la domanda più importante è, il software sarebbe (sufficientemente) accurato? Potrei fare affidamento su di esso per dirmi se è stata usata l’IA nella creazione di un manoscritto? E potrei dipendere da esso per non produrre “falsi positivi” - indicare che è stata usata l’IA, quando in realtà non è così?
Ora c’è molto software sul mercato che affronta queste sfide. Molti degli studi accademici che valutano questo software indicano la sua inaffidabilità. Il testo generato dall’IA passa inosservato. Peggio ancora, il testo che non è stato generato da un’IA viene falsamente etichettato come contaminato.
Ma gli editori di libri vorranno avere qualche tipo di garanzia. Sembra che, nella migliore delle ipotesi, questi strumenti potrebbero avvisarti di possibili preoccupazioni, ma dovresti sempre ricontrollare. Quindi forse potrebbe avvisarti dei testi che devono essere esaminati più attentamente di altri? È questa un’efficienza?
La vera efficienza si troverà andando oltre le preoccupazioni sulla genesi di un testo, mantenendo invece i nostri criteri esistenti riguardo alla sua qualità.
Perdita di posti di lavoro
“Non sarai sostituito dall’IA. Sarai sostituito da qualcuno che sa usare l’IA.” —Anonimo
La perdita di posti di lavoro dovuta all’adozione dell’IA potrebbe essere grave. Le stime variano, ma i numeri sono cupi. Ci sono esempi ovvi: i taxi senza conducente di San Francisco eliminano… i conducenti di taxi e rideshare. La diagnostica supportata dall’IA potrebbe ridurre la necessità di tecnici medici.
L’ottimista in me indica, come esempio, l’introduzione del foglio di calcolo e il suo impatto sull’occupazione. Come puoi vedere nel grafico qui sotto, l’occupazione in “Contabilità, Preparazione Fiscale, Contabilità e Servizi di Pagamento Stipendi” è quasi raddoppiata dal 1990 - difficilmente una critica ai fogli di calcolo e altre tecnologie che hanno ampiamente automatizzato questi compiti.
Lo studio di Ethan Mollick con il Boston Consulting Group (BCG) è stato un esperimento che mirava a comprendere meglio l’impatto dell’IA sul lavoro, specialmente su compiti complessi e intensivi di conoscenza. Lo studio ha coinvolto 758 consulenti BCG, assegnati casualmente all’uso o meno dell’OpenAI GPT-4 per due compiti: innovazione creativa del prodotto e risoluzione dei problemi aziendali. Lo studio ha misurato le prestazioni, il comportamento e gli atteggiamenti dei partecipanti, nonché la qualità e le caratteristiche dell’output dell’IA.
Tra i risultati è emerso che “l’IA funziona come un livellatore di competenze. I consulenti che hanno ottenuto i punteggi peggiori quando li abbiamo valutati all’inizio dell’esperimento hanno avuto il maggiore balzo nelle loro prestazioni, 43%, quando hanno potuto usare l’IA. I consulenti migliori hanno comunque ottenuto un miglioramento, ma minore.” L’articolo completo è rivelatore e, come tutto il lavoro di Mollick, provocatorio ma accessibile.
Istruzione
L’istruzione è stata al centro dei dibattiti pro e contro l’IA. L’introduzione dell’IA nelle aule è ampiamente vista come una maledizione, o almeno una sfida. Altri educatori, come il relatore principale di PW Ethan Mollick, abbracciano l’IA come un nuovo strumento straordinario per gli educatori; Mollick insiste che i suoi studenti lavorino con ChatGPT.
Il miglior libro sull’argomento è Teaching with AI: A Practical Guide to a New Era of Human Learning di José Antonio Bowen e C. Edward Watson.
Non intendo approfondire l’editoria educativa in questo libro - è un argomento vasto, che richiede un rapporto separato. Si potrebbe sostenere che l’editoria stia diventando di interesse secondario nell’istruzione: gli strumenti di IA sono software, non contenuti, per così dire.
Il futuro della ricerca
La ricerca è un argomento delicato nell’IA. Ti incoraggio a visitare perplexity.ai e You.com per dare uno sguardo a dove stanno andando le cose. Le prossime volte che pensi di iniziare una ricerca su Google, vai su Perplexity invece. Non sembrerà molto diverso - è simile ai grafici della conoscenza che Google spesso inserisce sul lato destro dello schermo di ricerca, o talvolta in cima ai risultati di ricerca. Invece di dover fare clic su un link, le informazioni sono proprio lì per te. |
La perplessità fa un passo avanti, riformulando le informazioni raccolte da più fonti in modo che tu non debba davvero cliccare su un link. Fornisce i link alle sue fonti, ma cliccarli di solito è superfluo—hai già ottenuto la risposta alla tua domanda.
Questo apparentemente modesto cambiamento ha enormi implicazioni per ogni azienda e ogni prodotto che si basa, almeno in parte, sull’essere scoperto tramite motori di ricerca. Se i ricercatori non vengono più inviati al tuo sito, come puoi coinvolgerli e convertirli in clienti? La risposta semplice è che non puoi.
Joanna Penn è in prima linea nel pensare all’impatto delle nuove tecnologie sulla scrittura e l’editoria. Ha affrontato questo complesso argomento sul suo podcast e blog lo scorso dicembre.
È ancora presto per l’IA e la trasformazione della ricerca.
Libri spazzatura su Amazon
I libri spazzatura generati dall’IA su Amazon sono un problema, anche se la loro gravità potrebbe essere più viscerale che letterale. Da un lato, questi libri stanno spammando la libreria online con contenuti di bassa qualità e plagiati, a volte usando i nomi di autori reali per ingannare i clienti e sfruttare le loro reputazioni. I libri non sono solo un fastidio per i lettori ma anche una minaccia per gli autori, potenzialmente privandoli di royalties guadagnate con fatica. I libri generati dall’IA influenzano anche la classifica e la visibilità dei libri e degli autori reali sul sito di Amazon, poiché competono per le stesse parole chiave, categorie e recensioni. |
Amazon ora richiede agli autori di divulgare i dettagli sull’uso dell’IA nella creazione dei loro libri. Senza dubbio questo può essere abusato.
Prova a cercare su Amazon “libri generati dall’IA.” Ce ne sono molti. Alcuni dei risultati sono libri di istruzioni sull’uso dell’IA per creare libri. Ma altri sono, senza mezzi termini, generati dall’IA. “Immagini divertenti e carine di gatti - Non puoi vedere questo tipo di foto nel mondo - PARTE-1” (stet) è accreditato a Rajasekar Kasi. Non ci sono dettagli della sua (?) biografia su una pagina autore, ma sei altri titoli sono accreditati al nome. Il libro, pubblicato il 26 agosto 2023, non ha recensioni e nessun rank di vendita. Il titolo sgrammaticato dell’ebook non corrisponde al titolo sgrammaticato sulla copertina del libro stampato.
Ma altri autori stanno chiaramente utilizzando l’IA in modo estensivo nella creazione dei loro libri, senza dichiararlo. Come discuto sopra, rilevare l’uso dell’IA è quasi impossibile con ‘falsari’ abili. Libri da colorare, diari, libri di viaggio e libri di cucina vengono generati con strumenti IA in una frazione del tempo e dello sforzo dell’editoria tradizionale.
Cerca “ricettario vegano coreano” e troverai il titolo numero uno, di Joanne Lee Molinaro, al primo posto. Ma subito dopo ci sono altri titoli che sono chiaramente imitazioni. “Il Ricettario Vegano Coreano: Ricette Tradizionali e Moderne Semplici e Deliziose per Amanti della Cucina Coreana” ha due recensioni, inclusa una che nota “Questo non è un ricettario vegano. Tutte le ricette contengono carne e uova.” Ma il libro è al #5,869,771 in classifica vendite, rispetto all’originale, che è al #2,852 nella lista.
È difficile determinare l’entità del danno causato. Nulla di buono può venire da questo, ma quanto è grave?
Amazon ha politiche in atto che le permettono di rimuovere qualsiasi libro che non riesca a “fornire una esperienza positiva al cliente.” Le linee guida per i contenuti Kindle vietano “contenuti descrittivi destinati a ingannare i clienti o che non rappresentano accuratamente il contenuto del libro.” Possono anche bloccare “contenuti che tipicamente deludono i clienti.” È il volume stesso che sconfigge i sorveglianti di Amazon? O c’è un’altra ragione?
Bias
I LLM sono addestrati su ciò che è già stato pubblicato online. Ciò che è stato pubblicato online è pieno di bias e quindi i LLM riflettono quel bias. E ovviamente non solo bias, ma odio, riflesso nei suoi apprendimenti, e ora un potenziale output in parole e immagini generate dall’IA. Il porno è un altro beneficiario naturale della notevole capacità dell’IA con le immagini, e ci sono recenti storie preoccupanti di giovani donne che trovano immagini nude fabbricate, con i loro compagni di classe maschi come probabili sospetti. The New York Times ha riportato separatamente un aumento delle immagini online di abusi sessuali su minori.
Autori ed editori devono essere consapevoli di queste limitazioni intrinseche quando usano strumenti IA.
La Creatività può essere un Cliché
La questione se le macchine possano essere veramente creative rimane un argomento di acceso dibattito. Dipende in parte da come definiamo la creatività. |
“Le IA non saranno mai creative.” Questo è un mantra familiare.
Tutti noi sappiamo cos’è la creatività, vero?
Cambridge: “la capacità di produrre o utilizzare idee originali e insolite.”
Britannica: “la capacità di creare o portare all’esistenza qualcosa di nuovo, che sia una nuova soluzione a un problema, un nuovo metodo o dispositivo, o un nuovo oggetto o forma artistica.”
Non contesto che la creatività, in questo senso, sia ben oltre la portata dei LLM.
Il mio argomento è che la maggior parte di ciò che viene spacciato per creativo—e spesso appare abbastanza creativo—-è, in realtà, iterativo. Il che funziona perfettamente per molte cose, inclusa la maggior parte della pubblicità.
Ma sollevare lo stendardo della ‘creatività’, e poi sminuire i LLM, è porre una barriera impossibilmente alta, a cui l’IA fallisce invariabilmente. Quindi le persone lo liquidano come “beh, te l’ho detto che non è creativo.”
E così facendo, ignorano le cose iterative in cui è molto brava.
Pubblicherò un lungo saggio su questo argomento nel prossimo futuro, dopo aver finito di leggere:
The Creativity Code, di Marcus du Sautoy, e
The Artist in the Machine, di Athur I. Miller
Literary Theory for Robots, di Dennis Yi Tenen
Un Altro Pensiero
Jeremiah Owyang è un analista del settore basato nella Silicon Valley. È un sostenitore dell’IA, ma ha già visto altre volte il clamore. Nota che “non ha mai visto un’evoluzione così rapida in così poco tempo.”
Come dice Owyang, piccoli team di programmatori ora possono usare i LLM per assemblare “creature senzienti”—come un bambino di 4 anni—in due giorni. Sono in grado di:
‘Vedere’ con la visione artificiale, cosa sta succedendo nel mondo reale,
‘Sentire’ tramite comandi vocali e suoni ambientali nel mondo reale,
‘Pensare’ elaborando l’input del mondo reale sopra descritto,
‘Imparare’ accedendo ai dati pre-addestrati,
‘Fare riferimento’ a set di dati esclusivi,
‘Parlare’ con voci audio realistiche, che hanno inflessione e tono in qualsiasi lingua,
‘Scrivere’ tramite comunicazione testuale, in qualsiasi formato o stile richiesto,
‘Disegnare’ creando immagini spontaneamente, e
‘Interagire’: può impegnarsi proattivamente in dialogo, fare domande o assegnare agenti IA per completare compiti da soli.
Questo è straordinario e senza precedenti. Avrà rilevanza per l’editoria? Decidete voi.
Cose Buone al di Fuori dell’Editoria
L’IA è alla base di alcuni risultati rivoluzionari al di fuori dell’editoria. La medicina è il fiore all’occhiello dell’IA, ma ci sono anche storie potenti da altri settori. La rilevanza per l’editoria deriva da una domanda retorica: l’IA può salvare vite. Ma non pensate che possa aiutare gli editori?
L’obiettivo di questa breve sezione è semplicemente contrastare l’argomento che, non convinti che l’IA aiuterà l’editoria, l’IA possa aiutare qualcuno in generale?
IA e medicina
Leggendo un numero di marzo 2024 dell’Economist, ho approfondito il suo supplemento tecnologico sulla salute e l’IA. Negli ultimi anni, la medicina è costantemente apparsa come il punto di forza dell’intelligenza artificiale. La maggior parte dei rapporti sono positivi. Ma comunque il servizio dell’Economist vi lascerà a bocca aperta. Esprimono numerose riserve ben articolate. Ma leggerete anche che l’IA in medicina “rappresenta un’opportunità per migliorare la vita di centinaia di milioni, persino miliardi.”
Un’altra domanda retorica per coloro che vorrebbero vietare la tecnologia IA, o almeno imporre una moratoria sul suo sviluppo: sacrifichereste il suo potenziale valore per la salute di milioni per soddisfare la vostra ansia su un futuro incerto?
IA e TSA negli aeroporti
Ci siamo stati: le file interminabili, il lento movimento del nostro bagaglio a mano attraverso gli scanner a raggi X.
I fallimenti nella rilevazione da parte della TSA sono ben documentati, ma non molto discussi.
Quello che mi turba di più sono i lavoratori tristi, che fissano i loro schermi per ore e ore. Per cosa? Non solo è un lavoro miserabile, ma, come semplici mortali, non sono molto bravi a farlo.
Entra l’AI. Se può individuare tumori difficili da rilevare nei polmoni, sono sicuro che può individuare il contrabbando nei bagagli a mano. E sollevare gli esseri umani da un compito ingrato che non sono adatti a gestire.
Secondo questo resoconto, il nuovo programma di screening assistito dall’AI della TSA è in corso.
Saggio: L’Impatto dell’AI sull’Industria dell’Editoria
Di recente stavo parlando con Peter Brantley, il mio partner nei seminari sull’AI, su come potremmo plasmare i prossimi programmi di AI. Peter lavora gran parte del tempo all’interno della comunità bibliotecaria, ed era appena tornato da un evento di un’intera giornata a Los Angeles con circa 150 dei suoi colleghi bibliotecari, dove hanno esplorato, di persona, il potenziale impatto dell’AI sul loro settore. La conversazione è stata vivace e approfondita. Perché, si domandava, gli editori di libri commerciali non hanno incontri come questo? L’AI è un argomento in ogni evento editoriale: perché non è l’argomento?
Le conseguenze nel mondo reale dell’AI
La risposta che ha trovato è che gli editori di libri commerciali non hanno ancora concluso che l’AI avrà delle conseguenze nel mondo reale sul loro business. Sul cuore del loro business. Sulla loro capacità di condurre affari. Certo, potrebbe aiutare a scrivere un comunicato stampa o a redigere una lettera di rifiuto di un manoscritto, ma presumono che l’editoria continuerà a funzionare come ha fatto per decenni, con il tempo medio dal contratto al libro stampato che si trascina fino a due anni.
Allo stesso tempo, gli editori ovviamente affrontano sfide a breve termine più urgenti dell’AI. Prezzi della carta. Costi di spedizione. Margini in diminuzione. Vendite per lo più stabili in generale. Con tutte queste pressioni, chi ha il tempo o la capacità di preoccuparsi dell’AI?
Ma le altre industrie creative lo capiscono. L’arte e il design lo capiscono. La pubblicità lo capisce. Hollywood vede cosa sta arrivando, così come l’industria musicale. I giornalisti osservano con timore.
Altri settori dell’editoria stanno iniziando a comprendere l’impatto dell’AI. L’editoria accademica è profondamente immersa nella tecnologia. Ma gli editori di libri commerciali si comportano come se ci saranno poche conseguenze reali dall’AI.
Quali potrebbero essere le conseguenze nel mondo reale? Impatterà sull’offerta di libri? O sulla domanda di libri?
Offerta: Sì, l’AI è il colpevole dietro una serie di nuovi libri spazzatura su Amazon. Centinaia? Certamente. Migliaia? Forse. Milioni? No. Quanti libri ci sono su Amazon? Più di 50 milioni. È già molto affollato.
A parte questo, è chiaro che nel breve termine, l’AI non scriverà interi libri che le persone vorranno effettivamente leggere. Il suo valore finora è come compagno di scrittura—critica, suggerisce, occasionalmente produce qualche paragrafo di testo utilizzabile. No, nel breve termine, l’AI non cambierà radicalmente i risultati dell’editoria, l’offerta di nuovi libri.
Domanda: No, nessuno sta chiedendo libri generati dall’AI. Non è un fattore. E non riesco a prevedere alcuno scenario in cui l’AI influenzerà la domanda di libri in modo più ampio.
Che dire del processo di pubblicazione? Sì, quello cambierà. Almeno un po’. Come abbiamo scoperto al nostro evento sull’AI di Publishers Weekly lo scorso autunno, gli editori stanno cercando l’AI per un aiuto qua e là: marketing, editoria, un po’ di questo e un po’ di quello.
È possibile che ci saranno poche conseguenze reali dell’IA sull’editoria libraria commerciale? Forse è solo un giocattolo.
Quindi facciamo un passo indietro dalle erbacce dell’IA e rivisitiamo lo stato travagliato dell’editoria commerciale, e attraverso questo, approfondiamo dove l’IA è probabile che abbia il suo maggiore impatto.
L’editoria è in declino economico da decenni
Secondo varie stime, l’intera industria editoriale negli Stati Uniti ha vendite annuali inferiori a $35 miliardi. Anche se fossero $40 miliardi, le vendite annuali di Apple Computer sono 10 volte più alte. Il profitto lordo di Apple è il 44% delle vendite, insieme a profitti netti del 25% delle vendite. L’editoria non osa nemmeno sognare margini come questi.
L’editoria libraria commerciale è in un lieve declino economico da decenni, alcuni anni in aumento di pochi punti percentuali, altri anni in calo. A metà del 2024 le vendite sembrano solide anno su anno, ma questo è il tipo di amore estivo che i redattori conoscono bene. Alcuni anni vinciamo, altri perdiamo, ma, nel complesso, l’editoria libraria commerciale non è un’industria in crescita.
Nel 2023, secondo il rapporto StatShot di AAP, “i ricavi commerciali sono diminuiti dello 0,3%, a $8,9 miliardi per l’anno solare.” Per quanto posso dire, i dati di AAP non considerano l’inflazione. Con un’inflazione del 3,4%, il calo delle vendite sarebbe del 3,6%, più vicino al calo del 2,6% nelle vendite unitarie riportato da Circana.
Senza la crescita dei formati alternativi, ebook e audiolibri, l’industria potrebbe essere in pessime condizioni. Gli ebook sono stati un motore di crescita per anni. Le vendite di audiolibri continuano a salire, in aumento di quasi il 15% nel 2022 e un altro 9% nel 2023. Sì, parte di ciò è vendita di sostituzione, ma molti dei clienti per ebook e audiolibri sono nuovi clienti, non necessariamente lettori abituali di libri. Gli ebook e gli audiolibri hanno rappresentato il 21% delle vendite commerciali l’anno scorso. Tutti questi clienti comprerebbero libri stampati se la stampa fosse tutto quello che c’era disponibile?
Il prezzo al dettaglio sta diventando una preoccupazione crescente poiché i costi e gli sconti al dettaglio e all’ingrosso stringono i margini dei redattori. Studi accademici suggeriscono che ci sia un grado di elasticità dei prezzi per i libri, ma sicuramente stiamo raggiungendo il punto di resistenza: i bestseller con copertina rigida stanno andando incontro a quello che potrebbe essere un tetto di $35. La “fatica da abbonamento” sta causando ai clienti del video on demand di abbandonare i servizi, concentrati sul crescente costo di ciascuno. Il piano Premium di Netflix ora arriva a $22,99/mese; il Disney Plus Duo Premium è $19,99/mese. Come mi ha recentemente detto un collega, quanti abbonati a corto di soldi diranno, oh, cancelliamo il nostro abbonamento a Netflix così posso comprare un libro il mese prossimo?
Stipendi nell’editoria libraria
Non voglio infierire: non sono solo gli autori a lottare per guadagnarsi da vivere—il personale editoriale è grossolanamente sottopagato rispetto a professioni comparabili.
Tengo una rappresentativa gamma di recenti annunci di lavoro editoriali. Sto guardando uno, per un Marketing Manager presso un editore commerciale che ha riportato vendite per poco più di $30 milioni nel 2023. La posizione paga tra $60.000 e $70.000 per anno. Eccone un altro, per un Publicity Manager presso uno degli imprint di un editore che riporta $750 milioni di vendite annuali. “Questo ruolo avrà uno stipendio annuale di $74.000–$79.000,” nota l’annuncio.
Secondo le U.S. Bureau of Labor Statistics National Occupational Employment and Wage Estimates, i responsabili marketing guadagnano, in media, in tutti i settori, $166,410. I guadagni medi dei “responsabili delle relazioni pubbliche” sono di $159,420.
L’editoria libraria non è nemmeno in gioco. Questo non è una novità per chi lavora nell’editoria. È sempre stato così. Ma l’editoria può sostenersi a questi livelli di retribuzione? L’incapacità di offrire ai candidati anche solo la metà dello standard di retribuzione non promette bene per un’industria sempre più digitale.
In un’epoca di TikTok, YouTube, social media, SEO, metadati e piattaforme per autori, che diavolo è comunque un “responsabile della pubblicità”?
I tre (e mezzo) vantaggi rimanenti per gli editori di libri tradizionali
Tre vantaggi persistenti per gli editori di libri tradizionali sono (i) il prestigio, (ii) l’accesso ai principali media e (iii) l’accesso alla distribuzione nelle librerie. Questo non si applica in egual misura a tutti gli editori tradizionali: i più grandi hanno più di ciascuno: più prestigio, un miglior accesso ai principali media e maggiori opportunità di far arrivare i loro libri sui tavoli principali del maggior numero di librerie. Ma, presi insieme, questi sono i vantaggi caratteristici dell’industria editoriale tradizionale.
Un altro valore che gli editori possono offrire è una lista curata di titoli complementari, dove ogni singolo titolo beneficia dei suoi compagni. Pensate a un editore come Fox Chapel, specializzato in libri sui mestieri: se vi piace uno dei loro titoli, c’è una ragionevole possibilità che guardiate attentamente gli altri loro libri (e riviste) sullo stesso argomento, anche se scritti da altri autori.
Questo si sovrappone a qualcosa che solo pochi editori sono riusciti a sviluppare, un marchio vendibile. Pensate a serie come “For Dummies” di Wiley, o “Very Short Introductions” di Oxford. Il marchio trasmette una coerenza di approccio editoriale e qualità che incoraggia i lettori ad acquistare più titoli. Gli auto-pubblicatori spesso lanciano le proprie serie brevi, principalmente per la narrativa, anche se non possono abitare l’ampiezza di questi cataloghi di editori più grandi.
Tutti gli altri servizi che gli editori tradizionali forniscono possono essere acquistati sul mercato aperto, con qualità simile, a prezzi accessibili (ad esempio, funzioni editoriali, di design, di produzione e di marketing essenziale). E, per gli auto-pubblicatori, il reddito per libro venduto è cinque volte o più maggiore rispetto ai tradizionali programmi di royalty.
Approfondirò un po’ di più su questo in un breve appendice alla fine di questo libro. Ma lasciatemi rapidamente sminuire il valore dei tre principali vantaggi. Il prestigio è buono per vantarsi, ma ha un modesto valore monetario. Le recensioni di libri e altre esposizioni nei principali media ora hanno un impatto notevolmente diminuito sulle vendite di libri. E le librerie rappresentano circa il 15% delle vendite del settore (e molto meno per gli autori auto-pubblicati): non sono più fondamentali per il successo di un libro.
Le cose sono cambiate.
Auto-pubblicazione
L’auto-pubblicazione è stata il principale motore di crescita nel settore dei libri di consumo (trade) nell’ultimo decennio e più. I dati di vendita accurati sull’auto-pubblicazione rimangono nascosti: è facile ignorarne l’importanza. Ma i dati disponibili mostrano che l’auto-pubblicazione rivendica una porzione sostanziale del mercato editoriale trade.
Come ha notato (in parte) famosamente Michael Tamblyn, CEO di Kobo, “Uno su 4 libri che vendiamo in inglese è un titolo auto-pubblicato, il che significa che, effettivamente, per noi, l’auto-pubblicazione è come avere un altro Penguin Random House nel mercato che nessuno vede. È come la materia oscura dell’editoria.”
Le tendenze all’interno del mercato dell’auto-pubblicazione sono probabilmente le uniche tendenze significative nell’editoria trade. Gli autori auto-pubblicati stanno mostrando la strada. Sono avventurosi e non vincolati dalle consuetudini dell’industria tradizionale. Molti sono fluenti con i social media. Sono vicini ai loro lettori, ai loro clienti. Se vuoi imparare le ultime tecniche di marketing, segui i forum degli autori, i blog e le newsletter.
Approfondisci le statistiche sui redditi degli autori, l’economia della scrittura, e poi confronta il declino dei redditi degli autori pubblicati tradizionalmente contro i guadagni degli autori auto-pubblicati. In un sondaggio e rapporto internazionale che ho condotto con Steve Sieck per ALLi, nel 2023 (pdf), abbiamo scoperto che “il reddito mediano derivante dalla scrittura e dall’auto-pubblicazione nel 2022 di tutti gli auto-pubblicatori che hanno risposto era di $12,749, un aumento del 53% rispetto all’anno precedente. I redditi medi (media) erano molto più alti: $82,600 nel 2022, un aumento del 34%.”
In a separate survey, condotto da Peter Hildick-Smith per la Authors Guild, “gli autori auto-pubblicati a tempo pieno, che pubblicavano almeno dal 2018, hanno riportato un reddito medio di $24,000 rispetto a $13,700 nel 2018, un aumento del 76 percento.”
Editori ibridi
Per completezza, voglio anche menzionare gli editori ibridi. Sono diventato sempre più entusiasta del modello ibrido, e il segmento degli editori ibridi è significativo e in crescita. Nessuno stima le vendite ibride separatamente. Ma l’impatto si vede chiaramente nel loro dominio di due categorie: libri di celebrità e libri aziendali popolari. Queste categorie sono state a lungo fonti di reddito affidabili per gli editori commerciali, ma i “servizi di concierge” degli editori ibridi, e una condivisione dei redditi molto più favorevole, sono irresistibili per molti autori di alto profilo.
Casi recenti, come il rapporto di condivisione dei profitti di Authors Equity con i suoi autori, e la condivisione dei profitti al 50/50 di Keila Shaheen con Simon & Schuster, suggeriscono una tendenza verso la normalizzazione del modello ibrido. Questa è una buona notizia per gli autori; meno promettente per gli editori tradizionali.
Pubblicare oltre gli editori
Sto co-scrivendo un rapporto con Rüdiger Wischenbart, basato sul suo studio originale “Publishing Beyond Publishers.” Stiamo cercando di comprendere, e di quantificare, nel miglior modo possibile, tutte le attività di pubblicazione librarie, in tutto il mondo, che potrebbero (e dovrebbero) essere incluse come parte di una visione più completa dell’ecosistema editoriale moderno.
Una volta che si va oltre il contenitore librario, si intravedono scorci di dove l’IA potrebbe davvero fare la differenza.
L’esempio emblematico del nostro progetto è Wattpad, dove “97 milioni di persone trascorrono oltre 23 miliardi di minuti al mese immersi in storie originali.” Le storie vengono vissute online, principalmente su smartphone, in brevi frammenti. Pochi diventano libri pubblicati. È altrettanto probabile che trovino la loro strada in “Wattpad WEBTOON Studios, le controparti della compagnia per TV, film e editoria.”
I lettori più giovani sono più sintonizzati sulla lettura digitale online rispetto ai loro fratelli maggiori. Secondo un sondaggio di Wattpad di gennaio 2024, “i formati digitali sono sempre più popolari tra le generazioni più giovani, con il 65% della Gen Z e il 71% dei Millennials che abbracciano webnovels, ebook e webcomics, mentre meno della metà delle generazioni Gen X e Boomer affermano lo stesso.”
E, naturalmente, come l’industria editoriale tradizionale sta ora imparando: “La diversità è un fattore chiave per abbracciare i formati digitali: il 61% della Gen Z e il 70% dei Millennials concordano sul fatto che ebook, webnovels e webcomics danno loro accesso a contenuti più difficili da trovare nelle librerie e nelle biblioteche, inclusi contenuti LGBTQ+ e incentrati sulle minoranze.”
Wattpad ha dei concorrenti, tra cui Inkitt, che, secondo Publishers Weekly, di recente ha raccolto $37 milioni da investitori “tra cui Stefan von Holtzbrinck, il proprietario del Holtzbrinck Publishing Group, che possiede Macmillan, e l’ex CEO di Penguin Michael Lynton; ha ora raccolto un totale di $117 milioni in investimenti. A febbraio 2023, il Financial Times ha detto che Inkitt era l’ottava azienda in più rapida crescita in Europa, e la #1 in Germania.” Un articolo del 9 luglio su Esquire ha delineato l’uso dell’IA da parte di Inkitt, il suo ruolo nel loro successo.
Quanti di voi hanno mai sentito parlare di Inkitt, visitato la sua piattaforma di pubblicazione o scaricato la sua app di lettura Galatea?
Ma il nostro rapporto “Pubblicazione Oltre gli Editori” va oltre le piattaforme di storie online per considerare come “il contenuto possa essere creato e diffuso in una varietà di formati (stampa, digitale), media (libri, audio, film, giochi), canali di distribuzione (comunità, piattaforme, flussi) e modelli di business (vendite di prodotti, abbonamenti, streaming, freemium, modelli a pagamento) in catene di fornitura e marketing principalmente definite digitalmente.” Quante opportunità stanno perdendo gli editori di libri perché non si adattano ovviamente al loro modello di business attuale?
Innovazione, tecnologia e pubblicazione di libri
Con l’eccezione degli ebook, la pubblicazione moderna non ha mai affrontato una minaccia dalla tecnologia. (Gli audiolibri digitali sono stati accolti più con gioia che con apprensione.) L’alba dell’era di Internet ha offerto agli editori più opportunità che minacce; è solo un singolo rivenditore, Amazon, abilitato da Internet, che ha sconvolto il carrello delle mele.
Non ho mai visto uno studio su se Amazon sia stato (quando tutti gli aspetti delle sue operazioni e del suo impatto sono pienamente considerati) un beneficio netto per l’industria della pubblicazione di libri. Raggiunge molti acquirenti che non sono serviti dai negozi fisici ed è disposto a sacrificare il margine per mantenere i prezzi bassi. Gli ebook e gli audiolibri vengono consegnati su larga scala. Ma Amazon è in grado di tagliare i prezzi in parte perché richiede sconti e commissioni elevate dai fornitori e soffoca altri canali di vendita al dettaglio. Ci sono compromessi dolorosi.
Tuttavia, non provare a criticare Amazon davanti a un autore auto-pubblicato. Non sarebbero in affari senza The Everything Store.
Il dilemma dell’innovatore
Per ottenere una prospettiva sull’impatto imminente dell’IA sulla pubblicazione di libri, raccomando The Innovator’s Dilemma: When New Technologies Cause Great Firms to Fail di Clayton Christensen, pubblicato per la prima volta nel 1997 dalla Harvard Business Review Press.
Christensen esamina come le aziende esistenti (incumbenti) possono soccombere alle forze dell’innovazione.
Le aziende di successo e ben gestite spesso falliscono quando i cambiamenti dirompenti arrivano nella loro industria. Le pratiche di gestione convenzionali, che le avevano aiutate a diventare leader del settore, rendono difficile per queste aziende essere agili nel confrontare le tecnologie dirompenti che potrebbero cannibalizzare i loro mercati.
Ignorano i prodotti generati dalle tecnologie dirompenti, perché, a prima vista, si confrontano male con i loro prodotti esistenti. I loro clienti più redditizi generalmente non possono usare le presunte innovazioni e non le vogliono. Le aziende cercano di combattere le minacce dirompenti raddoppiando sui prodotti e servizi esistenti.
L’intuizione chiave di Christensen è che facendo apparentemente la cosa ‘giusta’, incluso ascoltare i clienti, le aziende di successo si lasciano ampiamente aperte all’innovazione dirompente. Si concentrano sui loro clienti attuali e ignorano importanti nuove tecnologie, che inizialmente mirano a mercati piccoli e meno redditizi. Ciò crea un’apertura per le startup agili per sconvolgere i leader.
Chris Dixon, discutendo del libro, sottolinea che “il motivo per cui le grandi novità sfuggono agli incumbenti è che la prossima grande cosa inizia sempre per essere respinta come un ‘giocattolo’.” Hmm, sì, molte persone vedono Chat AI come un giocattolo.
Gli editori stanno fallendo nel riconoscere che le innovazioni costruite con l’IA generativa potrebbero sconvolgere il loro fragile modello di business?
Narrativa versus saggistica
L’impatto dell’IA sulla pubblicazione di libri avrà sicuramente un impatto drammaticamente diverso sulla pubblicazione di narrativa rispetto alla saggistica.
L’industria della pubblicazione di libri non viene spesso analizzata come due industrie biforcate, una che pubblica libri di narrativa e un’altra che pubblica saggistica.
Sebbene la maggior parte degli editori commerciali offra sia titoli di narrativa che di saggistica, il divario a livello industriale tra le due forme è netto sia nel numero di titoli pubblicati che nelle vendite di libri. Le stime variano, ma i titoli di narrativa rappresentano solo circa il 10% dei libri pubblicati ogni anno. Le vendite, tuttavia, favoriscono ampiamente la narrativa. Ancora una volta, ci sono spostamenti anno per anno, ma la narrativa cattura circa la metà delle vendite annuali di libri commerciali. L’anno scorso 21 dei 25 bestseller erano di narrativa. Utilizzando la compilazione di Wikipedia, dei libri in inglese che hanno venduto 20 milioni di copie o più, l’84% sono titoli di narrativa.
Le tendenze delle vendite di libri sono notoriamente volubili, ma le vendite di narrativa sembrano essere su una pendenza continua verso l’alto. Dopo aver toccato il fondo al 32% nel 2019, hanno raggiunto il 40% del mercato adulto nel 2022 e sono cresciute leggermente di nuovo nel 2023. Le vendite di narrativa per adulti sono aumentate di un ulteriore 6,3% nella prima metà del 2024.
Mentre l’Intelligenza Artificiale sarà sempre più utilizzata dagli autori di narrativa per aiutare nel processo di creazione, come discusso altrove, sembra improbabile che le storie generate dall’IA dominino le classifiche dei bestseller. È concepibile un “abbastanza buono” per alcune fiction di genere, ma non qualcosa che dovrebbe dare notti insonni ad autori e editori.
La scrittura e la pubblicazione di saggi, d’altra parte, saranno assistite e sostenute dall’IA in tutto il settore. Sta già accadendo. Gli autori di saggistica stanno sfruttando i numerosi talenti di Chat AI sia come assistente di ricerca che come aiuto per la scrittura. E gli editori di saggistica richiederanno sempre più l’aiuto di Chat AI per lo sviluppo dei manoscritti, il controllo dei fatti, la modifica, il marketing e la distribuzione.
Esiste una minaccia esistenziale per gli autori?
Ho parlato con un agente di autori molto intelligente, che ha riflettuto molto su cosa significhi l’IA per i suoi clienti e per tutti gli autori professionisti. La conversazione si è spostata sull’idea del libro come un “contenitore”, e le ho chiesto di espandere questa idea. La sua risposta:
“L’idea di base è che quando autori/agent sono in trattativa con un editore per un libro, è solo questo: un libro. C’è la comprensione che potrebbe diventare una delle innumerevoli forme di opere derivate che conosciamo (traduzione, adattamento drammatico, graphic novel, ecc.) ma tutto questo è secondario rispetto al ‘Lavoro’ stesso. Il Lavoro non è una borsa di parole o frasi o fatti, è qualcosa strutturato dall’autore in un modo unico per quell’autore. Rompere il contenitore, scuotere la borsa di lettere di Scarabeo e tirare fuori una selezione casuale (che non è del tutto casuale perché è una borsa di Scarabeo composta dalla sintassi e semantica e dallo stile del particolare autore), non è ciò che viene considerato quando concediamo i diritti a un editore.
“Il libro è l’integrale che è più della somma delle sue parti. È il prodotto di un’epifania creativa (e una tonnellata di lavoro intellettuale creativo) che l’ha portato a essere un libro, non solo ‘un’ libro, ma il libro di quell’autore particolare.”
I libri contengono tesori
Quando penso ai libri di saggistica, rompere il contenitore è uno dei vantaggi dell’era dell’IA. Rompi il contenitore, e come le uova Fabergé, ci sono tesori contenuti all’interno.
I vincoli del contenitore sono sia una caratteristica sia un inconveniente. Da un lato “il Lavoro non è solo una borsa di parole o frasi o fatti, è qualcosa strutturato dall’autore in un modo unico per quell’autore.” Dall’altro, nel creare il contenitore, l’autore, per via delle limitazioni intrinseche del contenitore libresco, è stato costretto a ridurre, rifiutare, riscrivere e riconfigurare. Il lavoro è rifinito, ma è distillato, e alcune cose sono andate perdute (mentre altre sono state guadagnate) lungo il percorso.
Le persone non leggono lunghi libri di saggistica in parte perché sono condizionate a scorrere tutto il testo che incontrano sul web, incluse le loro email. Anche il modello del “riassunto del libro” fallisce: invece di un libro di saggistica indigeribile di 250 pagine, ottieni un riassunto indigeribile di 8 pagine del libro.
I libri sono come scatole per il pranzo: tutto il materiale in un unico posto. Ma io voglio solo i biscotti.
Non sarà facile per gli autori affermati liberarsi delle loro catene. Ma potrebbero dover imparare a farlo, o rischiare di essere oscurati da una nuova generazione di ricercatori e scrittori abili che possono esprimersi con o senza contenitori formali, a seconda delle necessità. I contenitori impongono troppi limiti e limitazioni.
In definitiva, il mondo della scrittura è cambiato irrevocabilmente. È come la fine degli scribi. In questo caso, i nostri autori monastici devono uscire da dietro le loro scrivanie e dalla loro visione conteniorizzata del libro, e interagire con la forma e con i loro lettori.
Oh sì, conosco bene le risposte degli autori: Ma io sono uno scrittore, non sono un promotore. Non sono sui social media. Non ho interesse a comunicare effettivamente con i miei lettori se non tramite il mio lavoro e con occasionali email e apparizioni sempre più occasionali. Ho un sito web (ma, a dire il vero, non lo aggiorno mai). Il mio lavoro è il mio dono ai lettori. Possono accettare il mio lavoro, o rifiutare il mio lavoro, ma non mi unirò a loro nei loro salotti.
Bene, puoi mettere via i rotoli e l’inchiostro fatto con il sangue delle ermelline. L’occupazione di ‘autore’ ora richiede che tu esca da dietro la tua scrivania e incontri i tuoi lettori dove vivono, nei loro salotti e sulle loro pagine Facebook. Puoi lamentarti quanto vuoi, mentre chiudiamo i tuoi finanziamenti e la tua cattedra e le tue opportunità di pubblicazione. Questo è il nuovo coraggioso mondo degli scrittori e dei lettori, senza editori, quei terribili intermediari che lavorano duramente per migliorare il tuo lavoro, ma che costantemente interrompono la tua connessione diretta con i lettori, le persone che lo apprezzano di più.
Niente di tutto questo preclude che grandi libri di narrativa non fiction raggiungano un pubblico attento. Au contraire. Quei libri possono continuare a brillare. Ci saranno ancora best seller di non fiction, anche se l’economia sarà impossibile per tutti tranne che per i più venduti. Il modello attuale non deve scomparire perché il nuovo modello prosperi.
Penso a questi grandi libri di non fiction come ‘belli.’ ‘Belli’ nel senso di ben scritti, attentamente curati, progettati con cura e deliberazione, e stampati, con bordi sfrangiati, su carta certificata FSC. Sono venduti in boutique.
Le boutique si chiamano ‘librerie,’ ma hanno tutte le caratteristiche della vendita al dettaglio di boutique: oggetti incantevoli, scelti con cura dal proprietario e dai gestori, un po’ costosi, ma per chi apprezza tali oggetti, ben vale il costo.
Il compito della maggior parte degli autori di non fiction ora è di andare oltre il contenitore, così come l’editore come guardiano.
Contenitori di contenuti in media multipli
Il pubblico di lettori, in particolare i suoi membri più giovani, è sempre più ‘agnostico ai media.’ In cerca di intrattenimento o conoscenza, possono guardare un video su YouTube o TikTok, una serie su Netflix, ascoltare su Spotify, scorrere su Instagram (“Insta”), aggiornarsi sulle notizie, o, occasionalmente, leggere un libro.
(Gli abitanti che accarezzano i libri di BookTok sono un gruppo di influenzatori prezioso, ma hanno un impatto modesto sul mercato in generale.)
Eppure il modello di mercato è ancora focalizzato sul contenitore unico. L’industria editoriale. L’industria cinematografica. L’industria televisiva. L’industria musicale.
I film non sono libri. I video di YouTube non sono film. I podcast non sono audiolibri.
Questi silos non erano un’inevitabilità storica ma il risultato di una serie di decisioni aziendali prese da organizzazioni potenti nel tempo.
Non è difficile interrompere un modello di business costruito su un singolo contenitore.
Per tutta la sua facilità con il linguaggio, l’attuale generazione di AI generativa compie la sua magia con ancora più spavalderia producendo suoni, immagini e video. L’AI fornisce a questo libro audiolibri, in più lingue, insieme alle 31 traduzioni dell’ebook. Niente di tutto questo sarebbe nemmeno lontanamente possibile senza l’AI: l’economia della produzione tradizionale non ha senso per me.
Silos di contenitori
I creatori di contenuti sono tradizionalmente addestrati per eccellere in un solo silo di contenitori. Abbiamo programmi di scrittura e programmi di cinema e programmi di musica. Raramente ci accade che gli scrittori creativi possano anche prendere una ‘minore’ in cinema o musica. O in programmazione per computer o nello sviluppo di app.
Che fine ha fatto il transmedia? Dove sono i programmi che insegnano ai creativi a essere, come Apple una volta li descriveva, “Maestri dei Media Digitali”?
Il miglior contenuto vincerà sempre. Ma, nel tempo, i contenitori di contenuti contano sempre meno. La generazione digitale potrebbe non essere agnostica ai contenitori. Ma sono flessibili ai contenitori. Incontrano la maggior parte dei loro contenuti digitalmente, tramite smartphone. La stampa continuerà a trovare un pubblico, ma non comanderà mai più il centro.
Il “editore del futuro” deve anche essere flessibile ai contenitori. La maggior parte della crescita nella distribuzione dei contenuti non avviene tramite inchiostro su carta, né parole in file EPUB. La crescita degli audiolibri non è un caso, né è la popolarità di YouTube e TikTok.
La sfida più grande risiede nella necessità di rendere scopribile il contenuto nuovo ed esistente, qualunque sia la sua forma, e poi, una volta scoperto, trasformare la consapevolezza in una decisione di acquisto.
Scoperta e conversione
Il problema della scoperta online è con noi da un po’ di tempo; l’AI non l’ha creato. Il problema è uno che il veterano dell’industria Mike Shatzkin ha evidenziato più di una volta. Ci sono così tanti titoli disponibili in stampa, e i formati digitali permettono loro di rimanere continuamente in stampa. Milioni di libri fuori stampa possono essere trovati presso rivenditori di libri usati. In aggiunta a ciò, vengono pubblicati ogni anno due milioni o più nuovi libri, solo in inglese. L’AI peggiorerà il problema della saturazione, ma è già fuori controllo.
Gli algoritmi di Amazon non sono disinteressati: fanno un ottimo lavoro nel far emergere ciò che è vendibile, il libro che probabilmente acquisterai dopo. Quel libro non è caratterizzato solo dalle sue cifre di vendita. Ha venduto meglio non perché qualche truffatore ha ottimizzato l’elenco online. Ha venduto meglio perché era il migliore, e i lettori soddisfatti hanno detto ad altri di comprarlo, sia online che di persona. (Amazon ha incoraggiato la pubblicità che distorce i suoi algoritmi, parte dell’enshittification della piattaforma.)
Ho parlato sopra dei metadati. La conversione è tanto fastidiosa quanto la scoperta. Può l’IA aiutare gli autori a trasformare i navigatori in acquirenti?
Il futuro del diritto d’autore
Il concetto di diritto d’autore è stato reso assurdo dall’IA. Non è che la gente non voglia o non meriti protezione per il proprio lavoro — si potrebbe dire che lo meritano più che mai. E non è che l’IA renda il diritto d’autore inapplicabile (almeno in qualche forma, se non nella forma attuale).
È che la “protezione del diritto d’autore” diventa anche un velo dietro il quale il tuo lavoro scompare. Se il tuo libro non può essere referenziato tramite una conversazione con ChatGPT, de facto, non esiste. Le aziende di IA licenzieranno solo il crème de la crème dei contenuti. Non hanno bisogno del latte scremato.
Perché proteggere ciò che non può essere trovato?
È qui che il problema della scoperta potrebbe diventare una catastrofe. Google fa un ottimo lavoro nel scoprire i libri solo attraverso i loro metadati. L’IA vuole l’intero “burrito”. A differenza dei motori di ricerca tradizionali, l’IA non risponde alle query degli utenti basandosi solo sui metadati astratti di un’opera.
Allo stesso tempo, i contenitori di contenuti che cambiano, contenitori diversi dai libri interi, suggeriscono diversi tipi di sfide del diritto d’autore. Se il testo di un libro può cambiare al volo, in risposta all’input del lettore, qual è allora il diritto d’autore del testo?
Scrittori e lettori
Gli editori hanno bisogno degli autori; gli autori non hanno bisogno degli editori.
Il futuro dell’editoria è la relazione intima tra scrittori e lettori. È molto più forte della relazione tra scrittori ed editori e lettori ed editori. Gli editori possono essere un ostacolo nella relazione tra scrittori e lettori. In molti casi non facilitano la relazione; la ostacolano.
Per molto tempo, l’unico modo per accedere a contenuti scritti di alta qualità era attraverso i libri o tramite una modesta selezione di periodici. Questo certamente non è più il caso. A parte le distrazioni di altri media, ci sono ora tanti modi diversi per accedere a contenuti scritti di alta qualità (non containerizzati). I libri non detengono più la primazia che un tempo godevano.
L’IA può comunicare
“Qual è il libro perfetto da leggere per me, adesso?” L’IA generativa può rispondere a questa domanda con un’eloquenza e una precisione che non sono mai state possibili prima. Man mano che l’IA diventa un motore di raccomandazione affidabile, gli autori dovranno comunicare attraverso quel motore. (Amazon, naturalmente, sta lavorando a questo, e ha il vantaggio di sapere cosa hai acquistato in precedenza.)
Conclusione
Allora, dove ci lascia tutto questo?
Ho sentito il bisogno di catalogare le sfide che l’editoria deve affrontare. L’IA di chat sta arrivando in un momento in cui l’editoria commerciale è in difficoltà. Non sta arrivando in un momento in cui l’industria è robusta e in grado di dire: “non abbiamo bisogno di questa nuova tecnologia; stiamo andando benissimo.”
Ho parlato sopra delle sfide più urgenti che l’editoria deve affrontare: costi in aumento e margini in diminuzione.
I lupi non saranno mai sazi nelle loro richieste di sconti sempre più ripidi; i margini non miglioreranno. I prezzi al dettaglio sono vicini a un tetto. Il futuro del modello attuale dell’editoria commerciale risiede nella riduzione dei costi.
Gli stipendi non possono scendere ulteriormente, quindi dovremo tagliare i costi all’interno del ciclo di produzione.
Ma gli editori stanno cercando di ridurre i costi di produzione da decenni. Ci sono stati alcuni successi notevoli, ma abbiamo esaurito le opzioni attuali.
Ho dimostrato che l’IA può portare efficienze all’editoria, lungo tutto il flusso di lavoro. Non sono istantanee e non sono facili: bisogna lavorare con l’IA. Ma l’opportunità è lì.
Gli editori non cercano di ridurre il personale, quindi l’obiettivo deve essere più libri che arrivano più rapidamente sul mercato basandosi sulle risorse del personale attuale. Gli strumenti di IA possono favorire questo obiettivo.
E, naturalmente, c’è sempre l’obiettivo di vendere più copie dei libri pubblicati. L’IA può aiutare anche in questo.
Descrivo sopra come l’IA possa anche essere trasformativa per il futuro dell’editoria.
Non preoccuparti di questo. Metti in ordine la tua casa, e ne parleremo ulteriormente.
Una Sola Risorsa
Ora c’è una fornitura quasi infinita di materiale disponibile per aiutarti a informarti sull’IA, troppo, naturalmente. Scegli il tuo mezzo preferito: libri, blog, newsletter, video, podcast, corsi e divinazione psichica. Ho collegato alcune fonti chiave attraverso questo libro, vale la pena cliccare su alcuni link casuali per vedere dove ti portano.
C’è solo un eccellente libro sull’IA per principianti, Co-Intelligence di Ethan Mollick, che è stato rilasciato all’inizio di aprile 2024. È tratto dalla sua altrettanto eccellente newsletter, “One Useful Thing.”
Nota a margine: credenziali per scrivere questo libro
Non volevo appesantire l’introduzione con queste informazioni, ma sono consapevole che molte persone sono scettiche riguardo a coloro che scrivono sull’IA oggi, sospettando che questi autori si stiano autoproclamando esperti di IA dei giorni nostri. Senza dubbio alcuni lo sono. Spero di avere credenziali accettabili per intraprendere questo progetto.
Ho letto il mio primo libro sull’intelligenza artificiale nel 1988, un libro pubblicato due anni prima, Understanding Computers and Cognition: A New Foundation for Design di Terry Winograd e Fernando Flores. Il libro è denso - gran parte di esso era al di là della mia comprensione - ma è stata la prima volta che mi sono entusiasmato per le possibilità dell’intelligenza artificiale nell’editoria.
A quel tempo ero profondamente immerso nella digitalizzazione dell’editoria, causata dall’esplosione dell’editoria desktop, dei computer Apple, di PageMaker e simili. Nel 1986 ho supervisionato lo sviluppo del software di editoria automatizzato Page One, un programma che poteva prendere un manoscritto di un libro come file Microsoft Word e comporlo in un libro intero in pochi minuti. È molto facile da fare oggi; non era facile allora.
Ho continuato a lavorare nella tecnologia editoriale successivamente, come consulente e analista, collaborando con alcuni dei principali fornitori di software e hardware, tra cui Adobe, Apple e Microsoft. Sono anche diventato coinvolto in, e coproprietario di, una società di software chiamata Enfocus. Abbiamo creato un sistema automatizzato per i flussi di lavoro pre-stampa.
Non avevamo accesso all’IA a quel punto, ma siamo diventati molto bravi a scatenare sistemi di produzione editoriale completamente automatizzati. Come l’IA può essere indistinguibile dalla magia, anche la migliore automazione può sembrare somigliare all’IA.
Avanti veloce fino al 2016, e il mio collega Cliff Guren mi ha aiutato a concentrarmi sull’IA nell’editoria: sembrava che finalmente stesse succedendo qualcosa. The Bestseller Code (Archer e Jockers) è apparso a settembre 2016, chiarendo che i computer potevano interpretare la trama della letteratura con un alto grado di intuizione e precisione.
A quel punto stavo prestando molta attenzione alle startup dell’editoria, e un piccolo numero è emerso con un certo grado di tecnologia IA integrata nelle loro offerte software.
Avanti veloce di nuovo fino a ottobre 2022.
Mesi prima che diventasse l’argomento di cui tutti nell’editoria parlavano, Tim O’Reilly ha presentato alla conferenza PageBreak su “IA e Trasformazione dell’Editoria.” O’Reilly è ben noto nella comunità editoriale, sia per O’Reilly Media che per la conferenza Tools of Change. È uno dei principali visionari della tecnologia.
O’Reilly non era semplicemente entusiasta dei nuovi progressi dell’IA, era al settimo cielo. “Siamo a un punto molto simile a come mi sono sentito quando abbiamo scoperto il World Wide Web nel 1992,” ha detto, e ha aggiunto “questo è trasformativo quanto VisiCalc, il PC e il browser web.”
Ha ammesso che (a quel punto) il caso d’uso era ancora nebuloso, indicando un paio di progetti pilota presso O’Reilly Media. Ma, ha detto, “questo sta migliorando spaventosamente in fretta. L’apprendimento automatico non è più una cosa futura. Questo riguarda la democratizzazione dell’IA.”
O’Reilly ha parlato di come gli editori dovrebbero affrontare queste nuove tecnologie, dicendo che devono “sapere quando bruciare le navi e andare fino in fondo. C’è un momento in cui bisogna impegnarsi.”
ChatGPT è stato rilasciato solo un mese dopo. PageBreak è stata la prima conferenza editoriale a metterlo in primo piano, grazie alle intuizioni di Tim.
Rivelazioni
Questo libro ha cinque sponsor. Sapevo che scrivendo il libro ci sarebbero state poche ricchezze da trovare, e ho deciso di sostenere i miei sforzi invitando gli sponsor a partecipare.
Come indico sul mio sito web, lavorando come consulente, analista e giornalista, sostengo la Carta Etica Globale dei Giornalisti della Federazione Internazionale dei Giornalisti. Il paragrafo 13 è chiaro sull’obbligo di evitare conflitti di interesse o “qualsiasi confusione tra (la mia) attività e quella di pubblicità o propaganda.”
Avere sponsor implica un conflitto di interessi e una confusione riguardo alla pubblicità. Se lavorassi per il New York Times sarebbe semplice: “No.” Lavorando per me stesso, la divulgazione è la mia arma per soddisfare questi obblighi: descriverò le considerazioni che ho ricevuto e voi potrete giudicare, nel mio lavoro, se sono stato compromesso.
Ho scelto gli sponsor che ho invitato a questo progetto perché conoscevo non solo il loro lavoro, ma anche le persone coinvolte nelle loro organizzazioni. Sono colleghi e amici. Ho detto loro che i loro prodotti potrebbero essere discussi nel testo di questo libro e che non avrebbero alcun controllo su quelle parole. Ciò che potevano controllare erano le loro pubblicità alla fine del libro—le avrei pubblicate come fornite. È quello che ho fatto.
Ho ricevuto pagamenti da altri che potrebbero aver influenzato il mio lavoro su questo libro—posso catalogare quanto segue:
Non ho fatto alcun lavoro di consulenza pagato per i fornitori di AI descritti in questo libro, inclusi gli sponsor.
Ho ricevuto alcune entrate dalla condivisione dei profitti da Publishers Weekly per i webinar sull’AI a settembre 2023.
Sono pagato a tariffa standard per i miei articoli su Publishers Weekly.
Per favore fatemi sapere se rilevate qualsiasi favoritismo che pensate possa essere risultato da questi impegni. Il mio bias a favore dell’AI si è formato prima che fluisse la grande ricchezza.
Ringraziamenti
Non sarei in grado di parlare con alcuna credibilità di AI se non fosse per il supporto di Publishers Weekly, incluso l’editore emerito, Jim Milliot, e il CEO, Cevin Bryerman. Jim ha supportato i miei primi scritti sull’AI, e Cevin (insieme a Krista Rafanello e al resto del team) sono stati strumentali per il successo della conferenza dello scorso autunno, AI and the Revolution in Book Publishing. Andrew Albanese è ora il caporedattore esecutivo di PW; Ed Nawotka, un redattore senior. Sono fortunato a lavorare con loro.
E ulteriori ringraziamenti a numerosi colleghi…
Peter Brantley
Cliff Guren, partner di lunga data e lettore perspicace delle mie bozze
Due altri lettori della versione ‘beta’, hanno offerto feedback preziosi: Joe Wikert e Brad Farmer
I miei Publishing Technology Partners, Ken Brooks, Bill Kasdorf, Bill Rosenblatt, Bill Trippe, Steve Sieck, e i nostri nuovi partner, Lettie Conrad e Linda Secondari.
Mia sorella, Anne Pashley, che mi aiuta a mantenere il database delle startup editoriali aggiornato e che energizza costantemente i miei sforzi.
I miei partner nei miei webinar mensili sull’AI: Brooke Horn e Brian O’Leary di BISG.
Bill Kasdorf mi ha aiutato ad approfondire le questioni di accessibilità per il mio libro.
Peter Armstrong e Len Epp di Leanpub sono stati pazienti con le mie obiezioni e mi hanno aiutato nel processo di offrire il miglior risultato possibile sulla piattaforma Leanpub.
Hugo Rayne di ElevenLabs per il supporto dell’audiolibro.
Il mio buon amico e rilevatore affidabile delle mie sviste di scrittura e ragionamento, Bob McArthur.
Appendice: Esplorare i Vantaggi Rimanenti dell’Editoria Tradizionale
Il prestigio dell’editoria tradizionale è il motivo per cui la maggior parte di noi si è unita a questo settore. Siamo cresciuti amando i libri, abbiamo studiato inglese o qualcosa di simile all’università, abbiamo girovagato per un po’, forse abbiamo trovato lavoro in una libreria, forse un certificato di Master in Editoria, poi abbiamo lavorato come stagisti in una casa editrice, ed eccoci qua oggi. Ami il tuo lavoro, anche se la paga fa schifo e le condizioni di lavoro non sono sempre piacevoli.
Lo stesso prestigio alimenta la catena di approvvigionamento editoriale. Sul lato dell’input della catena di approvvigionamento: significa molto per molti autori. Lo vediamo tutto il tempo. L’economia dell’editoria tradizionale non ha senso, e ci vuole quattro volte tanto per andare in stampa, ma, forse, solo forse, sarò il prossimo vincitore al debutto, come Delia Owens (La Ragazza della Palude) o la megastar della seconda volta, Amor Towles (Un Gentiluomo a Mosca).
È come Las Vegas: tranne che le probabilità sono migliori in Nevada. Gioca un singolo numero alla roulette e le probabilità contro di te sono 36 a 1. Gioca all’editoria tradizionale e le probabilità contro di te sono… molto peggiori.
Le probabilità di ottenere un contratto con uno qualsiasi degli editori commerciali tradizionali, per non parlare di uno dei big 5, sono scarse. Ma questo è il meno dei problemi di un autore. È in realtà trovare lettori che è la mega-sfida.
Una cosa che può aiutare è ottenere un posto in una lista dei bestseller.
Consideriamo PRH, Penguin Random House. La compagnia pubblica solo 15.000 nuovi titoli ogni anno. Nel 2021 sono riusciti a portare 196 libri nella lista dei bestseller di Publishers Weekly. Come evidenzia l’articolo collegato: “PW pubblica quattro liste di bestseller per adulti, ciascuna con 20 titoli: narrativa in copertina rigida, saggistica in copertina rigida, tascabile commerciale e tascabile da edicola. Questo significa che nel corso di un anno ci sono 2.080 posizioni in copertina rigida nelle nostre liste e 2.080 posizioni in tascabile.
Non tutti i bestseller sono stati pubblicati quell’anno—supponiamo generosamente che il 90% lo siano stati, 1870 posti.
Nel frattempo The New York Times ha 15 posti per i bestseller a settimana per ogni categoria di libro (narrativa, saggistica, bambini; liste separate per YA e come fare; copertina rigida separata dal tascabile, più liste combinate). Per un singolo autore, ciò significa 780 posti disponibili all’anno, anche se la maggior parte di questi posti è occupata da venditori ripetuti. (The Body Keeps the Score di Bessel van der Kolk è stato nella lista dei tascabili per cinque anni e mezzo!) Quindi dividiamolo a metà, 390 posti disponibili. Devi vendere molti libri per accaparrartene uno.
Che dire della copertura nella New York Times Book Review? Nel 2016, Pamela Paul, allora editrice della Review, ha affermato che “La Book Review del Times recensisce circa l’1% dei libri che escono in un dato anno.” Chiaramente intende l’1% dei libri dei principali editori—non può riferirsi alle piccole case editrici o agli autori autopubblicati. E quindi forse 150 dei 15.000 nuovi titoli di PRH vengono recensiti ogni anno.
La maggior parte degli osservatori concorda sul fatto che, sebbene ottenere attenzione dai principali media sia ancora importante e possa essere potente, l’impatto delle recensioni non è più quello di una volta, se non altro perché meno lettori di libri interagiscono con i principali punti di revisione.
Rivolgiamo la nostra attenzione alla catena di approvvigionamento a valle, alla distribuzione. Anche se i marchi degli editori hanno peso con gli autori, è sempre stato un detto comune che, a differenza di molti beni di consumo, i marchi degli editori hanno quasi nessun peso con gli acquirenti e i lettori di libri. Ma hanno molto peso con i distributori e i librai. Questo riflette la natura storica business-to-business dell’editoria (piuttosto che B2C—verso i consumatori). Il prestigio degli editori viene diffuso tramite canali di distribuzione e vendita al dettaglio: Barnes & Noble porta un libro perché è di PRH, e poi lo mette davanti agli occhi degli acquirenti; così il prestigio è diffuso ai lettori.
Sponsor
David Lamb e Susan Reich hanno fondato Book Advisors LLC nel 2016 per offrire consulenze su fusioni e acquisizioni nell’editoria. Abbiamo completato più di una dozzina di transazioni, oltre a una varietà di progetti di consulenza finanziaria, distributiva e operativa, inclusa la valutazione del mercato equo. Siamo lieti di aver recentemente lavorato in associazione con Clarke & Esposito; Thad McIlroy di The Future of Publishing; e Kuo-Yu Liang di Ku Worldwide.
Siamo orgogliosi delle nostre relazioni, diligenza e discrezione. Che siate interessati all’acquisto, alla vendita, al finanziamento o alla consulenza, vi preghiamo di contattarci per una discussione riservata.
bookadvisorsllc.com | bookadvisors@gmail.com
Firebrand Technologies è un’azienda di software e servizi che da oltre 35 anni assiste gli editori di libri con soluzioni di gestione dei dati e del flusso di lavoro.
NetGalley è una piattaforma online che collega editori e autori a recensori, bibliotecari, librai, media ed educatori che scoprono nuovi libri su NetGalley e li raccomandano al loro pubblico.
In quanto sviluppatori di software e soluzioni digitali, Firebrand Technologies e NetGalley sono anche esperti del settore e membri attivi della comunità editoriale. Le nostre soluzioni beneficiano tutti gli aspetti del processo editoriale, dalle acquisizioni fino alle vendite e al marketing.
NetGalley aiuta gli editori a creare buzz per i titoli, ricevere feedback e recensioni rapide e scoprire tendenze precoci.
Title Management Enterprise, insieme alla sua versione compatta, Title Management Lite, è l’applicazione software principale di Firebrand che fornisce una gestione avanzata del flusso di lavoro editoriale durante tutto il processo di pubblicazione.
Eloquence on Demand è la piattaforma di distribuzione ONIX più potente del settore editoriale, che distribuisce metadati e risorse digitali a oltre 600 partner commerciali in formati ONIX e altri formati.
Flywheel è un servizio di marketing per il backlist che identifica opportunità nascoste nel backlist per aumentarne la visibilità e le vendite.
Eloquence on Alert monitora i dati dei titoli in tempo reale e le tendenze del mercato e avvisa gli editori di errori critici e opportunità che possono influire sulle vendite (pulsanti di acquisto mancanti, venditori terzi, ecc.).
FlightDeck è lo strumento di convalida e test EPUB più avanzato disponibile.
Benvenuti in un modo migliore di stampare libri.
Perfect Bound è stato creato nel 2022 per aiutare ad affrontare i problemi della catena di approvvigionamento che affliggono l’industria editoriale da anni. Periodi di eccesso di capacità presso gli stampatori sono seguiti da brevi finestre di ritardi dovuti a crisi di approvvigionamento. Perfect Bound cerca di aprire il mercato della stampa agli editori e agli autori indipendenti permettendo agli stampatori di tutto il mondo di connettersi facilmente e fare affari con editori alla ricerca di fornitori nuovi e dinamici.
Che cos’è Perfect Bound?
Perfect Bound è un mercato a due lati che connette editori di libri indipendenti con stampatori negli Stati Uniti, Canada, Colombia, Brasile, Turchia, Cina, Malesia, India e altro ancora.
Scopri nuovi partner editoriali con un click
La nostra piattaforma robusta ti consente di creare facilmente preventivi di prodotto, inviare richieste a centinaia di stampatori con un click, negoziare e finalizzare le tue tirature di stampa e tracciare i prodotti dalla stampa al magazzino. Come stampatore, connettersi con nuovi editori, fare offerte su progetti futuri e ricevere pagamenti non è mai stato così facile e sicuro.
Connettiti con nuovi partner editoriali istantaneamente
Invia e ricevi richieste di stampa da tutto il mondo
Esegui e traccia le tirature di stampa dalla stampa al magazzino
Transazioni senza problemi utilizzando pagamenti ACH tramite Stripe senza lasciare la piattaforma
Incontra Insight, una piattaforma AI costruita specificamente per gli editori
“Adottare Insight per la nostra casa editrice è stato come passare da una bicicletta a una Ferrari. Improvvisamente, tutto si muove più velocemente.”
—-Editore di libri per bambini tedesco e cliente di Insight
Lavorare in modo più intelligente, ottenere di più
Sviluppato da Veristage, Insight consente agli editori di prosperare nel panorama evolutivo dell’IA. Utilizzando l’IA e una robusta suite di strumenti digitali, Insight analizza e comprende i tuoi documenti e libri, per aiutarti a:
Creare, migliorare e aggiornare i metadati
Accelerare la creazione di materiali di marketing, pubblicità e vendita specifici per i titoli
Identificare e valutare i messaggi chiave di un libro, i punti di vendita unici, il pubblico di destinazione, i titoli comparabili e altro
Ottimizzare i tuoi contenuti di marketing e vendita per massimizzare la portata, l’engagement e aumentare le vendite
A differenza delle piattaforme di IA generiche, Insight è progettato per funzionare all’interno dei flussi di lavoro editoriali e per aiutarti a creare informazioni e risorse specifiche per l’editoria.
Come funziona
Carica il tuo libro sulla piattaforma Insight
Gli strumenti di IA di Insight analizzano e comprendono il tuo libro
In pochi minuti, Insight genera una vasta gamma di metadati e informazioni chiave sul tuo libro per i dipartimenti editoriali, marketing, pubblicità, vendite e diritti
Inserisci modifiche manuali a qualsiasi di queste informazioni direttamente sulla piattaforma. Il tuo libro e i contenuti di IA sono salvati all’interno di Insight, quindi puoi accedervi in qualsiasi momento.
Utilizza la nostra chat IA consapevole dei documenti per ottimizzare le informazioni sui tuoi titoli, interagire con i tuoi libri e incorporare dettagli sui libri nelle comunicazioni e in altri materiali
Sicurezza e Diritto d’Autore
Il team di Veristage si impegna a fornire servizi di IA sicuri e a proteggere la proprietà intellettuale degli editori. La nostra piattaforma dispone di avanzati sistemi di sicurezza delle informazioni e lavoriamo solo con modelli di IA che non memorizzano né utilizzano i tuoi dati per addestrare modelli futuri.
Soluzioni per Editori di Tutte le Dimensioni
Insight è progettato per funzionare per editori di tutte le forme e dimensioni, dai consumer agli accademici, dai team di tre persone alle organizzazioni multinazionali. Offriamo prezzi competitivi e soluzioni scalabili.
Parla con noi per scoprire come Insight può beneficiare la tua attività: