Die KI-Revolution im Buchverlag (Deutsche Ausgabe)
Die KI-Revolution im Buchverlag (Deutsche Ausgabe)
Thad McIlroy
Buy on Leanpub

Inhaltsverzeichnis

Einführung

“Die nächste Revolution wird uns alle überraschen, wie sie es immer tun. Anders gesagt: Wenn die Menge die Revolution erwartet, kann es keine Revolution sein.” —Doc Searls, 2002

Es ist über ein Jahr und sechs Monate her, seit OpenAI ChatGPT einer Öffentlichkeit vorgestellt hat, die größtenteils mit Künstlicher Intelligenz (KI) nicht vertraut war. Anfangs schien es keine offensichtliche Relevanz für das Verlagswesen zu haben. Seitdem hat sich alles geändert. Und gleichzeitig hat sich nichts geändert. Verlage beginnen, in die neuen KI-Tools einzutauchen, die Grenzen zu erkunden und vorsichtige Gespräche mit ChatGPT zu führen. Aber es gibt keine Anzeichen für eine echte Revolution in der Praxis des Verlagswesens; es ist einfach zu früh.

Es gibt eine Fülle von Unsicherheiten rund um KI im Schreiben und Veröffentlichen. Große Kontroversen umgeben die Nutzung von KI. Trotzdem gibt es für viele eine Aufregung über die Möglichkeiten.

Ich werde mich hier mehr auf die Versprechen als auf die Gefahren konzentrieren, aber ich biete auch einen Überblick über die Bedenken und Risiken rund um KI, insbesondere wie sie sich auf Autoren und Verleger auswirken. Ich versuche nicht, die Bedenken herunterzuspielen. Sie sind einfach nicht das, worum es in diesem Buch geht.

Ist es ein Buch?

Ich betrachte diese Veröffentlichung eher als ein ‘Heft’ denn als ein Buch. Die UNESCO-Definition eines Buches lautet “mindestens 49 Seiten” (warum nicht 50?), und bei 300 Wörtern pro Seite könnte dieses nicht qualifizieren. Aber, was noch wichtiger ist, es ist nicht als das endgültige Wort zu irgendetwas gedacht – es ist eher ein Fortschrittsbericht. Künstliche Intelligenz und ihre Rolle im Verlagswesen ändern sich in rasantem Tempo, das keine Anzeichen dafür zeigt, sich zu verlangsamen. Dieses Buch(let), dieser Bericht, ist also nur eine Momentaufnahme.

Mit der Leanpub-Plattform habe ich meine Forschung und Analyse als ein fortlaufendes Werk veröffentlicht – es wird als lebendiges Dokument überarbeitet. Ich habe das noch nie zuvor versucht. Meine Gründe sind zwei: etwas Nützliches kurzfristig anzubieten und die Möglichkeit zu haben, es bei Bedarf zu überarbeiten. Die KI-Geschichte ist noch lange nicht zu Ende.

Ich hoffe, dass mein Ansatz für Leser nützlich sein wird, obwohl ich mir bewusst bin, dass zu viele Updates bald lästig werden könnten. Ich habe versucht, die Aktualität dieses Buches zu verringern, um den Fokus auf das zu reduzieren, was sich am schnellsten ändern wird.

Die Version, die seit April 2024 (stillschweigend) verfügbar ist, habe ich als “75% vollständig” markiert und kostenlos den Lesern angeboten. Der 23. Juli ist das offizielle Veröffentlichungsdatum für die “100% vollständige” Version, die auch in eine größere Verbreitung außerhalb von Leanpub findet. Ich werde die 100% Version weiterhin aktualisieren: aber diese Updates werden nur für Leanpub-Käufer verfügbar sein – es ist unpraktisch, ständig gedruckte Bücher, E-Books und Hörbücher, die in weiter Verbreitung sind, zu aktualisieren.

Schmerz der Verleger mit KI selbst

Ich höre täglich über den Schmerz, den Menschen in der Verlagsbranche empfinden, wenn sie versuchen, sich mit KI auseinanderzusetzen. Warum ist es so schmerzhaft? Hier sind drei Gründe, die ich sehe:

  • Die Technologie ist komplex und mysteriös, zu komplex für Nicht-Wissenschaftler, um sie zu verstehen. (Es gibt eine faszinierende Studie, die eine “AI-Angst-Skala (AIAS)” vorschlägt, die 21 verschiedene Gründe misst, warum Menschen Angst vor KI haben.)

  • KI ist im Verlagswesen äußerst umstritten, hauptsächlich wegen Urheberrechtsfragen, die das Herz des Schreibens und Verlagswesens betreffen.

  • Dennoch herrscht auch eine Atmosphäre von FOMO – Fear Of Missing Out. Trotz der vielen Mängel der KI, wie bei vielen verlockenden Technologien (die Apple Watch? Smarte Lautsprecher?), haben wir das nagende Gefühl: Was, wenn ich das nächste wirklich große Ding verpasse, wie ich ein paar der letzten wirklich großen Dinge verpasst habe. Damals fühlte ich mich dumm; ich will mich nicht wieder dumm fühlen. Es tut weh.

In Ordnung: Es macht Sinn, dass Verlagsleute KI-Schmerz empfinden.

Was ist also der Anwendungsfall für dieses Buch?

Der Anwendungsfall ist, dass Sie im Buchverlag arbeiten oder ein Autor sind, der versucht, den Buchverlag besser zu verstehen, und es leid sind, sich in Bezug auf KI dumm und verwirrt zu fühlen. Zu viele Ihrer Kollegen scheinen es besser zu verstehen als Sie, und Sie sind es leid, nicht intelligent über das Thema sprechen zu können.

Mein Ziel für die Leser ist, dass sie sich am Ende dieses Buches in der Lage fühlen, an der Diskussion teilzunehmen, eine informierte Meinung zu äußern. Ich möchte, dass Sie in der Lage sind, persönliche Entscheidungen rund um die Technologie zu treffen und einen Weg zu finden, wie Sie KI nutzen können, wenn Sie sich dafür entscheiden.

Ich möchte nicht die Leser mit viel Blabla über die Grundlagen der KI-Technologie überfluten - ich werde nicht viel über KI im Abstrakten sprechen. Stattdessen möchte ich Ihnen eine Grundlage für KI speziell für das Schreiben und Veröffentlichen von Büchern geben. Wenn jemand Sie fragt, was Verarbeitung natürlicher Sprache wirklich bedeutet, können Sie antworten, wie ich es tue: Ich bin kein KI-Experte. Aber ich weiß, wie KI in meiner Branche eingesetzt wird.

Wird es genau das sein, was Sie wissen müssen?

Ich mag den Ausdruck “was Sie wissen müssen” nicht, weil er so selten hält, was er verspricht, oft weit daneben liegt, entweder viel mehr als nötig oder viel weniger. Werde ich es richtig machen? Ich bin ernsthaft bemüht, das Minimum zu vermitteln. Ich denke, ich weiß, was Verleger über KI wissen müssen, da ich mit vielen von ihnen gesprochen habe, während ich Seminare und Webinare veranstaltete, die sehr spezifisch darauf ausgerichtet sind, nur die Grundlagen zu vermitteln.

An icon of a key

Anstatt den Ausdruck “was Sie wissen müssen” endlos zu wiederholen, werde ich ein Schlüssellogo mit einigen eingerückten Text verwenden.

Nach den Zusammenfassungen, die viele Abschnitte einleiten, werde ich die Hauptkonzepte weiter ausführen. Ich habe diese auch so kurz wie möglich gehalten, obwohl ich, ehrlich gesagt, manchmal doch weiter aushole.

Eine Kurzform, die ich verwenden werde, ist “Chat-KI.” Als OpenAI ChatGPT erstmals veröffentlichte, war es das einzige Kind auf dem Block, aber jetzt gibt es mehrere wichtige Konkurrenten. Ich werde gleich auf die Einzelheiten eingehen, aber Sie haben sicherlich schon von einigen gehört, offensichtlich Google und Microsoft. Sie (und mehrere andere Unternehmen) bieten jetzt Online-KI-Chat-Software an, die ChatGPT ähnelt. Und deshalb werde ich, anstatt “ChatGPT und seine Konkurrenten” zu sagen, die gesamte Kategorie als “Chat-KI” bezeichnen. Wenn ich “ChatGPT” schreibe, beziehe ich mich speziell auf die Software von OpenAI.

Das Buch ist größtenteils praktisch, aber im letzten Abschnitt stelle ich einen Essay über die möglichen realen Konsequenzen von KI für die Buchverlagsbranche an, zusammen mit einigen anderen spekulativen Überlegungen.

Für wen ist dieses Buch?

Die Hauptzielgruppe dieses Buches sind Publikumsverlage. Die sekundäre Zielgruppe sind alle anderen Buchverlage (wissenschaftlich, bildend…), soweit es Überschneidungen in diesen Branchen gibt. Meine dritte Zielgruppe sind Autoren, die im Spiel sind, und die vielen anderen, die von der Buchveröffentlichung fasziniert sind.

Der Untertitel besagt, dass dies ein Leitfaden für KI für sowohl Autoren als auch Verleger ist. Zum Teil liegt das daran, dass ich möchte, dass Verleger auch verstehen, was Autoren mit dieser Technologie tun. Ich denke, das ist wichtig. Bei seiner jüngsten Jahrestagung hat das BISG (Book Industry Study Group), das hauptsächlich Publikumsverlage vertritt, angedeutet, dass “es aus einem breiteren Pool, einschließlich Literaturagenten und Autoren, schöpfen möchte.” Das ist eine willkommene Bewegung.

Ich möchte, dass Autoren dieses Buch lesen, weil es ihnen helfen kann zu verstehen, was Verleger mit ihren Manuskripten machen. Selbstverleger haben immer ein Auge auf das traditionelle Verlagswesen, teilweise weil sie de facto selbst Verleger sind, und daher kann die KI-Technologie, die für Verleger von Interesse ist, auch für sie von Interesse sein.

Aber machen Sie keinen Fehler, dies ist kein praktischer Leitfaden für Autoren, wie man KI einsetzt, um bessere und produktivere Autoren zu werden. Es gibt zahlreiche Bücher zu diesem Thema (leider viele davon nur betrügerische Amazon-Abzocke). Und viele YouTube-Videos (unterschiedlicher Qualität).

Innerhalb des Bereichs Publikumsverlage ist mein idealer Leser nicht unbedingt ein Entscheidungsträger, sondern einer der vielen Menschen, die täglich in der Branche arbeiten, Bücher erstellen und Leser finden. Ich werde in diesem Buch über alle wichtigen Verlagsfunktionen sprechen, von der Redaktion bis hin zu Vertrieb und Verkauf. Und über die Schnittstelle zwischen Autoren und Lesern.

Obwohl ich in Kanada aufgewachsen bin und dort meine Verlagskarriere begonnen habe, bin ich in San Francisco, in den Vereinigten Staaten, ansässig und denke daher standardmäßig an die US-amerikanische Verlagsbranche. Aber fast alles in diesem Heft sollte für einen Verleger in Madagaskar genauso relevant sein wie für einen Verleger in Manhattan. Während Verleger in kleineren Ländern mit Skalierungsproblemen konfrontiert sind, gilt das auch für kleine Verleger in Amerika, und dieses Buch ist für Unternehmen jeder Größe gedacht.

Wenn ich mit kleinen Verlegern über KI spreche und wenn ich mit sehr großen Verlegern über KI spreche, ist der große Unterschied, den ich bemerke, die Vorstellung vom Verlagsunternehmen. Die größten Verlage sind oft Teil von (oder neben) börsennotierten Unternehmen, und sobald man ein börsennotiertes Unternehmen ist, sind Fragen rund um Reputation und Sicherheit viel größer als bei einem alltäglichen Verleger, der nicht auf die gleiche Weise gegenüber Aktionären und den Medien rechenschaftspflichtig ist. Während ein Redakteur bei einem der Big 5-Verlage die gleichen KI-Tools wie ein freiberuflicher Redakteur, der für kleinere Unternehmen arbeitet, verwenden kann, ist der Kontext, in dem sie die Tools verwenden, ganz unterschiedlich.

Wie viel müssen Sie über KI wissen, um dieses Buch zu lesen?

Ich gehe davon aus, dass mein Publikum kaum Wissen über das Innenleben von KI hat, aber dass es kluge Leser sind. Daher werde ich die feine Linie zwischen null Wissen und nicht von oben herab sprechen.

Ich nehme an, dass fast jeder von der neuen Generation der KI gehört hat: Eine YouGov-Umfrage im März 2024 legt nahe, dass nur 7 % der Amerikaner “überhaupt nichts” über KI wissen. Autoren und Verleger haben fast sicher von einigen der Urheberrechtsbeschwerden gehört, haben aber wahrscheinlich keinen Überblick über die Probleme. Daher muss ich nicht erklären, dass KI für “Künstliche Intelligenz” steht. Aber ich werde nicht davon ausgehen, dass die Leser definieren können, was KI ist, was sie bedeutet, ihr potenzieller Einfluss und so weiter. Deshalb sind Sie hier.

Zugänglichkeit, sowohl im Allgemeinen als auch im Besonderen

Mein Mantra für die Veröffentlichung dieses Buches lautet ‘Zugänglichkeit.’

Für die meisten Menschen bedeutet das lediglich etwas Ähnliches wie ‘Verfügbarkeit’, und tatsächlich beabsichtige ich, dieses Buch in so vielen Formen und Formaten wie möglich verfügbar zu machen. Ich möchte den Rahmen erweitern. Ich versuche, mein Buch zu einer beispielhaften Veröffentlichung zu machen, die das gesamte Spektrum dessen hervorhebt, was heute beim Veröffentlichen eines einzelnen Buches erreicht werden kann.

Auf Leanpub finden Sie das Buch als PDF-Datei, als EPUB-Datei und als kostenlose webbasierte Veröffentlichung. Sie finden Übersetzungen in 31 Sprachen, einschließlich der wichtigsten asiatischen und europäischen Sprachen. Es wird mehrere Hörbücher in den wichtigsten Sprachen geben.

Ich werde das Buch auch in gedruckten und digitalen Formaten auf allen E-Commerce-Plattformen verfügbar machen, die über Ingram und Amazon zugänglich sind. Dazu gehören die meisten Online-Buchhandelsseiten in vielen Teilen der Welt. Auf diese Weise können Bibliotheken das Buch auch kaufen, obwohl sie verständlicherweise nur wenig Platz für selbstveröffentlichte Werke haben. (Ich werde jeder Bibliothek der Welt, die es anfragt, gedruckte und digitale Exemplare spenden.)

Neben der kostenlosen Webversion des vollständigen Buches werde ich kostenlose Auszüge, eine Q&A und Infografiken erstellen, für diejenigen, die nur kosten oder probieren möchten. Diese werden über meinen Blog verfügbar sein.

Es macht keinen Sinn, ein Video des gesamten Buches aufzunehmen, wenn Hörbücher verfügbar sind. Aber einige Leute bevorzugen es, Inhalte über Videos zu konsumieren. Daher werde ich gekürzte Videoversionen in mehreren Längen anbieten.

Und was ist mit dem menschlichen Touch? Ich werde auch über Webinare oder Einzelgespräche online über meine Website und meinen Blog verfügbar sein. Man kann mich sogar engagieren, persönlich zu erscheinen!

‘Zugänglichkeit’ bedeutet viel mehr als seine Wörterbuchdefinition. Wie die Leute vom Canadian National Network for Equitable Library Service (NNELS) es ausdrücken, “Ein zugängliches Buch ist eines, das von jedem benutzt und verstanden werden kann.” Und so erfüllt meine englische EPUB-Datei die W3C 1.1-Empfehlung für Druckbehinderte, einschließlich robuster Alt-Text-Beschreibungen für Bilder. Wir erwarten, diesen Zugänglichkeitsstandard auch für die fremdsprachigen Übersetzungen zu erfüllen.

Der Alt-Text wurde mit ChatGPT erstellt. Ich habe die Version von ChatGPT nicht bearbeitet, damit jeder, der das EPUB liest, sehen kann, wie gut es ist und wo es noch fehlt. Wie mich mein Kollege Bill Kasdorf erinnert, beschreibt guter Alt-Text, was ein sehender Leser aus einem Bild erkennt, nicht nur, wie es aussieht.

Für Buchverleger ist Zugänglichkeit keine Option mehr: Es ist eine Standardeinstellung.

(Ich habe zwei mea culpas zu teilen: Aufgrund von Einschränkungen innerhalb der Verlagsplattformen wird die Standard-PDF-Datei leider nicht der PDF/UA-Spezifikation entsprechen, und ich werde keine Großdruckversion des Buches auf E-Commerce-Seiten anbieten können. Aber beides ist auf Anfrage erhältlich.)

Ein wenig Hausarbeit

Wie bereits erwähnt, ist dieses Buch (relativ) kurz. Wenn man ein kurzes Dokument ‘ein Buch’ nennt, läuft man Gefahr, dass Käufer protestieren: “Ich dachte, ich kaufe ein Buch, aber es ist nur 50 Seiten lang!” Ich habe alles getan, um auf der Verkaufsseite deutlich zu machen, dass dies kein vollständiges Buch ist, aber wenn Sie enttäuscht sind, bedenken Sie, dass Leanpub eine 60-tägige Geld-zurück-Garantie bietet, und ich werde dieses Rückerstattungsangebot gerne auf ‘für immer’ ausweiten. Ich möchte, dass die Leser begeistert und nicht enttäuscht sind. (Wenn Sie das Buch auf einer anderen Plattform gekauft haben, schreiben Sie mir eine E-Mail: Ich sende Ihnen einen Scheck!)

Das Buch ist stark verlinkt (diese erscheinen in verschiedenen Formaten auf unterschiedliche Weise, aber oft als Fußnoten). Ich habe immer daran geglaubt, in meiner Arbeit auf Originalquellen zu verlinken, damit die Leser meine manchmal großen Behauptungen überprüfen können. Aber ich bin mir bewusst, dass Hyperlinks und Fußnoten ablenkend sein können, besonders wenn Sie ein E-Reader-Gerät verwenden. Ich entschuldige mich dafür. Der beste Weg ist, die Links während des Lesens zu ignorieren und zu ihnen zurückzukehren, wenn Sie tiefer in ein Thema eintauchen möchten.

Ich weiß nicht, in welchem Format Sie gerade lesen (oder hören). Auch nicht, in welcher Sprache. Ich habe versucht, die “Ergonomie” des Buches so benutzerfreundlich wie möglich zu gestalten, aber Links und Fußnoten sind aus dieser Perspektive nicht immer optimal.

Dieses Buch hat Sponsoren, etwas, das ich weiß, dass es für ‘ein Buch’ ungewöhnlich ist. Ich erkläre, wie das Sponsoring in meinem ‘Offenlegungen’ Abschnitt am Ende des Textes funktioniert.

Warum KI jetzt?

An icon of a key

Wenn ich mit Verlegern spreche, höre ich von dringenden, unmittelbaren Bedenken. Und KI ist normalerweise nicht eines davon.

Die steigenden Kosten der Druckherstellung sind seit mehreren Jahren ärgerlich, obwohl sie sich jetzt scheinbar stabilisieren. Erhöhte Vertriebskosten sind für alle Akteure eine Herausforderung. Diese führen zu Preisdruck – es gibt Hinweise darauf, dass Leser beginnen, sich über die aktuellen Preise für neue Hardcover und Taschenbücher zu ärgern. Ich klassifiziere diese als ‘analoge’ Probleme – digitale Technologien tragen wenig zur Lösung bei.

Dann gibt es die breiteren ‘existentiellen’ Probleme, die von zunehmender Bedeutung sind, aber vage Themen ohne offensichtliche Lösungen darstellen. Dazu gehören:

  • Inhaltsentdeckung und Publikumsengagement über Online- und soziale Medien.

  • Verändertes Verbraucherverhalten und Lesegewohnheiten.

  • Wettbewerb durch andere digitale Medien.

Ich glaube, dass KI Verlegern in diesen Bereichen enorm helfen könnte, aber die Methoden sind nicht offensichtlich und werden Zeit brauchen, um implementiert zu werden. Ich werde dies in späteren Kapiteln des Buches beschreiben.

KI: Erste Schritte

Bevor ich auf den langweiligen technischen Hintergrund eingehe, lade ich Sie ein, direkt in die Online-Software einzutauchen. Die besten Tools sind kostenlos zum Ausprobieren. Es gibt ChatGPT. Und Claude.ai. Sie können mit Microsoft Copilot herumspielen. Oder Googles Gemini ausprobieren.

So beginnen die meisten Menschen mit KI – ich wette, Sie haben bereits eines oder mehrere dieser Spielzeuge ausprobiert. Ich wette auch, dass Sie sie nicht sehr lange ausprobiert haben. Die meisten Menschen, mit denen ich spreche, widmen nur ein paar Minuten. Sie stellen ein paar Fragen, bekommen einige ziemlich offensichtliche Antworten und machen weiter.

Falscher Ansatz.

Ich stimme mit Ethan Mollick überein, dessen Arbeit ich in diesem Buch ein paar Mal beschreiben werde. In seinem Blog und in einem kürzlichen Interview spricht Mollick über seine ‘10-Stunden-Regel’:

“Ich möchte darauf hinweisen, dass 10 Stunden so willkürlich sind wie 10.000 Schritte. Es gibt keine wissenschaftliche Grundlage dafür. Dies ist eine Beobachtung. Aber es bewegt Sie auch über das hinaus, ich habe das für einen Abend ausprobiert, und es bewegt Sie dazu, dies ernsthaft zu nutzen. Ich weiß nicht, ob 10 Stunden die wirkliche Grenze sind, aber es scheint einigermaßen transformativ zu sein. Der Schlüssel ist, es in einem Bereich zu verwenden, in dem Sie Expertise haben, damit Sie verstehen können, wofür es gut oder schlecht ist, und die Form seiner Fähigkeiten lernen können.”

Ein weiterer Kommentator, der Mollicks kürzliches Buch über KI rezensiert hat, wies auf eine ebenso wahre ‘Regel der Zehn’ hin: “Eine Stunde des Experimentierens mit diesen Tools ist zehn Stunden des Lesens darüber wert.”

Sie verstehen die Idee. Es geht ums Tun, nicht ums Nachdenken. Mein Buch ist ein Nachdenken. Sie müssen sich die Hände schmutzig machen.

KI: Eine sehr kurze Geschichte

An icon of a key

Bis vor ein paar Jahren hörte der Durchschnittsmensch nur als Abstraktion von KI, entweder als Science-Fiction oder als etwas, das einen Großmeister im Schach oder Go schlagen konnte. Plötzlich ist KI überall und schafft den falschen Eindruck, dass sie neu ist. Selbst das neue Zeug ist nicht wirklich neu. Aber das ist ein Streitpunkt. KI bedeutete vor ChatGPT wenig für die Buchveröffentlichung. Jetzt bedeutet es viel.

Das Verständnis der etwa 70-jährigen Entwicklung der KI kann faszinierend sein, ist aber keineswegs erforderlich, um zu schätzen, was heute vor sich geht.

Our World In Data macht einen guten Job bei der kurzen Aufzeichnung der Geschichte – ich überlasse es ihnen.

Die aktuelle Generation der KI wurde hauptsächlich im letzten Jahrzehnt entwickelt. Dann, plötzlich, erschien am 30. November 2022 ChatGPT. Zwei Monate später hatte es 100 Millionen monatliche Nutzer, die schnellste Verbreitung, die jede Technologie jemals im Verbrauchermarkt erreicht hat (zum Vergleich: Facebook brauchte über zwei Jahre, um 100 Millionen Nutzer zu erreichen).

Warum die schnelle Annahme? Erstens ist es faszinierend und macht Spaß. Zweitens ist es kostenlos. Drittens muss man kein neues Gerät kaufen, um es zu nutzen. Und viertens braucht man keine Schulung, um auf ChatGPT (oder seine Chat-KI-Konkurrenten) zuzugreifen. Aber diese Faktoren trafen auch auf Facebook zu, also warum ChatGPT?

Wie Arthur C. Clarke berühmt bemerkte: “Jede hinreichend fortgeschrittene Technologie ist von Magie nicht zu unterscheiden.” Chat-KI ist Magie. Das Erlebnis, in Alltagssprache mit einer Maschine zu ‘sprechen’… das ist magisch. Das Erlebnis, zu sagen “Ich möchte ein Bild von einem Buch in einem Ballon in einer Wolke in der Nähe der Sonne,” und Sekunden später

Ein offenes Buch, aus dessen Seiten ein Heißluftballon aufsteigt, schwebend zwischen den Wolken.

… auch magisch. GPT-generierte Bilder beginnen ähnlich im Stil auszusehen, bunt und fantasievoll. Also schickte ich eine zweite Aufforderung “jetzt im Stil einer Illustration aus dem 15. Jahrhundert.” Und so:

Eine künstlerische Illustration eines Heißluftballons mit komplizierten Mustern, schwebend zwischen Wolken mit einer Sonne im Hintergrund.

Wenn ich ein Video von einem Buch in einem Ballon in einer Wolke in der Nähe der Sonne möchte, gibt es über ein Dutzend Werkzeuge zur Auswahl, und presto. Und einen musikalischen Soundtrack zum Video. Nun, wie klingt das? Es ist einfach wie Magie.

Aus Angst, die außergewöhnlichen Fähigkeiten der KI herabzuwürdigen, indem man sie in die Kategorie der unergründlichen “Magie” einordnet, ist es interessant zu erfahren, dass viele der Wissenschaftler, die für die aktuelle Generation der KI verantwortlich sind, zugeben, dass sie wirklich nicht genau verstehen, wie sie funktioniert. Wie in einem Bericht in einer kürzlich erschienenen Ausgabe des MIT Technology Review erwähnt, “trotz all ihres durchschlagenden Erfolgs weiß niemand genau, wie – oder warum – sie funktioniert.” Aufregend, aber ein wenig beängstigend.

Verständnis der KI und einige wichtige Begriffe

An icon of a key

KI kommt mit einer Vielzahl von Technologien und Fachbegriffen, von denen viele für alle außer Datenwissenschaftler unverständlich sind. Benutzer von Chat-KI benötigen kein tiefgehendes Wissen über KI-Begriffe oder die technischen Konzepte. Die konversationelle Natur des Systems ermöglicht intuitive Interaktionen ohne spezielles Hintergrundwissen darüber, wie die Dinge funktionieren. Es ist wichtiger, sich darauf zu konzentrieren, was Chat-KI tatsächlich leisten kann.

Bei der Vorbereitung dieses Buches habe ich mich gefragt, was das ‘verantwortungsvolle’ Vorgehen für mich als Autor eines Buches über KI ist. Der konventionelle Ansatz besteht darin, eine kurze Erklärung der Wissenschaft und eine Überprüfung häufig verwendeter Begriffe bereitzustellen.

Das werde ich nicht tun.

Ich werde hier einige externe Links zu dem anbieten, was ich für einigermaßen verständliche kurze Beschreibungen der KI-Grundlagen halte.

Wie sieht die Zukunft der KI aus?: McKinsey & Co. (April 2024) hat eine gute Reihe von Erklärungen.

Ebenso ist Gartners Generative KI (undatiert) nicht schlecht.

Futurepedia bietet eine nicht schlechte Zusammenfassung der KI-Grundlagen (Mai 2024)

Nachdem ich die “How-to”-Frage geklärt habe, werde ich nun einige Begriffe vorstellen, die ich für wertvoll halte zu verstehen. Nicht weil man sie kennen muss, um die Software zu nutzen. Nur weil diese Begriffe einige zentrale Aspekte der Funktionsweise der aktuellen KI-Generation betreffen.

Mein Anwendungsfall für die Auseinandersetzung mit diesen Begriffen und Konzepten sind Autoren und Verlage, die (i) aus irgendeinem Grund ein tieferes Verständnis der KI erlangen möchten, (ii) den Kontext der aktuellen KI-Kritik verstehen möchten oder (iii) zu strategischen Diskussionen darüber beitragen möchten, wie ihre Kollegen oder Organisationen KI angehen sollten.

Mit anderen Worten, dies ist nicht das, was Sie wissen müssen, sondern eher das, was Sie wissen möchten. Hier sind sie, in nicht-alphabetischer Reihenfolge:

Eingabeaufforderungen und Auffordern

Sie können die Chat-KI-Software öffnen und einfach eine Frage eingeben, ganz wie Sie es derzeit bei Google tun.

Großes Sprachmodell (LLM)

Große Sprachmodelle funktionieren, indem sie riesige Mengen (meistens) schriftlichen Materials analysieren, was ihnen ermöglicht vorherzusagen, welche Wörter oder Sätze als nächstes in einem Gespräch oder einem Schriftstück kommen sollten. Sie ‘verstehen’ Sprache nicht im menschlichen Sinne, sondern verarbeiten Text, indem sie ihn in kleinere Stücke (sogenannte Tokens) zerlegen und diese dann in Zahlen umwandeln. Sie verarbeiten den Text als Zahlen, spucken mehr Zahlen aus, die dann wieder in Text umgewandelt werden. Das ist eine stark vereinfachte Erklärung dafür, warum Chat-KI keine urheberrechtlich geschützten Werke ‘enthält’: Es ist mit Zahlen aufgebaut, die eine weitreichende Abstraktion von den zugrundeliegenden Texten darstellen.

LLMs werden darauf trainiert, wie Sprache typischerweise verwendet wird, und generieren dann Antworten basierend auf diesem Verständnis. Wir neigen dazu zu unterschätzen, wie vorhersehbar die meiste Sprache ist. Chat-KI kann Texte erzeugen, die (manchmal schockierend) der bestehenden Literatur ähnlich sind, aber sie hat von Natur aus nicht die Fähigkeit, spezifische Auszüge oder Kopien urheberrechtlich geschützter Texte abzurufen. (Ich weiß, viele von Ihnen haben von der Klage der New York Times gegen OpenAI gehört—die Times konnte ChatGPT dazu bringen, einige Teile zuvor veröffentlichter Artikel wörtlich wiederzugeben.

Generative KI

Das Wichtigste, das man bei diesem Begriff verstehen muss, ist der “generative” Teil. Generative KI generiert neuen Text.

Generativer Vorgefertigter Transformator (GPT)

Dies, der nerdigste Begriff hier, beschreibt eine spezifische Art von LLM, die von OpenAI entwickelt wurde. “Generativ” weist auf die Fähigkeit hin, Text zu erstellen, “vorgefertigt” bedeutet, dass es auf einer großen Menge an Textdaten trainiert wurde, und “Transformator” bezieht sich auf die Software, die es verwendet. Zu wissen, wofür GPT steht, ist nur hilfreich, damit Sie verstehen, was das GPT in ChatGPT repräsentiert.

ChatGPT

ChatGPT ist die Software, die Sie sehen; GPT ist das, was hinter der Software steckt. Benutzer erleben ChatGPT, nicht das dahinterliegende GPT. Wie oben erwähnt, ist ChatGPT nur eines von mehreren Chat-KI-Online-Softwaresystemen mit ähnlicher Funktionalität.

Ein weiterer Begriff, dem Sie häufig begegnen werden und der vielen unbekannt ist:

Korpus

Die Wörterbuchdefinition von Korpus ist “eine Sammlung geschriebener Texte” (obwohl es tatsächlich nicht immer Text ist). Der Begriff wird in Bezug auf das verwendet, worauf GPTs trainiert werden: umfangreiche Korpora von (meistens) Text. Uns wird gesagt, dass die größten Korpora Hunderte von Milliarden Wörtern enthalten. Für normale Sterbliche ist das unmöglich zu begreifen. Denken Sie nicht, dass Wikipedia riesig ist und eine riesige Anzahl von Wörtern enthält? Nun, es gibt nur 4,5 Milliarden Wörter in Wikipedia—GPT-4 wurde auf weit über eine Billion trainiert.

Ich denke, es ist wichtig, diese Größenordnung zu berücksichtigen. Autoren machen sich verständlicherweise Sorgen, dass die 75.000 Wörter, plus oder minus, in ihrem Buch in ein großes Sprachmodell eingeflossen sein könnten. Vielleicht haben sie das (mehr dazu weiter unten). Aber nehmen wir an, dies sei der Fall, bedenken Sie, wie wenig Wert ein einziges Buch für die gesamte Leistungsfähigkeit heutiger großer Sprachmodelle hat. Es ist wirklich unbedeutend. Jenseits von unbedeutend. Selbst 10.000 Bücher sind Kleingeld.

KI-Software: Die System-Schwergewichte

An icon of a key

Ich habe oben die vier Schwergewichte der Chat-KI aufgelistet: ChatGPT, Claude.ai, Microsoft Copilot und Google Gemini.

Sie funktionieren alle mehr oder weniger gleich und liefern ähnliche Ergebnisse. Welche ist also die beste? Diese Frage führt Sie in ein Kaninchenloch. Es ist ein bisschen so, als würde man fragen, welcher Ort den besten Strandurlaub bietet oder welches SUV am besten für Familien geeignet ist. Es gibt eine riesige Menge an Nuancen in den Themen und eine gewaltige Menge an Stolz und Vorurteilen, die unsere Antworten filtern.

So auch bei dieser scheinbar einfachen, aber enorm komplexen Software. Leute argumentieren, dass Claude nuanciertere Sprachfähigkeiten hat und dass ChatGPT besser mit Softwarecode umgehen kann. Microsoft Copilot integriert sich in die Microsoft-Software-Suite. Google Gemini kann sich in Gmail, Google Maps und YouTube einfügen. Einige der Unterschiede sind bedeutend; viele sind geringfügig. Und sie ändern sich ständig mit jeder neuen Softwareversion.

An icon of a key

‘Die beste’ Software wird noch eine Weile nicht geklärt sein. Wenn Sie genug der verfügbaren Tools ausprobieren, werden Sie einige Favoriten finden.

Es gibt zwei Spitzenkategorien von KI-Software. Die erste könnte man als die grundlegende Software bezeichnen, Software wie ChatGPT und seine Konkurrenten (Chat-KI). So erleben die meisten Menschen heute KI.

Die nächste Ebene ist all die andere Software, die im Wesentlichen ein Fenster zur grundlegenden Software bietet. Neulinge im Bereich AI-Chat werden diese Software meist nicht kennengelernt haben, obwohl sie weder selten noch unbekannt ist. Einige sind mit Jasper (Marketingsoftware) oder Perplexity (Suche) vertraut. Diese Software würde ohne ChatGPT und seine Verwandten einfach nicht existieren.

Denken Sie daran, dass Mainstream-Software von Adobe, Microsoft, Grammarly, Zoom usw. jetzt AI-Tools integriert, aber dies unterscheidet sich von Software, die von Grund auf auf Chatbot-Schnittstellen basiert. (Andere wie Otter (Transkriptionen) sind älter als ChatGPT, aber jetzt mit der Technologie großer Sprachmodelle ausgestattet.)

Im Folgenden betrachten wir speziell auf das Verlagswesen ausgerichtete Software, die die Fähigkeiten der generativen AI nutzt.

Software-Paradigmen

Früher war Software Code und nur Ingenieure verstanden, wie sie funktionierte. Was Personal Computer neben ihren relativ niedrigen Kosten erfolgreich machte, war Software, die (relativ) einfach zu bedienen war. Wir denken nicht viel darüber nach; es umgibt uns einfach.

Aber denken Sie einen Moment lang an Microsoft Word, ein Programm, das ich sicher bin, dass 99% der Leser dieses Buches verwenden. Es dauert etwa 10 Minuten, jemandem zu zeigen, wie man in Word einen Textabsatz schreibt. Dann können Sie ihnen zeigen, wie man Text fett macht, kursiv setzt und wie man die Standardschriftart ändert, vielleicht von Calibri zu Arial oder Times Roman. Dann, wie man die Datei speichert und ausdruckt. Wie man sucht und ersetzt.

Und dann lässt man sie allein.

Jahre später stellt man fest, dass sie ihre Word-Absätze immer noch mit Leerzeichen und Tabs formatieren. Und immer noch vergessen, ihre Dateien zu speichern, oder verwirrt sind, welche Version sie gespeichert haben, manchmal müssen sie Texte von Grund auf neu erstellen. Aber sie “wissen, wie man Word benutzt.”

Word hat Hunderte von Funktionen, aber ein Drittel der Zeit verwenden Benutzer nur 5 Befehle: Einfügen, Speichern, Kopieren, Rückgängig und Fett. Es dauert mehrere Wochen Training, um die erweiterten Funktionen von Word richtig zu erlernen; Funktionen, die einem Verlag helfen könnten, viele hundert Stunden Zeit zu sparen. Aber die meisten tun das nie. Ich benutze Word seit 1985, fast vierzig Jahre, und ich habe nie einen Kurs besucht. Ich weiß nicht einmal, was ich nicht weiß über die volle Nutzung der Software.

Ich gehe darauf ein, weil es eine hilfreiche Möglichkeit ist, zu verstehen, warum AI-Software so anders ist als jede Software, die Sie jemals verwendet haben. Sie kommt nicht mit einem Handbuch, nicht einmal mit einer Schnellstart-Anleitung. Sie kommt mit einem leeren Bildschirm und einer Frage: “Womit kann ich Ihnen helfen.”

Eine Willkommensnachricht auf einer Konversations-AI-Schnittstelle, die Thaddeus fragt, wie sie helfen kann.

Es gibt keine Menüleiste, keinen Knopf zum Drücken, keine Tastenkombinationen. Sie stellen eine Frage, beginnen einen Chat und erhalten einige Antworten.

Eine Konversations-AI-Schnittstelle mit einer Benutzereingabe, die fragt, wie man den Unterschied zwischen neuer Generation von Konversations-AI und traditionellen Tools wie Microsoft Word oder Excel erklärt.

Claude’s Antwort:

“Es gibt mehrere wesentliche Unterschiede zwischen der Arbeit mit moderner Konversations-AI wie mir und traditionellen Tools wie Microsoft Word oder Excel:

“1. Interaktion in natürlicher Sprache: Mit Konversations-AI können Sie Ihre Absicht in Alltagssprache kommunizieren, anstatt komplexe Menüs und Funktionen zu lernen und zu navigieren. Sie erklären einfach, was Sie erreichen möchten, in einer konversationellen Weise.

“2. Kontextuelles Verständnis: AI-Assistenten behalten den Kontext und verstehen den Ablauf des Gesprächs, was einen natürlicheren Dialog ermöglicht. Traditionelle Software hat kein kontextuelles Bewusstsein von einem Befehl zum nächsten.

“3. Anpassungsfähigkeit: AI kann sich dynamisch anpassen und auf eine Vielzahl von Anfragen reagieren, während traditionelle Tools auf einen vordefinierten Satz von Funktionen beschränkt sind. Ein AI-Assistent kann beim Schreiben, Analysieren, Rechnen, Programmieren, Ideenfindung und mehr innerhalb einer einzigen Schnittstelle helfen.”

Das war nützlich, aber ich wollte etwas Einfacheres zum Verstehen. Also fragte ich:

Eine Benutzeranfrage auf einer Konversations-AI-Schnittstelle, die um eine einfache Erklärung für ein nicht-technisches Publikum bittet.

Claude:

“Hier ist eine einfache Möglichkeit, den Unterschied jemandem ohne technischen Hintergrund zu erklären:

“Denken Sie an traditionelle Software wie Microsoft Word oder Excel als Werkzeug, wie einen Hammer oder einen Taschenrechner. Es hat einen festgelegten Funktionsumfang, den es ausführen kann, und Sie müssen lernen, wie man es richtig benutzt, um das gewünschte Ergebnis zu erzielen.

“Auf der anderen Seite, denken Sie an moderne konversationelle KI als einen intelligenten Assistenten, wie einen wissenden Kollegen oder Freund. Sie können einfach in normalem Englisch mit ihr sprechen und sie versteht, was Sie tun möchten. Sie kann Ihnen bei allerlei Aufgaben helfen, von Schreiben über Mathematik bis hin zu Ideenfindung.

“Sie müssen keine speziellen Befehle oder Techniken lernen – chatten Sie einfach natürlich mit ihr. Sie passt sich Ihren Bedürfnissen an und merkt sich den Kontext Ihrer Unterhaltung. Mit der Zeit lernt sie Sie und Ihre Vorlieben kennen.

“Also, während traditionelle Software wie ein statisches Werkzeug ist, das Sie benutzen, ist konversationelle KI mehr wie ein intelligenter Partner, mit dem Sie natürlich interagieren, um Dinge zu erledigen. Es ist eine flexiblere, persönlichere und effizientere Art zu arbeiten.”

Hmm. Nicht ganz das, was ich wollte. Also setzte ich das Gespräch fort:

Eine Antwort der Konversations-KI, die rät, technische Fachbegriffe und Verweise zu vermeiden, die für nicht-technische Personen möglicherweise nicht nachvollziehbar sind.

Claude:

“Sicher, lassen Sie mich es noch einmal ohne technische Begriffe versuchen:

“Stellen Sie sich vor, Sie sprechen mit einem Freund, der wirklich kenntnisreich ist und Ihnen gerne helfen möchte. Sie können einfach in normalem Englisch mit ihm über das sprechen, was Sie tun möchten, sei es ein Aufsatz schreiben, ein mathematisches Problem lösen oder Ideen für ein Projekt sammeln.

“Anstatt eine Menge spezifischer Schritte oder Befehle lernen und sich merken zu müssen, können Sie einfach in Ihren eigenen Worten erklären, was Sie brauchen. Ihr Freund versteht den Kontext und passt seine Hilfe basierend auf dem an, was Sie bereits besprochen haben.

“Es ist ein Hin und Her Gespräch, bei dem Sie Fragen stellen, Dinge klären und Ratschläge erhalten können. Und je mehr Sie mit diesem Freund sprechen, desto besser versteht er Ihre einzigartigen Bedürfnisse und Ihren Kommunikationsstil.

“Stellen Sie sich nun vor, Sie könnten diese Art von hilfreicher, einfacher Interaktion auch mit einem Computerprogramm haben. Das ist die Grundidee hinter neuen Arten von Software, von denen Sie vielleicht gehört haben.

“Anstatt der alten Art von Software, bei der Sie eine starre Reihe von Funktionen haben und den richtigen Weg lernen müssen, sie zu verwenden, ähnelt diese neue Software eher einem wissenden Freund. Sie können einfach konversationell mit ihr sprechen und sie findet heraus, wie sie Ihnen basierend auf dem natürlichen Fluss Ihrer Diskussion helfen kann.

“Es ist also eine intelligentere, persönlichere und einfachere Art, Hilfe bei allerlei Aufgaben auf Ihrem Computer zu bekommen, indem Sie einfach wie mit einer Person mit ihr sprechen. Das ist der entscheidende Unterschied zur älteren, starreren Software.”

Zusammenfassung: Ich versuchte, mit diesen Beispielen zwei Dinge zu tun. Zum einen wollte ich ein einfaches Beispiel dafür bieten, warum Chatbot-Software so anders ist als jede Software, die wir je benutzt haben. Und zum anderen wollte ich illustrieren, wie sich ein einzelner Chat entwickeln kann. Es ist nicht nur eine einzelne Frage und eine einzelne Antwort. Es ist ein Gespräch. Das ist ein großer Teil des Durchbruchs.

Chat-KIs sind eine Art Kombination aus Praktikant und wissendem Berater. Sie können nicht davon ausgehen, dass sie wissen, was Sie meinen. Sie müssen erklären, was Sie wollen, warum Sie es wollen und wie sie am hilfreichsten sein können.

Drei Arten von KI-Software

An icon of a key

Grob gesagt, gibt es heute drei Arten von KI-Software. Die erste sind KI-Grundlagenplattformen wie ChatGPT, die Kern-KI-Technologie. Die zweite ist, nennen wir sie, KI-Erweiterungen, Software, die frisch auf den Kernplattformen aufgebaut wurde. Von vielen dieser Tools, wie Jasper oder Rewind, haben Sie wahrscheinlich noch nie gehört.

Meine dritte Kategorie ist Software, die KI-Tools in das bestehende Produkt integriert hat. Zum Beispiel bietet die Microsoft-Softwaresuite neue KI-Tools in Word, Excel und PowerPoint. Adobe hat KI-Technologie in Photoshop und Acrobat integriert. Grammarly wird um die neue Generation der LLM-basierten Technologie neu aufgebaut. Es ist größtenteils dasselbe Produkt, aber mit hinzugefügter KI.

Es wird immer klarer, dass fast alle Software, die Sie heute verwenden, bald KI-Funktionen enthalten wird. Sie müssen selbst beurteilen, ob diese Tools wirklich nützlich sind oder nur als KI-Schaufensterdekoration dienen.

Ich bin mehr an den neuen Tools interessiert, die von Grund auf so gebaut sind, dass sie den Wert bieten, den nur KI bieten kann. Das ist die nächste Generation von Software.

Arbeiten mit KI-Software

Ich bin leider ein Windows-Typ (es ist eine lange Geschichte, warum), und daher spreche ich über meine Erfahrungen mit dem Zugriff auf KI-Software über einen Windows-Computer, nicht einen Mac. Da die gesamte Software hier browserbasiert ist, sollte es keinen Unterschied machen, diese Tools auf einem Mac zu verwenden. Aber ich gebe keine Garantien.

Sie werden etwas Geld brauchen, um das KI-Spiel zu spielen, aber nicht viel. Wie oben beschrieben, kann ein Großteil der grundlegenden Software über kostenlose Versionen zugegriffen werden. Aber Sie werden normalerweise ein kostenpflichtiges Abonnement wollen, während Sie es testen, und das Abonnement sollte etwa 20 $/Monat kosten. Kündigen Sie nach dem Testen (nicht vergessen!). Wenn Sie etwas sehen, das 79 $/Monat oder, Gott bewahre, 159 $/Monat kostet, können Sie es ignorieren. Sie denken nicht an Sie als potenziellen Benutzer; sie denken an große, etablierte Unternehmensnutzer.

Schulung für Chat-KI

An icon of a key

Die heutige KI ist scheinbar einfach. Jeder, der eine Frage eingeben kann, kann sie nutzen. Aber sie gut zu nutzen ist kompliziert, was auf den ersten Blick keinen Sinn ergibt, bis man sich mit den Komplexitäten rund um “Eingabeaufforderungen” und verwandte Konzepte befasst.

Um auf ihre Intelligenz zugreifen zu können, muss man manchmal mit ihr sprechen, als wäre sie ein Idiot. Oder vielleicht ein idiot savant. Es ist ein bisschen wie die von Dustin Hoffman gespielte Figur in Rain Man.

Jeder kann ChatGPT nutzen. Gehen Sie einfach zu chat.openai.com und Sie können die neueste Version, GPT-4o, kostenlos nutzen (es gibt einige Premium-Funktionen für zusätzliche 20 $/Monat).

Wenn Sie zu ChatGPT gehen, finden Sie im Wesentlichen einen leeren Bildschirm und die implizite Frage “Wie kann ich Ihnen heute helfen?”

Sie können ihm Fragen stellen. Noch besser, Sie können eine große PDF-Datei hochladen und Fragen zu der Datei stellen. Sie können auch Bilder hochladen, die es beschreiben kann, oder eine gescannte Seite: Es kann den Text erkennen, selbst wenn er handgeschrieben ist.

Was sich als entscheidendes Problem für die erfolgreiche Nutzung von Chat-KI herausgestellt hat, ist das Erlernen, wie man mit ihr “spricht” (was Sie in der neuesten mobilen App-Version buchstäblich tun können). In der Chat-KI-Sprache nennt man das Erstellen von “Eingabeaufforderungen” oder “Aufforderungen”. Benutzer haben festgestellt, dass je präziser und detaillierter ihre Aufforderungen sind, desto besser sind die Antworten, die sie von ChatGPT erhalten. Zudem sind Aufforderungen nicht nur einmalig. Chat-KI kann ein Gespräch eine Weile fortsetzen (wenn auch nicht unbegrenzt), und wenn Sie nicht die Antwort erhalten, die Sie suchen, können Sie Ihre Aufforderungen überarbeiten und verfeinern. Dies erfordert viel Gewöhnung und hat eine Reihe von Anleitungen, schriftlich und online, hervorgebracht, um Benutzer darin zu schulen, wie man das Beste aus Aufforderungen herausholt.

Versuchen Sie, eine beliebige Chat-KI-Software zu bitten, ein Konzept wie Entwicklungsbearbeitung zu erklären. Bitten Sie es dann, eine Erklärung zu erstellen, die ein 12-Jähriger verstehen könnte. Die Ergebnisse sind dramatisch unterschiedlich. Amüsanterweise scheint die Chat-KI auch auf emotionale Bitten zu reagieren. Wenn Sie einer Aufforderung hinzufügen “das ist sehr wichtig für meine Karriere”, können Sie nützlichere Antworten erhalten.

(Dies ist ein ebenso guter Zeitpunkt wie jeder andere, um eine Klammerbemerkung hinzuzufügen: Es ist sowohl beruhigend als auch zutiefst beunruhigend, dass die führenden Wissenschaftler, die an sprachbasierten KIs arbeiten, nicht erklären können, warum solche Dinge passieren.)

Wie man auffordert

An icon of a key

“Auffordern” ist eine spezifische Fähigkeit, die wesentlich für die effektive Nutzung von Chat-KI ist.

Von den verschiedenen übernommenen Begriffen, die während des KI-Goldrauschs aufgegriffen wurden, sind “Aufforderungen” und “Auffordern” so gut wie es nur geht. Man “spricht” nicht wirklich mit einer Chat-KI. Man “stellt” ihr keine Fragen (oder sollte es nicht tun – so funktioniert es nicht). Man fordert diese Maschinen auf, Antworten zu geben, nicht einfache Lösungen.

Zuerst dachte ich, ein Vergleich mit theatralischen Aufforderungen könnte passen. Der Souffleur gibt einem Schauspieler, der eine Zeile vergessen hat, einen Hinweis, damit dieser wieder ins Spiel kommt. Aber das ist nicht zutreffend, weil eine KI-Aufforderung keinen Teil eines auswendig gelernten Textes lockert – so funktioniert generative KI nicht. Geben Sie einer KI-Maschine mehrfach dieselbe Aufforderung, und die Antworten werden immer zumindest ein wenig unterschiedlich sein.

Gerade habe ich ChatGPT gebeten, “die Schlüsselelemente effektiver Aufforderungen aufzulisten”. Ich habe es ein zweites Mal gefragt und die Antworten waren thematisch konsistent, aber in den Details ziemlich unterschiedlich. Hervorgehobene Themen waren:

  • Seien Sie spezifisch

  • Vermeiden Sie Mehrdeutigkeit

  • Geben Sie Hintergrundinformationen

  • Verwenden Sie klare Anweisungen

In gewisser Weise ist es ziemlich seltsam: KI hat ein gutes Verständnis für Sprache – sollte sie nicht wissen, was Sie meinen, ohne pedantische Aufforderungen? Aber genau diese Sprachbeherrschung macht Aufforderungen so mächtig. Sagen Sie ihr genau, was Sie meinen, nicht ungefähr.

Sprechen Sie mit ihr wie mit dem hilfreichen Assistenten, dem gelehrten Berater, den Sie sich wünschen, nicht wie mit einem Kind von der Straße.

Die Erkenntnis hier ist, dass zumindest vorerst die effektive Nutzung von auf LLM basierenden KI-Tools zumindest Vertrautheit mit den besten Praktiken für Aufforderungen erfordert. Eine Meisterschaft im Auffordern wird angemessen belohnt.

Halluzinationen: Ein Störenfried im System

An icon of a key

KI, die auf großen Sprachmodellen basiert, erfindet Dinge. Das tut sie einfach. Dies wird allgemein als “Halluzinationen” bezeichnet. Es ist ein echtes Problem, ein ernstes Problem. Sie müssen Halluzinationen verstehen, wenn Sie mit KI arbeiten möchten.

Das Wort des Jahres 2023 im Cambridge Dictionary war “Hallucinate” (halluzinieren), dessen Definition erweitert wurde, um “Wenn eine künstliche Intelligenz… halluziniert, produziert sie falsche Informationen” einzuschließen. (Weitere Ergänzungen zum Wörterbuch 2023 umfassen “Prompt-Engineering”, “großes Sprachmodell” und “GenAI”.)

KI-Halluzinationen, so bemerkt Cambridge, “erscheinen manchmal unsinnig. Aber sie können auch völlig plausibel erscheinen – selbst wenn sie faktisch ungenau oder letztlich unlogisch sind.” Das ist leider ziemlich wahr, und Stand Juli 2024 bleibt dies eine dramatische Einschränkung für die Nutzung generativer KI für mission-kritische Aufgaben. Es ist eine der großen Merkwürdigkeiten der KI, und es dauert eine Weile, bis die Menschen das verstehen. Denken Sie daran, generative KI ist meist eine Vorhersagemaschine für das nächste Wort und keine Fakten-Datenbank. Daher die Notwendigkeit von HITLs, Menschen-in-der-Schleife, wie wir jetzt genannt werden, um die KI-Ausgaben zu überprüfen. Und wieder ist es bemerkenswert, dass wir einen so außergewöhnlichen Wert aus einer Technologie ziehen können, die nachweislich ungenaue Ausgaben erzeugen kann. So ist das.

Gary Marcus, ein erfahrener und gut informierter KI-Kritiker, vergleicht KI-Halluzinationen mit kaputten Uhren, die zweimal am Tag richtig gehen. “Es ist manchmal richtig”, sagt er, “aber man weiß nicht, welcher Teil der Zeit, und das mindert seinen Wert erheblich.”

Ethan Mollick, ein Hauptredner auf der Publishers Weekly Konferenz im September 2023, bemerkt, dass Menschen, die KI nutzen, 100% Genauigkeit erwarten. Halluzinationen, sagt er, sind ähnlich wie “menschliche Fehlerquoten”, die wir täglich tolerieren.

Andrej Karpathy, ein bekannter Wissenschaftler, der sich auf KI spezialisiert hat und derzeit bei OpenAI arbeitet, schreibt über Halluzinationen:

“Ich habe immer ein bisschen Schwierigkeiten, wenn ich nach dem ‘Halluzinationsproblem’ in LLMs gefragt werde. Denn in gewissem Sinne ist Halluzination alles, was LLMs tun. Sie sind Traummaschinen.

“Wir lenken ihre Träume mit Prompts. Die Prompts starten den Traum, und basierend auf der verschwommenen Erinnerung des LLM an seine Trainingsdokumente führt das Ergebnis meistens zu etwas Nützlichem.

“Erst wenn die Träume in als faktisch inkorrektes Territorium eingestuft werden, nennen wir es eine ‘Halluzination’. Es sieht aus wie ein Fehler, aber es ist nur das LLM, das tut, was es immer tut.”

Es ist nicht nur das Problem, Dinge zu erfinden. Chat-KI ist tief fehlerhafte Software.

Für viele Anfragen, insbesondere von Anfängern, sind die Antworten banal, unpassend oder einfach unhilfreich. Chat-KI hat Schwierigkeiten beim Zählen: Wenn man sie nach einem 500-Wörter-Blogpost fragt, hat man Glück, wenn man 150 bekommt.

Und jedes der KI-Unternehmen hat, um Vorurteile zu reduzieren und um zu vermeiden, dass Anfragen wie “wie baut man eine Bombe” beantwortet werden, enge Antwort-Schutzschienen um ihre Produkte errichtet: Allzu oft ist die Antwort auf eine Frage im Wesentlichen “Nein, das werde ich nicht beantworten.” Ich bat Google Gemini, einen Entwurf dieses Textes zu überprüfen und wurde darauf hingewiesen, dass “es wichtig ist, die Genehmigung des Autors vor der Veröffentlichung einzuholen.”

Faktenprüfung

An icon of a key

Ich argumentiere, meist auf taube Ohren, dass Halluzinationen ein Technologieproblem sind, das eine technologische Lösung finden wird. Ja, sie sind endemisch für LLMs, aber sie können umgangen werden.

Betrachten Sie dies: Ich habe vier Chat-KIs gebeten, die folgenden Aussagen zu überprüfen:

  • Stand 2024 gibt es 6 große multinationale Verlage mit Sitz in New York City. Sie sind als die Big 6 bekannt.

  • E-Books dominieren weiterhin den Buchverkauf in den Vereinigten Staaten.

  • Borders und Barnes & Noble sind die beiden größten Buchhandelsketten in den Vereinigten Staaten.

  • Nach einem Umsatzrückgang während Covid wachsen die US-Buchverkäufe wieder zweistellig.

Alle haben die Fehler in den ersten drei Aussagen erkannt. Bei der vierten wurden sie alle etwas verwirrt und waren unsicher über das Ausmaß des Covid-Verkaufsanstiegs und die anschließenden Verkaufsmuster. Es ist ein kleines, nicht repräsentatives Experiment, aber diese Chat-KIs, die nicht darauf ausgelegt sind, faktenbasiert zu sein, können eine glaubwürdige Arbeit bei der Bewertung von Fakten leisten, die die meisten Gelegenheitsbeobachter übersehen würden.

Was ist mit Bildern und Videos?

An icon of a key

Da die Veröffentlichung von Handelsbüchern mehr von Text als von Bildern abhängt, neigen Verleger dazu, die bahnbrechenden KI-basierten Werkzeuge für Bilder und Videos zu übersehen.

Sie sind relevant für das Verständnis der KI-Revolution. Aber die Diskussion ist zu groß für den verfügbaren Platz: Ich würde ihr einfach nicht gerecht werden.

Empfohlen für Autoren und Verleger: Spielen Sie mit den Bildgenerierungsfunktionen in ChatGPT – sie sind kostenlos und machen Spaß. Suchen Sie dann unter “Video und KI” und staunen Sie über einige der Beispiele, die Sie auf den verlinkten Seiten finden. Obwohl das Tool noch nicht öffentlich verfügbar ist, bietet OpenAI’s Sora einige atemberaubende Beispiele für Videos, die nur aus Texteingaben generiert wurden.

Software für Buchverlage

Es gibt wenig von Grund auf entwickelte KI-Software speziell für Buchverlage (obwohl es viele für Autoren gibt).

Wissenschaftliche Verlage haben mehr Optionen, mit einer Vielzahl von KI-Werkzeugen für Forschung, Schreiben und Veröffentlichen.

Für Publikumsverlage beziehen sich die meisten Optionen auf KI und Audio. Abseits von Audio konzentrieren sich die Entscheidungen auf Bearbeitungs- und Marketing-Tools. Es gibt auch mehrere KI-Inhaltserkennungstools und Inhaltslizenzierungstools und -dienste.

Die Bearbeitungssoftware ist auf Autoren ausgerichtet, nicht auf professionelle Lektoren — es gibt viel mehr Autoren als Lektoren, und die von professionellen Lektoren geforderte Qualität ist weitaus höher als die von (meist selbstveröffentlichten) Autoren.

Die Marketing-Tools zielen ebenfalls breiter als nur auf Buchverlage ab, sondern auf Marketer überall, mit Werkzeugen für Webinhalte, Texterstellung und SEO. Jasper.ai ist in dieser Kategorie führend und nennt HarperCollins als Kunden.

Shimmr, ein Sponsor dieses Buches, ist ein KI-gesteuertes Werbeerstellungstool speziell für Buchverlage. Das Unternehmen und sein Gründer, Nadim Sadek, wurden in einem Artikel vom Mai 2024 in Publishers Weekly vorgestellt.

„Was wir tun, ist, KI zu nutzen, um das psychologische Profil eines Buches zu berücksichtigen und es mit der Denkweise eines bestimmten Publikums abzugleichen, um eine effektivere Verbindung zwischen Lesern und Büchern zu gewährleisten“, sagte Sadek gegenüber PW. „Wir nennen es ‚Buch-DNA‘, und es geht nicht nur darum, die Charaktere und die Handlung eines Buches zu kennen, sondern auch die Werte, Interessen und Emotionen des Buches.“

Durch die Nutzung der Buch-DNA erstellen die KI-Tools von Shimmr dann gezielte Anzeigen für Such- und Social-Media-Kanäle (derzeit Google und Meta). Die Anzeigen nehmen die Form von Display-Anzeigen an, die von KI-generierten Bildern begleitet werden, zusammen mit Slogans.

Was ich Verlagen, die Shimmr evaluieren, mitteile, ist, dass es zusätzlichen Umsatz generieren kann, was wir von einem neuen Werbe-/Marketing-Tool erwarten.

Wenn Sie ein weiteres „nur mit KI“ Software-Tool erleben möchten, schauen Sie sich Hypnovels an, das Kapitel in fiktionalen Büchern animiert. „Erzählung, Bild und Bewegung, alles von KI generiert, kommen mit großartigem Geschichtenerzählen auf eine Art und Weise zusammen, die weniger wörtlich ist als traditionelle Animation (daher das ‚Hypno‘) und sensorisch ansprechender als ein Hörbuch, in einem Stil, der das Kapitel einzigartig und fesselnd macht.“

Ein weiterer neuer Anbieter, der aus der Gelegenheit mit KI entstanden ist, ist Veristage (ebenfalls ein Sponsor dieses Buches). Veristage bietet Insight, seinen „KI-Veröffentlichungsassistenten“, ein aufgabenbezogenes Frontend für mehrere Verlagsfunktionen.

Die Insight-Reise beginnt mit dem Manuskript. Das Hochladen einer frühen Version schaltet eine Reihe von Werkzeugen frei, einige wertvoller für die Redaktion, andere wertvoller für das Marketing. Nach der Arbeit mit allen Funktionen können Sie einen PDF-Bericht herunterladen, der redaktionelle Aspekte wie Schreibstil, Tropen, Klischees und den Gebrauch von Adverbien und Adjektiven sowie Marketinginhalte wie Beschreibungen, Metadaten, Alleinstellungsmerkmale, Vergleichsprodukte, Amazon-optimierte Inhalte und vorgeschlagene Social-Media-Posts enthält.

Was mir an Insight am besten gefällt, ist, dass es einen ganzheitlichen Ansatz zur Anwendung von KI im Verlagsprozess verfolgt, anstatt mehrere Software-Tools zu sammeln, die jeweils für eine andere Funktion gedacht sind.

Ich möchte hier auch meine Verlagsplattform Leanpub hervorheben. Sie waren großartig zu arbeiten. Klein ist schön: Sie gehen Risiken mit Technologien und Dienstleistungen ein, die größere Unternehmen meiden würden. Von besonderem Interesse für Autoren und kleinere Verlage ist ihr neuer TranslateWord-Dienst, mit dem Sie ein in Microsoft Word geschriebenes Buch in bis zu 31 Sprachen übersetzen können, über die GPT-4o API (die ChatGPT antreibt). Das ist es, was ich benutze, um dieses Buch zu übersetzen.

Ich habe anderswo nach einem Dienst für Buchübersetzungen gesucht. Es gibt viele Übersetzungsfirmen, einige verwenden KI. Die einzige, die ich gefunden habe, die Buchübersetzungen anbietet, ist DeepL. Aber es ist kein Schwerpunkt für das Unternehmen. Derzeit ist Leanpub der richtige Ort.

Geschäftliche Software für das Verlagswesen

An icon of a key

Die bestehenden Anbieter von Geschäftssystemen, die der Verlagsbranche dienen, beginnen, KI-Technologien zu integrieren, wie wir es bei Unternehmen im großen Maßstab gesehen haben, wie Salesforce und Oracle.

Ich habe mit mehreren Anbietern von Verlagssoftware-Systemen gesprochen, darunter Firebrand, und alle betrachten die Möglichkeiten, gehen aber vorsichtig vor.

Ich freue mich auf die Gelegenheit, auf dem Publishing Innovation Forum von Firebrand im September 2024 in Nashville, TN, mit einer vielfältigen Gruppe von Teilnehmern über KI zu sprechen.

knk hat zwei Webinare zu KI durchgeführt und ein Whitepaper veröffentlicht, aber (Stand 26. Juni 2024) noch keine KI-Funktionen in seinen Produkten angekündigt.

Virtusales hat kürzlich sein erstes Set von KI-gestützten Tools eingeführt, darunter Bildmarkierung, Alt-Text-Generierung, Werkzeuge zur Textbearbeitung, Erstellung von Verkaufs- und Marketingtexten und Übersetzungen dieser Texte.

Ich habe mit Klopotek in ihrem Klopotek Publishing Radio gesprochen. Sie haben “eine KI-Initiative im Bereich Kundenservice gestartet”, aber keine Details sind verfügbar.

Supadu, das Verlagen “Webdesign, E-Commerce und Datenlösungen” anbietet, verfügt jetzt über “Supadu Smart AI,” (pdf) mit “avatar-geführten Titelvideo-Rezensionen mit Smart Buy,” “avatar-gesteuerten Werbematerialien für Marketing- und Vertriebsteams” und “einfachen mehrsprachigen Übersetzungen von Autoren- und Titelvideos.”

KI-Software für Buchverlage: die Startups

Einige Leute sind mit der Arbeit vertraut, die ich im Bereich technologiegestützter Startups im Buchverlagswesen geleistet habe. Es gibt einen Bericht in Publishers Weekly, der die Arbeit beschreibt und Links zur Datenbank enthält.

Wie Sie im Bericht sehen werden, betrachte ich Startups im gesamten Spektrum des Buchverlagswesens. Ich nehme keine neuen Buchverlage auf, es sei denn, sie machen etwas Ungewöhnliches mit Technologie. Das grundlegende Kriterium ist: Nutzen Sie Technologie, um einen Aspekt des Buchverlagsprozesses zu beleben? In meiner Datenbank sind über 1.600 Unternehmen, die meisten wurden nach der Veröffentlichung des ersten Kindle durch Amazon im Jahr 2007 gegründet.

Nachdem Sie sich einen Überblick über die Datenbank verschafft haben, können Sie tiefer eintauchen. Auf der Registerkarte ganz rechts finden Sie eine Möglichkeit, nur nach den KI-bezogenen Verlags-Startups zu sortieren.

Ein Screenshot einer Tabelle, die Werkzeuge und Dienstleistungen mit einem für KI ausgewählten Filter auflistet und eine Anzahl von 243 hervorhebt.

Wie Sie in der Abbildung sehen können, gibt es über 240 KI-bezogene Verlagsstartups (Stand Anfang Juli 2024). Wir zählen die Audioverlags-Startups, die KI einsetzen, als separate Kategorie, und die Gesamtzahl beider beträgt über 300 Unternehmen. Die Mehrheit, über 280, wurde nach dem ersten Erscheinen von ChatGPT im November 2022 gegründet. Dieses Volumen an neuen Geschäftsgründungen ist im Buchverlagswesen beispiellos. Es ist erstaunlich.

Wie es für die gesamte Datenbank charakteristisch ist, zielen diese KI-Startups hauptsächlich auf Autoren ab (70%). Etwa 13% wollen Verlage bedienen. 10% sind auf Kinderverlage fokussiert.

Etwa 50 der Startups richten sich an Leser mit einer Vielzahl an kreativen Angeboten. Einige sind Erzählplattformen. Es gibt einige Zusammenfassungsdienste. Es gibt mehrere Entdeckungsseiten, “Nutzen Sie KI, um Ihr neues Lieblingsbuch zu finden.” Schnell verbesserte KI-generierte Stimmen haben zu einer Auswahl an “Lies es mir vor”-Werkzeugen geführt.

Und einige interessante Ideen, die ohne KI nicht möglich wären.

Bookshelf: Reading Tracker ist eine Kombination aus Buchentdeckungs- und persönlicher Bibliotheks-App, die „automatisches Zeit-Tracking, Leseziele & Erinnerungen sowie aufschlussreiche Statistiken & Trends“ beinhaltet. Sein KI-Bibliothekar „kann Zusammenfassungen und Karteikarten erstellen, wichtige Ideen und Erkenntnisse diskutieren und vieles mehr.“

Mein Freund Ron Martinez hat kürzlich eine Seite namens Inventionarts.ai gestartet, die „ein neues konversationelles Medium“ einführt. Wie auf der Seite erklärt wird: “Sprechen Sie mit mehreren KI-Persönlichkeiten, jede mit ihrer eigenen Identität, ihrem Fachwissen und Bewusstsein. Laden Sie verschiedene Personas ein, sich Ihnen in Szenarien anzuschließen. Und Sie können auch eine fiktive Rolle spielen!” Eine Art literarisches Spiel.

Wie es für die größere Startup-Kohorte charakteristisch ist, sind viele dieser Startups winzig bis winzig klein, nur eine Person mit einer Website und einer halbgaren Idee. Ich nehme sie alle auf – wer weiß, wohin sie führen.

Ich ermutige Sie nachdrücklich, mit der Datenbank zu spielen. Klicken Sie auf ein paar Links. Ich denke, Sie werden von der Innovation und Kühnheit vieler dieser Organisationen begeistert sein.

Einer der Sponsoren dieses Buches, Book Advisors, ist auf Fusionen und Übernahmen in der Verlagsbranche spezialisiert. Ich empfehle immer innovativen Startups, nach Partnern zu suchen, und Book Advisors ist der Ort, an den ich sie schicke, um den Prozess zu besprechen. Die Buchverlagsbranche kann auf mehrere angesehene M&A-Firmen zurückgreifen, darunter The Fisher Company und Oaklins DeSilva+Phillips. Book Advisors ist die einzige Firma, die ich kenne, die auch mit Technologie-Startups arbeitet.

KI und Buchverlag: Was macht die Branche derzeit?

An icon of a key

Die KI-bezogenen Aktivitäten vieler prominenter Handelsgruppen der Verlagsbranche scheinen sich dem Chor der Urheberrechtsbesorgten anzuschließen. The Association of American Publishers “reichte Erwiderungskommentare in der Untersuchung des US Copyright Office zum Schnittpunkt von Urheberrecht und Künstlicher Intelligenz (KI) ein...”

Die britische Publishers Association merkt an, “dass es von größter Wichtigkeit ist, dass die Regierung so schnell wie möglich greifbare Lösungen bereitstellt, um die menschliche Kreativität und das Wissen zu schützen, die eine sichere und zuverlässige KI untermauern.”

Auf der anderen Seite bietet die Independent Publishers Guild (IPG) mit mehr als 600 Mitgliedern KI-Richtlinien und Schulungen für ihre Mitglieder an, einschließlich ihres “Practical Guide to AI in Publishing,” durchgeführt von einem anerkannten KI- und Verlagsexperten, George Walkley.

Hier in den USA habe ich das Privileg, Teil der AI Working Group der Book Industry Study Group (BISG) zu sein, die dem Workflow Committee berichtet. Die Arbeitsgruppe hat mehrere potenzielle strategische Initiativen skizziert:

  • Entwicklung von Best Practices und Standards: Empfehlen von Best Practices im Zusammenhang mit der Nutzung von KI, verknüpft mit ethischen Richtlinien, bestehenden Vorschriften und Gesetzen. Dies umfasst Transparenz bei KI-generierten Inhalten und deren Offenlegung gegenüber Verbrauchern.

  • Branchenumfragen und Definitionen: Durchführung von Umfragen, um umfassende Brancheneinblicke in aktuelle und potenzielle KI-Nutzungen zu gewinnen und klare Definitionen und Umfänge dafür festzulegen, was KI im Kontext des Buchverlags bedeutet.

  • Periodische Berichterstattung und Überprüfungen: Anbieten von periodischen Berichten, um der Branche zu helfen, die schnellen Veränderungen durch KI-Technologien vorherzusehen und sich anzupassen.

Andere Schreib- und Verlagsverbände versuchen, dem Thema zuvorzukommen. Einige beziehen Stellung gegen KI; andere versuchen einfach, ihren Mitgliedern die Technologie zu erklären und möglicherweise mit ihr zu experimentieren.

KI und Buchverlag: Was machen Verlagsunternehmen?

Vor einem Jahr lautete die Antwort auf die Frage, was Verlagsunternehmen derzeit tun, “nicht viel.” Seitdem hat sich nicht viel geändert, aber es gab einige Aktivitäten. Ich werde mich auf Buchverlage konzentrieren; wissenschaftliche und akademische Verlage sind aktiver. Hier ist ein Teil dessen, was ich herausgefunden habe.

Hachette: Laut einem Bericht vom November 2023 in The Bookseller im Vereinigten Königreich hat Hachette eine Stellungnahme zu KI veröffentlicht, in der eine Unterscheidung zwischen ‘operativen’ Anwendungen und ‘kreativen’ Anwendungen vorgenommen wird. Das Unternehmen “machte deutlich, dass es ‘verantwortungsvolles Experimentieren’ für operative Anwendungen fördert, aber ’maschinelle Kreativität... ablehnt, um originale kreative Inhalte, die von Menschen produziert werden, zu schützen.”

HarperCollins: Laut einem Bericht von April 2023 in Publishers Weekly von Andrew Albanese und Ed Nawotka sagte HarperCollins-CEO Brian Murray:

“Wir wissen, dass es wichtig sein wird und einen großen Einfluss auf unsere Branche in den nächsten drei bis fünf Jahren haben wird. Und deshalb denke ich, dass viele von uns versuchen herauszufinden, wie und um sicherzustellen, dass wir es auf eine ethische, moralische Weise einsetzen, die uns hilft, Autoren zu dienen und professionelle Dienstleistungen für Autoren bereitzustellen und nicht mit Autoren und Geschichten konkurriert.

“Und das ist, denke ich, eine Herausforderung. Vielleicht nicht so sehr für alle Verlage, die hier sind, aber ich garantiere Ihnen, dass es viele kleine Tech-Teams auf der ganzen Welt gibt, die möglicherweise auf unser Geschäft abzielen. Sie sind keine Verleger, sie sind keine Redakteure. Sie sind die Technologen und sie sehen eine Chance.”

Penguin Random House (PRH): Bertelsmann, das Mutterunternehmen von PRH, bietet ein Whitepaper namens State of Play: Exploring Generative AI’s Transformative Effects on the Media & Entertainment Industry an, das einen Abschnitt über den Buchverlag enthält.

Laut einem Bericht in Publishers Lunch hat das Unternehmen außerdem “eine eigene interne KI-Anwendung namens PRH ChatGPT eingeführt.”

Der Artikel besagt, dass PRH-interne Dokumente erklären, dass das Programm “‘zur Optimierung von Prozessen, Förderung der Kreativität und Bereitstellung von Dateneinblicken’ in verschiedenen Abteilungen verwendet werden kann. Das Unternehmen schlägt vor, dass die App unter anderem zum Zusammenfassen von Büchern und Dokumenten, Überarbeiten von E-Mails, Verfassen von Blogbeiträgen oder Stellenbeschreibungen, Analysieren von textbasierten Daten und zum ‘Generieren von Ideen für Inhalte’ verwendet werden kann.”

Simon & Schuster: Unternehmens-CEO Jonathan Karp wurde in den New York Times “Most Memorable Literary Moments of the Last 25 Years” mit einem Zitat erwähnt, das in Publishers Weekly von der U.S. Book Show im Mai 2024 berichtet wurde. Er sagte, dass KI nicht der “Elefant im Raum” sei, sondern eher “wie die Zikade in der Welt. Wissen Sie, viel Summen und viel Paarung.”

Er erkannte an, dass KI “definitiv ein wertvolles Werkzeug ist. Sie wird uns definitiv effizienter machen. Sie wird uns helfen, Informationen besser zu verarbeiten und zu sammeln, und hoffentlich den Mitarbeitern ermöglichen, eine höherwertige Arbeit zu leisten, die interessanter und kreativer ist.”

Im März, auf der London Book Fair, berichtete The Bookseller, sagte Karp, dass das Unternehmen auch Fremdsprachversionen von KI-generierten Hörbüchern in “Gebieten prüfen würde, in denen [die Werke dieses Autors] sonst nie eine Chance hätten aufgrund der Kosten der [Audio-Produktion].”

KI und Buchverlag: Die Anwendungsfälle

An icon of a key

Die spezifischen Anwendungsfälle für KI und Buchverlag in verschiedenen Funktionen sind konzeptionell leicht zu beschreiben. Aber es gibt nicht viele Informationen darüber, was Verlage tatsächlich tun.

Keith Riegert, CEO von Ulysses Press und Perfect Bound, präsentierte auf der Publishers Weekly U.S. Book Show im Mai 2024 und bot den umfassendsten Überblick, den ich bisher über KI-Anwendungsfälle innerhalb von Verlagen gesehen habe. Perfect Bound ist ein Sponsor dieses Berichts; ich stehe zu dieser Aussage. Er bietet “20 praktische Möglichkeiten, wie Sie als Verlagsexperte KI sofort nutzen können.”

Seine Präsentation, Getting Started with AI, kann von der Perfect Bound-Website angesehen und heruntergeladen werden.

Was passiert, wenn KI ein Buch liest?

Ich leihe mir diesen Abschnittstitel aus Ethan Mollicks Newsletter bewusst aus - es gibt keinen Grund, ihn zu verbessern. Mollick ist Professor an der Wharton School der University of Pennsylvania, der Unternehmertum und Innovation studiert. Sein Newsletter, den ich häufig empfehle, ist ruhig, erfrischend und einzigartig aufschlussreich.

Zu den Dingen, die Mollick als Kommentator qualifizieren, gehört, dass er kein Eigeninteresse hat. Er muss KI weder verkaufen noch schlechtreden. Er hat sich lediglich verpflichtet, KI in ihren vielfältigen Auswirkungen zu erforschen, hauptsächlich auf Bildung, Kultur, Schreiben und Verlage. Und er ist ein guter, klarer Schriftsteller.

Wenn Sie durch Mollicks Newsletter-Archiv blättern, werden Sie sehen, dass er sich bis Dezember 2022 nicht auf KI konzentrierte. Es war nicht sein Thema - wie bei den meisten von uns trat KI in seinen Arbeitsalltag ein, und er konnte seine Augen nicht davon abwenden.

In diesem Beitrag fallen seine Einsichten am nächsten zu unserem Interesse als Verlagsexperten. “Könnte KI,” fragt er, “die Art und Weise verändern, wie wir mit Büchern interagieren?”

Um die Frage zu beantworten, merkt Mollick an, “brauchen wir sowohl eine KI mit einem Speicher groß genug, um ein Buch zu halten, als auch einen Autor, der sein eigenes Buch gut genug kennt, um die Ergebnisse der KI zu beurteilen.” Mollick testet eines seiner mehreren Titel (er spezifiziert nicht, welches, aber aus den Chats geht klar hervor, dass es sich um The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors handelt, ein Buch, das auf Amazon positiv rezensiert wurde, aber kein aktueller Bestseller ist).

Mollick betrachtet verschiedene Aspekte des potenziellen Werts von KI für einen Autor, Verlag oder Leser, einschließlich “KI als Leser und Redakteur” und “ein praktischer Nutzen: Hilfe für Lehrer.” Er bittet ein LLM—großes Sprachmodell—nicht ChatGPT—das Buch zusammenzufassen. Es gelingt zu Mollicks Zufriedenheit.

Dann eine härtere Herausforderung: “Gib mir Beispiele von Metaphern im Buch.” Metaphern, so weist er darauf hin, “sind selbst für menschliche Leser eine Herausforderung, da es darum geht, eine Verwendung von bildhafter Sprache ohne klare Marker zu finden (im Gegensatz zu einem Vergleich gibt es keine ‘wie’ oder ‘als’).” Die Ergebnisse, so hält er fest, “sind beeindruckend, obwohl es kleinere Fehler gibt.”

Das LLM ist als Redakteur weniger erfolgreich: Seine Mängel in diesem Bereich, merkt Mollick an, illustrieren “etwas, das über den aktuellen Stand der KI deutlich geworden ist: Wenn Sie ein sehr guter Schriftsteller oder Redakteur sind, sind Sie besser als die aktuelle KI…”

Nichtsdestotrotz “haben KIs, oder haben zumindest den Anschein, ein Verständnis für den Kontext und die Bedeutung eines Textstücks zu haben.” Infolgedessen glaubt Mollick, dass “sich unsere Beziehung zu Büchern aufgrund der KI wahrscheinlich ändern wird.”

Ich denke das auch.

KI und Buchgestaltung & -produktion

An icon of a key

Expertensysteme und Prozessautomatisierung sind der KI bei der Buchgestaltung und -produktion immer noch voraus.

Software für den automatisierten Buchsatz gibt es mindestens seit den 1970er Jahren. Mitte der 1980er Jahre habe ich ein Softwareprojekt namens PageOne betreut, das auf Donald Knuths TeX basierte und ein Buch in Minuten setzen konnte. SGML erschien etwa zur gleichen Zeit, basierend auf einem 1969 eingeführten Dokumentenstandard. Es wurde weitgehend durch XML ersetzt, das 1996 eingeführt wurde. Diese robusten Auszeichnungssprachen schaffen solide Strukturen für die Automatisierung.

Desktop-Publishing leitete eine weitere Runde der Automatisierung für QuarkXPress und Adobe InDesign sowie Adobe Illustrator und Adobe Photoshop ein. Verlags-Workflows können mit verschiedenen Programmen und Systemen verwaltet werden.

Eine Organisation, die man im Auge behalten sollte, ist die Coko Foundation. Sie bieten eine Suite von Open-Source-Produktions- und Veröffentlichungsmanagement-Tools an, darunter Kotahi, eine Plattform für wissenschaftliche Veröffentlichungen, und Ketty für die Buchproduktion, die einen KI-Assistenten umfasst. Der Kotahi AI PDF Designer “verwandelt das PDF-Design in einen unkomplizierten, interaktiven Prozess.”

Es gibt einige frühe Initiativen, KI in InDesign-Workflows zu integrieren. Im April 2024 kündigte Adobe eine Text-to-Image-Funktion an. Drittanbieter könnten Adobe hier voraus sein: Die innovativen Prepress- und Produktionsanbieter in Indien, wie Hurix Digital und Integra, zeigen mehr Initiative als Adobe bei der Nutzung von KI für die Produktion.

KI & Buchmarketing

An icon of a key

Die Auswirkungen von KI auf das Buchmarketing werden kurzfristig gering, aber langfristig weitaus tiefgreifender sein. Vieles hängt davon ab, was Sie unter ‘Buchmarketing’ verstehen; es verändert sich.

Die ‘niedrig hängenden Früchte’ sind offensichtlich. Bitten Sie Chat-KI um Hilfe bei einer Produktbeschreibung oder einer Pressemitteilung. Bitten Sie sie, einige Schlüsselwörter vorzuschlagen. Das kann sie ohne Weiteres tun. Aber die meisten Verlagsprofis können das Gleiche tun, mit nur ein wenig Feuchtigkeit auf der Stirn.

Die oben verlinkten Anwendungsfälle von Keith Riegert umfassen Vorschläge zur Ideenfindung für Titel, das Entwerfen eines digitalen Marketingberichts und das Erstellen eines digitalen Marketing-Kampagnen-Trackers in Google Sheets.

Die oben beschriebene Shimmr-Software deutet auf die zukünftige Form des automatisierten Marketings hin.

KI und Metadaten

An icon of a key

Was hat KI mit Metadaten zu tun und umgekehrt? Ihre Rolle scheint bisher bescheiden zu sein; erwarten Sie einige große Veränderungen.

Metadaten sind entscheidend für die Auffindbarkeit von Büchern. Das haben Sie schon oft genug gehört, um von der Ermahnung genervt zu sein. Es ist vor allem abschreckend, weil “Metadaten” für die meisten Nicht-Techniker schwer fassbar bleibt. Wenn Sie sagen: “Es sind nur die grundlegenden Informationen über das Buch, der Titel, die Beschreibung, der Preis, die Themenkategorien, solche Dinge,” atmen die Leute aus. Damit sind sie einverstanden. Aber das war’s dann auch schon.

Es tut mir leid, Sie daran erinnern zu müssen, dass Metadaten weit mehr umfassen als nur ein paar Details über das Buch. Es gibt so viel mehr. Viel mehr, als ich in diesem kleinen Buch zusammenfassen kann. Ich habe ein ganzes Buch zu diesem Thema mitverfasst. Ingram veröffentlicht Metadata Essentials, ein ausgezeichnetes kurzes Buch. Ich werde es hier sagen, und nicht zum letzten Mal: Autoren und Verlage vernachlässigen ihre Metadaten auf eigene Gefahr.

KI kann bei der Metadatengenerierung helfen. Zum Beispiel bietet der Selbstverlag-Anbieter PublishDrive, einen “KI-gesteuerten Buch-Metadatengenerator” an, der KI-Empfehlungen für den Buchtitel, die Zusammenfassung, Amazon-Kategorien, BISAC-Kategorien und Schlüsselwörter bietet.

Insight, von Veristage, das oben beschrieben wurde, kann Beschreibungen, Schlüsselwörter, BISAC-Kategorien generieren und Zielgruppen definieren.

KI-Nutzung in Metadaten angeben

An icon of a key

Man könnte denken, dass die angesehene Welt der Metadaten langsam wäre, sich mit KI auseinanderzusetzen. Dem ist nicht so! Letzten November veröffentlichte EDItEUR, der Hüter des ONIX-Standards, eine kurze Anwendungshinweis mit dem Titel “Aspects of AI in ONIX.” (pdf)

Mit seiner typischen tiefen Weisheit merkt Graham Bell, der Direktor der Organisation, an, dass “eine Reaktion auf (die Kontroversen rund um die Technologie) darin bestehen könnte, die Nutzung von KI zu vermeiden oder den Handel mit KI-erzeugten Produkten zu meiden. Eine realistischere Option ist es einfach, gegenüber Handelspartnern und Lesern transparent zu sein, wenn KI verwendet wurde. Und da einige Wiederverkäufer KI-basierte Inhalte auf ihren Plattformen einschränken oder verbieten, ist es wichtig, dass seriöse Verlage die Produkte hervorheben, die generative KI-Techniken zur Inhaltserstellung verwenden.”

Bell beschreibt weiter, wie Verlage in Metadaten angeben können:

  • KI-Mitarbeiter

  • KI-basierte Stimmen in Hörbüchern

… sowie eine Methode, um in den Metadaten für digitale Produkte anzugeben, dass der Verlag explizit die Text- und Datenanalyse (TDM) für andere Zwecke als die Forschung ablehnt. Es gibt auch eine Möglichkeit, eine separate Lizenz für kommerzielle oder nicht-forschungsbezogene TDM anzugeben.

Wie so oft der Fall ist, wird das, was in ONIX festgelegt ist, möglicherweise nicht weiter unten in der Nahrungskette aufgedeckt, aber zumindest wurde eine Bestmöglichkeit unternommen.

Strategien zur Integration von KI in Verlagsvorgänge

An icon of a key

Es gibt wenige Dinge, die Verlagsunternehmen weniger gerne tun, als komplexe digitale Technologien in ihren täglichen Betrieb zu integrieren. Das ist verständlich. KI verursacht insbesondere bei jedem Angst, und nicht nur im Verlagswesen. Sie ist neu, sie ist mysteriös, sie ist personalisiert, sie ist mächtig. Menschen fühlen sich aus verschiedenen Gründen von KI bedroht. Einstellungsänderungen brauchen Zeit.

Aber dies ist keine gute Zeit, um technisch schüchtern zu sein.

Es gibt ruhige und rationale Ansätze, um KI in Ihren Verlagsbetrieb zu integrieren, unabhängig von der Größe Ihrer Organisation.

Der Anstoß muss von ganz oben kommen. Ganz oben. Führungskräfte müssen eine Vision vom potenziell transformativen Einfluss der KI annehmen und ein Programm an das gesamte Personal der Organisation kommunizieren. Das Programm kann kaum mehr sein als “experimentieren, dokumentieren Sie Ihre Experimente und teilen Sie sie.” Das ist ein guter Anfang.

The Economist erwähnte kürzlich eine organisatorische Taktik zur Einführung neuer Technologien, die als “Leuchtturm-Ansatz” bezeichnet wird. Sie schaffen ein Leuchtfeuer, indem Sie ein hochkarätiges Proof-of-Concept-Projekt auswählen, das schnell umgesetzt werden kann und auf das sich jeder beziehen kann.

Verlage sind durch den Trubel um das Urheberrecht gehandicapt: Autoren sind in Aufruhr. Eine Umfrage der Authors Guild vom Mai 2023 ergab, dass “90 Prozent der Autoren glauben, dass sie entschädigt werden sollten, wenn ihre Arbeit zur Schulung generativer KI-Technologien verwendet wird,” und 67 Prozent sagten, sie “seien sich nicht sicher, ob ihre Verlagsverträge oder Plattformnutzungsbedingungen Berechtigungen oder Rechte zur Nutzung ihrer Arbeit für KI-bezogene Zwecke umfassen.” Diese unsicheren Autoren fragen jetzt ihre Verlage, ob KI bei der Bearbeitung oder Produktion ihrer Arbeit verwendet wird, und einige mächtige Autoren bestehen darauf, dass dies nicht der Fall ist. Sie suchen nach dem KI-Äquivalent einer erdnussfreien Bäckerei.

Dies ist ein heikles Problem für Verlage – wenn Sie KI nicht für die Bücher verwenden können, die Sie veröffentlichen möchten, wofür können Sie sie dann verwenden?

Entwicklung und Kommunikation von KI-Richtlinien

Trotz ihrer weit verbreiteten Nutzung haben nur wenige Verlage öffentlich ihre KI-Richtlinien definiert und ihre Ansätze zur KI der Öffentlichkeit kommuniziert. Der Begriff ‘die Öffentlichkeit’ hat hier eine schwer fassbare Bedeutung, wenn man die unterschiedlichen Zielgruppen von Belletristik-, wissenschaftlichen und Bildungs-Verlagen berücksichtigt.

Für Handelsverlage ist die wichtigste Zielgruppe die Autoren und ihre Agenten. Wissenschaftliche Verlage stehen vor anderen Herausforderungen, wenn sie den vielversprechenden Einfluss der KI auf die Forschung und dann den problematischeren Einfluss der KI auf die Umwandlung von Forschung in Erzählungen in Betracht ziehen (Avi Staiman schrieb einen nachdenklichen Beitrag zu diesem Thema). Für Bildungs-Verlage ist die Festlegung von Richtlinien schwierig, da der Einfluss der KI auf die Praxis des Lehrens und der Bildung facettenreich und komplex ist.

Ich denke, dass Verlage zwei große Herausforderungen haben, wenn sie mit KI-Technologien vorankommen. Die erste besteht darin, eine Unternehmensposition zu entwickeln, wie man KI im Allgemeinen angeht und wie man KI in ihre Arbeitsabläufe integriert. Die zweite Herausforderung besteht darin, diese Position klar und unmissverständlich an ihre Beteiligten zu kommunizieren.

Die Verlagspolitiken, die ich gesehen habe, sind größtenteils fehlerhaft. Einige von ihnen sind tatsächlich nach außen gerichtete Richtlinien, an Autoren, mit einer Reihe von Ermahnungen darüber, was akzeptable Praxis ist (nicht viel) und was nicht akzeptabel ist (vieles). O’Reillys “KI-Nutzungsrichtlinie für Talente, die Inhalte für O’Reilly entwickeln” geht seitenweise weiter mit esoterischen Anweisungen wie “VERWENDEN SIE KEINE OSS GenAI-Modelle, die Softwareausgaben produzieren, die den Bedingungen einer Copyleft- oder netzwerkviralen Open-Source-Lizenz unterliegen.”

Auf der anderen Seite enthält der wissenschaftliche Verlag Elsevier im Abschnitt “Elsevier-Richtlinien” seiner Website Aussagen zu “Verantwortungsbewussten KI-Prinzipien”, “Text- und Datenanalyse” und “Die Verwendung von generativer KI und KI-unterstützten Technologien beim Schreiben für Elsevier.”

Die wenigen internen, unveröffentlichten Verlagspolitiken, die ich gesehen habe, sind konservativ, übermäßig so. Diese Verlage reagierten zu schnell auf die Vielzahl wahrgenommener und möglicher Bedrohungen und auf die Ängste ihrer Autoren und haben ihre eigene Fähigkeit behindert, sich robust mit dieser sich schnell entwickelnden, sich schnell verändernden Technologie zu befassen.

Es ist selbstverständlich, dass sie KI ‘verantwortungsbewusst’ einsetzen werden, was auch immer das bedeutet. Es ist selbstverständlich, dass sie das größte Anliegen für das geistige Eigentum der Autoren haben und aggressiv das urheberrechtlich geschützte Werk der Autoren schützen. (Obwohl diese allgemeinen Grundsätze natürlich öffentlich erklärt und oft wiederholt werden müssen.)

Aber was noch?

  • Werden sie KI eine Rolle bei redaktionellen Akquisitionen erlauben? Kann KI einen Blick auf den “Slush Pile” werfen?

  • Werden sie KI eine Rolle bei der Entwicklungsredaktion, der Zeilenredaktion und der Korrekturredaktion erlauben?

  • Werden sie KI eine Rolle bei der Bestimmung von Auflagenhöhen und Zuweisungen erlauben?

  • Bei der Erstellung zugänglicher E-Book-Dateien, einschließlich Alt-Text?

  • Bei der Unterstützung der Hörbucherstellung in Fällen, in denen es wirtschaftlich nicht realistisch ist, talentierte menschliche Erzähler zu engagieren?

  • Bei der Unterstützung der Übersetzung in Fremdsprachen in Märkte, in denen Rechte niemals verkauft würden?

  • Bei der Entwicklung von Marketingmaterial in großem Maßstab?

  • Bei der Kommunikation mit Wiederverkäufern?

Wenn ja, müssen sie dies klar machen und klar erklären, die Überlegungen hinter diesen Richtlinien. Verlage müssen mutig sein, um den vielen Einwänden der meisten Autoren in dieser Zeit der Angst und des Zweifels entgegenzutreten.

Berufliche Überlegungen

An icon of a key

Nur die größten Verlage werden in der Lage sein, dediziertes Personal einzustellen, um mit KI-Software und -Systemen zu arbeiten. Der durchschnittliche Verlag wird wollen, dass alle ihre Mitarbeiter KI-Tools nutzen, in der Erwartung, dass jeder von ihnen die Nutzung von KI erkunden könnte, um Effizienz in ihrer Arbeit zu finden.

Auf der PubWest-Konferenz im Februar 2024 in Arizona schlug ein Redner aus einer anderen Branche vor, dass eine der Anwendungen für KI darin bestehen wird, Praktikanten zu ersetzen. Der Raum explodierte. Sie meinte es gut – tatsächlich beschreibt ein April 10, 2024 Bericht in der New York Times, wie Wall Street Investmentbanken viele ihrer Praktikanten durch KI ersetzen wollen. Ähnlich wie im Verlagswesen besteht eine offensichtliche Sorge: Wie findet man Senioranalysten, wenn sie nicht als Junioranalysten anfangen können?

Die Verlagsbranche hat sich immer auf Praktika verlassen. Eine Studie aus dem Jahr 2019 ergab, dass 80 Prozent der Menschen, die weniger als fünfzehn Jahre im Verlagswesen gearbeitet hatten, zuvor ein Praktikum absolviert hatten.

Zum Teil ist es eine Möglichkeit, die Routinearbeit zu vernünftigen Kosten zu erledigen. Aber das verblasst im Vergleich zur größeren Realität, dass keine Verlagsschule jemanden darauf vorbereiten kann, in ein Verlagshaus auf der Ebene eines mittleren Managers einzusteigen. Der einzige Weg, die qualifizierten Mitarbeiter von morgen zu entwickeln, besteht darin, heute Praktikanten und Auszubildende auszubilden.

Das Ziel hier ist nicht, Praktikanten durch KI zu ersetzen, sondern stattdessen ihre Arbeit mit KI-Tools produktiver und lohnender zu machen, was sowohl dem Praktikanten als auch dem Verlag zugutekommt.

KI für Hörbücher

An icon of a key

KI für Hörbücher funktioniert wirklich gut. Es ist nicht perfekt, aber es funktioniert. Autoren und Verlage nutzen inzwischen routinemäßig KI-Tools bei der Produktion von Hörbüchern, vor allem für Bücher, bei denen eine vollständige produktion mit Erzählern finanziell nicht machbar ist. Und das nicht nur für englischsprachige Hörbücher, sondern auch für Hörbücher in Übersetzung.

Die Verwendung von KI für Hörbücher ist nicht neu; ich habe erstmals in Publishers Weekly im Jahr 2021 über den Trend berichtet. Aber die neueren großen Sprachmodelle haben die Technologie für automatisierte Hörbucherzählung wiederbelebt.

Im Jahr 2021 bemerkte ich: “Ist es perfekt? Sicherlich nicht. Kann es gut genug sein? Wahrscheinlich, wenn ein Verlag bereit ist, die notwendige Zeit in die Sprachbearbeitungsphase des Projekts zu investieren.” Zweieinhalb Jahre später sind KI-Stimmen nach vielen Berichten von menschlichen Stimmen nicht mehr zu unterscheiden, es sei denn, man hört sehr genau hin.

Im letzten November stellte Meta (Facebook) “Seamless” vor, das in der Lage ist, “Töne, emotionale Ausdrucksweisen und stimmliche Stilqualitäten” in die Übersetzung von 200 Sprachen zu übertragen. Ein Hörbuch kann sofort in mehrere Sprachen übersetzt werden, und das mit außergewöhnlicher Qualität.

Ebenfalls im Jahr 2021 berichtete ich, dass “Audibles Sperre für die Verbreitung von Hörbüchern mit nicht-menschlichen Erzählern ein echtes Problem darstellt, dessen Lösung einige Zeit in Anspruch nehmen könnte.” Inzwischen haben sowohl Google als auch Apple Programme angekündigt, die es Autoren ermöglichen, Hörbücher mit KI-generierten Stimmen zu erstellen. Am 5. Dezember begann Findaway Voices von Spotify, “digital voice narrated audiobooks from Google Play Books for distribution to select retail partners” zu akzeptieren.

Anfang November 2023 kündigte Amazon an, dass Autoren von Kindle Direct Publishing (KDP) bald Zugang zu einem Dienst haben würden, der es ihnen ermöglicht, “schnell und einfach eine Hörbuchversion ihres E-Books mit virtueller Spracherzählung, einer synthetischen Sprachtechnologie, zu erstellen.” Im Januar 2024 berichtete Jane Friedman (Paywall), dass “Audible still und leise begonnen hat, KI-erzählte Hörbücher im vergangenen Herbst in sein Schaufenster aufzunehmen, lange nachdem andere Einzelhändler dasselbe getan hatten.”

Und natürlich verwende ich KI für die Hörbuchversionen dieses Buches.

KI für Buchübersetzungen

An icon of a key

KI für Buchübersetzungen funktioniert. Vielleicht nicht so gut wie bei der automatisierten Hörbucherstellung. Aber es kommt sehr schnell sehr nahe. Nicht-literarische Belletristik könnte den Anfang machen. Literarische Belletristik könnte folgen. Sachliteratur stellt eine andere Reihe von Herausforderungen dar.

Im Juni 2024 habe ich ein Webinar über KI für Buchübersetzungen veranstaltet, gesponsert von BISG. Das Video ist online auf YouTube. Jane Friedman hat das Programm ebenfalls in ihrem Hot Sheet Newsletter beschrieben.

Das Thema ist komplex und nuanciert. Eine Sache, die ich faszinierend finde, ist, wie lange Menschen schon versuchen, Übersetzungen zu automatisieren. Es ist eine Erinnerung daran, dass Bücher, die unser Universum füllen, nur einen kleinen Teil der schriftlichen Kommunikation ausmachen, besonders in diesem Online-Zeitalter.

Warren Weaver, der als Vater der Maschinellen Übersetzung (MT) gilt, bemerkte gegenüber einem Kollegen: “Wenn ich einen Artikel auf Russisch sehe, sage ich: ‘Das ist eigentlich auf Englisch geschrieben, aber es wurde in seltsame Symbole verschlüsselt. Ich werde nun mit der Entschlüsselung fortfahren.’” Für eine Maschine ist Sprache nur Code. Es ist keine Kultur und kein Gefühl und keine Pracht der geschriebenen Sprache. Es ist eine Aufgabe mit Zahlen und Code.

Offensichtlich wird der Unterschied zwischen Belletristik und Sachliteratur in der KI-Übersetzung eine große Rolle spielen. Chat-KI ist stark im Stil, aber schwach in den Fakten. Es sind noch sehr frühe Tage, aber ich neige dazu zu glauben, dass Chat-KI bei Belletristik glänzen wird, aber bei Sachliteratur zu kurz kommt. (Nichtsdestotrotz werde ich dieses faktenreiche Buch maschinell übersetzen!)

Literarische Belletristik ist sehr viel der Elefant im Raum. Sie ist kostbar und verehrt, und das zu Recht. Übersetzer können Stunden damit verbringen, über ein einziges Wort oder eine Phrase zu diskutieren. Chat-KI muss in diesen Gewässern vorsichtig vorgehen.

Aber dies ist fruchtbares Terrain. Soweit ich feststellen kann (aus spärlichen Daten), gab es im Jahr 2023 nur 9.500 Übersetzungen von Handelsbüchern. Selbst wenn ich mich um einen großen Faktor irre, ist klar, dass nur wenige Bücher aus Fremdsprachen ins Englische übersetzt werden.

Ähnlich fand ich eine Statistik, die darauf hinweist, dass es im Jahr 2023 nur 7.230 Übersetzungen aus dem Englischen ins Spanische gab (in spanischen Buchmärkten). Das scheint lächerlich klein zu sein.

Es gibt hier eine enorme Chance.

Der größte Teil der Nutzung von KI zur Buchübersetzung wird für Bücher sein, bei denen eine Übersetzung wirtschaftlich nie in Betracht gezogen wurde. Es wird zwangsläufig Auswirkungen auf die Arbeitsplätze von Übersetzern von „Mid-Market“-Büchern geben; das Jobwachstum wird im Projektmanagement und in der Qualitätssicherung liegen. Wird das den Arbeitsplatzverlust ausgleichen? Unwahrscheinlich.

Wie bei den meisten Aspekten der KI gibt es herausfordernde Probleme zu lösen, und es gibt keine einfachen Antworten.

Wie ich im Software-Abschnitt anmerke, sind Leanpub und DeepL die beiden Unternehmen, die Autoren und Verlagen KI-unterstützte Buchübersetzungsdienste anbieten.

KI für wissenschaftliches Publizieren

An icon of a key

Verlage und Autoren aller Art sollten die Entwicklung der KI im wissenschaftlichen Publizieren im Auge behalten. Es schreitet viel schneller voran als im Verbraucherpublizieren.

Ich sehe zwei Gründe für den Fortschritt. Erstens sind die Autoren im wissenschaftlichen Publizieren von Beruf Akademiker, und im STM-Sektor (wissenschaftlich, technisch und medizinisch) sind sie oft Wissenschaftler mit fortgeschrittenen Abschlüssen. Abgesehen vom Publizieren untersuchen und übernehmen sie KI häufig in ihrer Arbeit. Sie wären mehr überrascht, wenn ihr Verlag nicht die Nutzung von KI bei der Bearbeitung und Veröffentlichung ihrer Arbeit erkunden würde.

Dies fließt in das wissenschaftliche Publikationsökosystem ein, wo die Redakteure oft selbst Wissenschaftler sind. Für sie ist Technologie nicht einschüchternd.

Ich werde in diesem Buch nicht weiter auf die Einzelheiten eingehen; ich werde darüber ausführlicher in meinem Blog berichten.

KI für Autoren

Autoren und Verlage sehen sich oft als zwei getrennte Welten, verbunden, aber im Wesentlichen getrennt. Das war in der modernen Verlagswelt weitgehend zutreffend.

Die Zeiten ändern sich. Wo Verlage einst unantastbar waren, geben die Top-Autoren jetzt den Ton an. Wie ich an anderer Stelle diskutiere, sind selbstveröffentlichte Autoren die Wegbereiter. Sie tragen wenig von dem Ballast, der das traditionelle Verlagswesen belastet.

Wenn Verlage KI betrachten, sehen sie wenige Möglichkeiten. Wenn ich mit Autoren über KI spreche, ist die Welt ihre Auster. Die Möglichkeiten sind nahezu endlos:

Autorenschaft und Bearbeitung

  • Versuchen, ganze Bücher zu schreiben & zu veröffentlichen

  • Versuchen, Ideen für ein neues Projekt zu finden

  • Versuchen, innerhalb eines neuen Buches Ideen zu entwickeln

  • Feintuning der Geschichte

  • Recherche

  • Faktenprüfung

  • Schreibbegleitung

  • Entwicklungsllektorat

  • Korrektorat

  • Rechtschreib- und Grammatikprüfung

  • Lektorat

Illustration/Bildgebung

  • Illustrationen und Diagramme erstellen

  • Grobentwürfe für Cover-Designs

  • Videopromotion

Marketing

  • Automatisieren von Einreichungen bei Agenten, Verlagen, Wettbewerben, Freunden, Blurb-Anfragen

  • Marketingmaterial generieren: Pressemitteilungen, Blogposts, Social Media etc.

  • Website-Generierung

Autoren werden einen Großteil der Veränderungen bei der Einführung von KI in der Branche vorantreiben, sei es dafür oder dagegen.

Sie sind die Nutznießer vieler der Startup-Innovationen rund um KI im Bereich Autorenschaft und Publizieren — etwa 70% der Startups suchen die Zusammenarbeit mit Autoren auf ihren Reisen.

Bedenken und Risiken im Zusammenhang mit KI

An icon of a key

Die Bedenken rund um KI sind ernst. Die Risiken sind real. Manchmal werden sie auf hysterische Weise ausgedrückt, aber wenn man genauer hinsieht, hat der Einfluss von KI das Potenzial, enorm destruktiv zu sein.

Es gibt so viele Probleme und Bedenken rund um KI, dass sie Bände füllen könnten. Hier ist eine Wortwolke der Themen, die ich verfolge. Ich bin sicher, dass ich ein paar übersehe.

Eine Wortwolke, die um den Begriff 'KI' zentriert ist, mit verwandten Begriffen wie 'Bedenken', 'Ethik' und 'Menschlichkeit', die sie umgeben.

Es gibt viele Informationen zu jedem dieser Themen, und ich ermutige Sie, so tief wie möglich zu lesen. Es ist möglich, dass Sie zu dem Schluss kommen, dass die Risiken die Vorteile überwiegen und dass Sie die Nutzung von KI, sei es persönlich oder innerhalb Ihrer Organisation, nicht verfolgen möchten. Diese Entscheidung bringt eigene Risiken mit sich; das übliche, zurückgelassen zu werden. Aber es ist eine persönliche Entscheidung.

Wenn Sie “Bücher über die Risiken von KI” googeln, finden Sie eine Auswahl an lohnenswerten Bänden. Ein kürzlich erschienener Podcast, den ich besonders erschreckend fand, war Ezra Kleins Gespräch mit Dario Amodei, Mitbegründer und CEO von Anthropic (das Unternehmen, das Claude.ai entwickelt). Sie erfahren, dass sich diese Unternehmen der Risiken bewusst sind. Amodei verweist auf ein internes Risikoklassifizierungssystem namens A.S.L., für “AI Safety Levels” (nicht American Sign Language). Derzeit sind wir bei ASL 2, “Systeme, die frühe Anzeichen gefährlicher Fähigkeiten zeigen – zum Beispiel die Fähigkeit, Anweisungen zum Bau von Biowaffen zu geben.” Er beschreibt ASL 4 als “die Fähigkeit, staatlichen Akteuren erheblich zu steigern … wo wir uns Sorgen machen würden, dass Nordkorea, China oder Russland ihre Offensivfähigkeiten in verschiedenen militärischen Bereichen mit KI erheblich verbessern könnten, um ihnen einen erheblichen Vorteil auf geopolitischer Ebene zu verschaffen.” Erschreckende Sachen.

Innerhalb dieses düsteren Kontexts werde ich die wichtigsten Themen für Autoren und Verlage hervorheben.

Urheberrecht verletzt?

An icon of a key

Die Urheberrechtsfragen sind ein Miasma aus Komplexität und Mehrdeutigkeit. Es scheint sicher, dass einige noch urheberrechtlich geschützte Bücher in das Training einiger LLMs einbezogen wurden. Aber es ist sicherlich nicht so, wie einige Autoren befürchten, dass all ihre Werke in jedes einzelne der großen Sprachmodelle aufgenommen wurden.

Die Urheberrechtsfragen sind sowohl spezifisch als auch breit gefächert. Es ist allgemein bekannt, dass alle LLMs auf dem offenen Web trainiert werden – alles, was von den 1,5 Milliarden Websites im heutigen Web abgekratzt werden kann, seien es Zeitungsartikel, Social-Media-Posts, Webblogs und anscheinend auch Transkripte von YouTube-Videos.

Es ist nachweisbar, dass mindestens eines der LLMs den tatsächlichen Text von Tausenden von nicht gemeinfreien Büchern aufgenommen hat.

War es legal, all diesen Text zu verwenden, um milliardenschwere KI-Unternehmen aufzubauen, ohne den Autoren eine Entschädigung zu zahlen? Die KI-Unternehmen argumentieren mit Fair Use; die Gerichte werden letztendlich entscheiden. Selbst wenn es legal war, war es ethisch oder moralisch? Die Ethik erscheint weniger komplex als die rechtlichen Überlegungen. Sie entscheiden.

Die Gesetze zum Urheberrecht haben offensichtlich die einzigartigen Herausforderungen, die KI mit sich bringt, nicht vorausgesehen, und die Suche nach rechtlichen Lösungen wird Zeit in Anspruch nehmen, vielleicht Jahre. (Wenn Sie tiefer in die Frage eintauchen möchten, warum die Gesetze für das spezielle Problem ungeeignet sind, lesen Sie das ausgezeichnete Papier von A. Feder Cooper und James Grimmelmann mit dem Titel “The Files are in the Computer: Copyright, Memorization, and Generative AI.”)

Hier ist eine Liste von dreizehn der prominentesten Klagen, von denen nicht alle mit Büchern zu tun haben; auch Bilder und Musik. Und hier ist eine andere Liste, die den Status aller Klagen aktualisiert.

Urheberrecht und KI für Autoren

An icon of a key

Autoren stehen vor zusätzlichen Fragen zur Urheberrechtsfähigkeit von KI-generierten Inhalten.

Die Position des US-Copyright Office zur Urheberrechtsfähigkeit von KI-generierten Inhalten besagt, dass KI allein kein Urheberrecht halten kann, da es den rechtlichen Status eines Autors nicht hat. Das macht Sinn. Aber das setzt voraus, dass 100% der Arbeit von der KI generiert wird. Wie an anderer Stelle diskutiert, werden nur wenige Autoren KI ein ganzes Buch generieren lassen. Wahrscheinlicher sind es 5%, oder 10% oder… Und hier stolpert das Copyright Office (wie ich auch).

In einer neueren Entscheidung kam das Office zu dem Schluss, dass ein Graphic Novel, das von Menschen verfassten Text und von der KI-Dienstleistung Midjourney generierte Bilder kombiniert, ein urheberrechtlich geschütztes Werk darstellt, die einzelnen Bilder selbst jedoch nicht urheberrechtlich geschützt werden können. Jeez!

An icon of a key

Es genügt zu sagen, dass Autoren und Verlage auf mehreren Ebenen wachsam gegenüber sich entwickelnden Urheberrechtsfragen sein müssen.

Was sind die langfristigen Implikationen?

Einige vergleichen die aktuelle Rechtsstreitigkeit mit der Google-Bücher-Klage, die 10 Jahre dauerte, um rechtlich beigelegt zu werden. Wer weiß, wie lange sich das Berufungsverfahren für diese Klagen hinziehen wird. In der Zwischenzeit ist es für Verlage klug, so zu handeln, als ob die KI-Unternehmen verlieren werden, was zumindest theoretisch jeden, der Lizenzen erteilt oder vielleicht sogar Chat-KI nutzt, einer Art von Eventualverbindlichkeit aussetzt.

Aber das ist nicht das ernsthafteste Problem eines Verlages. Es ist die Wahrnehmung. Für viele Autoren, einige prominent, einige obskur, ist der Brunnen vergiftet. KI ist radioaktiv in der Schreib- und Verlagsgemeinschaft. Alles, was auch nur den Anschein von KI hat, zieht intensive Kritik auf sich.

Es gibt zahlreiche Beispiele. In einem kürzlichen Vorfall kündigte Angry Robot, ein britischer Verlag, der sich der besten modernen Erwachsenen-Science-Fiction, Fantasy und WTF widmet, an, dass er eine KI-Software namens Storywise verwenden würde, um eine erwartete große Menge von Manuskripten zu sortieren. Es dauerte nur fünf Stunden, bis das Unternehmen den Plan fallen ließ und zurück zum “alten Posteingang” kehrte.

Das unerträgliche Dilemma für Fachverlage bei der internen Nutzung von KI-Tools: Wenn Ihre Autoren es herausfinden, werden Sie es schwer haben, den daraus resultierenden Sturm zu überstehen. Ich glaube, dass Verlage keine andere Wahl haben, als mutig zu sein, (zumindest einige) der Tools zu übernehmen, klar zu erklären, wie diese Tools trainiert werden und wie sie genutzt werden, und voranzuschreiten.

Im Vereinigten Königreich verfolgt die Society of Authors einen harten Kurs: “Bitten Sie Ihren Verlag zu bestätigen, dass er keine wesentliche Nutzung von KI für irgendeinen Zweck im Zusammenhang mit Ihrem Werk vornimmt - wie z.B. Korrekturlesen, Bearbeiten (einschließlich Authentizitätsprüfungen und Faktenchecks), Indexierung, rechtliche Prüfung, Design und Layout oder irgendetwas anderes ohne Ihre Zustimmung. Sie möchten vielleicht die KI-gestützte Hörbucherzählung, Übersetzung und Covergestaltung verbieten.”

Die Authors Guild scheint zu akzeptieren, dass “Verlage beginnen, KI als Werkzeug im normalen Betriebsablauf zu erkunden, einschließlich redaktioneller und Marketingzwecke.” Ich glaube nicht, dass viele Mitglieder der Guild so verständnisvoll sind.

Inhalte an KI-Unternehmen lizenzieren

Die meisten Verlage und viele Autoren suchen nach Wegen, Inhalte an KI-Unternehmen zu lizenzieren. Jeder hat eine andere Vorstellung davon, wie die Lizenzbedingungen aussehen sollten und wie viel ihre Inhalte wert sind, aber zumindest sind die Diskussionen im Gange.

Es gibt mehrere Startups, die mit Verlagen (und in einigen Fällen auch mit einzelnen Autoren) zusammenarbeiten möchten. Calliope Networks und Created by Humans sind in dieser Hinsicht beide interessant.

Mitte Juli gab das Copyright Clearance Center, seit langem der Hauptakteur in der kollektiven Urheberrechtslizenzierung der Branche, bekannt, dass „Wiederverwendungsrechte für künstliche Intelligenz (KI) innerhalb seiner jährlichen Urheberrechtslizenzen (ACL) verfügbar sind, eine unternehmensweite Lizenzierungslösung, die Rechte an Millionen von Werken für abonnierende Unternehmen bietet.“

Publishers Weekly berichtete über die Ankündigung und zitierte Tracey Armstrong, Präsidentin und CEO von CCC, die sagte: „Es ist möglich, pro-KI und pro-Urheberrecht zu sein und KI mit Respekt für die Schöpfer zu koppeln.“

Auch wenn dies nicht alles umfassend ist, ist es wahrscheinlich ein Durchbruch, um das Verlagswesen näher an eine Zusammenarbeit mit den Entwicklern großer Sprachmodelle zu bringen.

Es ist zu spät, um KI zu vermeiden

An icon of a key

Für Autoren und Verlage, die es vorziehen, sich nicht mit KI zu befassen, sind die Nachrichten schlecht: Sie nutzen heute KI und tun dies schon seit Jahren.

Künstliche Intelligenz in verschiedenen Formen ist bereits in die meisten Software-Tools und Dienste integriert, die wir täglich verwenden. Menschen verlassen sich auf KI-gestützte Rechtschreib- und Grammatikprüfung in Programmen wie Microsoft Word oder Gmail. Microsoft Word und PowerPoint verwenden KI, um Schreibvorschläge zu machen, Design- und Layout-Empfehlungen zu geben und mehr. Virtuelle Assistenten wie Siri und Alexa verwenden natürliche Sprachverarbeitung, um Sprachbefehle zu verstehen und auf Fragen zu antworten. E-Mail-Dienste nutzen KI, um Nachrichten zu filtern, Spam zu erkennen und Alarme zu senden. KI treibt Kundenservice-Chatbots an und generiert Produktempfehlungen basierend auf Ihrem Kaufverlauf.

Und vieles davon basiert auf großen Sprachmodellen, wie es bei ChatGPT der Fall ist.

Für einen Autor oder Redakteur zu sagen: “Ich möchte nicht, dass KI auf mein Manuskript angewendet wird,” ist im Großen und Ganzen fast unmöglich, es sei denn, sie und ihre Redakteure arbeiten mit Schreibmaschinen und Bleistiften.

Sie könnten versuchen zu sagen: “Ich möchte keine generative KI” auf ihrem Buch verwendet haben. Aber das ist schwer zu trennen. Rechtschreibprüfungssoftware wurde ursprünglich nicht auf generativer KI aufgebaut. Grammarly hat es als Zutat zu seinem Produkt hinzugefügt, ebenso wie alle anderen Rechtschreib- und Grammatikprüfer. Generative KI ist auch ein Kernbestandteil der angebotenen Marketingsoftware.

Wenn Autoren KI verwenden

Ein weiterer Aspekt der Autoren und der Nutzung von KI hat Ähnlichkeiten mit der oben diskutierten Urheberrechtsfrage. Im Extremfall sehen wir 100 % KI-generierte Inhalte, die bei Amazon veröffentlicht werden. Die meisten davon (alle?) sind von schrecklicher Qualität, aber das hindert sie nicht daran, veröffentlicht zu werden. (Siehe auch den Abschnitt über Amazon.) Besorgniserregender für Verlage sind KI-generierte Einreichungen. Ja, KI erhöht die Menge, aber große Verlage haben bereits ein Filter für die Menge. Die Filter werden Agenten genannt. Sie sind diejenigen, die herausfinden müssen, wie sie das Mengenproblem bewältigen, und anscheinend müssen sie eine Lösung finden, die keine KI einsetzt.

Es ist ein existenzielles Problem – möchte ich ein Buch veröffentlichen, das von „einer Maschine“ geschrieben wurde? Für die meisten Verlage ist das ein eindeutiges „Nein.“ Ganz einfach. Nun, was ist mit einem Buch, bei dem 50% des Inhalts von einem LLM unter der Aufsicht eines fähigen Autors generiert wurden? Hm, versuchen wir es auch hier mit einem „Nein.“ Ok: Was ist dann mit 25%, oder 10%, oder 5%? Wo zieht man die Grenze?

Und, jetzt, da Sie sich im Grenzziehgeschäft befinden, wie lösen Sie das Dilemma, dass Rechtschreib- und Grammatiktools jetzt zumindest teilweise auf generative KI angewiesen sind? Was ist mit KI-gesteuerten Transkriptionstools, wie Otter.ai, oder der Transkriptionsfunktion, die in Microsoft Word integriert ist?

Ich kann keinen Verlag finden, der erklärt hat, dass er keine Werke mit einer vorab festgelegten Menge an KI-generiertem Text veröffentlichen wird. Hier ist die Authors Guild zu diesem Thema:

„Wenn ein erheblicher Anteil an KI-generiertem Text, Charakteren oder Handlung in Ihr Manuskript aufgenommen wird, müssen Sie dies Ihrem Verlag offenlegen und sollten es auch dem Leser mitteilen. Wir halten es nicht für notwendig, dass Autoren die Verwendung generativer KI offenlegen, wenn sie lediglich als Werkzeug für Brainstorming, Ideenfindung oder Korrekturlesen eingesetzt wird.“

Es versteht sich von selbst, dass „erheblich“ nicht definiert ist (Oxford definiert es als „groß genug, um bemerkt oder für wichtig gehalten zu werden“), aber der Beitrag erklärt weiter, dass die Einbeziehung von mehr als „de minimis KI-generiertem Text“ die meisten Verlagsverträge verletzen würde. De minimis, in rechtlichen Begriffen, ist nicht genau spezifiziert, bedeutet aber im Allgemeinen mehr oder weniger dasselbe wie erheblich.

Kann KI im Schreiben erkannt werden?

Ich habe im Mai 2024 ein von BISG gesponsertes Webinar zur KI-Erkennung moderiert. Die Wiederholung ist online auf YouTube verfügbar. Jane Friedman hat in ihrem Hot Sheet Newsletter eine umfassende Zusammenfassung des Webinars angeboten.

Für viele Autoren bedeutet die Toxizität von KI, sie von ihren Worten fernzuhalten. Verlage tragen eine besondere Bürde – sie erstellen den Text nicht, aber sobald er veröffentlicht ist, tragen sie eine erhebliche Verpflichtung gegenüber dem Text. Wir haben gesehen, wie viel Dynamit in der Nähe von aufrührerischen Büchern explodiert ist, sei es wegen der sozialen Implikationen des Inhalts oder wegen des plagiaristischen Diebstahls von Worten und Ideen anderer Autoren. Jetzt stehen wir mit KI vor einem völlig neuen Satz ethischer und rechtlicher Fragen, von denen keine in der Verlagschule umrissen wurden.

Ein Teil davon scheint ähnlich wie das, worüber sich die Leute bei Schülern Sorgen machen, dass die Verwendung von KI irgendwie Betrug ist, ähnlich wie das Abschreiben von einem Wikipedia-Artikel oder vielleicht einfach einen Freund zu bitten, Ihren Aufsatz zu schreiben.

Einer unserer Webinar-Referenten, ein Pädagoge namens José Bowen, hat seine Offenlegung für Studenten geteilt. Es ist nicht genau das, was man für einen Autor verwendet, aber es demonstriert eine Art „Risikostufen“ der KI-Nutzung.

Vorlage für eine Offenlegungsvereinbarung für Studenten

  • Ich habe diese Arbeit vollständig selbstständig ohne Hilfe von Freunden, Werkzeugen, Technologie oder KI erstellt.

  • Ich habe den ersten Entwurf gemacht, aber dann Freunde/Familie, KI-Paraphrasierungs-/Grammatik-/Plagiatssoftware gebeten, ihn zu lesen und Vorschläge zu machen. Nach dieser Hilfe habe ich folgende Änderungen vorgenommen:

    • Rechtschreibung und Grammatik korrigiert

    • Struktur oder Reihenfolge geändert

    • Ganze Sätze/Absätze umgeschrieben

  • Ich hatte Probleme und habe ein Thesaurus, Wörterbuch verwendet, einen Freund angerufen, das Hilfezentrum aufgesucht, Chegg oder einen anderen Lösungsanbieter genutzt.

  • Ich habe KI/Freunde/Nachhilfelehrer genutzt, um mir bei der Ideenfindung zu helfen.

  • Ich habe Hilfe/Werkzeuge/KI genutzt, um eine Gliederung/einen ersten Entwurf zu erstellen, den ich dann bearbeitet habe. (Beschreiben Sie die Art Ihres Beitrags.)

Und so könnte ein Verlag etwas Ähnliches für seine Autoren entwerfen. Angenommen, der Autor gibt die oberste Stufe offen: Ich habe KI umfangreich genutzt und dann die Ergebnisse bearbeitet. Was dann? Lehnen Sie das Manuskript automatisch ab? Wenn ja, warum?

Und unterdessen, wenn Sie aufmerksam sind, erfahren Sie, dass das Manuskript, das Sie gerade gelesen und geliebt haben, bei dem der Autor geschworen hat, dass es nicht einmal von Grammarly auf Rechtschreibung überprüft wurde, tatsächlich zu 90% von KI generiert worden sein könnte, von einem Autor, der Experte darin ist, ihre Nutzung zu verbergen.

Sie sind dann gezwungen, die Frage neu zu überdenken. Es wird zu: „Warum bin ich so verdammt entschlossen, dieses Ding zu erkennen, das nicht zu erkennen ist?“

Zum Teil ist es die alarmistische Sorge um die Urheberrechtsschutzfähigkeit von KI-generiertem Text. Das Urheberrechtsamt wird keinen Urheberrechtsschutz für 100 % KI-generierten Text (oder Musik, oder Bilder usw.) gewähren. Aber was ist mit 50 % KI-generiertem Text? Nun, wir würden nur die 50 % abdecken, die vom Autor erstellt wurden. Und wie würden Sie wissen, welche Hälfte? Wir melden uns diesbezüglich bei Ihnen.

Wäre es nicht großartig, wenn Sie jedes Manuskript einfach in eine Software eingeben könnten, die Ihnen sagt, ob KI bei der Erstellung des Textes verwendet wurde?

Abgesehen davon, dass dies nur durch den Einsatz von KI-Tools möglich wäre, ist die wichtigere Frage, ob die Software (ausreichend) genau wäre. Könnte ich mich darauf verlassen, dass sie mir sagt, ob KI bei der Erstellung eines Manuskripts verwendet wurde? Und könnte ich darauf vertrauen, dass sie keine “falschen Positiven” produziert – also anzeigt, dass KI verwendet wurde, wenn dies in Wirklichkeit nicht der Fall war?

Es gibt jetzt viele Software auf dem Markt, die diese Herausforderungen angeht. Viele der akademischen Studien, die diese Software bewerten, weisen auf ihre Unzuverlässigkeit hin. KI-generierter Text schlüpft durch. Schlimmer noch, Text, der nicht von einer KI generiert wurde, wird fälschlicherweise als kontaminiert gekennzeichnet.

Aber Buchverlage werden irgendeine Art von Sicherheitsvorkehrungen wünschen. Es scheint, dass diese Tools im besten Fall auf mögliche Bedenken hinweisen könnten, aber man müsste immer noch doppelt prüfen. Vielleicht könnte es also auf Texte aufmerksam machen, die sorgfältiger geprüft werden müssen als andere? Ist das eine Effizienz?

Wahre Effizienz wird darin bestehen, über Bedenken hinsichtlich der Entstehung eines Textes hinauszugehen und stattdessen unsere bestehenden Kriterien hinsichtlich seiner Qualität beizubehalten.

Arbeitsplatzverlust

“Sie werden nicht durch KI ersetzt werden. Sie werden durch jemanden ersetzt, der weiß, wie man KI nutzt.” —Anonym

Der Arbeitsplatzverlust durch die Einführung von KI könnte schwerwiegend sein. Die Schätzungen variieren, aber die Zahlen sind düster. Es gibt offensichtliche Beispiele: Die fahrerlosen Taxis in San Francisco eliminieren… Taxi- und Fahrdienstfahrer. KI-unterstützte Diagnosen könnten den Bedarf an medizinischen Technikern verringern.

Der Optimist in mir verweist als Beispiel auf die Einführung der Tabellenkalkulation und ihre Auswirkungen auf die Beschäftigung. Wie Sie in der unten stehenden Grafik sehen, hat sich die Beschäftigung im Bereich “Buchhaltung, Steuerberatung, Buchführung und Lohnabrechnungsdienste” seit 1990 fast verdoppelt – kaum ein Vorwurf gegen Tabellenkalkulationen und andere Technologien, die diese Aufgaben weitgehend automatisiert haben.

Ein Liniendiagramm zeigt die Anzahl der Beschäftigten in der Buchhaltung, Steuerberatung, Buchführung und Lohnabrechnungsdienste von 1990 bis 2020.

Ethan Mollicks Studie mit der Boston Consulting Group (BCG) war ein Experiment, das darauf abzielte, die Auswirkungen von KI auf die Arbeit, insbesondere bei komplexen und wissensintensiven Aufgaben, besser zu verstehen. Die Studie umfasste 758 Berater der BCG, die zufällig zugewiesen wurden, OpenAI’s GPT-4 für zwei Aufgaben zu verwenden oder nicht zu verwenden: kreative Produktinnovation und Problemlösung im Geschäft. Die Studie maß die Leistung, das Verhalten und die Einstellungen der Teilnehmer sowie die Qualität und die Eigenschaften der KI-Ausgabe.

Zu den Erkenntnissen gehörte, dass “KI als Fähigkeitsnivellierer wirkt. Die Berater, die bei der Bewertung zu Beginn des Experiments am schlechtesten abschnitten, verzeichneten den größten Leistungssprung, 43 %, als sie KI nutzen durften. Die Top-Berater erhielten ebenfalls einen Schub, jedoch einen geringeren.” Der vollständige Artikel ist aufschlussreich und wie bei all seinen Arbeiten provokativ, aber zugänglich.

Bildung

Bildung stand im Mittelpunkt der Pro- und Kontra-Debatten über KI. Die Einführung von KI in Klassenzimmer wird weitgehend als Fluch oder zumindest als Herausforderung angesehen. Andere Pädagogen, wie PW’s Hauptredner Ethan Mollick, sehen KI als bemerkenswertes neues Werkzeug für Lehrer; Mollick besteht darauf, dass seine Studenten mit ChatGPT arbeiten.

Das beste Buch zu diesem Thema ist Teaching with AI: A Practical Guide to a New Era of Human Learning von José Antonio Bowen und C. Edward Watson.

Ich werde in diesem Buch nicht auf das Thema Bildungswesen im Verlagswesen eingehen – es ist ein weites Feld, das einen separaten Bericht erfordert. Man könnte argumentieren, dass das Verlagswesen im Bildungsbereich an Bedeutung verliert: KI-Tools sind Software, nicht Inhalte per se.

Die Zukunft der Suche

An icon of a key

Suche ist ein heikles Thema in der KI. Ich ermutige Sie, perplexity.ai und You.com zu besuchen, um einen Einblick zu bekommen, wohin die Reise geht. Die nächsten Male, wenn Sie daran denken, eine Google-Suche zu starten, gehen Sie stattdessen zu Perplexity. Es wird nicht dramatisch anders erscheinen – es ähnelt den Wissensgraphen, die Google oft auf der rechten Seite eines Suchbildschirms oder manchmal oben in den Suchergebnislisten einblendet. Anstatt auf einen Link klicken zu müssen, sind die Informationen direkt dort für Sie verfügbar.

Perplexity geht einen Schritt weiter und formuliert die Informationen, die es aus verschiedenen Quellen sammelt, so um, dass du wirklich keinen Link anklicken musst. Es stellt Links zu seinen Quellen bereit, aber das Anklicken ist normalerweise unnötig – du hast bereits die Antwort auf deine Frage.

Diese scheinbar bescheidene Veränderung hat enorme Auswirkungen auf jedes Unternehmen und jedes Produkt, das zumindest teilweise darauf angewiesen ist, über Suchmaschinen entdeckt zu werden. Wenn Suchende nicht mehr auf deine Seite weitergeleitet werden, wie kannst du sie ansprechen und in Kunden umwandeln? Die einfache Antwort: Du kannst es nicht.

Joanna Penn steht an der Spitze der Überlegungen zu den Auswirkungen neuer Technologien auf das Schreiben und Veröffentlichen. Sie hat dieses komplexe Thema in ihrem Podcast und Blog im letzten Dezember behandelt.

Es sind noch frühe Tage für KI und die Transformation der Suche.

Schrottbücher auf Amazon

An icon of a key

KI-generierte Schrottbücher auf Amazon sind ein Problem, obwohl ihre Schwere möglicherweise mehr viszeral als buchstäblich ist. Einerseits überschwemmen diese Bücher den Online-Buchladen mit minderwertigem und plagiiertem Inhalt, manchmal unter Verwendung der Namen echter Autoren, um Kunden zu täuschen und von deren Ruf zu profitieren. Die Bücher sind nicht nur ein Ärgernis für Leser, sondern auch eine Bedrohung für Autoren, die möglicherweise um hart verdiente Tantiemen gebracht werden. KI-generierte Bücher beeinflussen auch das Ranking und die Sichtbarkeit echter Bücher und Autoren auf der Amazon-Website, da sie um dieselben Schlüsselwörter, Kategorien und Bewertungen konkurrieren.

Ein niedliches Kätzchen sitzt am Strand, umgeben von Blumen, mit einer Bildunterschrift, die sagt: 'Lustige und niedliche Katzenfotos, die man in der Welt nicht sehen kann'.

Amazon verlangt jetzt von Autoren Details über die Verwendung von KI bei der Erstellung ihrer Bücher offenzulegen. Kein Zweifel, dass dies missbraucht werden kann.

Versuche, auf Amazon nach “KI-generierte Bücher” zu suchen. Es gibt viele. Einige der Ergebnisse sind Anleitungsbücher über die Verwendung von KI zur Erstellung von Büchern. Aber andere sind unverhohlen KI-generiert. “Funny and Cute cat images-You are can’t see this types of photos in the world-PART-1” (stet) wird Rajasekar Kasi zugeschrieben. Es gibt keine Details zu seiner (?) Biografie auf einer Autorenseite, aber sechs weitere Titel sind auf den Namen zugeschrieben. Das Buch, veröffentlicht am 26. August 2023, hat keine Bewertungen und keinen Verkaufsrang. Der ungrammatikalische Titel des E-Books passt nicht zum ungrammatikalischen Titel auf dem Cover des gedruckten Buches.

Aber andere Autoren nutzen KI offensichtlich intensiv bei der Erstellung ihrer Bücher und geben dies nicht an. Wie ich oben erwähnt habe, ist das Erkennen der Nutzung von KI bei geschickten ‘Fälschern’ nahezu unmöglich. Malbücher, Tagebücher, Reiseführer und Kochbücher werden mit KI-Tools in einem Bruchteil der Zeit und des Aufwands traditioneller Veröffentlichungen erstellt.

Sucht man nach “korean vegan cookbook”, findet man den Titel Nummer eins, von Joanne Lee Molinaro, an erster Stelle. Aber direkt dahinter folgen andere Titel, die offensichtliche Nachahmungen sind. “The Korean Vegan Cookbook: Simple and Delicious Traditional and Modern Recipes for Korean Cuisine Lovers” hat zwei Bewertungen, darunter eine, die feststellt: “Dies ist kein veganes Kochbuch. Alle Rezepte enthalten Fleisch- und Eierzutaten.” Aber das Buch steht auf Platz #5,869,771 im Verkaufsrang, während das Original auf Platz #2,852 der Liste steht.

Es ist schwierig, das Ausmaß des verursachten Schadens zu bestimmen. Nichts Gutes kann daraus entstehen, aber wie schlimm ist es?

Amazon hat Richtlinien, die es ermöglichen, jedes Buch zu entfernen, das “keine positive Kundenerfahrung bietet.” Die Kindle-Inhaltsrichtlinien verbieten “beschreibende Inhalte, die darauf abzielen, Kunden in die Irre zu führen oder die den Inhalt des Buches nicht genau wiedergeben.” Sie können auch “Inhalte blockieren, die für Kunden typischerweise enttäuschend sind.” Ist es das schiere Volumen, das Amazons Wächter überfordert? Oder gibt es einen anderen Grund?

Voreingenommenheit

LLMs werden anhand dessen trainiert, was bereits online veröffentlicht wurde. Das, was online veröffentlicht wurde, ist voller Voreingenommenheit, und so spiegeln LLMs diese Voreingenommenheit wider. Und natürlich nicht nur Voreingenommenheit, sondern auch Hass, der sich in ihren Lernprozessen widerspiegelt und nun ein potenzieller Output in KI-generierten Worten und Bildern ist. Pornografie ist ein weiterer natürlicher Nutznießer der bemerkenswerten Fähigkeit der KI mit Bildern, und es gibt kürzlich beunruhigende Geschichten von jungen Frauen, die gefälschte Nacktbilder finden, wobei ihre männlichen Klassenkameraden als wahrscheinliche Verdächtige gelten. The New York Times berichtete separat über eine Zunahme von Online-Bildern mit sexuellem Missbrauch von Kindern.

Autoren und Verleger müssen sich dieser eingebauten Einschränkungen bewusst sein, wenn sie KI-Tools verwenden.

Kreativität kann ein Klischee sein

An icon of a key

Die Frage, ob Maschinen wirklich kreativ sein können, bleibt ein heiß diskutiertes Thema. Es hängt teilweise davon ab, wie wir Kreativität definieren.

“KI wird niemals kreativ sein.” Das ist ein bekanntes Mantra.

Wir alle wissen, was Kreativität ist, oder?

Cambridge: “die Fähigkeit, originelle und ungewöhnliche Ideen zu produzieren oder zu nutzen.”

Britannica: “die Fähigkeit, etwas Neues zu schaffen oder anderweitig ins Dasein zu bringen, sei es eine neue Lösung für ein Problem, eine neue Methode oder ein Gerät, oder ein neues künstlerisches Objekt oder eine Form.”

Ich bestreite nicht, dass Kreativität in diesem Sinne weit jenseits der Reichweite von LLMs liegt.

Mein Argument ist, dass das meiste, was als kreativ ausgegeben wird und oft sehr kreativ erscheint, in Wirklichkeit iterativ ist. Und das funktioniert für viele Dinge perfekt, einschließlich der meisten Werbung.

Aber das “Kreativitäts”-Banner zu heben und dann LLMs zu verringern, bedeutet, eine unüberwindbare Hürde zu setzen, an der KI zwangsläufig scheitern muss. Dann sagen die Leute: “Nun, ich habe euch gesagt, dass es nicht kreativ ist.”

Und übersehen dabei die iterativen Dinge, in denen es sehr gut ist.

Ich werde in naher Zukunft einen langen Essay zu diesem Thema posten, nachdem ich folgende Bücher gelesen habe:

The Creativity Code, von Marcus du Sautoy, und

The Artist in the Machine, von Athur I. Miller

Literary Theory for Robots, von Dennis Yi Tenen

Ein weiterer Gedanke

Jeremiah Owyang ist ein Branchenanalyst aus dem Silicon Valley. Er ist ein KI-Unterstützer, aber er hat schon vorher Hype erlebt. Er stellt fest, dass er “noch nie eine so schnelle Entwicklung in so kurzer Zeit gesehen” hat.

Wie Owyang formuliert, können kleine Teams von Programmierern jetzt LLMs verwenden, um “fühlende Kreaturen” wie ein vierjähriges Kind in zwei Tagen zusammenzustellen. Sie sind in der Lage:

  • Mit Computersicht zu ‘sehen’, was in der realen Welt passiert,

  • Durch Sprachbefehle und Umgebungsgeräusche in der realen Welt zu ‘hören’,

  • Durch Verarbeitung der oben genannten Eingaben aus der realen Welt zu ‘denken’,

  • Durch Zugriff auf vortrainierte Daten zu ‘lernen’,

  • Exklusive Datensätze zu ‘referenzieren’,

  • Mit lebensechten Audio-Stimmen, die Betonung und Ton in jeder Sprache haben, zu ‘sprechen’,

  • Durch Textkommunikation in jedem erforderlichen Format oder Stil zu ‘schreiben’,

  • Spontan Bilder zu ‘zeichnen’, und

  • ‘Interagieren’: Es kann proaktiv in Dialog treten, Fragen stellen oder KI-Agenten zuweisen, um Aufgaben eigenständig zu erledigen.

Das ist außergewöhnlich und beispiellos. Wird es für das Verlagswesen von Bedeutung sein? Entscheiden Sie.

Gute Dinge außerhalb des Verlagswesens

KI steht hinter einigen bahnbrechenden Errungenschaften außerhalb des Verlagswesens. Die Medizin ist das Aushängeschild der KI, aber es gibt auch starke Geschichten aus anderen Branchen. Die Relevanz für das Verlagswesen ergibt sich aus einer rhetorischen Frage: KI kann Leben retten. Aber Sie glauben nicht, dass sie Verlegern helfen kann?

Das Ziel dieses kurzen Abschnitts ist es lediglich, das Argument zu widerlegen, dass KI möglicherweise niemandem helfen kann, wenn man nicht überzeugt ist, dass sie dem Verlagswesen helfen wird.

KI und Medizin

Als ich eine Ausgabe vom März 2024 des Economist las, vertiefte ich mich in dessen Technologie-Supplement über Gesundheit und KI. In den letzten Jahren war die Medizin konsequent ein heller Punkt der künstlichen Intelligenz. Die meisten Berichte sind positiv. Aber das Economist-Feature wird Sie umhauen. Sie äußern zahlreiche gut formulierte Vorbehalte. Aber Sie werden auch lesen, dass KI in der Medizin “eine Gelegenheit darstellt, das Leben von Hunderten von Millionen, sogar Milliarden, zu verbessern.”

Eine weitere rhetorische Frage für diejenigen, die entweder die KI-Technologie verbieten oder zumindest ein Moratorium für ihre Entwicklung einlegen wollen: Würden Sie ihren potenziellen Wert für die Gesundheit von Millionen opfern, um Ihre Angst vor einer unsicheren Zukunft zu befriedigen?

KI und die TSA an Flughäfen

Wir waren alle schon dort: die endlosen Schlangen, die langsame Bewegung unserer Handgepäckstücke durch die Röntgenscanner.

Die Erkennungsfehler der TSA sind gut dokumentiert, werden aber nicht viel diskutiert.

Was mich am meisten beunruhigt, sind die traurigen Arbeiter, die stundenlang auf ihre Bildschirme starren. Wofür? Es ist nicht nur ein miserabler Job, sondern als bloße Sterbliche sind sie auch nicht besonders gut darin.

Hier kommt die KI ins Spiel. Wenn sie schwer zu erkennende Tumore in Lungen entdecken kann, bin ich zuversichtlich, dass sie auch Schmuggelware in Handgepäckstücken erkennen kann. Und Menschen von einer undankbaren Aufgabe entlasten kann, für die sie schlecht geeignet sind.

Laut diesem Bericht ist das neue KI-unterstützte Screening-Programm der TSA im Gange.

Essay: Die Auswirkungen von KI auf die Buchverlagsbranche

Vor kurzem sprach ich mit Peter Brantley, meinem Partner im KI-Webinar-Dschungel, darüber, wie wir kommende KI-Programme gestalten könnten. Peter arbeitet viel innerhalb der Bibliotheksgemeinschaft und war gerade von einer ganztägigen Veranstaltung in Los Angeles mit etwa 150 seiner Bibliothekskollegen zurückgekehrt, bei der sie persönlich das Potenzial von KI für ihren Sektor erkundeten. Das Gespräch war lebhaft und tiefgründig. Warum, fragte er sich, haben Handelsbuchverlage keine derartigen Zusammenkünfte? KI ist ein Thema bei jeder Verlagsveranstaltung: Warum ist es nicht das Thema?

Die realen Konsequenzen von KI

Die Antwort, die er fand, ist, dass Handelsbuchverlage noch nicht zu dem Schluss gekommen sind, dass KI irgendwelche realen Konsequenzen für ihr Geschäft haben wird. Für den Kern ihres Geschäfts. Für ihre Fähigkeit, Geschäfte zu machen. Sicher, es könnte helfen, eine Pressemitteilung zu schreiben oder einen Manuskriptablehnungsbrief zu verfassen, aber sie gehen davon aus, dass das Verlagswesen weiterhin so dahinplätschern wird wie seit Jahrzehnten, wobei die durchschnittliche Zeit vom Vertrag bis zum gedruckten Buch bis zu zwei Jahre dauern kann.

Gleichzeitig stehen die Verlage natürlich vor kurzfristigen Herausforderungen, die dringender sind als KI. Papierpreise. Versandkosten. Schrumpfende Margen. Insgesamt weitgehend stagnierende Verkaufszahlen. Mit all diesen Belastungen, wer hat da die Zeit oder Kapazität, sich um KI zu kümmern?

Aber andere kreative Branchen verstehen es. Kunst und Design verstehen es. Werbung versteht es. Hollywood sieht, was kommt, ebenso wie die Musikindustrie. Journalisten schauen mit Angst zu.

Andere Buchverlagssektoren beginnen zu verstehen, welche Auswirkungen KI haben könnte. Das wissenschaftliche Verlagswesen ist tief in die Technologie eingetaucht. Aber Handelsbuchverlage tun so, als ob es nur wenige reale Konsequenzen durch KI geben würde.

Welche realen Konsequenzen könnte es geben? Wird es das Buchangebot beeinflussen? Oder die Buchnachfrage?

Angebot: Ja, KI ist verantwortlich für eine Menge neuer Schrottbücher auf Amazon. Hunderte? Sicher. Tausende? Vielleicht. Millionen? Nein. Wie viele Bücher gibt es auf Amazon? Mehr als 50 Millionen. Es ist bereits sehr voll.

Davon abgesehen ist klar, dass KI in naher Zukunft nicht ganze Bücher schreiben wird, die Menschen tatsächlich lesen wollen. Ihr Wert liegt bisher darin, ein Schreibpartner zu sein – zu kritisieren, Vorschläge zu machen, gelegentlich ein paar Absätze brauchbaren Text zu erstellen. Nein, in naher Zukunft wird KI nicht radikal die Ergebnisse des Buchverlagswesens, das Angebot neuer Bücher, verändern.

Nachfrage: Nein, niemand fordert KI-generierte Bücher. Das ist kein Faktor. Und ich kann kein Szenario vorhersehen, in dem KI die Nachfrage nach Büchern im weiteren Sinne beeinflussen wird.

Was ist mit dem Verlagsprozess? Ja, der wird sich ändern. Zumindest ein wenig. Wie wir bei unserer Publishers Weekly KI-Veranstaltung letzten Herbst herausfanden, suchen Verlage hier und da nach Hilfe durch KI: Marketing, Redaktion, ein bisschen von diesem und ein bisschen von jenem.

Ist es möglich, dass es wenige reale Konsequenzen der KI auf den Handelsbuchverlag geben wird? Vielleicht ist es nur ein Spielzeug.

Lasst uns also einen Schritt zurücktreten von den KI-Diskussionen und den schwierigen Zustand des Handelsverlagswesens erneut betrachten, um herauszufinden, wo KI wahrscheinlich den größten Einfluss haben wird.

Das Verlagswesen befindet sich seit Jahrzehnten im wirtschaftlichen Rückgang

Nach unterschiedlichen Schätzungen hat die gesamte Buchverlagsbranche in den Vereinigten Staaten einen Jahresumsatz von unter 35 Milliarden Dollar. Selbst wenn es 40 Milliarden Dollar wären, der Jahresumsatz von Apple Computer allein ist zehnmal höher. Apples Bruttogewinn beträgt 44% des Umsatzes, bei Nettogewinnen von 25% des Umsatzes. Vom Träumen von solchen Margen ist das Verlagswesen weit entfernt.

Der Handelsbuchverlag befindet sich seit Jahrzehnten in einem sanften wirtschaftlichen Rückgang, in manchen Jahren steigt er um ein paar Prozent, in anderen Jahren sinkt er. Mitte 2024 sehen die Umsätze im Jahresvergleich solide aus, aber das ist die Art von Sommerromanze, die Verlage gut kennen. Wir gewinnen einige, wir verlieren einige, aber insgesamt ist das Handelsverlagswesen keine Wachstumsbranche.

Im Jahr 2023, laut AAPs StatShot “sanken die Handelserlöse um 0,3% auf 8,9 Milliarden Dollar für das Kalenderjahr.” Soweit ich das beurteilen kann, berücksichtigt die Daten von AAP die Inflation nicht. Bei einer Inflation von 3,4% würde der Umsatzrückgang 3,6% betragen, näher an dem Rückgang von 2,6% bei den Stückverkäufen, gemeldet von Circana.

Ohne das Wachstum alternativer Formate, E-Books und Hörbücher, könnte die Branche in sehr schlechter Verfassung sein. E-Books waren jahrelang ein Wachstumsmotor. Die Verkäufe von Hörbüchern steigen weiterhin, um fast 15% im Jahr 2022 und weitere 9% im Jahr 2023. Ja, ein Teil davon sind Ersatzverkäufe, aber viele der Kunden für E-Books und Hörbücher sind neue Kunden, nicht unbedingt regelmäßige Buchleser. E-Books und Hörbücher machten im letzten Jahr 21% der Handelserlöse aus. Würden all diese Kunden gedruckte Bücher kaufen, wenn es nur gedruckte Bücher gäbe?

Der Einzelhandelspreis wird zunehmend zu einem Problem, da Kosten und Rabatte von Einzelhändlern und Großhändlern die Margen der Verlage schmälern. Akademische Studien deuten darauf hin, dass es eine gewisse Preiselastizität für Bücher gibt, aber sicherlich erreichen wir den Widerstandspunkt: Hardcover-Bestseller stoßen an eine Preisobergrenze von 35 Dollar. “Abonnementmüdigkeit” führt dazu, dass Video-on-Demand-Kunden Dienste kündigen, weil die Kosten jedes einzelnen Dienstes steigen. Netflix’ Premium-Plan kostet jetzt 22,99 Dollar/Monat; das Disney Plus Duo Premium 19,99 Dollar/Monat. Wie ein Kollege kürzlich zu mir sagte, wie viele knapp bei Kasse befindliche Abonnenten werden sagen, oh, lass uns unser Netflix-Abonnement kündigen, damit ich nächsten Monat ein Buch kaufen kann?

Gehälter im Verlagswesen

Ich werde das nicht weiter ausführen: Es sind nicht nur Autoren, die ums Überleben kämpfen - auch das Verlagspersonal wird im Vergleich zu vergleichbaren Berufen grob unterbezahlt.

Ich habe eine repräsentative Auswahl an aktuellen Stellenanzeigen im Verlagswesen. Ich schaue auf eine, für einen Marketing Manager bei einem Handelsverlag, der 2023 einen Umsatz von etwas mehr als 30 Millionen Dollar gemeldet hat. Die Position zahlt zwischen 60.000 und 70.000 Dollar pro Jahr. Hier ist eine weitere, für einen Publicity Manager bei einem der Imprints eines Verlags, der einen Jahresumsatz von 750 Millionen Dollar meldet. “Diese Rolle wird ein Jahresgehalt von 74.000–79.000 Dollar haben”, heißt es in der Anzeige.

Laut den U.S. Bureau of Labor Statistics National Occupational Employment and Wage Estimates verdienen Marketingmanager im Durchschnitt über alle Branchen hinweg $166,410. Die durchschnittlichen Einnahmen von “Public Relations Managers” betragen $159,420.

Buchverlage sind nicht einmal annähernd in diesem Bereich. Das ist für niemanden, der im Verlagswesen arbeitet, neu. Es war schon immer so. Aber kann sich das Verlagswesen auf diesem Gehaltsniveau halten? Die Unfähigkeit, Kandidaten auch nur die Hälfte des Standardlohns zu bieten, verheißt nichts Gutes für eine Branche, die zunehmend digital wird.

In einem Zeitalter von TikTok, YouTube, sozialen Medien, SEO, Metadaten und Autorenplattformen, was zum Teufel ist eigentlich ein “Öffentlichkeitsmanager”?

Die drei (und ein halber) verbleibenden Vorteile für traditionelle Buchverlage

Drei anhaltende Vorteile für traditionelle Buchverlage sind (i) Prestige, (ii) Zugang zu großen Medien und (iii) Zugang zum Buchhandelsvertrieb. Dies gilt nicht gleichermaßen für alle traditionellen Verlage – die größten haben mehr von allem: mehr Prestige, besseren Zugang zu großen Medien und bessere Möglichkeiten, ihre Bücher auf die vorderen Tische in den meisten Buchhandlungen zu bringen. Aber insgesamt sind dies die charakteristischen Vorteile der traditionellen Buchverlagsbranche.

Ein weiterer Wert, den Verlage bieten können, ist eine kuratierte Liste von ergänzenden Titeln, bei denen jeder einzelne Titel von seinen Begleitern profitiert. Denken Sie an einen Verlag wie Fox Chapel, der sich auf Bücher über Handwerk spezialisiert hat: Wenn Ihnen einer ihrer Titel gefällt, besteht eine gute Chance, dass Sie sich auch ihre anderen Bücher (und Zeitschriften) zu diesem Thema genauer ansehen, selbst wenn sie von anderen Autoren geschrieben wurden.

Dies überschneidet sich mit etwas, das nur wenige Verlage entwickelt haben, einer vermarktbaren Marke. Denken Sie an Reihen wie Wileys “For Dummies” oder Oxfords “Very Short Introductions”. Die Marke vermittelt eine Konsistenz im redaktionellen Ansatz und in der Qualität, die die Leser dazu ermutigt, mehrere Titel zu kaufen. Self-Publisher starten oft ihre eigenen kurzen Serien, hauptsächlich für Belletristik, obwohl sie nicht die Breite dieser größeren Verlagskataloge abdecken können.

Alle anderen Dienstleistungen, die traditionelle Verlage bieten, können auf dem freien Markt mit ähnlicher Qualität zu erschwinglichen Preisen erworben werden (zum Beispiel redaktionelle Dienstleistungen, Design, Produktion und grundlegende Marketingfunktionen). Und für Self-Publisher ist das Einkommen pro verkauftem Buch fünfmal oder mehr höher als bei traditionellen Lizenzgebühren.

Ich werde dies in einem kurzen Anhang am Ende dieses Buches etwas genauer erläutern. Lassen Sie mich aber schnell den Wert der drei größten Vorteile schmälern. Prestige ist gut für das Ansehen, hat aber einen bescheidenen Geldwert. Buchrezensionen und andere große Medienauftritte haben jetzt einen stark verringerten Einfluss auf den Buchverkauf. Und Buchhandlungen machen etwa 15% des Umsatzes der Branche aus (und weit weniger für Self-Publisher) – sie sind nicht mehr zentral für den Erfolg eines Buches.

Die Dinge haben sich geändert.

Self-Publishing

Self-Publishing war in den letzten zehn Jahren und mehr der Haupttreiber für das Wachstum im Publikumsverlag. Genaue Verkaufsdaten zum Self-Publishing bleiben verborgen – es ist leicht, seine Bedeutung zu ignorieren. Aber die verfügbaren Daten zeigen, dass Self-Publishing einen erheblichen Teil des Marktes für Publikumsverlage beansprucht.

Wie der CEO von Kobo, Michael Tamblyn, (etwas) berühmt feststellte: “Eines von vier Büchern, die wir auf Englisch verkaufen, ist ein selbst veröffentlichtes Buch, was bedeutet, dass Self-Publishing für uns effektiv wie ein weiteres Penguin Random House auf dem Markt ist, das niemand sieht. Es ist wie die Dunkle Materie des Verlagswesens.”

Die Trends im Self-Publishing-Markt sind wohl die einzigen bedeutenden Trends im Publikumsverlag. Self-Publisher zeigen den Weg. Sie sind abenteuerlustig und nicht durch die Gepflogenheiten der traditionellen Branche gehemmt. Viele sind mit sozialen Medien vertraut. Sie sind nah an ihren Lesern, ihren Kunden. Wenn Sie die neuesten Marketingtechniken lernen wollen, folgen Sie Autoren Foren, Blogs und Newslettern.

Tauchen Sie tief in die Einkommensstatistiken der Autoren, die Wirtschaftlichkeit des Schreibens, und vergleichen Sie dann den Einkommensrückgang traditionell veröffentlichter Autoren mit den Einkommenszuwächsen der Self-Publisher. In einer internationalen Umfrage und einem Bericht, den ich mit Steve Sieck für ALLi im Jahr 2023 (pdf) durchgeführt habe, fanden wir heraus, dass “das mittlere Einkommen aus Schreiben und Self-Publishing im Jahr 2022 aller antwortenden Self-Publisher $12,749 betrug, ein Anstieg von 53% gegenüber dem Vorjahr. Durchschnittliche (mittlere) Einkommen waren viel höher: $82,600 im Jahr 2022, ein Anstieg von 34%.”

In einer separaten Umfrage, durchgeführt von Peter Hildick-Smith für die Authors Guild, “berichteten hauptberufliche Selbstverleger, die seit mindestens 2018 veröffentlichen, von einem durchschnittlichen Einkommen von 24.000 USD im Vergleich zu 13.700 USD im Jahr 2018, eine Steigerung von 76 Prozent.”

Hybrid-Verlage

Der Vollständigkeit halber möchte ich auch Hybrid-Verlage erwähnen. Ich bin zunehmend begeistert von dem Hybridmodell, und das Segment der Hybridverlage ist bedeutend und wächst. Niemand schätzt den Umsatz der Hybridverlage separat. Aber der Einfluss zeigt sich am deutlichsten in ihrer Dominanz in zwei Kategorien: Bücher von Prominenten und populäre Wirtschaftsbücher. Diese Kategorien waren lange Zeit zuverlässige Einkommensquellen für Publikumsverlage, aber die “Concierge-Dienste” der Hybridverlage und die viel günstigere Gewinnbeteiligung sind für viele hochkarätige Autoren unwiderstehlich.

Jüngste Beispiele, wie Authors Equitys Gewinnbeteiligung mit ihren Autoren und Keila Shaheens 50/50 Gewinnbeteiligung mit Simon & Schuster, deuten auf einen Trend zur Normalisierung des Hybridmodells hin. Das sind gute Nachrichten für Autoren; weniger vielversprechend für traditionelle Verlage.

Veröffentlichen jenseits der Verlage

Ich bin Co-Autor eines Berichts mit Rüdiger Wischenbart, basierend auf seiner Originalstudie “Publishing Beyond Publishers.” Wir versuchen zu verstehen und so gut wie möglich zu quantifizieren, all die buchähnlichen Verlagsaktivitäten weltweit, die als Teil einer umfassenderen Sicht der modernen Verlagsökosphäre einbezogen werden könnten (und sollten).

Sobald man über den buchähnlichen Container hinausgeht, findet man Einblicke, wo KI wirklich einen Einfluss haben könnte.

Das Aushängeschild für unser Projekt ist Wattpad, wo “97 Millionen Menschen über 23 Milliarden Minuten im Monat mit Originalgeschichten beschäftigt sind.” Die Geschichten werden online, meist auf Smartphones, in kurzen Abschnitten erlebt. Wenige werden zu veröffentlichten Büchern. Sie finden genauso wahrscheinlich ihren Weg in “Wattpad WEBTOON Studios, das TV-, Film- und Verlagspendant des Unternehmens.”

Jüngere Leser sind mehr auf das digitale Lesen eingestellt als ihre älteren Kollegen. Laut einer Wattpad-Umfrage vom Januar 2024, “werden digitale Formate bei den jüngeren Generationen immer beliebter, wobei 65 % der Gen Z und 71 % der Millennials Webromane, E-Books und Webcomics annehmen, während weniger als die Hälfte der Gen X und der Boomer-Generationen dasselbe sagen.”

Und natürlich, wie die traditionelle Verlagsbranche jetzt lernt: “Vielfalt ist ein Schlüsselfaktor für die Akzeptanz digitaler Formate: 61 % der Gen Z und 70 % der Millennials sind der Meinung, dass E-Books, Webromane und Webcomics ihnen Zugang zu Inhalten geben, die in Buchhandlungen und Bibliotheken schwerer zu finden sind, einschließlich LGBTQ+ und auf Minderheiten fokussierter Inhalte.”

Wattpad hat Konkurrenten, darunter Inkitt, das laut Publishers Weekly kürzlich 37 Millionen USD von Investoren “einschließlich Stefan von Holtzbrinck, dem Besitzer der Holtzbrinck Publishing Group, zu der Macmillan gehört, und dem ehemaligen Penguin-CEO Michael Lynton; es hat jetzt insgesamt 117 Millionen USD an Investitionen eingeworben. Im Februar 2023 sagte die Financial Times, dass Inkitt das acht-schnellstwachsende Unternehmen in Europa und die Nummer 1 in Deutschland sei.” Ein Artikel vom 9. Juli in Esquire skizzierte Inkitts Nutzung von KI und deren Rolle für ihren Erfolg.

Wie viele von Ihnen haben schon von Inkitt gehört, die Verlagsplattform besucht oder die Galatea-Lese-App heruntergeladen?

Aber unser Bericht “Veröffentlichen jenseits der Verleger” geht über Online-Geschichten-Plattformen hinaus und betrachtet, wie “Inhalte in einer Vielzahl von Formaten (Druck, digital), Medien (Bücher, Audio, Filme, Spiele), Vertriebskanälen (Gemeinschaften, Plattformen, Streams) und Geschäftsmodellen (Produktverkäufe, Abonnements, Streaming, Freemium, bezahlte Modelle) in meist digital definierten Liefer- und Marketingketten erstellt und verbreitet werden können.” Wie viele Chancen verpassen Buchverlage, weil sie nicht offensichtlich in ihr aktuelles Geschäftsmodell passen?

Innovation, Technologie und Buchverlag

Mit Ausnahme von E-Books hat das moderne Verlagswesen nie eine Bedrohung durch Technologie erlebt. (Digitale Hörbücher wurden eher mit Freude als mit Sorge begrüßt.) Die Ära des Internets bot Verlagen mehr Chancen als Bedrohungen; es ist nur ein einzelner Einzelhändler, Amazon, der durch das Internet ermöglicht wurde und den Markt aufgewühlt hat.

Ich habe noch nie eine Studie darüber gesehen, ob Amazon (wenn alle Aspekte seiner Operationen und Auswirkungen vollständig berücksichtigt werden) ein Nettopositiv für die Buchverlagsbranche war. Es erreicht viele Käufer, die nicht von stationären Geschäften bedient werden, und ist bereit, die Marge zu opfern, um die Preise niedrig zu halten. E-Books und Hörbücher werden in großem Maßstab geliefert. Aber Amazon kann Preise teilweise senken, weil es hohe Rabatte und Gebühren von Lieferanten verlangt und andere Vertriebskanäle erstickt. Es gibt schmerzhafte Kompromisse.

Versuchen Sie dennoch nicht, Amazon vor einem selbstveröffentlichten Autor zu kritisieren. Sie wären ohne Der Alles-Laden nicht im Geschäft.

Das Innovator-Dilemma

Um eine Perspektive auf die kommende Auswirkung von KI auf das Buchverlagswesen zu gewinnen, empfehle ich Clayton Christensens Das Innovator-Dilemma: Wenn neue Technologien großartige Unternehmen zum Scheitern bringen, das 1997 erstmals von Harvard Business Review Press veröffentlicht wurde.

Christensen untersucht, wie bestehende (etablierte) Unternehmen den Kräften der Innovation erliegen können.

Erfolgreiche, gut geführte Unternehmen scheitern oft, wenn disruptive Veränderungen in ihre Branche kommen. Konventionelle Managementpraktiken, die ihnen geholfen haben, Branchenführer zu werden, erschweren es diesen Unternehmen, flexibel auf disruptive Technologien zu reagieren, die ihre Märkte kannibalisieren könnten.

Sie ignorieren die Produkte, die durch die disruptiven Technologien entstehen, weil sie auf den ersten Blick schlecht mit ihren bestehenden Produkten vergleichbar sind. Ihre profitabelsten Kunden können die angeblichen Innovationen im Allgemeinen nicht nutzen und wollen sie nicht. Unternehmen versuchen, disruptive Bedrohungen abzuwehren, indem sie ihre bestehenden Produkte und Dienstleistungen verstärken.

Christensens zentrale Erkenntnis ist, dass erfolgreiche Unternehmen, indem sie das anscheinend ‘Richtige’ tun, einschließlich des Zuhörens auf ihre Kunden, sich weitgehend für disruptive Innovationen öffnen. Sie konzentrieren sich auf ihre aktuellen Kunden und ignorieren wichtige neue Technologien, die zunächst kleine, weniger profitable Märkte ansprechen. Dies schafft eine Öffnung für agile Startups, um die Führungskräfte zu stören.

Chris Dixon, in einer Diskussion über das Buch, weist darauf hin, dass “der Grund, warum große neue Dinge an den etablierten Unternehmen vorbeigehen, darin liegt, dass das nächste große Ding immer anfängt, als ‘Spielzeug’ abgetan zu werden.” Hmm, ja, viele Leute sehen Chat-KI als Spielzeug.

Erkennen Verlage nicht, dass Innovationen, die mit generativer KI aufgebaut sind, ihr fragiles Geschäftsmodell stören könnten?

Fiktion versus Sachbuch

Die Auswirkung von KI auf das Buchverlagswesen wird sicherlich einen dramatisch unterschiedlichen Einfluss auf die Veröffentlichung von Fiktion haben als auf die von Sachbüchern.

Die Buchverlagsbranche wird nicht oft genug als zwei bifurkierte Industrien analysiert, eine, die fiktionale Bücher veröffentlicht, und eine andere, die Sachbücher veröffentlicht.

Während die meisten Handelsverlage sowohl Fiktion als auch Sachbücher anbieten, ist die branchenweite Kluft zwischen den beiden Formen sowohl in der Anzahl der veröffentlichten Titel als auch in den Buchverkäufen deutlich. Die Schätzungen variieren, aber fiktionale Titel machen nur etwa 10% der jährlich veröffentlichten Bücher aus. Die Verkäufe hingegen bevorzugen stark Fiktion. Auch hier gibt es jährliche Schwankungen, aber Fiktion erfasst etwa die Hälfte der jährlichen Handelsbuchverkäufe. Letztes Jahr waren 21 der 25 Bestseller Fiktion. Unter Verwendung von Wikipedias Zusammenstellung, von den in englischer Sprache veröffentlichten Büchern, die jemals 20 Millionen Exemplare oder mehr verkauft haben, sind 84% fiktionale Titel.

Buchverkaufstrends sind notorisch unbeständig, aber die Verkaufszahlen von Belletristik scheinen weiterhin zu steigen. Nach einem Einbruch auf 32% im Jahr 2019 erreichten sie 2022 40% des Erwachsenenmarktes und wuchsen 2023 erneut leicht. Die Verkaufszahlen von Erwachsenen-Belletristik stiegen in der ersten Hälfte des Jahres 2024 um weitere 6,3%.

Während KI zunehmend von Belletristik-Autoren zur Unterstützung im Schaffensprozess genutzt werden wird, wie an anderer Stelle besprochen, scheint es wenig wahrscheinlich, dass KI-generierte Geschichten die Bestseller-Regale übernehmen werden. Ein “gut genug” für einige Genre-Fiktion ist vorstellbar, aber wieder nichts, was Autoren und Verlegern schlaflose Nächte bereiten sollte.

Das Schreiben und Veröffentlichen von Sachbüchern hingegen wird umfassend durch KI unterstützt und gefördert. Es geschieht bereits. Sachbuchautoren nutzen die vielen Talente der Chat-KI sowohl als Forschungsassistent als auch als Schreibhilfe. Und Sachbuchverlage werden zunehmend auf die Hilfe der Chat-KI bei der Entwicklung von Manuskripten, der Überprüfung von Fakten, der Bearbeitung, dem Marketing und der Verteilung zurückgreifen.

Gibt es eine existenzielle Bedrohung für Autoren?

Ich sprach mit einer sehr klugen Literaturagentin, die viel darüber nachgedacht hat, was KI für ihre Kunden und für alle professionellen Autoren bedeutet. Das Gespräch drehte sich um die Idee des Buches als ‘Behälter’, und ich bat sie, diese Idee näher auszuführen. Ihre Antwort:

“Die Grundidee ist, dass, wenn Autoren/Agenten ein Buch bei einem Verlag platzieren, es genau das ist: ein Buch. Es besteht das Verständnis, dass es später eine der unzähligen Formen von abgeleiteten Werken werden könnte, die wir kennen (Übersetzung, dramatische Adaption, Graphic Novel usw.), aber all dies ist nachrangig gegenüber dem ‘Werk’ selbst. Das Werk ist kein Sack voller Wörter oder Phrasen oder Fakten, es ist etwas, das vom Autor auf eine Weise strukturiert wurde, die für diesen Autor einzigartig ist. Den Behälter zu zerbrechen, den Scrabble-Sack der Buchstaben zu schütteln und eine zufällige Auswahl herauszuziehen (die nicht völlig zufällig ist, da es ein Scrabble-Sack ist, der aus der Syntax, Semantik und dem Stil des spezifischen Autors besteht), ist nicht das, was in Betracht gezogen wird, wenn wir einem Verlag Rechte gewähren.

“Das Buch ist das integrale Ganze, das größer ist als die Summe seiner Teile. Es ist das Produkt einer kreativen Erleuchtung (und einer Menge kreativer intellektueller Arbeit), die es als Buch zusammengebracht hat, nicht nur ‘ein’ Buch, sondern das Buch dieses bestimmten Autors.”

Bücher enthalten Schätze

Wenn ich an Sachbücher denke, ist das Zerbrechen des Behälters eine der positiven Seiten der KI-Ära. Man zerbricht den Behälter, und wie Fabergé-Eier sind darin Schätze enthalten.

Die Einschränkungen des Behälters sind sowohl ein Merkmal als auch ein Nachteil. Einerseits “ist das Werk nicht nur ein Sack voller Wörter oder Phrasen oder Fakten, es ist etwas, das vom Autor auf eine Weise strukturiert wurde, die für diesen Autor einzigartig ist.” Andererseits war der Autor bei der Erstellung des Behälters gezwungen, aufgrund der inhärenten Einschränkungen des buchartigen Behälters zu reduzieren, abzulehnen, umzuschreiben und neu zu konfigurieren. Das Werk ist poliert, aber es ist destilliert, und einige Dinge gingen verloren (während andere gewonnen wurden) auf dem Weg.

Menschen lesen keine langen Sachbücher, teilweise weil sie darauf konditioniert wurden, alle Texte, auf die sie im Web stoßen – einschließlich ihrer E-Mails – zu überfliegen. Selbst das “Buchzusammenfassungsmodell” scheitert – anstelle eines unverdaulichen 250-seitigen Sachbuchs erhält man eine unverdauliche 8-seitige Zusammenfassung des Buches.

Bücher sind wie Lunchboxen – alles an einem Ort. Aber ich will nur die Kekse.

Es wird für etablierte Autoren nicht einfach sein, ihre Ketten abzuwerfen. Aber sie müssen möglicherweise lernen, dies zu tun, oder riskieren, von einer neuen Generation von geschickten Forschern und Schriftstellern überschattet zu werden, die sich mit oder ohne formale Behälter ausdrücken können, je nach Bedarf. Behälter auferlegen viel zu viele Grenzen und Einschränkungen.

Letztendlich hat sich das Geschäft des Schreibens unwiderruflich verändert. Es ist wie das Ende der Schreiber. In diesem Fall müssen unsere Mönchsautoren hinter ihren Schreibtischen und ihrer containerisierten Sichtweise des Buches hervortreten und sich mit der Form und ihrem Publikum auseinandersetzen.

Oh ja, ich kenne die Erwiderungen der Autoren gut: Aber ich bin ein Schriftsteller, kein Promoter. Ich bin nicht in den sozialen Medien. Ich habe kein Interesse daran, tatsächlich mit meinen Lesern zu kommunizieren, außer durch mein Werk und durch gelegentliche E-Mails und immer seltener werdende Auftritte. Ich habe eine Website (aber, ehrlich gesagt, ich aktualisiere sie nie). Mein Werk ist mein Geschenk an die Leser. Sie können mein Werk annehmen oder ablehnen, aber ich werde nicht zu ihnen in ihre Wohnzimmer kommen.

Nun, du kannst die Schriftrollen und die aus Hermelinblut gefertigte Tinte beiseite legen. Der Beruf des ‘Autors’ verlangt nun, dass du hinter deinem Schreibtisch hervorkommst und deine Leser dort triffst, wo sie leben: in ihren Wohnzimmern und auf ihren Facebook-Seiten. Du kannst es beklagen, so viel du willst, während wir deine Stipendien, deine Festanstellungen und deine Veröffentlichungsmöglichkeiten einstellen. Dies ist die schöne neue Welt der Schriftsteller und Leser, ohne Verleger, diese schrecklichen Zwischenhändler, die hart daran arbeiten, dein Werk zu verbessern und doch ständig deine direkte Verbindung zu den Lesern unterbrechen, den Menschen, die es am meisten schätzen.

Nichts davon schließt aus, dass großartige narrative Sachbücher ein aufmerksames Publikum erreichen. Im Gegenteil. Diese Bücher können weiterhin glänzen. Es wird immer noch Bestseller-Sachbücher geben, auch wenn die Wirtschaftlichkeit für alle außer den meistverkauften Autoren unmöglich sein wird. Das aktuelle Modell muss nicht verschwinden, damit das neue Modell gedeihen kann.

Ich denke an diese großartigen Sachbücher als ‘schön’. ‘Schön’ im Sinne von schön geschrieben, sorgfältig redigiert, mit Sorgfalt und Überlegung gestaltet und gedruckt, mit Büttenrand, auf FSC-zertifiziertem Papier. Sie werden in Boutiquen verkauft.

Die Boutiquen werden ‘Buchhandlungen’ genannt, aber sie haben alle Eigenschaften des Boutique-Einzelhandels – schöne Objekte, sorgfältig ausgewählt vom Besitzer und den Managern, ein bisschen teuer, aber für diejenigen, die solche Objekte schätzen, den Preis wert.

Die Aufgabe der meisten Sachbuchautoren besteht jetzt darin, über den Container hinauszugehen, ebenso wie den Verleger als Gatekeeper.

Inhaltscontainer in mehreren Medien

Das Lesepublikum, insbesondere seine jüngeren Mitglieder, ist zunehmend ‘medienagnostisch’. Auf der Suche nach Unterhaltung oder Wissen können sie ein YouTube- oder TikTok-Video ansehen, eine Netflix-Serie schauen, auf Spotify zuhören, durch Instagram (“Insta”) scrollen, sich über die Nachrichten informieren oder gelegentlich ein Buch lesen.

(Die Printbuch-liebenden Bewohner von BookTok sind eine geschätzte Gruppe von Influencern, haben aber insgesamt nur einen bescheidenen Markteinfluss.)

Doch das Marktmodell ist immer noch auf den einzigartigen Container fokussiert. Die Verlagsindustrie. Die Filmindustrie. Die Fernsehindustrie. Die Musikindustrie.

Filme sind keine Bücher. YouTube-Videos sind keine Filme. Podcasts sind keine Hörbücher.

Diese Silos waren keine historische Unvermeidlichkeit, sondern das Ergebnis einer Reihe von Geschäftsentscheidungen, die mächtige Organisationen im Laufe der Zeit getroffen haben.

Es ist nicht schwer, ein Geschäftsmodell zu stören, das auf einem einzigen Container basiert.

Trotz all ihrer Sprachfertigkeit wirkt die aktuelle Generation der generativen KI mit noch mehr Bravour bei der Produktion von Klängen, Bildern und Videos. KI ermöglicht diesem Buch Hörbücher in mehreren Sprachen neben den 31 Übersetzungen des E-Books. Nichts davon wäre auch nur annähernd möglich ohne KI – die Wirtschaftlichkeit der traditionellen Produktion macht für mich keinen Sinn.

Containersilos

Inhaltsersteller werden traditionell darauf trainiert, in nur einem einzigen Containersilo zu glänzen. Wir haben Schreibprogramme und Filmprogramme und Musikprogramme. Es kommt selten vor, dass kreative Schriftsteller auch ein ‘Nebenfach’ in Film oder Musik belegen. Oder in Computerprogrammierung oder App-Entwicklung.

Was ist eigentlich aus Transmedia geworden? Wo sind die Programme, die Kreative dazu ausbilden, wie Apple es einmal formulierte, “Meister der digitalen Medien” zu sein?

Der beste Inhalt wird immer gewinnen. Aber mit der Zeit werden die Inhaltscontainer immer unwichtiger. Die digitale Generation mag nicht medienagnostisch sein. Aber sie sind containerflexibel. Sie begegnen den meisten ihrer Inhalte digital, über Smartphones. Druck wird weiterhin ein Publikum finden, aber es wird nie wieder das Zentrum beherrschen.

Der “Verleger der Zukunft” muss auch containerflexibel sein. Das meiste Wachstum in der Inhaltsverteilung erfolgt nicht über Tinte auf Papier, noch über Wörter in EPUB-Dateien. Das Wachstum von Hörbüchern ist kein Zufall, ebenso wenig wie die Popularität von YouTube und TikTok.

Die größere Herausforderung liegt in der Notwendigkeit, neue und bestehende Inhalte auffindbar zu machen, in welcher Form auch immer, und dann nach der Entdeckung diese Bekanntheit in eine Kaufentscheidung umzuwandeln.

Entdeckung und Umwandlung

Das Online-Entdeckungsproblem begleitet uns schon seit einiger Zeit; KI hat es nicht geschaffen. Das Problem ist eines, das der Branchenveteran Mike Shatzkin mehr als einmal hervorgehoben hat. Es gibt so viele Titel im Druck, und digitale Formate ermöglichen es ihnen, kontinuierlich im Druck zu bleiben. Millionen von vergriffenen Büchern sind bei Antiquariaten zu finden. Darüber hinaus werden jedes Jahr zwei Millionen oder mehr neue Bücher veröffentlicht, allein in englischer Sprache. KI wird das Sättigungsproblem verschlimmern, aber es ist bereits außer Kontrolle.

Amazons Algorithmen sind nicht selbstlos – sie machen einen sehr guten Job darin, das Verkaufbare hervorzuheben, das Buch, das du als nächstes kaufen wirst. Dieses Buch zeichnet sich nicht nur durch seine Verkaufszahlen aus. Es verkaufte sich am besten, nicht weil ein Betrüger die Online-Liste optimiert hat. Es verkaufte sich am besten, weil es das beste war, und begeisterte Leser anderen empfahlen, es zu kaufen, sowohl online als auch persönlich. (Amazon hat Werbung gefördert, die seine Algorithmen verzerrt, ein Teil der Enshittifizierung der Plattform.)

Ich habe oben über Metadaten gesprochen. Die Umwandlung ist genauso ärgerlich wie die Entdeckung. Kann KI Autoren helfen, aus Browsern Käufer zu machen?

Die Zukunft des Urheberrechts

Das Konzept des Urheberrechts ist durch die KI absurd geworden. Es ist nicht so, dass Menschen keinen Schutz für ihre Arbeit wollen oder verdienen – man könnte argumentieren, dass sie ihn mehr denn je verdienen. Und es ist nicht so, dass KI das Urheberrecht undurchsetzbar macht (zumindest in irgendeiner Form, wenn auch nicht in der derzeitigen Form).

Es ist so, dass der “Schutz des Urheberrechts” auch zu einem Schleier wird, hinter dem Ihre Arbeit verschwindet. Wenn Ihr Buch nicht über ein Gespräch mit ChatGPT referenziert werden kann, existiert es de facto nicht. Die KI-Unternehmen werden nur die crème de la crème der Inhalte lizenzieren. Sie brauchen nicht die Magermilch.

Warum etwas schützen, das nicht gefunden werden kann?

Hier könnte das Entdeckungsproblem zu einer Katastrophe werden. Google macht einen großartigen Job, Bücher nur durch ihre Metadaten zu entdecken. KI will das ganze Paket. Anders als traditionelle Suchmaschinen reagiert KI nicht nur auf Benutzeranfragen basierend auf den abstrakten Metadaten eines Werks.

Gleichzeitig deuten sich durch sich ändernde Content-Container, Container, die nicht ganze Bücher sind, unterschiedliche Arten von Urheberrechtsherausforderungen an. Wenn sich der Text eines Buches on-the-fly ändern kann, als Reaktion auf Leserinput, was ist dann das Urheberrecht des Textes?

Autoren & Leser

Verleger brauchen Autoren; Autoren brauchen keine Verleger.

Die Zukunft des Verlagswesens ist die intime Beziehung zwischen Autoren und Lesern. Sie ist weitaus stärker als die Beziehung zwischen Autoren und Verlegern und Lesern und Verlegern. Verleger können ein Hindernis in der Beziehung zwischen Autoren und Lesern sein. In vielen Fällen ermöglichen sie die Beziehung nicht; sie behindern sie.

Lange Zeit war der einzige Weg, qualitativ hochwertige schriftliche Inhalte zu erhalten, durch Bücher oder über eine bescheidene Auswahl an Periodika. Das ist sicherlich nicht mehr der Fall. Ganz abgesehen von den Ablenkungen durch andere Medien gibt es jetzt so viele verschiedene Möglichkeiten, auf (nicht containerisierte) qualitativ hochwertige schriftliche Inhalte zuzugreifen. Bücher genießen nicht mehr den Vorrang, den sie einst hatten.

KI kann kommunizieren

“Was ist das perfekte Buch, das ich als nächstes lesen sollte?” Generative KI kann diese Frage mit einer Eloquenz und Präzision beantworten, die zuvor nie möglich war. Da KI zu einer zuverlässigen Empfehlungsmaschine wird, müssen Autoren über diese Maschine kommunizieren. (Amazon arbeitet natürlich daran und hat den Vorteil zu wissen, was Sie zuvor gekauft haben.)

Schlussfolgerung

Wo stehen wir also?

Ich hielt es für notwendig, die Herausforderungen des Verlagswesens zu katalogisieren. Chat-KI kommt zu einer Zeit, in der das Verlagswesen in Schwierigkeiten steckt. Es kommt nicht zu einer Zeit, in der die Branche robust ist und sagen kann: „Wir brauchen keine neumodische Technologie; uns geht es gut.“

Ich habe oben über die dringendsten Herausforderungen gesprochen, denen das Verlagswesen gegenübersteht: steigende Kosten und schrumpfende Margen.

Die Wölfe werden nie gesättigt sein in ihren Forderungen nach immer steileren Rabatten; die Margen werden sich nicht verbessern. Die Einzelhandelspreise sind nahe einer Obergrenze. Die Zukunft des aktuellen Verlagsmodells liegt in der Kostensenkung.

Die Gehälter können nicht weiter sinken, also müssen wir die Kosten im Produktionszyklus senken.

Aber Verleger versuchen seit Jahrzehnten, die Produktionskosten zu senken. Es gab einige bemerkenswerte Erfolge, aber wir haben die aktuellen Optionen ausgeschöpft.

Ich habe gezeigt, dass KI Effizienz in den Verlagsprozess bringen kann, über den gesamten Workflow hinweg. Sie sind nicht sofort und nicht einfach: Man muss an der KI arbeiten. Aber die Gelegenheit ist da.

Verleger versuchen nicht, die Belegschaft zu reduzieren, also muss das Ziel sein, dass mehr Bücher schneller auf den Markt kommen, basierend auf den aktuellen personellen Ressourcen. KI-Tools können dieses Ziel weiter verfolgen.

Und natürlich gibt es immer das Ziel, mehr Exemplare der veröffentlichten Bücher zu verkaufen. Auch hier kann KI helfen.

Ich beschreibe oben, wie KI auch transformativ für die Zukunft des Verlagswesens sein kann.

Keine Sorge darüber. Bringen Sie Ihr Haus in Ordnung, und wir werden weiter darüber sprechen.

Eine einzige Ressource

Es gibt jetzt ein nahezu endloses Angebot an Material, das Ihnen Informationen über KI liefern kann, viel zu viel natürlich. Wählen Sie Ihr bevorzugtes Medium: Bücher, Blogs, Newsletter, Videos, Podcasts, Kurse und Wahrsagerei. Ich habe einige wichtige Quellen durch dieses Buch verlinkt, es lohnt sich, auf ein paar zufällige Links zu klicken, um zu sehen, wohin sie führen.

Es gibt nur ein hervorragendes KI-Buch für Anfänger, Ethan Mollicks Co-Intelligence, das Anfang April 2024 veröffentlicht wurde. Es basiert auf seinem ebenso hervorragenden Newsletter, “One Useful Thing.”

Randnotiz: Qualifikationen für das Schreiben dieses Buches

Ich wollte die Einleitung nicht mit diesen Informationen belasten, aber ich bin mir bewusst, dass viele Menschen heutzutage skeptisch gegenüber den Leuten sind, die über KI schreiben, und misstrauisch sind, dass sich diese Autoren als heutige KI-Experten darstellen. Zweifellos tun das einige. Ich hoffe, dass ich akzeptable Qualifikationen habe, um dieses Projekt zu übernehmen.

1988 las ich mein erstes Buch über künstliche Intelligenz, ein Buch, das zwei Jahre zuvor veröffentlicht wurde, Understanding Computers and Cognition: A New Foundation for Design von Terry Winograd und Fernando Flores. Das Buch ist dicht – vieles davon war für mich unverständlich – aber es war das erste Mal, dass ich mich für die Möglichkeiten der künstlichen Intelligenz im Buchverlag begeisterte.

Zu dieser Zeit war ich tief in der Digitalisierung des Verlagswesens verstrickt, ausgelöst durch die Explosion des Desktop-Publishing, Apple-Computer, PageMaker und ähnliches. 1986 überwachte ich die Entwicklung der automatisierten Buchverlagssoftware Page One, ein Programm, das ein Buchmanuskript als Microsoft Word-Datei aufnehmen und es in wenigen Minuten in ein ganzes Buch setzen konnte. Das ist heute sehr einfach; damals war es nicht einfach.

Danach arbeitete ich weiterhin in der Verlagstechnologie, als Berater und Analyst, und arbeitete mit einigen der führenden Software- und Hardwareanbieter zusammen, darunter Adobe, Apple und Microsoft. Ich wurde auch Teilhaber eines Softwareunternehmens namens Enfocus. Wir entwickelten ein automatisiertes System für Vorstufen-Workflows.

Zu diesem Zeitpunkt hatten wir keinen Zugang zu KI, aber wir wurden sehr gut darin, vollständig automatisierte Verlagsproduktionenssysteme zu entfesseln. So wie KI von Magie nicht zu unterscheiden sein kann, kann auch die beste Automatisierung erscheinen, als würde sie KI ähneln.

Schnellvorlauf bis 2016, und mein Kollege Cliff Guren half mir, mich auf KI im Buchverlag zu konzentrieren: Es sah so aus, als ob endlich etwas passierte. The Bestseller Code (Archer und Jockers) erschien im September 2016 und machte deutlich, dass Computer die Textur der Literatur mit einem hohen Maß an Einsicht und Präzision interpretieren konnten.

Zu dieser Zeit achtete ich genau auf Startups im Buchverlag, und eine kleine Anzahl entstand mit einem gewissen Grad an KI-Technologie in ihren Softwareangeboten.

Schnellvorlauf bis Oktober 2022.

Monate bevor es zum Thema wurde, über das jeder im Verlagswesen sprach, präsentierte Tim O’Reilly auf der PageBreak-Konferenz über “AI and Publishing Transformation.” O’Reilly ist in der Verlagsgemeinschaft wohlbekannt, sowohl für O’Reilly Media als auch für die Tools of Change-Konferenz. Er ist einer der Top-Visionäre der Technologiebranche.

O’Reilly war nicht nur begeistert von den neuen Fortschritten in der KI, er war überaus begeistert. “Wir befinden uns an einem Punkt, der sehr ähnlich ist wie damals, als wir 1992 das World Wide Web entdeckten”, sagte er und fügte hinzu, “dies ist genauso transformativ wie VisiCalc, der PC und der Webbrowser.”

Er gab zu, dass (zu diesem Zeitpunkt) der Anwendungsfall noch unklar war und verwies auf ein paar Pilotprojekte bei O’Reilly Media. Aber, sagte er, “das wird erschreckend schnell besser. Maschinelles Lernen ist keine Zukunftssache mehr. Es geht um die Demokratisierung der KI.”

O’Reilly sprach darüber, wie Verlage diese neuen Technologien angehen sollten, und sagte, dass sie “wissen müssen, wann sie die Boote verbrennen und alles auf eine Karte setzen müssen. Es gibt eine Zeit, in der man sich verpflichten muss.”

ChatGPT wurde erst einen Monat später veröffentlicht. PageBreak war die erste Verlagskonferenz, die es dank Tims Einsichten in den Mittelpunkt stellte.

Offenlegungen

Dieses Buch hat fünf Sponsoren. Ich wusste beim Schreiben des Buches, dass es keine großen Reichtümer bringen würde, und entschied mich, meine Bemühungen durch die Einladung von Sponsoren zu unterstützen.

Wie ich auf meiner Website angebe, unterstütze ich als Berater, Analyst und Journalist die Internationale Journalisten-Föderation Global Charter of Ethics for Journalists. Paragraph 13 ist klar in Bezug auf die Verpflichtung, Interessenkonflikte oder “jede Verwechslung zwischen (meiner) Tätigkeit und der von Werbung oder Propaganda” zu vermeiden.

Sponsoren zu haben, impliziert einen Interessenkonflikt und Verwirrung rund um Werbung. Wenn ich für die New York Times arbeiten würde, wäre es einfach: “Nein.” Da ich für mich selbst arbeite, ist Offenlegung meine Waffe, um diesen Verpflichtungen nachzukommen: Ich werde die Gegenleistungen beschreiben, die ich erhalten habe, und Sie können anhand meiner Arbeit beurteilen, ob ich beeinträchtigt wurde.

Ich habe die Sponsoren, die ich zu diesem Projekt eingeladen habe, ausgewählt, weil ich nicht nur mit ihrer Arbeit, sondern auch mit den Personen in ihren Organisationen vertraut war. Sie sind Kollegen und Freunde. Ich habe ihnen gesagt, dass ihre Produkte im Text dieses Buches besprochen werden könnten und sie keine Kontrolle über diese Worte hätten. Was sie kontrollieren könnten, wären ihre Anzeigen am Ende des Buches – diese würde ich so veröffentlichen, wie sie geliefert wurden. Das habe ich getan.

Ich habe Zahlungen von anderen erhalten, die meine Arbeit an diesem Buch beeinflusst haben könnten – ich kann Folgendes katalogisieren:

  • Ich habe keine bezahlten Beratungsdienste für die in diesem Buch beschriebenen KI-Anbieter, einschließlich der Sponsoren, geleistet.

  • Ich habe einige Gewinnbeteiligungseinnahmen von Publishers Weekly für die KI-Webinare im September 2023 erhalten.

  • Ich werde für meine Publishers Weekly Artikel zu einem Standardtarif bezahlt.

Bitte lassen Sie mich wissen, wenn Sie eine Bevorzugung feststellen, die Ihrer Meinung nach aus diesen Engagements resultieren könnte. Meine Voreingenommenheit zugunsten von KI entstand, bevor die großen Reichtümer flossen.

Danksagungen

Ich könnte nicht glaubwürdig über KI sprechen, wenn nicht Publishers Weekly, einschließlich des emeritierten Redakteurs Jim Milliot und des CEO Cevin Bryerman, mich unterstützt hätten. Jim unterstützte mein frühes Schreiben über KI, und Cevin (zusammen mit Krista Rafanello und dem Rest des Teams) waren maßgeblich am Erfolg der letztjährigen Konferenz beteiligt, AI and the Revolution in Book Publishing. Andrew Albanese ist jetzt der Chefredakteur bei PW; Ed Nawotka, ein leitender Redakteur. Ich habe das Glück, mit ihnen zu arbeiten.

Und weiterer Dank gilt zahlreichen Kollegen…

  • Peter Brantley

  • Cliff Guren, langjähriger Sparringspartner und aufmerksamer Leser meiner Entwürfe

  • Zwei weitere ‘Beta’-Version Leser, die wertvolles Feedback gegeben haben: Joe Wikert und Brad Farmer

  • Meine Publishing Technology Partners, Ken Brooks, Bill Kasdorf, Bill Rosenblatt, Bill Trippe, Steve Sieck und unsere neuesten Partner, Lettie Conrad und Linda Secondari.

  • Meine Schwester, Anne Pashley, die mir hilft, die Datenbank des Publishing-Startups aktuell zu halten und meine Bemühungen ständig beflügelt.

  • Meine Partner in meinen monatlichen KI-Webinaren: Brooke Horn und Brian O’Leary bei BISG.

  • Bill Kasdorf half mir, die Barrierefreiheitsthemen für mein Buch zu vertiefen.

  • Peter Armstrong und Len Epp bei Leanpub waren geduldig mit meinen Einwänden und halfen mir durch den Prozess, das bestmögliche Ergebnis auf der Leanpub-Plattform zu bieten.

  • Hugo Rayne bei ElevenLabs für die Unterstützung bei Hörbüchern.

  • Mein guter Freund und zuverlässiger Entdecker meiner Schreib- und Denkfehler, Bob McArthur.

Anhang: Erforschung der verbleibenden Vorteile des traditionellen Verlagswesens

Das Prestige des traditionellen Verlagswesens ist der Grund, warum die meisten von uns in die Branche eingestiegen sind. Wir sind mit der Liebe zu Büchern aufgewachsen, haben an der Universität Englisch oder etwas Ähnliches studiert, eine Weile herumgetrieben, vielleicht einen Job in einer Buchhandlung bekommen, vielleicht ein Master-Zertifikat im Verlagswesen erworben, dann als Praktikant bei einem Verlag gearbeitet, und hier sind wir heute. Du liebst deinen Job, obwohl die Bezahlung mies ist und die Arbeitsbedingungen nicht immer angenehm sind.

Dieses Prestige nährt die Versorgungskette des Verlagswesens. Auf der Eingangsseite der Versorgungskette: es bedeutet viel für viele Autoren. Wir sehen es die ganze Zeit. Die Ökonomie des traditionellen Verlagswesens macht keinen Sinn, und es dauert viermal so lange, um in den Druck zu kommen, aber, vielleicht, nur vielleicht, werde ich der nächste Debütgewinner, wie Delia Owens (Where the Crawdads Sing) oder der zweite Megastar, Amor Towles (A Gentleman in Moscow).

Es ist wie in Vegas: außer dass die Chancen in Nevada besser stehen. Setze auf eine einzelne Zahl im Roulette und die Chancen gegen dich stehen 36 zu 1. Spiele traditionelles Verlagswesen und die Chancen gegen dich sind… weit schlechter.

Die Chancen, einen Vertrag mit einem der traditionellen Publikumsverlage zu bekommen, geschweige denn mit einem der großen 5, sind schlecht. Aber das ist das geringste Problem eines Autors. Tatsächlich Leser zu finden, ist die Mega-Herausforderung.

Eine Sache, die helfen kann, ist, einen Platz auf einer Bestsellerliste zu ergattern.

Betrachten wir PRH, Penguin Random House. Das Unternehmen veröffentlicht jedes Jahr nur 15.000 neue Titel. Im Jahr 2021 schafften sie es, 196 Bücher auf die Publishers Weekly Bestsellerliste zu bringen. Wie im verlinkten Artikel hervorgehoben wird: “PW veröffentlicht vier Bestsellerlisten für Erwachsene, jede mit 20 Titeln: Hardcover-Fiktion, Hardcover-Sachbuch, Trade Paperback und Massenmarkt-Paperback. Das bedeutet, dass es im Laufe eines Jahres 2.080 Hardcover-Positionen auf unseren Listen gibt und 2.080 Paperback-Positionen.

Nicht alle Bestseller wurden in diesem Jahr neu veröffentlicht - schätzen wir großzügig, dass 90% davon neu waren, 1870 Plätze.

Währenddessen hat The New York Times 15 Bestsellerplätze pro Woche für jede Buchkategorie (Fiktion, Sachbuch, Kinderbücher; separate Listen für YA und Ratgeber; Hardcover getrennt von Paperback, plus kombinierte Listen). Für einen einzelnen Autor bedeutet das 780 verfügbare Plätze pro Jahr, obwohl die meisten dieser Plätze von wiederkehrenden Bestsellern besetzt sind. (The Body Keeps the Score von Bessel van der Kolk ist seit fünfeinhalb Jahren auf der Paperback-Liste!) Teilen wir das also durch die Hälfte, bleiben 390 verfügbare Plätze. Man muss viele Bücher verkaufen, um einen dieser Plätze zu ergattern.

Was ist mit Berichterstattung in der New York Times Book Review? Im Jahr 2016 behauptete Pamela Paul, damals die Herausgeberin der Review, dassThe Book Review bei der Times etwa 1% der Bücher rezensiert, die in einem bestimmten Jahr erscheinen.” Offensichtlich meint sie 1% der Bücher der großen Verlage - sie kann nicht an kleine Verlage oder selbstveröffentlichte Autoren denken. Und so werden vielleicht 150 der 15.000 neuen Titel von PRH jedes Jahr rezensiert.

Die meisten Beobachter sind sich einig, dass die Aufmerksamkeit der großen Medien zwar immer noch wichtig ist und mächtig sein kann, die Wirkung von Rezensionen jedoch nicht mehr so stark ist wie früher, wenn auch aus keinem anderen Grund, als dass weniger Buchleser mit den großen Bewertungsstellen interagieren.

Wenden wir uns nun der Lieferkette weiter unten zu, dem Vertrieb. Während Verlagsmarken bei Autoren Gewicht haben, war es immer eine Binsenweisheit, dass Verlagsmarken im Gegensatz zu vielen Konsumgütern bei Buchkäufern und Lesern fast kein Gewicht haben. Aber sie haben viel Gewicht bei Distributoren und Buchhändlern. Dies spiegelt die historische B2B-Natur des Verlagswesens wider (im Gegensatz zu B2C - zu Verbrauchern). Das Ansehen des Verlags wird über Vertriebs- und Einzelhandelskanäle verbreitet: Barnes & Noble führt ein Buch, weil es von PRH stammt, und stellt es dann den Käufern ins Gesicht; so wird das Ansehen an die Leser weitergegeben.

Sponsoren

Ein Banner, auf dem steht 'BOOK ADVISORS LLC Transaktionsdienstleistungen und Beratung für Verlage'.

David Lamb und Susan Reich gründeten Book Advisors LLC im Jahr 2016, um bei Fusionen und Übernahmen im Verlagswesen zu beraten. Wir haben mehr als ein Dutzend Transaktionen abgeschlossen sowie eine Vielzahl von finanziellen, vertrieblichen und operativen Beratungsprojekten, einschließlich fairer Marktbewertungen. Wir freuen uns, kürzlich in Zusammenarbeit mit Clarke & Esposito; Thad McIlroy von The Future of Publishing; und Kuo-Yu Liang von Ku Worldwide gearbeitet zu haben.

Wir sind stolz auf unsere Beziehungen, Sorgfalt und Diskretion. Ob Sie kaufen, verkaufen, finanzieren oder beraten möchten, bitte kontaktieren Sie uns für ein vertrauliches Gespräch.

bookadvisorsllc.com | bookadvisors@gmail.com

Ein 3x2-Raster von Bannern: Ein Banner, das ankündigt, dass Papercutz im August 2022 von Mad Cave Studios in Zusammenarbeit mit Ku Worldwide LLC übernommen wurde; Ein Banner, das ankündigt, dass DAW Books im Juli 2022 von Astra Publishing House übernommen wurde, in Zusammenarbeit mit Ku Worldwide LLC; Ein Banner, das ankündigt, dass Caslon Publishing im April 2022 von Brookes Publishing Co. übernommen wurde, in Zusammenarbeit mit Thad McIlroy; Ein Banner, das ankündigt, dass B.E.S. Publishing im November 2021 von Sourcebooks übernommen wurde; Ein Banner, das ankündigt, dass Applewood Books im April 2023 von Arcadia Publishing übernommen wurde; Ein Banner, das ankündigt, dass Erewhon Books im Oktober 2022 von Kensington Publishing übernommen wurde.
Logo von Firebrand Technologies und NetGalley.

Firebrand Technologies ist ein Software- und Dienstleistungsunternehmen, das seit mehr als 35 Jahren Buchverlage mit Daten- und Workflow-Management-Lösungen unterstützt.

NetGalley ist eine Online-Plattform, die Verlage und Autoren mit Rezensenten, Bibliothekaren, Buchhändlern, Medien und Pädagogen verbindet, die neue Bücher auf NetGalley entdecken und sie ihrem Publikum empfehlen.

Als Entwickler von Software- und digitalen Lösungen sind Firebrand Technologies und NetGalley auch Branchenexperten und aktive Mitglieder der Verlagsgemeinschaft. Unsere Lösungen fördern alle Aspekte des Verlagsprozesses, von der Akquise bis hin zu Vertrieb und Marketing.

  • NetGalley hilft Verlagen, Aufmerksamkeit für Titel zu erzeugen, schnelle Rückmeldungen und Rezensionen zu erhalten und frühe Trends zu entdecken.

  • Title Management Enterprise zusammen mit seiner kompakten Version, Title Management Lite, ist Firebrands zentrale Softwareanwendung, die fortschrittliches Workflow-Management während des gesamten Verlagsprozesses bietet.

  • Eloquence on Demand ist die leistungsstärkste ONIX-Verteilungsplattform der Verlagsbranche, die Metadaten und digitale Assets an über 600 Handelspartner in ONIX und anderen Formaten verteilt.

  • Flywheel ist ein Marketingdienst für Backlist, der versteckte Chancen in der Backlist identifiziert, um die Auffindbarkeit und den Verkauf zu steigern.

  • Eloquence on Alert überwacht Live-Titeldaten und Trends im Markt und warnt Verlage vor kritischen Fehlern und Chancen, die den Verkauf beeinflussen können (fehlende Kaufbuttons, Drittanbieter, etc.).

  • FlightDeck ist das fortschrittlichste EPUB-Validierungs- und Testwerkzeug, das verfügbar ist.

Eine Infografik, die verschiedene von NetGalley angebotene Dienstleistungen zeigt, darunter Buchwerbung, Workflow-Management im Verlag, Metadatenverteilung, Verkaufs- und Backlist-Marketing sowie EPUB-Tests.
Banner für Perfect Bound, ein Marktplatz, der Verlage weltweit mit Druckereien verbindet.

Willkommen zu einer besseren Art, Bücher zu drucken.

Perfect Bound wurde 2022 gegründet, um die Lieferkettenprobleme zu lösen, die die Buchverlagsbranche seit Jahren plagen. Zeiten mit Überkapazitäten bei Druckereien wechseln sich mit kurzen Zeitfenstern der Verzögerung aufgrund von Lieferengpässen ab. Perfect Bound möchte den Druckmarkt für unabhängige Verlage und Autoren öffnen, indem Druckereien aus der ganzen Welt sich leicht mit Verlagen verbinden und Geschäfte machen können.

Was ist Perfect Bound?

Perfect Bound ist ein zweiseitiger Marktplatz, der unabhängige Buchverlage mit Druckereien in den USA, Kanada, Kolumbien, Brasilien, der Türkei, China, Malaysia, Indien und mehr verbindet.

Illustration einer Druckmaschine, die verschiedene Arten von Büchern und Publikationen produziert.

Entdecken Sie neue Verlagspartner mit einem Klick

Unsere robuste Plattform ermöglicht es Ihnen, einfach Produktangebote zu erstellen, Anfragen an Hunderte von Druckereien mit einem Klick zu senden, Druckaufträge auszuhandeln und abzuschließen und Produkte von der Druckerei bis zum Lager zu verfolgen. Als Druckerei war es nie einfacher oder sicherer, sich mit neuen Verlagen zu verbinden, auf bevorstehende Projekte zu bieten und bezahlt zu werden.

Verbinden Sie sich sofort mit neuen Verlagspartnern

  • Senden und empfangen Sie Druckanfragen aus der ganzen Welt

  • Führen Sie Druckaufträge aus und verfolgen Sie sie von der Druckerei bis zum Lager

  • Transaktionen nahtlos mit ACH-Zahlungen über Stripe durchführen, ohne die Plattform zu verlassen

Eine Anzeige für Shimmr, die automatisierte Werbung zeigt, die Bücher verkauft, mit einem Hinweis auf eine Umsatzsteigerung von 35% und eine doppelt so hohe Rendite auf Werbeausgaben.
Eine Anzeige für Shimmr mit Beispielanzeigen, Preisinformationen und einem QR-Code, um eine Demo zu buchen.

Lernen Sie Insight kennen, eine speziell für Verlage entwickelte KI-Plattform

Eine Nahaufnahme einer Person, die ein offenes Buch hält, aus dessen Seiten leuchtende Elemente emanieren.

“Die Einführung von Insight für unser Verlagshaus war wie der Tausch eines Fahrrads gegen einen Ferrari. Plötzlich bewegt sich alles schneller.”

—-Deutscher Kinderbuchverlag und Insight-Kunde

Arbeiten Sie intelligenter, erreichen Sie mehr

Entwickelt von Veristage, ermöglicht Insight Verlagen, im sich wandelnden KI-Umfeld zu florieren. Mithilfe von KI und einer robusten Suite digitaler Werkzeuge analysiert und versteht Insight Ihre Dokumente und Bücher, um Ihnen zu helfen:

  • Erstellen, verbessern und aktualisieren Sie Metadaten

  • Beschleunigen Sie die Erstellung titelbezogener Marketing-, Öffentlichkeitsarbeits- und Vertriebsmaterialien

  • Identifizieren und bewerten Sie die Schlüsselbotschaften, Alleinstellungsmerkmale, Zielgruppe, Vergleichstitel und mehr eines Buches

  • Optimieren Sie Ihre Marketing- und Vertriebsinhalte für maximale Reichweite, Engagement und gesteigerten Absatz

Im Gegensatz zu generischen KI-Plattformen ist Insight darauf ausgelegt, innerhalb von Verlags-Workflows zu funktionieren und Ihnen zu helfen, verlagsspezifische Informationen und Ressourcen zu erstellen.

Wie es funktioniert

  1. Laden Sie Ihr Buch auf die Insight-Plattform hoch

  2. Die KI-Tools von Insight analysieren und verstehen Ihr Buch

  3. Innerhalb weniger Minuten generiert Insight eine breite Palette an Metadaten und Schlüsselinformationen über Ihr Buch für die Redaktions-, Marketing-, Öffentlichkeitsarbeits-, Vertriebs- und Rechteabteilungen

  4. Nehmen Sie manuelle Änderungen an diesen Informationen direkt in der Plattform vor. Ihr Buch und die KI-Inhalte werden in Insight gespeichert, sodass Sie jederzeit darauf zugreifen können.

  5. Nutzen Sie unseren dokumentenbewussten KI-Chat, um Ihre Titelinformationen zu optimieren, mit Ihren Büchern zu interagieren und Buchdetails in Kommunikations- und andere Materialien einzubinden

Sicherheit und Urheberrecht

Das Veristage-Team verpflichtet sich, KI-Dienste bereitzustellen, die sicher sind und das geistige Eigentum der Verlage schützen. Unsere Plattform verfügt über fortschrittliche Informationssicherheitssysteme, und wir arbeiten nur mit KI-Modellen, die Ihre Daten nicht speichern oder zur Schulung zukünftiger Modelle verwenden.

Lösungen für Verlage jeder Größe

Insight ist darauf ausgelegt, für Verlage jeder Form und Größe zu arbeiten, von Konsumenten- bis zu akademischen Verlagen, von Dreipersonenteams bis hin zu multinationalen Organisationen. Wir bieten wettbewerbsfähige Preise und skalierbare Lösungen.

Sprechen Sie mit uns, um herauszufinden, wie Insight Ihrem Unternehmen zugute kommen kann:

Logo von Veristage in Blau mit einem abstrakten Design.