Η Επανάσταση της Τεχνητής Νοημοσύνης στην Έκδοση Βιβλίων (Έκδοση στα Ελληνικά)

Thad McIlroy

Πίνακας Περιεχομένων

Εισαγωγή
- Είναι βιβλίο;
- Πόνος των εκδοτών με την ίδια την ΤΝ
- Θα είναι ακριβώς αυτό που χρειάζεστε να ξέρετε;
- Για ποιον είναι αυτό το βιβλίο;
- Προσβασιμότητα, τόσο γενικά όσο και συγκεκριμένα
- Κάποιες διοικητικές λεπτομέρειες
Γιατί AI τώρα;
AI: Ξεκινώντας
AI: Μια Πολύ Σύντομη Ιστορία
Κατανόηση της Τεχνητής Νοημοσύνης και Κάποια Βασική Ορολογία
- Προτροπές και Προτροπή
- Μεγάλο Γλωσσικό Μοντέλο (LLM)
- Γεννητική Τεχνητή Νοημοσύνη
- Γεννητικός Προ-εκπαιδευμένος Μετασχηματιστής (GPT)
- ChatGPT
- Σώμα Κειμένων
Λογισμικό AI: Οι Μεγάλοι Παίκτες του Συστήματος
- Παραδείγματα Λογισμικού
- Τρεις τύποι λογισμικού AI
Εργασία με Λογισμικό Τεχνητής Νοημοσύνης
Εκπαίδευση για το Chat AI
- Πώς να κάνετε υποβολές
Παραληρήματα: Μια Μύγα στην Αλοιφή
- Επαλήθευση στοιχείων
Τι γίνεται με τις εικόνες και τα βίντεο;
Λογισμικό για Εκδότες Βιβλίων
- Επιχειρηματικό λογισμικό για την έκδοση βιβλίων
- Λογισμικό Τεχνητής Νοημοσύνης για εκδότες βιβλίων: οι νεοφυείς επιχειρήσεις
Τεχνητή Νοημοσύνη και Εκδοτική Βιομηχανία: Τι Κάνει Αυτή τη Στιγμή η Βιομηχανία;
AI και Έκδοση Βιβλίων: Τι Κάνουν οι Εκδοτικές Εταιρείες;
AI και Έκδοση Βιβλίων: Οι Χρήσεις
- Τι συμβαίνει όταν η ΤΝ διαβάζει ένα βιβλίο;
- ΤΝ και σχεδιασμός & παραγωγή βιβλίων
- Τεχνητή Νοημοσύνη & μάρκετινγκ βιβλίων
- Τεχνητή Νοημοσύνη και μεταδεδομένα
- Δήλωση χρήσης Τεχνητής Νοημοσύνης στα μεταδεδομένα
Στρατηγικές για την Ενσωμάτωση της Τεχνητής Νοημοσύνης στις Λειτουργίες Εκδόσεων
- Ανάπτυξη και επικοινωνία πολιτικών AI
- Επαγγελματικές σκέψεις
Τεχνητή Νοημοσύνη για Ηχητικά Βιβλία
AI για Μετάφραση Βιβλίων
AI για Ακαδημαϊκές Εκδόσεις
AI για Συγγραφείς
Ανησυχίες και Κίνδυνοι γύρω από την AI
- Παραβίαση πνευματικών δικαιωμάτων;
- Πνευματικά δικαιώματα και AI για συγγραφείς
- Ποιες είναι οι μακροπρόθεσμες επιπτώσεις;
- Άδεια χρήσης περιεχομένου σε εταιρείες τεχνητής νοημοσύνης
- Είναι πολύ αργά για να αποφύγουμε την τεχνητή νοημοσύνη
- Όταν οι συγγραφείς χρησιμοποιούν ΤΝ
- Μπορεί να ανιχνευθεί το AI στη γραφή;
- Απώλεια εργασίας
- Εκπαίδευση
- Το μέλλον της αναζήτησης
- Junk books on Amazon
- Προκατάληψη
Η δημιουργικότητα μπορεί να είναι Κλισέ
Μια Άλλη Σκέψη
Καλές Ιδέες Εκτός Δημοσίευσης
- Τεχνητή Νοημοσύνη και Ιατρική
- Τεχνητή Νοημοσύνη και η Υπηρεσία Ασφάλειας Μεταφορών στα αεροδρόμια
Δοκίμιο: Η Επίδραση της Τεχνητής Νοημοσύνης στη Βιομηχανία Εκδόσεων Βιβλίων
- Οι πραγματικές συνέπειες της Τεχνητής Νοημοσύνης
- Οι εκδόσεις είναι σε οικονομική ύφεση εδώ και δεκαετίες
- Μισθοί στον εκδοτικό κλάδο
- Τα τρία (και μισό) εναπομείναντα πλεονεκτήματα για τους παραδοσιακούς εκδότες βιβλίων
- Αυτοέκδοση
- Υβριδικοί εκδότες
- Εκδόσεις πέρα από τους εκδότες
- Καινοτομία, τεχνολογία και έκδοση βιβλίων
- Το δίλημμα του καινοτόμου
- Μυθιστόρημα έναντι μη μυθοπλασίας
- Υπάρχει υπαρξιακή απειλή για τους συγγραφείς;
- Τα βιβλία περιέχουν θησαυρούς
- Δοχεία περιεχομένου σε πολλαπλά μέσα
- Απομονωμένα δοχεία
- Ανακάλυψη και μετατροπή
- Το μέλλον των πνευματικών δικαιωμάτων
- Συγγραφείς & αναγνώστες
- Η Τεχνητή Νοημοσύνη μπορεί να επικοινωνήσει
Συμπέρασμα
Ένας Ενιαίος Πόρος
Παράπλευρη σημείωση: διαπιστευτήρια για τη συγγραφή αυτού του βιβλίου
- Αποκαλύψεις
- Ευχαριστίες
Παράρτημα: Εξερευνώντας τα Εναπομείναντα Πλεονεκτήματα της Παραδοσιακής Έκδοσης
Χορηγοί

Εισαγωγή

“Η επόμενη επανάσταση θα μας πιάσει όλους απροετοίμαστους, όπως πάντα. Με άλλα λόγια: αν το πλήθος περιμένει την επανάσταση, δεν μπορεί να είναι η επανάσταση.” —Doc Searls, 2002

Έχουν περάσει πάνω από ενάμιση χρόνο από τότε που η OpenAI παρουσίασε το ChatGPT σε ένα κοινό που ήταν κυρίως άγνωστο με την τεχνητή νοημοσύνη. Αρχικά, φαινόταν ότι δεν είχε προφανή σχέση με την έκδοση βιβλίων. Από τότε, όλα έχουν αλλάξει. Και τίποτα δεν έχει αλλάξει. Οι εκδότες αρχίζουν να εμβαθύνουν στα νέα εργαλεία AI, εξερευνώντας τα όρια και συμμετέχοντας σε διστακτικές συνομιλίες με το ChatGPT. Αλλά δεν υπάρχει ένδειξη μιας πραγματικής επανάστασης στην πρακτική της έκδοσης. Είναι απλά πολύ νωρίς.

Υπάρχει μια αφθονία αβεβαιότητας γύρω από την τεχνητή νοημοσύνη στη συγγραφή και την έκδοση. Μεγάλες αντιπαραθέσεις περιβάλλουν τη χρήση της τεχνητής νοημοσύνης. Ωστόσο, για πολλούς υπάρχει ενθουσιασμός για τις δυνατότητες.

Θα επικεντρωθώ εδώ περισσότερο στην υπόσχεση παρά στον κίνδυνο, αλλά περιλαμβάνω μια επισκόπηση των ανησυχιών και των κινδύνων που περιβάλλουν την τεχνητή νοημοσύνη, ιδιαίτερα καθώς αφορούν τους συγγραφείς και τους εκδότες. Δεν επιδιώκω να υποτιμήσω τις ανησυχίες. Απλώς δεν είναι αυτό το θέμα αυτού του βιβλίου.

Είναι βιβλίο;

Θεωρώ αυτή την έκδοση περισσότερο ως “βιβλιαράκι” παρά βιβλίο. Ο ορισμός της UNESCO για ένα βιβλίο είναι “τουλάχιστον 49 σελίδες” (γιατί όχι 50;), και, με 300 λέξεις ανά σελίδα, αυτό μπορεί να μην πληροί τις προϋποθέσεις. Αλλά, πιο σημαντικά, δεν προορίζεται να είναι η οριστική λέξη για οτιδήποτε—είναι περισσότερο μια αναφορά προόδου. Η τεχνητή νοημοσύνη και ο ρόλος της στην έκδοση βιβλίων αλλάζουν με ταχύτατο ρυθμό, που δεν δείχνει σημάδια επιβράδυνσης. Έτσι αυτό το βιβλίο(βιβλιαράκι), αυτή η αναφορά, είναι απλά ένα στιγμιότυπο.

Χρησιμοποιώντας την πλατφόρμα Leanpub, έχω δημοσιεύσει την έρευνα και την ανάλυσή μου ως ένα έργο σε εξέλιξη—αναθεωρείται ως ένα ζωντανό έγγραφο. Δεν το έχω επιχειρήσει ποτέ πριν. Οι λόγοι μου είναι διπλοί: να προσφέρω κάτι χρήσιμο βραχυπρόθεσμα και να έχω τη δυνατότητα να το αναθεωρώ όπως απαιτείται. Η ιστορία της τεχνητής νοημοσύνης απέχει πολύ από το τέλος της.

Ελπίζω η προσέγγισή μου να αποδειχθεί χρήσιμη για τους αναγνώστες, αν και γνωρίζω ότι πάρα πολλές ενημερώσεις θα μπορούσαν να γίνουν σύντομα ενοχλητικές. Έχω προσπαθήσει να μειώσω την επικαιρότητα αυτού του βιβλίου, για να μειώσω την εστίαση στα πράγματα που θα αλλάξουν ταχύτερα.

Η έκδοση που ήταν (αθόρυβα) διαθέσιμη από τον Απρίλιο του 2024 την είχα χαρακτηρίσει ως “75% ολοκληρωμένη” και προσφέρθηκε δωρεάν στους αναγνώστες. Η 23η Ιουλίου είναι η επίσημη ημερομηνία δημοσίευσης για την έκδοση “100% ολοκληρωμένη”, η οποία θα βρει επίσης τον δρόμο της σε ευρύτερη διανομή έξω από το Leanpub. Θα συνεχίσω να ενημερώνω την έκδοση 100%: αλλά αυτές οι ενημερώσεις θα είναι διαθέσιμες μόνο στους αγοραστές του Leanpub—είναι δύσχρηστο να ενημερώνω συνεχώς τα έντυπα, τα ebooks και τα audiobooks που είναι σε ευρύτερη διανομή.

Πόνος των εκδοτών με την ίδια την ΤΝ

Ακούω καθημερινά για τον πόνο που αντιμετωπίζουν οι άνθρωποι στον εκδοτικό κλάδο προσπαθώντας να κατανοήσουν την ΤΝ. Γιατί είναι τόσο επώδυνο; Εδώ είναι τρεις λόγοι που βλέπω:

Η τεχνολογία είναι περίπλοκη και μυστηριώδης, πολύ περίπλοκη για να την καταλάβουν οι μη επιστήμονες. (Υπάρχει μια συναρπαστική μελέτη που προτείνει μια “κλίμακα άγχους ΤΝ (AIAS)” που μετρά 21 διαφορετικούς λόγους για τους οποίους οι άνθρωποι αγχώνονται για την ΤΝ.)
Η ΤΝ έχει γίνει εξαιρετικά αμφιλεγόμενη στην εκδοτική βιομηχανία, κυρίως λόγω των ζητημάτων πνευματικών δικαιωμάτων που πλήττουν την καρδιά της συγγραφής και της έκδοσης.
Ωστόσο, υπάρχει επίσης μια ατμόσφαιρα FOMO—φόβος απώλειας ευκαιριών. Παρά τα πολλά ελαττώματα της ΤΝ, όπως συμβαίνει με πολλές δελεαστικές τεχνολογίες (το Apple watch; Έξυπνα ηχεία;), αντιμετωπίζουμε αυτό το διαρκές συναίσθημα: τι γίνεται αν χάνω το επόμενο πραγματικά μεγάλο πράγμα, όπως έκανα με μερικά από τα τελευταία πραγματικά μεγάλα πράγματα. Ένιωθα ανόητος τότε. Δεν θέλω να νιώσω ανόητος ξανά. Πονάει.

Εντάξει: Έχει νόημα ότι οι άνθρωποι στον εκδοτικό κλάδο αισθάνονται πόνο από την ΤΝ.

Τότε ποια είναι η περίπτωση χρήσης αυτού του βιβλίου;

Η περίπτωση χρήσης είναι ότι εργάζεστε στον εκδοτικό τομέα ή είστε συγγραφέας που προσπαθεί να κατανοήσει καλύτερα τον εκδοτικό τομέα και είστε κουρασμένοι να αισθάνεστε ανόητοι και συγχυσμένοι γύρω από την ΤΝ. Πάρα πολλοί από τους συναδέλφους σας φαίνεται να την κατανοούν καλύτερα από εσάς, και είστε κουρασμένοι να μην μπορείτε να συμμετάσχετε έξυπνα στη συζήτηση.

Ο στόχος μου για τους αναγνώστες είναι ότι, μέχρι το τέλος αυτού του βιβλίου, θα αισθάνονται ικανοί να συμμετάσχουν στη συζήτηση, να εκφράσουν μια ενημερωμένη γνώμη. Θέλω να αισθάνεστε εξοπλισμένοι να κάνετε προσωπικές επιλογές γύρω από την τεχνολογία και να έχετε έναν δρόμο για να μάθετε πώς να χρησιμοποιείτε την ΤΝ, εάν επιλέξετε να το κάνετε.

Δεν θέλω να πλημμυρίσω τους αναγνώστες με πολλή συζήτηση για τα θεμέλια της τεχνολογίας ΤΝ—δεν θα μιλήσω πολύ για την ΤΝ σε αφηρημένο επίπεδο. Αντίθετα, θέλω να σας δώσω μια βάση στην ΤΝ ειδικά για τη συγγραφική και εκδοτική βιομηχανία. Αν κάποιος σας ρωτήσει, τι σημαίνει πραγματικά η επεξεργασία φυσικής γλώσσας, μπορείτε να απαντήσετε, όπως κάνω εγώ: Δεν είμαι ειδικός στην ΤΝ. Αλλά ξέρω πώς χρησιμοποιείται η ΤΝ στον κλάδο μου.

Θα είναι ακριβώς αυτό που χρειάζεστε να ξέρετε;

Δεν μου αρέσει η φράση “αυτό που χρειάζεστε να ξέρετε” γιατί σπάνια ανταποκρίνεται στις προσδοκίες, συνήθως είτε λέει περισσότερα από όσα χρειάζεστε να ξέρετε, είτε πολύ λιγότερα. Θα το πετύχω; Είμαι σοβαρός στο να προσπαθώ να μεταφέρω το ελάχιστο. Νομίζω ότι ξέρω τι χρειάζονται να ξέρουν οι εκδότες για την Τεχνητή Νοημοσύνη, καθώς μιλάω με πολλούς από αυτούς, ενώ φιλοξενώ σεμινάρια και διαδικτυακά σεμινάρια που έχουν σχεδιαστεί πολύ συγκεκριμένα για να παρέχουν μόνο τα βασικά.

Αντί να επαναλαμβάνω συνεχώς τη φράση “αυτό που χρειάζεστε να ξέρετε”, θα χρησιμοποιήσω ένα λογότυπο κλειδιού με λίγο εσοχή κείμενο.

Μετά τις περιλήψεις που εισάγουν πολλές ενότητες, θα αναπτύξω τις κύριες έννοιες. Έχω επίσης διατηρήσει αυτές τις περιλήψεις όσο το δυνατόν πιο σύντομες, αν και, για να είμαι ειλικρινής, μερικές φορές επεκτείνομαι.

Μια σύντομη μορφή που θα χρησιμοποιήσω είναι “Συνομιλιακή ΤΝ”. Όταν η OpenAI κυκλοφόρησε για πρώτη φορά το ChatGPT, ήταν η μόνη επιλογή, αλλά τώρα υπάρχουν αρκετοί σημαντικοί ανταγωνιστές. Θα αναλύσω τα συγκεκριμένα σύντομα, αλλά έχετε ήδη ακούσει για μερικούς από αυτούς, προφανώς Google και Microsoft. Αυτοί (και αρκετές άλλες εταιρείες) προσφέρουν τώρα διαδικτυακό λογισμικό συνομιλίας ΤΝ παρόμοιο με το ChatGPT. Έτσι, αντί να λέω “ChatGPT και οι ανταγωνιστές του”, θα αναφέρομαι σε όλη την κατηγορία ως “Συνομιλιακή ΤΝ”. Αν γράψω “ChatGPT”, θα αναφέρομαι συγκεκριμένα στο λογισμικό της OpenAI.

Το βιβλίο είναι κυρίως πρακτικό, αλλά στο τελευταίο μέρος προτείνω ένα δοκίμιο για τις πιθανές συνέπειες της ΤΝ στη βιομηχανία έκδοσης βιβλίων, μαζί με μερικές άλλες υποθετικές σκέψεις.

Για ποιον είναι αυτό το βιβλίο;

Το κύριο κοινό αυτού του βιβλίου είναι οι εκδότες βιβλίων εμπορίου (καταναλωτές). Το δευτερεύον κοινό είναι όλοι οι άλλοι εκδότες βιβλίων (ακαδημαϊκοί, εκπαιδευτικοί…) στο βαθμό που υπάρχουν αλληλεπικαλύψεις σε αυτούς τους τομείς της βιομηχανίας. Το τρίτο κοινό μου είναι οι συγγραφείς που έχουν μερίδιο στο παιχνίδι, και οι πολλοί άλλοι που είναι γοητευμένοι από την έκδοση βιβλίων.

Ο υπότιτλος δηλώνει ότι αυτός είναι ένας οδηγός για την ΤΝ τόσο για συγγραφείς όσο και για εκδότες. Εν μέρει αυτό συμβαίνει γιατί θέλω οι εκδότες να καταλαβαίνουν επίσης τι κάνουν οι συγγραφείς με αυτήν την τεχνολογία. Νομίζω ότι αυτό είναι σημαντικό. Στην πρόσφατη ετήσια συνάντησή του, το BISG (το Book Industry Study Group), που εκπροσωπεί κυρίως τους εκδότες εμπορίου, υποδεικνύει ότι “επιδιώκει να αντλήσει από μια ευρύτερη δεξαμενή συμπεριλαμβανομένων, λογοτεχνικών πρακτόρων και συγγραφέων.” Αυτό είναι ένα καλοδεχούμενο βήμα.

Θέλω οι συγγραφείς να διαβάσουν αυτό το βιβλίο, γιατί μπορεί να τους βοηθήσει να κατανοήσουν τι κάνουν οι εκδότες με τα χειρόγραφά τους. Οι αυτοεκδιδόμενοι συγγραφείς πάντα κρατούν ένα μάτι στην παραδοσιακή έκδοση, εν μέρει επειδή είναι, de facto, εκδότες οι ίδιοι, και έτσι η τεχνολογία Τεχνητής Νοημοσύνης που ενδιαφέρει τους εκδότες μπορεί επίσης να τους ενδιαφέρει.

Αλλά, μην κάνετε λάθος, αυτό δεν είναι ένας πρακτικός οδηγός για τους συγγραφείς για το πώς να χρησιμοποιούν την Τεχνητή Νοημοσύνη για να γίνουν καλύτεροι και πιο παραγωγικοί συγγραφείς. Υπάρχουν πολλά βιβλία για αυτό το θέμα (δυστυχώς, πολλά από αυτά είναι απάτες στο Amazon). Και πολλά βίντεο στο YouTube (με ποικίλη ποιότητα).

Μέσα στον κόσμο της εμπορικής έκδοσης βιβλίων, ο ιδανικός αναγνώστης μου δεν είναι απαραίτητα ένα άτομο που παίρνει αποφάσεις, αλλά μάλλον ένας από τους πολλούς ανθρώπους που εργάζονται καθημερινά σε όλη τη βιομηχανία, δημιουργώντας βιβλία και βρίσκοντας αναγνώστες. Θα μιλήσω για όλες τις βασικές λειτουργίες των εκδόσεων σε αυτό το βιβλίο, από την επιμέλεια μέχρι τις πωλήσεις και τη διανομή. Και για τη διασταύρωση των συγγραφέων με τους αναγνώστες.

Αν και μεγάλωσα στον Καναδά και ξεκίνησα την καριέρα μου στις εκδόσεις εκεί, είμαι βασισμένος στο Σαν Φρανσίσκο, στις Ηνωμένες Πολιτείες, και έτσι σκέφτομαι προεπιλεγμένα για τη βιομηχανία εκδόσεων των Η.Π.Α. Αλλά σχεδόν όλα σε αυτό το βιβλίο θα πρέπει να είναι εξίσου σημαντικά για έναν εκδότη στη Μαδαγασκάρη όσο και για έναν εκδότη στο Μανχάταν. Ενώ οι εκδότες σε μικρότερες χώρες αντιμετωπίζουν προκλήσεις κλίμακας, το ίδιο συμβαίνει και με τους μικρούς εκδότες στην Αμερική, και αυτό το βιβλίο προορίζεται για εταιρείες όλων των μεγεθών.

Όταν μιλάω με μικρούς εκδότες για την Τεχνητή Νοημοσύνη, και όταν μιλάω με πολύ μεγάλους εκδότες για την Τεχνητή Νοημοσύνη, η μεγάλη διαφορά που παρατηρώ είναι η έννοια της ‘εκδοτικής επιχείρησης.’ Οι μεγαλύτεροι εκδότες είναι συχνά μέρος (ή δίπλα) σε δημόσιες εταιρείες, και όταν είσαι δημόσια εταιρεία, τα θέματα γύρω από τη φήμη και την ασφάλεια εμφανίζονται πολύ πιο έντονα από ό,τι για έναν καθημερινό εκδότη, που δεν είναι υπόλογος με τον ίδιο τρόπο στους μετόχους και τα μέσα μαζικής ενημέρωσης. Ενώ ένας επιμελητής σε έναν εκδότη της Big 5 έχει την ίδια χρήση για εργαλεία Τεχνητής Νοημοσύνης όπως και ένας ελεύθερος επιμελητής που εργάζεται για μικρότερες επιχειρήσεις, το πλαίσιο στο οποίο χρησιμοποιούν τα εργαλεία είναι αρκετά διαφορετικό.

Πόσα πρέπει να ξέρετε για την Τεχνητή Νοημοσύνη για να διαβάσετε αυτό το βιβλίο;

Υποθέτω ότι το κοινό μου έχει περίπου μηδενική γνώση για τα εσωτερικά της Τεχνητής Νοημοσύνης, αλλά ότι είναι έξυπνοι αναγνώστες. Έτσι, θα περπατήσω σε αυτή τη λεπτή γραμμή μεταξύ μηδενικής γνώσης και χωρίς να μιλάω υποτιμητικά στον αναγνώστη.

Φαντάζομαι ότι σχεδόν όλοι έχουν ακούσει για τη νέα γενιά της Τεχνητής Νοημοσύνης: μια δημοσκόπηση της YouGov, τον Μάρτιο του 2024, υποδηλώνει ότι μόνο το 7% των Αμερικανών δεν γνωρίζουν “τίποτα απολύτως” για την Τεχνητή Νοημοσύνη. Οι συγγραφείς και οι εκδότες έχουν σχεδόν σίγουρα ακούσει για ορισμένες από τις καταγγελίες για πνευματικά δικαιώματα, αλλά πιθανώς δεν κατανοούν τα ζητήματα. Έτσι, δεν χρειάζεται να εξηγήσω ότι η Τεχνητή Νοημοσύνη σημαίνει “Artificial Intelligence.” Αλλά δεν θα υποθέσω ότι οι αναγνώστες μπορούν να ορίσουν τι είναι η Τεχνητή Νοημοσύνη, τι σημαίνει, τον πιθανό της αντίκτυπο και ούτω καθεξής. Γι’ αυτό είστε εδώ.

Προσβασιμότητα, τόσο γενικά όσο και συγκεκριμένα

Το μάντρα μου για τη δημοσίευση αυτού του βιβλίου είναι ‘προσβασιμότητα.’

Για τους περισσότερους ανθρώπους, αυτό σημαίνει απλώς κάτι σαν ‘διαθεσιμότητα,’ και πράγματι, σκοπεύω να κάνω αυτό το βιβλίο διαθέσιμο σε όσες περισσότερες μορφές και φορμά μπορώ να σκεφτώ. Θέλω να διευρύνω το δοχείο. Προσπαθώ να κάνω το βιβλίο μου μια υποδειγματική δημοσίευση, επισημαίνοντας το πλήρες φάσμα αυτού που μπορεί να επιτευχθεί σήμερα όταν δημοσιεύεται ένα μόνο βιβλίο.

Στο Leanpub θα βρείτε το βιβλίο διαθέσιμο ως αρχείο PDF, αρχείο EPUB και ως δωρεάν διαδικτυακή δημοσίευση. Θα βρείτε μεταφράσεις σε 31 γλώσσες, συμπεριλαμβανομένων των μεγάλων ασιατικών και ευρωπαϊκών γλωσσών. Θα υπάρχουν πολλά ηχητικά βιβλία σε κύριες γλώσσες.

Θα κάνω επίσης το βιβλίο διαθέσιμο, σε έντυπη και ψηφιακή μορφή, σε όλες τις πλατφόρμες ηλεκτρονικού εμπορίου που μπορούν να προσπελαστούν μέσω του Ingram και του Amazon. Αυτό περιλαμβάνει τις περισσότερες από τις διαδικτυακές λιανικές τοποθεσίες βιβλίων, σε μεγάλο μέρος του κόσμου. Με αυτόν τον τρόπο, οι βιβλιοθήκες θα μπορούν επίσης να αγοράσουν το βιβλίο, αν και κατανοητά, έχουν λίγο χώρο διαθέσιμο για αυτοεκδόσεις. (Θα δωρίσω έντυπα και ψηφιακά αντίγραφα σε οποιαδήποτε βιβλιοθήκη στον κόσμο που τα ζητήσει.)

Εκτός από την δωρεάν διαδικτυακή έκδοση του πλήρους βιβλίου, θα δημιουργήσω δωρεάν αποσπάσματα, ένα Q&A και γραφήματα, για όσους θέλουν μόνο να γευτούν ή να δοκιμάσουν. Θα είναι διαθέσιμα μέσω του ιστολογίου μου.

Δεν έχει νόημα να καταγράψω ένα βίντεο ολόκληρου του βιβλίου, όταν είναι διαθέσιμα ηχητικά βιβλία. Αλλά μερικοί άνθρωποι προτιμούν να προσπελάσουν το περιεχόμενο μέσω βίντεο. Έτσι, θα προσφέρω συντομευμένες βιντεοεκδόσεις, σε πολλαπλά μήκη.

Και τι γίνεται με την ανθρώπινη επαφή; Θα είμαι επίσης διαθέσιμος μέσω διαδικτυακών σεμιναρίων ή προσωπικών διαδικτυακών διαβουλεύσεων, μέσω του ιστοτόπου και του ιστολογίου μου. Μπορώ ακόμη και να προσληφθώ να εμφανιστώ προσωπικά!

Η ‘προσβασιμότητα’ σημαίνει πολύ περισσότερα από τη λεξική της έννοια. Όπως λένε οι υπεύθυνοι του Canadian National Network for Equitable Library Service (NNELS) το θέτουν, “Ένα προσβάσιμο βιβλίο είναι αυτό που μπορεί να χρησιμοποιηθεί και να κατανοηθεί από όλους.” Και έτσι το αγγλικό αρχείο EPUB μου πληροί τη σύσταση W3C 1.1 για τα άτομα με αναπηρία ανάγνωσης, συμπεριλαμβανομένων των ισχυρών περιγραφών εναλλακτικού κειμένου για εικόνες. Αναμένουμε να πληρούμε αυτό το πρότυπο προσβασιμότητας και για τις μεταφράσεις στις ξένες γλώσσες.

Το εναλλακτικό κείμενο δημιουργήθηκε με το ChatGPT. Δεν επεξεργάστηκα την έκδοση του ChatGPT, ώστε οποιοσδήποτε διαβάζει το EPUB να δει πόσο καλό είναι και πού εξακολουθεί να υστερεί. Όπως μου θυμίζει ο συνάδελφός μου, Bill Kasdorf, το καλό εναλλακτικό κείμενο περιγράφει αυτό που ένας αναγνώστης με όραση αποκομίζει από μια εικόνα, όχι απλώς την εμφάνισή της.

Για τους εκδότες βιβλίων, η προσβασιμότητα δεν είναι πλέον επιλογή: είναι μια προεπιλεγμένη ρύθμιση.

(Έχω δύο mea culpas να μοιραστώ: Λόγω περιορισμών στις πλατφόρμες έκδοσης, το προεπιλεγμένο αρχείο PDF δυστυχώς δεν θα πληροί τις προδιαγραφές PDF/UA, ούτε θα μπορέσω να προσφέρω μια έκδοση μεγάλων γραμμάτων του βιβλίου σε ιστότοπους ηλεκτρονικού εμπορίου. Αλλά και τα δύο είναι διαθέσιμα κατόπιν αιτήματος.)

Κάποιες διοικητικές λεπτομέρειες

Όπως αναφέρθηκε, αυτό το βιβλίο είναι (σχετικά) σύντομο. Όταν αποκαλείς ένα σχετικά σύντομο κείμενο ‘βιβλίο’, διατρέχεις τον κίνδυνο οι αγοραστές να διαμαρτυρηθούν, “Νόμιζα ότι αγόρασα ένα βιβλίο, αλλά είναι μόνο 50 σελίδες!” Έχω κάνει ό,τι μπορώ για να καταστήσω σαφές στη σελίδα πωλήσεων ότι αυτό δεν είναι ένα πλήρες βιβλίο, αλλά αν απογοητευτείτε, να θυμάστε ότι το Leanpub προσφέρει εγγύηση επιστροφής χρημάτων 60 ημερών, και θα επεκτείνω ευχαρίστως αυτήν την προσφορά επιστροφής χρημάτων σε ‘για πάντα’. Θέλω οι αναγνώστες να είναι ευχαριστημένοι, όχι απογοητευμένοι. (Αν αγοράσατε το βιβλίο από άλλη πλατφόρμα, στείλτε μου email: θα σας στείλω μια επιταγή!)

Το βιβλίο είναι γεμάτο με υπερσυνδέσμους (αυτοί εμφανίζονται με διάφορους τρόπους σε διαφορετικές μορφές, αλλά συχνά ως υποσημειώσεις). Πάντα πίστευα στη σύνδεση με πρωτότυπες πηγές στο έργο μου, ώστε οι αναγνώστες να μπορούν να επαληθεύσουν τις μερικές φορές μεγαλοπρεπείς αξιώσεις μου. Αλλά γνωρίζω ότι οι υπερσύνδεσμοι και οι υποσημειώσεις μπορεί να αποσπούν την προσοχή, ιδιαίτερα αν χρησιμοποιείτε μια συσκευή ανάγνωσης ηλεκτρονικών βιβλίων. Ζητώ συγγνώμη γι’ αυτό. Η καλύτερη επιλογή είναι να αγνοήσετε τους συνδέσμους καθώς διαβάζετε και να επιστρέψετε σε αυτούς αν θέλετε να εμβαθύνετε σε ένα θέμα.

Δεν ξέρω σε ποια μορφή διαβάζετε (ή ακούτε) αυτή τη στιγμή. Ούτε σε ποια γλώσσα. Προσπάθησα να κάνω την “εργονομία” του βιβλίου όσο το δυνατόν πιο φιλική προς τον χρήστη, αλλά οι σύνδεσμοι και οι υποσημειώσεις δεν είναι πάντα βέλτιστοι από αυτή την άποψη.

Αυτό το βιβλίο έχει χορηγούς, κάτι που ξέρω ότι είναι ασυνήθιστο για ‘ένα βιβλίο.’ Εξηγώ πώς λειτουργεί η χορηγία στην ενότητα μου ‘αποκαλύψεις’ στο τέλος του κειμένου.

Γιατί AI τώρα;

Όταν μιλάω με εκδότες, ακούω για επείγουσες, άμεσες ανησυχίες. Και η Τεχνητή Νοημοσύνη (AI) συνήθως δεν είναι μία από αυτές.

Το αυξανόμενο κόστος κατασκευής εκτύπωσης έχει ενοχλήσει εδώ και αρκετά χρόνια, αν και τώρα φαίνεται να εξισορροπείται. Το αυξημένο κόστος διανομής είναι προκλητικό για όλους τους παίκτες. Αυτά οδηγούν σε πιέσεις τιμών - υπάρχουν ενδείξεις ότι οι αναγνώστες αρχίζουν να αντιδρούν στις τρέχουσες τιμές για τα νέα σκληρόδετα και τα εμπορικά βιβλία. Τα ταξινομώ αυτά ως «αναλογικά» προβλήματα - οι ψηφιακές τεχνολογίες δεν προσφέρουν πολλά για να τα αντιμετωπίσουν.

Στη συνέχεια, υπάρχουν τα ευρύτερα «υπαρξιακά» προβλήματα που προκαλούν αυξανόμενη ανησυχία, αλλά είναι ασαφή ζητήματα, χωρίς προφανείς λύσεις. Εδώ περιλαμβάνονται:

Η ανακάλυψη περιεχομένου και η αφοσίωση κοινού μέσω διαδικτυακών και κοινωνικών μέσων.
Αλλαγή συμπεριφοράς καταναλωτή και συνηθειών ανάγνωσης.
Ανταγωνισμός από άλλα ψηφιακά μέσα.

Πιστεύω ότι η AI θα μπορούσε να είναι εξαιρετικά χρήσιμη στους εκδότες σε αυτούς τους τομείς, αλλά οι μέθοδοι δεν είναι προφανείς και θα χρειαστούν χρόνο για να εφαρμοστούν. Θα το περιγράψω αυτό σε επόμενα κεφάλαια του βιβλίου.

AI: Ξεκινώντας

Πριν μπω στο βαρετό τεχνικό υπόβαθρο, σας προσκαλώ να μπείτε απευθείας στο διαδικτυακό λογισμικό. Τα κορυφαία εργαλεία είναι δωρεάν για να παίξετε μαζί τους. Υπάρχει το ChatGPT. Και το Claude.ai. Μπορείτε να δοκιμάσετε το Microsoft Copilot. Ή να δοκιμάσετε το Google’s Gemini.

Έτσι ξεκινούν οι περισσότεροι με την AI - στοιχηματίζω ότι έχετε ήδη δοκιμάσει ένα ή περισσότερα από αυτά τα παιχνίδια. Επίσης στοιχηματίζω ότι δεν τα έχετε δοκιμάσει για πολύ καιρό. Οι περισσότεροι άνθρωποι με τους οποίους μιλάω αφιερώνουν μόνο λίγα λεπτά. Δοκιμάζουν μερικές ερωτήσεις, λαμβάνουν κάποιες αρκετά προφανείς απαντήσεις και προχωρούν.

Λάθος προσέγγιση.

Συμφωνώ με τον Ethan Mollick, του οποίου τη δουλειά θα περιγράψω μερικές φορές σε αυτό το βιβλίο. Στο ιστολόγιό του και σε μια πρόσφατη συνέντευξη, ο Mollick μιλάει για τον «κανόνα των 10 ωρών»:

“Θέλω να δηλώσω ότι οι 10 ώρες είναι το ίδιο αυθαίρετες με τα 10.000 βήματα. Δηλαδή, δεν υπάρχει επιστημονική βάση για αυτό. Αυτή είναι μια παρατήρηση. Αλλά επίσης σε μετακινεί πέρα από το, ‘το κοίταξα αυτό για ένα βράδυ’, και σε μετακινεί προς το να το χρησιμοποιήσεις με σοβαρό τρόπο. Δεν ξέρω αν οι 10 ώρες είναι το πραγματικό όριο, αλλά φαίνεται να είναι κάπως μεταμορφωτικό. Το κλειδί είναι να το χρησιμοποιήσεις σε έναν τομέα όπου έχεις εξειδίκευση, ώστε να μπορείς να καταλάβεις σε τι είναι καλό ή κακό, και να μάθεις το σχήμα των δυνατοτήτων του.”

Ένας άλλος σχολιαστής, αναθεωρώντας το πρόσφατο βιβλίο του Mollick για την AI, επεσήμανε έναν εξίσου αληθινό ‘κανόνα του δέκα’: “Μια ώρα πειραματισμού με αυτά τα εργαλεία αξίζει όσο δέκα ώρες ανάγνωσης σχετικά με αυτά.”

Καταλαβαίνετε την ιδέα. Πρόκειται για πράξη, όχι σκέψη. Το βιβλίο μου είναι μια σκέψη. Πρέπει να λερώσετε τα χέρια σας.

AI: Μια Πολύ Σύντομη Ιστορία

Μέχρι πριν από μερικά χρόνια, ο μέσος άνθρωπος άκουγε για την AI ως μια αφηρημένη έννοια, είτε ως επιστημονική φαντασία είτε ως κάτι που μπορούσε να νικήσει έναν γκρανμέτρ στο σκάκι ή στο Go. Ξαφνικά η AI είναι παντού, δημιουργώντας την ψευδή εντύπωση ότι είναι καινούργια. Ακόμα και τα καινούργια πράγματα δεν είναι ακριβώς καινούργια. Αλλά αυτό είναι άσχετο. Η AI σήμαινε λίγα για την εκδοτική βιομηχανία πριν από το ChatGPT. Τώρα σημαίνει πολλά.

Η κατανόηση της περίπου 70χρονης ανάπτυξης της AI μπορεί να είναι ενδιαφέρουσα, αλλά δεν είναι καθόλου απαραίτητη για την εκτίμηση του τι συμβαίνει σήμερα.

Our World In Data κάνει καλή δουλειά στο να καταγράφει σύντομα την ιστορία—θα τους αφήσω να το κάνουν.

Η τρέχουσα γενιά AI αναπτύχθηκε κυρίως την τελευταία δεκαετία. Τότε, ξαφνικά, εμφανίστηκε το ChatGPT στις 30 Νοεμβρίου 2022. Δύο μήνες αργότερα είχε 100 εκατομμύρια μηνιαίους χρήστες, η ταχύτερη που οποιαδήποτε τεχνολογία έχει ποτέ εισέλθει στον καταναλωτικό χώρο (σε σύγκριση, το Facebook χρειάστηκε πάνω από δύο χρόνια για να φτάσει τα 100 εκατομμύρια χρήστες).

Γιατί η ταχεία υιοθέτηση; Πρώτον, είναι συναρπαστική και διασκεδαστική. Δεύτερον, είναι δωρεάν. Τρίτον, δεν χρειάζεται να αγοράσετε μια νέα συσκευή για να τη χρησιμοποιήσετε. Και τέταρτον, δεν χρειάζεται καμία εκπαίδευση για να αποκτήσετε πρόσβαση στο ChatGPT (ή τους ανταγωνιστές του Chat AI). Αλλά αυτοί οι ίδιοι παράγοντες ίσχυαν και για το Facebook, έτσι γιατί το ChatGPT;

Όπως σημείωσε διάσημα ο Arthur C. Clarke, “Κάθε επαρκώς προηγμένη τεχνολογία είναι αδιακρίτως από μαγεία.” Το Chat AI είναι μαγεία. Η εμπειρία του ‘μιλώντας’ σε καθημερινή γλώσσα με μια μηχανή… είναι μαγική. Η εμπειρία του να λες “Θέλω μια εικόνα ενός βιβλίου σε ένα μπαλόνι σε ένα σύννεφο κοντά στον ήλιο,” και, σε δευτερόλεπτα,

Ένα ανοιχτό βιβλίο με ένα αερόστατο που αναδύεται από τις σελίδες του, αιωρούμενο ανάμεσα στα σύννεφα.

… επίσης μαγικό. Οι εικόνες που παράγονται από GPT αρχίζουν να μοιάζουν σε στυλ, πολύχρωμες και φανταχτερές. Έτσι, έστειλα μια δεύτερη οδηγία “τώρα σε στυλ που μοιάζει με εικονογράφηση του 15ου αιώνα.” Και έτσι:

Μια καλλιτεχνική εικονογράφηση ενός αερόστατου με περίπλοκα σχέδια, που αιωρείται ανάμεσα στα σύννεφα με τον ήλιο στο υπόβαθρο.

Αν θέλω ένα βίντεο ενός βιβλίου σε αερόστατο σε ένα σύννεφο κοντά στον ήλιο, υπάρχουν πάνω από δώδεκα εργαλεία για να διαλέξω, και presto. Και ένα μουσικό soundtrack που συνοδεύει το βίντεο. Λοιπόν, πώς ακούγεται αυτό; Είναι σαν μαγεία.

Για τον φόβο του να φανώ υποτιμητικός για τις εξαιρετικές ικανότητες της Τεχνητής Νοημοσύνης κατατάσσοντάς την στην κατηγορία της ακατανόητης “μαγείας,” είναι διασκεδαστικό να μάθουμε ότι πολλοί από τους επιστήμονες που είναι υπεύθυνοι για την τρέχουσα γενιά της Τεχνητής Νοημοσύνης παραδέχονται ότι πραγματικά δεν καταλαβαίνουν ακριβώς πώς λειτουργεί. Όπως σημειώθηκε σε μια αναφορά σε ένα πρόσφατο τεύχος του MIT Technology Review, “παρά την τρομερή του επιτυχία, κανείς δεν ξέρει ακριβώς πώς—-ή γιατί—-λειτουργεί.” Συναρπαστικό, αλλά λίγο τρομακτικό.

Κατανόηση της Τεχνητής Νοημοσύνης και Κάποια Βασική Ορολογία

Η Τεχνητή Νοημοσύνη συνοδεύεται από πληθώρα τεχνολογίας και ορολογίας, πολλά από τα οποία είναι ακατανόητα σε όλους εκτός από τους επιστήμονες δεδομένων. Οι χρήστες του Chat AI δεν απαιτείται να έχουν βαθιά γνώση της ορολογίας της Τεχνητής Νοημοσύνης ούτε των τεχνικών εννοιών που εμπλέκονται. Η συνομιλιακή φύση του συστήματος επιτρέπει διαισθητικές αλληλεπιδράσεις χωρίς εξειδικευμένη γνώση του πώς λειτουργούν τα πράγματα. Η εστίαση στο τι μπορεί πραγματικά να κάνει το Chat AI είναι πιο σημαντική.

Κατά την προετοιμασία αυτού του βιβλίου, έχω παλέψει με το ποιο είναι το ‘υπεύθυνο’ πράγμα που πρέπει να κάνω ως συγγραφέας ενός βιβλίου για την Τεχνητή Νοημοσύνη. Η συμβατική προσέγγιση είναι να παρέχεται μια σύντομη εξήγηση της επιστήμης και μια ανασκόπηση των συχνά χρησιμοποιούμενων όρων.

Δεν θα το κάνω αυτό.

Θα προσφέρω εδώ μερικούς εξωτερικούς συνδέσμους σε αυτό που νομίζω ότι είναι μερικές λογικά κατανοητές σύντομες περιγραφές των βασικών στοιχείων της Τεχνητής Νοημοσύνης.

Ποιο είναι το μέλλον της Τεχνητής Νοημοσύνης;: Η McKinsey & Co. (Απρίλιος, 2024) έχει ένα καλό σετ εξηγητών.

Ομοίως, το Generative AI της Gartner (χωρίς ημερομηνία) δεν είναι κακό.

Το Futurepedia προσφέρει μια όχι κακή περίληψη των AI Fundamentals (Μάιος, 2024)

Αφού διέθεσα το πώς, τώρα θα παρουσιάσω μερικούς όρους που θεωρώ ότι είναι σημαντικό να κατανοήσουμε. Όχι επειδή πρέπει να τους γνωρίζετε για να χρησιμοποιήσετε το λογισμικό. Αλλά γιατί αυτό το σύνολο όρων αναφέρεται σε μερικές βασικές πτυχές του πώς λειτουργεί πραγματικά η τρέχουσα γενιά της Τεχνητής Νοημοσύνης.

Η χρήση μου για την αντιμετώπιση αυτών των όρων και εννοιών αφορά συγγραφείς και εκδότες που (i) θέλουν να εμβαθύνουν στο AI, για οποιονδήποτε λόγο, ή (ii) θέλουν να κατανοήσουν το πλαίσιο των τρεχουσών κριτικών της Τεχνητής Νοημοσύνης, ή (iii) θέλουν να συμβάλλουν στις στρατηγικές συζητήσεις για το πώς οι συνάδελφοί τους ή οι οργανισμοί τους θα πρέπει να προσεγγίσουν την Τεχνητή Νοημοσύνη.

Με άλλα λόγια, αυτό δεν είναι τι πρέπει να γνωρίζετε, αλλά, μάλλον, τι μπορεί να θέλετε να γνωρίζετε. Εδώ είναι, με μη αλφαβητική σειρά:

Προτροπές και Προτροπή

Μπορείτε να ανοίξετε το λογισμικό Chat AI και απλώς να πληκτρολογήσετε μια ερώτηση, πολύ όπως κάνετε αυτή τη στιγμή στο Google.

Μεγάλο Γλωσσικό Μοντέλο (LLM)

Τα Μεγάλα Γλωσσικά Μοντέλα λειτουργούν αναλύοντας τεράστιες ποσότητες (κυρίως) γραπτού υλικού, επιτρέποντάς τους να προβλέπουν ποιες λέξεις ή προτάσεις πρέπει να ακολουθήσουν σε μια συνομιλία ή ένα κομμάτι γραφής. Δεν ‘κατανοούν’ τη γλώσσα με την ανθρώπινη έννοια, αλλά επεξεργάζονται το κείμενο διασπώντας το σε μικρότερα κομμάτια (που ονομάζονται δείκτες), και στη συνέχεια μετατρέπουν τους δείκτες σε αριθμούς. Επεξεργάζονται το κείμενο ως αριθμούς, αναπαράγοντας περισσότερους αριθμούς, οι οποίοι στη συνέχεια μετατρέπονται ξανά σε κείμενο στην έξοδο. Αυτή είναι μια υπερβολικά απλοποιημένη εξήγηση του γιατί το Chat AI δεν ‘περιέχει’ έργα με πνευματικά δικαιώματα: είναι κατασκευασμένο με αριθμούς που αντιπροσωπεύουν μια τεράστια αφαίρεση από τα υποκείμενα κείμενα.

Τα LLM εκπαιδεύονται στο πώς χρησιμοποιείται συνήθως η γλώσσα και στη συνέχεια δημιουργούν απαντήσεις βάσει αυτής της κατανόησης. Τείνουμε να υποτιμούμε πόσο προβλέψιμη είναι η περισσότερη γλώσσα. Το Chat AI μπορεί να δημιουργήσει κείμενο που είναι (μερικές φορές σοκαριστικά) παρόμοιο με την υπάρχουσα λογοτεχνία, αλλά, από το σχεδιασμό, δεν έχει τη δυνατότητα να ανακτήσει συγκεκριμένα αποσπάσματα ή αντίγραφα κειμένων με πνευματικά δικαιώματα. (Ξέρω, πολλοί από εσάς έχετε ακούσει για την αγωγή των New York Times κατά της OpenAI—οι Times κατάφεραν να κάνουν το ChatGPT να αναπαράγει κάποια τμήματα προηγουμένως δημοσιευμένων άρθρων αυτολεξεί.

Γεννητική Τεχνητή Νοημοσύνη

Το πιο σημαντικό για να κατανοήσουμε αυτόν τον όρο είναι το μέρος “γεννητική”. Η γεννητική Τεχνητή Νοημοσύνη δημιουργεί νέο κείμενο.

Γεννητικός Προ-εκπαιδευμένος Μετασχηματιστής (GPT)

Αυτός, ο πιο τεχνικός από την ορολογία εδώ, περιγράφει έναν συγκεκριμένο τύπο LLM που αναπτύχθηκε από την OpenAI. Το “γεννητικός” υποδηλώνει την ικανότητά του να δημιουργεί κείμενο, το “προ-εκπαιδευμένος” σημαίνει ότι έχει εκπαιδευτεί σε ένα μεγάλο σώμα δεδομένων κειμένου, και το “μετασχηματιστής” αναφέρεται στο λογισμικό που χρησιμοποιεί. Το να γνωρίζουμε τι σημαίνει το GPT είναι χρήσιμο μόνο για να κατανοήσουμε τι αντιπροσωπεύει το GPT στο ChatGPT.

ChatGPT

Το ChatGPT είναι το λογισμικό που βλέπετε. Το GPT είναι αυτό που κρύβεται πίσω από το λογισμικό. Οι χρήστες βιώνουν το ChatGPT, όχι το GPT πίσω από αυτό. Όπως αναφέρθηκε παραπάνω, το ChatGPT είναι απλώς ένα από τα διάφορα συστήματα Chat AI online, με παρόμοια λειτουργικότητα.

Ένας ακόμη όρος που θα συναντήσετε συχνά και είναι άγνωστος σε πολλούς είναι:

Σώμα Κειμένων

Ο ορισμός του λεξικού για το σώμα κειμένων είναι “μια συλλογή γραπτών κειμένων” (αν και, στην πραγματικότητα, δεν είναι πάντα κείμενο). Ο όρος χρησιμοποιείται σε αναφορά με το τι εκπαιδεύονται τα GPT: τεράστια σώματα (κυρίως) κειμένου. Μας λένε ότι τα μεγαλύτερα σώματα περιέχουν εκατοντάδες δισεκατομμύρια λέξεις. Για τους κοινούς θνητούς αυτό είναι αδύνατο να κατανοηθεί. Δεν θεωρείτε τη Wikipedia ως τεράστια, περιέχοντας έναν τεράστιο αριθμό λέξεων; Λοιπόν, υπάρχουν μόλις 4,5 δισεκατομμύρια λέξεις στη Wikipedia—το GPT-4 εκπαιδεύτηκε σε καλά πάνω από ένα τρισεκατομμύριο.

Νομίζω ότι είναι σημαντικό να σκεφτούμε αυτή την κλίμακα. Οι συγγραφείς, κατανοητά, ανησυχούν ότι οι 75,000 λέξεις, περισσότερο ή λιγότερο, στο βιβλίο τους μπορεί να έχουν απορροφηθεί σε ένα μεγάλο γλωσσικό μοντέλο. Ίσως έχουν (περισσότερα παρακάτω). Αλλά υποθέτοντας ότι αυτό ισχύει, σκεφτείτε πόσο λίγη αξία έχει οποιοδήποτε βιβλίο για τη συνολική ισχύ των σημερινών μεγάλων γλωσσικών μοντέλων. Είναι πραγματικά ασήμαντο. Πέρα από ασήμαντο. Ακόμα και 10,000 βιβλία είναι ψίχουλα.

Λογισμικό AI: Οι Μεγάλοι Παίκτες του Συστήματος

Ανέφερα παραπάνω τους τέσσερις μεγάλους παίκτες του Chat AI: ChatGPT, Claude.ai, Microsoft Copilot και Google Gemini.

Λειτουργούν σχεδόν το ίδιο και παρέχουν παρόμοια αποτελέσματα. Ποιο είναι το καλύτερο; Αυτή η ερώτηση σας οδηγεί σε έναν λαβύρινθο. Είναι λίγο σαν να ρωτάτε ποια πόλη προσφέρει τις καλύτερες παραλίες ή ποιο SUV είναι το καλύτερο για οικογένειες. Υπάρχει τεράστια λεπτομέρεια στα ζητήματα και μεγάλη περηφάνια και προκατάληψη που φιλτράρει τις απαντήσεις μας.

Έτσι συμβαίνει και με αυτό το φαινομενικά απλό αλλά εξαιρετικά πολύπλοκο λογισμικό. Οι άνθρωποι υποστηρίζουν ότι ο Claude έχει πιο λεπτές δεξιότητες στη γλώσσα, ενώ το ChatGPT είναι καλύτερο με τον κώδικα λογισμικού. Το Microsoft Copilot ενσωματώνεται με τη σουίτα λογισμικού της Microsoft. Το Google Gemini μπορεί να συνδεθεί με το Gmail, το Google Maps και το YouTube. Μερικές από τις διαφορές είναι σημαντικές· πολλές είναι ελαφρές. Και αλλάζουν συνεχώς με κάθε νέα έκδοση λογισμικού.

‘Το καλύτερο’ λογισμικό δεν θα καθοριστεί για κάποιο χρονικό διάστημα ακόμα. Αν πειραματιστείτε με αρκετά από τα διαθέσιμα εργαλεία, θα καταλήξετε σε μερικά αγαπημένα.

Υπάρχουν δύο κορυφαίες κατηγορίες λογισμικού AI. Η πρώτη είναι αυτό που θα μπορούσε να ονομαστεί βασικό λογισμικό, λογισμικό όπως το ChatGPT και οι ανταγωνιστές του (Chat AI). Έτσι βιώνει η πλειονότητα των ανθρώπων την AI σήμερα.

Η επόμενη κατηγορία είναι όλο το άλλο λογισμικό που παρέχει ουσιαστικά ένα παράθυρο στο βασικό λογισμικό. Οι νεοεισερχόμενοι στην AI συνομιλία πιθανώς δεν έχουν συναντήσει αυτό το λογισμικό, αν και δεν είναι σπάνιο ή άγνωστο. Μερικοί είναι εξοικειωμένοι με το Jasper (λογισμικό μάρκετινγκ) ή το Perplexity (αναζήτηση). Αυτό το λογισμικό απλά δεν θα υπήρχε χωρίς το ChatGPT και τους συγγενείς του.

Λάβετε υπόψη ότι το κύριο λογισμικό από την Adobe, τη Microsoft, το Grammarly, το Zoom, κλπ., τώρα ενσωματώνει εργαλεία AI, αλλά αυτό είναι διαφορετικό από λογισμικό που έχει κατασκευαστεί από την αρχή με βάση τις διεπαφές chatbot. (Άλλα όπως το Otter (μεταγραφές) προϋπήρχαν του ChatGPT αλλά τώρα έχουν ενσωματώσει τεχνολογία μεγάλων γλωσσικών μοντέλων.)

Παρακάτω θα δούμε λογισμικό που είναι ειδικά για εκδόσεις και εκμεταλλεύεται τις δυνατότητες της δημιουργικής AI.

Παραδείγματα Λογισμικού

Παλαιότερα, το λογισμικό ήταν κώδικας και μόνο οι μηχανικοί καταλάβαιναν πώς λειτουργούσε. Αυτό που έκανε τους προσωπικούς υπολογιστές να επιτύχουν, πέρα από το σχετικά χαμηλό κόστος τους, ήταν το λογισμικό που ήταν (σχετικά) εύκολο στη χρήση. Δεν σκεφτόμαστε πολύ όλα αυτά· απλά μας περιβάλλουν.

Αλλά σκεφτείτε, για μια στιγμή, το Microsoft Word, ένα πρόγραμμα που μπορώ να υποθέσω με ασφάλεια ότι χρησιμοποιείται από το 99% των αναγνωστών αυτού του βιβλίου. Χρειάζονται περίπου 10 λεπτά για να δείξεις σε κάποιον πώς να γράψει μια παράγραφο κειμένου στο Word. Στη συνέχεια μπορείς να του δείξεις πώς να δημιουργήσει έντονο κείμενο και πλάγια γραφή, και πώς να αλλάξει τη βασική γραμματοσειρά, ίσως από Calibri σε Arial ή Times Roman. Μετά, πώς να αποθηκεύσει το αρχείο και να εκτυπώσει το αρχείο. Πώς να ψάξει και να αντικαταστήσει.

Και μετά τους αφήνεις μόνους τους.

Χρόνια αργότερα ανακαλύπτεις ότι εξακολουθούν να μορφοποιούν τις παραγράφους του Word τους με κενά και καρτέλες. Και εξακολουθούν να ξεχνούν να αποθηκεύουν τα αρχεία τους, ή να μπερδεύονται για το ποια έκδοση αποθήκευσαν, μερικές φορές αναγκάζονται να ξαναδημιουργήσουν το κείμενο από την αρχή. Αλλά “ξέρουν πώς να χρησιμοποιούν το Word.”

Το Word έχει εκατοντάδες λειτουργίες, αλλά το ένα τρίτο του χρόνου οι χρήστες χρησιμοποιούν μόνο 5 εντολές: Επικόλληση, Αποθήκευση, Αντιγραφή, Αναίρεση και Έντονα. Χρειάζονται αρκετές εβδομάδες εκπαίδευσης για να μάθουμε σωστά τις προχωρημένες δυνατότητες του Word· δυνατότητες που θα μπορούσαν να βοηθήσουν έναν εκδότη να εξοικονομήσει εκατοντάδες ώρες χρόνου. Αλλά οι περισσότεροι δεν το κάνουν ποτέ. Χρησιμοποιώ το Word από το 1985, σχεδόν σαράντα χρόνια, και δεν έχω παρακολουθήσει ποτέ μαθήματα. Δεν ξέρω καν τι δεν ξέρω σχετικά με το πώς να εξάγω την πλήρη ισχύ από το λογισμικό.

Αναφέρομαι σε αυτό επειδή είναι ένας χρήσιμος τρόπος για να καταλάβετε γιατί το λογισμικό AI είναι τόσο διαφορετικό από οποιοδήποτε λογισμικό έχετε χρησιμοποιήσει ποτέ. Δεν έρχεται με εγχειρίδιο, ούτε καν με οδηγό γρήγορης εκκίνησης. Έρχεται με μια κενή οθόνη και μια ερώτηση: “Πώς μπορώ να σας βοηθήσω.”

Ένα μήνυμα καλωσορίσματος σε μια συνομιλιακή διεπαφή AI που απευθύνεται στον Thaddeus, ρωτώντας πώς μπορεί να βοηθήσει.

Δεν υπάρχει γραμμή μενού, κανένα κουμπί να πατήσετε, καμία συντόμευση πληκτρολογίου. Κάνετε μια ερώτηση, ξεκινάτε μια συνομιλία και λαμβάνετε κάποιες απαντήσεις.

Μια συνομιλιακή διεπαφή AI με μια εισαγωγή χρήστη που ρωτά πώς να εξηγήσει τη διαφορά μεταξύ της νέας γενιάς συνομιλιακής AI και παραδοσιακών εργαλείων όπως το Microsoft Word ή το Excel.

Η απάντηση του Claude:

“Υπάρχουν αρκετές βασικές διαφορές μεταξύ της εργασίας με σύγχρονη συνομιλιακή AI όπως εμένα σε σύγκριση με τα παραδοσιακά εργαλεία όπως το Microsoft Word ή το Excel:

“1. Αλληλεπίδραση σε φυσική γλώσσα: Με τη συνομιλιακή AI, μπορείτε να επικοινωνήσετε την πρόθεσή σας χρησιμοποιώντας καθημερινή γλώσσα αντί να μάθετε και να περιηγηθείτε σε περίπλοκα μενού και λειτουργίες. Απλά εξηγείτε τι θέλετε να επιτύχετε συνομιλιακά.

“2. Συμφραζόμενη κατανόηση: Οι βοηθοί AI διατηρούν το συμφραζόμενο και κατανοούν τη ροή της συνομιλίας, επιτρέποντας μια πιο φυσική διάλογο. Το παραδοσιακό λογισμικό δεν έχει συμφραζόμενη συνείδηση από τη μία εντολή στην άλλη.

“3. Προσαρμοστικότητα: Η AI μπορεί να προσαρμόζεται δυναμικά και να ανταποκρίνεται σε μια μεγάλη ποικιλία αιτημάτων, ενώ τα παραδοσιακά εργαλεία περιορίζονται σε ένα προκαθορισμένο σύνολο λειτουργιών. Ένας βοηθός AI μπορεί να βοηθήσει με τη συγγραφή, την ανάλυση, τα μαθηματικά, τον προγραμματισμό, την ιδεοποίηση και πολλά άλλα μέσα από μια ενιαία διεπαφή.”

Αυτό ήταν χρήσιμο, αλλά ήθελα κάτι πιο εύκολο να κατανοήσω. Έτσι ρώτησα:

Ένα ερώτημα χρήστη σε μια συνομιλιακή διεπαφή AI που ζητά μια απλή εξήγηση για ένα μη τεχνικό κοινό.

Claude:

“Να ένας απλός τρόπος να εξηγήσουμε τη διαφορά σε κάποιον χωρίς τεχνικό υπόβαθρο:

“Σκεφτείτε το παραδοσιακό λογισμικό όπως το Microsoft Word ή το Excel σαν ένα εργαλείο, όπως ένα σφυρί ή μια αριθμομηχανή. Έχει ένα σταθερό σύνολο λειτουργιών που μπορεί να εκτελέσει, και πρέπει να μάθετε πώς να το χρησιμοποιήσετε σωστά για να επιτύχετε το αποτέλεσμα που θέλετε.

“Από την άλλη πλευρά, σκεφτείτε τη σύγχρονη συνομιλιακή τεχνητή νοημοσύνη σαν έναν έξυπνο βοηθό, όπως ένας γνώστης συνάδελφος ή φίλος. Μπορείτε απλά να του μιλήσετε χρησιμοποιώντας απλά ελληνικά, και αυτό καταλαβαίνει τι προσπαθείτε να κάνετε. Μπορεί να σας βοηθήσει με κάθε είδους εργασίες, από τη συγγραφή μέχρι τα μαθηματικά και την παραγωγή ιδεών.

“Δεν χρειάζεται να μάθετε ειδικές εντολές ή τεχνικές—απλώς συζητήστε μαζί του φυσικά. Προσαρμόζεται στις ανάγκες σας και θυμάται το πλαίσιο της συνομιλίας σας. Με την πάροδο του χρόνου, μαθαίνει να σας γνωρίζει και να ξέρει τις προτιμήσεις σας.

“Έτσι, ενώ το παραδοσιακό λογισμικό είναι σαν ένα στατικό εργαλείο που χρησιμοποιείτε, η συνομιλιακή τεχνητή νοημοσύνη είναι περισσότερο σαν έναν έξυπνο συνεργάτη με τον οποίο αλληλεπιδράτε φυσικά για να ολοκληρώσετε τις εργασίες σας. Είναι ένας πιο ευέλικτος, εξατομικευμένος και αποτελεσματικός τρόπος εργασίας.”

Χμμ. Όχι ακριβώς αυτό που ήθελα. Έτσι συνέχισα τη συνομιλία:

Μια απάντηση συνομιλιακής AI που προτείνει να αποφευχθεί η τεχνική ορολογία και οι αναφορές που μπορεί να μην σχετίζονται με μη τεχνικούς ανθρώπους.

Claude:

“Βέβαια, ας προσπαθήσω ξανά χωρίς να χρησιμοποιήσω τεχνικούς όρους:

“Φανταστείτε ότι μιλάτε σε έναν φίλο που είναι πραγματικά γνώστης και πρόθυμος να σας βοηθήσει. Μπορείτε απλά να του μιλήσετε στα ελληνικά για αυτό που προσπαθείτε να κάνετε, είτε πρόκειται για τη συγγραφή μιας έκθεσης, την επίλυση ενός μαθηματικού προβλήματος ή την παραγωγή ιδεών για ένα έργο.

“Αντί να πρέπει να μάθετε και να θυμάστε μια σειρά από συγκεκριμένα βήματα ή εντολές, μπορείτε απλά να εξηγήσετε τι χρειάζεστε με τα δικά σας λόγια. Ο φίλος σας καταλαβαίνει το πλαίσιο και προσαρμόζει τη βοήθειά του βάσει αυτών που έχετε ήδη συζητήσει.

“Είναι μια διαδραστική συνομιλία, όπου μπορείτε να κάνετε ερωτήσεις, να διευκρινίζετε πράγματα και να λαμβάνετε συμβουλές. Και όσο περισσότερο μιλάτε με αυτόν τον φίλο, τόσο καλύτερα καταλαβαίνει τις μοναδικές σας ανάγκες και τον τρόπο επικοινωνίας σας.

“Τώρα, φανταστείτε αν μπορούσατε να έχετε τον ίδιο τύπο βοηθητικής, εύκολης αλληλεπίδρασης, αλλά με ένα πρόγραμμα υπολογιστή. Αυτή είναι η βασική ιδέα πίσω από τους νέους τύπους λογισμικού που ίσως ακούτε.

“Αντί για το παλιό στυλ λογισμικού, όπου έχετε ένα άκαμπτο σύνολο λειτουργιών και πρέπει να μάθετε τον σωστό τρόπο χρήσης του, αυτό το νέο λογισμικό είναι περισσότερο σαν ένας γνώστης φίλος. Μπορείτε απλά να του μιλήσετε συνομιλητικά και αυτό καταλαβαίνει πώς να σας βοηθήσει με βάση τη φυσική ροή της συζήτησής σας.

“Έτσι, είναι ένας πιο έξυπνος, πιο εξατομικευμένος και πιο εύκολος τρόπος να λάβετε βοήθεια για διάφορες εργασίες στον υπολογιστή σας, απλά μιλώντας του όπως θα μιλούσατε σε ένα άτομο. Αυτή είναι η κύρια διαφορά από το παλιότερο, πιο άκαμπτο στυλ λογισμικού.”

Περίληψη: Προσπαθούσα να κάνω δύο πράγματα με αυτά τα παραδείγματα. Το ένα ήταν να προσφέρω ένα απλό παράδειγμα για το πόσο διαφορετικό είναι το λογισμικό chatbot από οποιοδήποτε λογισμικό έχουμε χρησιμοποιήσει ποτέ. Και το άλλο ήταν να δείξω πώς μια απλή συνομιλία μπορεί να εξελιχθεί. Δεν είναι μόνο μια ερώτηση και μια απάντηση. Είναι μια συζήτηση. Αυτό είναι ένα μεγάλο μέρος της καινοτομίας.

Τα Chat AI είναι κάποιο είδος συνδυασμού πρακτικής και γνώστη συμβούλου. Δεν μπορείτε να υποθέσετε ότι γνωρίζουν τι εννοείτε. Πρέπει να εξηγήσετε τι θέλετε, γιατί το θέλετε και πώς μπορούν να είναι πιο χρήσιμα.

Τρεις τύποι λογισμικού AI

Χρησιμοποιώντας ευρείες γραμμές, υπάρχουν τρεις τύποι λογισμικού AI διαθέσιμοι σήμερα. Ο πρώτος είναι οι βασικές πλατφόρμες AI, όπως το ChatGPT, η βασική τεχνολογία AI. Ο δεύτερος είναι, ας το πούμε, πρόσθετα AI, λογισμικό που έχει χτιστεί πρόσφατα πάνω στις βασικές πλατφόρμες. Δεν θα έχετε ακούσει για πολλά από αυτά, εργαλεία όπως το Jasper ή το Rewind.

Η τρίτη μου κατηγορία είναι λογισμικό που διαθέτει εργαλεία AI προσαρτημένα στο υπάρχον προϊόν. Για παράδειγμα, η σουίτα λογισμικού της Microsoft διαθέτει νέα εργαλεία AI στο Word, Excel και PowerPoint. Η Adobe έχει προσθέσει τεχνολογία AI στο Photoshop και στο Acrobat. Το Grammarly αναδιαμορφώνεται γύρω από τη νέα γενιά τεχνολογίας LLM. Είναι κυρίως το ίδιο προϊόν, αλλά με προσθήκη AI.

Γίνεται σαφές ότι σχεδόν όλο το λογισμικό που χρησιμοποιείτε σήμερα θα ενσωματώσει σύντομα χαρακτηριστικά AI. Θα πρέπει να κάνετε τη δική σας αξιολόγηση για το αν αυτά τα εργαλεία είναι πραγματικά χρήσιμα ή απλά φανταχτερά χαρακτηριστικά AI.

Περισσότερο με ενδιαφέρουν τα νέα εργαλεία, χτισμένα από την αρχή για να παρέχουν την αξία που μόνο η AI μπορεί να προσφέρει. Αυτή είναι η επόμενη γενιά λογισμικού.

Εργασία με Λογισμικό Τεχνητής Νοημοσύνης

Είμαι ένας άνθρωπος των Windows, δυστυχώς (είναι μια μακρά ιστορία το γιατί), και έτσι μιλάω για τις εμπειρίες μου στην πρόσβαση σε λογισμικό ΤΝ μέσω ενός υπολογιστή με Windows, όχι Mac. Επειδή όλο το λογισμικό εδώ είναι βασισμένο σε περιηγητή, δεν θα έπρεπε να υπάρχει διαφορά στη χρήση αυτών των εργαλείων σε Mac. Αλλά δεν προσφέρω καμία εγγύηση.

Θα χρειαστείτε κάποια χρήματα για να παίξετε το παιχνίδι της ΤΝ, αλλά όχι πάρα πολλά. Όπως περιγράφηκε παραπάνω, μεγάλο μέρος του βασικού λογισμικού μπορεί να προσπελαστεί μέσω δωρεάν εκδόσεων. Αλλά συνήθως θα θέλετε μια πληρωμένη συνδρομή ενώ το δοκιμάζετε, και η συνδρομή θα πρέπει να είναι περίπου 20$/μήνα. Ακυρώστε μετά την δοκιμή (μην το ξεχάσετε!). Αν δείτε κάτι που κοστίζει 79$/μήνα ή, Θεός φυλάξοι, 159$/μήνα, μπορείτε να το αγνοήσετε. Δεν σας θεωρούν ως πιθανό χρήστη· σκέφτονται μεγάλους κύριους εταιρικούς χρήστες.

Εκπαίδευση για το Chat AI

Η σημερινή ΤΝ είναι απατηλά απλή. Οποιοσδήποτε μπορεί να πληκτρολογήσει μια ερώτηση μπορεί να τη χρησιμοποιήσει. Αλλά η καλή χρήση της είναι περίπλοκη, κάτι που δεν βγάζει νόημα μέχρι να βυθιστείτε στις πολυπλοκότητες γύρω από τις “εντολές” και τις σχετικές έννοιες.

Για να αποκτήσετε πρόσβαση στην ευφυΐα της μερικές φορές πρέπει να μιλήσετε μαζί της σαν να ήταν ηλίθια. Ή ίσως σαν ένας ιδιοφυής ηλίθιος. Είναι λίγο σαν ο χαρακτήρας που υποδύεται ο Dustin Hoffman στο Rain Man.

Οποιοσδήποτε μπορεί να χρησιμοποιήσει το ChatGPT. Απλά πηγαίνετε στο chat.openai.com και μπορείτε να αποκτήσετε πρόσβαση στην πιο πρόσφατη έκδοση, GPT-4 δωρεάν (υπάρχουν μερικά επιπλέον χαρακτηριστικά διαθέσιμα για επιπλέον 20$/μήνα).

Όταν πηγαίνετε στο ChatGPT, βρίσκετε ουσιαστικά μια άδεια οθόνη και την έμμεση ερώτηση “Πώς μπορώ να σας βοηθήσω σήμερα;”

Μπορείτε να του κάνετε ερωτήσεις. Ακόμα καλύτερα, μπορείτε να ανεβάσετε ένα μεγάλο PDF και να κάνετε ερωτήσεις σχετικά με το αρχείο. Μπορείτε επίσης να ανεβάσετε εικόνες, τις οποίες μπορεί να περιγράψει, ή μια σκαναρισμένη σελίδα: μπορεί να αναγνωρίσει το κείμενο, ακόμα και αν είναι γραμμένο με το χέρι.

Αυτό που έχει προκύψει ως κρίσιμο ζήτημα για την επιτυχή χρήση της Chat ΤΝ είναι η εκμάθηση του πώς να “μιλάτε” μαζί της (κάτι που μπορείτε να κάνετε κυριολεκτικά στην τελευταία έκδοση της κινητής εφαρμογής). Στην γλώσσα της Chat ΤΝ αυτό ονομάζεται δημιουργία “εντολών” ή “προτροπών”. Οι χρήστες έχουν ανακαλύψει ότι όσο πιο ακριβείς και λεπτομερείς είναι οι εντολές τους, τόσο καλύτερες είναι οι απαντήσεις που λαμβάνουν από το ChatGPT. Επιπλέον, οι εντολές δεν είναι απλώς μια μοναδική προσπάθεια. Η Chat ΤΝ μπορεί να συνεχίσει μια συνομιλία για αρκετό καιρό (αν και όχι επ’ αόριστον), και αν δεν λάβετε την απάντηση που ψάχνετε, μπορείτε να αναθεωρήσετε και να βελτιώσετε τις εντολές σας. Αυτό απαιτεί πολύ χρόνο για να το συνηθίσετε και έχει δημιουργήσει μια σειρά από οδηγοί, γραπτούς και διαδικτυακούς, για να εκπαιδεύσουν τους χρήστες στο πώς να αξιοποιούν στο έπακρο τις εντολές.

Προσπαθήστε να ζητήσετε από οποιοδήποτε λογισμικό Συνομιλητικής Τεχνητής Νοημοσύνης να εξηγήσει μια έννοια όπως η εξελικτική επιμέλεια. Στη συνέχεια, ζητήστε του να δημιουργήσει μια εξήγηση που να μπορεί να κατανοήσει ένα παιδί 12 ετών. Τα αποτελέσματα είναι δραματικά διαφορετικά. Το διασκεδαστικό είναι ότι η Συνομιλητική Τεχνητή Νοημοσύνη φαίνεται επίσης να ανταποκρίνεται σε συναισθηματικές εκκλήσεις. Προσθέτοντας “αυτό είναι πολύ σημαντικό για την καριέρα μου” σε μια προτροπή μπορεί να εκμαιεύσει πιο χρήσιμες απαντήσεις.

(Αυτή είναι μια καλή στιγμή για να προσθέσουμε ένα παρενθετικό: Είναι τόσο καθησυχαστικό όσο και βαθιά ανησυχητικό ότι οι κορυφαίοι επιστήμονες που εργάζονται στη γλωσσική τεχνητή νοημοσύνη δεν μπορούν να εξηγήσουν γιατί συμβαίνουν τέτοια πράγματα.)

Πώς να κάνετε υποβολές

“Η υποβολή” είναι μια συγκεκριμένη δεξιότητα που είναι απαραίτητη για την αποτελεσματική χρήση της Συνομιλητικής Τεχνητής Νοημοσύνης.

Από την ποικιλία των όρων που υιοθετήθηκαν κατά τη διάρκεια της χρυσής εποχής της τεχνητής νοημοσύνης, “υποβολές” και “υποβολή” είναι από τους καλύτερους. Δεν “μιλάτε” πραγματικά με μια Συνομιλητική Τεχνητή Νοημοσύνη. Δεν “κάνετε” ερωτήσεις (ή, δεν θα έπρεπε - δεν λειτουργεί έτσι). Υποβάλλετε αυτές τις μηχανές για απαντήσεις, όχι για απλές απαντήσεις.

Αρχικά σκέφτηκα ότι μια αναλογία θα μπορούσε να είναι τα θεατρικά υποβολέα. Ο υποβολέας ενθαρρύνει έναν ηθοποιό που χάνει τη γραμμή του, προκαλώντας τον να επιστρέψει στη δράση. Αλλά αυτό δεν είναι ακριβές, γιατί μια υποβολή σε τεχνητή νοημοσύνη δεν χαλαρώνει ένα κομμάτι απομνημονευμένου κειμένου - δεν λειτουργεί έτσι η γενετική τεχνητή νοημοσύνη. Δώστε σε μια μηχανή τεχνητής νοημοσύνης μια μόνο υποβολή επανειλημμένα, και οι απαντήσεις θα είναι πάντα τουλάχιστον λίγο διαφορετικές.

Μόλις τώρα ζήτησα από το ChatGPT να “καταγράψει τα βασικά στοιχεία της αποτελεσματικής υποβολής.” Ζήτησα μια δεύτερη φορά και οι απαντήσεις ήταν θεματικά συνεπείς, αλλά αρκετά διαφορετικές στις λεπτομέρειες. Τα θέματα που επισημάνθηκαν περιλάμβαναν:

Να είστε συγκεκριμένοι
Αποφύγετε την ασάφεια
Παρέχετε υπόβαθρο
Χρησιμοποιήστε σαφείς οδηγίες

Με μια έννοια είναι αρκετά περίεργο: η τεχνητή νοημοσύνη έχει καλή αντίληψη της γλώσσας - δεν θα έπρεπε να έχει μια αίσθηση του τι εννοείτε χωρίς σχολαστική υποβολή; Αλλά ακριβώς αυτή η κυριαρχία της γλώσσας κάνει την υποβολή πιο ισχυρή. Πείτε ακριβώς τι εννοείτε, όχι περίπου.

Μιλήστε του όπως ο χρήσιμος βοηθός, ο έμπειρος σύμβουλος, που θέλετε να είναι, όχι σαν ένα παιδί από το δρόμο.

Το συμπέρασμα εδώ είναι ότι, τουλάχιστον προς το παρόν, η αποτελεσματική χρήση των εργαλείων τεχνητής νοημοσύνης που βασίζονται σε μεγάλα γλωσσικά μοντέλα απαιτεί τουλάχιστον εξοικείωση με τις βέλτιστες πρακτικές υποβολής. Η κυριαρχία στην υποβολή θα ανταμειφθεί κατάλληλα.

Παραληρήματα: Μια Μύγα στην Αλοιφή

Η Τεχνητή Νοημοσύνη, βασισμένη σε μεγάλα γλωσσικά μοντέλα, εφευρίσκει πράγματα. Απλά το κάνει. Αυτό γενικά ονομάζεται “παραληρήματα.” Είναι ένα πραγματικό πρόβλημα, ένα σοβαρό πρόβλημα. Πρέπει να κατανοήσετε τα παραληρήματα εάν πρόκειται να εργαστείτε με την Τεχνητή Νοημοσύνη.

Η Λεξικογραφική Λέξη της Χρονιάς του Cambridge για το 2023 ήταν “Παραληρήματα,” η οποία έχει επεκταθεί για να περιλαμβάνει “Όταν μια τεχνητή νοημοσύνη… παραληρεί, παράγει ψευδείς πληροφορίες.” (Άλλες προσθήκες στο λεξικό του 2023 περιλαμβάνουν “μηχανική προτροπών,” “μεγάλο γλωσσικό μοντέλο,” και “Γενετική ΤΝ.”)

Τα παραληρήματα της ΤΝ, σημειώνει το Cambridge, “μερικές φορές φαίνονται χωρίς νόημα. Αλλά μπορεί επίσης να φαίνονται εντελώς πειστικά–ακόμα κι αν είναι πραγματικά ανακριβή ή τελικά παράλογα.” Αυτό, δυστυχώς, είναι πολύ αληθινό, και από τον Ιούλιο του 2024 παραμένει ένας δραματικός περιορισμός για τη χρήση γενετικής ΤΝ για κρίσιμες εργασίες. Είναι ένα από τα πολλά μεγάλα παράδοξα της ΤΝ, και χρειάζεται χρόνος για να το καταλάβουν οι άνθρωποι. Θυμηθείτε, η γενετική ΤΝ είναι κυρίως μια μηχανή πρόβλεψης της επόμενης λέξης, όχι μια βάση δεδομένων γεγονότων. Εξ ου και η ανάγκη για HITLs, Humans-In-The-Loop, όπως είμαστε τώρα γνωστοί, που διπλοελέγχουν την έξοδο της ΤΝ. Και πάλι, είναι αξιοσημείωτο ότι μπορούμε να πάρουμε τόσο εξαιρετική αξία από μια τεχνολογία που μπορεί να παράγει αποδεδειγμένα ανακριβή αποτελέσματα. Έτσι είναι.

Ο Gary Marcus, ένας έμπειρος και ενημερωμένος κριτικός της ΤΝ, συγκρίνει τα παραληρήματα της ΤΝ με σπασμένα ρολόγια, τα οποία είναι σωστά δύο φορές την ημέρα. “Είναι σωστά μερικές φορές,” λέει, “αλλά δεν ξέρεις ποιο μέρος του χρόνου, και αυτό μειώνει σημαντικά την αξία τους.”

Ο Ethan Mollick, κεντρικός ομιλητής στο συνέδριο του Publishers Weekly τον Σεπτέμβριο του 2023, σημειώνει ότι οι άνθρωποι που χρησιμοποιούν την ΤΝ αναμένουν 100% ακρίβεια. Τα παραληρήματα, λέει, είναι παρόμοια με τα “ανθρώπινα ποσοστά σφάλματος” που ανεχόμαστε καθημερινά.

Ο Andrej Karpathy, ένας διακεκριμένος επιστήμονας που ειδικεύεται στην ΤΝ, ο οποίος εργάζεται αυτή τη στιγμή στην OpenAI, γράφει για τα παραληρήματα:

“Πάντα δυσκολεύομαι λίγο όταν με ρωτούν για το ‘πρόβλημα των παραληρημάτων’ στα μεγάλα γλωσσικά μοντέλα. Διότι, με κάποιον τρόπο, τα παραληρήματα είναι ό,τι κάνουν τα μεγάλα γλωσσικά μοντέλα. Είναι μηχανές ονείρων.

“Κατευθύνουμε τα όνειρά τους με προτροπές. Οι προτροπές ξεκινούν το όνειρο, και με βάση την ασαφή ανάμνηση των εκπαιδευτικών εγγράφων του μεγάλου γλωσσικού μοντέλου, τις περισσότερες φορές το αποτέλεσμα πηγαίνει κάπου χρήσιμο.

“Μόνο όταν τα όνειρα πηγαίνουν σε περιοχές που θεωρούνται πραγματικά ανακριβείς χαρακτηρίζουμε το αποτέλεσμα ως ‘παραλήρημα.’ Φαίνεται σαν σφάλμα, αλλά είναι απλώς το μεγάλο γλωσσικό μοντέλο που κάνει αυτό που πάντα κάνει.”

Δεν είναι μόνο το πρόβλημα της επινόησης πραγμάτων. Το Chat AI είναι βαθιά ελαττωματικό λογισμικό.

Για πολλές ερωτήσεις, ιδιαίτερα από αρχάριους, οι απαντήσεις είναι κοινές, εκτός στόχου ή απλώς άχρηστες. Το Chat AI έχει πρόβλημα να μετράει: Ζητήστε του μια ανάρτηση ιστολογίου 500 λέξεων και θα είστε τυχεροί αν λάβετε 150.

Και κάθε μία από τις εταιρείες AI, προκειμένου να μειώσει την προκατάληψη και να αποφύγει τις ερωτήσεις “πώς να φτιάξετε μια βόμβα”, έχει ανεγείρει αυστηρές προστατευτικές ράγες γύρω από τα προϊόντα τους: πολύ συχνά, η απάντηση σε μια ερώτηση είναι, ουσιαστικά, “Όχι, δεν θα απαντήσω σε αυτό.” Ζήτησα από το Google Gemini να εξετάσει ένα πρόχειρο αυτού του κειμένου και με προειδοποίησε ότι “είναι απαραίτητο να λάβετε την έγκριση του συγγραφέα πριν από τη δημοσίευση.”

Επαλήθευση στοιχείων

Υποστηρίζω, κυρίως σε κουφά αυτιά, ότι οι παραισθήσεις είναι ένα τεχνολογικό πρόβλημα, το οποίο θα βρει μια τεχνολογική λύση. Ναι, είναι ενδημικές στα LLMs, αλλά μπορούν να παρακαμφθούν.

Σκεφτείτε αυτό: Ζήτησα από τέσσερις Chat AI να επαληθεύσουν τα εξής δηλώσεις:

Από το 2024, υπάρχουν 6 μεγάλοι πολυεθνικοί εκδότες με έδρα τη Νέα Υόρκη. Είναι γνωστοί ως οι Μεγάλοι 6.
Τα ebooks συνεχίζουν να κυριαρχούν στις πωλήσεις βιβλίων στις Ηνωμένες Πολιτείες.
Τα Borders και Barnes & Noble είναι οι δύο μεγαλύτερες αλυσίδες πώλησης βιβλίων στις Ηνωμένες Πολιτείες.
Μετά από μια πτώση στις πωλήσεις κατά τη διάρκεια του Covid, οι πωλήσεις βιβλίων στις ΗΠΑ αυξάνονται ξανά με διψήφια ποσοστά.

Όλοι τους εντόπισαν τα λάθη στις τρεις πρώτες δηλώσεις. Ο καθένας τους μπερδεύτηκε λίγο στην τέταρτη, αβέβαιος για την έκταση της ανόδου των πωλήσεων κατά τη διάρκεια του Covid και των επακόλουθων προτύπων πωλήσεων. Είναι ένα μικρό, μη αντιπροσωπευτικό πείραμα, αλλά αυτές οι AI συνομιλίες, που δεν προορίζονται να βασίζονται σε γεγονότα, μπορούν να κάνουν μια αξιόπιστη δουλειά στην αξιολόγηση γεγονότων που οι περισσότεροι περιστασιακοί παρατηρητές θα έχαναν.

Τι γίνεται με τις εικόνες και τα βίντεο;

Επειδή η εκδοτική βιομηχανία βιβλίων βασίζεται περισσότερο στο κείμενο παρά στις εικόνες, οι εκδότες τείνουν να παραβλέπουν τα πρωτοποριακά εργαλεία βασισμένα στην AI για εικόνες και βίντεο.

Είναι σημαντικά για την κατανόηση της επανάστασης της AI από οποιονδήποτε. Αλλά η συζήτηση είναι πολύ μεγάλη για τον διαθέσιμο χώρο: απλώς δεν θα της αποδώσω δικαιοσύνη.

Συνιστάται για συγγραφείς και εκδότες: παίξτε με τις δυνατότητες δημιουργίας εικόνων στο ChatGPT—είναι δωρεάν και διασκεδαστικές στη χρήση. Στη συνέχεια, κάντε μια αναζήτηση με τη φράση “βίντεο και AI” και θαυμάστε μερικά από τα παραδείγματα που θα βρείτε στους συνδεδεμένους ιστότοπους. Αν και το εργαλείο δεν είναι ακόμα διαθέσιμο στο κοινό, το OpenAI’s Sora παρέχει μερικά εκπληκτικά παραδείγματα βίντεο που δημιουργούνται μόνο από προτροπές κειμένου.

Λογισμικό για Εκδότες Βιβλίων

Υπάρχει ελάχιστο λογισμικό AI συγκεκριμένα για εκδότες βιβλίων (αν και υπάρχει πολύ για συγγραφείς).

Οι επιστημονικοί εκδότες έχουν περισσότερες επιλογές, με μια ποικιλία εργαλείων AI για έρευνα, συγγραφή και έκδοση.

Για τους εμπορικούς εκδότες, οι περισσότερες επιλογές σχετίζονται με το AI και τον ήχο. Πέρα από τον ήχο, οι επιλογές επικεντρώνονται γύρω από εργαλεία επεξεργασίας και μάρκετινγκ. Υπάρχουν επίσης πολλά εργαλεία ανίχνευσης περιεχομένου AI και εργαλεία και υπηρεσίες αδειοδότησης περιεχομένου.

Το λογισμικό επεξεργασίας απευθύνεται σε συγγραφείς, όχι σε επαγγελματίες εκδότες — υπάρχουν πολλοί περισσότεροι συγγραφείς από εκδότες, και η ποιότητα που απαιτείται από τους επαγγελματίες εκδότες είναι πολύ πιο αυστηρή από αυτήν των (κυρίως αυτοεκδοθέντων) συγγραφέων.

Τα εργαλεία μάρκετινγκ επίσης στοχεύουν ευρύτερα από απλούς εκδότες βιβλίων, αλλά σε όλους τους marketers, με εργαλεία για περιεχόμενο web, δημιουργία κειμένων και SEO. Η Jasper.ai είναι ηγέτης σε αυτήν την κατηγορία, και ισχυρίζεται ότι η HarperCollins είναι πελάτης της.

Η Shimmr, ένας χορηγός αυτού του βιβλίου, είναι ένα εργαλείο δημιουργίας διαφημίσεων με τεχνητή νοημοσύνη που απευθύνεται συγκεκριμένα σε εκδότες βιβλίων. Η εταιρεία και ο ιδρυτής της, Nadim Sadek, παρουσιάστηκαν σε ένα άρθρο του Publishers Weekly τον Μάιο του 2024.

«Αυτό που κάνουμε είναι να χρησιμοποιούμε την AI για να εξετάζουμε το ψυχολογικό προφίλ ενός βιβλίου και να το ταιριάζουμε με τη διάθεση ενός συγκεκριμένου κοινού, διασφαλίζοντας μια πιο αποτελεσματική σύνδεση μεταξύ αναγνωστών και βιβλίων,» είπε ο Sadek στο PW. «Το αποκαλούμε ‘DNA του Βιβλίου’, και περιλαμβάνει όχι μόνο την κατανόηση των χαρακτήρων και της πλοκής ενός βιβλίου, αλλά και τις αξίες, τα ενδιαφέροντα και τα συναισθήματα του βιβλίου.»

Χρησιμοποιώντας το DNA του Βιβλίου, τα εργαλεία AI της Shimmr δημιουργούν στοχευμένες διαφημίσεις για κανάλια αναζήτησης και κοινωνικής δικτύωσης (προς το παρόν Google και Meta). Οι διαφημίσεις εμφανίζονται ως διαφημίσεις προβολής, με εικόνες που παράγονται από AI συνοδευόμενες από τίτλους.

Επισημαίνω στους εκδότες που αξιολογούν τη Shimmr ότι μπορεί να προσφέρει επιπλέον έσοδα, κάτι που περιμένουμε από ένα νέο εργαλείο διαφήμισης/μάρκετινγκ να φέρει στο τραπέζι.

Αν θέλετε να δοκιμάσετε ένα άλλο εργαλείο “μόνο με AI”, ελέγξτε το Hypnovels, που ζωντανεύει κεφάλαια σε μυθιστορήματα. «Αφήγηση, εικόνα και κίνηση, όλα παράγονται από AI, συνδυάζονται με εξαιρετική αφήγηση με τρόπο που είναι λιγότερο κυριολεκτικός από την παραδοσιακή κινούμενη εικόνα (εξ ου και το “hypno”) και πιο αισθητηριακά ελκυστικός από ένα ηχητικό βιβλίο, σε ένα στυλ που κάνει το κεφάλαιο μοναδικό και συναρπαστικό.»

Άλλος ένας νέος προμηθευτής που γεννήθηκε από την ευκαιρία με την Τεχνητή Νοημοσύνη, είναι η Veristage (επίσης χορηγός αυτού του βιβλίου). Η Veristage προσφέρει το Insight, τον «Βοηθό Έκδοσης με Τεχνητή Νοημοσύνη», ένα εργαλείο για συγκεκριμένες εργασίες που καλύπτει πολλές λειτουργίες έκδοσης.

Το ταξίδι του Insight ξεκινά με το χειρόγραφο. Η μεταφόρτωση μιας πρώιμης έκδοσης ξεκλειδώνει μια σειρά εργαλείων, κάποια πιο πολύτιμα για την επιμέλεια, άλλα πιο πολύτιμα για το μάρκετινγκ. Αφού δουλέψετε με οποιοδήποτε και όλα τα χαρακτηριστικά, μπορείτε να κατεβάσετε μια αναφορά PDF που περιλαμβάνει επιμελητικά στοιχεία, όπως τον τόνο γραφής, τα μοτίβα, τα κλισέ και τη χρήση επιρρημάτων και επιθέτων, και στη συνέχεια περιεχόμενο μάρκετινγκ, όπως περιγραφές, μεταδεδομένα, μοναδικά σημεία πώλησης, συγκρίσεις, περιεχόμενο βελτιστοποιημένο για το Amazon και προτεινόμενες δημοσιεύσεις στα μέσα κοινωνικής δικτύωσης.

Αυτό που μου αρέσει περισσότερο στο Insight είναι ότι προσεγγίζει ολιστικά την εφαρμογή της Τεχνητής Νοημοσύνης στη διαδικασία έκδοσης, αντί να χρειάζεται να συγκεντρώσετε πολλά λογισμικά εργαλεία για κάθε διαφορετική λειτουργία.

Θέλω επίσης να τονίσω εδώ την πλατφόρμα έκδοσης μου, Leanpub. Ήταν καταπληκτικοί στη συνεργασία. Το μικρό είναι όμορφο: δοκιμάζουν τεχνολογίες και υπηρεσίες που οι μεγαλύτερες εταιρείες θα απέφευγαν. Ιδιαίτερο ενδιαφέρον για τους συγγραφείς και τους μικρότερους εκδότες έχει η νέα τους υπηρεσία TranslateWord, όπου μπορείτε να μεταφράσετε ένα βιβλίο γραμμένο στο Microsoft Word σε έως και 31 γλώσσες, μέσω του API GPT-4o (που δίνει ισχύ στο ChatGPT). Αυτό χρησιμοποιώ για να μεταφράσω αυτό το βιβλίο.

Έψαξα αλλού για να βρω μια υπηρεσία για τη μετάφραση βιβλίων. Υπάρχουν πολλοί μεταφραστικοί οίκοι, κάποιοι από τους οποίους χρησιμοποιούν Τεχνητή Νοημοσύνη. Ο μόνος που βρήκα που προσφέρει μετάφραση βιβλίων είναι η DeepL. Αλλά δεν είναι προτεραιότητα για την εταιρεία. Αυτή τη στιγμή η Leanpub είναι το μέρος που πρέπει να πάτε.

Επιχειρηματικό λογισμικό για την έκδοση βιβλίων

Οι υπάρχοντες προμηθευτές επιχειρηματικών συστημάτων που εξυπηρετούν τη βιομηχανία έκδοσης βιβλίων αρχίζουν να ενσωματώνουν τεχνολογίες Τεχνητής Νοημοσύνης, όπως έχουμε δει στις εταιρείες κλίμακας επιχείρησης, όπως η Salesforce και η Oracle.

Έχω μιλήσει με αρκετούς προμηθευτές λογισμικού συστημάτων έκδοσης, συμπεριλαμβανομένης της Firebrand, και όλοι εξετάζουν τις ευκαιρίες, αλλά προχωρούν προσεκτικά.

Ανυπομονώ για την ευκαιρία να συζητήσω για την Τεχνητή Νοημοσύνη με μια ποικιλόμορφη ομάδα συμμετεχόντων στο Firebrand’s Publishing Innovation Forum τον Σεπτέμβριο, 2024 στο Νάσβιλ, ΤΝ.

Η knk έχει διεξάγει δύο διαδικτυακά σεμινάρια για την Τεχνητή Νοημοσύνη και έχει δημοσιεύσει μια λευκή βίβλο, αλλά (από τις 26 Ιουνίου 2024) δεν έχει ακόμη ανακοινώσει καμία δυνατότητα Τεχνητής Νοημοσύνης στα προϊόντα της.

Η Virtusales έχει πρόσφατα κυκλοφορήσει το πρώτο της σύνολο εργαλείων με δυνατότητες Τεχνητής Νοημοσύνης, συμπεριλαμβανομένης της ετικετοποίησης εικόνων, της δημιουργίας alt-text, των εργαλείων επιμέλειας κειμένου, της δημιουργίας κειμένων πωλήσεων και μάρκετινγκ και των μεταφράσεων αυτών των κειμένων.

Μίλησα με την Klopotek στο Klopotek Publishing Radio. Έχουν “ξεκινήσει μια πρωτοβουλία Τεχνητής Νοημοσύνης στον τομέα των Υπηρεσιών Πελατών,” αν και δεν υπάρχουν διαθέσιμες λεπτομέρειες.

Η Supadu, που προσφέρει στους εκδότες “σχεδιασμό ιστοσελίδων, ηλεκτρονικό εμπόριο και λύσεις δεδομένων,” τώρα διαθέτει το “Supadu Smart AI,” (pdf) με “κριτική τίτλου βίντεο με avatar και Smart Buy,” “προωθητικό υλικό με βίντεο avatar για τις ομάδες μάρκετινγκ και πωλήσεων,” και “εύκολη πολύγλωσση μετάφραση βίντεο συγγραφέα και τίτλου.”

Λογισμικό Τεχνητής Νοημοσύνης για εκδότες βιβλίων: οι νεοφυείς επιχειρήσεις

Μερικοί άνθρωποι είναι εξοικειωμένοι με το έργο που έχω κάνει γύρω από τις νεοφυείς επιχειρήσεις τεχνολογίας εκδόσεων βιβλίων. Υπάρχει μια αναφορά στο Publishers Weekly που περιγράφει το έργο, και συνδέσμους προς τη βάση δεδομένων.

Όπως θα δείτε στην αναφορά, εξετάζω αρκετά ευρέως τις νεοφυείς επιχειρήσεις σε όλο το φάσμα των εκδόσεων βιβλίων. Δεν περιλαμβάνω νέες εκδοτικές εταιρείες, εκτός αν κάνουν κάτι ασυνήθιστο με την τεχνολογία. Το βασικό κριτήριο είναι: χρησιμοποιείτε τεχνολογία για να προσπαθήσετε να αναζωογονήσετε κάποια πτυχή της διαδικασίας των εκδόσεων βιβλίων; Έχω πάνω από 1.600 εταιρείες στη βάση δεδομένων, οι περισσότερες από τις οποίες ξεκίνησαν μετά την κυκλοφορία του πρώτου Kindle από την Amazon το 2007.

Μετά από μια γενική κατανόηση της βάσης δεδομένων, μπορείτε να αρχίσετε να εμβαθύνετε περισσότερο. Στην καρτέλα στα δεξιά θα δείτε έναν τρόπο ταξινόμησης μόνο από τις νεοφυείς επιχειρήσεις που σχετίζονται με την Τεχνητή Νοημοσύνη.

Ένα στιγμιότυπο οθόνης ενός πίνακα που παραθέτει εργαλεία και υπηρεσίες με επιλεγμένο φίλτρο AI, επισημαίνοντας έναν αριθμό 243.

Όπως βλέπετε στην εικονογράφηση, υπάρχουν πάνω από 240 νεοφυείς επιχειρήσεις που σχετίζονται με την Τεχνητή Νοημοσύνη (στις αρχές Ιουλίου 2024). Υπολογίζουμε τις νεοφυείς επιχειρήσεις ηχητικής έκδοσης που χρησιμοποιούν Τεχνητή Νοημοσύνη ως ξεχωριστή κατηγορία και το σύνολο των δύο είναι πάνω από 300 εταιρείες. Η πλειοψηφία, πάνω από 280, ιδρύθηκαν μετά την πρώτη εμφάνιση του ChatGPT τον Νοέμβριο του 2022. Αυτός ο όγκος νέων νεοφυών επιχειρήσεων είναι πρωτοφανής στον τομέα των εκδόσεων βιβλίων. Είναι εκπληκτικό.

Όπως είναι χαρακτηριστικό της πλήρους βάσης δεδομένων, αυτές οι νεοφυείς επιχειρήσεις Τεχνητής Νοημοσύνης στοχεύουν κυρίως συγγραφείς (70%). Περίπου το 13% στοχεύουν να εξυπηρετήσουν εκδοτικές εταιρείες. Το 10% εστιάζει στις εκδόσεις για παιδιά.

Περίπου 50 από τις νεοφυείς επιχειρήσεις στοχεύουν αναγνώστες με μια γκάμα ευρηματικών προσφορών. Αρκετές είναι πλατφόρμες αφήγησης. Υπάρχουν αρκετοί περιληπτικοί μηχανισμοί. Υπάρχουν πολλαπλοί ιστότοποι ανακάλυψης, “Χρησιμοποιήστε την Τεχνητή Νοημοσύνη για να βρείτε το νέο αγαπημένο σας βιβλίο.” Οι ταχέως βελτιούμενες φωνές που δημιουργούνται από Τεχνητή Νοημοσύνη έχουν οδηγήσει σε μια επιλογή εργαλείων “διάβασέ το σε μένα”.

Και κάποιες ενδιαφέρουσες ιδέες που δεν θα ήταν δυνατές χωρίς την Τεχνητή Νοημοσύνη.

Το Bookshelf: Reading Tracker είναι ένας συνδυασμός εφαρμογής ανακάλυψης βιβλίων και προσωπικής βιβλιοθήκης που περιλαμβάνει “αυτόματη παρακολούθηση χρόνου, στόχους ανάγνωσης & υπενθυμίσεις, και διορατικές στατιστικές & τάσεις.” Η βιβλιοθηκάριος Τεχνητής Νοημοσύνης του “μπορεί να δημιουργήσει περιλήψεις και κάρτες ανασκόπησης, να συζητήσει βασικές ιδέες και συμπεράσματα, και πολλά άλλα.”

Ο φίλος μου Ron Martinez πρόσφατα λάνσαρε έναν ιστότοπο που ονομάζεται Inventionarts.ai ο οποίος εισάγει “ένα νέο συνομιλητικό μέσο.” Όπως εξηγεί ο ιστότοπος, “Μιλήστε με πολλαπλές προσωπικότητες Τεχνητής Νοημοσύνης, καθεμία με τη δική της ταυτότητα, εξειδίκευση και αντίληψη. Προσκαλέστε διαφορετικές προσωπικότητες να συμμετάσχουν σε σενάρια. Και μπορείτε να παίξετε κι εσείς έναν φανταστικό ρόλο!” Ένα είδος λογοτεχνικού παιχνιδιού.

Όπως είναι χαρακτηριστικό του μεγαλύτερου συνόλου νεοφυών επιχειρήσεων, πολλές από αυτές τις νεοφυείς επιχειρήσεις είναι μεταξύ πολύ μικρών και ελάχιστων, μόλις ένα άτομο με έναν ιστότοπο και μια ημιτελή ιδέα. Τις περιλαμβάνω όλες—ποιος ξέρει πού κατευθύνονται.

Σας ενθαρρύνω έντονα να παίξετε με τη βάση δεδομένων. Κάντε κλικ σε μερικούς συνδέσμους. Νομίζω ότι θα εντυπωσιαστείτε από την καινοτομία και την τόλμη πολλών από αυτές τις οργανώσεις.

Ένας από τους χορηγούς αυτού του βιβλίου, Book Advisors, ειδικεύεται στις συγχωνεύσεις και εξαγορές στη βιομηχανία της εκδοτικής. Πάντα συμβουλεύω καινοτόμες νεοφυείς επιχειρήσεις να αναζητούν συνεργάτες, και το Book Advisors είναι το μέρος όπου τους στέλνω για να συζητήσουν τη διαδικασία. Η εκδοτική βιομηχανία έχει αρκετές σεβαστές εταιρείες M&A στις οποίες μπορεί να απευθυνθεί, συμπεριλαμβανομένων των The Fisher Company και Oaklins DeSilva+Phillips. Το Book Advisors είναι η μόνη εταιρεία που γνωρίζω που επίσης συνεργάζεται με νεοφυείς επιχειρήσεις τεχνολογίας.

Τεχνητή Νοημοσύνη και Εκδοτική Βιομηχανία: Τι Κάνει Αυτή τη Στιγμή η Βιομηχανία;

Οι δραστηριότητες που σχετίζονται με την τεχνητή νοημοσύνη πολλών από τις εξέχουσες εμπορικές ομάδες εκδόσεων φαίνεται να προσθέτουν τη φωνή τους στη χορωδία των ανησυχιών για τα πνευματικά δικαιώματα. Η Ένωση Αμερικανών Εκδοτών “κατέθεσε απαντητικά σχόλια στην έρευνα του Γραφείου Πνευματικών Δικαιωμάτων των Η.Π.Α. σχετικά με τη διασταύρωση του νόμου περί πνευματικών δικαιωμάτων και της τεχνητής νοημοσύνης (AI)...”

Η Ένωση Εκδοτών του Ηνωμένου Βασιλείου σημειώνει ότι “είναι υψίστης σημασίας η Κυβέρνηση να θέσει σε εφαρμογή απτές λύσεις το συντομότερο δυνατό για την προστασία της ανθρώπινης δημιουργικότητας και γνώσης που υποστηρίζει την ασφαλή και αξιόπιστη τεχνητή νοημοσύνη.”

Από την άλλη πλευρά, η Independent Publishers Guild (IPG), με περισσότερα από 600 μέλη, προσφέρει καθοδήγηση για την τεχνητή νοημοσύνη και εκπαίδευση στα μέλη της, συμπεριλαμβανομένου του “Πρακτικού Οδηγού για την Τεχνητή Νοημοσύνη στην Εκδοτική,” που διεξάγεται από έναν γνωστό ειδικό στην τεχνητή νοημοσύνη και την εκδοτική, George Walkley.

Εδώ στις Η.Π.Α., έχω το προνόμιο να είμαι μέλος της Ομάδας Εργασίας για την Τεχνητή Νοημοσύνη της Book Industry Study Group (BISG), η οποία αναφέρεται στην Επιτροπή Εργασιών. Η Ομάδα Εργασίας έχει σκιαγραφήσει διάφορες πιθανές στρατηγικές πρωτοβουλίες:

Βέλτιστες Πρακτικές και Ανάπτυξη Προτύπων: Προτεινόμενες βέλτιστες πρακτικές που σχετίζονται με τη χρήση AI, συνδεδεμένες με ηθικές κατευθυντήριες γραμμές, υπάρχουσες ρυθμίσεις και νόμους. Αυτό περιλαμβάνει τη διαφάνεια στο περιεχόμενο που δημιουργείται από AI και την αποκάλυψή του στους καταναλωτές.
Έρευνες και Ορισμοί της Βιομηχανίας: Διεξαγωγή ερευνών για τη συλλογή ευρέων βιομηχανικών πληροφοριών σχετικά με τις τρέχουσες και τις πιθανές χρήσεις του AI και την καθιέρωση σαφών ορισμών και πεδίων για το τι σημαίνει AI στο πλαίσιο της έκδοσης βιβλίων.
Περιοδικές Αναφορές και Αξιολογήσεις: Προσφορά περιοδικών αναφορών για να βοηθήσει τη βιομηχανία να προβλέψει και να προσαρμοστεί στις ταχύτατες αλλαγές που προκαλούνται από τις τεχνολογίες AI.

Άλλες ενώσεις συγγραφέων και εκδοτών προσπαθούν να προλάβουν το θέμα. Κάποιες παίρνουν θέσεις αντίθετες με το AI· άλλες απλώς προσπαθούν να βοηθήσουν τα μέλη τους να κατανοήσουν την τεχνολογία και, ίσως, να πειραματιστούν με αυτήν.

AI και Έκδοση Βιβλίων: Τι Κάνουν οι Εκδοτικές Εταιρείες;

Πριν από έναν χρόνο, η ερώτηση για το τι κάνουν οι εκδοτικές εταιρείες έφερνε την απάντηση, “όχι πολλά.” Δεν έχει αλλάξει πολλά από τότε, αλλά υπήρξε κάποια δραστηριότητα. Θα επικεντρωθώ στους εκδότες εμπορικών βιβλίων· οι εκδότες επιστημονικών και ακαδημαϊκών βιβλίων είναι πιο ενεργοί. Εδώ είναι μερικά από όσα έχω ανακαλύψει.

Hachette: Σύμφωνα με μια αναφορά του Νοεμβρίου 2023 στο The Bookseller στο Ηνωμένο Βασίλειο, η Hachette έχει δημοσιεύσει μια δήλωση θέσης σχετικά με το AI, προσφέροντας μια διάκριση μεταξύ των ‘λειτουργικών’ και των ‘δημιουργικών’ χρήσεων. Η εταιρεία “έκανε σαφές ότι ενθαρρύνει τον ‘υπεύθυνο πειραματισμό’ για λειτουργικές χρήσεις αλλά είναι αντίθετη στη ‘μηχανική δημιουργικότητα... για να προστατεύσει το αυθεντικό δημιουργικό περιεχόμενο που παράγεται από ανθρώπους’.”

HarperCollins: Σύμφωνα με μια αναφορά του Απριλίου 2023 στο Publishers Weekly από τους Andrew Albanese και Ed Nawotka, ο CEO της HarperCollins, Brian Murray, είπε:

“Γνωρίζουμε ότι θα είναι σημαντικό και θα έχει μεγάλο αντίκτυπο στη βιομηχανία μας τα επόμενα τρία έως πέντε χρόνια. Και έτσι νομίζω ότι πολλοί από εμάς προσπαθούμε να καταλάβουμε πώς να το εφαρμόσουμε και να βεβαιωθούμε ότι το χρησιμοποιούμε με ηθικό, ηθικό τρόπο που βοηθά τους συγγραφείς και να παρέχουμε επαγγελματικές υπηρεσίες στους συγγραφείς και δεν ανταγωνίζεται τους συγγραφείς και την αφήγηση.

“Και αυτό, νομίζω, είναι μια πρόκληση. Ίσως όχι τόσο για όλους τους εκδότες που είναι εδώ, αλλά εγγυώμαι ότι υπάρχουν πολλές μικρές τεχνολογικές ομάδες σε όλο τον κόσμο που ίσως επιδιώκουν την επιχείρησή μας. Δεν είναι εκδότες, δεν είναι συντάκτες. Είναι οι τεχνολόγοι και βλέπουν μια ευκαιρία.”

Penguin Random House (PRH): Η Bertelsmann, η μητρική εταιρεία της PRH, προσφέρει ένα white paper με τίτλο Κατάσταση Παιχνιδιού: Εξερευνώντας τις Μεταμορφωτικές Επιπτώσεις της Γενετικής Τεχνητής Νοημοσύνης στη Βιομηχανία Μέσων και Ψυχαγωγίας, το οποίο περιλαμβάνει ένα τμήμα για την έκδοση βιβλίων.

Επίσης, σύμφωνα με μια αναφορά στο Publishers Lunch, η εταιρεία “εισήγαγε τη δική της εσωτερική εφαρμογή AI, που ονομάζεται PRH ChatGPT.”

Το άρθρο αναφέρει ότι τα εσωτερικά έγγραφα της PRH εξηγούν ότι το πρόγραμμα “‘μπορεί να χρησιμοποιηθεί για την απλοποίηση διαδικασιών, την ενίσχυση της δημιουργικότητας και την παροχή δεδομένων’ σε διάφορα τμήματα. Η εταιρεία προτείνει ότι μεταξύ των χρήσεων της εφαρμογής είναι η σύνοψη βιβλίων και εγγράφων, η αναθεώρηση email, η συγγραφή αναρτήσεων σε blog ή περιγραφών θέσεων εργασίας, η ανάλυση δεδομένων βασισμένων σε κείμενο, και η ‘δημιουργία ιδεών για περιεχόμενο.’”

Simon & Schuster: Ο Διευθύνων Σύμβουλος της εταιρείας, Jonathan Karp, κέρδισε μια αναφορά στο New York Times “Τα Πιο Αξέχαστα Λογοτεχνικά Στιγμιότυπα των Τελευταίων 25 Ετών” με μια φράση που αναφέρθηκε στο Publishers Weekly από την έκθεση U.S. Book Show του Μαΐου 2024. Είπε ότι η AI δεν ήταν “ο ελέφαντας στο δωμάτιο” αλλά μάλλον, “περισσότερο σαν την τζιτζικιά στον κόσμο. Ξέρετε, πολλή βοή και πολλή συνεύρεση.”

Αναγνώρισε ότι η AI “είναι σίγουρα ένα πολύτιμο εργαλείο. Θα μας κάνει σίγουρα πιο αποδοτικούς. Θα μας βοηθήσει να επεξεργαζόμαστε και να συλλέγουμε πληροφορίες καλύτερα, και ελπίζουμε να επιτρέψει στους εργαζόμενους να κάνουν ένα υψηλότερο επίπεδο εργασίας που είναι πιο ενδιαφέρον και δημιουργικό.”

Τον Μάρτιο, στην Έκθεση Βιβλίου του Λονδίνου, όπως αναφέρθηκε στο The Bookseller, ο Karp είπε ότι η εταιρεία θα εξετάσει επίσης τις ξενόγλωσσες εκδόσεις των AI-γεννημένων ηχητικών βιβλίων “σε περιοχές όπου [τα έργα του συγγραφέα] δεν θα είχαν ποτέ την ευκαιρία λόγω του κόστους [παραγωγής ήχου].”

AI και Έκδοση Βιβλίων: Οι Χρήσεις

Οι συγκεκριμένες χρήσεις της AI και της έκδοσης βιβλίων, σε διάφορες λειτουργίες, είναι εύκολο να περιγραφούν εννοιολογικά. Αλλά δεν υπάρχουν πολλές πληροφορίες διαθέσιμες για το τι κάνουν πραγματικά οι εκδότες.

Keith Riegert, CEO της Ulysses Press και της Perfect Bound, παρουσίασε στη Publishers Weekly U.S. Book Show τον Μάιο του 2024, προσφέροντας την πιο ολοκληρωμένη επισκόπηση που έχω δει σχετικά με τις περιπτώσεις χρήσης της Τεχνητής Νοημοσύνης στις εκδοτικές εταιρείες. Η Perfect Bound είναι χορηγός αυτής της αναφοράς· υποστηρίζω αυτή τη δήλωση. Προσφέρει “20 πρακτικούς τρόπους για να αρχίσετε να χρησιμοποιείτε την ΤΝ ως επαγγελματίας εκδόσεων αμέσως τώρα.”

Η παρουσίασή του, Ξεκινώντας με την ΤΝ, μπορεί να προβληθεί και να ληφθεί από την ιστοσελίδα της Perfect Bound.

Τι συμβαίνει όταν η ΤΝ διαβάζει ένα βιβλίο;

Δανείζομαι αυτόν τον τίτλο ενότητας από το ενημερωτικό δελτίο του Ethan Mollick σκόπιμα—δεν υπάρχει ανάγκη να προσπαθήσω να το βελτιώσω. Ο Mollick είναι καθηγητής στη Wharton School του Πανεπιστημίου της Πενσυλβανίας, που μελετά την επιχειρηματικότητα και την καινοτομία. Το ενημερωτικό δελτίο του, το οποίο συχνά συνιστώ, είναι ήρεμο, αναζωογονητικό και μοναδικά διορατικό.

Μεταξύ των πραγμάτων που καθιστούν τον Mollick έγκυρο σχολιαστή είναι ότι δεν έχει προσωπικό συμφέρον. Δεν χρειάζεται να πουλήσει την ΤΝ, ούτε να την κατακρίνει. Έχει απλώς δεσμευτεί να εξερευνήσει την ΤΝ και τις πολλές επιπτώσεις της, κυρίως στην εκπαίδευση, τον πολιτισμό, τη συγγραφή και τις εκδόσεις. Και είναι ένας καλός, σαφής συγγραφέας.

Αν ψάξετε στα αρχεία του ενημερωτικού δελτίου του Mollick, θα δείτε ότι δεν άρχισε να επικεντρώνεται στην ΤΝ μέχρι τον Δεκέμβριο του 2022. Δεν ήταν το αντικείμενό του—όπως οι περισσότεροι από εμάς, η ΤΝ εισέβαλε στην καθημερινή του δουλειά και δεν μπορούσε να πάρει τα μάτια του από πάνω της.

Σε αυτήν την ανάρτηση, οι γνώσεις του πλησιάζουν περισσότερο το ενδιαφέρον μας ως επαγγελματίες εκδόσεων. “Μπορεί η ΤΝ,” ρωτάει, “να αλλάξει τον τρόπο με τον οποίο αλληλεπιδρούμε με τα βιβλία;”

Για να απαντήσει στην ερώτηση, σημειώνει ο Mollick, “χρειαζόμαστε τόσο μια ΤΝ με μνήμη αρκετά μεγάλη για να χωρέσει ένα βιβλίο, όσο και έναν συγγραφέα που γνωρίζει το βιβλίο του αρκετά καλά για να κρίνει τα αποτελέσματα της ΤΝ.” Ο Mollick δοκιμάζει έναν από τους πολλούς τίτλους του (δεν προσδιορίζει ποιον, αλλά από τις συνομιλίες είναι σαφώς το The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors, ένα βιβλίο που έχει κριθεί ευνοϊκά στο Amazon, αν και δεν είναι τρέχων bestseller).

Ο Mollick εξετάζει διαφορετικές πτυχές της πιθανής αξίας της ΤΝ για έναν συγγραφέα, εκδότη ή αναγνώστη, συμπεριλαμβανομένων των “ΤΝ ως αναγνώστη και επιμελητή” και “μια πρακτική χρήση: βοήθεια για τους εκπαιδευτές.” Ζητά από ένα μεγάλο γλωσσικό μοντέλο (όχι το ChatGPT) να συνοψίσει το βιβλίο. Επιτυγχάνει προς ικανοποίηση του Mollick.

Στη συνέχεια, μια πιο δύσκολη πρόκληση: “Δώστε μου παραδείγματα μεταφορών στο βιβλίο.” Η μεταφορά, επισημαίνει, “είναι δύσκολη ακόμη και για ανθρώπους αναγνώστες, καθώς περιλαμβάνει τη χρήση μεταφορικής γλώσσας χωρίς σαφή δείκτες (σε αντίθεση με την παρομοίωση, δεν υπάρχουν “όπως” ή “σαν”).” Τα αποτελέσματα, καταγράφει, “είναι εντυπωσιακά, αν και υπάρχουν μικρά λάθη.”

Το μεγάλο γλωσσικό μοντέλο είναι λιγότερο επιτυχημένο ως επιμελητής: οι αποτυχίες του σε αυτόν τον τομέα, σημειώνει ο Mollick, δείχνουν “κάτι που έχει γίνει σαφές για την τρέχουσα κατάσταση της ΤΝ: αν είσαι πολύ καλός συγγραφέας ή επιμελητής, είσαι καλύτερος από την τρέχουσα ΤΝ…”

Παρ’ όλα αυτά, “Οι ΤΝ έχουν, ή τουλάχιστον φαίνεται να έχουν, κατανόηση του πλαισίου και της σημασίας ενός κειμένου.” Ως αποτέλεσμα, ο Mollick πιστεύει ότι “ο τρόπος που σχετιζόμαστε με τα βιβλία πιθανότατα θα αλλάξει λόγω της ΤΝ.”

Και εγώ το πιστεύω.

ΤΝ και σχεδιασμός & παραγωγή βιβλίων

Τα συστήματα ειδικών και η αυτοματοποίηση διαδικασιών είναι ακόμα μπροστά από την ΤΝ όταν πρόκειται για σχεδιασμό και παραγωγή βιβλίων.

Το λογισμικό για την αυτοματοποιημένη στοιχειοθεσία βιβλίων χρονολογείται τουλάχιστον από τη δεκαετία του 1970. Στα μέσα της δεκαετίας του 1980 επιτηρούσα ένα έργο λογισμικού με το όνομα PageOne, βασισμένο στο TeX του Donald Knuth, το οποίο μπορούσε να στοιχειοθετήσει ένα βιβλίο σε λίγα λεπτά. Το SGML εμφανίστηκε περίπου την ίδια εποχή, βασισμένο σε ένα πρότυπο εγγράφων που εισήχθη το 1969. Κατά μεγάλο μέρος αντικαταστάθηκε από το XML, που εισήχθη το 1996. Αυτές οι ισχυρές γλώσσες σήμανσης δημιουργούν σταθερές δομές για αυτοματοποίηση.

Η επιτραπέζια εκδόση εισήγαγε έναν άλλο γύρο αυτοματοποίησης για το QuarkXPress και το Adobe InDesign, καθώς και για το Adobe Illustrator και το Adobe Photoshop. Οι ροές εργασίας εκδόσεων μπορούν να διαχειρίζονται με διάφορα προγράμματα και συστήματα.

Μια οργάνωση που πρέπει να παρακολουθήσουμε είναι το Coko Foundation. Προσφέρουν μια σουίτα εργαλείων ανοιχτού κώδικα για την παραγωγή και τη διαχείριση εκδόσεων, συμπεριλαμβανομένου του Kotahi, μιας πλατφόρμας για ακαδημαϊκές εκδόσεις, και του Ketty για την παραγωγή βιβλίων, που περιλαμβάνει έναν Βοηθό ΤΝ. Ο Kotahi AI PDF Designer, “μετατρέπει το σχεδιασμό PDF σε μια απλή, διαδραστική διαδικασία.”

Υπάρχουν μερικές πρώιμες πρωτοβουλίες για να εισαχθεί η Τεχνητή Νοημοσύνη στις ροές εργασίας του InDesign. Τον Απρίλιο του 2024, η Adobe ανακοίνωσε μια λειτουργία Μετατροπής Κειμένου σε Εικόνα. Τρίτοι μπορεί να προπορεύονται της Adobe εδώ: οι καινοτόμοι προμηθευτές προεκτύπωσης και παραγωγής στην Ινδία, όπως οι Hurix Digital και Integra, δείχνουν περισσότερη πρωτοβουλία από την Adobe στην αξιοποίηση της Τεχνητής Νοημοσύνης για την παραγωγή.

Τεχνητή Νοημοσύνη & μάρκετινγκ βιβλίων

Ο αντίκτυπος της Τεχνητής Νοημοσύνης στο μάρκετινγκ βιβλίων θα είναι επιφανειακός βραχυπρόθεσμα, αλλά μακροπρόθεσμα πολύ πιο βαθύς. Πολλά εξαρτώνται από το τι αντιλαμβάνεστε ως «μάρκετινγκ βιβλίων»· αυτό αλλάζει.

Τα «χαμηλής κρεμάμενης φρούτα» είναι προφανή. Ζητήστε από την Chat AI να βοηθήσει με μια περιγραφή προϊόντος ή ένα δελτίο τύπου. Ζητήστε της να προτείνει κάποιες λέξεις-κλειδιά. Αυτό μπορεί να το κάνει, χωρίς να ιδρώσει. Αλλά οι περισσότεροι επαγγελματίες του εκδοτικού χώρου μπορούν να κάνουν το ίδιο, με μόνο λίγο ιδρώτα.

Οι περιπτώσεις χρήσης του Keith Riegert, που συνδέονται παραπάνω, περιλαμβάνουν προτάσεις για ιδέες τίτλων, σύνταξη ψηφιακής αναφοράς μάρκετινγκ και δημιουργία παρακολούθησης καμπάνιας ψηφιακού μάρκετινγκ στο Google Sheets.

Το λογισμικό Shimmr, που περιγράφεται παραπάνω, υποδεικνύει το σχήμα του αυτοματοποιημένου μάρκετινγκ που έρχεται.

Τεχνητή Νοημοσύνη και μεταδεδομένα

Τι σχέση έχει η Τεχνητή Νοημοσύνη με τα μεταδεδομένα, και το αντίστροφο; Ο ρόλος της φαίνεται μέτριος μέχρι στιγμής· περιμένετε μερικές μεγάλες αλλαγές.

Τα μεταδεδομένα είναι βασικά για την ανακαλυψιμότητα των βιβλίων. Το έχετε ακούσει αρκετές φορές ώστε να νιώθετε ναυτία από την προτροπή. Είναι αποθαρρυντικό κυρίως επειδή «τα μεταδεδομένα» παραμένουν δυσνόητα για τους περισσότερους μη τεχνικούς. Αν πείτε, «είναι απλώς οι βασικές πληροφορίες για το βιβλίο, ο τίτλος, η περιγραφή, η τιμή, οι κατηγορίες θεμάτων, τέτοια πράγματα», οι άνθρωποι αναστενάζουν. Με αυτό είναι άνετοι. Αλλά αυτό είναι το μόνο.

Λυπάμαι που σας υπενθυμίζω ότι υπάρχει στην πραγματικότητα πολύ περισσότερα στα μεταδεδομένα από μερικές λεπτομέρειες για το βιβλίο. Υπάρχουν πολλά περισσότερα. Πολύ περισσότερα από όσα μπορώ να καλύψω σε αυτό το μικρό βιβλίο. Έχω συνυπογράψει ένα ολόκληρο βιβλίο για το θέμα. Η Ingram εκδίδει το Metadata Essentials, ένα εξαιρετικό σύντομο βιβλίο. Θα το πω εδώ, και όχι για τελευταία φορά: οι συγγραφείς και οι εκδότες υποτιμούν τα μεταδεδομένα τους με δικό τους κίνδυνο.

Η Τεχνητή Νοημοσύνη μπορεί να βοηθήσει στη δημιουργία μεταδεδομένων. Για παράδειγμα, ο πάροχος αυτοέκδοσης PublishDrive, προσφέρει έναν “Γεννήτρια Μεταδεδομένων Βιβλίου με την ισχύ της Τεχνητής Νοημοσύνης” που προσφέρει προτάσεις Τεχνητής Νοημοσύνης για τον τίτλο του βιβλίου, την περίληψη, τις κατηγορίες του Amazon, τις κατηγορίες BISAC, και τις λέξεις-κλειδιά.

Insight, από την Veristage, που περιγράφεται παραπάνω, μπορεί να δημιουργήσει περιγραφές, λέξεις-κλειδιά, κατηγορίες BISAC, και να καθορίσει στόχους κοινό.

Δήλωση χρήσης Τεχνητής Νοημοσύνης στα μεταδεδομένα

Μπορεί να νομίζετε ότι ο σεβάσμιος κόσμος των μεταδεδομένων θα ήταν αργός στο να κατανοήσει την Τεχνητή Νοημοσύνη. Όχι όμως! Τον περασμένο Νοέμβριο, η EDItEUR, ο φύλακας του προτύπου ONIX, κυκλοφόρησε μια σύντομη Σημείωση Εφαρμογής με τίτλο “Πτυχές της Τεχνητής Νοημοσύνης στο ONIX.” (pdf)

Με την τυπική του βαθιά σοφία, ο Graham Bell, ο διευθυντής του οργανισμού, σημειώνει ότι “μία αντίδραση στις (αντιπαραθέσεις γύρω από την τεχνολογία) είναι να αρνηθεί κανείς τη χρήση της Τεχνητής Νοημοσύνης ή να αποφύγει το εμπόριο προϊόντων που δημιουργούνται από Τεχνητή Νοημοσύνη. Μια πιο ρεαλιστική επιλογή είναι απλώς να είμαστε διαφανείς με τους εμπορικούς εταίρους και τους αναγνώστες όταν έχει χρησιμοποιηθεί Τεχνητή Νοημοσύνη. Και καθώς ορισμένοι μεταπωλητές περιορίζουν ή απαγορεύουν περιεχόμενο που βασίζεται στην Τεχνητή Νοημοσύνη από τις πλατφόρμες τους, είναι σημαντικό για τους αξιόπιστους εκδότες να επισημαίνουν αυτά τα προϊόντα που χρησιμοποιούν τεχνικές δημιουργικής Τεχνητής Νοημοσύνης για δημιουργία περιεχομένου.”

Ο Bell συνεχίζει να περιγράφει τρόπους με τους οποίους οι εκδότες μπορούν να καθορίζουν στα μεταδεδομένα:

Συμβολή της Τεχνητής Νοημοσύνης
Φωνές βασισμένες σε Τεχνητή Νοημοσύνη σε ακουστικά βιβλία

… καθώς και μια μέθοδο για να υποδεικνύεται στα μεταδεδομένα για ψηφιακά προϊόντα ότι ο εκδότης αποφεύγει ρητά την εξόρυξη κειμένου και δεδομένων (TDM) για χρήσεις εκτός της έρευνας. Υπάρχει επίσης ένας τρόπος να καθοριστεί μια ξεχωριστή άδεια που καλύπτει εμπορική ή μη-ερευνητική TDM.

Όπως συμβαίνει συχνά, αυτό που καθορίζεται στο ONIX μπορεί να μην αποκαλυφθεί στην αλυσίδα τροφίμων, αλλά τουλάχιστον έχει γίνει μια καλύτερη προσπάθεια.

Στρατηγικές για την Ενσωμάτωση της Τεχνητής Νοημοσύνης στις Λειτουργίες Εκδόσεων

Υπάρχουν λίγα πράγματα που οι εκδοτικές εταιρείες είναι λιγότερο άνετες στο να κάνουν από το να ενσωματώσουν σύνθετες ψηφιακές τεχνολογίες στις καθημερινές τους λειτουργίες. Αυτό είναι κατανοητό. Η Τεχνητή Νοημοσύνη, ειδικά, προκαλεί άγχος σε όλους, και όχι μόνο στις εκδόσεις. Είναι νέα, είναι μυστηριώδης, είναι εξατομικευμένη, είναι ισχυρή. Οι άνθρωποι αισθάνονται απειλή από την Τεχνητή Νοημοσύνη για διάφορους λόγους. Η αλλαγή των στάσεων απαιτεί χρόνο.

Αλλά αυτή δεν είναι μια καλή στιγμή για να είμαστε διστακτικοί με την τεχνολογία.

Υπάρχουν ήρεμες και λογικές προσεγγίσεις για την ενσωμάτωση της Τεχνητής Νοημοσύνης (AI) στη λειτουργία της έκδοσής σας, ανεξάρτητα από το μέγεθος της οργάνωσής σας.

Η ώθηση πρέπει να έρθει από την κορυφή. Από την ίδια την κορυφή. Οι ανώτατοι εκτελεστικοί πρέπει να αγκαλιάσουν ένα όραμα για την πιθανώς μεταμορφωτική επίδραση της AI και να επικοινωνήσουν ένα πρόγραμμα στο προσωπικό σε όλη την οργάνωση. Το πρόγραμμα μπορεί να είναι λίγο περισσότερο από “πειραματιστείτε, καταγράψτε τα πειράματά σας και μοιραστείτε τα.” Αυτό είναι μια καλή αρχή.

The Economist αναφέρθηκε πρόσφατα σε μια οργανωτική τακτική για την υιοθέτηση νέας τεχνολογίας που ονομάζεται “η προσέγγιση φάρος.” Δημιουργείτε έναν φάρο επιλέγοντας μια υψηλού προφίλ απόδειξη της έννοιας που μπορεί να υλοποιηθεί γρήγορα, με την οποία όλοι μπορούν να σχετιστούν.

Οι εκδοτικές εταιρείες υστερούν λόγω του θορύβου που περιβάλλει τα πνευματικά δικαιώματα: οι συγγραφείς είναι αναστατωμένοι. Μια έρευνα του Authors Guild τον Μάιο του 2023 βρήκε ότι “90 τοις εκατό των συγγραφέων πιστεύουν ότι οι συγγραφείς πρέπει να αποζημιώνονται εάν το έργο τους χρησιμοποιείται για την εκπαίδευση τεχνολογιών γενετικής Τεχνητής Νοημοσύνης,” και 67 τοις εκατό δήλωσαν ότι “δεν ήταν σίγουροι αν τα συμβόλαια εκδόσεων ή οι όροι υπηρεσίας των πλατφορμών περιλαμβάνουν άδειες ή χορήγηση δικαιωμάτων για τη χρήση του έργου τους για οποιονδήποτε σκοπό σχετικό με την AI.” Αυτοί οι αβέβαιοι συγγραφείς ρωτούν τώρα τους εκδότες τους εάν η AI χρησιμοποιείται στην επεξεργασία ή την παραγωγή του έργου τους, και μερικοί ισχυροί συγγραφείς απαιτούν να μην χρησιμοποιείται. Αναζητούν το αντίστοιχο της AI ενός αρτοποιείου χωρίς φυστίκια.

Αυτό είναι ένα αγκάθινο πρόβλημα για τους εκδότες - αν δεν μπορείτε να χρησιμοποιήσετε την AI στα βιβλία που σχεδιάζετε να εκδώσετε, για τι μπορείτε να τη χρησιμοποιήσετε;

Ανάπτυξη και επικοινωνία πολιτικών AI

Παρά την ευρεία χρήση της, λίγοι εκδότες έχουν δημοσίως ορίσει τις πολιτικές τους για την AI και έχουν επικοινωνήσει τις προσεγγίσεις τους στην AI στο κοινό. Ο όρος ‘το κοινό’ έχει μια ολισθηρή σημασία εδώ, όταν σκεφτείτε τα διαφορετικά κοινά που απευθύνονται από εμπορικούς, επιστημονικούς και εκπαιδευτικούς εκδότες.

Για τους εμπορικούς εκδότες, το πιο σημαντικό κοινό είναι οι συγγραφείς και οι πράκτορές τους. Οι επιστημονικοί εκδότες αντιμετωπίζουν διαφορετικά εμπόδια, όταν εξετάζουν την υποσχόμενη επίδραση της AI στην έρευνα, και στη συνέχεια την πιο προβληματική επίδραση της AI στη μετατροπή της έρευνας σε αφήγηση (Ο Avi Staiman έγραψε μια στοχαστική ανάρτηση για αυτό το θέμα). Για τους εκπαιδευτικούς εκδότες, η καθιέρωση πολιτικών είναι δύσκολη, καθώς η επέκταση της AI στην πρακτική της διδασκαλίας, της εκπαίδευσης, είναι πολυδιάστατη και περίπλοκη.

Νομίζω ότι οι εκδότες αντιμετωπίζουν δύο μεγάλες προκλήσεις καθώς προχωρούν με τις τεχνολογίες Τεχνητής Νοημοσύνης. Η πρώτη είναι να αναπτύξουν μια εταιρική θέση σχετικά με το πώς να προσεγγίσουν γενικά την Τεχνητή Νοημοσύνη και πώς να ενσωματώσουν την Τεχνητή Νοημοσύνη στις ροές εργασίας τους. Η δεύτερη πρόκληση είναι να επικοινωνήσουν αυτή τη θέση, καθαρά και χωρίς αμφισημίες, στους ενδιαφερόμενους τους.

Οι πολιτικές των εκδοτών που έχω δει είναι κυρίως ελαττωματικές. Κάποιες από αυτές είναι στην πραγματικότητα πολιτικές που απευθύνονται εξωτερικά, στους συγγραφείς, με μια σειρά από προτροπές σχετικά με το τι είναι αποδεκτή πρακτική (όχι πολλά) και τι δεν είναι αποδεκτό (πολλά). Η πολιτική της O’Reilly “AI Use Policy for Talent Developing Content for O’Reilly” συνεχίζει για σελίδες και σελίδες, με εσωτερική καθοδήγηση, όπως “ΜΗΝ χρησιμοποιείτε κανένα OSS GenAI Models που παράγει λογισμικό Output που υπόκειται στους όρους μιας copyleft ή network viral open source license.”

Από την άλλη πλευρά, ο ακαδημαϊκός εκδότης Elsevier, στην ενότητα “Elsevier Policies” του ιστότοπού του, περιλαμβάνει δηλώσεις για τις “Αρχές Υπεύθυνης Τεχνητής Νοημοσύνης,” “Κείμενο και Εξαγωγή Δεδομένων,” και “Η χρήση της γενετικής Τεχνητής Νοημοσύνης και των τεχνολογιών που υποβοηθούνται από την Τεχνητή Νοημοσύνη στη συγγραφή για την Elsevier.”

Οι λίγες εσωτερικές, αδημοσίευτες πολιτικές εκδοτών που έχω δει είναι συντηρητικές, υπερβολικά έτσι. Αυτοί οι εκδότες αντέδρασαν πολύ γρήγορα στην ποικιλία των αντιληπτών και πιθανών απειλών, και στις ανησυχίες των συγγραφέων τους, και έχουν περιορίσει την ικανότητά τους να εμπλέκονται δυναμικά με αυτή την ταχέως αναπτυσσόμενη, ταχέως μεταβαλλόμενη τεχνολογία.

Είναι δεδομένο ότι θα χρησιμοποιούν την Τεχνητή Νοημοσύνη ‘υπεύθυνα,’ ό,τι κι αν σημαίνει αυτό. Είναι δεδομένο ότι έχουν την ύψιστη μέριμνα για την πνευματική ιδιοκτησία των συγγραφέων και για την επιθετική προστασία των πνευματικών δικαιωμάτων των συγγραφέων. (Αν και, φυσικά, αυτές οι γενικές αρχές πρέπει να δηλώνονται δημόσια και να επαναλαμβάνονται συχνά.)

Αλλά τι άλλο;

Θα επιτρέψουν στην Τεχνητή Νοημοσύνη να έχει ρόλο στις εκδοτικές εξαγορές; Μπορεί η Τεχνητή Νοημοσύνη να ρίξει μια ματιά στο slush pile;
Θα επιτρέψουν στην Τεχνητή Νοημοσύνη να έχει ρόλο στην αναπτυξιακή επιμέλεια, τη γραμμική επιμέλεια και την αντιγραφή επιμέλειας;
Θα επιτρέψουν στην Τεχνητή Νοημοσύνη να έχει ρόλο στον καθορισμό των εκτυπωτικών τρεξιμάτων και των κατανομών;
Στη δημιουργία προσβάσιμων αρχείων ηλεκτρονικών βιβλίων, συμπεριλαμβανομένου του εναλλακτικού κειμένου;
Στην υποβοήθηση της δημιουργίας ηχητικών βιβλίων σε περιπτώσεις όπου δεν είναι οικονομικά ρεαλιστικό να προσλάβουν ταλαντούχους ανθρώπινους αφηγητές;
Στην υποβοήθηση της μετάφρασης σε ξένες γλώσσες σε αγορές όπου τα δικαιώματα δεν θα πωλούνταν ποτέ;
Στην ανάπτυξη υλικού μάρκετινγκ σε μεγάλη κλίμακα;
Στην επικοινωνία με μεταπωλητές;

Αν ναι, πρέπει να το κάνουν σαφές και να εξηγήσουν ξεκάθαρα τη σκέψη πίσω από αυτές τις πολιτικές. Οι εκδότες πρέπει να είναι γενναίοι στην αντιμετώπιση των πολλών αντιρρήσεων των περισσότερων συγγραφέων σε αυτήν την εποχή φόβου και αμφιβολίας.

Επαγγελματικές σκέψεις

Μόνο οι μεγαλύτεροι εκδότες θα είναι σε θέση να προσλάβουν εξειδικευμένο προσωπικό για να δουλέψει με λογισμικό και συστήματα τεχνητής νοημοσύνης. Ο μέσος εκδότης θα θέλει να εκθέσει όλο το προσωπικό του σε εργαλεία τεχνητής νοημοσύνης, αναμένοντας ότι ο καθένας μπορεί να εξερευνήσει τη χρήση της τεχνητής νοημοσύνης για να βρει αποδοτικότητα στη δουλειά του.

Στο συνέδριο PubWest τον Φεβρουάριο του 2024 στην Αριζόνα, ένας ομιλητής από εκτός της εκδοτικής βιομηχανίας πρότεινε ότι μία από τις χρήσεις της τεχνητής νοημοσύνης θα είναι η αντικατάσταση των πρακτικάριων. Το δωμάτιο φούντωσε. Είχε καλές προθέσεις–πράγματι, μια αναφορά της 10ης Απριλίου 2024 στους New York Times περιγράφει πώς οι επενδυτικές τράπεζες της Wall Street κοιτάζουν να αντικαταστήσουν πολλούς από τους πρακτικάριους τους με τεχνητή νοημοσύνη. Παρομοίως στην εκδοτική βιομηχανία, μια προφανής ανησυχία είναι: πώς βρίσκεις ανώτερους αναλυτές αν δεν μπορούν να ξεκινήσουν ως κατώτεροι αναλυτές;

Η εκδοτική βιομηχανία πάντα βασιζόταν σε πρακτικές. Μια μελέτη του 2019 βρήκε ότι το 80 τοις εκατό των ανθρώπων που είχαν δουλέψει στην εκδοτική βιομηχανία για λιγότερο από δεκαπέντε χρόνια είχαν προηγουμένως κάνει πρακτική.

Εν μέρει είναι ένας τρόπος να ολοκληρωθεί η ανιαρή δουλειά σε λογικό κόστος. Αλλά αυτό ωχριά μπροστά στην μεγαλύτερη πραγματικότητα ότι καμία σχολή εκδόσεων δεν μπορεί να εξοπλίσει κάποιον να ενταχθεί σε μια εκδοτική εταιρεία στο επίπεδο του μεσαίου διευθυντή. Ο μόνος τρόπος να αναπτυχθεί το εξειδικευμένο προσωπικό του αύριο είναι να εκπαιδεύονται πρακτικάριοι και μαθητευόμενοι σήμερα.

Ο στόχος εδώ δεν είναι να αντικατασταθούν οι πρακτικάριοι με τεχνητή νοημοσύνη, αλλά αντίθετα να γίνει η δουλειά τους πιο παραγωγική και ανταποδοτική χρησιμοποιώντας εργαλεία τεχνητής νοημοσύνης, προς όφελος τόσο του πρακτικάριου όσο και της εκδοτικής εταιρείας.

Τεχνητή Νοημοσύνη για Ηχητικά Βιβλία

Η τεχνητή νοημοσύνη για ηχητικά βιβλία λειτουργεί πολύ καλά. Δεν είναι τέλεια, αλλά λειτουργεί. Οι συγγραφείς και οι εκδότες χρησιμοποιούν πλέον τακτικά εργαλεία τεχνητής νοημοσύνης στην παραγωγή ηχητικών βιβλίων, κυρίως για βιβλία όπου η παραγωγή ηχητικών βιβλίων με πλήρη αφηγητές δεν είναι οικονομικά εφικτή. Και όχι μόνο για ηχητικά βιβλία στα αγγλικά, αλλά και ηχητικά βιβλία σε μετάφραση.

Η χρήση τεχνητής νοημοσύνης για ηχητικά βιβλία δεν είναι καινούργια. Πρώτη φορά ανέφερα για την τάση αυτή στο Publishers Weekly το 2021. Αλλά τα νεότερα μεγάλα γλωσσικά μοντέλα έχουν αναζωογονήσει την τεχνολογία για αυτοματοποιημένη αφήγηση ηχητικών βιβλίων.

Πίσω στο 2021 σημείωσα “Είναι τέλειο; Βεβαίως όχι. Μπορεί να είναι αρκετά καλό; Πιθανώς, αν ένας εκδότης είναι πρόθυμος να αφιερώσει τον απαραίτητο χρόνο στη φάση επεξεργασίας της φωνής του έργου.” Δυόμισι χρόνια αργότερα, σύμφωνα με πολλές απόψεις, οι φωνές AI είναι αδιάκριτες από τις ανθρώπινες φωνές, εκτός αν ακούσεις πολύ προσεκτικά.

Τον περασμένο Νοέμβριο η Meta (Facebook) παρουσίασε το “Seamless,” το οποίο είναι ικανό να “μεταφέρει τόνους, συναισθηματική έκφραση και χαρακτηριστικά στυλ φωνής” στη μετάφραση 200 γλωσσών. Ένα ηχητικό βιβλίο μπορεί να μεταφραστεί άμεσα σε πολλές γλώσσες με εξαιρετική ποιότητα.

Επίσης το 2021 ανέφερα ότι “Το μπλοκάρισμα της Audible στη διανομή ηχητικών βιβλίων με μη ανθρώπινους αφηγητές είναι ένα πραγματικό πρόβλημα που μπορεί να πάρει κάποιο χρόνο να λυθεί.” Εν τω μεταξύ, τόσο η Google όσο και η Apple ανακοίνωσαν προγράμματα που επιτρέπουν στους συγγραφείς να δημιουργούν ηχητικά βιβλία με φωνές που παράγονται από AI. Στις 5 Δεκεμβρίου, το Findaway Voices από το Spotify άρχισε να δέχεται “ηχητικά βιβλία με ψηφιακή αφήγηση φωνής από τα Google Play Books για διανομή σε επιλεγμένους συνεργάτες λιανικής.”

Στις αρχές Νοεμβρίου 2023 η Amazon ανακοίνωσε ότι οι συγγραφείς του Kindle Direct Publishing (KDP) θα έχουν σύντομα πρόσβαση σε μια υπηρεσία που θα τους επιτρέπει να “παράγουν γρήγορα και εύκολα μια έκδοση ηχητικού βιβλίου του ebook τους χρησιμοποιώντας εικονική αφήγηση φωνής, μια συνθετική τεχνολογία ομιλίας.” Τον Ιανουάριο του 2024, η Jane Friedman ανέφερε (paywall) “Η Audible ήσυχα άρχισε να επιτρέπει ηχητικά βιβλία με αφήγηση AI να μπαίνουν στο κατάστημά της αργά το περασμένο φθινόπωρο, πολύ αργότερα από ότι άλλοι λιανοπωλητές.”

Και, φυσικά, χρησιμοποιώ AI για τις εκδόσεις ηχητικών βιβλίων αυτού του βιβλίου.

AI για Μετάφραση Βιβλίων

Το AI για τη μετάφραση βιβλίων λειτουργεί. Ίσως όχι τόσο καλά όσο λειτουργεί για τη δημιουργία ηχητικών βιβλίων αυτόματα. Αλλά πλησιάζει πολύ γρήγορα. Η μη λογοτεχνική μυθοπλασία θα μπορούσε να είναι η πρώτη. Η λογοτεχνική μυθοπλασία μπορεί να ακολουθήσει. Η μη λογοτεχνία θέτει ένα διαφορετικό σύνολο προκλήσεων.

Φιλοξένησα ένα διαδικτυακό σεμινάριο για το AI για τη μετάφραση βιβλίων, το οποίο χορηγήθηκε από το BISG, τον Ιούνιο του 2024. Το βίντεο είναι διαθέσιμο στο YouTube. Η Jane Friedman περιέγραψε επίσης το πρόγραμμα στο ενημερωτικό της δελτίο Hot Sheet.

Το θέμα είναι περίπλοκο και λεπτομερές. Ένα πράγμα που βρίσκω συναρπαστικό είναι πόσο καιρό προσπαθούν οι άνθρωποι να αυτοματοποιήσουν τη μετάφραση. Είναι μια υπενθύμιση ότι τα βιβλία, που γεμίζουν το σύμπαν μας, είναι ένα τόσο μικρό ποσοστό της γραπτής επικοινωνίας, ακόμη περισσότερο στην εποχή του διαδικτύου.

Ο Warren Weaver, που θεωρείται ο πατέρας της μετάφρασης μηχανής (MT), σημείωσε σε έναν συνάδελφο, «Όταν κοιτάζω ένα άρθρο στα Ρωσικά, λέω: ‘Αυτό είναι πραγματικά γραμμένο στα Αγγλικά, αλλά έχει κωδικοποιηθεί σε κάποια παράξενα σύμβολα. Τώρα θα προχωρήσω στην αποκωδικοποίηση.’» Για μια μηχανή, η γλώσσα είναι απλά κώδικας. Δεν είναι πολιτισμός και συναίσθημα και το μεγαλείο της γραπτής γλώσσας. Είναι ένα έργο με αριθμούς και κώδικα.

Είναι σαφές ότι το χάσμα μεταξύ μυθοπλασίας και μη μυθοπλασίας θα είναι μεγάλο στην μετάφραση με AI. Το Chat AI είναι ισχυρό στο στυλ, αλλά υστερεί στα γεγονότα. Είναι πολύ νωρίς, αλλά κλίνω προς την άποψη ότι το Chat AI θα λάμψει με τη μυθοπλασία, αλλά θα υστερεί με τη μη μυθοπλασία. (Παρ’ όλα αυτά, προχωρώ στη μηχανική μετάφραση αυτού του γεμάτου γεγονότα βιβλίου!)

Η λογοτεχνική μυθοπλασία είναι πολύ το «ελέφαντας στο δωμάτιο». Είναι πολύτιμη και σεβαστή και δικαίως. Οι μεταφραστές μπορούν να περάσουν ώρες συζητώντας για μια μόνο λέξη ή φράση. Το Chat AI πρέπει να προχωρήσει προσεκτικά σε αυτά τα νερά.

Αλλά αυτό είναι γόνιμο έδαφος. Όσο μπορώ να προσδιορίσω (από ελάχιστα δεδομένα), υπήρχαν μόνο 9.500 μεταφράσεις εμπορικών βιβλίων το 2023. Ακόμα κι αν κάνω λάθος κατά μεγάλο παράγοντα, είναι σαφές ότι λίγα βιβλία μεταφράζονται από ξένες γλώσσες στα Αγγλικά.

Παρομοίως, βρήκα ένα στατιστικό στοιχείο που δείχνει ότι το 2023 υπήρχαν μόνο 7.230 μεταφράσεις από τα Αγγλικά στα Ισπανικά (στις ισπανικές αγορές βιβλίων). Αυτό φαίνεται γελοία μικρό.

Υπάρχει μια τεράστια ευκαιρία εδώ.

Το μεγαλύτερο μέρος της χρήσης του AI για τη μετάφραση βιβλίων θα είναι για βιβλία όπου η μετάφραση δεν θεωρήθηκε ποτέ οικονομικά εφικτή. Είναι βέβαιο ότι θα υπάρξει αντίκτυπος στις θέσεις εργασίας των μεταφραστών των «μεσαίων» βιβλίων· η ανάπτυξη θέσεων εργασίας θα είναι στη διαχείριση έργων και στον ποιοτικό έλεγχο. Θα αντισταθμίσει αυτό την απώλεια θέσεων εργασίας; Απίθανο.

Όπως και με τις περισσότερες πτυχές του AI, υπάρχουν προκλητικά ζητήματα που πρέπει να αντιμετωπιστούν και καμία εύκολη απάντηση.

Όπως σημειώνω στην ενότητα του λογισμικού, οι Leanpub και DeepL είναι οι δύο εταιρείες που προσφέρουν υπηρεσίες μετάφρασης βιβλίων με τη βοήθεια AI σε συγγραφείς και εκδότες.

AI για Ακαδημαϊκές Εκδόσεις

Οι εμπορικοί εκδότες και οι συγγραφείς όλων των κατηγοριών θα έκαναν καλά να παρακολουθούν την πορεία του AI στην ακαδημαϊκή κοινότητα των εκδόσεων. Προχωράει πολύ πιο γρήγορα από ό,τι στις εκδόσεις καταναλωτών.

Βλέπω δύο λόγους για την πρόοδο. Πρώτον, οι συγγραφείς στον ακαδημαϊκό εκδοτικό τομέα είναι ακαδημαϊκοί επαγγελματικά, και στον τομέα ΕΤΜ (επιστημονικός, τεχνικός και ιατρικός), είναι συχνά επιστήμονες με προχωρημένα πτυχία. Εκτός από την έκδοση, ερευνούν και συχνά υιοθετούν την AI στη δουλειά τους. Θα ήταν πιο έκπληκτοι να διαπιστώσουν ότι ο εκδότης τους δεν εξερευνά τη χρήση της AI στην επεξεργασία και την έκδοση της δουλειάς τους.

Αυτό μεταφέρεται στο οικοσύστημα της ακαδημαϊκής έκδοσης, όπου, συχνά, οι εκδότες είναι και αυτοί ακαδημαϊκοί. Για αυτούς, η τεχνολογία δεν είναι τρομακτική.

Δεν θα αναλύσω περαιτέρω τις λεπτομέρειες σε αυτό το βιβλίο. Θα αναφέρω περισσότερα στο ιστολόγιό μου.

AI για Συγγραφείς

Οι συγγραφείς και οι εκδότες συχνά βλέπουν τους εαυτούς τους να ζουν σε δύο απομονώσεις, συνδεδεμένοι, αλλά ουσιαστικά χωριστά. Αυτό ήταν σε μεγάλο βαθμό αληθινό στη σύγχρονη έκδοση.

Οι καιροί αλλάζουν. Όπου οι εκδότες ήταν κάποτε ανέγγιχτοι, οι κορυφαίοι συγγραφείς τώρα έχουν τον έλεγχο. Όπως συζητάω αλλού, οι αυτοεκδιδόμενοι συγγραφείς είναι οι πρωτοπόροι. Φέρουν λίγη από τη βαριά κληρονομιά που επιβαρύνει την παραδοσιακή έκδοση.

Όταν οι εκδότες κοιτάζουν την AI, βλέπουν λίγες ευκαιρίες. Όταν μιλάω με συγγραφείς για την AI, ο κόσμος είναι η στρείδι τους. Οι δυνατότητες είναι σχεδόν ατελείωτες:

Συγγραφή και επεξεργασία

Προσπάθεια συγγραφής και έκδοσης ολόκληρων βιβλίων
Προσπάθεια ιδεών για ένα νέο έργο
Προσπάθεια ιδεών μέσα σε ένα νέο βιβλίο
Λεπτομερής βελτίωση της ιστορίας
Έρευνα
Έλεγχος γεγονότων
Συγγραφικός σύντροφος
Εξελικτική επιμέλεια
Επιμέλεια αντιγράφων
Έλεγχος ορθογραφίας και γραμματικής
Διόρθωση κειμένου

Εικονογράφηση/Απεικόνιση

Δημιουργία εικονογραφήσεων και διαγραμμάτων
Προσχέδια εξωφύλλου
Προωθητικά βίντεο

Μάρκετινγκ

Αυτοματοποίηση υποβολών σε πράκτορες, εκδότες, διαγωνισμούς, φίλους, αιτήσεις συστάσεων
Δημιουργία υλικού μάρκετινγκ: δελτία τύπου, αναρτήσεις ιστολογίου, κοινωνικά μέσα, κ.λπ.
Δημιουργία ιστοσελίδων

Οι συγγραφείς θα οδηγήσουν μεγάλο μέρος της αλλαγής στην υιοθέτηση της AI από τη βιομηχανία, είτε υπέρ είτε κατά.

Είναι οι δικαιούχοι μεγάλου μέρους της καινοτομίας των startup γύρω από την AI στη συγγραφή και την έκδοση - περίπου το 70% των startup αναζητούν να συνεργαστούν με τους συγγραφείς στα ταξίδια τους.

Ανησυχίες και Κίνδυνοι γύρω από την AI

Οι ανησυχίες γύρω από την AI είναι σοβαρές. Οι κίνδυνοι είναι πραγματικοί. Μερικές φορές εκφράζονται με υστερικό τρόπο, αλλά, όταν αναλύουμε σε βάθος, η επίδραση της AI έχει τη δυνατότητα να είναι τεράστια καταστροφική.

Υπάρχουν τόσα πολλά ζητήματα και ανησυχίες γύρω από την Τεχνητή Νοημοσύνη που γεμίζουν τόμους από μόνα τους. Εδώ είναι ένα σύννεφο λέξεων με τα θέματα που παρακολουθώ. Είμαι σίγουρος ότι λείπουν μερικά.

Ένα σύννεφο λέξεων γύρω από τον όρο 'Τεχνητή Νοημοσύνη', με σχετικούς όρους όπως 'ανησυχίες', 'ηθική' και 'ανθρωπότητα' γύρω του.

Υπάρχουν πολλές πληροφορίες διαθέσιμες για καθένα από αυτά τα θέματα, και σας ενθαρρύνω να διαβάσετε όσο πιο βαθιά μπορείτε. Είναι πιθανό να καταλήξετε στο συμπέρασμα ότι οι κίνδυνοι υπερτερούν των οφελών και ότι δεν θέλετε να ακολουθήσετε τη χρήση της Τεχνητής Νοημοσύνης, είτε προσωπικά είτε μέσα στην οργάνωσή σας. Αυτή η απόφαση φέρνει τους δικούς της κινδύνους· τον συνήθη, να μείνετε πίσω. Αλλά είναι μια προσωπική επιλογή.

Αν ψάξετε στο Google “βιβλία σχετικά με τους κινδύνους της Τεχνητής Νοημοσύνης” θα βρείτε μια επιλογή από αξιόλογους τόμους. Ένα πρόσφατο podcast που βρήκα ιδιαίτερα ανατριχιαστικό ήταν η συζήτηση του Ezra Klein με τον Dario Amodei, συνιδρυτή και CEO της Anthropic (η εταιρεία που αναπτύσσει το Claude.ai). Μαθαίνετε ότι αυτές οι εταιρείες είναι ενήμερες για τους κινδύνους. Ο Amodei αναφέρεται σε ένα εσωτερικό σύστημα κατάταξης κινδύνου που ονομάζεται A.S.L., για τα “Επίπεδα Ασφάλειας Τεχνητής Νοημοσύνης” (όχι American Sign Language). Βρισκόμαστε αυτή τη στιγμή στο ASL 2, “συστήματα που δείχνουν πρώιμα σημάδια επικίνδυνων δυνατοτήτων - για παράδειγμα, ικανότητα να δίνουν οδηγίες για το πώς να κατασκευάσετε βιολογικά όπλα.” Περιγράφει το ASL 4 ως “επιτρέποντας σε κρατικούς φορείς να αυξήσουν σημαντικά την ικανότητά τους… όπου θα ανησυχούσαμε ότι η Βόρεια Κορέα ή η Κίνα ή η Ρωσία θα μπορούσαν να ενισχύσουν σημαντικά τις επιθετικές τους δυνατότητες σε διάφορους στρατιωτικούς τομείς με την Τεχνητή Νοημοσύνη με τρόπο που θα τους έδινε ένα σημαντικό πλεονέκτημα στο γεωπολιτικό επίπεδο.” Ανατριχιαστικά πράγματα.

Μέσα σε αυτό το ζοφερό πλαίσιο, θα τονίσω τα πιο σημαντικά ζητήματα για συγγραφείς και εκδότες.

Παραβίαση πνευματικών δικαιωμάτων;

Τα ζητήματα πνευματικών δικαιωμάτων είναι ένας μίγμα πολυπλοκότητας και αμφισημίας. Φαίνεται βέβαιο ότι μερικά βιβλία που εξακολουθούν να καλύπτονται από πνευματικά δικαιώματα περιλήφθηκαν στην εκπαίδευση ορισμένων LLMs. Αλλά σίγουρα δεν είναι η περίπτωση, όπως φοβούνται μερικοί συγγραφείς, ότι όλο το έργο τους απορροφήθηκε σε κάθε ένα από τα μεγάλα γλωσσικά μοντέλα.

Τα ζητήματα πνευματικών δικαιωμάτων είναι τόσο συγκεκριμένα όσο και γενικά. Είναι γνωστό ότι όλα τα LLMs εκπαιδεύονται στο ανοιχτό διαδίκτυο—ό,τι μπορεί να συλλεχθεί από τα 1,5 δισεκατομμύρια ιστότοπους στο διαδίκτυο σήμερα, είτε πρόκειται για εφημερίδες, αναρτήσεις στα κοινωνικά μέσα, ιστολόγια και, προφανώς, απομαγνητοφωνήσεις βίντεο στο YouTube.

Είναι αποδεδειγμένο ότι τουλάχιστον ένα από τα LLMs κατανάλωσε το πραγματικό κείμενο χιλιάδων βιβλίων που δεν είναι στο δημόσιο τομέα.

Ήταν νόμιμο να καταναλωθεί όλο αυτό το κείμενο για να βοηθήσει στην κατασκευή εταιρειών AI δισεκατομμυρίων δολαρίων, χωρίς καμία αποζημίωση για τους συγγραφείς; Οι εταιρείες AI κάνουν το επιχείρημά τους γύρω από την εύλογη χρήση· τα δικαστήρια θα αποφασίσουν τελικά. Ακόμα και αν ήταν νόμιμο, ήταν ηθικό ή ηθικό; Η ηθική φαίνεται λιγότερο περίπλοκη από τις νομικές σκέψεις. Εσείς αποφασίζετε.

Οι νόμοι που αφορούν τα πνευματικά δικαιώματα προφανώς δεν προέβλεψαν τις μοναδικές προκλήσεις που φέρνει η AI στο ζήτημα, και η αναζήτηση νομικών λύσεων θα πάρει χρόνο, ίσως και χρόνια. (Αν θέλετε να εμβαθύνετε γιατί οι νόμοι δεν είναι κατάλληλοι για το συγκεκριμένο πρόβλημα, διαβάστε το εξαιρετικό άρθρο των A. Feder Cooper και James Grimmelmann με τίτλο “Τα αρχεία είναι στον υπολογιστή: Πνευματικά δικαιώματα, απομνημόνευση και γεννητική AI.”)

Εδώ είναι μια λίστα με δεκατρείς από τις πιο εξέχουσες αγωγές, όχι όλες να έχουν σχέση με βιβλία· επίσης εικόνες και μουσική. Και να μια άλλη λίστα που ενημερώνει την κατάσταση όλων των αγωγών.

Πνευματικά δικαιώματα και AI για συγγραφείς

Οι συγγραφείς αντιμετωπίζουν επιπλέον ζητήματα που σχετίζονται με τη δυνατότητα πνευματικών δικαιωμάτων του περιεχομένου που δημιουργείται από AI.

Η θέση του Γραφείου Πνευματικών Δικαιωμάτων των ΗΠΑ σχετικά με τη δυνατότητα πνευματικών δικαιωμάτων του περιεχομένου που δημιουργείται από AI δηλώνει ότι η AI μόνη της δεν μπορεί να κατέχει πνευματικά δικαιώματα επειδή της λείπει η νομική κατάσταση του συγγραφέα. Αυτό έχει νόημα. Αλλά αυτό υποθέτει ότι το 100% της εργασίας είναι η δημιουργία της AI. Όπως συζητήθηκε αλλού, λίγοι συγγραφείς θα αφήσουν την AI να δημιουργήσει ολόκληρο το βιβλίο. Πιο πιθανό θα είναι 5%, ή 10% ή… Και εδώ το Γραφείο Πνευματικών Δικαιωμάτων σκοντάφτει (όπως κι εγώ).

Σε μια πιο πρόσφατη απόφαση, το Γραφείο κατέληξε ότι ένα γραφικό μυθιστόρημα που αποτελείται από κείμενο γραμμένο από ανθρώπους σε συνδυασμό με εικόνες που δημιουργήθηκαν από την υπηρεσία Τεχνητής Νοημοσύνης Midjourney αποτελεί προστατευόμενο έργο από πνευματικά δικαιώματα, αλλά οι μεμονωμένες εικόνες αυτές καθαυτές δεν μπορούσαν να προστατευτούν από πνευματικά δικαιώματα. Απίστευτο!

Αρκεί να πούμε ότι οι συγγραφείς και οι εκδότες πρέπει να είναι σε εγρήγορση για τις εξελισσόμενες εκκρεμότητες πνευματικών δικαιωμάτων, σε πολλαπλά μέτωπα.

Ποιες είναι οι μακροπρόθεσμες επιπτώσεις;

Κάποιοι συγκρίνουν τη σημερινή δικαστική διαμάχη με την υπόθεση Google books, η οποία χρειάστηκε 10 χρόνια για να επιλυθεί νομικά. Ποιος ξέρει πόσο καιρό θα καθυστερήσει η διαδικασία των εφέσεων για αυτές τις καταθέσεις. Εν τω μεταξύ, οι εκδότες είναι συνετοί να ενεργούν σαν να πρόκειται να χάσουν οι εταιρείες Τεχνητής Νοημοσύνης, πράγμα που, τουλάχιστον θεωρητικά, εκθέτει όποιον αδειοδοτεί ή ίσως ακόμα και χρησιμοποιεί το Chat AI, σε κάποιο είδος ενδεχόμενης ευθύνης.

Αλλά αυτό δεν είναι το πιο σοβαρό ζήτημα για έναν εκδότη. Είναι η αντίληψη. Για πολλούς συγγραφείς, μερικοί εξέχοντες, μερικοί άγνωστοι, το πηγάδι έχει δηλητηριαστεί. Η Τεχνητή Νοημοσύνη είναι ραδιενεργή μέσα στην κοινότητα της συγγραφής και της έκδοσης. Οτιδήποτε μυρίζει Τεχνητή Νοημοσύνη προκαλεί έντονη κριτική.

Υπάρχουν πολλά παραδείγματα. Σε ένα πρόσφατο περιστατικό, η Angry Robot, ένας εκδότης στο Ηνωμένο Βασίλειο “αφιερωμένος στο καλύτερο της σύγχρονης ενήλικης επιστημονικής φαντασίας, φαντασίας και WTF,” ανακοίνωσε ότι θα χρησιμοποιούσε λογισμικό Τεχνητής Νοημοσύνης, που ονομάζεται Storywise, για να ξεχωρίσει μια αναμενόμενη μεγάλη ποσότητα υποβολών χειρογράφων. Χρειάστηκαν μόλις πέντε ώρες για την εταιρεία να εγκαταλείψει το σχέδιο και να επιστρέψει στο “παλιό inbox.“

Το αφόρητο δίλημμα για τους εκδότες εμπορικών βιβλίων στη χρήση εργαλείων Τεχνητής Νοημοσύνης εσωτερικά: αν οι συγγραφείς σας το ανακαλύψουν, θα δυσκολευτείτε να αντέξετε την επακόλουθη καταιγίδα. Πιστεύω ότι οι εκδότες δεν έχουν άλλη επιλογή παρά να είναι γενναίοι, να υιοθετήσουν (τουλάχιστον μερικά από) τα εργαλεία, να εξηγήσουν καθαρά πώς εκπαιδεύονται αυτά τα εργαλεία και πώς χρησιμοποιούνται, και να προχωρήσουν.

Στο Ηνωμένο Βασίλειο, Η Εταιρεία Συγγραφέων ακολουθεί σκληρή γραμμή: “Ζητήστε από τον εκδότη σας να επιβεβαιώσει ότι δεν θα κάνει ουσιαστική χρήση της Τεχνητής Νοημοσύνης για κανέναν σκοπό σε σχέση με το έργο σας-όπως η διόρθωση, η επιμέλεια (συμπεριλαμβανομένων των αναγνώσεων αυθεντικότητας και του ελέγχου γεγονότων), η κατάρτιση ευρετηρίου, η νομική αξιολόγηση, ο σχεδιασμός και η διάταξη, ή οτιδήποτε άλλο χωρίς τη συγκατάθεσή σας. Μπορεί να θελήσετε να απαγορεύσετε την αφήγηση ακουστικών βιβλίων, τη μετάφραση, και τον σχεδιασμό εξωφύλλου που δημιουργούνται από την Τεχνητή Νοημοσύνη.”

Η Συγγραφική Ένωση φαίνεται να δέχεται ότι “οι εκδότες αρχίζουν να εξερευνούν τη χρήση της τεχνητής νοημοσύνης ως εργαλείο στη συνηθισμένη πορεία των λειτουργιών τους, συμπεριλαμβανομένων των χρήσεων στην επεξεργασία και το μάρκετινγκ.” Δεν νομίζω ότι πολλά μέλη της Ένωσης είναι τόσο κατανοητικά.

Άδεια χρήσης περιεχομένου σε εταιρείες τεχνητής νοημοσύνης

Οι περισσότεροι εκδότες και πολλοί συγγραφείς αναζητούν τρόπους να δώσουν άδεια χρήσης του περιεχομένου τους σε εταιρείες τεχνητής νοημοσύνης. Ο καθένας έχει διαφορετική άποψη για το ποιοι θα πρέπει να είναι οι όροι της άδειας χρήσης και πόσο αξίζει το περιεχόμενό τους, αλλά τουλάχιστον οι συζητήσεις έχουν ξεκινήσει.

Υπάρχουν αρκετές νεοφυείς επιχειρήσεις που επιθυμούν να συνεργαστούν με εκδότες (και, σε μερικές περιπτώσεις, με μεμονωμένους συγγραφείς). Calliope Networks και Created by Humans είναι και οι δύο ενδιαφέρουσες από αυτή την άποψη.

Στα μέσα Ιουλίου, το Copyright Clearance Center, ο κύριος παίκτης της βιομηχανίας στη συλλογική άδεια πνευματικών δικαιωμάτων, ανακοίνωσε τη διαθεσιμότητα “δικαιωμάτων επαναχρησιμοποίησης τεχνητής νοημοσύνης (AI) εντός των Ετήσιων Αδειών Πνευματικών Δικαιωμάτων (ACL), μια λύση άδειας χρήσης περιεχομένου για επιχειρήσεις που προσφέρει δικαιώματα από εκατομμύρια έργα σε επιχειρήσεις που εγγράφονται.”

Το Publishers Weekly κάλυψε την ανακοίνωση παραθέτοντας τη Tracey Armstrong, πρόεδρο και CEO του CCC, να λέει “Είναι δυνατόν να είσαι υπέρ της AI και υπέρ των πνευματικών δικαιωμάτων, και να συνδυάσεις την AI με τον σεβασμό προς τους δημιουργούς.”

Αν και δεν είναι πλήρης, αυτό πιθανότατα είναι ένα σημαντικό βήμα προς την κατεύθυνση της συνεργασίας των εκδοτικών οίκων με τους προγραμματιστές μεγάλων γλωσσικών μοντέλων.

Είναι πολύ αργά για να αποφύγουμε την τεχνητή νοημοσύνη

Για τους συγγραφείς και τους εκδότες που προτιμούν να μην μολυνθούν από την AI, τα νέα είναι κακά: χρησιμοποιείτε AI σήμερα και το κάνετε εδώ και χρόνια.

Η τεχνητή νοημοσύνη, σε διάφορες μορφές, έχει ήδη ενσωματωθεί στα περισσότερα λογισμικά εργαλεία και υπηρεσίες που χρησιμοποιούμε καθημερινά. Οι άνθρωποι βασίζονται σε εργαλεία ελέγχου ορθογραφίας και γραμματικής που χρησιμοποιούν τεχνητή νοημοσύνη σε προγράμματα όπως το Microsoft Word ή το Gmail. Το Microsoft Word και το PowerPoint χρησιμοποιούν AI για να παρέχουν προτάσεις γραφής, να προσφέρουν προτάσεις σχεδιασμού και διάταξης, και άλλα. Οι εικονικοί βοηθοί όπως η Siri και η Alexa χρησιμοποιούν επεξεργασία φυσικής γλώσσας για να κατανοήσουν φωνητικές εντολές και να απαντήσουν σε ερωτήσεις. Οι υπηρεσίες email χρησιμοποιούν AI για να φιλτράρουν μηνύματα, να ανιχνεύουν ανεπιθύμητα μηνύματα και να στέλνουν ειδοποιήσεις. Η τεχνητή νοημοσύνη τροφοδοτεί τα chatbot εξυπηρέτησης πελατών και δημιουργεί προτάσεις προϊόντων με βάση το ιστορικό των αγορών σας.

Και πολλά από αυτά βασίζονται σε Μεγάλα Μοντέλα Γλώσσας, όπως συμβαίνει με το ChatGPT.

Για έναν συγγραφέα ή έναν επιμελητή να πει, “Δεν θέλω να χρησιμοποιηθεί ΤΝ στο χειρόγραφό μου,” είναι, γενικά μιλώντας, σχεδόν αδύνατο, εκτός αν τόσο αυτοί όσο και οι επιμελητές τους δουλεύουν με γραφομηχανές και μολύβια.

Θα μπορούσαν να προσπαθήσουν να πουν, “Δεν θέλω γενετική ΤΝ” να χρησιμοποιηθεί στο βιβλίο τους. Αλλά αυτό είναι δύσκολο να το διαχωρίσεις. Το λογισμικό ελέγχου γραμματικής δεν κατασκευάστηκε αρχικά πάνω στη γενετική ΤΝ. Το Grammarly το έχει προσθέσει ως συστατικό στο προϊόν του, όπως θα κάνουν και όλα τα άλλα προγράμματα ελέγχου ορθογραφίας και γραμματικής. Η γενετική ΤΝ είναι επίσης κεντρική στο λογισμικό μάρκετινγκ που προσφέρεται.

Όταν οι συγγραφείς χρησιμοποιούν ΤΝ

Ένα άλλο θέμα που αφορά τους συγγραφείς και τη χρήση της ΤΝ έχει ομοιότητες με το ζήτημα των πνευματικών δικαιωμάτων που συζητήθηκε παραπάνω. Στην ακραία περίπτωση, βλέπουμε περιεχόμενο που παράγεται 100% από ΤΝ να δημοσιεύεται στο Amazon. Το μεγαλύτερο μέρος του (όλο του;) είναι απαίσιο, αλλά αυτό δεν το εμποδίζει να δημοσιευτεί. (Δείτε επίσης την ενότητα του Amazon.) Πιο ανησυχητικό για τους εκδότες είναι οι υποβολές που παράγονται από ΤΝ. Ναι, η ΤΝ αυξάνει την ποσότητα, αλλά οι μεγάλοι εκδότες έχουν ήδη φίλτρο για την ποσότητα. Τα φίλτρα ονομάζονται πράκτορες. Αυτοί είναι που θα πρέπει να βρουν πώς να χειριστούν το πρόβλημα της ποσότητας και προφανώς θα πρέπει να βρουν μια λύση που δεν χρησιμοποιεί ΤΝ.

Είναι κάπως ένα υπαρξιακό πρόβλημα—θέλω να εκδώσω ένα βιβλίο γραμμένο από ‘ένα μηχάνημα’; Για τους περισσότερους εκδότες αυτό είναι ένα αδιαμφισβήτητο ‘όχι.’ Εύκολο. Λοιπόν, τι γίνεται με ένα βιβλίο όπου το 50% του περιεχομένου δημιουργήθηκε από ένα Μεγάλο Μοντέλο Γλώσσας, υπό την επίβλεψη ενός ικανού συγγραφέα; Χμμ, ας προσπαθήσουμε ένα ‘όχι’ και σε αυτό. ΟΚ: τότε τι γίνεται με το 25%, ή το 10%, ή το 5%; Πού τραβάτε τη γραμμή;

Και, τώρα που έχετε μπει στην επιχείρηση του να σχεδιάζετε γραμμές, πώς επιλύετε το δίλημμα ότι τα εργαλεία ελέγχου ορθογραφίας και γραμματικής τώρα βασίζονται, τουλάχιστον εν μέρει, στην γενετική ΤΝ; Τι γίνεται με τα εργαλεία μεταγραφής που βασίζονται στην ΤΝ, όπως το Otter.ai, ή το χαρακτηριστικό μεταγραφής που είναι ενσωματωμένο στο Microsoft Word;

Δεν μπορώ να βρω κανέναν εκδότη εμπορίου που να έχει δηλώσει ότι δεν θα δημοσιεύσει έργο με προ-καθορισμένη ποσότητα κειμένου που δημιουργήθηκε από ΤΝ. Εδώ είναι η άποψη της Authors Guild για το θέμα:

“Εάν ένα αξιοσημείωτο ποσοστό AI-δημιουργημένου κειμένου, χαρακτήρων ή πλοκής ενσωματωθεί στο χειρόγραφό σας, πρέπει να το αποκαλύψετε στον εκδότη σας και θα πρέπει επίσης να το αποκαλύψετε στον αναγνώστη. Δεν πιστεύουμε ότι είναι απαραίτητο οι συγγραφείς να αποκαλύπτουν τη χρήση γενετικού AI όταν χρησιμοποιείται απλώς ως εργαλείο για καταιγισμό ιδεών, δημιουργία ιδεών ή για επιμέλεια κειμένου.”

Αναμφίβολα, ο όρος ‘αξιοσημείωτο’ δεν ορίζεται (η Οξφόρδη το ορίζει ως “αρκετά μεγάλο για να γίνει αντιληπτό ή να θεωρηθεί σημαντικό”), αλλά η ανάρτηση συνεχίζει εξηγώντας ότι η συμπερίληψη περισσότερου από “de minimis AI-δημιουργημένου κειμένου” θα παραβίαζε τα περισσότερα εκδοτικά συμβόλαια. De minimis, σε νομικούς όρους, δεν καθορίζεται με ακρίβεια, αλλά, γενικά μιλώντας, σημαίνει περίπου το ίδιο με το αξιοσημείωτο.

Μπορεί να ανιχνευθεί το AI στη γραφή;

Φιλοξένησα ένα διαδικτυακό σεμινάριο για την ανίχνευση AI, που χορηγήθηκε από το BISG, τον Μάιο του 2024. Η επανάληψη είναι διαθέσιμη στο YouTube. Η Jane Friedman προσέφερε μια ολοκληρωμένη ανασκόπηση του σεμιναρίου στο ενημερωτικό της δελτίο Hot Sheet.

Για πολλούς συγγραφείς, η τοξικότητα του AI σημαίνει να το κρατούν μακριά από τα λόγια τους. Οι εκδότες φέρουν ένα ιδιαίτερο βάρος - δεν δημιουργούν το κείμενο, αλλά, μόλις δημοσιευθεί, αναλαμβάνουν μια σημαντική υποχρέωση προς το κείμενο. Έχουμε δει πολλές εκρηκτικές καταστάσεις κοντά σε εμπρηστικά βιβλία, είτε πρόκειται για τις κοινωνικές επιπτώσεις του περιεχομένου είτε για τη λογοκλοπή από άλλους συγγραφείς. Τώρα με το AI αντιμετωπίζουμε ένα εντελώς νέο σύνολο ηθικών και νομικών ζητημάτων, κανένα από τα οποία δεν περιγράφηκε στο εκδοτικό σχολείο.

Μέρος αυτού φαίνεται παρόμοιο με αυτό που ανησυχούν οι άνθρωποι για τους μαθητές, ότι η χρήση AI είναι κάπως εξαπάτηση, παρόμοια με το να αντιγράψεις από ένα άρθρο της Wikipedia, ή ίσως απλώς να ζητήσεις από έναν φίλο να γράψει το δοκίμιό σου.

Ένας από τους ομιλητές του σεμιναρίου μας, ένας εκπαιδευτικός, ο José Bowen, μοιράστηκε την αποκάλυψή του για τους μαθητές. Δεν είναι ακριβώς αυτό που χρησιμοποιείς για έναν συγγραφέα, αλλά δείχνει κάποια είδη “επιπέδων κινδύνου” της χρήσης AI.

Πρότυπη Συμφωνία Αποκάλυψης για Μαθητές

Έκανα όλη αυτή τη δουλειά μόνος μου χωρίς βοήθεια από φίλους, εργαλεία, τεχνολογία ή AI.
Έκανα το πρώτο προσχέδιο, αλλά ζήτησα από φίλους/οικογένεια, AI παραφράσεις/γραμματική/λογισμικό λογοκλοπής να το διαβάσουν και να κάνουν προτάσεις. Έκανα τις ακόλουθες αλλαγές μετά από αυτή τη βοήθεια:
- Διορθώθηκαν ορθογραφικά και γραμματικά λάθη
- Αλλάχθηκε η δομή ή η σειρά
- Ξαναγράφηκαν ολόκληρες προτάσεις/παράγραφοι
Κόλλησα σε προβλήματα και χρησιμοποίησα ένα θησαυρό, λεξικό, κάλεσα έναν φίλο, πήγα στο κέντρο βοήθειας, χρησιμοποίησα το Chegg ή άλλον πάροχο λύσεων.
Χρησιμοποίησα AI/φίλους/δάσκαλο για να με βοηθήσουν να δημιουργήσω ιδέες.
Χρησιμοποίησα βοήθεια/εργαλεία/AI για να κάνω ένα περίγραμμα/πρώτο σχέδιο, το οποίο στη συνέχεια επεξεργάστηκα. (Περιγράψτε τη φύση της συνεισφοράς σας.)

Και έτσι ένας εκδότης θα μπορούσε να συντάξει κάτι τέτοιο για τους συγγραφείς του. Ας πούμε ότι ο συγγραφέας αποκαλύπτει το ανώτερο επίπεδο: Χρησιμοποίησα εκτενώς AI και μετά επεξεργάστηκα τα αποτελέσματα. Τι γίνεται τότε; Απορρίπτετε αυτόματα το χειρόγραφο; Αν ναι, γιατί;

Και, εν τω μεταξύ, αν προσέχετε, μαθαίνετε ότι το χειρόγραφο που μόλις διαβάσατε και αγαπήσατε, το οποίο ο συγγραφέας ορκίστηκε ότι δεν είχε καν ελεγχθεί ορθογραφικά από το Grammarly, θα μπορούσε στην πραγματικότητα να είχε παραχθεί κατά 90% από AI, από έναν συγγραφέα ειδικό στην απόκρυψη της χρήσης του.

Τότε αναγκάζεστε να ξανασκεφτείτε την ερώτηση. Γίνεται, “Γιατί είμαι τόσο αποφασισμένος να ανιχνεύσω αυτό το πράγμα που είναι αδύνατο να ανιχνευθεί;”

Εν μέρει είναι η ανησυχία σχετικά με τη δυνατότητα κατοχύρωσης πνευματικών δικαιωμάτων για κείμενο που παράγεται από AI. Το γραφείο πνευματικών δικαιωμάτων δεν θα προσφέρει προστασία πνευματικών δικαιωμάτων για 100% κείμενο που παράγεται από AI (ή μουσική, ή εικόνες, κλπ.). Αλλά τι γίνεται με το 50% κείμενο που παράγεται από AI; Λοιπόν, θα καλύπταμε μόνο το 50% που παράγεται από τον συγγραφέα. Και πώς θα ξέρατε ποιο μισό; Θα επανέλθουμε σε αυτό.

Δεν θα ήταν υπέροχο αν μπορούσατε απλώς να εισάγετε κάθε χειρόγραφο σε κάποιο λογισμικό που θα σας έλεγε αν είχε χρησιμοποιηθεί AI για τη δημιουργία του κειμένου;

Αφήνοντας κατά μέρος το ζήτημα ότι ο μόνος τρόπος να το κάνετε αυτό θα ήταν με τη χρήση εργαλείων AI, το πιο σημαντικό ερώτημα είναι, θα ήταν το λογισμικό (επαρκώς) ακριβές; Θα μπορούσα να βασιστώ σε αυτό για να μου πει αν είχε χρησιμοποιηθεί AI για τη δημιουργία ενός χειρόγραφου; Και θα μπορούσα να βασιστώ σε αυτό να μην παράγει “ψευδώς θετικά αποτελέσματα” - να υποδεικνύει ότι είχε χρησιμοποιηθεί AI, όταν στην πραγματικότητα δεν είχε χρησιμοποιηθεί;

Υπάρχει τώρα πολύ λογισμικό στην αγορά που αντιμετωπίζει αυτές τις προκλήσεις. Πολλές από τις ακαδημαϊκές μελέτες που αξιολογούν αυτό το λογισμικό επισημαίνουν την αναξιοπιστία του. Κείμενο που παράγεται από AI διαφεύγει. Ακόμα χειρότερα, κείμενο που δεν έχει παραχθεί από AI χαρακτηρίζεται ψευδώς ως μολυσμένο.

Αλλά οι εκδότες βιβλίων θα θέλουν κάποια είδους διασφάλιση. Φαίνεται ότι, στην καλύτερη περίπτωση, αυτά τα εργαλεία θα μπορούσαν να σας ειδοποιήσουν για πιθανές ανησυχίες, αλλά θα πρέπει πάντα να κάνετε διπλό έλεγχο. Ίσως λοιπόν να σας ειδοποιούν για κείμενα που χρειάζονται πιο προσεκτική εξέταση από άλλα; Είναι αυτό αποδοτικότητα;

Η πραγματική αποδοτικότητα θα βρεθεί προχωρώντας πέρα από τις ανησυχίες για τη γένεση ενός κειμένου, διατηρώντας αντί αυτού τα υπάρχοντα κριτήριά μας ως προς την ποιότητά του.

Απώλεια εργασίας

“Δεν θα αντικατασταθείτε από την AI. Θα αντικατασταθείτε από κάποιον που ξέρει πώς να χρησιμοποιεί την AI.” —Ανώνυμος

Η απώλεια εργασίας λόγω της υιοθέτησης της AI θα μπορούσε να είναι σοβαρή. Οι εκτιμήσεις ποικίλλουν, αλλά οι αριθμοί είναι ζοφεροί. Υπάρχουν προφανή παραδείγματα: τα αυτόνομα ταξί του Σαν Φρανσίσκο εξαλείφουν… οδηγούς ταξί και rideshare. Οι διαγνωστικές υποστηριζόμενες από την AI θα μπορούσαν να μειώσουν την ανάγκη για ιατρικούς τεχνικούς.

Ο αισιόδοξος μέσα μου δείχνει, ως ένα παράδειγμα, την εισαγωγή του λογιστικού φύλλου και την επίδρασή του στην απασχόληση. Όπως βλέπετε στο γράφημα παρακάτω, η απασχόληση στις “Λογιστικές, Φορολογικές Υπηρεσίες, Τήρηση Βιβλίων και Μισθοδοσίας” έχει σχεδόν διπλασιαστεί από το 1990—δεν αποτελεί κατηγορία για τα λογιστικά φύλλα και άλλες τεχνολογίες που έχουν κατά μεγάλο μέρος αυτοματοποιήσει αυτές τις εργασίες.

Ένα γραφικό γραμμών που δείχνει τον αριθμό των εργαζομένων στις λογιστικές, φορολογικές υπηρεσίες, την τήρηση βιβλίων και τη μισθοδοσία από το 1990 έως το 2020.

Η μελέτη του Ethan Mollick με την Boston Consulting Group (BCG) ήταν ένα πείραμα που στόχευε να κατανοήσει καλύτερα την επίδραση της AI στην εργασία, ιδιαίτερα σε σύνθετες και γνώσης εντατικές εργασίες. Η μελέτη περιλάμβανε 758 συμβούλους της BCG, οι οποίοι τυχαία ανατέθηκαν να χρησιμοποιήσουν ή να μην χρησιμοποιήσουν το GPT-4 της OpenAI για δύο εργασίες: καινοτομία προϊόντων και επίλυση επιχειρηματικών προβλημάτων. Η μελέτη μέτρησε την απόδοση, τη συμπεριφορά και τις στάσεις των συμμετεχόντων, καθώς και την ποιότητα και τα χαρακτηριστικά της εξόδου της AI.

Μεταξύ των ευρημάτων ήταν ότι “η AI λειτουργεί ως εξισορροπητής δεξιοτήτων. Οι σύμβουλοι που είχαν τη χαμηλότερη βαθμολογία όταν τους αξιολογήσαμε στην αρχή του πειράματος είχαν τη μεγαλύτερη άνοδο στην απόδοσή τους, 43%, όταν χρησιμοποιούσαν την AI. Οι κορυφαίοι σύμβουλοι εξακολουθούσαν να έχουν μια ώθηση, αλλά μικρότερη.” Το πλήρες άρθρο είναι αποκαλυπτικό και, όπως με όλη τη δουλειά του Mollick, προκλητικό αλλά προσιτό.

Εκπαίδευση

Η εκπαίδευση έχει βρεθεί στο προσκήνιο στις συζητήσεις υπέρ και κατά της Τεχνητής Νοημοσύνης (AI). Η εισαγωγή της AI στις τάξεις θεωρείται κατά κύριο λόγο ως κατάρα, ή τουλάχιστον ως πρόκληση. Άλλοι εκπαιδευτικοί, όπως ο βασικός ομιλητής του PW Ethan Mollick, αγκαλιάζουν την AI ως ένα αξιοσημείωτο νέο εργαλείο για τους εκπαιδευτικούς. Ο Mollick επιμένει ότι οι μαθητές του να εργάζονται με το ChatGPT.

Το καλύτερο βιβλίο για το θέμα είναι το Teaching with AI: A Practical Guide to a New Era of Human Learning από τους José Antonio Bowen και C. Edward Watson.

Δεν πρόκειται να εξετάσω την εκπαιδευτική έκδοση σε αυτό το βιβλίο—είναι ένα τεράστιο θέμα, που απαιτεί ξεχωριστή αναφορά. Ενδεχομένως η εκδοτική δραστηριότητα να γίνεται δευτερεύουσας σημασίας στην εκπαίδευση: τα εργαλεία AI είναι λογισμικό, όχι περιεχόμενο, καθεαυτό.

Το μέλλον της αναζήτησης

Η αναζήτηση είναι ένα αμφιλεγόμενο θέμα στην AI. Σας ενθαρρύνω να επισκεφθείτε τους perplexity.ai και You.com για να πάρετε μια ματιά στο πού κατευθύνονται τα πράγματα. Τις επόμενες φορές που θα σκεφτείτε να ξεκινήσετε μια αναζήτηση στο Google, πηγαίνετε αντί για αυτό στο Perplexity. Δεν θα φανεί δραματικά διαφορετικό—μοιάζει με τα γραφήματα γνώσης που συχνά εμφανίζει η Google στην δεξιά πλευρά της οθόνης αναζήτησης, ή μερικές φορές στην κορυφή των λιστών αποτελεσμάτων αναζήτησης. Αντί να πρέπει να κάνετε κλικ σε έναν σύνδεσμο, οι πληροφορίες είναι εκεί για εσάς.

Το Perplexity πηγαίνει ένα βήμα παραπέρα, διατυπώνοντας ξανά τις πληροφορίες που συγκεντρώνει από πολλαπλές πηγές, ώστε να μην χρειάζεται πραγματικά να κάνετε κλικ σε έναν σύνδεσμο. Παρέχει συνδέσμους στις πηγές του, αλλά το κλικ σε αυτές είναι συνήθως περιττό—έχετε ήδη την απάντηση στην ερώτησή σας.

Αυτή η φαινομενικά μέτρια αλλαγή έχει τεράστιες επιπτώσεις για κάθε εταιρεία και κάθε προϊόν που βασίζεται, έστω και εν μέρει, στην ανακάλυψή του μέσω μηχανών αναζήτησης. Αν οι αναζητητές δεν κατευθύνονται πλέον στον ιστότοπό σας, πώς μπορείτε να τους εμπλέξετε και να τους μετατρέψετε σε πελάτες; Η απλή απάντηση είναι ότι δεν μπορείτε.

Η Joanna Penn είναι στην πρώτη γραμμή της σκέψης για τον αντίκτυπο των νέων τεχνολογιών στη συγγραφή και την έκδοση. Αντιμετώπισε αυτό το σύνθετο θέμα στο podcast και το blog της τον περασμένο Δεκέμβριο.

Είναι ακόμα νωρίς για την AI και τη μεταμόρφωση της αναζήτησης.

Junk books on Amazon

Τα παραγόμενα από AI βιβλία σκουπίδια στο Amazon αποτελούν πρόβλημα, αν και η σοβαρότητά τους μπορεί να είναι περισσότερο συναισθηματική παρά κυριολεκτική. Από τη μία πλευρά, αυτά τα βιβλία γεμίζουν το διαδικτυακό βιβλιοπωλείο με χαμηλής ποιότητας και λογοκλοπικά περιεχόμενα, χρησιμοποιώντας μερικές φορές τα ονόματα πραγματικών συγγραφέων για να εξαπατήσουν τους πελάτες και να εκμεταλλευτούν τη φήμη τους. Τα βιβλία δεν είναι μόνο ενόχληση για τους αναγνώστες αλλά και απειλή για τους συγγραφείς, καθώς μπορούν να τους στερήσουν δικαιώματα που έχουν κερδίσει με κόπο. Τα παραγόμενα από AI βιβλία επίσης επηρεάζουν την κατάταξη και την ορατότητα των πραγματικών βιβλίων και συγγραφέων στην ιστοσελίδα του Amazon, καθώς ανταγωνίζονται για τις ίδιες λέξεις-κλειδιά, κατηγορίες και κριτικές.

Ένα χαριτωμένο γατάκι που κάθεται σε μια παραλία με λουλούδια γύρω του και μια λεζάντα που λέει 'Αστείες και χαριτωμένες φωτογραφίες γάτας που δεν μπορείτε να δείτε στον κόσμο'.

Το Amazon τώρα απαιτεί από τους συγγραφείς να αποκαλύπτουν λεπτομέρειες για τη χρήση AI στη δημιουργία των βιβλίων τους. Χωρίς αμφιβολία αυτό μπορεί να καταχραστεί.

Δοκιμάστε να αναζητήσετε στο Amazon “παραγόμενα από AI βιβλία.” Υπάρχουν πολλά. Ορισμένα από τα αποτελέσματα είναι βιβλία οδηγιών για τη χρήση του AI στη δημιουργία βιβλίων. Αλλά άλλα είναι, αδίστακτα, παραγόμενα από AI. “Αστείες και χαριτωμένες φωτογραφίες γάτας - Δεν μπορείτε να δείτε αυτούς τους τύπους φωτογραφιών στον κόσμο - ΜΕΡΟΣ-1” (sic) αποδίδεται στον Rajasekar Kasi. Δεν υπάρχουν λεπτομέρειες για το βιογραφικό του σε σελίδα συγγραφέα, αλλά έξι άλλοι τίτλοι αποδίδονται στο όνομα. Το βιβλίο, που δημοσιεύθηκε στις 26 Αυγούστου 2023, δεν έχει κριτικές και καμία κατάταξη πωλήσεων. Ο αγγλικός τίτλος του ebook δεν ταιριάζει με τον αγγλικό τίτλο στο εξώφυλλο του έντυπου βιβλίου.

Αλλά άλλοι συγγραφείς χρησιμοποιούν AI εκτεταμένα στη δημιουργία των βιβλίων τους, και δεν αποκαλύπτουν. Όπως συζητώ παραπάνω, η ανίχνευση της χρήσης AI είναι σχεδόν αδύνατη με ικανούς ‘πλαστογράφους.’ Βιβλία χρωματισμού, ημερολόγια, ταξιδιωτικά βιβλία και βιβλία μαγειρικής δημιουργούνται με εργαλεία AI σε ένα κλάσμα του χρόνου και της προσπάθειας της παραδοσιακής έκδοσης.

Αναζητήστε “korean vegan cookbook” και θα βρείτε τον αριθμό ένα τίτλο, από την Joanne Lee Molinaro, στην πρώτη θέση. Αλλά ακολουθούν ακριβώς πίσω του άλλοι τίτλοι που είναι προφανείς αντιγραφές. “The Korean Vegan Cookbook: Simple and Delicious Traditional and Modern Recipes for Korean Cuisine Lovers” έχει δύο κριτικές, συμπεριλαμβανομένης μιας που σημειώνει “Αυτό δεν είναι ένα vegan βιβλίο μαγειρικής. Όλες οι συνταγές έχουν συστατικά κρέατος και αυγών.” Αλλά το βιβλίο είναι στο #5,869,771 στην κατάταξη πωλήσεων, σε σύγκριση με το πρωτότυπο, που βρίσκεται στο #2,852 στη λίστα.

Είναι δύσκολο να καθορίσουμε την έκταση της προκληθείσας βλάβης. Τίποτα καλό δεν μπορεί να προκύψει από αυτό, αλλά πόσο κακό είναι;

Η Amazon έχει πολιτικές που της επιτρέπουν να αφαιρέσει οποιοδήποτε βιβλίο αποτυγχάνει να “παρέχει μια θετική εμπειρία πελάτη.” Οι οδηγίες περιεχομένου του Kindle απαγορεύουν “περιγραφικό περιεχόμενο που προορίζεται να παραπλανήσει τους πελάτες ή που δεν αντιπροσωπεύει με ακρίβεια το περιεχόμενο του βιβλίου.” Μπορούν επίσης να μπλοκάρουν “περιεχόμενο που συνήθως απογοητεύει τους πελάτες.” Είναι ο τεράστιος όγκος που καταβάλλει τους παρατηρητές της Amazon; Ή υπάρχει κάποιος άλλος λόγος;

Προκατάληψη

Τα LLMs εκπαιδεύονται σε ό,τι έχει ήδη δημοσιευθεί διαδικτυακά. Ό,τι έχει δημοσιευθεί διαδικτυακά είναι γεμάτο προκατάληψη και έτσι τα LLMs αντανακλούν αυτήν την προκατάληψη. Και φυσικά όχι μόνο προκατάληψη, αλλά και μίσος, που αντανακλάται στις μάθησεις τους, και τώρα μια πιθανή έξοδος σε λέξεις και εικόνες που δημιουργούνται από την ΤΝ. Η πορνογραφία είναι ένας άλλος φυσικός δικαιούχος της αξιοσημείωτης ικανότητας της ΤΝ με τις εικόνες, και υπάρχουν πρόσφατες ανησυχητικές ιστορίες νεαρών γυναικών που βρίσκουν κατασκευασμένες γυμνές εικόνες, με τους ανδρικούς συμμαθητές τους ως πιθανούς υπόπτους. The New York Times ανέφερε ξεχωριστά για την αύξηση των διαδικτυακών εικόνων παιδικής σεξουαλικής κακοποίησης.

Οι συγγραφείς και οι εκδότες πρέπει να γνωρίζουν αυτούς τους ενσωματωμένους περιορισμούς όταν χρησιμοποιούν εργαλεία ΤΝ.

Η δημιουργικότητα μπορεί να είναι Κλισέ

Το ερώτημα αν οι μηχανές μπορούν να είναι πραγματικά δημιουργικές παραμένει ένα θέμα έντονου διαλόγου. Εξαρτάται εν μέρει από το πώς ορίζουμε τη δημιουργικότητα.

“Η ΤΝ δεν θα είναι ποτέ δημιουργική.” Αυτό είναι ένα γνωστό μάντρα.

Όλοι ξέρουμε τι είναι η δημιουργικότητα, έτσι δεν είναι;

Cambridge: “η ικανότητα να παράγεις ή να χρησιμοποιείς πρωτότυπες και ασυνήθιστες ιδέες.”

Britannica: “η ικανότητα να δημιουργείς ή να φέρεις στην ύπαρξη κάτι νέο, είτε μια νέα λύση σε ένα πρόβλημα, μια νέα μέθοδο ή συσκευή, είτε ένα νέο καλλιτεχνικό αντικείμενο ή μορφή.”

Δεν αμφισβητώ ότι η δημιουργικότητα, με αυτήν την έννοια, είναι πολύ πέρα από την εμβέλεια των LLMs.

Το επιχείρημά μου είναι ότι το μεγαλύτερο μέρος αυτού που παρουσιάζεται ως δημιουργικό—και συχνά φαίνεται αρκετά δημιουργικό—-είναι, στην πραγματικότητα, επαναληπτικό. Κάτι που λειτουργεί τέλεια για πολλά πράγματα, συμπεριλαμβανομένης της περισσότερης διαφήμισης.

Αλλά να υψώσουμε το στάνταρ της ‘δημιουργικότητας’, και μετά να μειώσουμε τα LLMs, είναι να θέσουμε έναν αδύνατο υψηλό φραγμό, στον οποίο η ΤΝ αναπόφευκτα αποτυγχάνει. Τότε οι άνθρωποι το απορρίπτουν ως “καλά, σας είπα ότι δεν είναι δημιουργικό.”

Και έτσι χάνουν τα επαναληπτικά πράγματα στα οποία είναι πολύ καλό.

Θα δημοσιεύσω ένα μακροσκελές δοκίμιο για αυτό το θέμα στο εγγύς μέλλον, αφού τελειώσω την ανάγνωση:

The Creativity Code, από τον Marcus du Sautoy, και

The Artist in the Machine, από τον Athur I. Miller

Literary Theory for Robots, από τον Dennis Yi Tenen

Μια Άλλη Σκέψη

Ο Jeremiah Owyang είναι αναλυτής της βιομηχανίας με βάση την Silicon Valley. Είναι υποστηρικτής της Τεχνητής Νοημοσύνης, αλλά έχει ξαναζήσει παρόμοιο ενθουσιασμό. Σημειώνει ότι “ποτέ δεν έχει δει τόσο γρήγορη εξέλιξη σε τόσο σύντομο χρονικό διάστημα.”

Όπως το θέτει ο Owyang ο ίδιος, μικρές ομάδες προγραμματιστών μπορούν τώρα να χρησιμοποιούν Μεγάλες Γλωσσικές Μοντέλες για να δημιουργούν “αισθανόμενα πλάσματα”–σαν ένα τετράχρονο παιδί–μέσα σε δύο μέρες. Είναι ικανά:

να ‘Βλέπουν’ με υπολογιστική όραση, τι συμβαίνει στον πραγματικό κόσμο,
να ‘Ακούνε’ μέσω φωνητικών εντολών και περιβαλλόντων ήχων στον πραγματικό κόσμο,
να ‘Σκέφτονται’ μέσω επεξεργασίας του παραπάνω πραγματικού εισόδου δεδομένων,
να ‘Μαθαίνουν’ έχοντας πρόσβαση στα εκ των προτέρων εκπαιδευμένα δεδομένα,
να ‘Αναφέρονται’ σε αποκλειστικά σύνολα δεδομένων,
να ‘Μιλούν’ με φωνές που μοιάζουν με πραγματικές, που έχουν έμφαση και τόνο σε οποιαδήποτε γλώσσα,
να ‘Γράφουν’ μέσω γραπτής επικοινωνίας, σε οποιαδήποτε μορφή ή στυλ απαιτείται,
να ‘Ζωγραφίζουν’ δημιουργώντας εικόνες αυθόρμητα, και
να ‘Αλληλεπιδρούν’: μπορούν να συμμετέχουν ενεργά σε διάλογο, να κάνουν ερωτήσεις, ή να αναθέτουν σε πράκτορες Τεχνητής Νοημοσύνης να ολοκληρώσουν εργασίες αυτόνομα.

Αυτό είναι εξαιρετικό και πρωτοφανές. Θα έχει σημασία για τη δημοσίευση; Αποφασίστε εσείς.

Καλές Ιδέες Εκτός Δημοσίευσης

Η Τεχνητή Νοημοσύνη βρίσκεται πίσω από μερικά επαναστατικά επιτεύγματα εκτός της δημοσίευσης. Η ιατρική είναι το υπόδειγμα της Τεχνητής Νοημοσύνης, αλλά υπάρχουν και δυνατές ιστορίες από άλλες βιομηχανίες. Η σχετικότητα με τη δημοσίευση προκύπτει από μια ρητορική ερώτηση: Η Τεχνητή Νοημοσύνη μπορεί να σώσει ζωές. Αλλά δεν πιστεύετε ότι μπορεί να βοηθήσει τους εκδότες;

Ο στόχος αυτού του σύντομου τμήματος είναι απλώς να αντικρούσει το επιχείρημα ότι, αν δεν πείθεστε ότι η Τεχνητή Νοημοσύνη θα βοηθήσει τη δημοσίευση, μπορεί η Τεχνητή Νοημοσύνη να βοηθήσει κανέναν άλλο;

Τεχνητή Νοημοσύνη και Ιατρική

Διαβάζοντας ένα τεύχος του The Economist του Μαρτίου του 2024, εμβάθυνα στο συμπλήρωμα τεχνολογίας για την υγεία και την Τεχνητή Νοημοσύνη. Τα τελευταία χρόνια, η ιατρική εμφανίζεται σταθερά ως το φωτεινό σημείο της Τεχνητής Νοημοσύνης. Οι περισσότερες αναφορές είναι θετικές. Αλλά το άρθρο του The Economist θα σας εκπλήξει. Εκφράζουν πολλές καλά διατυπωμένες επιφυλάξεις. Αλλά θα διαβάσετε επίσης ότι η Τεχνητή Νοημοσύνη στην ιατρική “αντιπροσωπεύει μια ευκαιρία να βελτιώσει τις ζωές εκατοντάδων εκατομμυρίων, ακόμα και δισεκατομμυρίων.”

Μια άλλη ρητορική ερώτηση για όσους θα ήθελαν είτε να απαγορεύσουν την τεχνολογία Τεχνητής Νοημοσύνης, είτε τουλάχιστον να θέσουν μορατόριουμ στην ανάπτυξή της: θα θυσιάζατε την πιθανή της αξία για την υγεία εκατομμυρίων για να ικανοποιήσετε το άγχος σας για ένα αβέβαιο μέλλον;

Τεχνητή Νοημοσύνη και η Υπηρεσία Ασφάλειας Μεταφορών στα αεροδρόμια

Έχουμε βρεθεί εκεί: οι ατελείωτες ουρές, η αργή κίνηση των χειραποσκευών μας μέσα από τα ακτινογραφικά μηχανήματα.

Οι αποτυχίες ανίχνευσης από την Υπηρεσία Ασφάλειας Μεταφορών είναι καλά τεκμηριωμένες, αλλά δεν συζητούνται πολύ.

Αυτό που με ανησυχεί περισσότερο είναι οι λυπημένοι εργαζόμενοι, που κοιτάζουν τις οθόνες τους, ώρες ατελείωτες. Για ποιο λόγο; Όχι μόνο είναι μια μίζερη δουλειά, αλλά, ως απλοί θνητοί, δεν είναι πολύ καλοί σε αυτήν.

Εισέρχεται η Τεχνητή Νοημοσύνη. Αν μπορεί να εντοπίσει δύσκολα ανιχνεύσιμους όγκους στους πνεύμονες, είμαι βέβαιος ότι μπορεί να εντοπίσει λαθρεμπόριο στις χειραποσκευές. Και να απαλλάξει τους ανθρώπους από ένα αχάριστο έργο για το οποίο δεν είναι κατάλληλοι.

Σύμφωνα με αυτό, το νέο πρόγραμμα ελέγχου με τη βοήθεια Τεχνητής Νοημοσύνης από την Υπηρεσία Ασφάλειας Μεταφορών είναι σε εξέλιξη.

Δοκίμιο: Η Επίδραση της Τεχνητής Νοημοσύνης στη Βιομηχανία Εκδόσεων Βιβλίων

Μιλούσα πρόσφατα με τον Peter Brantley, τον συνεργάτη μου στα σεμινάρια Τεχνητής Νοημοσύνης, για το πώς θα μπορούσαμε να διαμορφώσουμε τα επερχόμενα προγράμματα Τεχνητής Νοημοσύνης. Ο Peter εργάζεται πολύ συχνά στην κοινότητα των βιβλιοθηκών και μόλις είχε επιστρέψει από μια ημερήσια εκδήλωση στο Λος Άντζελες με περίπου 150 συναδέλφους του από τις βιβλιοθήκες, όπου εξερεύνησαν, πρόσωπο με πρόσωπο, την πιθανή επίδραση της Τεχνητής Νοημοσύνης στον τομέα τους. Η συζήτηση ήταν ζωντανή και σε βάθος. Γιατί, αναρωτήθηκε, δεν έχουν οι εκδότες εμπορικών βιβλίων συγκεντρώσεις σαν αυτήν; Η Τεχνητή Νοημοσύνη είναι θέμα σε κάθε εκδήλωση εκδόσεων: γιατί δεν είναι το θέμα;

Οι πραγματικές συνέπειες της Τεχνητής Νοημοσύνης

Η απάντηση που βρήκε είναι ότι οι εκδότες εμπορικών βιβλίων δεν έχουν ακόμη καταλήξει στο συμπέρασμα ότι η Τεχνητή Νοημοσύνη θα έχει πραγματικές συνέπειες στην επιχείρησή τους. Στην καρδιά της επιχείρησής τους. Στην ικανότητά τους να διεξάγουν επιχειρήσεις. Σίγουρα, μπορεί να βοηθήσει στη σύνταξη ενός δελτίου τύπου ή στην αποστολή μιας επιστολής απόρριψης χειρογράφου, αλλά υποθέτουν ότι οι εκδόσεις θα συνεχίσουν να προχωρούν όπως έκαναν για δεκαετίες, με τον μέσο χρόνο από τη σύμβαση μέχρι το τυπωμένο βιβλίο να διαρκεί έως και δύο χρόνια.

Ταυτόχρονα, οι εκδότες φυσικά αντιμετωπίζουν πιο άμεσες προκλήσεις από την Τεχνητή Νοημοσύνη. Τιμές χαρτιού. Κόστη αποστολής. Συρρίκνωση περιθωρίων κέρδους. Οι πωλήσεις είναι γενικά στάσιμες. Με όλες αυτές τις πιέσεις, ποιος έχει τον χρόνο ή το εύρος ζώνης να ασχοληθεί με την Τεχνητή Νοημοσύνη;

Αλλά οι άλλες δημιουργικές βιομηχανίες το καταλαβαίνουν. Η τέχνη και ο σχεδιασμός το καταλαβαίνουν. Η διαφήμιση το καταλαβαίνει. Το Χόλιγουντ βλέπει τι έρχεται, όπως και η μουσική βιομηχανία. Οι δημοσιογράφοι παρακολουθούν με τρόμο.

Άλλοι τομείς εκδόσεων βιβλίων αρχίζουν να κατανοούν την επίδραση της Τεχνητής Νοημοσύνης. Η ακαδημαϊκή έκδοση είναι βαθιά μέσα στην τεχνολογία. Αλλά οι εκδότες εμπορικών βιβλίων ενεργούν σαν να μην υπάρχουν σημαντικές συνέπειες από την Τεχνητή Νοημοσύνη στον πραγματικό κόσμο.

Ποιες θα μπορούσαν να είναι οι πραγματικές συνέπειες; Θα επηρεάσει την προσφορά των βιβλίων; Ή τη ζήτηση για βιβλία;

Προσφορά: Ναι, η Τεχνητή Νοημοσύνη ευθύνεται για μια πληθώρα νέων άχρηστων βιβλίων στο Amazon. Εκατοντάδες; Σίγουρα. Χιλιάδες; Ίσως. Εκατομμύρια; Όχι. Πόσα βιβλία υπάρχουν στο Amazon; Πάνω από 50 εκατομμύρια. Είναι ήδη πολύ συνωστισμένα.

Ανεξάρτητα από αυτό, είναι σαφές ότι στο άμεσο μέλλον, η Τεχνητή Νοημοσύνη δεν θα γράψει ολόκληρα βιβλία που οι άνθρωποι θα θέλουν πραγματικά να διαβάσουν. Η αξία της μέχρι στιγμής είναι ως συνεργάτης συγγραφής—κριτικάροντας, προτείνοντας, περιστασιακά γράφοντας λίγες παραγράφους χρησιμοποιήσιμου κειμένου. Όχι, στο άμεσο μέλλον, η Τεχνητή Νοημοσύνη δεν πρόκειται να αλλάξει ριζικά τα αποτελέσματα της εκδοτικής βιομηχανίας βιβλίων, την προσφορά νέων βιβλίων.

Ζήτηση: Όχι, κανείς δεν απαιτεί βιβλία που δημιουργούνται από AI. Αυτό δεν είναι παράγοντας. Και δεν μπορώ να προβλέψω κανένα σενάριο όπου το AI θα επηρεάσει τη ζήτηση για βιβλία σε ευρύτερη κλίμακα.

Τι γίνεται με τη διαδικασία της εκδόσεως; Ναι, αυτό θα αλλάξει. Τουλάχιστον λίγο. Όπως ανακαλύψαμε στην εκδήλωση AI του Publishers Weekly το περασμένο φθινόπωρο, οι εκδότες αναζητούν βοήθεια από το AI εδώ κι εκεί: μάρκετινγκ, συντακτικό, λίγο από αυτό και λίγο από εκείνο.

Είναι πιθανό να υπάρξουν λίγες πραγματικές συνέπειες του AI στις εκδόσεις εμπορικών βιβλίων; Ίσως είναι απλώς ένα παιχνίδι.

Λοιπόν, ας απομακρυνθούμε από τα ζιζάνια του AI και ας επανεξετάσουμε την προβληματική κατάσταση των εμπορικών εκδόσεων, και μέσα από αυτό, ας εμβαθύνουμε στο πού το AI πιθανότατα θα έχει τον μεγαλύτερο αντίκτυπο.

Οι εκδόσεις είναι σε οικονομική ύφεση εδώ και δεκαετίες

Σύμφωνα με διάφορες εκτιμήσεις, ολόκληρη η βιομηχανία εκδόσεων βιβλίων στις Ηνωμένες Πολιτείες έχει ετήσιες πωλήσεις κάτω από 35 δισεκατομμύρια δολάρια. Ακόμη και αν ήταν 40 δισεκατομμύρια δολάρια, οι ετήσιες πωλήσεις της Apple Computer είναι 10 φορές υψηλότερες. Το μικτό κέρδος της Apple είναι 44% των πωλήσεων, μαζί με καθαρά κέρδη 25% των πωλήσεων. Οι εκδόσεις δεν τολμούν καν να ονειρευτούν περιθώρια κέρδους όπως αυτά.

Οι εκδόσεις εμπορικών βιβλίων είναι σε ήπια οικονομική ύφεση εδώ και δεκαετίες, μερικά χρόνια αυξάνονται κατά μερικές ποσοστιαίες μονάδες, μερικά χρόνια μειώνονται. Στα μέσα του 2024, οι πωλήσεις φαίνονται σταθερές σε σχέση με την προηγούμενη χρονιά, αλλά αυτό είναι το είδος του καλοκαιρινού ρομάντζου που οι εκδότες γνωρίζουν καλά. Κερδίζουμε μερικά, χάνουμε μερικά, αλλά, συνολικά, οι εκδόσεις εμπορικών βιβλίων δεν είναι ένας τομέας ανάπτυξης.

Το 2023, σύμφωνα με το StatShot της AAP “τα έσοδα από τις εμπορικές εκδόσεις μειώθηκαν κατά 0,3%, στα 8,9 δισεκατομμύρια δολάρια για το ημερολογιακό έτος.” Όσο μπορώ να πω, τα δεδομένα της AAP δεν λαμβάνουν υπόψη τον πληθωρισμό. Με πληθωρισμό 3,4%, η μείωση των πωλήσεων θα ήταν 3,6%, πιο κοντά στη μείωση 2,6% στις πωλήσεις μονάδων που αναφέρθηκαν από την Circana.

Χωρίς την ανάπτυξη εναλλακτικών μορφών, όπως τα ηλεκτρονικά βιβλία και τα ηχητικά βιβλία, η βιομηχανία μπορεί να βρισκόταν σε πολύ κακή κατάσταση. Τα ηλεκτρονικά βιβλία ήταν κινητήρας ανάπτυξης για χρόνια. Οι πωλήσεις ηχητικών βιβλίων συνεχίζουν να αυξάνονται, αυξήθηκαν σχεδόν κατά 15% το 2022 και άλλο ένα 9% το 2023. Ναι, κάποιο από αυτό είναι πωλήσεις υποκατάστασης, αλλά πολλοί από τους πελάτες για ηλεκτρονικά βιβλία και ηχητικά βιβλία είναι νέοι πελάτες, όχι απαραίτητα τακτικοί αναγνώστες βιβλίων. Τα ηλεκτρονικά βιβλία και τα ηχητικά βιβλία αντιπροσώπευαν το 21% των πωλήσεων εμπορικών βιβλίων πέρυσι. Θα αγόραζαν όλοι αυτοί οι πελάτες έντυπα βιβλία αν υπήρχαν μόνο έντυπα διαθέσιμα;

Οι τιμές λιανικής γίνονται ολοένα και περισσότερο ανησυχητικές καθώς τα κόστη και οι εκπτώσεις λιανοπωλητών και χονδρεμπόρων πιέζουν τα περιθώρια κέρδους των εκδοτών. Οι ακαδημαϊκές μελέτες υποδεικνύουν ότι υπάρχει κάποιος βαθμός ελαστικότητας τιμής για τα βιβλία, αλλά σίγουρα φτάνουμε στο σημείο αντίστασης: τα σκληρόδετα bestsellers πλησιάζουν αυτό που μπορεί να είναι ένα ανώτατο όριο τιμής των $35. “Κόπωση από συνδρομές” κάνει τους πελάτες video-on-demand να διακόπτουν υπηρεσίες, εστιάζοντας στο αυξανόμενο κόστος της κάθε μίας. Το Premium πλάνο του Netflix τώρα κοστίζει $22.99/μήνα; το Disney Plus Duo Premium είναι $19.99/μήνα. Όπως μου είπε πρόσφατα ένας συνάδελφος, πόσοι από τους συνδρομητές που δυσκολεύονται οικονομικά θα πουν, ας ακυρώσουμε τη συνδρομή μας στο Netflix για να μπορέσουμε να αγοράσουμε ένα βιβλίο τον επόμενο μήνα;

Μισθοί στον εκδοτικό κλάδο

Δεν θα το παρατραβήξω: δεν είναι μόνο οι συγγραφείς που προσπαθούν να ζήσουν—το προσωπικό των εκδοτικών οίκων είναι εξαιρετικά υποπληρωμένο σε σύγκριση με αντίστοιχα επαγγέλματα.

Διατηρώ μια αντιπροσωπευτική ποικιλία πρόσφατων αγγελιών εργασίας στον τομέα των εκδόσεων. Κοιτάζω μία, για Διευθυντή Μάρκετινγκ σε έναν εκδοτικό οίκο εμπορίου που ανέφερε πωλήσεις για το 2023 λίγο πάνω από $30 εκατομμύρια. Η θέση πληρώνει μεταξύ $60,000 και $70,000 ετησίως. Εδώ είναι άλλη μία, για Διευθυντή Δημοσίων Σχέσεων σε ένα από τα αποτυπώματα ενός εκδότη που αναφέρει ετήσιες πωλήσεις ύψους $750 εκατομμυρίων. “Αυτή η θέση θα έχει ετήσιο μισθό $74,000–$79,000,” σημειώνει η αγγελία.

Σύμφωνα με τις Εκτιμήσεις Εθνικής Απασχόλησης και Μισθών της Υπηρεσίας Στατιστικών Εργασίας των ΗΠΑ, οι διευθυντές μάρκετινγκ κερδίζουν, κατά μέσο όρο, σε όλους τους τομείς, $166,410. “Οι Διευθυντές Δημοσίων Σχέσεων” έχουν μέσο όρο κερδών $159,420.

Η έκδοση βιβλίων δεν είναι καν κοντά. Αυτό δεν είναι είδηση για κανέναν που εργάζεται στις εκδόσεις. Πάντα ήταν έτσι. Αλλά μπορεί η εκδοτική βιομηχανία να διατηρηθεί σε αυτά τα επίπεδα αμοιβών; Η αδυναμία προσφοράς στους υποψήφιους ακόμη και του μισού του πρότυπου αμοιβών δεν προοιωνίζεται καλά για μια βιομηχανία που γίνεται όλο και πιο ψηφιακή.

Στην εποχή του TikTok, του YouTube, των κοινωνικών μέσων, του SEO, των μεταδεδομένων και των πλατφορμών συγγραφέων, τι στο καλό είναι ένας “διευθυντής δημοσίων σχέσεων”;

Τα τρία (και μισό) εναπομείναντα πλεονεκτήματα για τους παραδοσιακούς εκδότες βιβλίων

Τρία επίμονα πλεονεκτήματα για τους παραδοσιακούς εκδότες βιβλίων είναι (i) το κύρος, (ii) η πρόσβαση στα κύρια μέσα μαζικής ενημέρωσης και (iii) η πρόσβαση στη διανομή βιβλιοπωλείων. Αυτό δεν ισχύει εξίσου για όλους τους παραδοσιακούς εκδότες - οι μεγαλύτεροι έχουν περισσότερα από καθένα: περισσότερο κύρος, καλύτερη πρόσβαση στα κύρια μέσα και καλύτερες ευκαιρίες να βάλουν τα βιβλία τους στα μπροστινά τραπέζια στον μεγαλύτερο αριθμό βιβλιοπωλείων. Αλλά, συνολικά, αυτά είναι τα χαρακτηριστικά πλεονεκτήματα της παραδοσιακής εκδοτικής βιομηχανίας.

Μια άλλη αξία που μπορούν να προσφέρουν οι εκδότες είναι μια επιμελημένη λίστα συμπληρωματικών τίτλων, όπου κάθε μεμονωμένος τίτλος επωφελείται από τους συνοδούς του. Σκεφτείτε έναν εκδότη όπως Fox Chapel, που ειδικεύεται σε βιβλία για χειροτεχνίες: αν σας αρέσει ένας από τους τίτλους τους, υπάρχει μια λογική πιθανότητα να κοιτάξετε προσεκτικά τα άλλα βιβλία τους (και περιοδικά) για το ίδιο θέμα, ακόμα κι αν είναι γραμμένα από άλλους συγγραφείς.

Αυτό περνάει σε κάτι που μόνο λίγοι εκδότες έχουν καταφέρει να αναπτύξουν, μια εμπορεύσιμη μάρκα. Σκεφτείτε σειρές όπως το “For Dummies” της Wiley ή τις “Very Short Introductions” της Oxford. Η μάρκα μεταφέρει μια συνέπεια προσέγγισης και ποιότητας της επιμέλειας που ενθαρρύνει τους αναγνώστες να αγοράσουν πολλούς τίτλους. Οι αυτοεκδότες συχνά ξεκινούν τις δικές τους μικρές σειρές, κυρίως για τη λογοτεχνία, αν και δεν μπορούν να καλύψουν το εύρος αυτών των μεγαλύτερων καταλόγων εκδοτών.

Όλες οι άλλες υπηρεσίες που παρέχουν οι παραδοσιακοί εκδότες μπορούν να αγοραστούν στην ανοιχτή αγορά, με παρόμοια ποιότητα, σε προσιτές τιμές (για παράδειγμα, επιμέλεια, σχεδιασμός, παραγωγή και βασικές λειτουργίες μάρκετινγκ). Και, για τους αυτοεκδότες, το εισόδημα ανά βιβλίο που πουλιέται είναι πέντε φορές ή περισσότερο μεγαλύτερο από τα παραδοσιακά προγραμματάρια δικαιωμάτων.

Θα αναλύσω λίγο περισσότερο αυτό σε ένα σύντομο παράρτημα στο τέλος αυτού του βιβλίου. Αλλά ας υποβαθμίσω γρήγορα την αξία των τριών κορυφαίων πλεονεκτημάτων. Το γόητρο είναι καλό για λόγους καυχησιολογίας, αλλά έχει μέτρια χρηματική αξία. Οι κριτικές βιβλίων και άλλη σημαντική έκθεση στα μέσα ενημέρωσης, τώρα έχουν μια πολύ μειωμένη επίδραση στις πωλήσεις βιβλίων. Και τα βιβλιοπωλεία αντιπροσωπεύουν περίπου το 15% των πωλήσεων της βιομηχανίας (και πολύ λιγότερο για τους αυτοεκδότες) - δεν είναι πλέον κεντρικά για την επιτυχία ενός βιβλίου.

Τα πράγματα έχουν αλλάξει.

Αυτοέκδοση

Η αυτοέκδοση ήταν ο κύριος παράγοντας ανάπτυξης της καταναλωτικής (εμπορικής) έκδοσης την τελευταία δεκαετία και περισσότερο. Τα ακριβή δεδομένα πωλήσεων γύρω από την αυτοέκδοση παραμένουν κρυφά - είναι εύκολο να αγνοηθεί η σημασία της. Αλλά τα διαθέσιμα δεδομένα δείχνουν ότι η αυτοέκδοση διεκδικεί ένα σημαντικό τμήμα της αγοράς εμπορικής έκδοσης.

Όπως ο Διευθύνων Σύμβουλος της Kobo, Michael Tamblyn (κάπως) διάσημα σημείωσε, “Ένα στα 4 βιβλία που πουλάμε στα Αγγλικά είναι ένας τίτλος αυτοέκδοσης, που σημαίνει ότι ουσιαστικά, για μας, η αυτοέκδοση είναι σαν να υπάρχει ένας ολόκληρος άλλος Penguin Random House στην αγορά που κανείς δεν βλέπει. Είναι σαν τη σκοτεινή ύλη της έκδοσης.”

Οι τάσεις στην αγορά αυτοέκδοσης είναι αναμφίβολα οι μοναδικές σημαντικές τάσεις στην εμπορική έκδοση. Οι αυτοεκδότες δείχνουν το δρόμο. Είναι τολμηροί και απελευθερωμένοι από τα έθιμα της παραδοσιακής βιομηχανίας. Πολλοί είναι εξοικειωμένοι με τα κοινωνικά μέσα. Είναι κοντά στους αναγνώστες τους, τους πελάτες τους. Εάν θέλετε να μάθετε τις τελευταίες τεχνικές μάρκετινγκ, ακολουθήστε φόρουμ συγγραφέων, blogs και ενημερωτικά δελτία.

Βυθιστείτε στα στατιστικά στοιχεία για το εισόδημα των συγγραφέων, την οικονομία της συγγραφής, και στη συνέχεια συγκρίνετε τη μείωση του εισοδήματος των παραδοσιακά εκδιδόμενων συγγραφέων με τις αυξήσεις εισοδήματος των αυτοεκδιδόμενων συγγραφέων. Σε μια διεθνή έρευνα και αναφορά που διεξήγαγα με τον Steve Sieck για την ALLi, το 2023 (pdf), ανακαλύψαμε ότι “το διάμεσο εισόδημα από τη συγγραφή και την αυτο-έκδοση όλων των αυτοεκδιδόμενων συγγραφέων που απάντησαν το 2022 ήταν $12,749, αύξηση 53% σε σχέση με το προηγούμενο έτος. Τα μέση (μέσος όρος) εισοδήματα ήταν πολύ υψηλότερα: $82,600 το 2022, αύξηση 34%.”

Σε μια ξεχωριστή έρευνα, που διεξήχθη από τον Peter Hildick-Smith για το Authors Guild, “οι αυτοεκδιδόμενοι συγγραφείς πλήρους απασχόλησης, που είχαν δημοσιεύσει τουλάχιστον από το 2018, ανέφεραν μέσο εισόδημα $24,000 σε σύγκριση με $13,700 το 2018, αύξηση 76 τοις εκατό.”

Υβριδικοί εκδότες

Για λόγους πληρότητας, θέλω επίσης να αναφέρω τους υβριδικούς εκδότες. Έχω γίνει όλο και πιο ενθουσιώδης για το υβριδικό μοντέλο, και το τμήμα των υβριδικών εκδόσεων είναι σημαντικό και αναπτύσσεται. Κανείς δεν υπολογίζει τις πωλήσεις υβριδικών ξεχωριστά. Αλλά ο αντίκτυπος είναι πιο ξεκάθαρος στην κυριαρχία τους σε δύο κατηγορίες: βιβλία από διασημότητες και δημοφιλή επιχειρηματικά βιβλία. Αυτές οι κατηγορίες έχουν από καιρό αξιόπιστες πηγές εισοδήματος για τους εμπορικούς εκδότες, αλλά οι “υπηρεσίες θυρωρείου” των υβριδικών εκδοτών, και η πολύ πιο ευνοϊκή κατανομή εισοδήματος, είναι ακαταμάχητες για πολλούς υψηλού προφίλ συγγραφείς.

Πρόσφατα παραδείγματα, όπως η σχέση διανομής κερδών της Authors Equity με τους συγγραφείς της, και η διανομή κερδών 50/50 της Keila Shaheen με την Simon & Schuster, υποδηλώνουν μια τάση προς την κανονικοποίηση του υβριδικού μοντέλου. Αυτά είναι καλά νέα για τους συγγραφείς, αλλά λιγότερο ενθαρρυντικά για τους παραδοσιακούς εκδότες.

Εκδόσεις πέρα από τους εκδότες

Συγγράφω μια αναφορά με τον Rüdiger Wischenbart, βασισμένη στη μελέτη του “Publishing Beyond Publishers.” Προσπαθούμε να κατανοήσουμε και να ποσοτικοποιήσουμε, όσο καλύτερα μπορούμε, όλη τη δραστηριότητα δημοσίευσης βιβλίων παγκοσμίως που θα μπορούσε (και θα έπρεπε) να συμπεριληφθεί ως μέρος μιας πιο ολοκληρωμένης άποψης του σύγχρονου οικοσυστήματος εκδόσεων.

Μόλις περάσεις πέρα από το βιβλίο ως δοχείο, βρίσκεις ενδείξεις για το πού η AI θα μπορούσε πραγματικά να έχει επιρροή.

Το χαρακτηριστικό παράδειγμα για το έργο μας είναι το Wattpad, όπου “97 εκατομμύρια άνθρωποι ξοδεύουν πάνω από 23 δισεκατομμύρια λεπτά τον μήνα ασχολούμενοι με πρωτότυπες ιστορίες.” Οι ιστορίες βιώνονται διαδικτυακά, κυρίως σε smartphones, σε μικρά κομμάτια. Ελάχιστες γίνονται εκδοτικά βιβλία. Είναι εξίσου πιθανό να βρεθούν στα “Wattpad WEBTOON Studios, τα τμήματα τηλεόρασης, κινηματογράφου και εκδόσεων της εταιρείας.”

Οι νεότεροι αναγνώστες είναι πιο προσαρμοσμένοι στην ψηφιακή ανάγνωση μέσω διαδικτύου από τους μεγαλύτερους. Σύμφωνα με μια έρευνα του Wattpad τον Ιανουάριο του 2024, “οι ψηφιακές μορφές είναι ολοένα και πιο δημοφιλείς μεταξύ των νεότερων γενεών, με το 65% της Generation Z και το 71% των Millennials να αγκαλιάζουν τα webnovels, τα ebook και τα webcomics, ενώ λιγότερο από το μισό των γενεών Gen X και Boomer λένε το ίδιο.”

Και, φυσικά, όπως μαθαίνει τώρα η παραδοσιακή βιομηχανία εκδόσεων: “Η διαφορετικότητα είναι ένας βασικός παράγοντας για την αποδοχή των ψηφιακών μορφών: το 61% της Generation Z και το 70% των Millennials συμφωνούν ότι τα ebook, τα webnovels και τα webcomics τους δίνουν πρόσβαση σε περιεχόμενο που είναι πιο δύσκολο να βρεθεί σε βιβλιοπωλεία και βιβλιοθήκες, συμπεριλαμβανομένου περιεχομένου με έμφαση στο LGBTQ+ και τις μειονότητες.”

Το Wattpad έχει ανταγωνιστές, συμπεριλαμβανομένου του Inkitt, το οποίο, σύμφωνα με το Publishers Weekly, πρόσφατα συγκέντρωσε 37 εκατομμύρια δολάρια από επενδυτές “συμπεριλαμβανομένου του Stefan von Holtzbrinck, του ιδιοκτήτη της Holtzbrinck Publishing Group, η οποία κατέχει την Macmillan, και του πρώην διευθύνοντος συμβούλου της Penguin Michael Lynton; τώρα έχει συγκεντρώσει συνολικά 117 εκατομμύρια δολάρια σε επενδύσεις. Τον Φεβρουάριο του 2023, οι Financial Times είπαν ότι το Inkitt ήταν η όγδοη ταχύτερα αναπτυσσόμενη εταιρεία στην Ευρώπη και η #1 στη Γερμανία.” Ένα άρθρο της 9ης Ιουλίου στο Esquire περιέγραψε τη χρήση της AI από το Inkitt, τον ρόλο της στην επιτυχία τους.

Πόσοι από εσάς έχετε καν ακούσει για το Inkitt, επισκεφθεί την πλατφόρμα έκδοσής του, ή κατεβάσει την εφαρμογή ανάγνωσης Galatea;

Αλλά η αναφορά μας “Publishing Beyond Publishers” πηγαίνει πέρα από τις διαδικτυακές πλατφόρμες ιστοριών για να εξετάσει πώς “το περιεχόμενο μπορεί να δημιουργηθεί και να διανεμηθεί σε μια ποικιλία μορφών (εκτυπωμένα, ψηφιακά), μέσων (βιβλία, ήχος, ταινίες, παιχνίδια), καναλιών διανομής (κοινότητες, πλατφόρμες, ροές) και επιχειρηματικών μοντέλων (πωλήσεις προϊόντων, συνδρομές, ροή, freemium, πληρωμένα μοντέλα) σε κυρίως ψηφιακά καθορισμένες αλυσίδες προμήθειας και μάρκετινγκ.” Πόσες ευκαιρίες χάνουν οι εκδότες βιβλίων επειδή δεν ταιριάζουν προφανώς στο τρέχον επιχειρηματικό τους μοντέλο;

Καινοτομία, τεχνολογία και έκδοση βιβλίων

Με εξαίρεση τα ebooks, η σύγχρονη έκδοση δεν έχει ποτέ αντιμετωπίσει απειλή από την τεχνολογία. (Τα ψηφιακά ηχητικά βιβλία χαιρετίστηκαν περισσότερο με χαρά παρά με ανησυχία.) Η αυγή της εποχής του Διαδικτύου παρείχε στους εκδότες περισσότερες ευκαιρίες παρά απειλές. είναι μόνο ένας λιανοπωλητής, η Amazon, που διευκολύνεται από το Διαδίκτυο, που αναστάτωσε την αγορά.

Ποτέ δεν έχω δει μια μελέτη για το αν η Amazon ήταν (όταν όλοι οι παράγοντες των λειτουργιών και των επιπτώσεών της ληφθούν πλήρως υπόψη) θετική καθαρή για τη βιομηχανία έκδοσης βιβλίων. Φτάνει σε πολλούς αγοραστές που δεν εξυπηρετούνται από τα καταστήματα με τούβλα, και είναι πρόθυμη να θυσιάσει το περιθώριο κέρδους για να κρατήσει τις τιμές χαμηλές. Τα ebooks και τα ηχητικά βιβλία παραδίδονται σε μεγάλη κλίμακα. Αλλά η Amazon είναι σε θέση να μειώσει τις τιμές εν μέρει επειδή απαιτεί υψηλές εκπτώσεις και τέλη από τους προμηθευτές, και πνίγει άλλα κανάλια λιανικής. Υπάρχουν επώδυνες ανταλλαγές.

Ακόμα, μην προσπαθήσετε να κριτικάρετε την Amazon μπροστά σε έναν αυτοεκδιδόμενο συγγραφέα. Δεν θα ήταν στην επιχείρηση χωρίς The Everything Store.

Το δίλημμα του καινοτόμου

Για να αποκτήσετε μια προοπτική για τον επερχόμενο αντίκτυπο της τεχνητής νοημοσύνης στην έκδοση βιβλίων, συνιστώ το βιβλίο του Clayton Christensen The Innovator’s Dilemma: When New Technologies Cause Great Firms to Fail, που δημοσιεύθηκε για πρώτη φορά το 1997 από τις Harvard Business Review Press.

Ο Christensen εξετάζει πώς οι υπάρχουσες (καθιερωμένες) εταιρείες μπορούν να υποκύψουν στις δυνάμεις καινοτομίας.

Επιτυχημένες, καλά διαχειριζόμενες εταιρείες συχνά αποτυγχάνουν όταν ανατρεπτικές αλλαγές έρχονται στη βιομηχανία τους. Οι συμβατικές πρακτικές διαχείρισης, που τους είχαν βοηθήσει να γίνουν ηγέτες της βιομηχανίας, καθιστούν δύσκολο για αυτές τις εταιρείες να είναι ευέλικτες στην αντιμετώπιση των ανατρεπτικών τεχνολογιών που θα μπορούσαν να κανιβαλίσουν τις αγορές τους.

Αγνοούν τα προϊόντα που δημιουργούνται από τις ανατρεπτικές τεχνολογίες, επειδή, με την πρώτη ματιά, συγκρίνονται άσχημα με τα υπάρχοντα προϊόντα τους. Οι πιο κερδοφόροι πελάτες τους συνήθως δεν μπορούν να χρησιμοποιήσουν τις υποτιθέμενες καινοτομίες και δεν τις θέλουν. Οι εταιρείες προσπαθούν να πολεμήσουν τις ανατρεπτικές απειλές διπλασιάζοντας τις προσπάθειες για τα υπάρχοντα προϊόντα και υπηρεσίες.

Το κύριο συμπέρασμα του Christensen είναι ότι, κάνοντας το φαινομενικά ‘σωστό’ πράγμα, συμπεριλαμβανομένης της ακρόασης των πελατών, οι επιτυχημένες εταιρείες αφήνουν τον εαυτό τους ευάλωτο στην ανατρεπτική καινοτομία. Εστιάζουν στους τρέχοντες πελάτες τους και αγνοούν τις σημαντικές νέες τεχνολογίες – που αρχικά στοχεύουν μικρές, λιγότερο κερδοφόρες αγορές. Αυτό δημιουργεί ένα άνοιγμα για ευέλικτες νεοφυείς επιχειρήσεις να ανατρέψουν τους ηγέτες.

Ο Chris Dixon, συζητώντας το βιβλίο, επισημαίνει ότι “ο λόγος που τα μεγάλα νέα πράγματα ξεφεύγουν από τις καθιερωμένες εταιρείες είναι ότι το επόμενο μεγάλο πράγμα πάντα ξεκινάει να απορρίπτεται ως ‘παιχνίδι.’” Χμμ, ναι, πολλοί άνθρωποι βλέπουν την Chat AI ως παιχνίδι.

Μήπως οι εκδότες αποτυγχάνουν να αναγνωρίσουν ότι οι καινοτομίες που δημιουργούνται με γεννητική τεχνητή νοημοσύνη μπορεί να ανατρέψουν το ευαίσθητο επιχειρηματικό τους μοντέλο;

Μυθιστόρημα έναντι μη μυθοπλασίας

Η επίδραση της AI στη βιβλιοεκδοτική βιομηχανία θα έχει σίγουρα μια δραματικά διαφορετική επίδραση στην έκδοση μυθιστορημάτων από ό,τι στη μη μυθοπλασία.

Η βιβλιοεκδοτική βιομηχανία δεν αναλύεται συχνά αρκετά ως δύο διαχωρισμένες βιομηχανίες, μια που εκδίδει μυθιστορήματα και μια που εκδίδει μη μυθοπλασία.

Ενώ οι περισσότεροι εμπορικοί εκδότες προσφέρουν τόσο μυθιστορήματα όσο και μη μυθοπλασία, το χάσμα μεταξύ των δύο μορφών είναι έντονο τόσο στον αριθμό των τίτλων που εκδίδονται όσο και στις πωλήσεις βιβλίων. Οι εκτιμήσεις ποικίλλουν, αλλά οι τίτλοι μυθιστορημάτων αντιπροσωπεύουν μόνο περίπου το 10% των βιβλίων που εκδίδονται κάθε χρόνο. Οι πωλήσεις, ωστόσο, ευνοούν σε μεγάλο βαθμό τα μυθιστορήματα. Και πάλι, υπάρχουν ετήσιες μεταβολές, αλλά τα μυθιστορήματα καταλαμβάνουν περίπου το ήμισυ των ετήσιων πωλήσεων εμπορικών βιβλίων. Πέρυσι 21 από τα 25 κορυφαία ευπώλητα ήταν μυθιστορήματα. Χρησιμοποιώντας τη συλλογή της Wikipedia, από τα βιβλία στα Αγγλικά που έχουν πουλήσει ποτέ 20 εκατομμύρια αντίτυπα ή περισσότερα, το 84% είναι τίτλοι μυθιστορημάτων.

Οι τάσεις στις πωλήσεις βιβλίων είναι γνωστά ασταθείς, αλλά οι πωλήσεις μυθιστορημάτων φαίνεται να βρίσκονται σε συνεχή ανοδική πορεία. Μετά την πτώση στο 32% το 2019, διεκδίκησαν το 40% της αγοράς ενηλίκων το 2022 και αυξήθηκαν ελαφρώς ξανά το 2023. Οι πωλήσεις μυθιστορημάτων για ενήλικες αυξήθηκαν επιπλέον κατά 6,3% το πρώτο εξάμηνο του 2024.

Ενώ η AI θα χρησιμοποιείται όλο και περισσότερο από τους συγγραφείς μυθιστορημάτων για να βοηθήσει στη διαδικασία της δημιουργίας, όπως συζητείται αλλού, φαίνεται μικρή η πιθανότητα οι ιστορίες που παράγονται από AI να κατακτήσουν τα ράφια των ευπώλητων. Ένα “αρκετά καλό” επίπεδο για κάποια είδη μυθιστορημάτων είναι πιθανό, αλλά και πάλι όχι κάτι που θα πρέπει να προκαλεί αϋπνίες στους συγγραφείς και εκδότες.

Η συγγραφή και έκδοση μη μυθοπλασίας, από την άλλη πλευρά, θα υποβοηθηθεί και υποστηριχθεί από την AI σε όλο τον πίνακα. Ήδη συμβαίνει. Οι συγγραφείς μη μυθοπλασίας επωφελούνται από τα πολλά ταλέντα του Chat AI τόσο ως βοηθός έρευνας όσο και ως βοήθεια στη συγγραφή. Και οι εκδότες μη μυθοπλασίας θα καλούν όλο και περισσότερο το Chat AI για βοήθεια στην ανάπτυξη χειρογράφων, επαλήθευση γεγονότων, επιμέλεια, μάρκετινγκ και διανομή.

Υπάρχει υπαρξιακή απειλή για τους συγγραφείς;

Μίλησα με έναν πολύ έξυπνο πράκτορα συγγραφέων, που έχει σκεφτεί πολύ για το τι σημαίνει η AI για τους πελάτες της και για όλους τους επαγγελματίες συγγραφείς. Η συζήτηση στράφηκε στην ιδέα του βιβλίου ως ‘δοχείο’ και της ζήτησα να αναπτύξει αυτή την ιδέα. Η απάντησή της:

“Η βασική ιδέα είναι ότι όταν οι συγγραφείς/πράκτορες τοποθετούν ένα βιβλίο με έναν εκδότη, είναι απλά αυτό: ένα βιβλίο. Υπάρχει μια κατανόηση ότι μπορεί αργότερα να γίνει μια από τις μυριάδες μορφές παράγωγων έργων που έχουμε γνωρίσει (μετάφραση, δραματική προσαρμογή, γραφικό μυθιστόρημα, κ.λπ.), αλλά όλα αυτά είναι δευτερεύοντα στο ‘Έργο’ αυτό καθαυτό. Το Έργο δεν είναι μια σακούλα λέξεων ή φράσεων ή γεγονότων, είναι κάτι δομημένο από τον συγγραφέα με έναν τρόπο μοναδικό για αυτόν τον συγγραφέα. Το σπάσιμο του δοχείου, το ανακάτεμα της σακούλας του Scrabble και η αντληση μιας τυχαίας επιλογής (που δεν είναι εντελώς τυχαία επειδή είναι μια σακούλα Scrabble που αποτελείται από τη σύνταξη και τη σημασιολογία και το στυλ του συγκεκριμένου συγγραφέα), δεν είναι αυτό που εξετάζεται όταν παραχωρούμε δικαιώματα σε έναν εκδότη.

“Το βιβλίο είναι το ολοκληρωμένο σύνολο που είναι μεγαλύτερο από το άθροισμα των μερών του. Είναι το προϊόν μιας δημιουργικής επιφάνειας (και ενός μεγάλου αριθμού δημιουργικής πνευματικής εργασίας) που το έφερε όλα μαζί ως βιβλίο, όχι απλά ‘ένα’ βιβλίο, αλλά το βιβλίο από αυτόν τον συγκεκριμένο συγγραφέα.”

Τα βιβλία περιέχουν θησαυρούς

Όταν σκέφτομαι τα μη μυθοπλαστικά βιβλία, το σπάσιμο του κοντέινερ είναι ένα από τα πλεονεκτήματα της εποχής της Τεχνητής Νοημοσύνης. Σπάτε το κοντέινερ, και όπως τα αυγά Fabergé, υπάρχουν θησαυροί μέσα.

Οι περιορισμοί του κοντέινερ είναι τόσο ένα χαρακτηριστικό όσο και ένα μειονέκτημα. Από τη μία πλευρά, “το Έργο δεν είναι απλά μια σακούλα λέξεων ή φράσεων ή γεγονότων, είναι κάτι δομημένο από τον συγγραφέα με έναν μοναδικό τρόπο για αυτόν τον συγγραφέα.” Από την άλλη πλευρά, στη δημιουργία του κοντέινερ, ο συγγραφέας, λόγω των εγγενών περιορισμών του βιβλιοειδούς κοντέινερ, αναγκάστηκε να μειώσει, να απορρίψει, να ξαναγράψει και να αναδιαμορφώσει. Το έργο είναι γυαλισμένο, αλλά είναι αποσταγμένο, και κάποια πράγματα χάθηκαν (ενώ άλλα αποκτήθηκαν) στη διαδρομή.

Οι άνθρωποι δεν διαβάζουν μακροσκελή μη μυθοπλαστικά βιβλία εν μέρει επειδή έχουν συνηθίσει να σαρώνουν όλο το κείμενο που συναντούν στο διαδίκτυο - συμπεριλαμβανομένων των email τους. Ακόμη και το “μοντέλο περίληψης βιβλίου” αποτυγχάνει - αντί για ένα μη εύπεπτο βιβλίο 250 σελίδων, παίρνετε μια μη εύπεπτη περίληψη 8 σελίδων του βιβλίου.

Τα βιβλία είναι σαν κουτιά μεσημεριανού - όλα τα πράγματα σε ένα μέρος. Αλλά εγώ θέλω μόνο τα μπισκότα.

Δεν θα είναι εύκολο για τους καταξιωμένους συγγραφείς να αποτινάξουν τις αλυσίδες τους. Αλλά μπορεί να χρειαστεί να μάθουν να το κάνουν, ή να διακινδυνεύσουν να επισκιαστούν από μια νέα γενιά ικανών ερευνητών και συγγραφέων που μπορούν να εκφραστούν με ή χωρίς επίσημα κοντέινερ, ανάλογα με την περίσταση. Τα κοντέινερ επιβάλλουν πάρα πολλούς περιορισμούς και περιορισμούς.

Αυτό που συμβαίνει είναι ότι η επιχείρηση της συγγραφής έχει ανεπανόρθωτα αλλάξει. Είναι σαν το τέλος των γραφέων. Σε αυτήν την περίπτωση, οι μοναχικοί συγγραφείς μας πρέπει να βγουν από πίσω από τα γραφεία τους και την κοντεϊνοποιημένη άποψή τους για το βιβλίο, και να αλληλεπιδράσουν με τη φόρμα και με το κοινό τους.

Ω ναι, ξέρω καλά τις απαντήσεις των συγγραφέων: Αλλά είμαι συγγραφέας, δεν είμαι προαγωγός. Δεν είμαι στα κοινωνικά μέσα. Δεν έχω κανένα ενδιαφέρον για να επικοινωνήσω πραγματικά με τους αναγνώστες μου εκτός από το έργο μου και με περιστασιακά email και όλο και πιο περιστασιακές εμφανίσεις. Έχω έναν ιστότοπο (αλλά, για να πω την αλήθεια, ποτέ δεν τον ενημερώνω). Το έργο μου είναι το δώρο μου στους αναγνώστες. Μπορούν να δεχτούν το έργο μου, ή να το απορρίψουν, αλλά δεν θα τους συνοδεύσω στα σαλόνια τους.

Λοιπόν, μπορείτε να αποθηκεύσετε τους κυλίνδρους και το μελάνι φτιαγμένο από το αίμα των ερμίνων. Η ιδιότητα του ‘συγγραφέα’ τώρα απαιτεί να βγείτε από πίσω από το γραφείο σας και να συναντήσετε τους αναγνώστες σας εκεί που ζουν, στα σαλόνια τους και στις σελίδες τους στο Facebook. Μπορείτε να το θρηνήσετε όσο θέλετε, καθώς κλείνουμε τις επιχορηγήσεις σας, τις μόνιμες θέσεις και τις εκδοτικές σας ευκαιρίες. Αυτός είναι ο γενναίος νέος κόσμος των συγγραφέων και αναγνωστών, χωρίς εκδότες, αυτούς τους φρικτούς μεσάζοντες που εργάζονται σκληρά για να βελτιώσουν τη δουλειά σας, αλλά συνεχώς διακόπτουν την άμεση σύνδεσή σας με τους αναγνώστες, τα άτομα που την εκτιμούν περισσότερο.

Τίποτα από αυτά δεν αποκλείει τα μεγάλα βιβλία αφηγηματικής μη φαντασίας από το να φτάσουν σε ένα ευαισθητοποιημένο κοινό. Αντιθέτως. Αυτά τα βιβλία μπορούν να συνεχίσουν να λάμπουν. Θα υπάρχουν ακόμη και ευπώλητα μη φανταστικά βιβλία, αν και τα οικονομικά θα αποδειχθούν αδύνατα για όλους εκτός από τους συγγραφείς με τις κορυφαίες πωλήσεις. Το τρέχον μοντέλο δεν χρειάζεται να εξαφανιστεί για να ανθίσει το νέο μοντέλο.

Σκέφτομαι αυτά τα μεγάλα μη φανταστικά βιβλία ως ‘όμορφα.’ ‘Όμορφα’ με την έννοια της όμορφης γραφής, προσεκτικά επεξεργασμένα, σχεδιασμένα με φροντίδα και προσοχή, και τυπωμένα, με οδοντωτές άκρες, σε χαρτί πιστοποιημένο από FSC. Πωλούνται σε μπουτίκ.

Οι μπουτίκ ονομάζονται ‘βιβλιοπωλεία,’ αλλά έχουν όλα τα χαρακτηριστικά της μπουτίκ λιανικής – όμορφα αντικείμενα, επιλεγμένα με φροντίδα από τον ιδιοκτήτη και τους διευθυντές, λίγο ακριβά, αλλά για όσους θησαυρίζουν τέτοια αντικείμενα, αξίζουν το κόστος.

Το έργο των περισσότερων συγγραφέων μη φαντασίας είναι τώρα να προχωρήσουν πέρα από το δοχείο, καθώς και τον εκδότη ως φύλακα πύλης.

Δοχεία περιεχομένου σε πολλαπλά μέσα

Το αναγνωστικό κοινό, ιδιαίτερα τα νεότερα μέλη του, είναι ολοένα και περισσότερο ‘μέσα-αγνωστικό’. Αναζητώντας ψυχαγωγία ή γνώση, μπορούν να παρακολουθούν ένα βίντεο στο YouTube ή στο TikTok, μια σειρά στο Netflix, να ακούν στο Spotify, να σκρολάρουν στο Instagram (“Insta”), να ενημερώνονται για τα νέα ή, περιστασιακά, να διαβάζουν ένα βιβλίο.

(Οι κάτοικοι του BookTok που χαϊδεύουν τα έντυπα βιβλία είναι μια αγαπημένη ομάδα επιρροών, αλλά έχουν μέτριο αντίκτυπο στην αγορά συνολικά.)

Ωστόσο, το μοντέλο της αγοράς εξακολουθεί να επικεντρώνεται στο μοναδικό δοχείο. Η εκδοτική βιομηχανία. Η κινηματογραφική βιομηχανία. Η τηλεοπτική βιομηχανία. Η μουσική βιομηχανία.

Οι ταινίες δεν είναι βιβλία. Τα βίντεο στο YouTube δεν είναι ταινίες. Τα podcasts δεν είναι ηχοβιβλία.

Αυτοί οι σιλό δεν ήταν ιστορική αναγκαιότητα αλλά αποτέλεσμα μιας σειράς επιχειρηματικών αποφάσεων που έλαβαν ισχυρές οργανώσεις με την πάροδο του χρόνου.

Δεν είναι δύσκολο να διαταραχθεί ένα επιχειρηματικό μοντέλο που βασίζεται σε ένα μόνο δοχείο.

Για όλη της την άνεση με τη γλώσσα, η τρέχουσα γενιά της γενεσιουργής ΤΝ κάνει τα μαγικά της με ακόμη μεγαλύτερη έπαρση παράγοντας ήχους, εικόνες και βίντεο. Η ΤΝ προσφέρει σε αυτό το βιβλίο ηχητικά βιβλία, σε πολλές γλώσσες, μαζί με τις 31 μεταφράσεις του ebook. Τίποτα από αυτά δεν θα ήταν έστω και απομακρυσμένα δυνατό χωρίς την ΤΝ—η οικονομία της παραδοσιακής παραγωγής δεν έχει νόημα για μένα.

Απομονωμένα δοχεία

Οι δημιουργοί περιεχομένου παραδοσιακά εκπαιδεύονται να διαπρέπουν σε μόνο ένα απομονωμένο δοχείο. Έχουμε προγράμματα συγγραφής, προγράμματα κινηματογράφου και προγράμματα μουσικής. Σπάνια μας περνάει από το μυαλό ότι οι δημιουργικοί συγγραφείς μπορεί επίσης να πάρουν ‘δευτερεύουσα ειδικότητα’ στον κινηματογράφο ή στη μουσική. Ή στον προγραμματισμό ηλεκτρονικών υπολογιστών ή στην ανάπτυξη εφαρμογών.

Τι απέγινε η τρανσμέδια; Πού είναι τα προγράμματα που διδάσκουν στους δημιουργικούς να είναι, όπως το έθεσε κάποτε η Apple, “Δάσκαλοι των Ψηφιακών Μέσων”;

Το καλύτερο περιεχόμενο θα κερδίζει πάντα. Αλλά, με τον καιρό, τα δοχεία περιεχομένου έχουν όλο και λιγότερη σημασία. Η ψηφιακή γενιά μπορεί να μην είναι αδιάφορη ως προς το δοχείο. Αλλά είναι ευέλικτη ως προς το δοχείο. Συναντούν το μεγαλύτερο μέρος του περιεχομένου τους ψηφιακά, μέσω smartphones. Η εκτύπωση θα συνεχίσει να βρίσκει κοινό, αλλά δεν θα ξανακατακτήσει το κέντρο.

Ο “εκδότης του μέλλοντος” πρέπει επίσης να είναι ευέλικτος ως προς το δοχείο. Η περισσότερη ανάπτυξη στη διανομή περιεχομένου δεν γίνεται μέσω μελάνης σε χαρτί, ούτε μέσω λέξεων σε αρχεία EPUB. Η ανάπτυξη των ηχητικών βιβλίων δεν είναι τυχαία, ούτε και η δημοτικότητα του YouTube και του TikTok.

Η μεγαλύτερη πρόκληση έγκειται στην ανάγκη να γίνει το νέο και υπάρχον περιεχόμενο ανακαλύψιμο, όποια κι αν είναι η μορφή του, και μετά την ανακάλυψη, να μετατραπεί η επίγνωση σε απόφαση αγοράς.

Ανακάλυψη και μετατροπή

Το πρόβλημα της διαδικτυακής ανακάλυψης υπάρχει εδώ και καιρό· η ΤΝ δεν το δημιούργησε. Το πρόβλημα είναι αυτό που ο βετεράνος της βιομηχανίας Mike Shatzkin έχει επισημάνει πάνω από μία φορά. Υπάρχουν τόσοι πολλοί τίτλοι διαθέσιμοι σε εκτυπωμένη μορφή, και τα ψηφιακά φορμά επιτρέπουν να παραμένουν συνεχώς σε εκτύπωση. Εκατομμύρια εκτός εκτύπωσης βιβλία μπορούν να βρεθούν από μεταπωλητές μεταχειρισμένων βιβλίων. Πάνω από αυτό, δύο εκατομμύρια ή περισσότερα νέα βιβλία εκδίδονται κάθε χρόνο, μόνο στα Αγγλικά. Η ΤΝ θα κάνει το πρόβλημα κορεσμού χειρότερο, αλλά ήδη είναι εκτός ελέγχου.

Οι αλγόριθμοι του Amazon δεν είναι ανιδιοτελείς—κάνουν πολύ καλή δουλειά στην ανάδειξη του τι είναι πωλήσιμο, το βιβλίο που πιθανότατα θα αγοράσετε στη συνέχεια. Αυτό το βιβλίο δεν χαρακτηρίζεται μόνο από τους αριθμούς πωλήσεών του. Πούλησε καλύτερα όχι επειδή κάποιος απατεώνας βελτιστοποίησε την ηλεκτρονική καταχώριση. Πούλησε καλύτερα επειδή ήταν το καλύτερο, και οι ευχαριστημένοι αναγνώστες είπαν σε άλλους να το αγοράσουν, τόσο διαδικτυακά όσο και προσωπικά. (Το Amazon έχει ενθαρρύνει τη διαφήμιση που παραμορφώνει τους αλγόριθμούς του, μέρος της υποβάθμισης της πλατφόρμας.)

Μίλησα παραπάνω για τα μεταδεδομένα. Η μετατροπή είναι εξίσου εκνευριστική με την ανακάλυψη. Μπορεί η Τεχνητή Νοημοσύνη να βοηθήσει τους συγγραφείς να μετατρέψουν τους περιηγητές σε αγοραστές;

Το μέλλον των πνευματικών δικαιωμάτων

Η έννοια των πνευματικών δικαιωμάτων έχει καταστεί παράλογη από την Τεχνητή Νοημοσύνη. Δεν είναι ότι οι άνθρωποι δεν θέλουν ή δεν αξίζουν προστασία για το έργο τους—πιθανώς την αξίζουν περισσότερο από ποτέ. Και δεν είναι ότι η Τεχνητή Νοημοσύνη καθιστά τα πνευματικά δικαιώματα ανεφάρμοστα (τουλάχιστον με κάποια μορφή, αν όχι στην τρέχουσα μορφή τους).

Είναι ότι η “προστασία των πνευματικών δικαιωμάτων” γίνεται επίσης ένα πέπλο πίσω από το οποίο το έργο σας εξαφανίζεται. Αν το βιβλίο σας δεν μπορεί να αναφερθεί μέσω μιας συζήτησης με το ChatGPT, τότε, de facto, δεν υπάρχει. Οι εταιρείες Τεχνητής Νοημοσύνης θα αδειοδοτήσουν μόνο το crème de la crème του περιεχομένου. Δεν χρειάζονται το αποβουτηρωμένο γάλα.

Γιατί να προστατεύετε αυτό που δεν μπορεί να βρεθεί;

Εδώ είναι που το πρόβλημα της ανακάλυψης μπορεί να γίνει καταστροφικό. Η Google κάνει εξαιρετική δουλειά ανακαλύπτοντας βιβλία μόνο μέσω των μεταδεδομένων τους. Η Τεχνητή Νοημοσύνη θέλει ολόκληρο το πακέτο. Σε αντίθεση με τις παραδοσιακές μηχανές αναζήτησης, η Τεχνητή Νοημοσύνη δεν απαντά σε ερωτήματα χρηστών βασισμένη μόνο στα αφηρημένα μεταδεδομένα ενός έργου.

Ταυτόχρονα, οι αλλαγές στα περιεχόμενα, άλλα περιεχόμενα εκτός από ολόκληρα βιβλία, υποδεικνύουν διαφορετικά είδη προκλήσεων στα πνευματικά δικαιώματα. Αν το κείμενο ενός βιβλίου μπορεί να αλλάξει στη στιγμή, σε απάντηση στην εισαγωγή του αναγνώστη, τότε ποιο είναι το πνευματικό δικαίωμα του κειμένου;

Συγγραφείς & αναγνώστες

Οι εκδότες χρειάζονται τους συγγραφείς· οι συγγραφείς δεν χρειάζονται τους εκδότες.

Το μέλλον της εκδοτικής βιομηχανίας είναι η στενή σχέση μεταξύ συγγραφέων & αναγνωστών. Είναι πολύ πιο ισχυρή από τη σχέση μεταξύ συγγραφέων και εκδοτών και αναγνωστών και εκδοτών. Οι εκδότες μπορούν να είναι εμπόδιο στη σχέση μεταξύ συγγραφέων & αναγνωστών. Σε πολλές περιπτώσεις δεν διευκολύνουν τη σχέση· τη δυσχεραίνουν.

Για πολύ καιρό, ο μόνος τρόπος πρόσβασης σε υψηλής ποιότητας γραπτό περιεχόμενο ήταν μέσω βιβλίων ή μέσω μιας μετριοπαθούς επιλογής περιοδικών. Αυτό σίγουρα δεν είναι πλέον η περίπτωση. Εκτός από τις αποσπάσεις άλλων μέσων, υπάρχουν τώρα τόσοι πολλοί διαφορετικοί τρόποι πρόσβασης σε (μη κονσερβαρισμένο) υψηλής ποιότητας γραπτό περιεχόμενο. Τα βιβλία δεν κατέχουν πλέον την πρωτοκαθεδρία που απολάμβαναν κάποτε.

Η Τεχνητή Νοημοσύνη μπορεί να επικοινωνήσει

“Ποιο είναι το τέλειο βιβλίο για να διαβάσω στη συνέχεια;” Η δημιουργική Τεχνητή Νοημοσύνη μπορεί να απαντήσει σε αυτήν την ερώτηση με μια ευγλωττία και ακρίβεια που ποτέ άλλοτε δεν ήταν δυνατή. Καθώς η Τεχνητή Νοημοσύνη γίνεται ένας αξιόπιστος μηχανισμός συστάσεων, οι συγγραφείς θα χρειαστεί να επικοινωνήσουν μέσω αυτού του μηχανισμού. (Η Amazon, φυσικά, εργάζεται πάνω σε αυτό, και έχει το πλεονέκτημα να γνωρίζει τι έχετε αγοράσει προηγουμένως.)

Συμπέρασμα

Πού μας αφήνει αυτό λοιπόν;

Ένιωσα την ανάγκη να καταγράψω τις προκλήσεις που αντιμετωπίζει η εκδοτική βιομηχανία. Η Τεχνητή Νοημοσύνη φτάνει σε μια εποχή που η εμπορική έκδοση αντιμετωπίζει δυσκολίες. Δεν φτάνει σε μια εποχή που η βιομηχανία είναι ισχυρή και μπορεί να πει: «δεν χρειαζόμαστε κάποια νέα τεχνολογία· τα πάμε μια χαρά.»

Συζήτησα παραπάνω για τις πιο πιεστικές προκλήσεις που αντιμετωπίζει η εκδοτική βιομηχανία: αυξανόμενο κόστος και συρρίκνωση περιθωρίων.

Οι απαιτήσεις για διαρκώς μεγαλύτερες εκπτώσεις δεν θα σταματήσουν ποτέ· τα περιθώρια δεν θα βελτιωθούν. Οι λιανικές τιμές είναι κοντά σε ένα ταβάνι. Το μέλλον του τρέχοντος μοντέλου εμπορικής έκδοσης βρίσκεται στη μείωση του κόστους.

Οι μισθοί δεν μπορούν να μειωθούν περαιτέρω, οπότε θα χρειαστεί να μειώσουμε το κόστος εντός του κύκλου παραγωγής.

Αλλά οι εκδότες προσπαθούν να μειώσουν το κόστος παραγωγής εδώ και δεκαετίες. Έχουν υπάρξει κάποιες αξιοσημείωτες επιτυχίες, αλλά έχουμε εξαντλήσει τις τρέχουσες επιλογές.

Έχω δείξει ότι η Τεχνητή Νοημοσύνη μπορεί να φέρει αποδοτικότητα στην έκδοση, σε όλη τη ροή εργασίας. Δεν είναι άμεση και δεν είναι εύκολη: πρέπει να δουλέψεις με την Τεχνητή Νοημοσύνη. Αλλά η ευκαιρία υπάρχει.

Οι εκδότες δεν κοιτάζουν να μειώσουν το προσωπικό, οπότε ο στόχος πρέπει να είναι περισσότερα βιβλία να έρχονται πιο γρήγορα στην αγορά με βάση τους τρέχοντες πόρους προσωπικού. Τα εργαλεία AI μπορούν να προωθήσουν αυτόν τον στόχο.

Και, φυσικά, υπάρχει πάντα ο στόχος να πουληθούν περισσότερα αντίτυπα των βιβλίων που εκδίδονται. Η Τεχνητή Νοημοσύνη μπορεί να βοηθήσει και σε αυτό.

Περιγράφω παραπάνω πώς η Τεχνητή Νοημοσύνη μπορεί επίσης να είναι μετασχηματιστική για το μέλλον της έκδοσης.

Μην ανησυχείτε γι’ αυτό. Διορθώστε το σπίτι σας, και θα μιλήσουμε περαιτέρω.

Ένας Ενιαίος Πόρος

Υπάρχει τώρα μια σχεδόν ατελείωτη προσφορά υλικού διαθέσιμη για να σας ενημερώσει για την Τεχνητή Νοημοσύνη, πολύ περισσότερο, φυσικά. Επιλέξτε το προτιμώμενο μέσο σας: βιβλία, ιστολόγια, ενημερωτικά δελτία, βίντεο, podcasts, μαθήματα και μαντική. Έχω συνδέσει μερικές βασικές πηγές σε αυτό το βιβλίο, αξίζει να κάνετε κλικ σε μερικούς τυχαίους συνδέσμους για να δείτε πού σας οδηγούν.

Υπάρχει μόνο ένα εξαιρετικό βιβλίο για αρχάριους σχετικά με την Τεχνητή Νοημοσύνη, το Ethan Mollick’s Co-Intelligence, το οποίο κυκλοφόρησε στις αρχές Απριλίου 2024. Είναι βασισμένο στο εξίσου εξαιρετικό ενημερωτικό δελτίο του, “One Useful Thing.”

Παράπλευρη σημείωση: διαπιστευτήρια για τη συγγραφή αυτού του βιβλίου

Δεν ήθελα να επιβαρύνω την εισαγωγή με αυτές τις πληροφορίες, αλλά γνωρίζω ότι πολλοί άνθρωποι είναι σκεπτικοί για τους ανθρώπους που γράφουν για την Τεχνητή Νοημοσύνη σήμερα, υποψιασμένοι ότι αυτοί οι συγγραφείς παρουσιάζονται ως σύγχρονοι ειδικοί στην Τεχνητή Νοημοσύνη. Χωρίς αμφιβολία, κάποιοι είναι. Ελπίζω να έχω αποδεκτά διαπιστευτήρια για να αναλάβω αυτό το έργο.

Διάβασα το πρώτο μου βιβλίο για την τεχνητή νοημοσύνη το 1988, ένα βιβλίο που δημοσιεύθηκε δύο χρόνια προηγουμένως, Understanding Computers and Cognition: A New Foundation for Design από τους Terry Winograd και Fernando Flores. Το βιβλίο είναι πυκνό—πολλά από αυτά ήταν πέρα από την κατανόησή μου—αλλά ήταν η πρώτη φορά που ενθουσιάστηκα με τις δυνατότητες της τεχνητής νοημοσύνης στις εκδόσεις βιβλίων.

Μέχρι τότε ήμουν βαθιά μέσα στην ψηφιοποίηση των εκδόσεων, που προκλήθηκε από την έκρηξη της επιτραπέζιας εκδοτικής, των υπολογιστών Apple, του PageMaker και των παρόμοιων. Το 1986 επέβλεπα την ανάπτυξη του λογισμικού αυτοματοποιημένης εκδοτικής Page One, ένα πρόγραμμα που μπορούσε να πάρει ένα χειρόγραφο βιβλίου ως αρχείο Microsoft Word και να το στοιχειοθετήσει σε ένα ολόκληρο βιβλίο μέσα σε λίγα λεπτά. Αυτό είναι πολύ εύκολο να γίνει σήμερα· δεν ήταν εύκολο τότε.

Συνέχισα να εργάζομαι στην τεχνολογία εκδόσεων στη συνέχεια, ως σύμβουλος και αναλυτής, συνεργαζόμενος με μερικούς από τους κορυφαίους προμηθευτές λογισμικού και υλικού, συμπεριλαμβανομένων των Adobe, Apple και Microsoft. Επίσης, ασχολήθηκα και έγινα συνιδιοκτήτης μιας εταιρείας λογισμικού που ονομάζεται Enfocus. Δημιουργήσαμε ένα αυτοματοποιημένο σύστημα για τις ροές εργασίας προεκτύπωσης.

Δεν είχαμε πρόσβαση στην τεχνητή νοημοσύνη εκείνη τη στιγμή, αλλά γίναμε πολύ καλοί στο να απελευθερώνουμε πλήρως αυτοματοποιημένα συστήματα παραγωγής εκδόσεων. Όπως η τεχνητή νοημοσύνη μπορεί να είναι αδιάκριτη από τη μαγεία, έτσι και η καλύτερη αυτοματοποίηση μπορεί να μοιάζει με τεχνητή νοημοσύνη.

Προχωρώντας στο 2016, ο συνάδελφός μου Cliff Guren με βοήθησε να επικεντρωθώ στην τεχνητή νοημοσύνη στις εκδόσεις βιβλίων: άρχισε να φαίνεται ότι κάτι τελικά συνέβαινε. The Bestseller Code (Archer and Jockers) εμφανίστηκε τον Σεπτέμβριο του 2016, κάνοντας σαφές ότι οι υπολογιστές μπορούσαν να ερμηνεύσουν την υφή της λογοτεχνίας με υψηλό βαθμό διορατικότητας και ακρίβειας.

Μέχρι τότε παρακολουθούσα στενά νεοφυείς επιχειρήσεις εκδόσεων βιβλίων, και ένας μικρός αριθμός εμφανίστηκε με κάποιο βαθμό τεχνολογίας τεχνητής νοημοσύνης ενσωματωμένο στις προσφορές λογισμικού τους.

Προχωρώντας ξανά στον Οκτώβριο του 2022.

Μήνες πριν γίνει το θέμα που όλοι στον χώρο των εκδόσεων συζητούσαν, ο Tim O’Reilly παρουσίασε στο PageBreak Conference για την “AI και τη Μεταμόρφωση των Εκδόσεων”. Ο O’Reilly είναι γνωστός στην κοινότητα των εκδόσεων, τόσο για την O’Reilly Media όσο και για το συνέδριο Tools of Change. Είναι ένας από τους κορυφαίους οραματιστές της τεχνολογίας.

Ο O’Reilly δεν ήταν απλά ενθουσιώδης για τις νέες προόδους στην AI, ήταν υπέρμετρα ενθουσιώδης. “Είμαστε σε ένα σημείο που είναι πολύ παρόμοιο με το πώς ένιωσα όταν ανακαλύψαμε το Παγκόσμιο Ιστό το 1992,” είπε, και ακολούθησε με το “αυτό είναι τόσο μεταμορφωτικό όσο το VisiCalc, ο υπολογιστής και ο φυλλομετρητής ιστού.”

Παραδέχτηκε ότι (σε εκείνο το σημείο) η χρήση ήταν ακόμα ασαφής, αναφέροντας μερικά πιλοτικά έργα στην O’Reilly Media. Αλλά, είπε, “αυτό γίνεται καλύτερο τρομακτικά γρήγορα. Η μηχανική μάθηση δεν είναι πλέον κάτι του μέλλοντος. Αυτό αφορά τη δημοκρατικοποίηση της AI.”

Ο O’Reilly μίλησε για το πώς οι εκδότες θα πρέπει να προσεγγίσουν αυτές τις νέες τεχνολογίες, λέγοντας ότι πρέπει “να ξέρουν πότε να κάψουν τα πλοία και να τα δώσουν όλα. Υπάρχει μια στιγμή που πρέπει να δεσμευτείς.”

Η ChatGPT δεν κυκλοφόρησε παρά μόνο ένα μήνα αργότερα. Το PageBreak ήταν το πρώτο συνέδριο εκδόσεων που το έθεσε στο προσκήνιο, μέσω των ενόρασεων του Tim.

Αποκαλύψεις

Αυτό το βιβλίο έχει πέντε χορηγούς. Ήξερα όταν έγραφα το βιβλίο ότι δεν θα υπήρχαν πολλά πλούτη να βρεθούν, και αποφάσισα να υποστηρίξω τις προσπάθειές μου προσκαλώντας χορηγούς να συμμετάσχουν.

Όπως αναφέρω στην ιστοσελίδα μου, εργαζόμενος ως σύμβουλος, αναλυτής και δημοσιογράφος, υποστηρίζω τον Παγκόσμιο Χάρτη Ηθικής για Δημοσιογράφους της Διεθνούς Ομοσπονδίας Δημοσιογράφων. Η παράγραφος 13 είναι σαφής για την υποχρέωση αποφυγής σύγκρουσης συμφερόντων ή “οποιασδήποτε σύγχυσης μεταξύ της δραστηριότητάς μου και αυτής της διαφήμισης ή προπαγάνδας.”

Η ύπαρξη χορηγών υπονοεί σύγκρουση συμφερόντων και σύγχυση γύρω από τη διαφήμιση. Αν εργαζόμουν για τους New York Times θα ήταν απλό: “Όχι.” Εργαζόμενος για τον εαυτό μου, η αποκάλυψη είναι το όπλο μου για να ικανοποιήσω αυτές τις υποχρεώσεις: Θα περιγράψω την αμοιβή που έχω λάβει και μπορείτε να κρίνετε, στο έργο μου, αν έχω διαφθαρεί.

Επέλεξα τους χορηγούς που προσκάλεσα σε αυτό το έργο γιατί ήμουν εξοικειωμένος όχι μόνο με τη δουλειά τους αλλά και με τα άτομα που εμπλέκονται στις οργανώσεις τους. Είναι συνάδελφοι και φίλοι. Τους είπα ότι τα προϊόντα τους μπορεί να συζητηθούν στο κείμενο αυτού του βιβλίου και δεν θα είχαν κανέναν έλεγχο πάνω σε αυτά τα λόγια. Αυτό που μπορούσαν να ελέγξουν ήταν οι διαφημίσεις τους στο τέλος του βιβλίου—θα τις δημοσίευα όπως θα τις παρείχαν. Αυτό έκανα.

Έχω λάβει πληρωμές από άλλους που μπορεί να επηρέασαν τη δουλειά μου σε αυτό το βιβλίο—μπορώ να καταγράψω τα εξής:

Δεν έχω κάνει καμία πληρωμένη συμβουλευτική εργασία για τους προμηθευτές Τεχνητής Νοημοσύνης που περιγράφονται σε αυτό το βιβλίο, συμπεριλαμβανομένων των χορηγών.
Έλαβα κάποια έσοδα από διαμοιρασμό κερδών από το Publishers Weekly για τα διαδικτυακά σεμινάρια Τεχνητής Νοημοσύνης τον Σεπτέμβριο του 2023.
Πληρώνομαι με ένα τυπικό ποσοστό για τα άρθρα μου στο Publishers Weekly.

Παρακαλούμε ενημερώστε με αν εντοπίσετε οποιαδήποτε εύνοια που πιστεύετε ότι μπορεί να προέκυψε από αυτές τις συμμετοχές. Η προκατάληψή μου υπέρ της Τεχνητής Νοημοσύνης σχηματίστηκε πριν ρέουν τα τεράστια πλούτη.

Ευχαριστίες

Δεν θα μπορούσα να μιλήσω με καμία αξιοπιστία για την Τεχνητή Νοημοσύνη αν δεν ήταν για την υποστήριξη του Publishers Weekly, συμπεριλαμβανομένου του εκδότη σε αποχώρηση, Jim Milliot, και του διευθύνοντα συμβούλου, Cevin Bryerman. Ο Jim υποστήριξε τα πρώτα μου γραπτά για την Τεχνητή Νοημοσύνη, και ο Cevin (μαζί με την Krista Rafanello και την υπόλοιπη ομάδα) ήταν καθοριστικοί για την επιτυχία της περσινής διάσκεψης, Η Τεχνητή Νοημοσύνη και η Επανάσταση στην Έκδοση Βιβλίων. Ο Andrew Albanese είναι τώρα ο εκτελεστικός εκδότης στο PW; ο Ed Nawotka, ανώτερος εκδότης. Είμαι τυχερός που δουλεύω μαζί τους.

Και επιπλέον ευχαριστίες σε πολλούς συναδέλφους…

Peter Brantley
Cliff Guren, μακροχρόνιος αντίπαλος και διορατικός αναγνώστης των προσχεδίων μου
Δύο άλλοι αναγνώστες ‘beta’ εκδόσεων, που προσέφεραν πολύτιμα σχόλια: Joe Wikert και Brad Farmer
Οι Συνεργάτες Τεχνολογίας Έκδοσης, Ken Brooks, Bill Kasdorf, Bill Rosenblatt, Bill Trippe, Steve Sieck, και οι νεότεροι συνεργάτες μας, Lettie Conrad και Linda Secondari.
Η αδελφή μου, Anne Pashley, που με βοηθά να κρατώ την βάση δεδομένων της εκκίνησης εκδόσεων ενημερωμένη και συνεχώς δίνει ενέργεια στις προσπάθειές μου.
Οι συνεργάτες μου στα μηνιαία διαδικτυακά σεμινάρια Τεχνητής Νοημοσύνης: Brooke Horn και Brian O’Leary στο BISG.
Ο Bill Kasdorf με βοήθησε να εμβαθύνω σε θέματα προσβασιμότητας για το βιβλίο μου.
Οι Peter Armstrong και Len Epp στο Leanpub ήταν υπομονετικοί με τις αντιρρήσεις μου και με βοήθησαν να προσφέρω το καλύτερο δυνατό αποτέλεσμα στην πλατφόρμα Leanpub.
Ο Hugo Rayne στο ElevenLabs για την υποστήριξη του audiobook.
Ο καλός μου φίλος και αξιόπιστος ανιχνευτής των λαθών στη γραφή και την λογική μου, Bob McArthur.

Παράρτημα: Εξερευνώντας τα Εναπομείναντα Πλεονεκτήματα της Παραδοσιακής Έκδοσης

Το κύρος της παραδοσιακής έκδοσης είναι ο λόγος που οι περισσότεροι από εμάς μπήκαμε στον κλάδο. Μεγαλώσαμε αγαπώντας τα βιβλία, πήγαμε να σπουδάσουμε Αγγλικά ή κάτι παρόμοιο στο πανεπιστήμιο, δουλέψαμε για λίγο καιρό, ίσως βρήκαμε δουλειά σε ένα βιβλιοπωλείο, ίσως αποκτήσαμε ένα πιστοποιητικό Masters of Publishing, μετά εργαστήκαμε ως ασκούμενοι σε μια εκδοτική εταιρεία, και εδώ είμαστε σήμερα. Αγαπάς τη δουλειά σου, αν και η αμοιβή είναι χαμηλή και οι συνθήκες εργασίας δεν είναι πάντα ευχάριστες.

Το ίδιο κύρος τροφοδοτεί την αλυσίδα εφοδιασμού της έκδοσης. Από την πλευρά των εισροών στην αλυσίδα εφοδιασμού: σημαίνει πολλά για πολλούς συγγραφείς. Το βλέπουμε συνέχεια. Η οικονομία της παραδοσιακής έκδοσης δεν έχει νόημα, και χρειάζεται τετραπλάσιος χρόνος για να εκτυπωθεί, αλλά, ίσως, ίσως να είμαι ο επόμενος νικητής του ντεμπούτου, όπως η Delia Owens (Where the Crawdads Sing) ή ο δεύτερος μεγάλος αστέρας, ο Amor Towles (A Gentleman in Moscow).

Είναι σαν το Βέγκας: εκτός από το ότι οι πιθανότητες είναι καλύτερες στη Νεβάδα. Παίξε ένα μόνο αριθμό στη ρουλέτα και οι πιθανότητες εναντίον σου είναι 36 προς 1. Παίξε την παραδοσιακή έκδοση και οι πιθανότητες εναντίον σου είναι… πολύ χειρότερες.

Οι πιθανότητες να πάρεις συμβόλαιο με οποιονδήποτε από τους παραδοσιακούς εκδότες, πόσο μάλλον με έναν από τους μεγάλους 5, είναι ελάχιστες. Αλλά αυτό είναι το λιγότερο πρόβλημα για έναν συγγραφέα. Είναι πραγματικά να βρει αναγνώστες που είναι η μεγάλη πρόκληση.

Ένα πράγμα που μπορεί να βοηθήσει είναι να καταφέρεις να μπεις σε μια λίστα μπεστ σέλερ.

Ας εξετάσουμε την PRH, Penguin Random House. Η εταιρεία εκδίδει μόνο 15,000 νέα τίτλους κάθε χρόνο. Το 2021 κατάφερε να βάλει 196 βιβλία στη λίστα μπεστ σέλερ του Publishers Weekly. Όπως τονίζει το συνδεδεμένο άρθρο: “PW δημοσιεύει τέσσερις λίστες μπεστ σέλερ ενηλίκων, καθεμία με 20 τίτλους: σκληρό εξώφυλλο μυθιστορήματος, σκληρό εξώφυλλο μη μυθιστορήματος, εμπορικό βιβλίο τσέπης και μαζική αγορά βιβλίου τσέπης. Αυτό σημαίνει ότι σε όλη τη διάρκεια του έτους, υπάρχουν 2,080 θέσεις σκληρού εξώφυλλου στις λίστες μας και 2,080 θέσεις βιβλίου τσέπης.

Δεν ήταν όλα τα ευπώλητα καινούργιες εκδόσεις εκείνη τη χρονιά—ας υποθέσουμε γενναιόδωρα ότι το 90% ήταν, 1870 θέσεις.

Εν τω μεταξύ, οι The New York Times έχουν 15 θέσεις ευπώλητων ανά εβδομάδα για κάθε κατηγορία βιβλίου (μυθοπλασία, μη-μυθοπλασία, παιδικά; ξεχωριστές λίστες για νεανικά και how-to; σκληρό εξώφυλλο ξεχωριστά από χαρτόδετο, καθώς και συνδυασμένες λίστες). Για έναν μεμονωμένο συγγραφέα, αυτό σημαίνει 780 διαθέσιμες θέσεις ανά έτος, αν και οι περισσότερες από αυτές τις θέσεις είναι καταλαμβανόμενες από επαναλαμβανόμενους πωλητές. (The Body Keeps the Score του Bessel van der Kolk βρίσκεται στη λίστα χαρτόδετων για πέντε και μισό χρόνια!). Ας το διαιρέσουμε λοιπόν στη μέση, 390 διαθέσιμες θέσεις. Πρέπει να πουλήσεις πολλά βιβλία για να πιάσεις μία από αυτές.

Τι γίνεται με την κάλυψη στην Βιβλιοκριτική των New York Times; Το 2016, η Pamela Paul, τότε αρχισυντάκτρια της Βιβλιοκριτικής, ισχυρίστηκε ότι “Η Βιβλιοκριτική στους Times κριτικάρει περίπου το 1% των βιβλίων που κυκλοφορούν κάθε χρόνο.” Προφανώς εννοεί το 1% των βιβλίων από τους κορυφαίους εκδότες—δεν μπορεί να σκέφτεται μικρούς εκδοτικούς οίκους ή αυτοεκδόσεις. Έτσι, ίσως 150 από τους 15.000 νέους τίτλους της PRH κριτικάρονται κάθε χρόνο.

Οι περισσότεροι παρατηρητές συμφωνούν ότι, ενώ η προσοχή από τα κορυφαία μέσα ενημέρωσης είναι ακόμη σημαντική και μπορεί να είναι ισχυρή, η επίδραση των κριτικών δεν είναι πια όπως ήταν, αν μη τι άλλο, επειδή λιγότεροι αναγνώστες βιβλίων αλληλεπιδρούν με τα μεγάλα κριτικά μέσα.

Ας στρέψουμε την προσοχή μας στην αλυσίδα εφοδιασμού, στη διανομή. Ενώ οι μάρκες εκδοτών έχουν βαρύτητα με τους συγγραφείς, ήταν πάντα δεδομένο ότι, σε αντίθεση με πολλά καταναλωτικά αγαθά, οι μάρκες εκδοτών έχουν σχεδόν μηδενική βαρύτητα με τους αγοραστές και τους αναγνώστες βιβλίων. Αλλά έχουν πολλή βαρύτητα με τους διανομείς και τους βιβλιοπώλες. Αυτό αντικατοπτρίζει τη διαχρονική φύση της επιχείρησης από επιχείρηση σε επιχείρηση της εκδοτικής (παρά B2C—στους καταναλωτές). Η φήμη του εκδότη διαδίδεται μέσω καναλιών διανομής και λιανικής: το Barnes & Noble φέρνει ένα βιβλίο επειδή είναι από την PRH, και το τοποθετεί μπροστά από τα πρόσωπα των αγοραστών· έτσι διαδίδεται η φήμη στους αναγνώστες.

Χορηγοί

Ένα πανό που λέει 'BOOK ADVISORS LLC Υπηρεσίες συναλλαγών και συμβουλευτική για εκδότες'.

David Lamb και Susan Reich ίδρυσαν την Book Advisors LLC το 2016 για να συμβουλεύουν σε συγχωνεύσεις και εξαγορές στον τομέα των εκδόσεων. Έχουμε ολοκληρώσει περισσότερες από δώδεκα συναλλαγές, καθώς και μια ποικιλία από έργα χρηματοοικονομικής, διανομής και λειτουργικής συμβουλευτικής, συμπεριλαμβανομένων των εκτιμήσεων δίκαιης αγοραίας αξίας. Είμαστε ευχαριστημένοι που έχουμε συνεργαστεί πρόσφατα με την Clarke & Esposito; τον Thad McIlroy από το The Future of Publishing; και τον Kuo-Yu Liang από την Ku Worldwide.

Είμαστε υπερήφανοι για τις σχέσεις μας, την επιμέλεια και τη διακριτικότητα μας. Είτε ενδιαφέρεστε για αγορά, πώληση, χρηματοδότηση ή συμβουλευτική, παρακαλούμε επικοινωνήστε μαζί μας για μια εμπιστευτική συζήτηση.

bookadvisorsllc.com | bookadvisors@gmail.com

Ένα πλέγμα 3x2 με πανό: Ένα πανό που ανακοινώνει ότι η Papercutz εξαγοράστηκε από την Mad Cave Studios τον Αύγουστο του 2022, σε συνεργασία με την Ku Worldwide LLC; Ένα πανό που ανακοινώνει ότι η DAW Books εξαγοράστηκε από την Astra Publishing House τον Ιούλιο του 2022, σε συνεργασία με την Ku Worldwide LLC; Ένα πανό που ανακοινώνει ότι η Caslon Publishing εξαγοράστηκε από την Brookes Publishing Co. τον Απρίλιο του 2022, σε συνεργασία με τον Thad McIlroy; Ένα πανό που ανακοινώνει ότι η B.E.S. Publishing εξαγοράστηκε από την Sourcebooks τον Νοέμβριο του 2021; Ένα πανό που ανακοινώνει ότι η Applewood Books εξαγοράστηκε από την Arcadia Publishing τον Απρίλιο του 2023; Ένα πανό που ανακοινώνει ότι η Erewhon Books εξαγοράστηκε από την Kensington Publishing τον Οκτώβριο του 2022

Λογότυπο των Firebrand Technologies και NetGalley.

Firebrand Technologies είναι μια εταιρεία λογισμικού και υπηρεσιών που βοηθά τους εκδότες βιβλίων με λύσεις διαχείρισης δεδομένων και ροής εργασίας για περισσότερα από 35 χρόνια.

NetGalley είναι μια διαδικτυακή πλατφόρμα που συνδέει εκδότες και συγγραφείς με κριτικούς, βιβλιοθηκάριους, βιβλιοπώλες, μέσα ενημέρωσης και εκπαιδευτικούς που ανακαλύπτουν νέα βιβλία στο NetGalley και τα προτείνουν στο κοινό τους.

Ως προγραμματιστές λογισμικού και ψηφιακών λύσεων, οι Firebrand Technologies και NetGalley είναι επίσης ειδικοί του κλάδου και ενεργά μέλη της εκδοτικής κοινότητας. Οι λύσεις μας ωφελούν όλες τις πτυχές της εκδοτικής διαδικασίας, από τις εξαγορές μέχρι τις πωλήσεις και το μάρκετινγκ.

NetGalley βοηθά τους εκδότες να δημιουργήσουν θόρυβο για τους τίτλους, να λάβουν γρήγορα σχόλια και κριτικές, και να ανακαλύψουν πρώιμες τάσεις.
Title Management Enterprise, μαζί με την συμπαγή εκδοχή του, Title Management Lite, είναι η βασική εφαρμογή λογισμικού της Firebrand που παρέχει προηγμένη διαχείριση ροής εργασιών έκδοσης σε όλη τη διαδικασία έκδοσης.
Eloquence on Demand είναι η πιο ισχυρή πλατφόρμα διανομής ONIX στη βιομηχανία έκδοσης, διανέμοντας μεταδεδομένα και ψηφιακά αρχεία σε πάνω από 600 εμπορικούς συνεργάτες σε ONIX και άλλες μορφές.
Flywheel είναι μια υπηρεσία μάρκετινγκ καταλόγου παλαιών τίτλων που εντοπίζει κρυμμένες ευκαιρίες στον κατάλογο για αυξημένη ανακαλυψιμότητα και πωλήσεις.
Eloquence on Alert παρακολουθεί ζωντανά δεδομένα τίτλων και τάσεις στην αγορά και ειδοποιεί τους εκδότες για κρίσιμα λάθη και ευκαιρίες που μπορούν να επηρεάσουν τις πωλήσεις (έλλειψη κουμπιών αγοράς, τρίτοι πωλητές, κλπ.).
FlightDeck είναι το πιο προηγμένο εργαλείο επικύρωσης και δοκιμής EPUB που είναι διαθέσιμο.

Ένα infographic που δείχνει διάφορες υπηρεσίες που προσφέρει το NetGalley, συμπεριλαμβανομένης της προώθησης βιβλίων, της διαχείρισης ροής εργασιών έκδοσης, της διανομής μεταδεδομένων, του μάρκετινγκ πωλήσεων και καταλόγου παλαιών τίτλων, και της δοκιμής EPUB.

Πανό για το Perfect Bound, μια αγορά που συνδέει εκδότες με τυπογράφους παγκοσμίως.

Καλώς ήρθατε σε έναν καλύτερο τρόπο εκτύπωσης βιβλίων.

Το Perfect Bound δημιουργήθηκε το 2022 για να βοηθήσει στην αντιμετώπιση των προβλημάτων εφοδιαστικής αλυσίδας που πλήττουν τη βιομηχανία έκδοσης βιβλίων εδώ και χρόνια. Περίοδοι υπερβολικής δυναμικότητας στους τυπογράφους ακολουθούνται από σύντομα παράθυρα καθυστερήσεων λόγω ελλείψεων προμηθειών. Το Perfect Bound επιδιώκει να ανοίξει την αγορά εκτύπωσης σε ανεξάρτητους εκδότες και συγγραφείς επιτρέποντας στους τυπογράφους από όλο τον κόσμο να συνδέονται εύκολα και να συνεργάζονται με εκδότες που αναζητούν νέους και δυναμικούς προμηθευτές.

Τι είναι το Perfect Bound;

Το Perfect Bound είναι μία αγορά δύο κατευθύνσεων που συνδέει ανεξάρτητους εκδότες βιβλίων με τυπογράφους στις ΗΠΑ, τον Καναδά, την Κολομβία, τη Βραζιλία, την Τουρκία, την Κίνα, τη Μαλαισία, την Ινδία και άλλα.

Εικονογράφηση ενός τυπογραφικού πιεστηρίου με διάφορους τύπους βιβλίων και εκδόσεων που παράγονται.

Ανακαλύψτε νέους συνεργάτες εκδόσεων με ένα κλικ

Η ισχυρή μας πλατφόρμα σας επιτρέπει να δημιουργείτε απλά προσφορές προϊόντων, να στέλνετε αιτήματα σε εκατοντάδες εκτυπωτές με το πάτημα ενός κουμπιού, να διαπραγματεύεστε και να οριστικοποιείτε τις εκτυπωτικές σας σειρές και να παρακολουθείτε τα προϊόντα από το τυπογραφείο μέχρι την αποθήκη. Ως εκτυπωτής, η σύνδεση με νέους εκδότες, η υποβολή προσφορών για επερχόμενα έργα και η πληρωμή δεν ήταν ποτέ πιο εύκολη ή πιο ασφαλής.

Συνδεθείτε με νέους συνεργάτες εκδόσεων άμεσα

Στείλτε και λάβετε αιτήματα εκτύπωσης από όλο τον κόσμο
Εκτελέστε και παρακολουθήστε τις εκτυπωτικές σειρές από το τυπογραφείο μέχρι την αποθήκη
Κάντε συναλλαγές απρόσκοπτα χρησιμοποιώντας πληρωμές ACH μέσω Stripe χωρίς να αφήσετε την πλατφόρμα

perfectbound.io

Μια διαφήμιση για το Shimmr που παρουσιάζει αυτοματοποιημένη διαφήμιση που πωλεί βιβλία, αναφέροντας αύξηση πωλήσεων κατά 35% και διπλάσια επιστροφή στην επένδυση.

Μια διαφήμιση για το Shimmr με παραδείγματα διαφημίσεων, πληροφορίες τιμολόγησης και έναν QR κωδικό για κράτηση επίδειξης.

Γνωρίστε το Insight, μια πλατφόρμα AI που σχεδιάστηκε ειδικά για εκδότες

Μια κοντινή εικόνα ενός ατόμου που κρατά ένα ανοιχτό βιβλίο με λαμπερά στοιχεία που εκπηγάζουν από τις σελίδες.

“Η υιοθέτηση του Insight για τον εκδοτικό μας οίκο ήταν σαν να ανταλλάσσουμε ένα ποδήλατο με μια Ferrari. Ξαφνικά, όλα κινούνται πιο γρήγορα.”

—-Γερμανικός εκδότης παιδικών βιβλίων και πελάτης του Insight

Εργαστείτε πιο έξυπνα, Επιτύχετε περισσότερα

Αναπτύχθηκε από την Veristage, το Insight ενδυναμώνει τους εκδότες να ευημερήσουν στο εξελισσόμενο τοπίο της Τεχνητής Νοημοσύνης. Χρησιμοποιώντας AI και μια ισχυρή σουίτα ψηφιακών εργαλείων, το Insight αναλύει και κατανοεί τα έγγραφα και τα βιβλία σας, προκειμένου να σας βοηθήσει να:

Δημιουργήσετε, βελτιώσετε και ανανεώσετε μεταδεδομένα
Επιταχύνετε τη δημιουργία υλικού μάρκετινγκ, δημοσιότητας και πωλήσεων που είναι συγκεκριμένα για τίτλους
Εντοπίσετε και αξιολογήσετε τα κύρια μηνύματα του βιβλίου, τα μοναδικά σημεία πώλησης, το στοχευμένο κοινό, τους ανταγωνιστικούς τίτλους και πολλά άλλα
Βελτιστοποιήσετε το περιεχόμενο μάρκετινγκ και πωλήσεων σας για μέγιστη εμβέλεια, εμπλοκή και αύξηση πωλήσεων

Σε αντίθεση με τις γενικές πλατφόρμες AI, το Insight είναι σχεδιασμένο να λειτουργεί μέσα στις ροές εργασίας των εκδόσεων και να σας βοηθά να δημιουργήσετε πληροφορίες και περιουσιακά στοιχεία που είναι συγκεκριμένα για τις εκδόσεις.

Πώς Λειτουργεί

Ανεβάστε το βιβλίο σας στην πλατφόρμα Insight
Τα εργαλεία ΤΝ της Insight αναλύουν και κατανοούν το βιβλίο σας
Μέσα σε λίγα λεπτά, η Insight παράγει ένα ευρύ φάσμα μεταδεδομένων και βασικών πληροφοριών για το βιβλίο σας για τα τμήματα σύνταξης, μάρκετινγκ, δημοσιότητας, πωλήσεων και δικαιωμάτων
Εισάγετε χειροκίνητες επεξεργασίες σε οποιαδήποτε από αυτές τις πληροφορίες απευθείας στην πλατφόρμα. Το βιβλίο σας και το περιεχόμενο ΤΝ αποθηκεύονται εντός της Insight, ώστε να μπορείτε να τα έχετε πρόσβαση οποτεδήποτε.
Χρησιμοποιήστε τη συνομιλία ΤΝ με επίγνωση εγγράφων για να βελτιστοποιήσετε τις πληροφορίες του τίτλου σας, να αλληλεπιδράσετε με τα βιβλία σας και να ενσωματώσετε λεπτομέρειες βιβλίων σε επικοινωνίες και άλλα υλικά

Ασφάλεια και Πνευματική Ιδιοκτησία

Η ομάδα της Veristage δεσμεύεται να παρέχει υπηρεσίες ΤΝ που είναι ασφαλείς και προστατεύουν την πνευματική ιδιοκτησία των εκδοτών. Η πλατφόρμα μας διαθέτει προηγμένα συστήματα ασφάλειας πληροφοριών και συνεργαζόμαστε μόνο με μοντέλα ΤΝ που δεν αποθηκεύουν ή χρησιμοποιούν τα δεδομένα σας για εκπαίδευση μελλοντικών μοντέλων.

Λύσεις για Εκδότες Όλων των Μεγεθών

Η Insight είναι σχεδιασμένη να λειτουργεί για εκδότες όλων των μεγεθών, από καταναλωτικούς έως ακαδημαϊκούς, από ομάδες των τριών ατόμων έως πολυεθνικές οργανώσεις. Προσφέρουμε ανταγωνιστικές τιμές και κλιμακούμενες λύσεις.

Μιλήστε μαζί μας για να μάθετε πώς η Insight μπορεί να ωφελήσει την επιχείρησή σας:

www.veristage.com

Λογότυπο της Veristage σε μπλε με αφηρημένο σχέδιο.