人工智慧革命在圖書出版界 (繁體中文版)
人工智慧革命在圖書出版界 (繁體中文版)
Thad McIlroy
Buy on Leanpub

目錄

介紹

「下一場革命將會讓所有人措手不及,就像它們一向那樣。換句話說:如果大眾預期到了革命,那它就不能算是革命。」 —Doc Searls, 2002

自從OpenAI向大眾介紹ChatGPT以來,已經過了一年半多的時間。當初,這看似與圖書出版無關。然而,自那時起,一切都改變了,而一切也都未改變。出版商開始探索新的AI工具,試探性的與ChatGPT互動。但在出版實踐中,尚未看到真實的革命跡象;現在還太早。

在寫作和出版方面,圍繞AI存在大量的不確定性。關於AI的使用也存在重大爭議。儘管如此,對於許多人來說,AI的可能性令人興奮。

我將更多地關注AI的承諾,而不是它的危險,但我會概述與作者和出版商相關的擔憂和風險。我並不是想輕視這些擔憂。這本書的重點不在於此。

這是一本書嗎?

我認為這本出版物更像是一本“小冊子”而不是一本書。聯合國教科文組織對書的定義是“至少49頁”(為什麼不是50頁?),而按照每頁300字來算,這本書可能不符合資格。但更重要的是,它並不打算成為任何事物的最終說法——更像是進度報告。人工智慧及其在圖書出版中的作用正在以驚人的速度變化,這種變化沒有放緩的跡象。因此,這本書(小冊子),這份報告,只是一個快照。

使用Leanpub平台,我一直在以進行中的作品形式發布我的研究和分析——這是一個活文件,不斷修訂。我以前從未嘗試過這樣做。我的原因有兩個:提供短期內有用的東西,並有能力根據需要進行修訂。AI的故事遠未結束。

我希望我的方法對讀者有用,儘管我知道過多的更新可能會很快變得令人厭煩。我已經嘗試減少這本書的時效性,減少對變化最快的事物的關注。

自2024年4月以來默默可用的版本被標記為“完成75%”,並免費提供給讀者。7月23日是“100%完成”版本的正式出版日期,這個版本也會進入Leanpub以外的更大範圍的分發。我將繼續更新100%版本:但這些更新僅對Leanpub買家可用——不斷更新廣泛分發的印刷版、電子書和有聲書是不切實際的。

出版商在AI本身上的痛苦

我每天都聽到出版業各個領域的人們在努力理解AI時所面臨的痛苦。為什麼這麼痛苦?這裡有三個我看到的原因:

  • 技術複雜而神秘,對於非科學家來說太過複雜。(有一個有趣的研究提出了一個“AI焦慮量表(AIAS)”,測量了人們對AI焦慮的21個不同原因。)

  • AI在出版領域已經變得極具爭議性,主要是因為版權問題,它們直擊創作和出版的核心。

  • 然而,還有一種FOMO的氛圍——錯失良機的恐懼。儘管AI有很多缺陷,但就像許多誘人的技術(Apple手錶?智能音箱?)一樣,我們面臨那種揪心的感覺:如果我錯過了下一個真正的大事,就像我之前錯過了幾個真正的大事一樣。我當時覺得很愚蠢;我不想再感覺愚蠢了。那很痛苦。

好吧:出版業的人們感到AI的痛苦是有道理的。

那麼這本書的使用場景是什麼呢?

使用場景是你在圖書出版業工作,或你是一位試圖更好地了解圖書出版的作者,而你厭倦了在AI方面感到愚蠢和困惑。你周圍太多的同事似乎比你更了解它,而你厭倦了無法在這個話題上進行智能的交流。

我對讀者的目標是,希望在閱讀完這本書後,他們能夠參與對話,表達有見地的意見。我希望你能夠做出關於這項技術的個人選擇,並有一條學習如何使用AI的路徑,前提是你選擇這樣做。

不想用大量關於人工智慧技術的基礎知識來淹沒讀者——我不會談論太多抽象的人工智慧概念。相反,我希望給你一個關於人工智慧在書籍創作和出版方面的基礎知識。如果有人問你,自然語言處理到底是什麼意思,你可以像我一樣回答:我不是人工智慧專家。但我知道人工智慧在我的行業中是如何被應用的。

這會是你所需要知道的嗎?

我不喜歡「你需要知道的」這個短語,因為它很少能達到預期,要麼信息過多,要麼信息過少。我能準確傳達嗎?我認真地試圖傳達最少的必要信息。我認為我知道出版商需要了解的人工智慧知識,因為我一直在與很多出版商交談,並主持專門為提供基礎知識而設計的研討會和網絡研討會。

An icon of a key

與其不斷重複「你需要知道的」這個短語,我將使用一個鑰匙圖標和一些縮進的文本。

在介紹許多章節的摘要之後,我將擴展主要概念。不過,老實說,有時我會多說一些。

我將使用的簡稱是「聊天人工智慧」。當OpenAI首次發布ChatGPT時,它是唯一的選擇,但現在有幾個重要的競爭對手。我會很快介紹具體情況,但你已經聽說過其中的一些,顯然有Google和Microsoft。他們(以及其他幾家公司)現在提供與ChatGPT類似的在線人工智慧聊天軟體。因此,與其說「ChatGPT及其競爭對手」,我將整個類別稱為「聊天人工智慧」。如果我寫「ChatGPT」,我特指OpenAI的軟體。

這本書主要是實用的,但在最後部分我將提出一篇關於人工智慧對書籍出版行業的現實影響的論文,以及其他一些推測性的思考。

這本書是為誰寫的?

這本書的主要讀者是消費類書籍的出版商。次要讀者是所有其他書籍的出版商(學術、教育…)在這些行業領域有重疊的部分。我的第三個讀者是有利害關係的作者,以及對書籍出版感興趣的許多人。

副標題表明這是一本為作家和出版商提供的人工智慧指南。部分原因是我希望出版商也能了解作家在使用這項技術時做了什麼。我認為這很重要。在最近的年度會議上,BISG(書業研究小組),主要代表貿易出版商,表示「它正在尋求從包括文學代理人和作者在內的更廣泛的群體中汲取經驗。」 這是一個受歡迎的舉動。

我希望作家閱讀這本書,因為它可以幫助他們了解出版商在處理他們的手稿時做了什麼。自出版作者總是關注傳統出版,部分原因是他們實際上是出版商,因此出版商感興趣的人工智慧技術也可能對他們有興趣。

但不要誤會,這不是一本關於如何使用人工智慧成為更好、更高效作家的實用指南。關於這個話題有很多書(可惜,其中許多只是騙人的Amazon翻版)。還有很多質量參差不齊的YouTube視頻。

在貿易書籍出版中,我理想的讀者不一定是決策者,而是每天在行業中工作、創作書籍並尋找讀者的眾多人員。在這本書中,我將談論所有主要的出版功能,從編輯到銷售和分發。以及作家與讀者的交集。

儘管我在加拿大長大,並在那裡開始了我的出版事業,但我現在居住在美國舊金山,所以我習慣於思考美國的出版行業。但這本小冊子中的幾乎所有內容對馬達加斯加的出版商和曼哈頓的出版商一樣適用。儘管小國出版商面臨規模挑戰,美國的小出版商也面臨同樣的問題,這本書是為各種規模的公司而寫的。

當我與小型出版商談論人工智慧時,與我與大型出版商談論人工智慧時,最大的區別在於「企業」這個概念。最大的出版商通常是公共公司的一部分或附屬公司,當你成為公共公司後,聲譽和安全問題比普通出版商更重要,因為他們不必像公共公司那樣對股東和新聞媒體負責。儘管大五出版商的編輯使用人工智慧工具的方式與為小型公司工作的自由編輯相同,但他們使用這些工具的背景卻大不相同。

閱讀這本書需要多少人工智慧知識?

我假設我的讀者對人工智慧的內部構造幾乎完全不了解,但他們都是聰明的讀者。所以我會在零知識和不對讀者居高臨下之間,找到一個平衡點。

我想幾乎每個人都聽說過新一代的人工智慧:根據 YouGov 在2024年3月的一項調查顯示,只有7%的美國人對人工智慧“一無所知”。作家和出版商幾乎肯定聽說過一些版權投訴,但可能不太了解相關問題。因此,我不必解釋人工智慧代表“Artificial Intelligence”。但我也不會假設讀者能夠定義人工智慧是什麼,它的含義,它的潛在影響,等等。這就是為什麼你在這裡。

廣泛和具體的無障礙性

我出版這本書的口號是“無障礙”。

對大多數人來說,這僅意味著類似於“可用性”,事實上,我打算以我能想到的盡可能多的形式和格式提供這本書。我想擴展這個容器。我試圖讓我的書成為一個典範出版物,展示今天出版單一本書時所能達到的全部範圍。

在 Leanpub 上,你會發現這本書以 PDF 文件、EPUB 文件和免費的基於網頁的出版物形式提供。你會發現有31種語言的翻譯,包括主要的亞洲和歐洲語言。還會有多種語言的有聲書。

我還會在所有通過 Ingram 和 Amazon 可訪問的電子商務平台上,提供這本書的印刷和數字格式。這包括大多數的在線書店,在世界的許多地方。這樣圖書館也能購買這本書,儘管可以理解的是,它們對自費出版的作品只有有限的空間。(我會向世界上任何要求的圖書館捐贈印刷和數字版本。)

除了整本書的免費網頁版,我還會創建免費摘錄、問答和信息圖表,供那些只想嘗試或品嚐的人使用。這些會通過我的博客提供。

錄製整本書的視頻不太合理,因為有聲書已經可用。但有些人更喜歡通過視頻獲取內容。所以我會提供多個長度的精簡視頻版本。

那麼人情味呢?我還會通過網絡研討會或一對一的在線諮詢,通過我的網站和博客與讀者交流。我甚至可以被聘請親自現身!

“無障礙”遠不止其字典定義。正如加拿大國家公平圖書館服務網絡(NNELS)所說,“一本無障礙的書是每個人都能使用和理解的書。”因此,我的英文 EPUB 文件符合 W3C 1.1 建議 的印刷障礙者標準,包括為圖像提供健全的 替代文字 描述。我們期望外語翻譯版本也能達到這一無障礙標準。

替代文字是用 ChatGPT 創建的。我沒有編輯 ChatGPT 的版本,這樣任何閱讀 EPUB 的人都能看到它的優點和不足之處。正如我的同事 Bill Kasdorf 提醒我,好的替代文字描述的是視覺讀者從圖像中獲得的資訊,而不僅僅是它的外觀。

對於書籍出版商來說,無障礙性不再是一個選項:它是一個默認設置。

(我有兩個 致歉 要分享:由於出版平台的限制,默認的 PDF 文件將無法符合 PDF/UA 規範,我也無法在電子商務網站上提供大字版的書籍。但這兩者都可以應要求提供。)

一些注意事項

如前所述,這本書(相對)較短。當你稱一份短文件為“書”時,你有風險讓買家抗議,“我以為我買的是一本書,但它只有50頁!”我已經盡我所能在銷售頁面上明確說明這不是一本完整的書,但如果你感到失望,請記住 Leanpub 提供60天退款保證,我會高興地將這個退款承諾延長到“永遠”。我希望讀者感到高興,而不是失望。(如果你在其他平台上購買了這本書,請給我發電子郵件:我會寄支票給你!)

這本書包含大量的超連結(這些在不同格式中顯示方式不同,但通常作為註腳出現)。我一直相信在我的作品中鏈接到原始來源,這樣讀者可以驗證我有時誇大的主張。但我也知道,超連結和註腳可能會讓人分心,特別是如果你在使用電子閱讀設備的話。我為此感到抱歉。最好的辦法是忽略閱讀時的鏈接,如果你想更深入了解某個主題,可以回過頭來查看這些鏈接。

我不知道你現在正在以何種格式(或語言)閱讀(或聆聽)。我試圖讓這本書的“人體工學”盡可能用戶友好,但從這個角度來看,鏈接和註腳並不總是最佳選擇。

這本書有贊助商,這對於一本“書”來說是不尋常的。我在文本末尾的披露部分解釋了贊助的工作原理。

為什麼是現在的AI?

An icon of a key

當我與出版商交談時,我聽到的都是緊迫的、立即的關注點。而AI通常不是其中之一。

印刷製造成本上升已經困擾了好幾年,雖然現在似乎已經趨於平穩。增加的分銷成本對所有參與者來說都是挑戰。這些導致了定價壓力——有證據表明讀者開始對目前新精裝書和貿易平裝書的定價感到不滿。我將這些歸類為“類比”問題——數字技術對解決這些問題幾乎沒有幫助。

然後還有更廣泛的“存在性”問題,這些問題越來越受到關注,但它們是模糊的問題,沒有明顯的解決方案。包括:

  • 通過在線和社交媒體發現內容和與受眾互動。

  • 消費者行為和閱讀習慣的變化。

  • 來自其他數字媒體的競爭。

我認為AI在這些領域可以對出版商有很大的幫助,但方法並不明顯,且需要時間來實施。我會在本書的後續章節中描述這一點。

AI:入門

在我進入枯燥的技術背景之前,我邀請你直接跳到在線軟件。頂級工具是免費試用的。有ChatGPT。還有Claude.ai。你可以試試Microsoft Copilot。或者試試Google的Gemini

這就是大多數人開始使用AI的方式——我打賭你已經試過其中一種或多種“玩具”。我也打賭你沒有試過很長時間。我交談的大多數人只用了幾分鐘。他們問了幾個問題,得到了幾個非常明顯的答案,然後就走開了。

錯誤的方法。

我站在Ethan Mollick的一邊,我會在本書中多次描述他的作品。在他的博客和最近一次訪談中,Mollick談到了他的“10小時規則”:

“我想指出,10小時就像1萬步一樣是任意的。這沒有科學根據。這是一種觀察。但它也確實讓你超越了,我只是在一個晚上隨便試試,並讓你朝著認真使用它的方向邁進。我不知道10小時是否是真正的限制,但它似乎是某種變革的。關鍵是在你有專業知識的領域使用它,這樣你可以了解它的優劣勢,並學習其能力的範圍。”

另一位評論員,在評論Mollick最近的AI書籍時,指出了同樣真實的“十倍規則”:“用這些工具實驗一個小時相當於閱讀十個小時。”

你明白了吧。這是關於行動,而不是思考。我的書是一種思考。你需要親自動手。

AI:非常簡短的歷史

An icon of a key

直到幾年前,普通人只聽說過AI作為一種抽象概念,或者是科幻小說中的東西,或者是能在國際象棋或圍棋中擊敗大師的東西。突然間,AI無處不在,這造成了一種錯覺,認為它是新的。即使是新的東西也不完全是新的。但這是個無關緊要的問題。在ChatGPT之前,AI對圖書出版幾乎沒有意義。現在它意義重大。

了解人工智慧大約70年的發展是很有趣的,但這並不是理解現今情況的必要條件。

Our World In Data 已經很好地 簡要記錄了歷史 —我就留給他們吧。

目前這一代的人工智慧主要是在過去十年中發展起來的。然後,突然間,ChatGPT在2022年11月30日出現了。兩個月後,它已經有一億月活躍用戶,這是任何技術進入消費者領域最快的速度(相比之下,Facebook用了兩年以上才達到一億用戶)。

為什麼能夠如此快速地被採用呢?首先,這很有趣也很吸引人。其次,它是免費的。第三,你不需要購買新的設備來使用它。第四,你不需要任何訓練就可以使用ChatGPT(或其聊天AI競爭對手)。但這些因素同樣適用於Facebook,那麼為什麼是ChatGPT呢?

正如亞瑟·克拉克著名的指出,“任何足夠先進的技術都與魔法無異。”聊天AI就是魔法。用日常語言與機器“對話”的體驗……這是神奇的。比如說“我想要一本書在氣球中,在雲中,靠近太陽”,幾秒鐘後,

一本打開的書,熱氣球從書頁中浮現,漂浮在雲中。

……也是神奇的。GPT生成的圖像開始看起來風格相似,色彩豐富且富有幻想。所以我發送了第二個提示“現在以15世紀插圖風格”。於是:

一幅藝術插圖,熱氣球有精緻的圖案,漂浮在雲中,背景是太陽。

如果我想要一本書在氣球中,在雲中,靠近太陽的視頻,有十幾種工具可供選擇,馬上就能實現。還有音樂配樂與視頻配合。那麼,這聽起來如何?就像魔法一樣。

為了避免把人工智慧的非凡能力簡化為不可理解的“魔法”而顯得不敬,有趣的是,許多負責當代人工智慧的科學家承認他們真的不知道它是如何工作的。正如最近一期MIT Technology Review報告所指出的,“儘管它取得了驚人的成功,沒有人確切知道它是如何——或者為什麼——運作的。”既令人興奮,又有點令人害怕。

了解人工智慧和一些關鍵術語

An icon of a key

人工智慧帶來了大量的技術和術語,這些對於除了數據科學家以外的所有人來說都是不可理解的。聊天AI的用戶不需要深入了解人工智慧術語或涉及的技術概念。系統的對話性質允許用戶直觀地互動,而不需要專門的背景知識來了解其工作原理。專注於聊天AI實際能做什麼更為重要。

在準備這本書的過程中,作為一本關於人工智慧的書的作者,我一直在掙扎什麼是“負責任”的做法。傳統的方法是提供一個簡短的科學解釋和常用術語的回顧。

我不打算這麼做。

我將在這裡提供一些外部鏈接,這些鏈接是我認為相對易懂的人工智慧基礎知識的簡短描述。

人工智慧的未來是什麼?: 麥肯錫公司(2024年4月)有一組不錯的解釋

同樣地,Gartner的生成性AI(未註明日期)也不錯。

Futurepedia提供了一個不錯的人工智慧基礎(2024年5月)摘要。

解決了如何做之後,我現在要介紹一些我認為值得了解的術語。不是因為你需要知道它們才能使用軟體。而是因為這組術語涉及當前一代人工智慧實際運作的一些關鍵方面。

我處理這些術語和概念的使用案例是針對那些(i)無論出於何種原因想要更深入了解人工智慧的作者和出版商,或(ii)想要了解當前對人工智慧的批評背景,或(iii)想要參與討論他們的同事或組織應如何對待人工智慧的戰略討論。

換句話說,這不是你需要知道的,而是你可能想知道的。以下是一些非按字母順序排列的內容:

提示和提示技術

你可以打開 Chat AI 軟體,直接輸入問題,就像你目前在 Google 上做的那樣。

大型語言模型 (LLM)

大型語言模型通過分析大量(主要是書面)材料來工作,這使它們能夠預測下一個詞或句子在對話或書寫中的出現。它們並不像人類那樣“理解”語言,而是通過將文本分解為較小的部分(稱為令牌),然後將令牌轉換為數字來處理文本。它們以數字形式處理文本,並回吐更多數字,然後在輸出時將這些數字轉換回文本。這是一個過於簡化的解釋,說明了為什麼 Chat AI 不會“包含”受版權保護的作品:它是用表示底層文本的數字構建的。

LLM 被訓練如何典型地使用語言,然後基於這種理解生成回應。我們往往低估了大多數語言的可預測性。Chat AI 可以生成與現有文獻(有時令人震驚地)相似的文本,但根據設計,它不具備檢索特定摘錄或複製受版權保護文本的能力。(我知道,許多人都聽說過 紐約時報 對 OpenAI 的訴訟——時報 能夠讓 ChatGPT 原樣吐出先前發表文章的部分內容。)

生成式人工智慧

理解這個術語最重要的是“生成”部分。生成式人工智慧生成新的文本。

生成式預訓練轉換器 (GPT)

這是這裡最技術性的術語,描述了由 OpenAI 開發的一種特定類型的 LLM。“生成”意味著它創建文本的能力,“預訓練”表示它已經在大量文本數據上進行了訓練,“轉換器”指的是它使用的軟體。理解 GPT 代表什麼是有幫助的,這樣你就明白 ChatGPT 中的 GPT 代表什麼。

ChatGPT

ChatGPT 是你看到的軟體;GPT 是軟體背後的技術。用戶體驗到的是 ChatGPT,而不是背後的 GPT。如上所述,ChatGPT 只是幾個具有類似功能的 Chat AI 在線軟體系統之一。

你將經常遇到的另一個術語是:

語料庫

字典對語料庫的定義是“書面文本的集合”(儘管實際上,它並不總是文本)。該術語用於指 GPTs 的訓練材料:大量的(主要是)文本語料庫。我們被告知最大的語料庫包含數千億個單詞。對於普通人來說,這是無法理解的。你不認為維基百科已經很龐大,包含大量的單詞嗎?嗯,維基百科中只有 45 億個單詞——而 GPT-4 的訓練數據遠遠超過一萬億個單詞。

我認為這種規模值得考慮。作者們可以理解地擔心他們書中大約 75,000 個單詞可能已經被吸收到大型語言模型中。也許他們的擔心是正確的(下面會有更多介紹)。但假設這是事實,請考慮任何一本書對當今大型語言模型的總體能力有多麼微不足道。真的微乎其微。即使是 10,000 本書也是九牛一毛。

AI 軟體:系統重量級選手

An icon of a key

我在上面列出了四個 Chat AI 重量級選手:ChatGPT、Claude.ai、Microsoft Copilot 和 Google Gemini。

它們的工作方式大致相同,並且提供類似的結果。那麼哪一個最好?這個問題會讓你走進一個無底洞。這有點像問哪個城鎮提供最佳的海灘度假,或哪個 SUV 最適合家庭。有大量的細微差別在其中,並且我們的回答中還夾雜著大量的驕傲與偏見。

這個看似簡單但極其複雜的軟體也是如此。有人認為 Claude 在語言方面有更細緻的技能,而 ChatGPT 在軟體代碼方面更好。Microsoft Copilot 與微軟的軟體套件集成。Google Gemini 可以連接到 Gmail、Google 地圖和 YouTube。有些差異是有意義的;許多則是細微的。而且隨著每次新的軟體版本,它們都在不斷變化。

An icon of a key

目前還無法確定“最好的”軟體。如果你嘗試足夠多的可用工具,你會找到一些最喜歡的。

有兩個頂級的 AI 軟體層級。第一個可以稱為基礎軟體,如 ChatGPT 及其競爭對手(Chat AI)。這是大多數人今天體驗 AI 的方式。

下一層是所有其他提供基本軟體窗口的軟體。AI 聊天的新手大多不會遇到這些軟體,儘管它們並不罕見或晦澀。有些人熟悉 Jasper(行銷軟體)或 Perplexity(搜索)。這些軟體如果沒有 ChatGPT 及其同類就不會存在。

請記住,Adobe、Microsoft、Grammarly、Zoom 等主流軟體現在都內建了 AI 工具,但這與從頭開始基於聊天機器人界面構建的軟體不同。(其他如 Otter(轉錄)在 ChatGPT 之前就存在,但現在已經嵌入了大型語言模型技術。)

下面我們將看看利用生成式 AI 能力的特定於出版的軟體。

軟體範式

很久以前,軟體是代碼,只有工程師才懂得如何運作。個人電腦成功的原因之一,除了相對低廉的成本外,還有易於使用的軟體。我們不怎麼考慮這些,它們只是包圍著我們。

但請考慮一下 Microsoft Word,我可以安全地假設本書 99% 的讀者都在使用這個程式。教某人如何在 Word 中寫一段文字大約需要 10 分鐘。然後你可以教他們如何創建粗體文字、斜體字以及如何更改基本字體,可能從 Calibri 到 Arial 或 Times Roman。然後,如何保存文件和打印文件。如何搜索和替換。

然後你就讓他們自行摸索。

多年後,你發現他們仍然用空格和標籤來格式化 Word 段落。仍然忘記保存文件,或者混淆了保存的版本,有時不得不從頭開始重寫文本。但他們“知道如何使用 Word”。

Word 有數百個功能,但三分之一的時間用戶只使用 5 個命令:粘貼、保存、複製、撤銷和粗體。正確學習 Word 的高級功能需要幾週的訓練;這些功能可以幫助出版商節省數百小時的時間。但大多數人從未學習過。我從 1985 年開始使用 Word,將近四十年了,從未上過課。我甚至不知道如何充分利用這款軟體的全部功能。

我之所以談這個,是因為這是一個有助於了解為什麼 AI 軟體與你曾經使用過的任何軟體都非常不同的方式。它沒有手冊,甚至沒有快速入門指南。它只有一個空白屏幕和一個問題:“我能幫你做什麼。”

一個對話式 AI 介面上的歡迎消息,對 Thaddeus 說,詢問它能如何幫助。

沒有菜單欄,沒有按鈕,沒有鍵盤快捷鍵。你提出一個問題,開始聊天,你會得到一些答案。

一個對話式 AI 介面,使用者輸入詢問如何解釋新一代對話式 AI 與傳統工具如 Microsoft Word 或 Excel 之間的區別。

Claude 的回答

“使用現代對話式 AI 如我的工作方式與傳統工具如 Microsoft Word 或 Excel 之間有幾個主要區別:

“1. 自然語言互動:使用對話式 AI,你可以使用日常語言來傳達你的意圖,而不需要學習和導航複雜的菜單和功能。你只需對話式地解釋你想要完成的事情。

“2. 上下文理解:AI 助手可以保持上下文並理解對話的流程,使得對話更加自然。傳統軟體在命令之間沒有上下文意識。

“3. 適應性:AI 可以動態適應並回應各種請求,而傳統工具則僅限於預定義的功能集。AI 助手可以在單一界面內幫助進行寫作、分析、數學、編碼、創意等。”

這很有用,但我想要更容易理解的東西。所以我問:

一個對話式 AI 介面上的使用者查詢,要求對非技術背景的觀眾進行簡單解釋。

Claude

“這是一個簡單的方法來向沒有技術背景的人解釋區別:

“把傳統軟體如 Microsoft Word 或 Excel 想像成一個工具,比如錘子或計算器。它有一套固定的功能,你需要學習如何正確使用它才能得到你想要的結果。

“另一方面,想像現代的對話式人工智慧像是一個聰明的助手,就像一個知識豐富的同事或朋友。你可以用簡單的英文與它交談,它能理解你的意圖。它可以幫助你完成各種任務,從寫作到數學到提出想法。

“你不需要學習任何特殊命令或技巧——只要自然地與它聊天。它會適應你的需求並記住對話的上下文。隨著時間的推移,它會了解你和你的喜好。

“所以,傳統的軟體像是一個靜態工具,而對話式人工智慧更像是一個智慧夥伴,你可以自然地與它互動以完成任務。這是一種更靈活、個性化和高效的工作方式。”

嗯,不太是我想要的。所以我繼續了對話:

一個對話式人工智慧的回應,建議避免使用技術術語和非技術人員可能不理解的參考資料。

Claude:

“當然,讓我試著不用技術術語來解釋:

“想像你在跟一個非常博學且熱心幫助你的朋友交談。你可以用簡單的英文告訴他你想做什麼,無論是寫論文、解數學題,還是為專案腦力激盪。

“你不需要學習和記住一堆特定的步驟或命令,只需用自己的話解釋你的需求。你的朋友會理解上下文,並根據你已經討論的內容調整幫助方式。

“這是一個來回的對話,你可以問問題、澄清事情並獲得建議。而且你和這個朋友交談越多,他就越能理解你的獨特需求和溝通風格。

“現在,想像你能夠與電腦程式進行同樣類型的有幫助和簡單的互動。這就是你可能聽說的新型軟體的基本概念。

“與舊式軟體不同,你需要學習和使用一套僵化的功能,新軟體更像是一個知識豐富的朋友。你可以以對話的方式與它交談,它會根據自然的對話流程來幫助你。

“所以,這是一種更智能、更個性化且更簡單的方式來在電腦上完成各種任務,只需像對人一樣與它交談。這是與舊式軟體的關鍵區別。”

總結:我試圖通過這些例子實現兩個目標。第一,是提供一個非常簡單的實例,說明聊天機器人軟體與我們以往使用的任何軟體有何不同。第二,是展示單次對話如何演變。這不僅僅是單個問題和單個答案。這是一個對話。這是突破的一大部分。

聊天人工智慧是一種實習生和知識豐富顧問的結合。你不能假設它們知道你的意思。你需要解釋你想要什麼,為什麼想要,以及它們如何能夠最有幫助。

三種類型的人工智慧軟體

An icon of a key

總的來說,當今有三種類型的人工智慧軟體。第一類是人工智慧基礎平台,如 ChatGPT,核心人工智慧技術。第二類是,讓我們稱之為人工智慧附加軟體,這些軟體是在核心平台之上新建的。你可能沒聽說過很多這樣的工具,如 Jasper 或 Rewind。

我的第三類是將人工智慧工具嵌入現有產品的軟體。例如,Microsoft 套件在 Word、Excel 和 PowerPoint 中新增了人工智慧工具。Adobe 在 Photoshop 和 Acrobat 中加入了人工智慧技術。Grammarly 正在圍繞新一代基於大型語言模型的技術進行重建。大多數情況下,產品本身沒有變,只是加了人工智慧。

很明顯,你今天使用的幾乎所有軟體很快都會加入人工智慧功能。你需要自己評估這些工具是否真的有用,還是只是人工智慧的表面點綴。

我更感興趣的是那些從零開始構建的工具,這些工具提供只有人工智慧才能帶來的價值。這是下一代的軟體。

使用人工智慧軟體

我是一個 Windows 用戶,不幸的是(這是一個很長的故事),所以我討論的是我在 Windows 電腦上訪問人工智慧軟體的經驗,而不是 Mac。由於這裡的所有軟體都是基於瀏覽器的,在 Mac 上使用這些工具應該沒有區別。但我不保證。

你需要一些錢來玩人工智慧遊戲,但不需要很多。如上所述,許多基礎軟體可以通過免費版本訪問。但你通常會想要付費訂閱來測試它,而訂閱費應該約為每月 20 美元。試用後取消(別忘了!)。如果你看到每月 79 美元,甚至是 159 美元的價格,你可以忽略它們。他們不是把你當作潛在用戶,而是針對大型主流企業用戶。

訓練聊天AI

An icon of a key

今天的人工智慧看似簡單。任何會打字的人都能使用它。但是,要使用得好卻很複雜,這似乎不合邏輯,直到你深入了解「提示」和相關概念的複雜性。

有時候,為了接觸它的智慧,你必須像對待一個傻瓜一樣與它交談。或者,或許像是一個白痴天才。這有點像Dustin Hoffman在《雨人》中飾演的角色

任何人都可以使用ChatGPT。只需訪問chat.openai.com,你就可以免費使用最新版本的GPT-4o(有一些高級功能可用 ,每月額外收費20美元)。

當你訪問ChatGPT時,你會發現基本上是一個空白的屏幕,隱含的問題是「今天我能怎樣幫助你?」

你可以向它提問。更好的是,你可以上傳一個大的PDF文件並向它提問。你還可以上傳圖片,它可以描述圖片,或者一個掃描頁面:它可以識別文本,即使是手寫的。

成功使用聊天AI的關鍵問題之一是學會如何與它「對話」(在最新的移動應用版本中,你甚至可以真的對它說話)。在聊天AI的語言中,這叫做創建「提示」或「提示操作」。用戶發現,他們的提示越精確和詳細,從ChatGPT獲得的回應就越好。此外,提示不僅僅是一次性的。聊天AI可以持續一段時間進行對話(雖然不是無限期),如果你沒有得到你想要的答案,你可以修改和完善你的提示。這需要很多適應,並催生了一系列書面和在線的指南,訓練用戶如何最大限度地利用提示。

試著讓任何聊天AI軟件解釋一個像發展性編輯的概念。然後讓它編寫一個12歲孩子能理解的解釋。結果是截然不同的。有趣的是,聊天AI似乎也會對情感上的訴求作出回應。在提示中加上「這對我的職業生涯非常重要」可以引出更有用的回應。

(這是補充一句的好時機:最頂尖的語言基礎AI科學家無法解釋為什麼會發生這樣的事情,這既令人安心又深感不安。)

如何提示

An icon of a key

「提示」是一種特定的技能,對有效使用聊天AI至關重要。

在AI熱潮中被採用的各種術語中,「提示」和「提示操作」是最好的。你不是真的在「與」聊天AI「對話」。你不應該「問」它問題(或者,你不應該那樣做——那不是它的工作方式)。你是提示這些引擎作出回應,而不是簡單的答案。

起初我認為類比戲劇提示可能會比較恰當。提示員會讓忘詞的演員重新回到角色。但這並不準確,因為AI提示不是釋放記憶中的文本塊——生成式AI不是那樣工作的。給AI引擎一個提示重複多次,答案總是會有些不同。

剛才我讓ChatGPT「列出有效提示的關鍵要素」。我第二次問的時候,答案在主題上是一致的,但具體內容卻大不相同。突出強調的主題包括:

  • 具體化

  • 避免模糊

  • 提供背景

  • 使用清晰的指示

在某種意義上這很奇怪:AI對語言有很好的掌握——難道它不應該有一種不需要繁瑣提示就能理解你的意思的感覺嗎?但正因為它對語言的掌握,才使得提示變得最強大。告訴它你確切的意思,而不是大概的意思。

與它對話,就像你希望它成為一個樂於助人的助手,一個學識淵博的顧問,而不是街上的一個孩子。

這裡的要點是,至少目前為止,有效使用基於大語言模型的AI工具需要至少對提示最佳實踐有基本的了解。對提示的精通將會得到適當的回報。

幻覺:軟肋

An icon of a key

基於大語言模型的AI會虛構東西。它就是會這樣。這通常被稱為「幻覺」。這是一個真正的問題,一個嚴重的問題。如果你要與AI一起工作,你需要理解幻覺。

劍橋詞典 2023 年度詞彙是 “Hallucinate”(幻覺),其定義已擴展為「當人工智慧……產生幻覺時,它會產生虛假信息。」(2023 年詞典的其他新增詞包括 “prompt engineering”(提示工程)、“large language model”(大型語言模型)和 “GenAI”(生成式AI))

劍橋詞典指出,AI 幻覺「有時看起來是無意義的。但它們也可能看起來完全合理——即使在事實上不準確或最終不合邏輯。」這很遺憾,但事實確實如此,截至 2024 年 7 月,這仍然是使用生成式 AI 完成關鍵任務的一個顯著限制。這是 AI 的幾個大奇異現象之一,人們需要一段時間才能理解。記住,生成式 AI 主要是一個下一個詞的預測引擎,而不是一個事實數據庫。因此,需要 HITLs(人在循環中),如我們現在所知,來雙重檢查 AI 的輸出。再者,能夠從一種能夠產生可證明不準確輸出的技術中獲得如此非凡的價值,這真是令人驚奇。事情就是這樣。

Gary Marcus,一位有經驗且資訊豐富的 AI 批評家,將 AI 幻覺比作壞掉的鐘錶,壞掉的鐘錶一天會對兩次。他說:「它有時是對的,但你不知道是哪部分時間對的,這大大減少了其價值。」

Ethan Mollick,Publishers Weekly 2023 年 9 月會議的主講人指出,人們使用 AI 時期望 100% 的準確性。他說,幻覺類似於我們每天容忍的「人類錯誤率」。

Andrej Karpathy,一位專門研究 AI 的著名科學家,目前在 OpenAI 工作,他撰寫了關於幻覺的文章:

「當我被問到 LLM 的『幻覺問題』時,我總是有些困惑。因為從某種意義上說,幻覺是 LLM 所做的一切。它們是夢想機器。

「我們用提示來引導他們的夢想。提示開始了夢想,根據 LLM 對其訓練文件的模糊記憶,大多數情況下,結果會有用。

「只有當夢想進入被認為事實上不正確的領域時,我們才標記它為『幻覺』。它看起來像是一個錯誤,但這只是 LLM 在做它一直在做的事情。」

這不僅僅是編造東西的問題。聊天 AI 是一個有深深缺陷的軟體。

對於許多查詢,尤其是新手的查詢,回應是平淡無奇的、不對題或根本無幫助。聊天 AI 在計數方面也有問題:要求它寫一篇 500 字的博客文章,你很幸運能得到 150 字。

每家 AI 公司,為了減少偏見並避免回答「如何製造炸彈」之類的查詢,都在其產品周圍設置了嚴格的回應護欄:很多時候,對問題的回應基本上是「不,我不會回答這個問題。」我請 Google Gemini 審查這篇文章的草稿,並被警告「發布前獲得作者的批准是至關重要的。」

事實核查

An icon of a key

我主張,儘管大多數人不聽,幻覺是一個技術問題,會找到技術解決方案。是的,它們是 LLM 的特有問題,但可以被規避。

考慮這一點:我請四個聊天 AI 來核查以下聲明的事實:

  • 截至 2024 年,有 6 家總部位於紐約市的大型跨國出版商。它們被稱為 Big 6。

  • 電子書繼續主導美國的圖書銷售。

  • Borders 和 Barnes & Noble 是美國兩大連鎖書店。

  • 在 Covid 期間銷售下降後,美國圖書銷售再次以兩位數增長。

它們都發現了前三個聲明中的錯誤。每個都對第四個聲明有些困惑,不確定 Covid 銷售激增的程度及隨後的銷售模式。這是一個小而不具代表性的實驗,但這些聊天 AI,儘管不應該是基於事實的,能夠在評估事實方面做出一般觀察者會忽視的可信工作。

關於圖像和視頻呢?

An icon of a key

因為貿易圖書出版更多依賴於文本而非圖像,出版商往往忽略了基於 AI 的圖像和視頻工具的突破性。

它們對理解 AI 革命的任何人都具有相關性。但討論太大,無法在這裡展開:我無法公正地處理這個話題。

推薦給作家和出版商:試玩 ChatGPT 中的圖像生成功能——它們是免費且有趣的。然後在「視頻和 AI」下搜索,驚嘆於你會在鏈接的網站中找到的一些示例。雖然該工具尚未公開提供,但 OpenAI 的 Sora 提供了一些僅從文本提示生成視頻的驚人示例。

書籍出版商的軟體

目前很少有專門為書籍出版商量身打造的從零開始的人工智慧軟體(儘管有很多針對作者的軟體)。

學術出版商有更多選擇,擁有各種用於研究、寫作和出版的人工智慧工具。

對於商業出版商來說,大多數選擇與人工智慧和音頻相關。在音頻之外,選擇主要集中在編輯和行銷工具上。還有一些人工智慧內容檢測工具,以及內容授權工具和服務。

編輯軟體主要針對作者,而不是專業編輯——作者比編輯多得多,專業編輯對質量的要求遠比(大多數自出版的)作者高得多。

行銷工具同樣不僅針對書籍出版商,而是針對所有行銷人員,提供網站內容、文案生成和SEO的工具。Jasper.ai 是該類別的領導者,並聲稱 HarperCollins 是其客戶。

Shimmr 是本書的贊助商,是一個專門為書籍出版商設計的人工智慧廣告創作工具。該公司及其創辦人 Nadim Sadek 在 2024 年 5 月的Publishers Weekly 文章中有所介紹。

“我們所做的是使用人工智慧考慮書籍的心理檔案,並將其與特定受眾的心態匹配,確保讀者與書籍之間建立更有效的連接,”Sadek 告訴 PW。 “我們稱之為‘書籍DNA’,這不僅涉及了解書籍的角色和情節,還包括書籍的價值觀、興趣和情感。”

利用書籍DNA,Shimmr 的人工智慧工具然後創建針對搜索和社交媒體渠道(目前是 Google 和 Meta)的精準廣告。這些廣告以展示廣告的形式出現,包含人工智慧生成的圖像和標語。

我向評估 Shimmr 的出版商指出,它可以提供增量收入,這是我們期望新廣告/行銷工具帶來的效果。

如果你想體驗另一個“僅由人工智慧”軟體工具,請查看 Hypnovels,它會動畫化小說書中的章節。“敘述、圖像和動作,全部由人工智慧生成,與偉大的故事講述結合在一起,以比傳統動畫(因此稱為‘hypno’)更少具象的方式,比有聲書更具感官吸引力,使章節獨特且引人入勝。”

另一個因人工智慧機會而誕生的新供應商是 Veristage(也是本書的贊助商)。Veristage 提供 Insight,其“人工智慧出版助手”,是一個跨多個出版功能的特定任務前端。

Insight 的旅程從手稿開始。上傳早期版本後可以解鎖一系列工具,有些對編輯價值更高,有些對行銷價值更高。使用完所有功能後,你可以下載一份 PDF 報告,其中包括編輯方面的內容,如寫作語氣、陳詞濫調和副詞及形容詞的使用,然後是行銷內容,如描述、元數據、獨特的賣點、同類書籍、亞馬遜優化內容和建議的社交媒體帖子。

我最喜歡 Insight 的地方在於它採用整體方法將人工智慧應用於出版過程,而不是需要收集多個針對不同功能的軟體工具。

我還想在此強調我的出版平台 Leanpub。他們的合作真的很棒。小即是美:他們會嘗試大公司避之不及的技術和服務。對作者和小型出版商來說,他們的新 TranslateWord 服務 尤其有趣,這個服務可以通過 GPT-4o API(此技術支持 ChatGPT)將用 Microsoft Word 撰寫的書籍翻譯成多達 31 種語言。這就是我用來翻譯這本書的工具。

我嘗試在其他地方尋找書籍翻譯服務。有很多翻譯公司,有些使用人工智慧。唯一能找到提供書籍翻譯服務的是 DeepL。但這不是該公司的重點。目前 Leanpub 是最佳選擇。

書籍出版的商業軟體

An icon of a key

目前服務於出版行業的現有商業系統供應商開始將人工智慧技術融入其中,正如我們在企業級公司(如 SalesforceOracle)中所看到的。

我與幾家出版系統軟體供應商,包括 Firebrand 交談過,他們都在關注這些機會,但非常謹慎。

我期待在 2024 年 9 月於田納西州納什維爾舉行的 Firebrand 出版創新論壇 上與來自各行各業的與會者討論人工智慧的機會。

knk 已經舉辦了兩場關於人工智慧的網絡研討會,並發布了一份白皮書,但截至2024年6月26日,尚未在其產品中宣布任何人工智慧功能。

Virtusales 最近推出了其首套人工智慧工具,包括圖像標記、替代文字生成、編輯工具、市場和銷售文案生成,以及文案翻譯。

我在Klopotek 出版電台與Klopotek 進行了交談。他們已經「開始在客戶服務領域開展人工智慧計劃,」但沒有提供具體細節。

提供「網頁設計、電子商務和數據解決方案」的Supadu,現在推出了「Supadu Smart AI」,(pdf),具備「由虛擬人主導的標題視頻評論與智能購買」、「為市場和銷售團隊提供的虛擬人視頻驅動的宣傳材料」,以及「作者和標題視頻的多語言翻譯功能」。

給書籍出版商的人工智慧軟體:初創公司

有些人對我在書籍出版技術初創公司方面的工作有所了解。在Publishers Weekly的一篇報告中描述了這項工作,並鏈接到數據庫。

正如您在報告中看到的,我廣泛地關注書籍出版領域的初創公司。我不包括新的書籍出版公司,除非他們在技術上有一些不尋常的創新。基本標準是:您是否使用技術來試圖振興某些書籍出版過程?我的數據庫中有超過1600家公司,大多數是在亞馬遜於2007年推出第一款Kindle後成立的。

在對數據庫有一個整體感覺之後,您可以開始更深入地挖掘。在最右邊的標籤上,您會看到一種僅按與人工智慧相關的出版初創公司進行排序的方法。

一個顯示工具和服務列表的表格截圖,選擇了人工智慧篩選器,突出顯示了243個計數。

如圖所示,截至2024年7月初,有超過240個與人工智慧相關的出版初創公司。我們將使用人工智慧的音頻出版初創公司單獨分類,兩者總數超過300家公司。大多數,超過280家,是在2022年11月ChatGPT首次出現後成立的。這種新業務初創公司的數量在書籍出版領域是前所未有的。這令人驚嘆。

正如整個數據庫的特點,這些人工智慧初創公司主要針對作者(70%)。大約13%專門服務於出版公司。10%專注於兒童出版。

大約有50家初創公司針對讀者,提供一系列創新的產品。有幾個是故事平台。有不少是摘要工具。有多個發現網站,「使用人工智慧找到您的新最愛書籍。」快速改進的AI生成語音導致了一系列「讀給我聽」的工具。

還有一些沒有人工智慧就不可能實現的有趣想法。

Bookshelf: Reading Tracker 是一個結合書籍發現和個人圖書館應用程式,包含「自動時間追蹤、閱讀目標和提醒,以及有洞察力的統計和趨勢。」其人工智慧圖書館員「可以生成摘要和抽認卡,討論關鍵想法和要點,還有更多功能。」

我的朋友Ron Martinez 最近推出了一個名為Inventionarts.ai的網站,介紹了「一種新的對話媒介。」網站解釋道,「與多個具有自己身份、專業知識和意識的人工智慧人格對話。邀請不同的角色加入您的場景。您也可以扮演虛構角色!」某種程度上的文學遊戲。

正如較大初創公司群體的特點,這些初創公司大多數規模微小,有些甚至只有一個人和一個半成品的想法。我全部包括在內——誰知道它們將走向何方。

我強烈建議您使用這個數據庫。點擊幾個鏈接。我想您會被許多這些組織的創新和膽識所逗樂。

這本書的贊助商之一,Book Advisors,專門從事出版業的合併與收購。我經常建議創新的初創企業尋找合作夥伴,而Book Advisors就是我推薦他們去討論過程的地方。出版業有幾家備受尊敬的M&A公司可以依賴,包括The Fisher Company和Oaklins DeSilva+Phillips。Book Advisors是我知道的唯一一家也與科技初創企業合作的公司。

AI 與出版業:目前業界在做什麼?

An icon of a key

許多著名出版貿易組織的AI相關活動似乎都在為版權問題發聲。美國出版商協會「在美國版權局對版權法與人工智慧(AI)交叉領域的調查中提交了回覆意見...」

英國出版商協會指出「政府必須儘快制定具體的解決方案,以保護支撐安全可靠AI的人類創造力和知識。」

另一方面,擁有超過600名成員的獨立出版商協會(IPG)為其成員提供AI指導和培訓,包括由著名AI與出版專家 George Walkley主持的「AI在出版中的實用指南」。

在美國,我很榮幸成為書業研究小組(BISG)的AI工作組的一員,該工作組向工作流程委員會報告。工作組概述了幾個潛在的戰略舉措:

  • 最佳實踐和標準開發:推薦與AI使用相關的最佳實踐,結合倫理準則、現有法規和法律。這包括對AI生成內容的透明度及其向消費者的披露。

  • 行業調查和定義:進行調查以收集廣泛的行業見解,了解目前和潛在的AI用途,並在出版業背景下建立明確的AI定義和範圍。

  • 定期報告和審查:提供定期報告,幫助行業預見和適應AI技術帶來的快速變化。

其他寫作和出版協會也在努力迎頭趕上這個話題。有些反對AI,有些則只是試圖幫助其成員了解這項技術,甚至可能嘗試使用它。

AI 與出版業:出版公司在做什麼?

一年前,詢問出版公司目前在做什麼,得到的回答是「不多」。自那時起變化不大,但還是有一些活動。我將重點放在貿易書籍出版商上;學術和學術出版商更活躍。以下是我發現的一些情況。

Hachette:根據英國《The Bookseller》2023年11月的報告,Hachette發表了一份關於AI的立場聲明,區分了「操作性」用途和「創意性」用途。該公司「明確表示鼓勵對操作性用途進行『負責任的試驗』,但反對『機器創意...以保護由人類創作的原創內容』。」

HarperCollins:根據2023年4月《Publishers Weekly》Andrew Albanese和Ed Nawotka的報導,HarperCollins首席執行官Brian Murray表示:

「我們知道這很重要,未來三到五年將對我們的行業產生重大影響。所以我認為我們很多人都在努力弄清楚如何以道德和道德的方式運用它,這有助於我們為作者提供專業服務,而不與作者和故事競爭。

「我認為這是一個挑戰。或許對於所有在這裡的出版商來說不是那麼多,但我保證,世界各地有很多小型技術團隊可能正在瞄準我們的業務。他們不是出版商,不是編輯。他們是技術專家,看到了機會。」

Penguin Random House (PRH): Bertelsmann, the parent company of PRH, offers a white paper called State of Play: Exploring Generative AI’s Transformative Effects on the Media & Entertainment Industry, which includes a section on book publishing.

此外,根據Publishers Lunch 的報導,該公司“推出了其內部的人工智慧應用,名為 PRH ChatGPT。“

文章指出,PRH 的內部文件解釋說,該程式“‘可以用來簡化流程、增強創意,並在各部門提供數據洞察。公司建議該應用程式的用途包括摘要書籍和文件;修改電子郵件;撰寫博客文章或職位描述;分析文本數據,並‘生成內容創意。’“

Simon & Schuster: 公司 CEO Jonathan Karp 在Publishers Weekly 2024 年 5 月的美國書展上所說的一段話被《紐約時報》列為“過去 25 年最難忘的文學時刻“之一。他說,人工智慧不是“房間裡的大象“,而是“更像是世界上的蟬。你知道,很多嗡嗡聲和很多交配。“

他承認人工智慧“肯定是一個有價值的工具。它肯定會讓我們更高效。它將幫助我們更好地處理和收集信息,並希望讓員工能夠從事更有趣和創造性的高層次工作。“

在三月的倫敦書展上,根據The Bookseller 的報導,Karp 表示,公司還將考慮在“由於音頻製作成本高昂而使該作者作品不可能有機會的地區“推出人工智慧生成的有聲書外語版本。

人工智慧與圖書出版:使用案例

An icon of a key

人工智慧與圖書出版在不同功能中的具體使用案例概念上很容易描述。但關於出版社實際在做什麼的信息不多。

Ulysses Press 和 Perfect Bound 的 CEO Keith Riegert 在 2024 年 5 月的 Publishers Weekly 美國書展上提供了我所見過的最全面的關於出版公司內部人工智慧使用案例的概述。Perfect Bound 是此報告的贊助商;我對這個聲明負責。他提供了“20 種作為出版專業人士,您現在就能開始使用人工智慧的實用方法。“

他的演講Getting Started with AI 可以在 Perfect Bound 網站上觀看和下載

當人工智慧閱讀一本書會發生什麼?

我有意借用了這個標題 從 Ethan Mollick 的新聞郵件 —— 沒有必要嘗試改進它。Mollick 是賓夕法尼亞大學沃頓商學院的教授,研究創業與創新。他的新聞郵件,我經常推薦,是冷靜、清新且獨特的見解。

使 Mollick 有資格作為評論員的原因之一是他在這個領域沒有利益衝突。他不需要推銷人工智慧,也不需要詆毀它。他只是承諾探索人工智慧在各方面的影響,主要是對教育、文化、寫作和出版的影響。而且他是一個清晰、優秀的作家。

如果您瀏覽 Mollick 的新聞郵件存檔,會發現他直到 2022 年 12 月才開始關注人工智慧。這不是他的專業領域——像我們大多數人一樣,人工智慧突然闖入他的日常工作,他無法將目光移開。

在這篇文章中,他的見解與我們作為出版專業人士的興趣最接近。“人工智慧是否,“他問,“會改變我們與書籍互動的方式?”

Mollick 指出,“我們需要一個記憶足夠大的人工智慧來容納一本書,還需要一個對自己的書有足夠了解的作者來評判人工智慧的結果。” Mollick 測試了他的一些書籍(他沒有具體說明哪一本,但從對話中明顯看出是 The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors,這本書在 Amazon 上受到了好評,雖然不是當前的暢銷書)。

莫里克考慮了人工智慧對作者、出版商或讀者的潛在價值的不同方面,包括「人工智慧作為讀者和編輯」,以及「實際應用:幫助指導老師」。他要求一個大型語言模型(不是ChatGPT)總結這本書。總結結果讓莫里克感到滿意。

接著是一個更嚴峻的挑戰:「給我一些書中的隱喻例子。」他指出,隱喻「即使對於人類讀者來說也是一個挑戰,因為它涉及到在沒有明確標記的情況下(不像明喻那樣有“像“或“as“)找到比喻性的語言使用。」他記錄的結果「令人印象深刻,雖然有些小錯誤。」

作為編輯,大型語言模型的表現不如人意:莫里克指出,這反映了「目前人工智慧的現狀:如果你是一個非常優秀的作家或編輯,你比目前的人工智慧更好……」

儘管如此,「人工智慧具備或至少表現出具備理解文本上下文和意義的能力。」因此,莫里克認為「由於人工智慧,我們與書籍的關係可能會改變。」

我也這麼認為。

人工智慧與書籍設計和製作

An icon of a key

在書籍設計和製作方面,專家系統和流程自動化仍然領先於人工智慧。

自動排版書籍的軟體至少可以追溯到1970年代。1980年代中期,我監督了一個名為PageOne的軟體專案,基於Donald Knuth的TeX,可以在幾分鐘內排版一本書。SGML出現了,它基於1969年引入的文檔標準。它主要由1996年引入的XML取代了。這些強大的標記語言為自動化創建了堅實的結構。

桌面出版引入了另一輪的自動化,例如QuarkXPress和Adobe InDesign,以及Adobe Illustrator和Adobe Photoshop。出版工作流程可以通過各種程式和系統進行管理。

值得關注的一個組織是Coko Foundation。他們提供一套開源的生產和出版管理工具,包括Kotahi,一個學術出版平台,和Ketty的書籍製作工具,其中包括一個人工智慧助手Kotahi AI PDF Designer「將PDF設計轉變為一個簡單的互動過程。」

有一些早期嘗試將人工智慧引入InDesign工作流程。2024年4月,Adobe宣佈了一個文字轉圖片功能。第三方可能在這方面領先於Adobe:印度的創新預印和生產供應商,如Hurix DigitalIntegra,在利用人工智慧進行生產方面表現出了更多的主動性。

人工智慧與書籍行銷

An icon of a key

短期內,人工智慧對書籍行銷的影響將是淺顯的,但從長期來看將更加深遠。很多取決於你認為「書籍行銷」是什麼;它正在改變。

「垂手可得的果實」是顯而易見的。請求Chat AI幫助撰寫產品描述或新聞稿。請它推薦一些關鍵詞。這些它都能輕鬆完成。但大多數出版專業人士也能做到這些,只是稍微費些功夫。

上面提到的Keith Riegert的使用案例,包括為頭腦風暴標題提供建議、起草數位行銷報告和在Google表格中創建數位行銷活動追蹤器。

上面描述的Shimmr軟體,暗示了未來自動化行銷的形態。

人工智慧與中繼資料

An icon of a key

人工智慧與中繼資料有何關聯,反之亦然?目前它的角色似乎有限;預計會有一些重大變化。

中繼資料是書籍可發現性的核心。你已經聽過無數次這個提醒,以至於聽得頭昏眼花。主要讓人反感的是「中繼資料」這個詞對大多數非技術人員來說仍然難以理解。如果你說,「這只是關於書籍的基本信息,標題、描述、價格、主題類別之類的東西」,人們會鬆一口氣。他們對此感到舒服。但也僅此而已。

我很遺憾地提醒您,元數據其實遠不止是關於書本的一些細節。有很多內容,遠超出這本小書所能涵蓋。我與人合著了一本專門探討這個主題的書。Ingram 出版了Metadata Essentials,這是一本很好的短篇書籍。我在這裡說,並且不會是最後一次:作者和出版商忽視他們的元數據是自冒風險。

AI 可以幫助生成元數據。例如,自出版商 PublishDrive 提供了一個“AI 驅動的書籍元數據生成器”,該生成器為書名、簡介、亞馬遜分類、BISAC分類和關鍵詞提供 AI 建議。

Veristage 的 Insight可以生成描述、關鍵詞、BISAC 分類,並定義目標受眾。

聲明在元數據中使用 AI

An icon of a key

您可能認為元數據這個莊嚴的世界會慢慢地接受 AI。事實並非如此!去年十一月,ONIX 標準的管理者 EDItEUR 發布了一個簡短的應用說明,名為“ONIX 中 AI 的各個方面”。 (pdf)

該組織的主任 Graham Bell 以他一貫深入的智慧指出,“對於(圍繞這項技術的爭議)的其中一種反應是發誓不使用 AI 或避免交易 AI 創造的產品。一個更現實的選擇是,在使用 AI 時,對交易夥伴和讀者保持透明。而且,由於一些零售商限制或禁止 AI 內容在他們的平台上,重要的是,聲譽良好的出版商要強調那些使用生成 AI 技術創建內容的產品。”

Bell 繼續概述出版商可以在元數據中指定的方法:

  • AI 貢獻者

  • 有 AI 基礎的有聲書聲音

…以及在數字產品的元數據中指明出版商明確選擇不使用除了研究以外的文字和數據挖掘(TDM)的方法。還有一種方法可以指定單獨的許可證涵蓋商業或非研究的 TDM。

正如通常情況,ONIX 中規定的內容可能不會在整個供應鏈中被揭示,但至少已經做出了最大的努力。

將 AI 整合到出版運營中的策略

An icon of a key

出版公司最不擅長做的事情之一就是將複雜的數字技術整合到日常運營中。這是可以理解的。AI,特別是,讓每個人都感到焦慮,不僅僅是在出版界。它是新的,它是神秘的,它是個性化的,它是強大的。人們因為各種原因受到 AI 的威脅。改變態度需要時間。

但現在不是對技術膽怯的好時機。

不論您的組織規模有多大,都有冷靜和理性的方式將 AI 整合到您的出版運營中。

推動力必須來自上層。最高層。高層管理人員需要接受 AI 可能帶來的變革性影響的願景,並向全組織員工傳達一個計劃。該計劃可能僅僅是“實驗,記錄您的實驗,並分享。”這是一個好的開始。

經濟學人 最近參考了一種新技術採用的組織策略,稱為“燈塔方法”。您可以通過選擇一個能迅速實施的高知名度概念驗證來創建一個燈塔,這樣每個人都能理解。

出版公司因版權問題而受到困擾:作者們怒不可遏。2023 年 5 月的作家協會調查發現,“90% 的作家認為,如果他們的作品被用來訓練生成 AI 技術,作者應該得到補償,”67% 的人表示“他們不確定其出版合同或平台服務條款是否包含使用其作品進行任何 AI 相關目的的許可或權利授予。”這些不確定的作者現在正在問他們的出版商是否在編輯或製作他們的作品時使用了 AI,一些有影響力的作者堅持不使用。他們在尋找 AI 等同於無花生麵包店的東西。

這是出版商面臨的一個棘手問題——如果您不能在計劃出版的書籍上使用 AI,那麼您能用它做什麼?

制定和傳達 AI 政策

儘管 AI 被廣泛使用,但很少有出版商公開定義其 AI 政策,並向公眾傳達其 AI 的使用方法。當考慮到貿易、學術和教育出版商面對的不同公眾時,“公眾”這個詞的意義變得模糊。

對於貿易出版商來說,最重要的受眾是作者及其代理人。學術出版商面對不同的障礙,當他們考慮人工智慧對研究的有前景的影響時,然後是人工智慧對將研究轉化為敘述的更具問題的影響(Avi Staiman 在這個話題上寫了一篇深思熟慮的文章)。對於教育出版商來說,制定政策是棘手的,因為人工智慧對教學實踐、教育的侵入是多方面且複雜的。

我認為,隨著出版商向前推進人工智慧技術,他們面臨兩大挑戰。第一是制定一個公司立場,關於如何普遍地接觸人工智慧,如何將人工智慧納入他們的工作流程。第二個挑戰是明確且毫不含糊地向他們的成員傳達這一立場。

我所看到的出版商政策大多存在缺陷。其中一些事實上是針對作者的外部政策,包含各種關於什麼是可接受的做法(不多)和什麼是不可接受的(很多)的警告。O’Reilly 的「為 O’Reilly 開發內容的人才的人工智慧使用政策」長篇累牘,包含很多深奧的指導,例如「不要使用任何會使軟體輸出受制於 copyleft 或網絡病毒開源許可條款的 OSS GenAI 模型。」

另一方面,學術出版商 Elsevier 在其網站的「Elsevier 政策」部分,包含了「負責任的人工智慧原則」、「文本和數據挖掘」以及「在 Elsevier 寫作中使用生成性人工智慧和人工智慧輔助技術」的聲明。

我所見過的少數內部、未發表的出版商政策過於保守,反應過快,對於一系列感知和可能的威脅,以及作者的焦慮反應過快,束縛了他們自身與這一快速發展、快速變化的技術進行深入互動的能力。

可以肯定的是,他們會「負責任地」使用人工智慧,無論這意味著什麼。可以肯定的是,他們對作者的知識產權和積極保護作者的版權作品充滿了極大的關注。(當然,這些寬泛的原則必須公開聲明,並經常重申。)

但除此之外呢?

  • 他們是否會允許人工智慧在編輯採購中發揮作用?人工智慧能否查看潛在的稿件?

  • 他們是否會允許人工智慧在發展性編輯、行編輯和校對中發揮作用?

  • 他們是否會允許人工智慧在確定印刷次數和配置中發揮作用?

  • 在創建無障礙電子書文件中,包括替代文本?

  • 在創建有聲書時,當聘請有才華的人類敘述者在經濟上不切實際時?

  • 在進行外語翻譯到從未出售權利的市場中?

  • 在大規模開發行銷材料中?

  • 在與經銷商溝通中?

如果是,他們必須明確指出這一點,並清楚解釋這些政策背後的思考。出版商必須勇敢地反駁目前在恐懼和懷疑時期大多數作者的許多反對意見。

工作考量

An icon of a key

只有最大型的出版商才能雇用專門的員工來處理人工智慧軟體和系統。普通的出版商將希望讓所有員工接觸到人工智慧工具,期望每個人都能探索使用人工智慧來提高工作效率。

在2024年2月於亞利桑那州舉行的 PubWest 會議上,一位來自出版業外部的演講者建議人工智慧的一個用途將是取代實習生。現場爆發激烈反應。她本意是好的——確實,2024年4月10日 紐約時報 報告描述了華爾街投資銀行正尋求用人工智慧取代許多實習生。與出版業的情況類似,顯而易見的問題是:如果無法從初級分析師開始,如何找到高級分析師?

出版業一直依賴實習。2019年的一項研究發現,在出版業工作不滿十五年的人中,有80%曾經實習過。

部分原因是以合理的成本解決瑣碎工作。但這與更大的現實相比相形見絀,即沒有任何出版學校能夠使人們在加入出版公司時達到中層管理者的水平。唯一能夠培養明日熟練員工的方法是今天訓練實習生和學徒。

目標不是尋求以人工智慧取代實習生,而是使用人工智慧工具使他們的工作更加高效和有意義,造福於實習生和出版公司。

有聲書的人工智慧

An icon of a key

有聲書的人工智慧運作得很好。雖然不完美,但確實有效。作者和出版商現在常常在有聲書製作中使用人工智慧工具,主要針對那些全方位敘述者專注的有聲書製作在財務上不可行的書籍。而且不僅限於英語有聲書,還包括翻譯的有聲書。

使用人工智慧製作有聲書並不是新鮮事;我在2021年首次在出版者週刊報導了這個趨勢。但新的大型語言模型重新激活了自動化有聲書敘述技術。

回到2021年,我注意到「它完美嗎?當然不是。它能夠足夠好嗎?可能,如果出版商願意在項目的語音編輯階段投入必要的時間。」兩年半後,根據許多人的說法,AI 聲音和人聲幾乎無法區分,除非你非常仔細地聆聽。

去年十一月,Meta(Facebook)推出了「Seamless,」這項技術能夠將語氣、情感表達和聲音風格特質轉移到200種語言的翻譯中。一本有聲書可以立即以非凡的質量翻譯成多種語言。

同樣在2021年,我報導「Audible 對非人類敘述者有聲書的分發封鎖是一個真正的問題,可能需要一些時間來解決。」與此同時,Google 和 Apple 都宣布了允許作者使用 AI 生成的聲音創作有聲書的計劃。12月5日,Spotify 的 Findaway Voices 開始接受來自 Google Play Books 的「數字聲音敘述有聲書,並分發給選定的零售夥伴。」

2023年11月初,Amazon 宣布 Kindle Direct Publishing (KDP) 作者很快將能夠使用合成語音技術「快速且輕鬆地製作電子書的有聲書版本。」2024年1月,Jane Friedman 報導(付費牆)「Audible 在去年秋天悄悄地開始允許 AI 敘述的有聲書進入其店面,這比其他零售商晚了很久。」

當然,我也在使用人工智慧為本書製作有聲書版本。

書籍翻譯的人工智慧

An icon of a key

書籍翻譯的人工智慧有效。或許不像自動化有聲書創建那麼有效。但它正在非常快速地接近理想狀態。非文學小說可能會是第一步。文學小說可能會緊隨其後。非小說類書籍則面臨不同的挑戰。

2024年6月,我主持了一場由 BISG 贊助的書籍翻譯人工智慧網絡研討會。視頻在線 YouTube 上。Jane Friedman 也在她的 Hot Sheet 通訊中描述了這個計劃。

這個話題既複雜又微妙。我覺得一個有趣的現象是,人們一直在努力自動化翻譯。這提醒我們,書籍雖然充滿我們的宇宙,但在這個線上時代,它們只是書面交流的一小部分。

被譽為機器翻譯之父的 Warren Weaver 曾對一位同事說:「當我看一篇俄文文章時,我會說:‘這其實是用英文寫的,但它被編碼成了某些奇怪的符號。我現在要進行解碼。’」對機器來說,語言只是代碼。它不是文化、情感或書面語言的宏偉。它是一個包含數字和代碼的任務。

顯然,小說和非小說的分界線在人工智慧翻譯中將非常重要。聊天 AI 在風格上很強,但在事實上卻有所欠缺。這還是早期階段,但我傾向於認為聊天 AI 在小說方面會表現出色,但在非小說方面會有所不足。(儘管如此,我仍然在機器翻譯這本充滿事實的書!)

文學小說是房間裡的大象。它是珍貴且受人尊敬的,理應如此。譯者們可以花數小時爭論一個單詞或短語。聊天 AI 必須在這些領域謹慎行事。

但這是一片肥沃的土地。據我所知(根據稀少的數據),2023年只有9,500本貿易書籍被翻譯。即使我錯誤很大,顯然從外國語言翻譯成英文的書籍很少。

同樣,我發現一個統計數據顯示,2023年只有7,230本書從英文翻譯成西班牙文(在西班牙書市)。這看起來少得可笑。

這裡有巨大的機會。

大多數使用人工智慧進行書籍翻譯的用途將針對那些從未考慮經濟上可行的書籍。對於“中端市場”書籍的翻譯者來說,這必然會對工作產生影響;工作增長將體現在項目管理和質量保證方面。這能抵消工作損失嗎?不太可能。

如同人工智慧的大多數方面一樣,這裡有許多挑戰需要解決,並且沒有簡單的答案。

正如我在軟體部分提到的,Leanpub 和 DeepL 是兩家為作者和出版商提供人工智慧輔助書籍翻譯服務的公司。

學術出版中的人工智慧

An icon of a key

各類商業出版商和作者都應密切關注人工智慧在學術出版界的發展。它的進展速度遠比消費者出版領域要快得多。

我看到這一進展的兩個原因。首先,學術出版的作者本身就是學者,在 STM 領域(科學、技術和醫學),他們往往是具有高等學位的科學家。除了出版之外,他們在工作中也在研究並經常接受人工智慧技術。他們會對出版商不探索人工智慧在編輯和出版工作中的應用感到驚訝。

這種情況延續到學術出版生態系統中,編輯往往也是學者。對他們來說,技術並不可怕。

我不打算在本書中深入探討這些細節;我會在我的博客中更深入地報告。

對作者的人工智慧

作者和出版商經常認為自己生活在兩個孤立的世界中,彼此聯繫但基本上分開。在現代出版中,這在很大程度上是真實的。

時代在變化。曾經不可觸及的出版商,如今頂尖的作者掌握了主導權。如我在其他地方討論過,自出版作者是先鋒。他們沒有傳統出版所累贅。

當出版商看待人工智慧時,他們看到的機會很少。當我與作者談論人工智慧時,世界是他們的牡蠣。可能性幾乎是無限的:

創作和編輯

  • 嘗試寫作和出版整本書

  • 為新項目構思

  • 在新書中構思

  • 精細調整故事

  • 研究

  • 事實查證

  • 寫作伴侶

  • 發展性編輯

  • 文案編輯

  • 拼寫檢查和語法檢查

  • 校對

插圖/影像

  • 創作插圖和圖表

  • 封面設計草稿

  • 視頻宣傳

行銷

  • 自動提交給代理商、出版商、比賽、朋友、推薦請求

  • 生成行銷材料:新聞稿、博客文章、社交媒體等

  • 網站生成

作者將推動行業採用人工智慧的變革,不論是支持還是反對。

他們是圍繞人工智慧在創作和出版中創新的大部分初創企業的受益者——大約70%的初創企業希望與作者一起在他們的旅程中合作。

人工智慧的擔憂和風險

An icon of a key

圍繞人工智慧的擔憂是嚴重的。風險是真實存在的。有時這些擔憂表達得非常激進,但當你深入探討時,人工智慧的影響有潛力造成巨大的破壞。

關於人工智慧的問題和擔憂有很多,足以填滿數卷書。我監控的主題詞雲如下。我肯定還漏掉了一些。

圍繞“人工智慧”這個詞的詞雲,相關詞彙如“擔憂”、“倫理”和“人性”等環繞在其周圍。

關於這些主題有很多可用的信息,我鼓勵你儘可能深入閱讀。你可能會得出風險大於收益的結論,並且你不想在個人或組織中使用人工智慧。這種決定有其自身的風險;通常是被落在後面。但這是一個個人的選擇。

如果你在谷歌上搜索“關於人工智慧風險的書籍”,你會找到一系列值得閱讀的書籍。我最近發現的一個特別令人不安的播客是Ezra Klein 與 Dario Amodei 的對話,Anthropic 的聯合創始人兼 CEO(該公司開發了 Claude.ai)。你會了解到這些公司意識到風險。Amodei 提到一個名為 A.S.L. 的內部風險分類系統,代表“人工智慧安全級別”(不是美國手語)。我們目前處於 ASL 2,“系統顯示出早期的危險能力,例如提供如何製造生物武器的指示。” 他描述 ASL 4 為“使國家級行為者大幅提高其能力……我們擔心北韓、中國或俄羅斯可能在各種軍事領域利用人工智慧大幅增強其進攻能力,從而在地緣政治層面上獲得實質性優勢。”這真是令人不寒而慄。

在這個嚴峻的背景下,我將強調對作家和出版社最相關的問題。

版權被侵犯了嗎?

An icon of a key

版權問題是複雜和模糊的迷霧。顯然,有一些仍在版權保護期內的書籍被納入了一些大型語言模型的訓練中。但與一些作家擔心的情況不同,並不是他們的所有作品都被每一個大型語言模型全數吸收。

版權問題既具體又廣泛。眾所周知,所有的大型語言模型都是在開放網絡上訓練的——從當前網絡上的15億個網站中抓取的內容,無論是報紙文章、社交媒體帖子、網絡博客,甚至是YouTube視頻的轉錄文本。

可以證明 至少有一個大型語言模型吸收了數千本不在公共領域的書籍的實際文本。

在沒有向作者支付任何補償的情況下,將這些文本用於建立數十億美元的人工智慧公司是否合法?人工智慧公司依據合理使用來辯護;法院最終會做出裁決。即使這是合法的,這是否合乎道德或倫理?倫理問題似乎比法律考量更不複雜。你來決定。

圍繞版權的法律顯然沒有預見到人工智慧帶來的獨特挑戰,尋找法律解決方案需要時間,可能需要數年。(如果你想深入了解為什麼現行法律不適合解決這個特定問題,請閱讀A. Feder Cooper和James Grimmelmann撰寫的出色論文《文件在電腦裡:版權、記憶和生成型AI》)

這裡有一份十三個最著名的訴訟的列表,其中並不都是關於書籍的;還有圖像和音樂的訴訟。而這裡有另一份列表更新了所有訴訟的狀態。

版權與AI對作家的影響

An icon of a key

作家面臨著有關人工智慧生成內容的版權問題。

美國版權局對人工智慧生成內容的版權立場表示,人工智慧本身不能擁有版權,因為它缺乏作者的法律地位。這是有道理的。但這假設100%的作品都是由人工智慧生成的。如同在其他地方討論的,很少有作家會讓人工智慧生成整本書。更可能的是5%,或10%或… 在這裡,版權局也會陷入困境(我也會)。

在最近的一次裁決中,版權局認為由人類撰寫的文本與由Midjourney人工智慧服務生成的圖像組成的圖像小說構成了可版權保護的作品,但單個圖像本身不能受到版權保護。天啊!

An icon of a key

簡而言之,作家和出版社需要對多方面的版權問題保持警覺。

長期影響是什麼?

一些人將目前的訴訟比作Google圖書訴訟,該訴訟花了10年時間才在法律上解決。誰知道這些訴訟的上訴過程將拖延多久。與此同時,出版社應該審慎地行事,假設人工智慧公司會輸,這至少理論上會使任何授權使用或甚至使用Chat AI的人暴露在某種或有責任之下。

但這不是出版社最嚴重的問題。這是一種感知。對於許多作家,有些是知名的,有些是默默無聞的,這口井已經被毒化了。人工智慧在寫作和出版界是放射性的。任何沾上人工智慧的東西都會引起強烈的批評。

有很多例子。最近的一起事件中,致力於現代成人科幻小說、奇幻小說和WTF的英國出版商Angry Robot宣布將使用名為Storywise的人工智慧軟件來篩選預期的大批量手稿提交。公司花了僅五個小時就放棄了這個計劃並回到了“舊收件箱”

貿易出版商在內部使用人工智慧工具時面臨的難以忍受的兩難境地:如果你的作者發現了,你將很難應對隨之而來的風暴。我相信出版商別無選擇,只能勇敢地採用(至少部分)這些工具,清楚地解釋這些工具是如何訓練和使用的,並繼續前進。

在英國,The Society of Authors 採取強硬的立場:“請你的出版商確認,其不會在與你的作品相關的任何用途上大量使用人工智慧——如校對、編輯(包括真實性閱讀和事實核查)、索引、法律審查、設計和佈局,或在未經你同意的情況下使用於其他任何用途。你可能希望禁止人工智慧進行有聲書解說、翻譯和封面設計。”

The Authors Guild 似乎接受“出版商開始探索在日常運營中使用人工智慧作為工具,包括編輯和營銷用途。”我不認為公會的許多成員都這麼理解。

將內容授權給人工智慧公司

大多數出版商和許多作者都在尋找將內容授權給人工智慧公司的方法。每個人對授權條款應該是什麼以及他們的內容價值多少都有不同的看法,但至少討論已經開始。

有幾家初創公司正在尋求與出版商(在某些情況下,與個別作者)合作。Calliope NetworksCreated by Humans 在這方面都很有趣。

七月中旬,版權清算中心(Copyright Clearance Center),長期以來是集體版權授權領域的主要玩家,宣布在其年度版權授權(ACL)中提供“人工智慧(AI)重用權利,這是一項企業範圍的內容授權解決方案,為訂閱的企業提供數百萬作品的權利。”

Publishers Weekly 報導了這一公告,並引用了CCC總裁兼首席執行官Tracey Armstrong的話:“可以既支持人工智慧又支持版權,並將人工智慧與對創作者的尊重結合起來。”

雖然這不包括所有內容,但這可能是推動出版業與大型語言模型開發者達成某種合作的突破。

避免人工智慧已經太遲了

An icon of a key

對於不希望被人工智慧玷污的作者和出版商來說,消息不妙:你今天正在使用人工智慧,並且已經使用了多年。

人工智慧,以不同的形式,已經集成到我們每天使用的大多數軟體工具和服務中。人們依賴於像Microsoft Word或Gmail這樣程式中的人工智慧驅動的拼寫和語法檢查。Microsoft Word和PowerPoint應用人工智慧來提供寫作建議,提供設計和佈局推薦等等。虛擬助理如Siri和Alexa使用自然語言處理來理解語音命令並回答問題。電子郵件服務利用人工智慧來過濾信息,檢測垃圾郵件並發送警報。人工智慧驅動的客服聊天機器人和基於你的購買歷史生成產品推薦。

而這些大多數是基於大型語言模型,如ChatGPT。

對於一位作者或編輯來說,說“我不希望在我的手稿上使用人工智慧”,從廣義上講,幾乎是不可能的,除非他們和他們的編輯都使用打字機和鉛筆工作。

他們可以嘗試說,“我不希望使用生成式人工智慧”在他們的書上。但這是一個難以切割的問題。語法檢查軟體最初並不是基於生成式人工智慧構建的。Grammarly 已經將其作為其產品的一部分,所有其他拼寫和語法檢查器也將如此。生成式人工智慧也是提供的營銷軟體的核心。

當作者使用人工智慧

作者使用人工智慧的另一個方面與上面討論的版權問題有相似之處。在極端情況下,我們看到100%由人工智慧生成的內容在亞馬遜上發布。大多數(全部?)質量都很差,但這並不妨礙其發布。(另見亞馬遜部分。)對於出版商來說,更令人擔憂的是人工智慧生成的投稿。是的,人工智慧提高了數量,但大型出版商已經有一個過濾數量的過濾器。這些過濾器被稱為代理。他們將是那些必須弄清楚如何處理數量問題的人,顯然他們將不得不找到一個不使用人工智慧的解決方案。

這是一個存在問題——我真的想出版一本由「機器」寫的書嗎?對於大多數出版商來說,這是一個明確的「不」。簡單明瞭。那麼,如果一本書的50%內容是在一位有能力的作者監督下由 LLM 生成的呢?嗯,我們也試試「不」。好吧,那麼25%、10%或5%呢?你在哪裡劃界限?

既然你已經進入了劃界限的行業,那麼你如何解決拼寫和 語法工具現在至少部分依賴生成式 AI 的困境呢?那麼像 Otter.ai內建於 Microsoft Word 的轉錄功能 這樣的 AI 驅動的轉錄工具呢?

我找不到任何貿易出版商聲明他們不會出版含有預定數量的 AI 生成文本的作品。以下是作家公會對此話題的看法:

「如果你的手稿中包含大量 AI 生成的文本、角色或情節,你必須向你的出版商披露,並且應該也向讀者披露。我們認為,當 AI 僅用於頭腦風暴、想法生成或文案編輯時,作者不必披露生成式 AI 的使用。」

不言而喻,「顯著的」並未明確定義(牛津字典將其定義為「足夠大到可以被注意到或認為重要」),但該帖子繼續解釋說,包含超過「微不足道 的 AI 生成文本」將違反大多數出版合同。微不足道 在法律術語中沒有精確的規定,但一般來說,意味著與顯著差不多。

AI 能夠在寫作中被檢測出來嗎?

我在2024年5月主持了一場由 BISG 贊助的關於 AI 檢測的網絡研討會。重播在 YouTube 在線。Jane Friedman 在她的 Hot Sheet 電子報中提供了一篇 全面的網絡研討會寫作

對於許多作者來說,AI 的毒性意味著將其遠離他們的文字。出版商承擔著特殊的責任——他們不創造文本,但一旦出版,他們就對文本承擔了重大義務。我們已經看到很多引爆點接近煽動性書籍,無論是關於內容的社會影響,還是對其他作家文字和想法的剽竊。現在有了 AI,我們面臨一整套新的倫理和法律問題,這些問題在出版學校中都沒有提到。

部分擔憂類似於人們對學生的擔憂,即使用 AI 是某種作弊,類似於從維基百科文章中抄襲,或者只是讓朋友幫你寫文章。

我們的網絡研討會其中一位演講者,教育家 José Bowen,分享了他給學生的披露。這並不完全適用於作者,但它展示了某種 AI 使用的「風險等級」。

學生披露協議範本

  • 這些工作都是我自己完成的,沒有朋友、工具、技術或 AI 的幫助。

  • 我完成了初稿,但請朋友/家人、AI 改寫/語法/抄襲軟件閱讀並提出建議。在這些幫助之後,我做了如下修改:

    • 修正了拼寫和語法

    • 改變了結構或順序

    • 重寫了整個句子/段落

  • 我在遇到問題時使用了詞典、字典、打電話給朋友、去幫助中心、使用 Chegg 或其他解決方案提供商。

  • 我使用了 AI/朋友/導師來幫助我生成想法。

  • 我使用了幫助/工具/AI 來做大綱/初稿,然後我進行了編輯。(描述你的貢獻性質。)

因此,出版商可以為他們的作者起草類似的東西。假設作者披露了最高級別:我廣泛使用了 AI,然後編輯了結果。然後怎麼辦?你會自動拒絕手稿嗎?如果是,為什麼?

同時,如果你在注意,你會發現你剛剛讀過並喜愛的手稿,作者發誓甚至沒有用 Grammarly 檢查拼寫,實際上可能有 90% 是由 AI 生成的,由一位擅長隱藏其使用的作者完成。

你被迫重新思考這個問題。問題變成了,「為什麼我如此堅定地想要檢測這個無法檢測的東西?」

部分原因是對AI生成文本的著作權性問題的警告關注。版權局不會為100%由AI生成的文本(或音樂、圖像等)提供版權保護。但如果是50%由AI生成的文本呢?好吧,我們只會涵蓋由作者生成的50%。那你怎麼知道是哪一半呢?我們會再跟你聯繫。

如果你能將每個手稿輸入某些軟體,然後告訴你是否使用了AI來創建文本,那該多好?

撇開唯一能做到這一點的方法是使用AI工具不談,更重要的問題是,這些軟體是否(足夠)準確?我能依賴它告訴我是否使用了AI來創建手稿嗎?我能依賴它不產生“假陽性”——即表示使用了AI,而實際上並沒有嗎?

現在市面上有很多軟體來解決這些挑戰。許多學術研究評估這些軟體指出其不可靠性。AI生成的文本會漏掉。更糟的是,未由AI生成的文本被錯誤標記為已被污染。

但圖書出版商將需要某種保障措施。看來,這些工具最多只能提醒你可能存在的問題,但你始終需要仔細檢查。因此,也許它可能會提醒你需要比其他文本更仔細檢查的文本?這是一種效率嗎?

真正的效率在於不再關注文本的起源,而是保持我們現有的質量標準。

失業

“你不會被AI取代。你會被懂得如何使用AI的人取代。” —匿名

AI採用可能會導致嚴重的失業。估計各不相同,但數字令人沮喪。有明顯的例子:舊金山的無人駕駛出租車消除了……出租車和共乘司機的需求。AI支援的診斷可能會減少對醫療技術人員的需求。

我的樂觀主義者指出了一個例子,即試算表的引入及其對就業的影響。如下面的圖表所示,從1990年以來,“會計、稅務準備、簿記和薪資服務”領域的就業幾乎翻了一番——這並不是對試算表和其他大部分自動化這些任務的技術的譴責。

一個折線圖顯示了從1990年到2020年會計、稅務準備、簿記和薪資服務領域的員工數量。

Ethan Mollick與波士頓諮詢公司(BCG)的研究是一項旨在更好地了解AI對工作影響的實驗,特別是對複雜和知識密集型任務的影響。該研究涉及758名BCG顧問,隨機分配使用或不使用OpenAI的GPT-4進行兩項任務:創意產品創新和商業問題解決。該研究測量了參與者的表現、行為和態度,以及AI輸出的質量和特徵。

其中一項發現是“AI作為技能平衡器發揮作用。我們在實驗開始時評估得分最低的顧問在使用AI後,其表現提升了43%。頂尖顧問仍然有所提升,但提升的幅度較小。”完整文章揭示了更多內容,與所有Mollick的作品一樣,發人深省且易於理解。

教育

教育在AI的支持和反對辯論中一直處於前沿。AI進入教室的引入大多被視為詛咒,或至少是一個挑戰。其他教育者,如PW的主講人Ethan Mollick,則將AI作為教育者的一個非凡新工具;Mollick堅持他的學生使用ChatGPT。

關於這個話題最好的書是*Teaching with AI: A Practical Guide to a New Era of Human Learning*由José Antonio Bowen 和C. Edward Watson合著。

我不打算在這本書中深入探討教育出版——這是一個廣泛的話題,需要單獨報告。可以說,出版在教育中的重要性正在下降:AI工具是軟體,而非內容本身。

搜尋的未來

An icon of a key

搜尋在AI中是一個充滿挑戰的話題。我鼓勵你訪問perplexity.aiYou.com,以瞭解未來的發展方向。下次當你考慮開始Google搜尋時,請改用Perplexity。它不會顯得大不相同——類似於Google經常在搜尋屏幕的右側或有時在搜尋結果列表頂部彈出的知識圖譜。不需要點擊鏈接,信息就直接呈現在你面前。

困惑度更進一步,重新措辭它從多個來源收集的信息,這樣你真的不需要點擊鏈接。它提供了來源的鏈接,但通常不需要點擊——你已經得到了你問題的答案。

這看似微小的變化對於每個公司和每個產品都有巨大的影響,這些公司和產品至少部分依賴於通過搜尋引擎被發現。如果搜索者不再被引導到你的网站,你如何吸引他們並將其轉化為客戶?簡單回答,你做不到。

Joanna Penn 在思考新技術對寫作和出版的影響方面處於前沿。她在去年12月的播客和博客中討論了這個複雜的話題

對於AI和搜尋的轉變來說,這還是早期階段。

亞馬遜上的垃圾書籍

An icon of a key

AI生成的垃圾書籍在亞馬遜上是一個問題,儘管其嚴重性可能更多是感覺上的而不是實質上的。一方面,這些書籍用低品質和抄襲的內容充斥著網上書店,有時甚至使用真實作者的名字來欺騙顧客,利用他們的名聲。這些書籍不僅對讀者來說是一個麻煩,也是對作者的一個威脅,有可能剝奪他們辛苦賺來的版稅。AI生成的書籍還會影響亞馬遜網站上真實書籍和作者的排名和可見度,因為它們在關鍵詞、類別和評論方面競爭。

一隻可愛的小貓坐在海灘上,周圍有花,標題說“世界上看不到的搞笑和可愛的貓照片”.

亞馬遜現在要求作者披露他們在創作書籍過程中使用AI的詳情。毫無疑問,這可能會被濫用。

試著在亞馬遜上搜索“AI生成的書籍”。有很多結果。一些結果是關於如何使用AI創作書籍的書籍。但其他的,無所顧忌地,是AI生成的。《搞笑和可愛的貓圖片-你無法在世界上看到這樣的照片-第一部分》(原文) 被歸功於Rajasekar Kasi。在作者頁面上沒有他的(或她的?)生平詳情,但有六個其他標題被歸功於這個名字。該書於2023年8月26日出版,沒有評論也沒有銷售排名。這本電子書不合語法的標題與印刷書封面的不合語法標題不符。

但其他作者顯然在創作他們的書籍時廣泛使用AI,卻沒有披露。如上所述,檢測AI使用幾乎不可能,尤其是對於技術嫻熟的“造假者”。塗色書、日記、旅行書和食譜書正以極少的時間和精力通過AI工具生成,與傳統出版相比。

搜索“韓國素食食譜書”,你會發現第一名的標題是Joanne Lee Molinaro的書。但緊隨其後的是其他顯然是抄襲的標題。“《韓國素食食譜書:韓國美食愛好者的簡單和美味的傳統和現代食譜》”有兩條評論,其中一條指出“這不是一本素食食譜書。所有的食譜都有肉和蛋的成分。”但這本書的銷售排名是#5,869,771,而原版的排名是#2,852。

很難確定造成的損害程度。這不會有任何好處,但有多糟糕呢?

亞馬遜有政策允許它刪除任何未能“提供積極客戶體驗”的書籍。Kindle內容指導方針禁止“旨在誤導顧客或未能準確代表書籍內容的描述性內容。”他們還可以阻止“通常令顧客失望的內容。”是龐大的數量擊敗了亞馬遜的監視者?還是有其他原因?

偏見

LLMs是基於已經在線發布的內容進行培訓的。已經在線發布的內容充滿了偏見,因此LLMs反映了這些偏見。當然,不僅僅是偏見,還有仇恨,這些都反映在它的學習中,現在可能成為AI生成的文字和圖像中的潛在輸出。色情是AI在圖像方面驚人能力的另一個自然受益者,最近有令人不安的故事,講述年輕女性發現虛構的裸照,她們的男性同學可能是嫌疑人。《紐約時報》分別報導了網上兒童性虐待圖像增加的情況。

作者和出版商在使用AI工具時需要注意這些內在的限制。

創造力可以是陳腔濫調

An icon of a key

機器是否能真正具有創造力這個問題仍然是激烈辯論的話題。這在某種程度上取決於我們如何定義創造力。

「AI永遠不會有創造力。」這是一個熟悉的口號。

我們都知道什麼是創造力,不是嗎?

劍橋大學的定義:「產生或使用原創和不尋常想法的能力。」

大英百科全書的定義:「創造新事物的能力,不論是一個問題的新解決方案、一種新方法或裝置,還是一件新的藝術作品或形式。」

我並不否認這種意義上的創造力遠遠超出了LLMs的能力範圍。

我的論點是,大多數被認為是創造性的東西——而且看起來相當有創造力——實際上是漸進的。這在許多事情中運作良好,包括大多數的廣告。

但是,提出“創造力”這個標準,然後貶低LLMs,是設立了一個不可能達到的高門檻,人工智慧無法避免地會失敗。然後人們就會說:「好吧,我告訴你它不具創造力。」

從而忽略了它在迭代方面非常擅長的東西。

在不久的將來,我會在完成閱讀以下書籍後,發表一篇長篇文章討論這個話題:

The Creativity Code,作者:Marcus du Sautoy,和

The Artist in the Machine,作者:Athur I. Miller

Literary Theory for Robots,作者:Dennis Yi Tenen

另一個想法

Jeremiah Owyang 是一位位於矽谷的行業分析師。他是一個AI的支持者,但他也見證過炒作。他指出,他「從未見過如此短時間內的快速發展。」

正如 Owyang 在他的文章中所說,小團隊的程式設計師現在可以使用LLMs在兩天內組裝出像四歲小孩一樣的「有感知的生物」。它們能夠:

  • 通過計算機視覺「看見」現實世界中發生的事情,

  • 通過語音命令和環境聲音「聽到」現實世界中的聲音,

  • 通過處理上述現實世界的輸入進行「思考」,

  • 通過訪問預訓練數據進行「學習」,

  • 參考專屬數據集,

  • 用任何語言進行具有語調和語氣的「說話」,

  • 通過文字通訊進行任何格式或風格的「寫作」,

  • 自發地創建圖像進行「繪畫」,以及

  • 主動參與對話,提問,或分配AI代理完成任務進行「互動」。

這是非凡且前所未有的。這對出版業會有影響嗎?你來決定。

出版業以外的好事

AI在出版業以外的一些突破性成就背後起到了關鍵作用。醫學是AI的典範,但其他行業也有強有力的故事。與出版業的相關性來自一個修辭問題:AI能拯救生命。但你不認為它能幫助出版業嗎?

這個簡短部分的目的是僅僅反駁這樣的論點,即不相信AI會幫助出版業,那麼AI可能會幫助到任何人嗎?

AI與醫學

閱讀2024年3月的經濟學人,我深入研究了其關於健康和AI的科技增刊。在過去的幾年中,醫學一直是人工智慧的亮點。大多數報告都是正面的。但經濟學人的特寫會讓你大吃一驚。他們確實表達了許多言之有理的保留意見。但你也會讀到AI在醫學中「代表了一個改善數億甚至數十億人生活的機會。」

對於那些試圖禁止AI技術,或至少暫停其發展的人來說,另一個修辭問題是:你會犧牲它對數百萬人健康的潛在價值來滿足你對不確定未來的焦慮嗎?

AI與機場的TSA

我們都經歷過:無盡的排隊,我們的隨身行李在X光機中的緩慢移動。

TSA的檢測失敗是有記錄的,但並沒有被廣泛討論。

最讓我困擾的是那些悲傷的工人,盯著螢幕,沒完沒了地工作。為了什麼?這不僅是一份悲慘的工作,而且作為凡人,他們並不擅長這項工作。

引入人工智慧。如果它能夠檢測出肺部難以察覺的腫瘤,我相信它也能檢測出隨身行李中的違禁品。並且讓人類擺脫一項他們不適合處理的無感恩的任務。

根據這篇報導,新推出的美國運輸安全管理局人工智慧輔助篩檢計劃正在進行中。

論文:人工智慧對圖書出版業的影響

我最近與Peter Brantley,我的人工智慧網路研討會夥伴,討論了如何塑造即將到來的人工智慧計劃。Peter 大部分時間都在圖書館界工作,剛從洛杉磯的一場全天活動回來,與他的約 150 位圖書館同事一起,親自探討了人工智慧對他們行業的潛在影響。討論非常活躍且深入。他納悶,為什麼貿易書籍出版商沒有這樣的聚會?人工智慧是每個出版活動中的話題之一:為什麼它不是主要話題

人工智慧的現實影響

他得出的結論是,貿易書籍出版商尚未認為人工智慧會對他們的業務產生任何現實世界的影響。對他們業務的核心。對他們進行業務的能力。當然,它可能有助於撰寫新聞稿或拒絕稿件信,但他們認為出版業仍會像幾十年來一樣慢慢進行,從簽約到印刷書籍的平均時間可能長達兩年。

同時,出版商當然面臨比人工智慧更緊迫的短期挑戰。紙張價格。運輸成本。利潤縮水。整體銷售基本持平。在所有這些壓力下,誰有時間或精力去關心人工智慧?

其他圖書出版領域開始掌握人工智慧的影響了。學術出版深入探討了這項技術。但貿易出版商的行為好像人工智慧不會對現實世界產生多大影響。

現實世界的影響可能是什麼?它會影響書籍的供應嗎?還是對書籍的需求?

供應:是的,人工智慧是亞馬遜上大量新垃圾書籍的罪魁禍首。數百本?當然。數千本?也許。數百萬?不會。亞馬遜上有多少本書?超過 5000 萬本。已經非常擁擠了。

除此之外,很明顯在短期內,人工智慧不會寫出人們真正想讀的整本書。到目前為止,它的價值在於作為寫作夥伴——批評、建議、偶爾寫出幾段可用的文字。否,短期內,人工智慧不會從根本上改變圖書出版的產出,新的書籍供應。

需求:不,沒有人在要求人工智慧生成的書籍。這不是一個因素。我無法預見任何情況下人工智慧會更廣泛地影響書籍需求。

那麼出版過程呢?是的,這將會改變。至少有些改變。正如我們在去年秋天的Publishers Weekly人工智慧活動中發現的那樣,出版商正在尋求人工智慧在這裡和那裡的幫助:行銷、編輯、一點這個一點那個。

人工智慧對商業書籍出版的現實影響是否會很少?也許它只是a toy

讓我們從人工智慧的細節中退一步,重新審視商業出版業的困境,並透過這一點深入探討人工智慧可能產生最大影響的地方。

出版業經濟衰退已持續數十年

根據不同的估計,美國整個書籍出版業的年銷售額不到350億美元。即使是400億美元,Apple Computer的年銷售額也高出十倍。Apple的毛利是銷售額的44%,而淨利是銷售額的25%。出版業甚至不敢夢想這樣的利潤率。

商業書籍出版業經濟衰退已持續數十年,有些年份上升幾個百分點,有些年份下降。到2024年中期,銷售年復一年看起來很穩定,但這就是出版商熟悉的那種夏日戀情。我們有時贏,有時輸,但總體而言,商業書籍出版業並不是一個成長型產業。

2023年,根據AAP的StatShot,“商業收入下降了0.3%,年度銷售額為89億美元。”據我所知,AAP的數據並未考慮通貨膨脹。在3.4%的通貨膨脹率下,銷售下降應為3.6%,更接近Circana報告的2.6%的單位銷售下降率報告

如果沒有替代格式的增長,如電子書和有聲書,這個行業的狀況可能會非常糟糕。電子書多年來一直是增長引擎。有聲書銷售繼續攀升,2022年增長近15%,2023年再增長9%。是的,其中一些是替代銷售,但很多電子書和有聲書的顧客是新顧客,而不一定是常規的讀者。去年電子書和有聲書佔商業銷售的21%。如果只有印刷書可供選擇,這些顧客都會購買印刷書嗎?

隨著成本和零售商與批發折扣擠壓出版商的利潤,零售定價成為日益關注的問題。學術研究表明,書籍確實存在一定程度的價格彈性,但我們肯定已達到抵抗點:精裝書暢銷書的價格可能會遇到35美元的天花板。“訂閱疲勞”正導致視頻點播顧客取消服務,關注每項服務不斷增加的成本。Netflix的高級計劃現在每月高達22.99美元;Disney Plus Duo Premium每月為19.99美元。正如一位同事最近對我說的,有多少手頭拮据的訂閱者會說,哦,讓我們取消Netflix訂閱,這樣我下個月就可以買一本書?

書籍出版業薪資

我不打算過度討論這個問題:不僅僅是作者為了謀生而奔波——出版業人員的薪資與可比職業相比嚴重偏低。

我保留了一些近期的出版業職位招聘信息。這裡有一個,某商業出版商的市場經理職位,該公司報告2023年銷售額剛超過3000萬美元。該職位每年支付60000至70000美元之間。這裡還有一個,某出版商旗下的一個品牌的公關經理職位,該出版商報告年銷售額7.5億美元。“此職位的年薪為74000至79000美元,”招聘信息指出。

根據美國勞工統計局國家職業就業和工資估算,行銷經理在所有行業中的平均收入為 $166,410。 “公共關係經理“的平均收入為 $159,420。

圖書出版業甚至連這個標準都達不到。對於在出版行業工作的人來說,這並不是新聞。一直以來都是這樣。但出版行業能在這樣的薪資水平下持續下去嗎?無法為候選人提供甚至一半的薪資標準,對於一個日益數字化的行業來說,這並不是好兆頭。

在 TikTok、YouTube、社交媒體、SEO、元數據和作者平台的時代,到底什麼是“宣傳經理”呢?

傳統圖書出版商的三個(半個)剩餘優勢

傳統圖書出版商的三個持久優勢是(i)聲望,(ii)接觸主流媒體的渠道,以及(iii)書店分銷渠道。這並不適用於所有傳統出版商——最大的出版商擁有更多每個優勢:更多的聲望,更好的主流媒體接觸渠道,以及更多在最多數量書店前台展示書籍的機會。但總的來說,這些是傳統圖書出版行業的特徵性優勢。

出版商能提供的另一個價值是精選的互補書目清單,其中每本書都能從其伴侶書中受益。想想像Fox Chapel這樣的出版商,專門出版有關手工藝的書籍:如果你喜歡他們的一本書,那麼你很可能會仔細看看他們其他關於同一主題的書籍(和雜誌),即使它們是由其他作者寫的。

這還涉及到只有少數出版商能夠發展起來的東西,一個可銷售的品牌。想想像 Wiley 的“For Dummies“系列,或者牛津的“Very Short Introductions“系列。這個品牌傳達了編輯方法和質量的一致性,鼓勵讀者購買多本書籍。自我出版者常常推出自己的短系列,主要是為了小說,儘管他們無法擁有這些大型出版商目錄的廣度。

所有傳統出版商提供的其他服務,都可以在公開市場上購買,質量相似,價格合理(例如,編輯、設計、製作和基本的行銷功能)。而且,對於自我出版者來說,每本書的收入是傳統版稅計劃的五倍或更多。

我會在本書末尾的一個簡短附錄中深入探討這一點。但讓我快速貶低前三個優勢的價值。聲望對於炫耀權利來說很好,但現金價值有限。書評和其他主流媒體曝光,現在對書籍銷量的影響大大減少。而書店佔行業銷售的比例約為15%(對於自我出版的作者來說更少)——它們不再是書籍成功的核心。

事情已經改變了。

自我出版

自我出版在過去十多年中一直是消費者(商業)出版增長的主要驅動力。圍繞自我出版的準確銷售數據仍然隱藏——很容易忽視它的重要性。但現有數據顯示自我出版佔據了商業出版市場的相當一部分。

就像 Kobo CEO Michael Tamblyn(有點)著名地指出,“我們賣的四本英文書中有一本是自我出版的,這意味著對我們來說,自我出版就像在市場上有另一個Penguin Random House,只是沒有人看到。這就像出版界的暗物質。”

自我出版市場的趨勢可以說是商業出版中唯一重要的趨勢。自我出版的作者在引領潮流。他們大膽且不受傳統行業習俗的束縛。許多人熟悉社交媒體。他們與讀者,他們的客戶,保持著密切的聯繫。如果你想學習最新的行銷技巧,請關注作者論壇博客,和新聞簡報

深入研究作者收入統計數據、寫作經濟學,然後比較傳統出版作者收入的下降與自我出版作者收入的增長。在我與Steve SieckALLi進行的2023年國際調查和報告中(pdf),我們發現“2022年所有自我出版者回應者的寫作和自我出版相關收入的中位數為 $12,749,比前一年增長了53%。平均(均值)收入大大偏高:2022年為 $82,600,增長了34%。”

[在一項由Peter Hildick-Smith為作家協會進行的獨立調查中,全職自出版作者從2018年開始出版以來,報告的平均收入為24,000美元,相比2018年的13,700美元,增長了76%。]

混合出版商

為了全面起見,我還想提到混合出版商。我對混合模式越來越感興趣,而混合出版市場非常重要並且正在增長。沒有人單獨估計混合出版的銷售額,但其影響最明顯地體現在兩個類別的主導地位:名人書籍和熱門商業書籍。這些類別長期以來一直是商業出版商可靠的收入來源,但混合出版商的“禮賓服務”和更有利的收入分享,對許多高知名度的作者來說是不可抗拒的。

最近的例子,如Authors Equity 與其作者的利潤分享關係,以及Keila Shaheen 與 Simon & Schuster 的50/50利潤分享,表明混合模式的正常化趨勢。這對作者來說是好消息;對傳統出版商來說則不那麼樂觀。

出版超越出版商

我正與Rüdiger Wischenbart共同撰寫一份報告,基於他原始的《出版超越出版商》研究。我們試圖盡可能全面地了解和量化全球所有與書籍相關的出版活動,這些活動應該(並且應該)被納入現代出版生態系統的更全面視角中。

一旦你超越了書籍容器,你就會看到人工智慧真正能產生影響的地方。

我們專案的典範是Wattpad,這裡“9700萬人每月花費超過230億分鐘投入於原創故事中”。這些故事主要在智能手機上以短篇形式在線體驗。很少有成為出版書籍的。它們同樣可能進入“Wattpad WEBTOON Studios,即該公司的電視、電影和出版部門”。

年輕讀者比年長的讀者更適應線上數位閱讀。根據2024年1月的Wattpad調查,“數位格式在年輕一代中越來越受歡迎,65%的Z世代和71%的千禧一代接受網絡小說、電子書和網絡漫畫,而X世代和嬰兒潮一代中不到一半的人有相同的看法。”

當然,正如傳統出版業現在所學到的:“多樣性是接受數位格式的關鍵驅動力:61%的Z世代和70%的千禧一代認為電子書、網絡小說和網絡漫畫讓他們能夠獲取在書店和圖書館中更難找到的內容,包括LGBTQ+和少數族裔為主題的內容。”

Wattpad 有競爭對手,包括Inkitt,根據Publishers Weekly,最近從投資者那裡籌集了3700萬美元,其中包括Holtzbrinck出版集團(擁有麥克米倫)所有者Stefan von Holtzbrinck和前企鵝CEO Michael Lynton;它現在共吸引了1.17億美元的投資。2023年2月,金融時報Inkitt是歐洲增長最快的公司之一,排名第八,德國第一。Esquire 7月9日的文章概述了Inkitt使用人工智慧及其在成功中的作用。

有多少人聽說過Inkitt,訪問過其發佈平台,或下載過其Galatea閱讀應用

但是我們的“超越出版商的出版”報告不僅僅考慮在線故事平台,還考慮到“內容可以以多種格式(印刷、數位)、媒體(書籍、有聲書、電影、遊戲)、發行渠道(社區、平台、流媒體)和商業模式(產品銷售、訂閱、流媒體、免費增值、付費模式)創建和傳播,主要在數位定義的供應和行銷鏈中。”書籍出版商錯過了多少機會,因為它們不適合其現有的商業模式?

創新、技術與圖書出版

除了電子書,現代出版業從未面臨過技術威脅。(數位有聲書更多地被歡迎而不是恐懼。)互聯網時代的黎明為出版商提供了更多的機會而不是威脅;只是單個零售商亞馬遜,由互聯網支持,打亂了市場。

我從未見過一項研究能全面考量亞馬遜對圖書出版行業的影響是否為正面。它觸及了許多實體店無法服務的買家,並願意犧牲利潤以保持低價。電子書和有聲書大規模交付。但亞馬遜能夠降低價格,部分原因是它要求供應商提供高折扣和費用,並扼殺其他零售渠道。這是一個痛苦的取捨。

但是,不要在自行出版的作者面前批評亞馬遜。沒有萬物商店,他們根本無法經營。

創新者的困境

為了了解AI對圖書出版業即將產生的影響,我推薦克萊頓·克里斯坦森的創新者的困境:當新技術使偉大的公司失敗,該書於1997年由哈佛商業評論出版社首次出版。

克里斯坦森研究了現有(主流)公司如何屈服於創新力量。

成功且管理良好的公司在面臨行業顛覆性變革時經常失敗。傳統的管理實踐,曾幫助他們成為行業領導者,使這些公司難以靈活應對可能蠶食其市場的顛覆性技術。

他們忽視了由顛覆性技術產生的產品,因為乍看之下,這些產品與現有產品相比顯得遜色。他們最有利可圖的客戶通常無法使用所謂的創新,也不希望使用它們。公司試圖通過加倍推廣現有產品和服務來抵擋顛覆性威脅。

克里斯坦森的關鍵洞見是,通過做顯然“正確”的事情,包括聆聽客戶,成功的公司讓自己對顛覆性創新敞開了大門。他們專注於當前的客戶,忽視了重要的新技術——這些技術最初瞄準的是小而不盈利的市場。這為敏捷的初創公司創造了顛覆領導者的機會。

克里斯·迪克森,在討論這本書時指出,“大新事物之所以能夠悄悄越過現有企業,是因為下一個大事物總是被視為‘玩具’。”嗯,是的,很多人認為Chat AI是玩具

出版商是否未能意識到由生成式人工智慧構建的創新可能會顛覆其脆弱的商業模式?

小說與非小說

AI對圖書出版的影響在小說出版和非小說出版方面將會有截然不同的影響。

圖書出版業經常被分析為兩個分支產業,一個出版小說書籍,另一個出版非小說書籍。

儘管大多數貿易出版商都提供小說和非小說書籍,但這兩種形式在出版數量和書籍銷售方面的差距十分明顯。估計數量有所不同,但每年出版的書籍中,小說書籍僅佔約10%。然而,銷售量大大偏向小說。每年會有一些變化,但小說大約佔年度貿易書籍銷售的一半。去年,前25本暢銷書中有21本是小說。根據維基百科的統計,在曾經售出2000萬本以上的英文書籍中,84%是小說書籍。

書籍銷售趨勢一向變幻莫測,但小說銷售似乎持續上升。在2019年跌至32%後,2022年佔據了成人市場的40%,並在2023年略有增長。成人小說銷售在2024年上半年又增加了6.3%。

雖然AI將越來越多地被小說作家用來輔助創作過程,如在其他地方討論過的,但AI生成的故事似乎不太可能佔據暢銷書榜。一些類型小說達到“夠好”的標準是可以想像的,但這並不是應該讓作家和出版商夜不能寐的事情。

另一方面,非小說的寫作和出版將全面受到AI的幫助。這已經在發生。非小說作家正在利用聊天AI的眾多才能,既作為研究助理又作為寫作助手。非小說出版商也將越來越多地求助於聊天AI來幫助手稿開發、事實核查、編輯、市場營銷和分發。

作者面臨生存威脅嗎?

我與一位非常聰明的作者代理人交談過,她一直在思考AI對她的客戶以及所有專業作者的影響。談話轉向了“書籍作為‘容器’”的概念,我請她詳細說明這一想法。她的回答是:

“基本理念是,當作者/代理人將一本書交給出版商時,它就是一本書。理解在於,它可能後來會成為我們所熟知的各種衍生作品形式(翻譯、戲劇改編、圖像小說等),但所有這些都是次要的,‘作品’本身是主要的。作品不是一袋文字或短語或事實,它是由作者以特定方式結構化的。打破容器,搖動拼字袋並抽出一個隨機選擇(這並不是完全隨機的,因為它是由特定作者的語法、語義和風格組成的拼字袋),這不是我們在授予出版商權利時所考慮的。

“書籍是大於其部分之和的整體。它是創意頓悟(和大量創意智力工作)的產物,將其全部結合在一起,成為一本書,不僅僅是‘一本’書,而是那位特定作者的書。”

書籍中包含寶藏

當我想到非小說書籍時,打破容器是AI時代的一個優點。你打破容器,就像法貝熱彩蛋一樣,內含寶藏。

容器的限制既是一種特性也是一種缺點。一方面,“作品不僅僅是一袋文字或短語或事實,它是由作者以特定方式結構化的。” 另一方面,在創建容器時,作者因書籍容器的固有限制,被迫縮減、拒絕、重寫和重新配置。作品是經過打磨的,但也被提煉了,有些東西在這過程中丟失了(而另一些東西則得到了)。

人們不閱讀長篇非小說書籍,部分原因是他們已經習慣於在網絡上掃視所有遇到的文本——包括他們的電子郵件。即使是“書籍摘要”模式也失敗了——與其說是一部難以消化的250頁非小說書,不如說是一部難以消化的8頁書籍摘要。

書籍就像午餐盒——所有東西都在一個地方。但我只想要餅乾。

對於已成名的作家來說,擺脫他們的束縛並不容易。但他們可能不得不學會這樣做,否則就有可能被新一代技術嫻熟的研究人員和作家所掩蓋,這些人能夠隨場合表達自己,無論有無正式的容器。容器施加了太多限制和局限。

問題在於,寫作的商業模式已經不可挽回地改變了。這就像是抄寫員的結束。在這種情況下,我們的修道士作家必須從他們的書桌和他們對書籍的容器化視角中走出來,與形式和他們的讀者進行互動。

哦,是的,我很清楚作家的反駁:但我是作家,不是推廣者。我不在社交媒體上。我對與讀者實際交流不感興趣,除了通過我的作品和偶爾的電子郵件以及越來越少的露面。我有一個網站(但說實話,我從來不更新它)。我的作品是我給讀者的禮物。他們可以接受我的作品,也可以拒絕我的作品,但我不會加入他們的客廳。

好吧,你可以收起羊皮紙和由貂皮血液製成的墨水了。“作者”這個職業現在要求你走出書桌,去讀者的客廳和他們的Facebook頁面見面。你可以隨意哀嘆,我們會關閉你的補助金、終身職位和出版機會。這是作家和讀者的勇敢新世界,沒有出版商,那些努力提升你的作品但不斷打斷你與最重視它的讀者的直接聯繫的可怕中介。

這一切並不妨礙偉大的敘事非虛構書籍接觸到調音的觀眾。恰恰相反。 這些書籍可以繼續閃耀。依然會有暢銷的非虛構作品,儘管經濟學會發現,這種模式對於除了最暢銷的作家之外的所有人來說都是不可能的。目前的模式不需要消失,新模式就能蓬勃發展。

我認為這些偉大的非虛構書籍是“美麗的”。“美麗”是指寫得優美,精心編輯,設計精美,並用FSC認證的紙張印刷,具有毛邊。它們在精品店銷售。

這些精品店被稱為“書店”,但它們具有精品零售的所有特徵——精美的物品,由店主和經理精心挑選,有點昂貴,但對於那些珍惜這些物品的人來說,物有所值。

大多數非虛構作者的任務現在是超越容器,以及作為守門人的出版商。

多媒體的內容容器

讀者群,特別是其中的年輕成員,越來越“媒體無偏見”。在尋找娛樂或知識時,他們可以觀看YouTube或TikTok視頻,Netflix劇集,在Spotify上聽音樂,瀏覽Instagram (“Insta”),了解新聞,或者偶爾閱讀書籍。

(印刷書籍愛好者的BookTok群體是一群珍貴的影響者,但整體市場影響有限。)

然而,市場模式仍然專注於獨特的容器。出版業。電影業。電視業。音樂業。

電影不是書籍。YouTube視頻不是電影。播客不是有聲書。

這些孤島不是歷史上的必然,而是隨著時間的推移由強大的組織做出的一系列商業決策的結果。

打破建於單一容器上的商業模式並不難。

儘管當代生成式人工智慧對語言運用自如,但它在生成聲音、圖像和視頻方面的魔力更甚。人工智慧為這本書提供了有聲書,以多種語言播放,並提供31種電子書翻譯。沒有人工智慧,這一切甚至都不可能實現——傳統生產的經濟學對我來說毫無意義。

容器孤島

內容創作者傳統上接受過在單一容器孤島中出類拔萃的訓練。我們有寫作課程和電影課程以及音樂課程。我們很少想到創意作家也可以輔修電影或音樂。或者計算機編程或應用程序開發。

跨媒體怎麼了?那些教創意者成為如蘋果曾經所說的“數位媒體大師”的課程在哪裡?

最好的內容永遠會贏。但隨著時間的推移,內容容器的重要性越來越小。數位世代可能不會對容器無感。但他們是容器靈活的。他們主要通過智能手機數位化地接觸大多數內容。印刷品將繼續找到觀眾,但它再也不會占據中心。

“未來的出版商”也需要對容器靈活。內容分發的增長主要不是通過紙上的墨水,也不是EPUB文件中的文字。有聲書的增長不是偶然的,YouTube和TikTok的受歡迎也不是偶然的。

更大的挑戰在於使新內容和現有內容可以被發現,不論其形式如何,然後在被發現後,將意識轉化為購買決策。

發現與轉換

線上發現問題已經存在了一段時間;人工智慧沒有創造這個問題。這個問題是行業老手Mike Shatzkin 多次強調過的。有這麼多書籍以印刷形式存在,而數位格式使它們可以持續在印刷中。數以百萬計的絕版書可以從二手書商那裡找到。除此之外,每年僅英文新書就有兩百萬本或更多。人工智慧會使飽和問題變得更糟,但它已經失控了。

亞馬遜的算法並非無私——它們做得非常好,能夠展示出最有銷售潛力的書籍,那本你最有可能下一本購買的書。那本書不僅僅因為銷售數字而被推薦。它賣得最好不是因為某個騙子優化了線上列表。它賣得最好是因為它就是最好的,並且令讀者愉悅,讀者告訴其他人去買它,無論是在線上還是線下。(亞馬遜鼓勵的廣告扭曲了它的算法,這是平台變糟的一部分。)

我在上文中談到元數據。轉換過程就像探索一樣令人頭疼。人工智慧能否幫助作者將瀏覽者轉化為購買者?

版權的未來

版權的概念已被人工智慧弄得荒謬。這並不是說人們不希望或不應該保護他們的作品——可以說,他們比以往任何時候都更需要這種保護。也不是說人工智慧使版權無法執行(至少在某種形式上,即使不是現行的形式)。

而是“版權保護”也成為了你作品消失的面紗。如果你的書無法通過與ChatGPT的對話被引用,那麼它事實上就不存在。人工智慧公司只會授權最優質的內容。他們不需要劣質內容。

為什麼要保護那些無法找到的東西呢?

這就是發現問題可能變成災難的地方。Google僅通過元數據就能很好地發現書籍。而人工智慧則需要完整的信息。與傳統搜索引擎不同,人工智慧不僅僅依賴於作品的抽象元數據來回應用戶查詢。

同時,更改內容容器,除了整本書之外的容器,會帶來不同類型的版權挑戰。如果書的文本可以即時根據讀者輸入進行更改,那麼這些文本的版權又是什麼呢?

作家與讀者

出版商需要作者;作者不需要出版商。

出版的未來是作家與讀者之間的親密關係。這比作家與出版商以及讀者與出版商之間的關係要強得多。出版商可能會成為作家與讀者之間關係的障礙。在很多情況下,他們不僅沒能促進這種關係,反而阻礙了它。

很長一段時間以來,接觸高質量書面內容的唯一途徑是通過書籍或少量的期刊。現在情況顯然不再如此。除了其他媒體的干擾之外,現在有太多不同的方式來訪問高質量的非容器化書面內容。書籍不再享有曾經的優勢地位。

人工智慧可以溝通

“下一本適合我閱讀的完美書籍是什麼?”生成式人工智慧可以前所未有的優雅和精確回答這個問題。隨著人工智慧成為可靠的推薦引擎,作者將需要通過這個引擎進行溝通。(當然,Amazon正在努力實現這一點,並且擁有了解你之前購買記錄的優勢。)

結論

那麼這將我們帶到了哪裡?

我覺得有必要記錄出版面臨的挑戰。聊天人工智慧在貿易出版業陷入困境時到來。它不是在行業強大、能夠說“我們不需要一些新技術,我們做得很好”的時候到來的。

我在上文中談到了出版業面臨的最緊迫的挑戰:成本上升和利潤縮減。

狼永遠不會滿足於他們對更大折扣的需求;利潤不會改善。零售價格接近上限。當前貿易出版模式的未來在於降低成本。

薪資無法再降低,所以我們需要在生產週期內削減成本。

但出版商幾十年來一直在努力削減生產成本。雖然有一些顯著的成功,但我們已經耗盡了現有的選擇。

我已經展示了人工智慧如何在整個工作流程中為出版業帶來效率提升。這些不是立即的,也不是簡單的:你需要在人工智慧上努力。但機會就在那裡。

出版商不打算減少員工,因此目標必須是基於現有員工資源,更快地將更多書籍推向市場。人工智慧工具可以推動這一目標。

當然,還有一個目標是售出更多正在出版的書籍。人工智慧也可以在這方面提供幫助。

我在上文中描述了人工智慧如何對出版的未來產生變革性影響。

別擔心這些。先把你的事情安排好,我們再進一步討論。

單一資源

如今,有幾乎無限量的材料可用來幫助你了解人工智慧,當然,數量太多了。選擇你喜歡的媒介:書籍、博客、新聞簡報、視頻、播客、課程和心靈感應。我在這本書中連結了一些重要的資源,點擊幾個隨機連結看看它們會帶你到哪裡。

對於初學者來說,只有一本優秀的人工智慧書籍,Ethan Mollick的《共智》,於2024年4月初發行。該書取材於他同樣出色的新聞簡報《One Useful Thing》。

側註:撰寫此書的資歷

我不想在引言中負擔這些信息,但我知道今天有很多人對撰寫關於 AI 的作者持懷疑態度,懷疑這些作者將自己塑造成現代 AI 專家。毫無疑問,有些人確實如此。我希望我有足夠的資歷來承擔這個項目。

我第一次閱讀關於人工智慧的書是在 1988 年,這本書是兩年前出版的,書名為 Understanding Computers and Cognition: A New Foundation for Design,作者是 Terry Winograd 和 Fernando Flores。這本書內容艱澀——很多部分超出了我的理解範圍——但這是我第一次對人工智慧在書籍出版中的可能性感到興奮。

那時我已經深陷於出版數位化的過程中,這是由桌面出版、Apple 電腦、PageMaker 等的爆發所引發的。1986 年,我監督了 Page One 自動化書籍出版軟體的開發,這個程序可以將 Microsoft Word 文件格式的書稿在幾分鐘內排版成完整的書籍。這在今天很容易做到;但在當時並不容易。

此後,我繼續在出版技術領域工作,擔任顧問和分析師,與一些領先的軟體和硬體供應商合作,包括 Adobe、Apple 和 Microsoft。我還參與並成為了一家名為 Enfocus 的軟體公司的部分股東。我們創建了一個自動化的印前工作流程系統。

當時我們無法使用 AI,但我們在釋放全自動出版生產系統方面做得非常好。正如 AI 可以與魔法無法區分一樣,最好的自動化也可以看起來像 AI。

快進到 2016 年,我的同事 Cliff Guren 幫助我專注於書籍出版中的 AI:看起來終於有了進展。The Bestseller Code(Archer 和 Jockers)於 2016 年 9 月出版,這本書明確指出電腦可以高度精確地解讀文學的質地。

那時我正在密切關注 書籍出版初創公司,其中少數公司在其軟體產品中融入了一些 AI 技術。

再次快進到 2022 年 10 月。

在它成為出版界人人談論的話題的幾個月前,Tim O’Reilly 向 PageBreak 會議展示了「AI 和出版轉型」。O’Reilly 在出版界廣為人知,不僅因為 O’Reilly Media,還因為 Tools of Change 會議。他是科技界的頂尖願景者之一。

O’Reilly 不僅對 AI 的新進展充滿熱情,他還非常激動。「這與我們在 1992 年發現全球資訊網時的感覺非常相似,」他說,並補充說「這和 VisiCalc、個人電腦以及網頁瀏覽器一樣具有變革性。」

他承認(在那時)使用案例仍然模糊,指向 O’Reilly Media 的幾個試點項目。但他說,「這正在以極快的速度變得更好。機器學習不再是未來的事情了。這是關於 AI 的民主化。」

O’Reilly 談到出版商應該如何應對這些新技術,說他們需要「知道何時燒掉船隻,全力投入。有時你必須做出承諾。」

ChatGPT 直到一個月後才發布。PageBreak 是第一個將其置於中心位置的出版會議,通過 Tim 的見解。

披露

這本書有五個贊助商。我在寫這本書時就知道很難找到豐厚的財富,因此我決定通過邀請贊助商參與來支持我的工作。

正如我 在我的網站上 所指出的那樣,作為顧問、分析師和記者,我支持 國際記者聯合會全球記者道德憲章。第 13 段明確規定了避免利益衝突或「將(我的)活動與廣告或宣傳混淆」的義務。

擁有贊助商意味著利益衝突和廣告混淆。如果我在 New York Times 工作,這很簡單:“不行。” 為自己工作,揭露是我滿足這些義務的武器:我會描述我所收到的考量,而你可以在我的工作中判斷我是否已經被妥協。

我選擇邀請這些贊助商參與這個項目,因為我不僅熟悉他們的工作,還熟悉他們組織中的個人。他們是我的同事和朋友。我告訴他們,他們的產品可能會在這本書的文字中被討論,但他們對這些文字沒有任何控制權。他們可以控制的是書末的廣告——我會按他們提供的方式刊登。這正是我所做的。

我從其他人那裡收到的付款可能影響了我在這本書上的工作——我可以列出以下內容:

  • 我沒有為本書中描述的 AI 供應商,包括贊助商,做任何有償諮詢工作。

  • 我從 Publishers Weekly 在 2023 年 9 月的 AI 網路研討會中獲得了一些利潤分享收入。

  • 我的 Publishers Weekly 文章是按標準費率支付的。

如果你發現任何可能由這些參與引起的偏袒,請讓我知道。我對 AI 的偏見在大量財富流入之前就已經形成。

致謝

如果沒有 Publishers Weekly 的支持,包括名譽編輯 Jim Milliot 和 CEO Cevin Bryerman,我就無法以任何可信度談論 AI。Jim 支持我早期關於 AI 的寫作,而 Cevin(以及 Krista Rafanello 和其他團隊成員)對去年秋季會議的成功起到了重要作用,AI 和圖書出版革命。Andrew Albanese 現在是 PW 的執行編輯;Ed Nawotka 是資深編輯。我很幸運能與他們合作。

還要感謝許多同事…

  • Peter Brantley

  • Cliff Guren,長期的辯論夥伴和我草稿的深刻讀者

  • 兩位其他“測試版”讀者,提供了寶貴的反饋:Joe Wikert 和 Brad Farmer

  • 我的 Publishing Technology Partners,Ken Brooks, Bill Kasdorf, Bill Rosenblatt, Bill Trippe, Steve Sieck 和我們最新的夥伴,Lettie Conrad 和 Linda Secondari。

  • 我的姐姐 Anne Pashley,她幫助我保持出版初創公司資料庫的最新狀態,並不斷激勵我的努力。

  • 我的每月 AI 網路研討會的夥伴:Brooke Horn 和 Brian O’Leary 在 BISG。

  • Bill Kasdorf 幫助我深入研究我的書的可及性問題。

  • Peter Armstrong 和 Leanpub 的 Len Epp 耐心處理我的疑問,幫助我在 Leanpub 平台上提供最佳結果。

  • ElevenLabs 的 Hugo Rayne 提供有聲書支持。

  • 我的好朋友和可靠的寫作和推理錯誤檢測者,Bob McArthur。

附錄:探索傳統出版的剩餘優勢

傳統出版的魅力是我們大多數人加入這個行業的原因。我們從小就喜歡書本,上大學時讀了英語或類似的專業,踢踢打打了一段時間,也許在書店找到了一份工作,也許拿到了出版碩士證書,然後在出版公司實習,今天我們就在這裡了。你熱愛你的工作,儘管薪水糟糕,工作條件也不總是愉快的。

同樣的魅力也滋養了出版供應鏈。在供應鏈的輸入端:這對很多作家來說意義重大。我們經常看到這種情況。傳統出版的經濟學毫無意義,並且需要四倍的時間才能印刷出來,但也許,也許,我會成為下一個首發得主,比如 Delia Owens(Where the Crawdads Sing)或第二次成名的巨星 Amor Towles(A Gentleman in Moscow)。

這就像拉斯維加斯:除了內華達州的賠率更高。玩輪盤賭下注一個數字,你的賠率是 36 比 1。玩傳統出版,你的賠率是……更糟糕。

獲得任何一家傳統貿易出版商的合同,遑論五大之一的合同,機會渺茫。但這只是作者問題的最小部分。真正的大挑戰是找到讀者。

有一件事能幫助你,那就是登上暢銷書榜。

讓我們來看看PRH,也就是Penguin Random House。這家公司每年只出版15,000本新書在2021年,他們成功讓196本書登上了*《出版人週刊》*的暢銷書榜。正如鏈接中的文章所強調的:*《出版人週刊》*每年發布四個成人暢銷書榜,每個榜單有20本書:精裝小說、精裝非小說、貿易平裝本和大眾市場平裝本。這意味著一年內,我們的榜單上有2080個精裝本位置和2080個平裝本位置。

並非所有的暢銷書都是當年新出版的——讓我們慷慨地猜測其中90%是新書,也就是1870個位置。

同時,*《紐約時報》*有每週15個暢銷書位置,每本書類別(小說、非小說、兒童書;分別有青少年和實用書榜單;精裝本和平裝本分開,還有綜合榜單)。對於一位作者來說,這意味著每年有780個可用位置,儘管大多數這些位置都是由重複的暢銷書佔據的。(例如Bessel van der Kolk的《The Body Keeps the Score》已經在平裝書榜單上呆了五年半!)所以讓我們將這個數字減半,390個可用位置。你必須賣出大量的書才能佔據其中一個位置。

那麼*《紐約時報書評》的報導呢?在2016年,當時的書評編輯Pamela Paul聲稱《書評》*每年只評論約1%的出版書籍。”顯然,她指的是來自頂級出版商的1%的書籍——她不可能考慮到小型出版社或自出版的作者。因此,PRH的15,000本新書中,可能每年只有約150本被評論。

大多數觀察家同意,雖然得到頂級媒體的關注仍然很重要,並且可能很有影響力,但評論的影響力已經不如從前,原因之一是與主要評論渠道互動的讀者減少了。

讓我們把注意力轉向下游的供應鏈,關注發行。雖然出版商品牌對作者具有影響力,但長期以來,與許多消費品不同,出版商品牌對書籍買家和讀者幾乎沒有影響力。但它們對分銷商和書商非常有影響力。這反映了出版業歷史上的企業對企業性質(而非B2C——對消費者)。出版商的聲譽是通過分銷和零售渠道傳播的:Barnes & Noble因為一本書來自PRH而銷售它,然後將它放在買家的面前;聲譽因此傳播給讀者。

贊助商

一個橫幅,上面寫著'BOOK ADVISORS LLC 為出版商提供交易服務和諮詢'。

David LambSusan Reich於2016年成立Book Advisors LLC,專門為出版業的併購提供諮詢。我們已完成了十多宗交易,以及各種財務、分銷和運營諮詢項目,包括公平市場估值。我們很高興最近與Clarke & EspositoThe Future of Publishing的Thad McIlroy;以及Ku Worldwide的Kuo-Yu Liang合作。

我們以我們的關係、勤勉和謹慎為榮。無論您對購買、銷售、融資還是諮詢感興趣,請與我們聯繫進行保密討論。

bookadvisorsllc.com | bookadvisors@gmail.com

一個3x2的橫幅網格:一個橫幅宣布Papercutz已於2022年8月被Mad Cave Studios收購,與Ku Worldwide LLC合作;一個橫幅宣布DAW Books已於2022年7月被Astra Publishing House收購,與Ku Worldwide LLC合作;一個橫幅宣布Caslon Publishing已於2022年4月被Brookes Publishing Co.收購,與Thad McIlroy合作;一個橫幅宣布B.E.S. Publishing已於2021年11月被Sourcebooks收購;一個橫幅宣布Applewood Books已於2023年4月被Arcadia Publishing收購;一個橫幅宣布Erewhon Books已於2022年10月被Kensington Publishing收購。
Logo of Firebrand Technologies and NetGalley.

Firebrand Technologies 是一家軟體和服務公司,已經為書籍出版社提供數據和工作流程管理解決方案超過 35 年。

NetGalley 是一個線上平台,連接出版社和作者與評論家、圖書館員、書商、媒體和教育者,這些人在 NetGalley 上發現新書並推薦給他們的受眾。

作為軟體和數位解決方案的開發者,Firebrand Technologies 和 NetGalley 也是出版界的專家和活躍成員。我們的解決方案惠及出版過程中的各個方面,從採購到銷售和行銷。

  • NetGalley 幫助出版社為書籍建立聲勢,快速獲得反饋和評論,並發現早期趨勢。

  • Title Management Enterprise 及其輕量版 Title Management Lite 是 Firebrand 的核心軟體應用,提供整個出版過程中的高級出版工作流程管理。

  • Eloquence on Demand 是出版行業中最強大的 ONIX 分發平台,將元數據和數位資產分發給超過 600 個交易夥伴,以 ONIX 和其他格式進行分發。

  • Flywheel 是一項後備書目行銷服務,識別後備書目中的潛在機會,以提高可發現性和銷售。

  • Eloquence on Alert 監控市場中的即時書籍數據和趨勢,並提醒出版社可能影響銷售的關鍵錯誤和機會(缺少購買按鈕、第三方賣家等)。

  • FlightDeck 是目前最先進的 EPUB 驗證和測試工具。

An infographic showing various services offered by NetGalley including book promotion, publishing workflow management, metadata distribution, sales and backlist marketing, and EPUB testing.
Banner for Perfect Bound, a marketplace connecting publishers with printers worldwide.

歡迎來到更好的圖書印刷方式。

Perfect Bound 成立於 2022 年,旨在解決困擾圖書出版行業多年的供應鏈問題。印刷廠的過剩產能期往往會被供應緊張導致的短期延誤所取代。Perfect Bound 希望通過允許全球各地的印刷廠與尋找新動態供應商的出版社輕鬆連接和開展業務,來打開印刷市場的大門。

什麼是 Perfect Bound?

Perfect Bound 是一個雙向市場平台,將美國、加拿大、哥倫比亞、巴西、土耳其、中國、馬來西亞、印度等地的獨立圖書出版社與印刷廠連接起來。

Illustration of a printing press with various types of books and publications being produced.

一鍵發現新的出版夥伴

我們強大的平台讓您可以輕鬆建立產品報價,發送請求給數百家印刷廠,按一下按鈕即可談判並最終確定您的印刷計劃,並從印刷廠到倉庫跟蹤產品。作為印刷商,與新出版社聯繫、競標即將到來的項目和獲得付款從未如此簡單且安全。

即時連接新的出版夥伴

  • 發送和接收來自世界各地的印刷請求

  • 從印刷廠到倉庫執行和跟蹤印刷計劃

  • 通過 Stripe 使用 ACH 付款無縫交易,不需離開平台

An advertisement for Shimmr showcasing automated advertising that sells books, mentioning a 35% uplift in sales and 2x better return on ad spend.
An advertisement for Shimmr with example ads, pricing information, and a QR code to book a demo.

認識 Insight,一個專為出版社打造的 AI 平台

A close-up image of a person holding an open book with glowing elements emanating from the pages.

“採用 Insight 對於我們的出版社來說,就像是把自行車換成法拉利。一瞬間,一切都變得更快了。”

—-德國童書出版社及 Insight 客戶

更聰明地工作,達成更多目標

由 Veristage 開發的 Insight 賦能出版社在不斷變化的人工智慧環境中茁壯成長。利用人工智慧和強大的數位工具套件,Insight 解析並理解您的文件和書籍,以幫助您:

  • 創建、改進和更新 元數據

  • 加快 創建特定書籍的行銷、宣傳和銷售材料

  • 識別和評估 書籍的關鍵訊息、獨特賣點、目標讀者、比較書目等

  • 優化 您的行銷和銷售內容,以達到最大的覆蓋率、參與度和銷售增長

與通用的人工智慧平台不同,Insight 專為在出版工作流程中運行而設計,幫助您創建專門為出版業務量身定制的信息和資產。

運作方式

  1. 將您的書籍上傳到 Insight 平台

  2. Insight 的人工智慧工具解析並理解您的書籍

  3. 幾分鐘內,Insight 生成大量關於您的書籍的元數據和關鍵信息,供編輯、行銷、宣傳、銷售和版權部門使用

  4. 在平台上直接手動編輯這些信息。您的書籍和人工智慧內容會保存在 Insight 中,您可以隨時訪問它們。

  5. 使用我們的文件感知的人工智慧對話來優化您的書籍信息,與您的書籍互動,並將書籍細節整合到通信和其他材料中

安全性與版權

Veristage 團隊致力於提供安全的人工智慧服務,保護出版社的知識產權。我們的平台配備了先進的信息安全系統,並且我們僅使用不存儲或用您的數據來訓練未來模型的人工智慧模型。

適合各種規模的出版社解決方案

Insight 專為各種規模的出版社設計,無論是面向消費者還是學術用途,無論是三人團隊還是跨國組織。我們提供具競爭力的價格和可擴展的解決方案。

與我們聯繫,了解 Insight 如何為您的業務帶來利益:

Veristage 的藍色標誌,帶有抽象設計。