出版業界におけるAI革命 (日本語版)

Thad McIlroy

はじめに
- これは本か？
- AI自体に対する出版社の苦痛
- あなたが知る必要があることだけでしょうか？
- この本は誰のためですか？
- 広義と狭義の両方のアクセシビリティ
- 一部の事務連絡
なぜ今AIなのか？
AI: はじめに
AI: 非常に簡単な歴史
AIの理解といくつかの重要な用語
- プロンプトとプロンプトの作成
- 大規模言語モデル（LLM）
- 生成AI
- 生成事前学習型変換器（GPT）
- ChatGPT
- コーパス
AIソフトウェア：システムの重量級
- ソフトウェアのパラダイム
- 3種類のAIソフトウェア
AIソフトウェアの使用方法
チャットAIのトレーニング
- プロンプトの方法
幻覚：軟膏の中のハエ
- ファクトチェック
画像やビデオについてはどうですか？
書籍出版社向けのソフトウェア
- 書籍出版のためのビジネスソフトウェア
- 出版社向けAIソフトウェア：スタートアップ
AIとブックパブリッシング：業界は現在何をしているのか？
AIとブックパブリッシング：出版会社は何をしているのか？
AIと書籍出版: 使用例
- AIが本を読むとどうなるのか？
- AIと本のデザインと制作
- AIと本のマーケティング
- AIとメタデータ
- メタデータにおけるAI使用の宣言
出版業務へのAI統合戦略
- AIポリシーの策定とコミュニケーション
- 職務に関する考慮事項
オーディオブックのためのAI
本の翻訳のためのAI
学術出版におけるAI
著者のためのAI
AIに関する懸念とリスク
- 著作権侵害？
- 著作権とAIに関する著者向け情報
- 長期的な影響は？
- AI企業へのコンテンツライセンス
- AIを避けるのは手遅れ
- 著者がAIを使用する時
- AIは文章中で検出できるか？
- 失業
- 教育
- 検索の未来
- アマゾンのジャンク本
- 偏見
創造性は陳腐なものになり得る
もう一つの考え
出版以外の素晴らしいこと
- AIと医学
- 空港でのAIとTSA
エッセイ：AIが出版業界に与える影響
- AIの実世界の影響
- 出版業界の経済的衰退は数十年続いています
- 出版業界の給与
- 伝統的な書籍出版社の残る三つ（と半分）の利点
- 自費出版
- ハイブリッド出版社
- 出版社を超えた出版
- イノベーション、技術、書籍出版
- イノベーターのジレンマ
- フィクション対ノンフィクション
- 著者にとっての存在的脅威はあるのか？
- 本には宝物が含まれている
- 複数のメディアにおけるコンテンツコンテナ
- コンテナサイロ
- 発見とコンバージョン
- 著作権の未来
- 著者と読者
- AIがコミュニケーションできる
結論
単一のリソース
サイドノート：この本を書くための資格
- 開示
- 謝辞
付録：伝統的な出版の残る利点の探求
スポンサー

はじめに

“次の革命はいつも通り、私たち全員を不意打ちにするでしょう。言い換えれば、群衆が革命を予測しているなら、それは革命ではない。” —Doc Searls, 2002年

OpenAIがChatGPTを一般に紹介してから1年半以上が経ちました。当初は、人工知能が本の出版に明らかに関連しているとは思われませんでした。しかし、それ以来、すべてが変わりました。そして何も変わっていません。出版社は新しいAIツールに飛び込み、その境界を探り、ChatGPTと慎重に対話を始めています。しかし、出版の実践における真の革命の兆しはありません。それはまだ早すぎるのです。

AIが執筆と出版に与える影響については、多くの不確実性があります。AIの使用に関しては大きな論争が巻き起こっています。それでも、多くの人々にとっては可能性に対する興奮があります。

ここでは危険よりも約束に焦点を当てますが、特に作家や出版社に関連するAIに関する懸念やリスクの概要も含めています。懸念を軽視するつもりはありません。ただ、それがこの本の主題ではないのです。

これは本か？

この出版物は「本」よりも「小冊子」に近いと考えています。UNESCOの定義では、本は「少なくとも49ページ」ですが（なぜ50ページでないのか？）、1ページあたり300語で計算すると、この小冊子は基準を満たさない可能性があります。しかし、もっと重要なのは、これは何かの決定版を目指しているわけではなく、進捗報告書のようなものだということです。人工知能とその出版における役割は目まぐるしく変化しており、その変化の速度は遅れる兆しがありません。この本（小冊子）、この報告書はただのスナップショットに過ぎません。

Leanpubプラットフォームを使用して、進行中の作業として研究と分析を発表しています。これは初めての試みです。理由は二つあります：短期的に役立つものを提供するためと、必要に応じて改訂できるようにするためです。AIの物語はまだ終わっていません。

私のアプローチが読者にとって有用であることを願っていますが、あまりにも多くの更新がすぐに煩わしくなる可能性があることも認識しています。この本のトピカリティを減らし、最も速く変化するものに焦点を当てないように努めました。

2024年4月から（静かに）提供されているバージョンは「75％完了」とマークされ、読者に無料で提供されました。「100％完了」バージョンの公式発行日は7月23日で、Leanpub以外の広範な流通にも移行する予定です。100％バージョンの更新は続けますが、その更新はLeanpubの購入者のみが利用可能です。印刷物、電子書籍、オーディオブックを頻繁に更新するのは煩雑だからです。

AI自体に対する出版社の苦痛

出版社業界全体で毎日、人々がAIに馴染むために直面している苦痛について聞いています。なぜそれがこんなに苦痛なのでしょうか？私が見ている理由は3つあります：

テクノロジーが複雑で神秘的であり、非科学者には理解できないほど複雑です。（興味深い研究によると、AIに対する不安感を測定する「AI不安尺度（AIAS）」が21の異なる理由を測定しています。）
AIは主に著作権の問題のために出版において非常に論争の的となっています。これは著作と出版の核心に触れる問題です。
それでも、FOMO（取り残される恐怖）の雰囲気があります。多くの魅力的な技術（Apple Watchやスマートスピーカーなど）と同様に、AIの多くの欠点にもかかわらず、過去の大きな出来事を見逃したように感じると、その次に来る本当に大きなことを見逃しているのではないかという不安があるのです。その時は愚かだと感じました。もう一度愚かだと感じたくありません。それは痛いのです。

わかりました：出版業界の人々がAIの痛みを感じるのは当然です。

では、この本のユースケースは何ですか？

この本のユースケースは、あなたが出版業界で働いているか、または出版業界をよりよく理解しようとしている著者であり、AIに関して愚かで混乱していると感じるのにうんざりしているということです。多くの同僚があなたよりもそれをよく理解しているように見え、あなたはそのトピックについて知的に関与できないことにうんざりしています。

この本を読むことで、読者が会話に参加し、情報に基づいた意見を表明できるようになることが私の目標です。私はあなたが技術に関する個人的な選択をするための準備が整い、必要に応じてAIの使い方を学ぶための道を持っていると感じてほしいのです。

私は読者にAI技術の基礎についてのたくさんの無駄話を inundate するつもりはありません。抽象的なAIについてあまり話すつもりはありません。代わりに、私は特に書籍の執筆と出版に関連するAIの基礎を提供したいと思います。もし誰かが、「自然言語処理とは本当に何を意味するのか」と尋ねたら、私のように答えることができます：「私はAIの専門家ではありません。しかし、私の業界でAIがどのように使用されているかは知っています。」

あなたが知る必要があることだけでしょうか？

私は「あなたが知る必要があること」というフレーズが嫌いです。なぜなら、それはほとんどの場合、期待に応えず、必要以上または必要以下の情報を提供することが多いからです。私は正確に伝えることができるでしょうか？私は真剣に最小限を伝えることを目指しています。私は出版社がAIについて知る必要があることを知っていると思います。私は多くの出版社と話し、非常に具体的に基本を提供するために設計されたセミナーやウェビナーを開催してきました。

「あなたが知る必要があること」というフレーズを繰り返す代わりに、キーのロゴとインデントされたテキストを使用します。

多くのセクションを紹介する要約の後、主要な概念を詳述します。それでも、これらをできるだけ短く保つようにしましたが、実際のところ、時々長くなってしまうこともあります。

私が使用する短縮形は「チャットAI」です。OpenAIがChatGPTを最初にリリースしたとき、それは唯一の存在でしたが、現在ではいくつかの重要な競合他社がいます。具体的なことについてはすぐに詳述しますが、GoogleやMicrosoftなど、いくつかはすでにご存知でしょう。彼ら（およびその他のいくつかの会社）は現在、ChatGPTに似たオンラインAIチャットソフトウェアを提供しています。したがって、「ChatGPTとその競合他社」と言う代わりに、「チャットAI」というカテゴリー全体を指します。私が「ChatGPT」と書くとき、それは特にOpenAIのソフトウェアを指します。

この本は主に実用的なものですが、最後のセクションではAIが出版業界に与える現実の影響についてのエッセイと、いくつかの推測的な考察を提案します。

この本は誰のためですか？

この本の主な読者は、一般書（消費者）出版社です。二次的な読者は、これらの業界セクターに重複がある程度まで、他のすべての出版社（学術、教育など）です。私の第3の読者は、ゲームに関心のある著者と、出版業界に興味を持っている多くの人々です。

このサブタイトルは、作家と出版社の両方のためのAIガイドであることを示しています。部分的には、出版社にも作家がこの技術を使って何をしているのか理解してもらいたいからです。それが重要だと思います。最近の年次総会で、主に商業出版社を代表するBISG（ブック・インダストリー・スタディ・グループ）は、「文学エージェントや著者を含む、より広範なプールからの引き出しを目指している」と述べています。（参照元）これは歓迎すべき動きです。

私は作家にこの本を読んでほしいと思っています。なぜなら、出版社が彼らの原稿で何をしているのかを理解するのに役立つからです。自費出版の作家は常に伝統的な出版に目を向けており、一部には彼ら自身が事実上の出版社だからです。そのため、出版社にとって興味深いAI技術は、彼らにとっても興味深いものとなります。

しかし、誤解しないでください。これは作家がAIを使用してより良く、より生産的な作家になるためのハウツーではありません。そのトピックに関する本は多数存在します（残念ながら、その多くは詐欺的なAmazonの模倣品です）。そして、多くのYouTube動画もあります（質はさまざまです）。

商業書籍出版の中で、私の理想的な読者は必ずしも意思決定者ではなく、毎日業界全体で働き、本を作り、読者を見つける多くの人々の一人です。この本では、編集から販売、流通に至るまで、すべての重要な出版機能について話します。そして、作家と読者の交差点についても話します。

私はカナダで育ち、そこで出版キャリアを始めましたが、現在はアメリカ合衆国のサンフランシスコを拠点に活動しています。そのため、アメリカの出版業界について考えるのが基本です。しかし、この小冊子の内容は、マダガスカルの出版社にとってもマンハッタンの出版社にとっても同様に関連性があるはずです。小さな国の出版社が規模の問題に直面するように、アメリカの小さな出版社も同様です。この本は、すべての規模の会社を対象としています。

小規模な出版社とAIについて話すとき、大規模な出版社とAIについて話すとき、私が気付く大きな違いは「出版企業」という概念です。最大の出版社は多くの場合、上場企業の一部（または隣接）であり、一度上場企業になると、評判やセキュリティに関する問題は、株主やニュースメディアに対して同じように責任を負わない日常の出版社よりもはるかに大きくなります。大手5社の出版社の編集者が小さな出版社のフリーランス編集者と同じようにAIツールを使用する場合でも、そのツールを使用する文脈は大きく異なります。

この本を読むためにどれくらいのAI知識が必要ですか？

私は読者がAIの内部についてほとんど知識がないことを前提としていますが、彼らが賢い読者であることを前提としています。したがって、ゼロ知識と読者に対して上から目線にならないことの微妙なバランスを取ろうとしています。

ほとんどの人が新世代のAIについて聞いたことがあると思います。2024年3月のYouGovの調査によると、アメリカ人のわずか7％が「AIについて全く知らない」と答えています。作家や出版社は著作権に関する苦情を聞いたことがあるでしょうが、その問題を把握していない可能性が高いです。したがって、AIが「人工知能」の略であることを説明する必要はありません。しかし、読者がAIとは何か、それが何を意味するのか、その潜在的な影響などを定義できるとは思っていません。それがこの本を読む理由です。

広義と狭義の両方のアクセシビリティ

この本の出版に関する私のモットーは「アクセシビリティ」です。

ほとんどの人にとって、それは単に「利用可能性」に近いものを意味します。実際、私はこの本をできる限り多くの形態とフォーマットで提供する予定です。コンテナを拡張したいと考えています。私はこの本を今日の単一の本を出版する際に達成できるすべてを示す模範的な出版物にしようとしています。

Leanpubでは、PDFファイル、EPUBファイル、無料のウェブベースの出版物として本を入手できます。主要なアジア言語およびヨーロッパ言語を含む31の言語に翻訳されたものを見つけることができます。主要な言語で複数のオーディオブックも提供される予定です。

また、この本を印刷形式とデジタル形式の両方で、IngramとAmazonを介してアクセスできるすべての電子商取引プラットフォームで提供します。それには、多くの世界中のオンライン書店が含まれます。この方法で、図書館もこの本を購入できるようになりますが、理解できるように、自費出版作品のためのスペースはわずかです。（この本の印刷版とデジタル版を世界中のどの図書館にも寄付します。）

本書の無料ウェブ版に加えて、無料の抜粋、Q&A、インフォグラフィックも作成します。これらは私のブログで提供されます。これは、少しだけ試してみたいという人々のためのものです。

オーディオブックが利用できる時に、全書のビデオを録画するのは意味がありません。しかし、一部の人々はビデオでコンテンツにアクセスするのを好みます。したがって、複数の長さの要約ビデオバージョンを提供します。

そして、人間的な触れ合いはどうでしょう？ウェビナーや一対一のオンライン相談を通じて、私のウェブサイトやブログ経由で私と直接やり取りできるようにします。場合によっては、対面での相談も可能です！

「アクセシビリティ」とは辞書の定義以上の意味を持ちます。カナダ全国公正図書館サービスネットワーク（NNELS）の人々が言うように、「アクセシブルな本とは、誰もが使用し理解できる本のことです。」そのため、私の英語のEPUBファイルは、印刷障害者のためのW3C 1.1推奨事項に準拠しています、画像のための堅牢な代替テキストの説明を含んでいます。私たちは、外国語翻訳についてもこのアクセシビリティ基準を満たすことを期待しています。

代替テキストはChatGPTで作成されました。ChatGPTのバージョンを編集せずにそのまま使用したので、EPUBを読んでいる人がその品質を確認し、不足している点を見つけられるようになっています。同僚のBill Kasdorfが教えてくれたように、良い代替テキストは、視覚読者が画像から得るものを説明するものであり、単に見た目を記述するものではありません。

書籍出版者にとって、アクセシビリティはもはや選択肢ではなく、デフォルト設定です。

（2つのお詫びを共有します：出版プラットフォームの制限により、デフォルトのPDFファイルは残念ながらPDF/UA規格を満たさず、また電子商取引サイトで大文字版の本を提供することはできません。しかし、どちらもリクエストに応じて提供可能です。）

一部の事務連絡

前述の通り、この本は（比較的）短いです。「短めのドキュメント」を「本」と呼ぶと、「本を買ったと思ったら、たった50ページのものだった！」と不満を言う買い手がいるリスクがあります。販売ページでこれがフルレングスの本ではないことを明確にするためにあらゆる手段を講じましたが、それでも失望する場合、Leanpubは60日の返金保証を提供しており、私はその返金オファーを「永遠に」延長します。読者には喜んでいただきたいので、失望させたくありません。（他のプラットフォームで本を購入した場合は、私にメールしてください。小切手を送ります！）

この本には多くのハイパーリンクが含まれています（これらはフォーマットによって異なりますが、多くの場合、脚注として表示されます）。私は常に、自分の仕事において原典にリンクすることを信じてきました。読者が私の時には大げさな主張を検証できるようにです。しかし、ハイパーリンクや脚注は特に電子リーディングデバイスを使用している場合、分散させることがあります。申し訳ありませんが、読みながらリンクを無視し、トピックを深掘りしたい場合に戻るのが最善です。

どのフォーマットで本を読んでいる（または聞いている）のか、またどの言語で読んでいるのかは分かりません。本の「エルゴノミクス」を可能な限りユーザーフレンドリーにしようとしましたが、リンクと脚注はその観点から必ずしも最適ではありません。

この本にはスポンサーがいます。これは「本」には珍しいことですが、スポンサーシップがどのように機能するかについては、テキストの最後にある「開示」セクションで説明しています。

なぜ今AIなのか？

出版社と話すと、緊急かつ差し迫った懸念があると聞きます。そして、AIは通常その一つではありません。

印刷製造コストの上昇が数年間悩みの種でしたが、現在では安定してきたようです。配送コストの増加はすべてのプレイヤーにとって挑戦です。これらは価格圧力を引き起こし、新しいハードカバーやトレードペーパーバックの現在の価格に読者が不満を感じ始めている証拠があります。私はこれらを「アナログ」問題と分類しています—デジタル技術はこれらの問題に対処するためにあまり役立ちません。

次に、ますます懸念されるが未解決の「存在的」問題があります。これには明確な解決策がありません。ここには以下のものが含まれます：

オンラインおよびソーシャルメディアを通じたコンテンツ発見とオーディエンスエンゲージメント。
消費者行動と読書習慣の変化。
他のデジタルメディアとの競争。

これらの分野でAIが出版社に非常に役立つと私は信じていますが、方法は明確ではなく、実装に時間がかかるでしょう。これについては本の後の章で説明します。

AI: はじめに

退屈な技術的背景に入る前に、オンラインソフトウェアを直接使ってみることをお勧めします。トップツールは無料で試すことができます。ChatGPTやClaude.aiがあります。Microsoft Copilotで遊んだり、Google’s Geminiを試してみることもできます。

ほとんどの人がAIを始める方法はこれです—おそらくあなたもすでにこれらの玩具のいくつかを試したことがあるでしょう。そして、多分長くは試していないのではないでしょうか。私が話をするほとんどの人は、ほんの数分だけを費やします。いくつかの質問を試し、かなり明白な答えを得て、そして次に進みます。

間違ったアプローチです。

私はEthan Mollickの側に立っています。彼の仕事についてはこの本で何度か紹介します。彼のブログや最近のインタビューで、Mollickは彼の「10時間ルール」について話しています：

「私は10時間が10,000歩と同じくらい恣意的であることを示したいと思います。つまり、それには科学的根拠はありません。これは観察結果です。しかし、それはまた、一晩だけ試してみたという段階を超え、真剣に使う方向に進むことを意味します。10時間が本当の限界かどうかは分かりませんが、それは多少変革的であるようです。重要なのは、自分が専門知識を持つ分野で使用することです。そうすれば、何が良いのか悪いのかを理解し、その能力の形を学ぶことができます。」

別の評論家、Mollickの最近のAIに関する本をレビューしている評論家は、同じく真実な「10の法則」を指摘しました：「これらのツールを1時間実験することは、それについて10時間読むことに相当します。」

お分かりいただけると思います。これは考えることではなく、実行することです。私の本は考察です。あなたは手を汚さなければなりません。

AI: 非常に簡単な歴史

数年前までは、一般の人々がAIについて聞いたことがあるのは、科学フィクションとしてか、チェスや囲碁でグランドマスターに勝てるものとしてでした。突然、AIは至る所にあり、それが新しいものであるという誤った印象を与えています。新しいものですら、正確には新しいものではありません。しかし、それは重要な点ではありません。ChatGPT以前は、AIは本の出版にとってほとんど意味がありませんでした。今では大いに意味があります。

約70年間のAIの発展を理解することは魅力的ですが、今日の出来事を理解するためには必要ありません。

Our World In DataはAIの歴史を簡潔に記録しています。彼らに任せましょう。

現在のAI世代は、主に過去10年間で開発されました。そして突然、ChatGPTが2022年11月30日に登場しました。2ヶ月後には月間1億人のユーザーを獲得し、これは消費者市場に最も速く浸透した技術となりました（比較すると、Facebookが1億ユーザーに到達するまでに2年以上かかりました）。

なぜこれほど急速に普及したのでしょうか？第一に、面白くて楽しいからです。第二に、無料だからです。第三に、新しいデバイスを購入する必要がないからです。そして第四に、ChatGPT（およびその競合チャットAI）を利用するためのトレーニングは必要ありません。しかし、これらの要因はFacebookにも当てはまります。それでは、なぜChatGPTなのでしょうか？

アーサー・C・クラークが有名にしたように、「十分に発達した技術は、魔法と見分けがつかない。」チャットAIは魔法です。機械と日常言語で「話す」体験…それはまさに魔法のようです。「雲の中の気球に本が浮かんでいる画像が欲しい」と言い、数秒後に

…これも魔法です。GPT生成の画像は、スタイルが似ていて、カラフルで空想的です。そこで、次のプロンプトを送りました。「今度は15世紀のイラストのようなスタイルで」と。そして：

日当たりの良い雲の中の気球に本が浮かんでいる動画が欲しい場合、選ぶべきツールは十数種類あります。そして、音楽のサウンドトラックを動画に付けることもできます。どうでしょうか？まるで魔法のようです。

AIの素晴らしい能力を「不可解な魔法」のカテゴリーに押し込むことで軽視しているように見えるのを避けるためにも、現在のAI世代を担当している多くの科学者がそれが正確にどのように機能するのか本当に理解していないことを知るのは面白いことです。最近のMIT Technology Reviewの記事では、「その大成功にもかかわらず、誰も正確にどのように、なぜそれが機能するのかを知らない」と報告されています。興奮しますが、少し怖いですね。

AIの理解といくつかの重要な用語

AIにはデータサイエンティスト以外には理解しがたい多くの技術や用語が含まれています。チャットAIのユーザーは、AIの用語や関係する技術的概念の深い知識を必要としません。このシステムの会話的な性質は、専門的な知識がなくても直感的なやり取りを可能にします。チャットAIが実際に何ができるかに焦点を当てることがより重要です。

この本を準備するにあたって、AIについての本の著者として「責任ある」行動とは何かについて悩みました。従来のアプローチは、科学の短い説明と頻繁に使用される用語のレビューを提供することです。

私はそれをしません。

ここでは、AIの基本に関する比較的理解しやすい短い説明へのいくつかの外部リンクを提供します。

AIの未来はどうなるか？：マッキンゼー・アンド・カンパニー（2024年4月）は良い説明集を持っています。

同様に、ガートナーのGenerative AI（日付なし）も悪くありません。

FuturepediaはAI Fundamentalsのまあまあの概要を提供しています（2024年5月）。

使い方を説明したので、ここで理解しておくと価値があると思ういくつかの用語を紹介します。ソフトウェアを使うために知る必要があるわけではありませんが、この一連の用語は、現在のAIが実際にどのように機能しているかの重要な側面を参照しています。

私がこれらの用語と概念に取り組む目的は、(i)何らかの理由でAIについてもう一段深く理解したい作家や出版者、(ii)現在のAIに対する批判の文脈を理解したい人、(iii)同僚や組織がAIにどのように取り組むべきかについての戦略的な議論に貢献したい人を対象としています。

つまり、これは知る必要があることではなく、知っておくとよいことです。ここでは、アルファベット順ではなく紹介します：

プロンプトとプロンプトの作成

Chat AIソフトウェアを開いて、現在Googleで行っているように質問を入力することができます。

大規模言語モデル（LLM）

大規模言語モデルは、大量の（主に）書かれた資料を分析することで機能し、会話や文章の次に来るべき言葉や文を予測します。人間の意味で言語を「理解」するわけではなく、テキストをトークンと呼ばれる小さな単位に分解し、それを数値に変換して処理します。テキストを数値として処理し、さらに数値を生成し、それを出力時に再びテキストに変換します。これは、Chat AIが著作権で保護された作品を「含む」わけではない理由の簡略化した説明です：それは、基礎となるテキストからの巨大な抽象化を表す数値で構築されています。

LLMは、言語が通常どのように使用されるかを学習し、その理解に基づいて応答を生成します。私たちは、ほとんどの言語がどれほど予測可能であるかを過小評価しがちです。Chat AIは、既存の文学に（時には驚くほど）似たテキストを生成することができますが、設計上、特定の抜粋や著作権で保護されたテキストのコピーを取得する能力はありません。（ニューヨーク・タイムズがOpenAIに対して提訴したことを多くの方が聞いたことがあると思います。タイムズは、ChatGPTに以前に発表された記事の一部をそのまま再現させることができました。）

生成AI

この用語を理解する上で最も重要なのは、「生成」部分です。生成AIは新しいテキストを生成します。

生成事前学習型変換器（GPT）

これはここで紹介する用語の中で最もオタクっぽいもので、OpenAIによって開発された特定のタイプのLLMを指します。「生成」はテキストを作成する能力を意味し、「事前学習」は大量のテキストデータで学習されたことを示し、「変換器」はそれが使用するソフトウェアを指します。GPTが何を意味するかを知っておくことは、ChatGPTのGPTが何を表しているかを理解するために有用です。

ChatGPT

ChatGPTはユーザーが見るソフトウェアであり、GPTはその背後にあるものです。ユーザーはChatGPTを体験し、その背後にあるGPTを体験するわけではありません。前述の通り、ChatGPTは類似の機能を持つ複数のChat AIオンラインソフトウェアシステムの一つに過ぎません。

もう一つ、多くの人にとって馴染みのない用語があります：

コーパス

辞書の定義によると、コーパスは「書かれたテキストのコレクション」です（実際には必ずしもテキストではありませんが）。この用語は、GPTが訓練されるものに関連して使用されます：大量の（主に）テキストのコーパスです。最大のコーパスには数千億の単語が含まれていると言われています。一般人にはそれは理解しがたいものです。Wikipediaを膨大な数の単語を含む巨大なものとして考えませんか？Wikipediaにはわずか45億語しかありません—GPT-4は1兆をはるかに超える単語で訓練されました。

この規模を考慮することは重要だと思います。著者たちは、自分たちの本の75,000語が、大規模言語モデルに吸い込まれたのではないかと心配しています。おそらくその通りでしょう。しかし、仮にそうだとしても、今日の大規模言語モデルの総合力に対して、1冊の本が持つ価値がいかに少ないかを考えてみてください。それは本当に取るに足らないものです。取るに足らないどころか、10,000冊の本でも微々たるものです。

AIソフトウェア：システムの重量級

先に挙げた4つのChat AI重量級：ChatGPT、Claude.ai、Microsoft Copilot、Google Gemini。

これらはほぼ同じように機能し、似たような結果を提供します。では、どれが一番良いのでしょうか？それを問うと、まるでどの町が最高のビーチバケーションを提供するか、どのSUVが家族向けに最適かを尋ねるようなものです。問題には多くの微妙なニュアンスがあり、私たちの回答には多くのプライドや偏見がフィルタリングされています。

この一見シンプルながら非常に複雑なソフトウェアも同様です。Claudeが言語に関する微妙なスキルを持っていると主張する人もいれば、ChatGPTがソフトウェアコードに優れていると言う人もいます。Microsoft CopilotはMicrosoftのソフトウェアスイートと統合されています。Google GeminiはGmail、Google Maps、YouTubeに接続できます。これらの違いのいくつかは意味がありますが、多くはわずかです。そして、それらは新しいソフトウェアリリースごとに絶えず変わります。

‘最高の’ ソフトウェアは当分の間、決定されないでしょう。利用可能なツールを十分に試してみれば、お気に入りが見つかるでしょう。

AIソフトウェアには2つのトップティアがあります。1つ目は、ChatGPTやその競合他社（Chat AI）のような基盤ソフトウェアです。これがほとんどの人が今日AIを体験する方法です。

次のティアは、基盤ソフトウェアを実質的に窓口として提供するその他のソフトウェアです。AIチャットの新参者はこのソフトウェアに出会ったことがないかもしれませんが、それは珍しいものではありません。Jasper（マーケティングソフトウェア）やPerplexity（検索）に馴染みがある人もいます。このソフトウェアは、ChatGPTやその仲間がなければ存在し得ません。

Adobe、Microsoft、Grammarly、Zoomなどの主流ソフトウェアにはAIツールが組み込まれていますが、これはチャットボットインターフェースに基づいてゼロから構築されたソフトウェアとは異なります。（Otter（トランスクリプション）のように、ChatGPT以前から存在しているが、大規模言語モデル技術が組み込まれているものもあります。）

以下では、生成AIの能力を活用した出版専用のソフトウェアを見ていきます。

ソフトウェアのパラダイム

かつて、ソフトウェアはコードであり、それがどのように動作するかを理解していたのはエンジニアだけでした。パーソナルコンピュータが成功した理由は、その比較的低価格に加えて、（比較的）使いやすいソフトウェアがあったからです。これらについてあまり考えることはありません。それはただ私たちを取り巻いているのです。

しかし、Microsoft Wordについて考えてみてください。この本の読者の99%が使用していると安全に仮定できるプログラムです。Wordでテキストの段落を書く方法を教えるのに約10分かかります。その後、太字テキストの作成方法、イタリックの作成方法、基本フォントの変更方法、たとえばCalibriからArialやTimes Romanへの変更方法を教えます。次に、ファイルの保存方法と印刷方法、検索と置換の方法を教えます。

そして、彼らを放っておきます。

数年後、彼らがまだスペースとタブでWordの段落をフォーマットしていることがわかります。そしてまだファイルの保存を忘れていたり、保存したバージョンについて混乱していたり、時にはテキストを最初から作り直さなければならないこともあります。しかし、彼らは「Wordの使い方を知っている」と言います。

Wordには何百もの機能がありますが、ユーザーが3分の1の時間しか使わないコマンドは5つしかありません：貼り付け、保存、コピー、元に戻す、太字です。Wordの高度な機能を適切に学ぶには数週間のトレーニングが必要です。出版社が何百時間も節約できる機能もあります。しかし、ほとんどの人はそれをしません。私は1985年から、ほぼ40年間Wordを使っていますが、コースを受けたことはありません。ソフトウェアの完全な力を引き出す方法について何も知らないことさえ知りません。

私はこの話を続けていますが、それはAIソフトウェアがこれまでに扱ったどのソフトウェアとも非常に異なる理由を理解するための助けになるからです。マニュアルも、クイックスタートガイドさえも付属していません。表示されるのは空白の画面と一つの質問だけです：「何をお手伝いできますか？」

タデウスに向けられた会話型AIインターフェースのウェルカムメッセージが、どのようにサポートできるかを尋ねている。

メニューバーも、押すボタンも、キーボードショートカットもありません。質問をしたり、チャットを始めたりすると、いくつかの答えが返ってきます。

会話型AIインターフェースで、新世代の会話型AIとMicrosoft WordやExcelのような従来のツールの違いを説明する方法を尋ねるユーザー入力。

Claudeの回答:

「私のような最新の会話型AIとMicrosoft WordやExcelのような従来のツールを使うことには、いくつかの重要な違いがあります：

「1. 自然言語インタラクション: 会話型AIでは、複雑なメニューや機能を学びナビゲートする必要はなく、日常の言葉を使って意図を伝えることができます。会話形式でやりたいことを説明するだけで済みます。

「2. コンテクスト理解: AIアシスタントは会話の流れを理解し、コンテクストを維持します。これにより、より自然なやり取りが可能になります。従来のソフトウェアはコマンドごとにコンテクストを持ちません。

「3. 適応性: AIは様々なリクエストに動的に対応できるのに対し、従来のツールはあらかじめ定義された機能に制限されています。AIアシスタントは執筆、分析、数学、コーディング、アイデアの創出など、単一のインターフェースで様々なタスクを手助けできます。」

それは役に立ちましたが、もっと簡単に理解できるものが欲しかったので、次のように尋ねました：

Claude:

「技術的な背景を持たない人に違いを説明するための簡単な方法は次の通りです：

「伝統的なソフトウェアであるMicrosoft WordやExcelを、ハンマーや電卓のようなツールと考えてください。それは固定された機能のセットを持ち、望む結果を得るためには正しく使い方を学ぶ必要があります。

「一方、最新の会話型AIを知識豊富な同僚や友人のようなスマートアシスタントと考えてください。普通の英語を使って話しかけるだけで、それがあなたのやりたいことを理解します。それは執筆から数学、アイデアの創出まで、あらゆるタスクを手助けしてくれます。

「特別なコマンドや技術を学ぶ必要はありません。自然にチャットするだけです。それはあなたのニーズに適応し、会話のコンテクストを覚えます。時間が経つにつれて、それはあなたとあなたの好みを理解するようになります。

「従来のソフトウェアが使うための静的なツールであるのに対し、会話型AIは自然にやり取りしながら物事を進めるインテリジェントなパートナーのようなものです。それはより柔軟で、個人に合わせた効率的な作業方法です。」

うーん。私が望んでいたものとは少し違います。そこで、会話を続けました：

技術用語や非技術者が理解できないリファレンスを避けるよう助言する会話型AIの応答。

Claude:

「わかりました。技術用語を使わずにもう一度試してみます：

「想像してみてください。非常に知識豊富で助けたがりの友人と話しているとします。エッセイを書いたり、数学の問題を解決したり、プロジェクトのアイデアをブレインストーミングしたりすることについて、ただ普通の英語で話しかけるだけです。

「特定の手順やコマンドを学んで覚える必要はなく、自分の言葉で何が必要かを説明するだけです。その友人はコンテクストを理解し、これまで話し合った内容に基づいて助けを適応させます。

「それは、質問をしたり、物事を明確にしたり、アドバイスを求めたりすることができる、行ったり来たりの会話です。そして、この友人と話せば話すほど、彼らはあなたの独自のニーズやコミュニケーションスタイルをよりよく理解します。

「さて、もしその同じ種類の役立つ、簡単なやり取りをコンピュータプログラムとできたらどうでしょう。それが、あなたが耳にするかもしれない新しいタイプのソフトウェアの基本的なアイデアです。

「古いスタイルのソフトウェアの代わりに、決まった機能のセットがあり、それを正しく使う方法を学ばなければならないこの新しいソフトウェアは、知識豊富な友人のようなものです。普通に会話するだけで、あなたの話の自然な流れに基づいて、どのように助けるかを理解します。

「つまり、コンピュータ上のさまざまなタスクを人と話すように話すだけで助けてもらうための、よりスマートで、よりパーソナルで、より簡単な方法です。これが、古くて厳格なスタイルのソフトウェアとの大きな違いです。」

要約：これらの例を使って2つのことをしようとしていました。1つは、チャットボットソフトウェアがこれまでに使ったどのソフトウェアとも異なる理由を簡単に示すこと。そしてもう1つは、1つのチャットがどのように進化するかを示すことです。それは単なる1つの質問と1つの答えではありません。それは会話です。これが大きなブレークスルーの一部です。

チャットAIは、インターンと知識豊富なコンサルタントの組み合わせのようなものです。彼らがあなたの意味を理解しているとは限りません。あなたが何を望んでいるのか、なぜそれを望んでいるのか、そして彼らがどのように最も役立つかを説明する必要があります。

3種類のAIソフトウェア

大まかに言えば、現在利用可能なAIソフトウェアには3種類あります。1つ目は、ChatGPTのようなAI基盤プラットフォーム、コアAI技術です。2つ目は、AI追加機能と呼べるもので、コアプラットフォームの上に新たに構築されたソフトウェアです。これらの多くは聞いたことがないでしょう。例えば、JasperやRewindのようなツールです。

私の3つ目のカテゴリーは、既存の製品にAIツールが追加されたソフトウェアです。例えば、マイクロソフトスイートのソフトウェアには、Word、Excel、PowerPointに新しいAIツールが搭載されています。アドビはフォトショップやアクロバットにAI技術を追加しました。グラマリーは、新しい世代のLLMベースの技術を中心に再構築されています。ほとんど同じ製品ですが、AIが追加されています。

現在使用しているほぼすべてのソフトウェアが、すぐにAI機能を組み込むことが明らかになっています。これらのツールが本当に役立つかどうかを自分で評価する必要があります。

私は、AIによってのみ生み出される価値を提供するためにゼロから構築された新しいツールにもっと興味があります。それが次世代のソフトウェアです。

AIソフトウェアの使用方法

私は残念ながらWindowsユーザーです（理由は長い話です）、ですので、Windowsコンピュータを通じてAIソフトウェアにアクセスする私の経験について話しています。ここで紹介するすべてのソフトウェアはブラウザベースなので、これらのツールをMacで使用することに違いはないはずです。しかし、保証はしません。

AIゲームを楽しむには、多少のお金が必要ですが、それほど多くはありません。上記のように、多くの基盤ソフトウェアは無料版でアクセスできます。ただし、テスト中は通常、有料のサブスクリプションが必要であり、サブスクリプション料金は約20ドル/月です。試した後はキャンセルしてください（忘れないように！）。もし79ドル/月や、恐ろしいことに159ドル/月のものを見かけたら、それは無視して構いません。彼らはあなたを潜在的なユーザーとして考えていません。彼らは大規模な主流の企業ユーザーを考えています。

チャットAIのトレーニング

今日のAIは一見すると簡単です。質問を入力できる人なら誰でも使用できます。しかし、それをうまく使うのは複雑で、これは「プロンプト」や関連する概念の複雑さに飛び込むまで理解できません。

その知性にアクセスするためには、時折まるでバカに話しかけるようにしなければならないことがあります。もしくは白痴天才として話しかけるかもしれません。これはちょうどダスティン・ホフマンが「レインマン」で演じたキャラクターのようなものです。

誰でもChatGPTを使うことができます。chat.openai.comにアクセスすれば、最新バージョンのGPT-4を無料で利用できます（一部のプレミアム機能は月額20ドルで利用可能です）。

ChatGPTにアクセスすると、基本的には空白の画面と「今日はどのようにお手伝いしましょうか？」という暗黙の質問が表示されます。

質問をすることができます。さらに良いのは、大きなPDFをアップロードしてそのファイルに関する質問をすることもできます。画像をアップロードすることもでき、それを説明させたり、スキャンしたページをアップロードすることもできます：手書きであってもテキストを認識することができます。

Chat AIを成功裏に使用するための重要な課題として浮上してきたのは、それと「対話」する方法を学ぶことです（最新のモバイルアプリバージョンでは実際に対話することができます）。Chat AIの世界ではこれを「プロンプトを作成する」または「プロンプティング」と呼びます。ユーザーは、プロンプトが具体的で詳細であるほど、ChatGPTから得られる応答が良くなることを発見しました。さらに、プロンプトは一度だけのものではありません。Chat AIはしばらくの間会話を続けることができ（無限ではありませんが）、求めている答えが得られない場合はプロンプトを修正し、洗練させることができます。これには慣れが必要であり、プロンプティングを最大限に活用する方法を訓練するためのハウツーが書かれたり、オンラインで提供されたりしています。

どのChat AIソフトウェアでも、開発的編集のような概念を説明するように頼んでみてください。それから、12歳の子供が理解できるような説明を作成するように依頼してください。結果は劇的に異なります。面白いことに、Chat AIは感情的な訴えにも反応するようです。プロンプトに「これは私のキャリアにとって非常に重要です」と追加すると、より有用な応答を引き出すことができます。

（ここで親指を加えるのに良い時期です：言語ベースのAIに取り組むトップ科学者が、なぜこのようなことが起こるのかを説明できないのは、安心でもあり、深く憂慮すべきことでもあります。）

プロンプトの方法

「プロンプティング」は、Chat AIを効果的に使用するための特定のスキルです。

AIゴールドラッシュの間に押収されたさまざまな用語の中で、「プロンプト」と「プロンプティング」は最高のものです。実際にはChat AIと「話す」ことはありません。質問を「する」こともありません（または、すべきではありません—それはそのように機能しません）。これらのエンジンに応答を求めるのであって、単純な答えを求めるのではありません。

最初は劇場のプロンプトと比喩するかもしれません。プロンプターはセリフを忘れた俳優を刺激し、彼らを行動に戻します。しかし、これは正確ではありません。なぜなら、AIプロンプトは暗記されたテキストの塊を緩めることはありません—それが生成AIの動作方法ではないからです。AIエンジンに同じプロンプトを繰り返し与えると、答えは少なくとも少しは異なるでしょう。

今、ChatGPTに「効果的なプロンプティングの主要要素をリストしてください」とお願いしました。二度目にお願いしたとき、回答はテーマ的には一致していましたが、具体的にはかなり異なっていました。ハイライトされたトピックには以下が含まれていました：

具体的であること
曖昧さを避ける
背景を提供する
明確な指示を使用する

ある意味で奇妙です：AIは言語をよく理解しているはずです—細かいプロンプティングなしで意味を理解する感覚を持っているべきではありませんか？しかし、まさにその言語の熟練度がプロンプティングを最も強力にするのです。正確に意味を伝えましょう、曖昧にではなく。

まるで頼りになるアシスタントや賢明なカウンセラーのように話しかけましょう。道ばたの子供のように話しかけてはいけません。

ここでのポイントは、少なくとも現時点では、LLMベースのAIツールを効果的に使用するには、プロンプトのベストプラクティスに少なくとも通じている必要があるということです。プロンプトの熟練は適切に報われるでしょう。

幻覚：軟膏の中のハエ

大規模言語モデルに基づくAIは、物事をでっち上げます。それはただそうするのです。これを一般的に「幻覚」と呼びます。これは実際の問題であり、深刻な問題です。AIと一緒に仕事をするなら、幻覚を理解する必要があります。

ケンブリッジ辞書の2023年の年間単語は「Hallucinate（幻覚）」で、その定義には「人工知能が幻覚を起こすと、それは虚偽の情報を生成する」という意味が加わりました。（2023年の辞書には他に「プロンプトエンジニアリング」、「大規模言語モデル」、そして「GenAI」も追加されました。）

ケンブリッジはAIの幻覚について「時には無意味に見えることもあるが、全くもってもっともらしく見えることもある - たとえ事実的に不正確であったり、最終的に非論理的であったりしても」と指摘しています。これは悲しいことに非常に真実であり、2024年7月時点でも、生成AIをミッションクリティカルなタスクに使用する際の大きな制限となっています。これはAIのいくつかの大きな奇妙さの一つであり、人々が理解するのに時間がかかります。覚えておいてください、生成AIは主に次の単語を予測するエンジンであり、事実のデータベースではないのです。したがって、HITL（人間が介在する）がAIの出力をダブルチェックする必要があります。そして再び、明らかに不正確な出力を生成する技術からこれほどの価値を引き出せることは驚くべきことです。そういうものです。

経験豊富で情報通なAI批評家であるGary Marcusは、AIの幻覚を壊れた時計に例えています。壊れた時計は一日に2回正しい。「それは一部の時間では正しい」と彼は言いますが、「どの部分が正しいのか分からないため、その価値が大いに減少するのです。」

2023年9月のPublishers Weekly会議の基調講演者であるEthan Mollickは、AIを使用する人々が100％の正確性を期待していると述べています。彼は、幻覚は「我々が日々許容している人間の誤りの率と似ている」と言います。

OpenAIで現在働いているAI専門家のAndrej Karpathyは、幻覚について次のように書いています：

「LLMの『幻覚問題』について尋ねられるとき、いつも少し苦労します。ある意味で、幻覚はLLMがするすべてのことだからです。彼らは夢の機械です。

「我々はプロンプトで彼らの夢を導きます。プロンプトが夢を始め、そのLLMのぼんやりとした訓練文書の記憶に基づいて、大部分の時間は有益な場所に到達します。

「夢が事実的に不正確とされる領域に入ると、それを『幻覚』と呼びます。それはバグのように見えますが、それはただLLMが常にしていることをしているだけです。」

それは単に物事をでっち上げる問題だけではありません。チャットAIは深刻な欠陥のあるソフトウェアです。

特に初心者からの多くの質問に対して、応答は平凡で、的外れで、単に役に立たないことがあります。チャットAIは数を数えるのが苦手です：500ワードのブログ記事を頼むと、150ワードしかもらえないことがほとんどです。

また、各AI企業はバイアスを減らし、「爆弾の作り方」の質問に答えないようにするために、その製品に厳しい応答ガードレールを設けています：質問に対する答えが「いいえ、それには答えません」というのが実質的にすべての答えになることがあまりにも多いです。私はGoogle Geminiにこのテキストのドラフトをレビューするよう依頼しましたが、「公開前に著者の承認を得ることが重要です」と注意されました。

ファクトチェック

私は、ほとんどの人が耳を傾けないが、幻覚は技術的な問題であり、それに対する技術的な解決策が見つかると主張している。確かに、これらはLLMにとって特有の問題だが、回避することは可能だ。

次のように考えてみてください。私は4つのチャットAIに以下の声明をファクトチェックするよう依頼しました：

2024年現在、ニューヨーク市に拠点を置く6つの大手多国籍出版社があり、これらはビッグ6として知られている。
電子書籍は引き続きアメリカ合衆国における書籍販売を支配している。
BordersとBarnes & Nobleはアメリカ合衆国で最大の書店チェーンである。
Covidの間に売上が減少した後、アメリカの書籍売上は再び二桁成長している。

全てのAIが最初の3つの声明の誤りを見抜きました。4つ目の声明については、Covidの売上増加の程度やその後の売上パターンについて少し混乱していました。これは小さな、非代表的な実験ですが、これらのチャットAIは、事実に基づくものでないにもかかわらず、ほとんどのカジュアルな観察者が見逃すような事実を評価する上で信頼できる仕事を行うことができます。

画像やビデオについてはどうですか？

一般書籍の出版はテキストに依存しているため、出版社は画像やビデオに関する画期的なAIベースのツールを見過ごしがちです。

これらはAI革命を理解する上で重要です。しかし、この議論はここで取り上げるには大きすぎます：十分に説明することができません。

著者や出版社におすすめします：ChatGPTの画像生成機能を試してみてください—無料で楽しいです。その後、「ビデオとAI」で検索して、リンクされたサイトで見つけるいくつかの例に驚いてください。まだ一般公開されていませんが、OpenAIのSoraは、テキストプロンプトから生成された驚くべきビデオ例を提供しています。

書籍出版社向けのソフトウェア

書籍出版社向けに特に設計されたゼロからのAIソフトウェアはほとんどありません（著者向けには多くのものがあります）。

学術出版社は、研究、執筆、出版のためのさまざまなAIツールを持っているため、より多くの選択肢があります。

一般書籍出版社向けのオプションのほとんどはAIとオーディオに関連しています。オーディオ以外では、選択肢は編集およびマーケティングツールに集中しています。また、いくつかのAIコンテンツ検出ツールとコンテンツライセンシングツールおよびサービスもあります。

編集ソフトウェアは、主に著者向けに位置づけられており、プロの編集者向けではありません—編集者よりも多くの著者が存在し、プロの編集者が求める品質は（主に自主出版の）著者が求めるものよりもはるかに厳しいものです。

マーケティングツールも同様に、書籍出版社だけでなく、すべてのマーケティング担当者を対象としており、ウェブコンテンツ、コピー生成、SEOのツールを提供しています。このカテゴリのリーダーであるJasper.aiは、HarperCollinsを顧客としていると主張しています。

この本のスポンサーであるShimmrは、書籍出版社向けのAI駆動の広告作成ツールです。この会社とその創設者であるNadim Sadekは、Publishers Weeklyの2024年5月の記事で紹介されました。

「私たちが行っているのは、本の心理プロファイルを考慮し、それを特定の読者層の心の状態と一致させることで、読者と本の間のより効果的なつながりを確保することです」とSadekはPWに語った。「私たちはこれを『本のDNA』と呼びますが、これは本のキャラクターやプロットだけでなく、本の価値観、興味、感情も知ることを含みます。」

本のDNAを利用して、ShimmrのAIツールは、検索やソーシャルメディアチャンネル（現在はGoogleとMeta）向けにターゲティングされた広告を作成します。これらの広告は、AI生成の画像とキャッチフレーズを伴うディスプレイ広告の形を取ります。

出版者がShimmrを評価する際に指摘するのは、これは増分収益を提供できるという点です。これは新しい広告/マーケティングツールに期待するものです。

別の「AIだけで可能」なソフトウェアツールを体験したいなら、Hypnovelsをチェックしてみてください。これはフィクションの本の章をアニメーション化します。「ナレーション、画像、動き、すべてがAIによって生成され、伝統的なアニメーションよりも文字通りではなく（したがって「hypno」）、オーディオブックよりも感覚的に魅力的で、章をユニークで魅力的なものにします。」

AIの機会から生まれたもう一つの新しいベンダーはVeristageです（この本のスポンサーでもあります）。Veristageは「AI出版アシスタント」であるInsightを提供しています。これは、複数の出版機能にわたる特定のタスクに特化したフロントエンドです。

Insightの旅は原稿から始まります。初期バージョンをアップロードすると、いくつかのツールが解除されます。編集にとってより価値のあるものもあれば、マーケティングにとってより価値のあるものもあります。すべての機能を使用した後、書式のトーン、トロープ、クリシェ、形容詞と副詞の使用など、編集面を含むPDFレポートをダウンロードできます。そして、説明、メタデータ、独自の販売ポイント、競合、Amazon最適化コンテンツ、提案されたソーシャルメディア投稿などのマーケティングコンテンツも含まれます。

Insightで最も気に入っているのは、複数の機能ごとに異なるソフトウェアツールを集めるのではなく、出版プロセスにAIを適用する全体的なアプローチを取っている点です。

ここで自分の出版プラットフォームLeanpubを強調したいと思います。彼らとの仕事は素晴らしいものでした。小さなものは美しい：大企業が避けるような技術やサービスに挑戦します。著者や小規模な出版社にとって最も関心があるのは、新しいTranslateWordサービスで、Microsoft Wordで書かれた本をGPT-4o API（ChatGPTを動かすエンジン）を使って最大31の言語に翻訳できます。これを使ってこの本を翻訳しています。

本の翻訳サービスを探すために他を見ましたが、翻訳会社はたくさんありますが、AIを利用しているところもあります。本の翻訳を提供している唯一の会社はDeepLでした。しかし、それは会社の重点ではありません。今のところLeanpubが行くべき場所です。

書籍出版のためのビジネスソフトウェア

出版業界にサービスを提供している既存のビジネスシステムベンダーは、SalesforceやOracleのようなエンタープライズ規模の企業で見られるように、AI技術を層化し始めています。

いくつかの出版システムソフトウェアベンダーと話しましたが、Firebrandを含むすべてがその機会を見てはいるものの、慎重に進んでいます。

2024年9月にテネシー州ナッシュビルで開催されるFirebrandの出版イノベーションフォーラムで、多様な参加者とAIについて話し合う機会を楽しみにしています。

knkはAIに関する2つのウェビナーを実施し、ホワイトペーパーを公開しましたが（2024年6月26日現在）、製品にAI機能を発表していません。

Virtusalesは最近、画像タグ付け、代替テキスト生成、コピー編集ツール、セールスおよびマーケティングコピー生成、そのコピーの翻訳など、最初のAI対応ツールセットを立ち上げました。

私はKlopotekのKlopotek Publishing Radioで話をしました。彼らは「カスタマーサービスの分野でAIイニシアチブを開始しました」が、詳細はまだ公開されていません。

Supadu は出版社向けに「ウェブデザイン、電子商取引、データソリューション」を提供しており、現在「Supadu Smart AI」を特徴としています (pdf)。これには「スマートバイ付きのアバターリードタイトルビデオレビュー」、「マーケティングおよび販売チーム向けのアバタービデオ主導のプロモーション資料」、「著者およびタイトルビデオの簡単な多言語翻訳」が含まれます。

出版社向けAIソフトウェア：スタートアップ

私が本の出版技術に基づくスタートアップに関して行った仕事を知っている人もいます。Publishers Weeklyのレポートにはその仕事の説明があり、データベースへのリンクも含まれています。

レポートでわかるように、私は本の出版スペクトラム全体にわたってスタートアップを幅広く見ています。新しい出版社は、技術を使って何か異常なことをしていない限り含まれません。基本的な基準は、技術を使って本の出版プロセスのある側面を活性化しようとしていますか？私のデータベースには、Amazonが2007年に最初のKindleを発売してから立ち上げられた会社が1,600社以上あります。

データベースの全体像を把握したら、さらに深く掘り下げていくことができます。右端のタブには、AI関連の出版スタートアップだけをソートする方法があります。

AIが選択されたフィルターを持つツールとサービスのリストを示すテーブルのスクリーンショット。243のカウントを強調しています。

図に示すように、AI関連の出版スタートアップは240社以上あります（2024年7月初旬時点）。AIを利用している音声出版スタートアップを別のカテゴリとしてカウントすると、合計で300社以上になります。大多数、280社以上は2022年11月にChatGPTが初めて登場してから立ち上げられました。この新しいビジネススタートアップの量は、出版業界では前例のないものです。驚くべきことです。

データベース全体の特徴として、これらのAIスタートアップのほとんどは著者を対象としています（70％）。約13％は出版社を直接対象としています。10％は子供向けの出版に焦点を当てています。

約50のスタートアップは、読者を対象としたさまざまな革新的な提供をしています。いくつかは物語のプラットフォームです。要約者がかなりいます。複数の発見サイトがあります。「AIを使って新しいお気に入りの本を見つけよう」。急速に改善されているAI生成の音声により、「読んでくれる」ツールの選択肢が増えています。

そして、AIがなければ実現できなかった興味深いアイデアもあります。

Bookshelf: Reading Trackerは、書籍の発見と個人的なライブラリアプリを組み合わせたもので、「自動タイムトラッキング、読書目標とリマインダー、洞察に満ちた統計と傾向」を含んでいます。そのAI司書は「要約とフラッシュカードを生成し、主要なアイデアと持ち帰りを議論し、さらに多くのことができます。」

私の友人Ron Martinezは最近、Inventionarts.aiというサイトを立ち上げ、「新しい会話型メディア」を紹介しています。サイトはこう説明しています。「それぞれ独自のアイデンティティ、専門知識、認識を持つ複数のAI人格と話すことができます。シナリオに異なるペルソナを招待することもできます。そして、あなたも架空の役割を演じることができます！」一種の文学ゲームです。

より大きなスタートアップコホートの特徴として、これらのスタートアップの多くは小規模から極小規模で、サイトと未完成のアイデアを持つ一人だけです。私はすべてを含めています—彼らがどこに向かっているのか誰にもわかりません。

データベースをぜひ活用してください。いくつかのリンクをクリックしてみてください。多くのこれらの組織の革新と大胆さに驚かされると思います。

この本のスポンサーの一つであるBook Advisorsは、出版業界における合併と買収を専門としています。私は常に革新的なスタートアップにパートナーを探すように勧めており、そのプロセスを話し合うために彼らをBook Advisorsに送っています。出版業界には、The Fisher CompanyやOaklins DeSilva+Phillipsなど、頼りになるM&A企業がいくつかありますが、Book Advisorsは技術系スタートアップとも連携している唯一の企業です。

AIとブックパブリッシング：業界は現在何をしているのか？

多くの著名な出版業界団体のAI関連活動は、著作権に関する懸念の声を上げることのようです。The Association of American Publishersは、「著作権法と人工知能（AI）の交差点に関するアメリカ著作権局の調査に対して、返信コメントを提出しました...」

イギリスのPublishers Associationも述べています。「政府が安全で信頼性のあるAIを支える人間の創造性と知識を保護するために、できるだけ早く具体的な解決策を講じることが極めて重要です」と。

一方で、600以上のメンバーを持つIndependent Publishers Guild (IPG)は、メンバーに対してAIガイダンスと研修を提供しています。その中には、著名なAIと出版専門家のGeorge Walkleyが実施する「出版におけるAIの実践ガイド」も含まれます。

ここアメリカでは、私はBook Industry Study Group (BISG)のAIワーキンググループの一員であることを光栄に思っています。このグループはWorkflow Committeeに報告を行っています。ワーキンググループは、いくつかの戦略的イニシアチブを提案しています：

最良慣行と標準の開発：倫理ガイドライン、既存の規制および法律にリンクしたAI使用に関する最良慣行を推奨します。これには、AI生成コンテンツの透明性と消費者への開示が含まれます。
業界調査と定義：現在および将来のAI使用に関する業界全体の洞察を収集するための調査を実施し、出版の文脈でAIが何を意味するかの明確な定義と範囲を確立します。
定期報告とレビュー：AI技術によってもたらされる急速な変化に業界が適応できるように、定期的な報告を提供します。

他の執筆および出版団体も、このトピックに先んじようとしています。中にはAIに反対の立場を取るものもあれば、技術を理解し、場合によっては実験しようとするメンバーを支援しようとするものもあります。

AIとブックパブリッシング：出版会社は何をしているのか？

1年前、出版会社が現在何をしているのかという質問に対する答えは「ほとんど何もしていない」でした。それ以来、大きな変化はありませんが、いくつかの活動は見られます。今回は商業出版に焦点を当てますが、学術出版および学術出版社はより活発です。以下は私が発見したいくつかの事例です。

Hachette：イギリスのThe Booksellerの2023年11月の報告によると、HachetteはAIに関する立場声明を発表し、「運用上の使用」と「創造的な使用」の区別を提供しています。会社は「運用上の使用に対しては『責任ある実験』を奨励するが、『機械による創造性...人間によって生み出されたオリジナルの創造的コンテンツを保護するために反対する』と明確に述べています。」

HarperCollins: 2023年4月のPublishers WeeklyのAndrew AlbaneseとEd Nawotkaの報告によると、HarperCollinsのCEOであるBrian Murrayは次のように述べました:

“これは重要であり、今後3〜5年で私たちの業界に大きな影響を与えることを知っています。したがって、多くの人々がそれをどのように使用するかを考え、それを作家に役立て、プロフェッショナルなサービスを提供し、作家や物語と競合しない倫理的かつ道徳的な方法で使用することを確認しようとしています。

“これは課題だと思います。ここにいるすべての出版社にとってはそうではないかもしれませんが、世界中の多くの小さな技術チームが私たちのビジネスを狙っていることは間違いありません。彼らは出版社でも編集者でもなく、技術者であり、チャンスを見ています。”

ペンギン・ランダムハウス（PRH）：PRHの親会社であるベルテルスマンは、State of Play: Exploring Generative AI’s Transformative Effects on the Media & Entertainment Industryというホワイトペーパーを提供しています。このホワイトペーパーには、書籍出版に関するセクションも含まれています。

また、Publishers Lunchの報告によると、同社は「PRH ChatGPT」と呼ばれる独自の内部AIアプリケーションを導入しました。

記事には、PRHの内部文書でそのプログラムが「プロセスの効率化、創造性の向上、部門全体でのデータ洞察の提供に使用できる」と説明されていると記載されています。同社はアプリの使用例として、本や文書の要約、メールの修正、ブログ投稿や職務記述書の作成、テキストベースのデータ分析、「コンテンツのアイデアの生成」などを挙げています。

Simon & Schuster: 同社のCEOであるJonathan Karpは、New York Timesの「過去25年間で最も記憶に残る文学的瞬間」で言及されました。これはPublishers Weeklyの2024年5月のU.S. Book Showで報告されたものです。彼はAIについて、「部屋の象」ではなく、「世界のセミのようなものです。たくさんの音とたくさんの交尾」と述べました。

彼はまた、AIが「確かに貴重なツールであり、より効率的にしてくれる。情報をよりよく処理し収集するのに役立ち、従業員がより興味深く創造的な高レベルの仕事をできるようにしてくれることを望んでいる」と認めました。

3月にロンドンブックフェアで、The Booksellerに報告されたように、Karpは同社がAI生成のオーディオブックの外国語版を「[その著者の]作品がオーディオ制作のコストのために絶対にチャンスがない地域で」検討すると述べました。

AIと書籍出版: 使用例

書籍出版におけるAIの具体的な使用例は、概念的には簡単に説明できます。しかし、出版社が実際に何をしているのかについての情報はほとんどありません。

Ulysses PressとPerfect BoundのCEOであるKeith Riegertは、2024年5月のPublishers Weekly U.S. Book Showで発表しましたが、出版業界内でのAIの使用例について最も包括的な概要を提供しました。Perfect Boundはこの報告書のスポンサーであり、その声明を支持します。彼は「出版プロフェッショナルとして、今すぐAIを使い始めるための20の実用的な方法」を提供しています。

彼のプレゼンテーション、Getting Started with AI は Perfect Bound のウェブサイトから閲覧およびダウンロードできます。

AIが本を読むとどうなるのか？

このセクションのタイトルは Ethan Mollick のニュースレターから借用しています—改善する必要はありません。Mollick はペンシルベニア大学ウォートン・スクールの教授で、起業家精神とイノベーションを研究しています。彼のニュースレターは、私が頻繁におすすめするもので、冷静で爽やか、そして独自の洞察に満ちています。

Mollick が解説者としての資格を持つ理由の一つは、彼が利害関係を持たないことです。彼はAIを売り込む必要もなければ、それを批判する必要もありません。ただ、教育、文化、執筆、出版に対するAIの多くの影響を探求することに専念しています。そして彼は優れた明快なライターです。

Mollick のニュースレターのアーカイブを閲覧すると、彼がAIに注目し始めたのは2022年12月からであることがわかります。それまでは彼の専門分野ではなく、多くの人と同様に、AIは彼の日常業務に突如として現れ、彼はそれから目を離せなくなりました。

この投稿で彼の洞察は、出版業界のプロフェッショナルとしての私たちの関心に最も近いものです。「AIは、私たちが本と関わる方法を変えるかもしれない」と彼は尋ねます。

その質問に答えるために、Mollick は「本を保持するのに十分なメモリを持つAIと、自分の本を十分に知っている著者の両方が必要だ」と述べています。Mollick は彼のいくつかのタイトルの一つ（具体的には明示されていませんが、チャットからは* The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors* であることが明らかです）をテストします。この本はAmazonで好意的にレビューされていますが、現在のベストセラーではありません。

Mollick はAIが著者、出版者、読者にとっての潜在的な価値のさまざまな側面を検討し、「読者および編集者としてのAI」や「実用的な用途: 教師への支援」を含んでいます。彼はLLM—大規模言語モデル—ChatGPTではなく—に本を要約させます。それはMollick の満足のいく結果を出します。

次にさらに難しい課題：「本の中の隠喩の例を挙げてください」。隠喩は「比喩的な言語の使用を明確なマーカーなしで見つけるため、人間の読者にとっても挑戦的である」と彼は指摘します（直喩とは異なり、「のような」や「as」がありません）。彼の記録によると結果は「印象的ですが、若干の誤りがあります」。

LLM は編集者としては成功しません：この分野での失敗は、「現在のAIの状態について明らかになっていることを示している」とMollick は述べています：もしあなたが非常に優れたライターまたは編集者であれば、現在のAIよりも優れています…」

それにもかかわらず、「AIは、少なくともテキストの文脈と意味を理解しているかのような外観を持っている」とMollick は信じています。その結果、「AIの結果として本と私たちの関係が変わる可能性がある」と彼は考えています。

私もそう思います。

AIと本のデザインと制作

専門システムとプロセス自動化は、本のデザインと制作に関してはまだAIよりも先を行っています。

本の自動組版ソフトウェアは少なくとも1970年代から存在しています。1980年代半ば、私は Donald Knuth の TeX に基づく PageOne というソフトウェアプロジェクトを監督しました。このソフトウェアは数分で本を組版できました。SGML は1969年に導入されたドキュメント標準に基づいて同時期に登場しました。それは1996年に導入されたXMLに大部分が引き継がれました。これらの堅牢なマークアップ言語は、自動化のための堅固な構造を作り出します。

デスクトップ出版は、QuarkXPressやAdobe InDesign、Adobe Illustrator、そしてAdobe Photoshopに対して、もう一度オートメーションの波をもたらしました。出版ワークフローは様々なプログラムやシステムで管理できます。

注目すべき組織としてCoko Foundationがあります。彼らは、学術出版プラットフォームのKotahiや書籍制作のためのKettyを含む、オープンソースの制作および出版管理ツールを提供しており、AIアシスタントを含む機能を持っています。Kotahi AI PDF Designerは、「PDFデザインをシンプルでインタラクティブなプロセスに変える」としています。

InDesignのワークフローにAIを取り入れる初期の取り組みがいくつかあります。2024年4月、AdobeはText to Image機能を発表しました。第三者はAdobeを先取りしているかもしれません。インドの革新的なプリプレスおよび制作ベンダーであるHurix DigitalやIntegraは、制作にAIを活用する取り組みでAdobeを凌駕しています。

AIと本のマーケティング

短期的にはAIの本のマーケティングへの影響は浅いですが、長期的にははるかに深いものになるでしょう。本のマーケティングをどう捉えるかによりますが、それは変わりつつあります。

「手っ取り早い成果」は明らかです。Chat AIに製品説明やプレスリリースの手伝いを頼むことができます。キーワードを提案させることもできます。これは簡単にこなせます。しかし、多くの出版プロフェッショナルも同じことを少しの汗をかくだけでできます。

Keith Riegertの事例（上記リンク参照）には、タイトルのブレインストーミング、デジタルマーケティングレポートの作成、Google Sheetsでのデジタルマーケティングキャンペーンのトラッカー作成の提案が含まれています。

Shimmrソフトウェア（上記参照）は、これからの自動マーケティングの形を示唆しています。

AIとメタデータ

AIとメタデータにはどんな関係があり、お互いにどのように影響を与えるのでしょうか？その役割はこれまでのところ控えめに見えますが、大きな変化が期待されます。

メタデータは本の発見可能性の核心です。この言葉を聞き飽きているでしょう。主に「メタデータ」がほとんどの非技術者にとって捉えどころのないものだからです。「それは本の基本情報、タイトル、説明、価格、主題カテゴリ、そんなものです」と言えば、人々は安堵します。それなら安心できるからです。しかし、それだけではありません。

実際にはメタデータには本の詳細情報以上のものがあります。この小さな本ではとてもカバーしきれません。私はこのトピックについて共著で本を書きました。IngramはMetadata Essentials、優れた短編を出版しています。ここで言いますが、これが最後ではありません：著者と出版社がメタデータを軽視するのは危険です。

AIはメタデータ生成を助けることができます。例えば、自費出版ベンダーのPublishDriveは、「AI-Powered Book Metadata Generator」を提供しており、書籍のタイトル、概要、Amazonカテゴリ、BISACカテゴリ、キーワードに対するAIの推奨を提供します。

前述のVeristageのInsightは、説明文、キーワード、BISACカテゴリを生成し、ターゲットオーディエンスを定義することができます。

メタデータにおけるAI使用の宣言

メタデータの厳かな世界がAIを受け入れるのに時間がかかると思うかもしれませんが、そうではありません！昨年11月、ONIX標準の管理者であるEDItEURが、「ONIXにおけるAIの側面」と題した短いアプリケーションノートを発表しました。(pdf)

組織のディレクターであるGraham Bell氏は、「（技術を巡る論争に対する反応の一つは）AIの使用を断念するか、AIによって作成された製品の取引を避けることです。より現実的な選択肢は、AIが使用された場合に取引先や読者に透明性を持たせることです。そして、一部の再販業者がAIベースのコンテンツを自社プラットフォームから制限または禁止しているため、信頼できる出版社が生成AI技術を使用してコンテンツを作成した製品を強調することが重要です」と述べています。

Bell氏は、出版社がメタデータで指定する方法を次のように説明しています。

AIの寄稿者
オーディオブックにおけるAIベースの声

… さらに、デジタル製品のメタデータで、出版社が研究以外の目的でのテキスト・データマイニング（TDM）を明示的に拒否する方法もあります。商業目的または非研究目的のTDMをカバーする別のライセンスを指定する方法もあります。

通常、ONIXで指定された内容はサプライチェーンの下流で発見されないことが多いですが、少なくとも最善の努力がされています。

出版業務へのAI統合戦略

出版会社が日常業務に複雑なデジタル技術を統合することほど不安を感じることはほとんどありません。それは理解できます。特にAIは、出版業界だけでなく、皆に不安を抱かせています。それは新しいものであり、神秘的で、個人化されており、強力です。人々はさまざまな理由でAIに脅威を感じています。態度を変えるには時間がかかります。

しかし、今は技術に対して臆病でいるべき時ではありません。

組織の規模に関係なく、AIを出版業務に統合するための冷静で合理的なアプローチがあります。

その推進力はトップから来なければなりません。非常にトップから。上級経営陣はAIの潜在的な変革力のビジョンを受け入れ、組織全体にプログラムを伝える必要があります。そのプログラムは「実験し、実験を記録し、共有する」程度のものであってもよいのです。それは良いスタートです。

The Economistが最近言及した新しい技術採用のための組織戦術として「灯台アプローチ」があります。すぐに実行でき、誰もが関連性を感じる高プロファイルの概念実証を選択して、ビーコンを作成します。

出版会社は著作権を巡る騒動によって不利な立場にあります。作家たちは怒っています。2023年5月のAuthors Guild調査では、「90％の作家が、彼らの作品が生成AI技術のトレーニングに使用された場合、補償を受けるべきだと考えている」と述べ、67％が「自分の出版契約やプラットフォームの利用規約がAI関連の目的で彼らの作品を使用する許可を含んでいるかどうか不確かである」と述べました。その不確かな作家たちは今、彼らの作品の編集や制作にAIが使用されているかどうかを出版社に尋ねており、一部の有力な作家はそれを禁止するよう求めています。彼らはAIのピーナッツフリーベーカリーのようなものを探しています。

これは出版社にとって厄介な問題です—出版を計画している本にAIを使用できない場合、何に使用できるのでしょうか？

AIポリシーの策定とコミュニケーション

その広範な使用にもかかわらず、AIポリシーを公に定義し、AIへのアプローチを公に伝えている出版社はほとんどありません。取引、学術、教育の各出版社が対象とする異なる公衆を考えると、「公衆」という用語には微妙な意味があります。

商業出版社にとって最も重要な読者は作家とその代理人です。学術出版社は、研究に対するAIの有望な影響を考慮し、その後、研究を物語に変換する際のAIのより問題のある影響を考慮する際に、異なる障害に直面します（Avi Staimanはこのトピックに関する思慮深い投稿を書いています）。教育出版社にとって、ポリシーの確立は難しく、AIが教育の実践に侵入することは多面的で複雑です。

出版者がAI技術を進めるにあたり、二つの大きな課題に直面していると思います。第一は、AIを一般的にどのように取り入れるかについての会社の立場を開発することです。第二の課題は、その立場を明確かつ明白に、彼らの関係者に伝えることです。

私が見てきた出版社のポリシーはほとんどが欠陥があります。その中には、実際には外部向けに、作家に対してのポリシーもあり、何が許容されるか（ほとんどない）と何が許容されないか（たくさん）についての一連の警告があります。O’Reillyの“O’Reillyのコンテンツを開発するタレントのためのAI使用ポリシー”はページ数が多く、「DO NOT use any OSS GenAI Models that produce software Output that is subject to the terms of a copyleft or network viral open source license」などの専門的なガイドラインが含まれています。

一方、学術出版社Elsevierは、ウェブサイトの“Elsevierポリシー”セクションに、「責任あるAI原則」、「テキストとデータマイニング」、および「Elsevierの執筆における生成AIおよびAI支援技術の使用」に関する声明を含めています。

私が見てきた少数の内部未公開の出版社のポリシーは、過度に保守的です。これらの出版社は、さまざまな認識された脅威や可能な脅威、そして作家の不安に対してあまりにも迅速に反応し、この急速に発展し変化する技術に対して積極的に関与する能力を自ら制限しています。

彼らが「責任を持って」AIを使用することは当然であり、それが何を意味するにせよです。彼らは作家の知的財産に最大限の関心を持ち、作家の著作権を積極的に保護することに最大限の関心を持つことは当然です。（もちろん、これらの広範な原則は公開され、頻繁に繰り返し宣言されなければなりません）。

しかし、他に何がありますか？

編集取得にAIが役割を果たすことを許可しますか？AIがスラッシュパイルを確認することができますか？
開発編集、ライン編集、校正にAIが役割を果たすことを許可しますか？
印刷部数と配布量の決定にAIが役割を果たすことを許可しますか？
代替テキストを含むアクセシブルな電子書籍ファイルの作成において？
才能ある人間のナレーターを雇うことが経済的に現実的でない場合のオーディオブック作成において？
権利が決して売られることのない市場への外国語翻訳において？
大規模にマーケティング資料を開発することにおいて？
再販業者とのコミュニケーションにおいて？

そうであるならば、これを明確にし、そのポリシーの背後にある考えを明確に説明しなければなりません。出版者は、恐れと疑念の時期において多くの作家の反対に立ち向かう勇気を持たなければなりません。

職務に関する考慮事項

最大の出版社だけがAIソフトウェアとシステムを扱う専任スタッフを雇うことができるでしょう。平均的な出版社は、全スタッフにAIツールを公開し、それぞれが自分の作業で効率を見つけるためにAIを探索することを期待します。

2024年2月のアリゾナ州でのPubWest会議で、出版業界外部からのスピーカーが、AIの用途の一つとしてインターンを置き換えることを提案しました。部屋は炎上しました。彼女は善意でした—実際、2024年4月10日のニューヨーク・タイムズの記事では、ウォールストリートの投資銀行が多くのインターンをAIで置き換えることを検討していることが報告されています。出版業界と同様に、明白な懸念は次のとおりです：ジュニアアナリストとしてスタートできない場合、どうやってシニアアナリストを見つけるのですか？

出版業界は常にインターンシップに依存しています。2019年の研究によると、出版業界で働いている15年未満の人々の80％が以前にインターンシップを経験していました。

部分的には、手頃なコストで雑用をこなす方法です。しかし、それ以上に大きな現実があります。どの出版学校も中間管理職レベルで出版会社に入社するための準備をすることはできません。将来の熟練したスタッフを育成する唯一の方法は、今日インターンや徒弟を訓練することです。

ここでの目的は、インターンをAIに置き換えることではなく、AIツールを使用して彼らの仕事をより生産的で報われるものにすることです。これにより、インターンと出版会社の両方に利益がもたらされます。

オーディオブックのためのAI

オーディオブックのためのAIは非常によく機能します。完璧ではありませんが、機能します。現在、著者や出版社は、全規模のナレーター中心のオーディオブック制作が経済的に実現不可能な場合に、主にAIツールをオーディオブック制作に使用しています。そして、それは英語のオーディオブックだけでなく、翻訳されたオーディオブックにも適用されています。

オーディオブックのためのAIの使用は新しいものではありません。私はこの傾向を2021年にPublishers Weeklyで報告しました。しかし、新しい大規模言語モデルは、自動オーディオブックナレーションの技術を再活性化させました。

2021年に私は「完璧ですか？確かにそうではありません。十分に良いですか？おそらく、出版社がプロジェクトの音声編集段階に必要な時間を費やす意欲があるならば」と述べました。2年半後、多くの報告によれば、AIの声は非常に注意深く聞かなければ人間の声と区別がつかないほどです。

昨年11月、Meta（Facebook）は「Seamless」を導入しました。これは「トーン、感情表現、声のスタイルの特質」を200の言語の翻訳に転送できるものです。オーディオブックは、驚異的な品質で複数の言語に即座に翻訳できます。

また、2021年には「Audibleによる非人間のナレーターを使用したオーディオブックの配信ブロックは、解決には時間がかかる可能性がある実際の問題です」と報告しました。その間に、GoogleとAppleの両方が、著者がAI生成の声でオーディオブックを作成できるプログラムを発表しました。12月5日には、SpotifyのFindaway Voicesが「Google Play Booksからのデジタル音声ナレーションオーディオブックの一部の小売パートナーへの配信を受け入れ始めました」。

2023年11月初旬、AmazonはKindle Direct Publishing（KDP）著者が「合成音声技術を使用して、電子書籍のオーディオブックバージョンを迅速かつ簡単に制作できるサービスにまもなくアクセスできるようになる」と発表しました。2024年1月、Jane Friedmanは「Audibleは昨年の秋に他の小売業者が同じことをしてからしばらくして、静かにAIナレーションのオーディオブックをストアに導入し始めた」と報告しました（有料記事）。

そしてもちろん、私はこの本のオーディオブックバージョンにもAIを使用しています。

本の翻訳のためのAI

本の翻訳のためのAIは機能します。おそらく、自動オーディオブック制作ほどの精度ではありません。しかし、それは非常に近づいており、急速に進歩しています。非文学作品が最初になる可能性があります。文学作品がそれに続くかもしれません。ノンフィクションは異なる一連の課題を提示します。

私は2024年6月にBISGが主催する本の翻訳のためのAIに関するウェビナーを開催しました。ビデオはYouTubeでオンラインです。Jane Friedmanも彼女のHot Sheetニュースレターでこのプログラムを説明しました。

このテーマは複雑で微妙なものです。私が興味深いと感じるのは、人々がどれだけ長い間、翻訳の自動化を試みてきたかということです。本が私たちの宇宙を満たしているとはいえ、それは書かれたコミュニケーションのごく一部であり、このオンライン時代ではさらにその割合が小さいです。

機械翻訳（MT）の父として知られるウォーレン・ウィーバーは、同僚にこう述べています。「ロシア語の記事を見ると、『これは実際には英語で書かれているが、奇妙な記号でコード化されている』と言います。これからデコードを始めます。」機械にとって、言語はただのコードです。それは文化や感情、書かれた言語の壮大さではありません。数字とコードのタスクです。

明らかに、フィクションとノンフィクションの区別はAI翻訳において大きな問題となります。チャットAIはスタイルには強いですが、事実には弱いです。まだ初期段階ですが、チャットAIはフィクションには優れているが、ノンフィクションには劣ると考えています。（それでも、私はこの事実に満ちた本を機械翻訳しています！）

文学的なフィクションは非常に重要な存在です。それは貴重で敬愛されており、その価値は正当です。翻訳者は単語やフレーズについて何時間も議論することがあります。チャットAIはその領域で慎重に行動する必要があります。

しかし、これは肥沃な領域です。私の知る限り（限られたデータから）、2023年には9500冊の商業書籍の翻訳しか行われていません。たとえ大きな誤差があっても、外国語から英語への翻訳が非常に少ないことは明らかです。

同様に、2023年には英語からスペイン語への翻訳が7230件しかなかったという統計を見つけました（スペイン語の書籍市場で）。それは非常に少ないように思えます。

ここには大きなチャンスがあります。

AIを使った書籍翻訳の大部分は、経済的に実現不可能と考えられていた書籍に対して行われるでしょう。「中間市場」の書籍の翻訳者に対する職業への影響は避けられませんが、プロジェクト管理や品質保証の分野での職業成長が見込まれます。それが職業喪失を相殺するかどうかは疑問です。

ほとんどのAIの側面と同様に、対処するべき課題があり、簡単な答えはありません。

ソフトウェアセクションで述べたように、LeanpubとDeepLは、著者や出版社にAI支援の書籍翻訳サービスを提供している2つの会社です。

学術出版におけるAI

商業出版社やあらゆる種類の著者は、学術出版コミュニティにおけるAIの動向を注視するべきです。それは消費者向け出版よりもはるかに急速に進んでいます。

私は2つの理由でその進展を見ています。まず、学術出版における著者は職業としての学者であり、STMセクター（科学、技術、医療）では、高度な学位を持つ科学者であることが多いです。出版とは別に、彼らは自身の仕事の中でAIを調査し、しばしば受け入れています。彼らは出版社がAIを編集や出版に利用していないことに驚くでしょう。

これは学術出版エコシステムに反映され、編集者も学者であることが多いです。彼らにとって、技術は恐れるものではありません。

この本では詳細には触れませんが、私のブログでさらに詳しく報告します。

著者のためのAI

著者と出版社は、2つの孤立した存在として、つながってはいるが基本的には別々に生きていると見られがちです。それは現代の出版において大部分が真実です。

時代は変わりました。かつては手の届かない存在だった出版社も、今ではトップの著者が主導権を握っています。別の場所で述べたように、自費出版の著者は先駆者です。彼らは伝統的な出版を悩ます重荷をほとんど持っていません。

出版社がAIを見るとき、彼らはほとんど機会を見出せません。著者にAIについて話すとき、世界は彼らのオイスターです。可能性はほぼ無限です：

執筆と編集

本全体の執筆と出版を試みる
新しいプロジェクトのアイデアを出す
新しい本の中でアイデアを出す
ストーリーの微調整
調査
事実確認
執筆の伴侶
開発編集
コピー編集
スペルチェックと文法チェック
校正

イラスト/画像処理

イラストやチャートを作成する
カバーデザインのラフ
ビデオプロモーション

マーケティング

エージェント、出版社、コンテスト、友人、推薦文のリクエストへの自動送信
マーケティング資料の作成：プレスリリース、ブログ投稿、ソーシャルメディアなど
ウェブサイト生成

著者は、AIの産業採用に対する変化を推進する重要な存在です。それが賛成か反対かにかかわらず。

彼らは、執筆や出版に関するスタートアップのイノベーションの多くの恩恵を受けています。スタートアップの約70%が、著者との協力を目指しています。

AIに関する懸念とリスク

AIに関する懸念は深刻です。リスクは現実です。時にはヒステリックな形で表現されることもありますが、掘り下げてみると、AIの影響は非常に破壊的である可能性があります。

AIに関する問題と懸念は非常に多く、それだけで何冊もの本を埋め尽くします。以下は、私が監視しているトピックのワードクラウドです。いくつか見逃しているものもあるかもしれません。

「AI」を中心としたワードクラウド。関連する用語として「懸念」、「倫理」、「人類」などが周囲に配置されています。

これらのトピックに関する情報は豊富にあり、できるだけ深く読んでみることをお勧めします。リスクが利益を上回ると結論付け、個人的または組織内でAIの使用を追求しないことを選択するかもしれません。その決定には、通常の取り残されるリスクが伴います。しかし、それは個人の選択です。

「AIのリスクに関する本」をグーグルで検索すると、有益な書籍の選択肢が見つかります。最近特に衝撃的だったポッドキャストはEzra KleinがDario Amodeiと話したもので、彼はAnthropicの共同創設者兼CEO（Claude.aiを開発する会社）です。これらの企業がリスクを認識していることがわかります。Amodeiは「AI安全レベル」（A.S.L.、アメリカ手話ではありません）という内部リスク分類システムに言及しています。現在、ASL 2にあり、「生物兵器の作成方法を指示する能力を示し始めるシステム」を指すと説明しています。彼はASL 4を「国家レベルのアクターが能力を大幅に向上させることができる…北朝鮮や中国、ロシアが軍事分野でAIを利用して地政学的なレベルで大きな優位性を得ることを心配する状況」と述べています。恐ろしい話です。

この厳しい文脈の中で、著者や出版社に最も関連する問題を強調します。

著作権侵害？

著作権に関する問題は複雑で曖昧です。いくつかの本が著作権を保持している状態で、いくつかの大規模言語モデル（LLM）の訓練に含まれていたことは確かです。しかし、すべての著者の作品がすべての大規模言語モデルに取り込まれたわけではないということは確かです。

著作権に関する問題は、特定のものから広範なものまであります。すべてのLLMがオープンウェブ上で訓練されていることはよく知られています。今日のウェブ上の15億のサイトからスクレイピングできるすべてのもの、新聞記事、ソーシャルメディア投稿、ウェブブログ、そして、YouTubeビデオのトランスクリプトまでが含まれます。

証明されているように、少なくとも一つの大規模言語モデルは、パブリックドメインではない数千冊の本の実際のテキストを取り込んでいます。

これらのテキストを無償で取り込んで、億ドル規模のAI企業を構築することは合法だったのでしょうか？AI企業はフェアユースを主張していますが、最終的には裁判所が決定するでしょう。たとえ合法であっても、それは倫理的または道徳的だったのでしょうか？倫理の問題は法的な考慮よりも複雑ではないようです。皆さんが判断してください。

著作権に関する法律は、AIがもたらす独自の課題を予見していなかったことは明らかであり、法的解決策を見つけるには時間がかかるでしょう。おそらく数年かかるかもしれません。（この問題に特化した法律がなぜ不適切かについて詳しく知りたい場合は、A. Feder CooperとJames Grimmelmannによる優れた論文「The Files are in the Computer: Copyright, Memorization, and Generative AI」をお読みください。）

ここには最も著名な訴訟の13件のリストがあります。すべてが本に関するものではなく、画像や音楽も含まれています。そしてこちらのリストでは、すべての訴訟の進捗状況を更新しています。

著作権とAIに関する著者向け情報

著者はAI生成コンテンツの著作権に関して追加の問題に直面しています。

米国著作権局のAI生成コンテンツの著作権に関する見解は、AI単独では著作権を保持できないとしています。なぜなら、AIは著者としての法的地位を持っていないからです。それは理にかなっています。しかし、これは作品の100%がAI生成であることを前提としています。他の場所で議論されているように、少数の著者がAIに全体の本を生成させることはないでしょう。もっと現実的には5％、10％、あるいは…。ここで著作権局はつまずきます（私も同様ですが）。

最近の判決では、MidjourneyというAIサービスによって生成された画像と人間が執筆したテキストを組み合わせたグラフィックノベルは著作権を持つ作品と見なされましたが、個々の画像そのものは著作権で保護できないとされました。なんてことだ！

著者と出版社は、複数の方面から進化する著作権問題に注意を払うべきです。

長期的な影響は？

現在の訴訟をGoogle Books訴訟と比較する人もいます。この訴訟は法的に解決するのに10年かかりました。これらの訴訟の控訴プロセスがどれだけ長引くかは誰にもわかりません。その間に、出版社はAI企業が敗訴するかのように行動することが賢明です。少なくとも理論上、Chat AIをライセンスしたり使用したりする人々に何らかの潜在的な責任を負わせることになります。

しかし、それが出版社にとって最も深刻な問題ではありません。それは認識です。多くの著者にとって、著名であろうと無名であろうと、井戸は毒されています。AIは執筆と出版のコミュニティ内で放射性物質と見なされているのです。AIの匂いがするものは何でも激しい批判を受けます。

多くの例があります。最近の事件では、イギリスの出版社Angry Robotは、大量の原稿提出を見込んでAIソフトウェアStorywiseを使用することを発表しました。わずか5時間で、その計画を撤回し、元の受信箱に戻ることになりました。

トレード出版社が内部でAIツールを使用する際の耐え難いジレンマ：著者に発覚すると、その後の嵐を乗り切るのは困難です。出版社は勇気を持ち、（少なくとも一部の）ツールを採用し、それらのツールがどのように訓練され、どのように利用されるかを明確に説明し、前進するしかありません。

イギリスでは、The Society of Authorsは厳格なアプローチを取っています：「出版社に対し、校正、編集（信頼性チェックや事実確認を含む）、索引作成、法的審査、デザインやレイアウトなど、あなたの作品に関連する目的でAIを大幅に使用しないことを確認するよう求めてください。オーディオブックのナレーション、翻訳、AIによるカバーアートのデザインを禁止することも検討してください。」

Authors Guildは「出版社が通常の業務の一環としてAIをツールとして使用することを探っている」と認めているようです。しかし、多くのGuildメンバーがそれほど理解を示しているとは思いません。

AI企業へのコンテンツライセンス

ほとんどの出版社、および多くの著者は、AI企業にコンテンツをライセンスする方法を模索しています。ライセンス条件やコンテンツの価値についてはそれぞれ異なる意見がありますが、少なくとも議論は進行中です。

いくつかのスタートアップが出版社（場合によっては個々の著者）と協力することを模索しています。Calliope NetworksやCreated by Humansはこの点で興味深い存在です。

7月中旬に、長年業界の著作権ライセンスの主力であったCopyright Clearance Centerが、「人工知能（AI）の再利用権を年次著作権ライセンス（ACL）に組み込んだ」と発表しました。「企業全体のコンテンツライセンスソリューションとして、数百万の作品からの権利を提供します。」

Publishers Weeklyは、CCCの社長兼CEOであるTracey Armstrongの「AIに賛成しながら著作権も尊重することが可能であり、AIとクリエーターへの敬意を結びつけることができる」という言葉を引用して発表を報じました。

すべてを包括するものではありませんが、これは出版業界が大規模言語モデルの開発者と協力する方向に一歩近づくための画期的な進展である可能性があります。

AIを避けるのは手遅れ

AIに汚染されることを好まない著者や出版社にとっては、悪いニュースです：あなたは今日もAIを使用しており、何年も前から使用しています。

人工知能は、さまざまな形で、私たちが毎日使用しているほとんどのソフトウェアツールやサービスにすでに統合されています。人々は、Microsoft WordやGmailなどのプログラムでAIを活用したスペルチェックや文法チェックに依存しています。Microsoft WordやPowerPointは、執筆の提案を提供し、デザインやレイアウトの推奨を行うためにAIを活用しています。SiriやAlexaなどのバーチャルアシスタントは、音声コマンドを理解し質問に答えるために自然言語処理を使用しています。メールサービスは、AIを活用してメッセージをフィルタリングし、スパムを検出し、アラートを送信します。AIはカスタマーサービスのチャットボットを動かし、購入履歴に基づいた製品の推奨を生成します。

そして、これらの多くは、ChatGPTのような大規模言語モデルに基づいています。

著者や編集者が「私の原稿にAIを使用しないで」と言うのは、一般的に言ってもほぼ不可能です。彼らとその編集者がタイプライターや鉛筆を使っている場合を除いて。

彼らは「生成型AIを使わないで」と言おうとするかもしれません。しかし、これは難しい問題です。文法チェックソフトウェアは元々生成型AIに基づいて作られたものではありません。Grammarlyはそれを製品に組み込んでおり、他のスペルチェックや文法チェックツールも同様です。生成型AIはマーケティングソフトウェアのコアでもあります。

著者がAIを使用する時

著者とAIの使用に関するもう一つの側面は、上記で議論した著作権の問題と似ています。極端な例では、100％AIで生成されたコンテンツがAmazonで公開されています。そのほとんど（すべて？）はひどい品質ですが、それが公開されるのを妨げるものではありません。（Amazonのセクションも参照してください。）出版社にとってもっと懸念されるのは、AIで生成された投稿です。確かに、AIは量を増やしますが、大手出版社はすでに量をフィルタリングするシステムを持っています。そのフィルタはエージェントと呼ばれています。彼らが量の問題をどのように処理するかを見つける必要があり、どうやらAIを使用しない解決策を見つける必要があるようです。

それはある意味で存在的問題です—「私は『機械』によって書かれた本を出版したいのか？」多くの出版社にとって、それは明確な「いいえ」です。簡単なことです。では、50％のコンテンツが有能な著者の監督のもとでLLMによって生成された本はどうでしょうか？うーん、それも「いいえ」にしましょう。では、25％、10％、5％はどうでしょうか？どこで線を引くのでしょうか？

そして、線を引く仕事に取り掛かった今、スペルや文法ツールが少なくとも一部は生成AIに依存しているというジレンマをどう解決するのでしょうか？AI駆動の文字起こしツール、例えばOtter.aiやMicrosoft Wordに組み込まれた文字起こし機能はどうでしょうか？

特定の量のAI生成テキストを含む作品を公開しないと宣言した商業出版社は見つかりません。以下はAuthors Guildの見解です：

「原稿にかなりの量のAI生成のテキスト、キャラクター、またはプロットが組み込まれている場合、それを出版社に開示し、読者にも開示する必要があります。アイデアのブレインストーミング、アイデア生成、またはコピー編集のために単にツールとして使用される場合には、生成AIの使用を開示する必要はないと考えています。」

言うまでもなく、「かなりの」は定義されていません（オックスフォード辞書は「気づかれるほど大きい、または重要と考えられる」と定義しています）が、投稿は「de minimis AI生成テキスト」の包含がほとんどの出版契約に違反することを説明しています。法的には、de minimis は正確には指定されていませんが、一般的には「かなりの」とほぼ同じ意味です。

AIは文章中で検出できるか？

2024年5月に、BISGがスポンサーとなったAI検出に関するウェビナーを主催しました。リプレイはYouTubeでオンラインで視聴できます。Jane Friedmanは自身のHot Sheetニュースレターでウェビナーの包括的な要約を提供しました。

多くの著者にとって、AIの毒性は言葉から遠ざけておくことを意味します。出版社は特別な負担を負います—テキストを作成するわけではありませんが、一度出版されると、テキストに対してかなりの義務を負います。社会的影響を含むコンテンツや他の作家の言葉やアイデアの盗用を巡って、爆発的な議論が巻き起こることを目にしてきました。今、AIによって新たな一連の倫理的および法的問題に直面していますが、これらの問題は出版学校で説明されていませんでした。

一部は学生が心配することと似ており、AIの使用はウィキペディアの記事をカンニングするのと同様に不正行為であると考える人もいます。または、友人にエッセイを書いてもらうことに似ているかもしれません。

私たちのウェビナーの講演者の一人である教育者のJosé Bowenは、学生向けの開示を共有しました。これは著者向けのものとは少し異なりますが、AIの使用リスクレベルの一種を示しています。

学生向けテンプレート開示契約

友人、ツール、技術、またはAIの助けを借りずに、すべて自分でこの作業を行いました。
最初の草稿は自分で書きましたが、その後、友人や家族、AIのパラフレーズ/文法/盗作ソフトウェアに読んでもらい、提案を受けました。この助けを受けて以下の変更を行いました：
- スペルと文法の修正
- 構造や順序の変更
- 全文や段落の書き直し
問題に行き詰まり、シソーラスや辞書を使用したり、友人に電話したり、ヘルプセンターに行ったり、Cheggや他のソリューションプロバイダーを利用したりしました。
アイデアを生成するためにAI/友人/チューターを使用しました。
アウトライン/最初の草稿を作成するために支援/ツール/AIを使用し、その後編集しました。（あなたの貢献の性質を説明してください。）

そして出版社は、著者のためにこのようなものを作成することができます。たとえば、著者が上位レベルを開示するとしましょう：AIを広範に使用し、その結果を編集しました。それならどうしますか？自動的に原稿を拒否しますか？もしそうなら、なぜですか？

そして、その間に気づくことがあります。あなたが読んで気に入った原稿が、著者がGrammarlyでさえスペルチェックされていないと誓ったものが、実際にはAIによって90％生成されていたかもしれないこと。

その時、質問を再考せざるを得ません。それは、「なぜ私はこの見つけにくいものを見つけようとこんなにも決意しているのか？」ということになるのです。

部分的には、AI生成テキストの著作権性に関する警戒心から来ています。著作権事務所は100％AI生成テキスト（または音楽、画像など）には著作権保護を提供しません。しかし、50％AI生成テキストはどうでしょうか？私たちは著者が生成した50％のみをカバーします。そして、どの半分かをどうやって知るのでしょうか？それについてはまた後でお知らせします。

各原稿をソフトウェアに入力するだけで、テキストの作成にAIが使用されたかどうかを教えてくれるとしたら素晴らしいことではありませんか？

これを行う唯一の方法がAIツールを使用することであるという問題を脇に置いて、もっと重要な質問は、そのソフトウェアが（十分に）正確であるかどうかです。原稿の作成にAIが使用されたかどうかを教えてくれると信頼できるでしょうか？そして、実際には使用されていないのにAIが使用されたと示す「偽陽性」を生成しないと信頼できるでしょうか？

現在、市場にはこれらの課題に取り組む多数のソフトウェアがあります。これらのソフトウェアを評価する多くの学術研究は、その信頼性の低さを指摘しています。AI生成テキストがすり抜けます。さらに悪いことに、AIによって生成されていないテキストが汚染されたと誤ってラベル付けされます。

しかし、出版社は何らかの安全策を設けたいと思うでしょう。これらのツールは、せいぜい可能性のある懸念を警告することができるだけで、常に二重チェックが必要です。したがって、他のテキストよりも慎重に検査する必要があるテキストを警告することは効率でしょうか？

真の効率は、テキストの起源に関する懸念を超えて、既存の品質基準を維持することにあります。

失業

「あなたはAIに取って代わられるのではない。AIを使いこなせる人に取って代わられるのだ。」 —匿名

AIの採用による失業は深刻である可能性があります。推定値はさまざまですが、数字は厳しいです。明らかな例としては、サンフランシスコの自動運転タクシーがタクシーやライドシェアの運転手を排除することが挙げられます。AI支援の診断は、医療技術者の必要性を減らす可能性があります。

私の中の楽観主義者は、スプレッドシートの導入とその雇用への影響を一例として指摘します。下のグラフでわかるように、「会計、税務準備、簿記、給与サービス」における雇用は1990年以降ほぼ倍増しており、これらのタスクを大部分自動化したスプレッドシートやその他の技術に対する批判とは言えません。

1990年から2020年までの会計、税務準備、簿記、給与サービスにおける従業員数を示す折れ線グラフ。

Ethan Mollickのボストンコンサルティンググループ（BCG）と行った研究は、特に複雑で知識集約型のタスクにおけるAIの仕事への影響をよりよく理解するための実験でした。この研究には758人のBCGコンサルタントが参加し、ランダムにOpenAIのGPT-4を使うグループと使わないグループに割り当てられ、2つのタスク（創造的な製品イノベーションとビジネス問題解決）を行いました。研究は参加者のパフォーマンス、行動、態度、およびAIの出力の質と特性を評価しました。

発見の一つとして、「AIはスキルの平準化を行います。実験開始時に評価した結果が最も低かったコンサルタントは、AIを使用するとパフォーマンスが43％も向上しました。トップコンサルタントも向上しましたが、その幅は小さかったです。」この記事全体は示唆に富んでおり、Mollickのすべての仕事と同様に、挑発的でありながらアクセスしやすい内容です。

教育

教育はAIに関する賛否両論の中心にあります。教室へのAIの導入は、大部分が呪いと見なされるか、少なくとも挑戦と見なされています。他の教育者、例えばPWの基調講演者であるEthan Mollickのように、AIを教育者のための注目すべき新しいツールとして受け入れています。Mollickは彼の学生にChatGPTを使うことを主張しています。

このトピックに関する最良の書籍は、José Antonio BowenとC. Edward Watsonによる*Teaching with AI: A Practical Guide to a New Era of Human Learning*です。

この本では教育出版には触れませんが、それは広大なトピックであり、別の報告書が必要です。おそらく、出版は教育内で二次的な関心事になりつつあります。AIツールはソフトウェアであり、コンテンツそのものではありません。

検索の未来

検索はAIにおいて困難なトピックです。perplexity.aiやYou.comを訪れて、今後の動向を垣間見ることをお勧めします。次回グーグル検索を始めようと思ったときには、代わりにPerplexityにアクセスしてみてください。劇的に異なるようには見えませんが、グーグルの検索画面の右側や検索結果リストの上部に表示される知識グラフに似ています。リンクをクリックする代わりに、情報がそこに直接表示されます。

パープレキシティはさらに一歩進んで、複数のソースから収集した情報を再構成して提示しますので、リンクをクリックする必要がほとんどありません。ソースへのリンクは提供されますが、すでに質問の答えが得られているため、クリックする必要はほとんどありません。

この一見控えめな変化は、検索エンジンを通じて発見されることに依存しているすべての企業や製品にとって、巨大な影響を及ぼします。検索者があなたのサイトに送られなくなった場合、どのようにして彼らと関わり、顧客に転換することができますか？簡単な答えは、できないということです。

Joanna Pennは、新しい技術がライティングと出版に与える影響についての考察の最前線にいます。彼女は昨年12月に彼女のポッドキャストとブログでこの複雑なトピックに取り組みました。

AIと検索の変革にとって、まだ初期段階です。

アマゾンのジャンク本

AI生成のジャンク本がアマゾンで問題になっていますが、その深刻さは感覚的なものかもしれません。一方で、これらの本は低品質で盗作されたコンテンツをオンライン書店にスパムのように送信し、時には実在する著者の名前を使って顧客を欺き、その評判を利用します。これらの本は読者にとって迷惑であるだけでなく、著者にとっても脅威となり、苦労して得た印税を奪う可能性があります。AI生成の本は、同じキーワード、カテゴリ、レビューを競うことで、アマゾンのサイト上で本物の本や著者のランキングや可視性にも影響を与えます。

ビーチで花に囲まれたかわいい子猫と「世界で見られない面白くてかわいい猫の写真」というキャプション

Amazonは現在、著者に対し、AIを使用して本を作成した際の詳細を開示するよう要求しています。これが悪用される可能性があることは間違いありません。

アマゾンで「AI生成の本」を検索してみてください。たくさんあります。一部の結果は、AIを使って本を作成する方法についての本です。しかし、他の結果は、紛れもなくAI生成のものです。「面白くてかわいい猫の写真-世界でこのタイプの写真は見られない-PART-1」(原文のまま)はRajasekar Kasiにクレジットされています。著者ページには彼(?)のバイオについての詳細はありませんが、同じ名前で他に6冊のタイトルがクレジットされています。この本は2023年8月26日に出版され、レビューも売上ランキングもありません。電子書籍の文法的に誤ったタイトルは、印刷本の表紙の文法的に誤ったタイトルと一致しません。

しかし、他の著者は明らかにAIを広範に使用して本を作成しており、それを開示していません。前述のように、AIの使用を検出することは、熟練した「偽造者」にとってほぼ不可能です。塗り絵、ジャーナル、旅行本、料理本は、従来の出版に比べてごくわずかな時間と労力でAIツールを使って生成されています。

「korean vegan cookbook」を検索すると、Joanne Lee Molinaroによる1位のタイトルが最初に表示されます。しかし、そのすぐ後ろには明らかに模倣品である他のタイトルが続いています。「The Korean Vegan Cookbook: Simple and Delicious Traditional and Modern Recipes for Korean Cuisine Lovers」は2つのレビューがあり、そのうちの1つは「これはビーガン料理本ではありません。すべてのレシピに肉と卵が含まれています」と指摘しています。しかし、この本の売上ランキングは#5,869,771であり、オリジナルの本はリストで#2,852に位置しています。

被害の程度を判断するのは難しいです。これから良いことは何も起こりませんが、どれほど悪いのでしょうか？

アマゾンには「顧客にポジティブな体験を提供しない」本を削除することを許可するポリシーがあります。Kindleコンテンツガイドラインは、「顧客を誤解させる、または本の内容を正確に表していない説明的なコンテンツ」を禁じています。また、「顧客にとって通常は失望するコンテンツ」をブロックすることもできます。アマゾンの監視者を打ち負かすのは膨大な量でしょうか？それとも他に理由があるのでしょうか？

偏見

LLMは既にオンラインに公開されているものを学習して訓練されています。オンラインで公開されているものには偏見が多く含まれているため、LLMもその偏見を反映します。そしてもちろん、偏見だけでなく、憎悪もその学習に反映され、AI生成の言葉や画像における潜在的な出力となります。ポルノもAIの画像生成能力の驚異的な利便性の恩恵を受ける自然な分野であり、最近では若い女性が捏造されたヌード画像を発見し、男性のクラスメートがその容疑者として挙げられるという問題があります。The New York Timesは、子供の性的虐待のオンライン画像の増加について別途報じています。

著者や出版社は、AIツールを使用する際にこれらの内蔵された制限を認識する必要があります。

創造性は陳腐なものになり得る

機械が本当に創造的であるかどうかの問題は、激しい議論の対象となっています。それは部分的には、私たちが創造性をどのように定義するかに依存します。

「AIは決して創造的ではない。」これはお馴染みのマントラです。

私たちは皆、創造性が何であるかを知っているのではないでしょうか？

ケンブリッジ: 「独創的で珍しいアイデアを生み出す、または使用する能力。」

ブリタニカ: 「問題に対する新しい解決策、新しい方法や装置、または新しい芸術的なオブジェクトや形式を作り出す、あるいは存在させる能力。」

この意味での創造性が、LLMsの手の届かないところにあることには異論はありません。

私の主張は、多くのものが創造的とされているものの大部分は、実際には反復的であるということです。そしてそれは、多くのことにおいて、特に広告の大部分において、非常にうまく機能します。

しかし、「創造性」のバリアを高め、それによってLLMsを低く評価することは、AIが必然的に失敗する高すぎる障壁を設定することになります。そして人々は「ほら、やっぱり創造的ではない」と言ってそれを却下します。

そして、AIが非常に得意とする反復的なものを見逃してしまいます。

私は、次の本を読み終えた後、近い将来このトピックに関する長いエッセイを投稿する予定です：

The Creativity Code, by Marcus du Sautoy, and

The Artist in the Machine, by Athur I. Miller

Literary Theory for Robots, by Dennis Yi Tenen

もう一つの考え

ジェレミア・オウヤングはシリコンバレーを拠点とする業界アナリストです。彼はAIの支持者ですが、以前にも誇大広告に接した経験があります。彼は「これほど短期間でこれほど急速な進化を見たことがない」と指摘しています。

オウヤングが述べているように、現在、小規模なプログラマーのチームがLLMsを使用して「感覚を持つ存在」― 4歳児のような存在 ―を2日で組み立てることができます。彼らは以下のことが可能です：

コンピュータビジョンで現実世界で何が起こっているかを「見る」こと、
音声コマンドや周囲の音を通じて現実世界を「聞く」こと、
上記の現実世界の入力を処理して「考える」こと、
事前学習データにアクセスして「学ぶ」こと、
独自のデータセットを「参照する」こと、
どの言語でも抑揚とトーンを持つリアルな音声で「話す」こと、
必要な形式やスタイルでテキストコミュニケーションを通じて「書く」こと、
自発的に画像を作成して「描く」こと、
対話を積極的に行い、質問をしたり、AIエージェントにタスクを完了させたりする「対話」すること。

これは非常に驚異的で前例のないことです。出版にとって重要でしょうか？あなたが決めてください。

出版以外の素晴らしいこと

AIは出版以外でも画期的な成果を上げています。医学はAIのポスター・チャイルドですが、他の産業からも強力なストーリーがあります。出版への関連性は修辞的な質問から生まれます：AIは命を救うことができます。しかし、出版社を助けることができないと思いますか？

この短いセクションの目標は、AIが出版を助けることができるとは思えないという議論に反論することです。AIが誰にも役立たないと思いますか？

AIと医学

2024年3月号のThe Economistを読み、その健康とAIに関する技術特集を掘り下げました。ここ数年、医学は人工知能の明るいスポットとして一貫して取り上げられてきました。ほとんどの報告はポジティブです。しかし、The Economistの特集はあなたを驚かせるでしょう。彼らは多くのよく整理された懸念を表明しています。しかし、AIが医学において「何億人、さらには数十億人の生活を改善する機会を提供する」とも読めます。

AI技術を禁止するか、少なくともその開発を一時停止しようとする人々に対するもう一つの修辞的な質問です。あなたは、不確実な未来への不安を満たすために、何百万人もの健康に対するその潜在的な価値を犠牲にしますか？

空港でのAIとTSA

私たちはそこにいました：終わりのない列、X線スキャナーを通る手荷物の遅い動き。

TSAによる検出の失敗はよく文書化されています、しかしあまり議論されていません。

私が最も心配するのは、画面を見つめている悲しそうな労働者たちです。何のために？それは悲惨な仕事であるだけでなく、単なる人間として、彼らはそれがあまり得意ではありません。

そこでAIの登場です。それが肺の検出が難しい腫瘍を発見できるなら、手荷物の密輸品を検出することもできると確信しています。そして、彼らが扱うには不向きな感謝されない仕事から人間を解放します。

この報告によれば、新しいTSAのAI支援検査プログラムが進行中です。

エッセイ：AIが出版業界に与える影響

最近、AIウェビナーでのパートナーであるPeter Brantleyと、今後のAIプログラムをどのように形作るかについて話し合っていました。Peterは図書館コミュニティで多くの時間を過ごしており、ロサンゼルスで彼の図書館同僚約150人と一緒にAIが彼らのセクターに与える潜在的な影響を探る日帰りのイベントから戻ったばかりでした。会話は活発で詳細でした。彼はなぜ一般書籍出版社がこのような集まりを持たないのかと疑問に思いました。AIはすべての出版イベントのトピックですが、それがトピックでないのはなぜでしょうか？

AIの実世界の影響

彼が出した答えは、一般書籍出版社がまだAIが彼らのビジネスに何らかの実世界の影響を及ぼすと結論付けていないということです。彼らのビジネスの核心に。彼らがビジネスを行う能力に。もちろん、それはプレスリリースを書いたり、原稿拒否の手紙を書いたりするのに役立つかもしれませんが、出版は何十年も続いてきたように続けると仮定しています。契約から印刷本までの平均時間が最大2年に及ぶこともあります。

同時に、出版社は当然、AIよりも差し迫った短期的な課題に直面しています。紙の価格。輸送コスト。利益率の縮小。全体的にほぼ横ばいの売上。これらすべてのプレッシャーの中で、誰がAIに関心を持つ時間や余裕があるのでしょうか？

しかし、他の創造産業はそれを理解しています。アートとデザインはそれを理解しています。広告もそれを理解しています。ハリウッドも、音楽業界もそれが何が来るかを見ています。ジャーナリストたちは恐怖を抱いて見守っています。

他の出版セクターはAIの影響を把握し始めています。学術出版は深く技術に入り込んでいます。しかし、一般書籍出版社はAIからの実世界の影響がほとんどないと行動しています。

現実世界での影響とは何でしょうか？本の供給に影響を与えるでしょうか？それとも本の需要に影響を与えるでしょうか？

供給：はい、AIはAmazonに新しいゴミ本が増える原因です。何百冊も？確かに。何千冊も？多分。何百万冊も？いいえ。Amazonには何冊の本があるでしょうか？ 5,000万冊以上です。すでに非常に混んでいます。

それはさておき、近い将来、AIが人々が実際に読みたいと思う全体の本を書くわけではないことは明らかです。これまでのところ、その価値は執筆の仲間として、批評し、提案し、時折使える文章をいくつか作成することにあります。いいえ、近い将来、AIが書籍出版のアウトプット、新しい本の供給を根本的に変えることはありません。

需要：いいえ、誰もAI生成の本を求めていません。それは要因ではありません。そして、AIが本の需要に広く影響を与えるシナリオは考えられません。

出版プロセスについてはどうでしょうか？はい、それは変わるでしょう。少なくとも少しは。我々が昨秋のPublishers Weekly AIイベントで発見したように、出版社はマーケティングや編集などでAIの助けを求めています。

AIが商業書籍出版に現実的な影響を及ぼさない可能性はありますか？それはただのおもちゃかもしれません。

それでは、AIの詳細から一歩引いて、商業出版の困難な状況を再検討し、そこからAIが最も大きな影響を及ぼす可能性のある場所を掘り下げてみましょう。

出版業界の経済的衰退は数十年続いています

様々な推定によれば、米国の全書籍出版業界の年間売上は350億ドル未満です。仮に400億ドルだとしても、Appleの年間売上はそれの10倍です。Appleの総利益は売上の44％で、純利益は売上の25％です。出版業界はこのような利益率を夢見ることさえできません。

商業書籍出版は数十年にわたり緩やかな経済的衰退を続けています。ある年は数パーセント増加し、ある年は減少します。2024年中頃の売上は前年と比べて堅調ですが、それは出版社が慣れている夏のロマンスのようなものです。勝つこともあれば、負けることもありますが、全体として商業書籍出版は成長産業ではありません。

2023年、AAPのStatShotによると、“商業書籍の収益は年間8.9億ドルで0.3％減少しました。” 私の知る限り、AAPのデータはインフレを考慮していません。インフレ率が3.4％の場合、売上減少は3.6％で、Circanaが報告した部数販売の2.6％減に近づきます reported by Circana.

代替フォーマット、電子書籍やオーディオブックの成長がなければ、業界は非常に悪い状態にあるかもしれません。電子書籍は何年も成長エンジンでした. オーディオブックの売上は引き続き増加しており、2022年には約15％増加、2023年にはさらに9％増加しました。はい、その一部は代替販売ですが、電子書籍やオーディオブックの顧客の多くは新しい顧客であり、必ずしも定期的な本の読者ではありません。昨年、電子書籍とオーディオブックは商業売上の21％を占めました。もし印刷本だけが利用可能だったら、それらの顧客がすべて印刷本を購入するでしょうか？

小売価格は、コストや小売業者および卸売業者の割引が出版社の利幅を圧迫する中、ますます懸念されるようになっています。学術研究によると、本にはある程度の価格弾力性があるとされていますが、確実に抵抗点に達しているでしょう。ハードカバーのベストセラーは、35ドルの価格上限に達しつつあります。“サブスクリプション疲れ”が、ビデオオンデマンドの顧客がサービスを解約する原因となっており、各サービスのコスト増加に焦点を当てています。Netflixのプレミアムプランは現在月額22.99ドルです。Disney Plus Duo Premiumは月額19.99ドルです。最近同僚が私に言ったように、次の月に本を買うためにNetflixのサブスクリプションをキャンセルする顧客がどれだけいるでしょうか？

出版業界の給与

これを長々と繰り返すつもりはありません。生活を立てるのに苦労しているのは作家だけではなく、出版関係者も同様に、他の職業と比べて著しく低賃金です。

最近の出版業界の求人情報を代表的なものとしていくつか保持しています。例えば、ある取引出版社のマーケティングマネージャーの求人では、2023年の売上高が3,000万ドルを少し超えたと報告されています。その職位の年収は60,000ドルから70,000ドルです。別の例として、年商7億5,000万ドルの出版社のインプリントのひとつで広報マネージャーの求人があります。「この職位の年収は74,000ドルから79,000ドルです」と求人情報には記載されています。

米国労働統計局の全国職業雇用賃金推計によると、マーケティングマネージャーの全産業平均年収は166,410ドルです。「広報マネージャー」の平均年収は159,420ドルです。

出版業界はまったく及んでいません。これは出版業界で働く誰にとっても新しい情報ではありません。昔からずっとそうでした。しかし、これらの賃金水準で出版業界は持続できるのでしょうか？標準給与の半分にも満たない給与を提供することができないのは、デジタル化が進む業界にとって良い兆しではありません。

TikTok、YouTube、ソーシャルメディア、SEO、メタデータ、作家プラットフォームの時代に、「広報マネージャー」とは一体何なのでしょうか？

伝統的な書籍出版社の残る三つ（と半分）の利点

伝統的な書籍出版社の三つの持続的な利点は、（i）名声、（ii）大手メディアへのアクセス、（iii）書店流通へのアクセスです。これはすべての伝統的な出版社に同等に適用されるわけではありません。大手の出版社はそれぞれに多くの利点を持っています：より多くの名声、大手メディアへのより良いアクセス、そしてより多くの書店のフロントテーブルに本を置く機会です。しかし、総合的に見れば、これらが伝統的な書籍出版業界の特徴的な利点です。

出版社が提供できるもう一つの価値は、補完的なタイトルのキュレーションリストです。これにより、各タイトルがその仲間から利益を得ることができます。Fox Chapelのような工芸に特化した出版社を考えてみてください。彼らのタイトルの一つを楽しめば、同じトピックに関する他の本（および雑誌）も注目する可能性が高いです。たとえそれが他の著者によって書かれていてもです。

これは、いくつかの出版社だけが開発に成功した市場価値のあるブランドにまで発展します。Wileyの「For Dummies」シリーズやOxfordの「Very Short Introductions」シリーズを考えてみてください。ブランドは一貫した編集アプローチと品質を伝え、読者が複数のタイトルを購入することを奨励します。セルフパブリッシャーは主にフィクション向けに自分自身の短いシリーズを立ち上げることが多いですが、これらの大手出版社のカタログの広さを持つことはできません。

伝統的な出版社が提供する他のすべてのサービスは、同等の品質で手頃な価格で公開市場で購入することができます（例えば、編集、デザイン、製作、そして重要なマーケティング機能）。そして、自費出版者にとって、1冊の本が売れたときの収入は、伝統的なロイヤリティスケジュールの5倍以上です。

この点については、本書の最後に短い付録でさらに詳しく説明します。しかし、ここで上位3つの利点の価値を簡単に否定します。名声は自慢するためには良いかもしれませんが、現金価値は控えめです。書評やその他の主要なメディア露出は、今では本の売上に対する影響が大幅に減少しています。そして書店は業界売上の約15％を占めているに過ぎません（自費出版の著者にとってはさらに少ない）—もはや本の成功にとって核心的な存在ではありません。

状況は変わりました。

自費出版

自費出版は、過去10年以上にわたり消費者（商業）出版の成長の主要な推進力となっています。自費出版に関する正確な売上データは隠されたままで、その重要性を無視するのは簡単です。しかし、利用可能なデータは、自費出版が商業出版市場のかなりの部分を占めていることを示しています。

KoboのCEO、マイケル・タンブリンが（ある程度）有名に述べたように、「私たちが英語で販売している本の4冊に1冊は自費出版のタイトルであり、事実上、自費出版は市場に出ている誰も見ないもう一つのPenguin Random Houseのようなものです。それは出版のダークマターのようなものです。」

自費出版市場のトレンドは、商業出版における唯一の重要なトレンドと言っても過言ではありません。自費出版の著者たちは道を示しています。彼らは冒険的で、伝統的な業界の慣習に縛られていません。多くの著者はソーシャルメディアに精通しています。彼らは読者や顧客と密接な関係を持っています。最新のマーケティング技術を学びたいなら、著者のフォーラム、ブログ、そしてニュースレターをフォローしてください。

著者の収入統計、執筆の経済学を深く掘り下げ、伝統的な出版社の著者の収入の減少と自費出版の著者の収入の増加を比較してください。私がスティーブ・シークと共にALLiのために2023年に実施した国際調査と報告書（pdf）によると、「2022年の自費出版者全員の中央値の収入は$12,749で、前年から53％増加しました。平均（平均値）の収入ははるかに高く、2022年には$82,600で、34％増加しました。」

別の調査では、ピーター・ヒルディック・スミスがAuthors Guildのために実施した調査において、「2018年以降に出版を開始したフルタイムの自費出版著者は、2023年には平均収入が$24,000で、2018年の$13,700と比較して76％増加しました。」

ハイブリッド出版社

徹底を期するために、ハイブリッド出版社についても言及しておきたいと思います。私はハイブリッドモデルにますます熱心になっており、ハイブリッド出版セグメントは重要で成長しています。ハイブリッドの売上を個別に推定する人はいません。しかし、その影響は、セレブリティによる本と人気のビジネス書という2つのカテゴリーでの優位性で最も明確に見られます。これらのカテゴリーは長い間、商業出版社にとって信頼できる収入源でしたが、ハイブリッド出版社の「コンシェルジュサービス」と、はるかに有利な収入分配は、多くの著名な著者にとって魅力的です。

最近の例としては、Authors Equityの著者との利益分配関係や、Keila ShaheenのSimon & Schusterとの50/50利益分配などがあり、ハイブリッドモデルの正規化への傾向を示唆しています。これは著者にとっては良いニュースですが、従来の出版社にとってはあまり有望ではありません。

出版社を超えた出版

私は、Rüdiger Wischenbartと共同で、彼のオリジナルの研究「出版社を超えた出版」に基づいてレポートを共著しています。私たちは、世界中のあらゆる本に関連する出版活動をできる限り理解し、定量化しようとしています。これらの活動は、現代の出版エコシステムの一部として包括的に考慮すべきものです。

本の容器を超えると、AIが本当に影響を与える可能性がある場所の一端が見えてきます。

私たちのプロジェクトのポスター子供はWattpadであり、「9700万人が毎月230億分以上をオリジナルストーリーに費やしている」と言われています。これらのストーリーは主にスマートフォンで短いチャンクでオンラインで体験されます。ほとんどは出版された本にはなりません。それらは「Wattpad WEBTOON Studios、同社のテレビ、映画、出版の相手」に行き着く可能性が高いです。

若い読者は、年配の兄弟よりもオンラインデジタル読書に精通しています。2024年1月のWattpadの調査によると、「デジタル形式は若い世代の間でますます人気があり、Z世代の65％とミレニアル世代の71％がウェブノベル、電子書籍、ウェブコミックを受け入れている一方で、X世代とベビーブーマー世代の半数以下が同じことを言っています。」

そしてもちろん、伝統的な出版業界が今学んでいるように、「多様性はデジタル形式を受け入れるための主要な推進力であり、Z世代の61％とミレニアル世代の70％が、電子書籍、ウェブノベル、ウェブコミックが書店や図書館で見つけにくいコンテンツ、特にLGBTQ+や少数派に焦点を当てたコンテンツへのアクセスを提供していると考えています。」

Wattpadには競合他社があり、その中にはInkittも含まれています。Publishers Weeklyによると、Inkittは最近、「ホルツブリンク出版グループの所有者であるStefan von Holtzbrinckや元ペンギンCEOのMichael Lyntonを含む投資家から3700万ドルを調達しました。これにより、これまでの投資総額は1億1700万ドルになりました。」 2023年2月、Financial TimesはInkittがヨーロッパで8番目に成長の早い企業であり、ドイツでは第1位であると述べました。 Esquireの7月9日の記事は、InkittのAIの使用と、それが成功に果たした役割について詳述しています。

あなたの中で、Inkittの名前を聞いたことがある人や、その出版プラットフォームを訪れたことがある人、そのGalatea読書アプリをダウンロードしたことがある人はどれくらいいるでしょうか？

しかし、私たちの「出版社を超えた出版」レポートは、オンラインストーリープラットフォームを超えて、「コンテンツが多様なフォーマット（印刷物、デジタル）、メディア（本、オーディオ、映画、ゲーム）、流通チャネル（コミュニティ、プラットフォーム、ストリーム）およびビジネスモデル（製品の販売、サブスクリプション、ストリーミング、フリーミアム、有料モデル）で作成および配信される方法」を考慮しています。現行のビジネスモデルに明らかに適合しないために、書籍出版社が逃している機会はどれほどあるでしょうか？

イノベーション、技術、書籍出版

電子書籍を除いて、現代の出版業界は技術からの脅威に直面したことはありません。（デジタルオーディオブックは、懸念よりも喜びで迎えられました。）インターネット時代の到来は、出版社に脅威よりも多くの機会を提供しました。インターネットによって可能になったのは、単にAmazonという1つの小売業者だけであり、彼らはリンゴのカートをひっくり返しました。

Amazonが（その運営と影響のすべての側面を完全に考慮した場合に）書籍出版業界にとって純粋なプラスであったかどうかについての研究を私は見たことがありません。Amazonは、実店舗ではサービスを提供されていない多くの買い手にリーチし、価格を低く保つためにマージンを犠牲にすることをいとわない。電子書籍やオーディオブックは大規模に配信されます。しかし、Amazonが価格を引き下げられるのは、サプライヤーから高い割引と手数料を要求し、他の小売チャネルを絞るからです。痛みを伴うトレードオフがあります。

それでも、自費出版の著者の前でAmazonを批判しようとしないでください。彼らはThe Everything Storeがなければビジネスを続けられませんでした。

イノベーターのジレンマ

AIが書籍出版に与える影響を知るためには、クレイトン・クリステンセンの著書The Innovator’s Dilemma: When New Technologies Cause Great Firms to Failをお勧めします。この本は1997年にハーバード・ビジネス・レビュー・プレスから初版が出版されました。

クリステンセンは、既存の（既得権益のある）企業がどのようにしてイノベーションの力に屈するかを探ります。

成功したよく管理された企業は、破壊的な変化が業界に訪れるときにしばしば失敗します。彼らが業界のリーダーになるのを助けた従来の管理慣行は、破壊的技術に直面して俊敏に対応するのを難しくします。

破壊的技術によって生まれた製品を無視します。なぜなら、最初は既存の製品と比較して見劣りするからです。彼らの最も利益を上げる顧客は一般的にその仮説的なイノベーションを使うことができず、それを望みません。企業は既存の製品やサービスに注力することで、破壊的な脅威と闘おうとします。

クリステンセンの重要な洞察は、顧客の声を聞くことを含む明らかに「正しい」ことを行うことで、成功した企業は破壊的イノベーションに対して広く開かれてしまうということです。彼らは現在の顧客に焦点を当て、新しい重要な技術を無視します。それは最初は小さく、利益率の低い市場をターゲットにしています。これにより、機敏なスタートアップがリーダーを破壊する機会が生まれます。

クリス・ディクソンはこの本について議論する中で、「次の大きなものが既存の企業に見逃される理由は、次の大きなものが常に『おもちゃ』として見下されるからだ」と指摘しています。うーん、確かに、多くの人がチャットAIをおもちゃと見なしています。

出版者は、生成AIを用いた革新がその脆弱なビジネスモデルを崩壊させる可能性があることを認識していないのではないでしょうか？

フィクション対ノンフィクション

AIが出版業界に与える影響は、フィクション出版とノンフィクション出版で劇的に異なる影響を与えるでしょう。

出版業界は、しばしばフィクション本とノンフィクション本を出版する二つの分岐した業界として分析されることが少ないです。

ほとんどの商業出版社はフィクションとノンフィクションの両方のタイトルを提供していますが、業界全体で見ると両者の間には出版されるタイトルの数と売上において大きな隔たりがあります。推定はさまざまですが、毎年出版される本のうちフィクションタイトルは約10%に過ぎません。しかし、売上はフィクションが大いに有利です。年ごとに変動はありますが、フィクションは年間の商業本売上の約半分を占めています。昨年のベストセラー25冊のうち21冊がフィクションでした。英語で2000万部以上売れた本のうち、84%がフィクションタイトルです（Wikipediaの集計より）。

本の売上動向は非常に気まぐれですが、フィクションの売上は引き続き上昇傾向にあるようです。2019年には32%にまで落ち込んだ後、2022年には成人市場の40%を占め、2023年にはさらにわずかに成長しました。2024年の前半には成人フィクションの売上がさらに6.3%増加しました。

フィクションの著者が創作過程を支援するためにAIをますます利用するようになる一方で、AI生成されたストーリーがベストセラーの棚を占拠する可能性はほとんどないように思えます。いくつかのジャンルフィクションでは「十分に良い」作品が生まれるかもしれませんが、著者や出版社が不眠不休で心配するようなものではありません。

一方で、ノンフィクションの執筆と出版は、全般的にAIによって支援され促進されるでしょう。これは既に起こっています。ノンフィクションの著者は、リサーチアシスタントや執筆支援としてのChat AIの多くの才能を活用しています。そして、ノンフィクションの出版社も、原稿開発、事実確認、編集、マーケティング、配信においてChat AIの支援を求めるようになるでしょう。

著者にとっての存在的脅威はあるのか？

私は非常に頭の良い著者のエージェントと話をしました。彼女は、AIが彼女のクライアントやすべてのプロの著者にとって何を意味するのかについて多く考えてきました。その会話は「コンテナ」としての本のアイデアに話が及び、私は彼女にそのアイデアを詳しく説明するように頼みました。彼女の回答：

「基本的なアイデアは、著者やエージェントが出版社に本を提供する際、それはただの本であるということです。それが後に私たちが知っている無数の派生作品の形（翻訳、劇的適応、グラフィックノベルなど）になるかもしれないという理解がありますが、それはすべて『作品』自体に次ぐものです。作品は単なる言葉やフレーズや事実の袋ではなく、その著者に特有の方法で構造化されたものです。コンテナを壊し、スクラブルの文字の袋を振ってランダムな選択を引き出す（その選択が特定の著者の構文と意味論とスタイルでできたスクラブルの袋であるため完全にランダムではない）ことは、出版社に権利を譲渡する際に考慮されることではありません。

「本は部分の合計を超える一体のものであり、それは創造的な啓示（および大量の創造的知的労働）の産物であり、それが本としてすべてをまとめたものです。それは単なる『本』ではなく、その特定の著者による本です。」

本には宝物が含まれている

ノンフィクションの本について考えると、コンテナを壊すことはAI時代の利点の一つです。コンテナを壊すと、ファベルジェの卵のように、中には宝物が含まれています。

コンテナの制約は特徴でもあり欠点でもあります。一方で「作品は単なる言葉やフレーズや事実の袋ではなく、その著者に特有の方法で構造化されたもの」です。他方で、コンテナを作成する際、著者は本の制約により削減、拒否、再執筆、再構成を余儀なくされました。作品は磨かれましたが、蒸留され、何かが失われ（他のものが得られ）ました。

人々が長いノンフィクションの本を読まないのは、一部にはウェブ上で遭遇するすべてのテキスト、メールを含む、をスキミングすることに慣れてしまったからです。「本の要約」モデルも失敗します—消化不良の250ページのノンフィクション本の代わりに、消化不良の8ページの要約を手に入れるだけです。

本はランチボックスのようなものです—すべての物が一つの場所にあるのです。でも私はクッキーだけが欲しいのです。

確立された著者がその鎖を解き放つのは簡単ではないでしょう。しかし、そうすることを学ばなければ、新しい世代の熟練した研究者や作家に追い越される危険性があります。彼らは、場合に応じて、形式的なコンテナを使用することなく、自分を表現することができます。コンテナはあまりにも多くの制限を課し、制約を課します。

結局のところ、執筆のビジネスは取り返しのつかないほど変わってしまったのです。これは書記の終焉のようなものです。この場合、修道士のような著者たちは机の後ろから抜け出し、本に対するコンテナイズされた見方から離れ、形式と読者と関わる必要があります。

ああ、著者の反論はよく知っています：でも私は作家です、私はプロモーターではありません。ソーシャルメディアにはいません。私の読者と実際にコミュニケーションを取ることには興味がありません。私の作品と時折のメール、そしてますます稀になる登場だけです。ウェブサイトを持っていますが（実を言うと、更新したことはありません）。私の作品は読者への贈り物です。彼らは私の作品を受け入れるか、拒否するかのどちらかです。しかし、彼らのリビングルームに参加することはありません。

さて、巻物とイタチの血から作られたインクを片付けることができます。「著者」という職業は、今や机の後ろから抜け出し、読者が住んでいるリビングルームや彼らのFacebookページに行くことを要求しています。これをいくら嘆いても、あなたの助成金やテニュア、出版の機会を閉鎖するだけです。これは出版社なしの、読者と作家の新しい勇敢な世界です。読者はあなたの作品を最も大切にしている人々です。

これにより、素晴らしいナラティブノンフィクション本が調整された観衆に届くことが妨げられることはありません。逆に言えば。 そうした本は引き続き輝き続けるでしょう。ベストセラーのノンフィクションは依然として存在しますが、経済的にはトップセラーの作家以外には不可能だとわかるでしょう。現在のモデルが新しいモデルの繁栄を妨げる必要はありません。

これらの素晴らしいノンフィクション本を「美しい」と考えています。「美しい」とは、美しく書かれ、丁寧に編集され、注意深く設計され、FSC認証の紙に印刷されたという意味です。これらはブティックで販売されます。

そのブティックは「書店」と呼ばれますが、すべての特徴はブティック小売店の特徴を持っています—素敵な物品、オーナーとマネージャーによって注意深く選ばれた物、少し高価ですが、そのような物を大切にする人々にはその価値があります。

ほとんどのノンフィクション著者の任務は、コンテナだけでなく、ゲートキーパーとしての出版社を超えることです。

複数のメディアにおけるコンテンツコンテナ

読者層、特に若者層はますます「メディアにとらわれない」傾向があります。エンターテイメントや知識を求めて、YouTubeやTikTokのビデオ、Netflixのシリーズ、Spotifyでのリスニング、Instagram（インスタ）のスクロール、ニュースのチェック、時折の本の読書などを行います。

（印刷本を愛するBookTokの住人は貴重な影響者グループですが、全体の市場への影響は控えめです。）

しかし、市場モデルは依然としてユニークなコンテナに焦点を当てています。出版業界。映画業界。テレビ業界。音楽業界。

映画は本ではありません。YouTubeのビデオは映画ではありません。ポッドキャストはオーディオブックではありません。

これらのサイロは歴史的な必然ではなく、時間をかけて強力な組織によって行われた一連のビジネス決定の結果です。

一つのコンテナに基づいたビジネスモデルを混乱させるのは難しくありません。

言語を駆使する能力を持つ現在の生成AIは、音声、画像、ビデオをさらに大胆に生成します。AIはこの本にオーディオブックを多言語で提供し、電子書籍の31の翻訳版も提供します。これらはすべてAIなしでは到底実現不可能です。従来の制作経済学では私には意味がありません。

コンテナサイロ

コンテンツクリエーターは伝統的に単一のコンテナサイロで卓越するように訓練されています。私たちにはライティングプログラムや映画プログラム、音楽プログラムがあります。クリエイティブライターが映画や音楽を「副専攻」することがあるとはめったに思いません。あるいはコンピュータプログラミングやアプリ開発でも同様です。

トランスメディアはどうなったのでしょうか？Appleがかつて表現したように「デジタルメディアの達人」を育てるプログラムはどこにあるのでしょうか？

最高のコンテンツは常に勝ちます。しかし、時間が経つにつれてコンテンツのコンテナはますます重要でなくなります。デジタル世代はコンテナに無関心ではないかもしれませんが、コンテナに柔軟です。彼らはほとんどのコンテンツにスマートフォンを通じてデジタルで出会います。印刷物は観客を見つけ続けるでしょうが、もう中心を支配することはないでしょう。

「未来の出版社」はコンテナに柔軟である必要があります。コンテンツ配信の成長の大部分は紙に印刷されたインクやEPUBファイルの中の言葉ではありません。オーディオブックの成長は偶然ではなく、YouTubeやTikTokの人気も同様です。

より大きな課題は、新しいコンテンツと既存のコンテンツをその形態にかかわらず発見可能にし、発見された後にその認知を購入決定に変える必要性です。

発見とコンバージョン

オンラインでの発見の問題はしばらく前から存在していました; AIがこれを作り出したわけではありません。この問題は業界のベテラン、マイク・シャツキンが何度も強調してきたものです。印刷物では多くのタイトルが利用可能で、デジタルフォーマットではそれらが継続的に印刷された状態を保ちます。何百万もの絶版の本が古本屋で見つかります。それに加えて、毎年200万冊以上の新しい本が英語だけで出版されています。AIは飽和問題を悪化させるでしょうが、すでに手に負えない状況です。

Amazonのアルゴリズムは無私ではありません—それは売れるものを表面化するのが非常に上手です、次に購入する可能性が最も高い本です。その本は単に売上高だけで特徴づけられているわけではありません。ある詐欺師がオンラインリストを最適化したから最も売れたわけではありません。それは最高だったから最も売れたのです、そして満足した読者がオンラインでも対面でも他の人にそれを買うように伝えました。（Amazonはそのアルゴリズムを歪める広告を奨励しました、プラットフォームの腐敗化の一部です。）

上でメタデータについて話しました。コンバージョンは発見と同じくらい厄介です。AIはブラウザをバイヤーに変える手助けを作家に提供できるでしょうか？

著作権の未来

著作権の概念はAIによって馬鹿げたものになりました。人々が自分の作品の保護を望んでいないわけでも、保護されるべきでないわけでもありません—むしろ保護されるべきです。そしてAIが著作権を（現在の形ではなくとも）執行不能にするわけでもありません。

それは「著作権の保護」があなたの作品を消滅させるベールにもなるということです。あなたの本がChatGPTとの会話で参照されなければ、それは事実上存在しないことになります。AI企業はコンテンツのクリーム・デ・ラ・クリームだけをライセンスするつもりです。彼らはスキムミルクは必要ありません。

見つけられないものを保護する意味は何でしょうか？

ここで発見の問題が災害になる可能性があります。Googleはメタデータを通じてのみ本を発見するのが得意です。AIは全体の内容を求めています。従来の検索エンジンとは異なり、AIは作品についての抽象的なメタデータのみに基づいてユーザーのクエリに応答するわけではありません。

同時に、書籍全体以外のコンテンツコンテナを変更することは、異なる種類の著作権の課題を示唆しています。読者の入力に応じて本のテキストが即座に変わる場合、そのテキストの著作権はどうなるのでしょうか？

著者と読者

出版社は著者を必要としますが、著者は出版社を必要としません。

出版の未来は、著者と読者の親密な関係にあります。それは、著者と出版社、読者と出版社の関係よりもはるかに強力です。出版社は、著者と読者の関係において障害となることがあります。多くの場合、彼らはその関係を促進するのではなく、妨げています。

長い間、高品質な書面によるコンテンツにアクセスする唯一の方法は、本や限られた数の定期刊行物を通じてでした。それはもう事実ではありません。他のメディアの誘惑は別として、今では（コンテナ化されていない）高品質な書面によるコンテンツにアクセスするためのさまざまな方法があります。本はかつて享受していた優位性をもはや持っていません。

AIがコミュニケーションできる

「次に読むべき完璧な本は何ですか？」生成AIは、その質問にこれまでにない優雅さと正確さで答えることができます。AIが信頼できるレコメンダーエンジンになるにつれて、著者はそのエンジンを通じてコミュニケーションする必要があります。（もちろん、Amazonはこの分野で取り組んでおり、あなたが以前に購入したものを知っているという利点があります。）

結論

それでは、私たちはどこにいるのでしょうか？

出版が直面する課題を記録する必要があると感じました。チャットAIは、商業出版が問題を抱えている時期に登場しています。業界が堅調で、「新しい技術は必要ない、私たちはうまくやっている」と言える時期ではありません。

上で述べたように、出版が直面する最も差し迫った課題は、コストの上昇と利益幅の縮小です。

狼たちは、ますます急な割引を要求し続け、その要求は満たされることはありません；利益幅は改善されません。小売価格はほぼ上限に達しています。現在の商業出版モデルの未来は、コスト削減にかかっています。

給与はこれ以上下げられないので、生産サイクル内でコストを削減する必要があります。

しかし、出版社は数十年にわたり生産コストを削減しようとしています。いくつかの顕著な成功がありましたが、現在のオプションは尽きています。

AIがワークフロー全体で出版に効率をもたらすことができることを示しました。それらは即時ではなく、簡単でもありません：AIに取り組む必要があります。しかし、機会はあります。

出版社は人員削減を目指しているわけではありませんので、目標は現有のスタッフリソースを基に、市場により迅速に多くの本を投入することです。AIツールはその目標を達成するのに役立ちます。

そしてもちろん、出版される本の販売部数を増やすという目標も常にあります。AIもここで役立つことができます。

上で述べたように、AIは出版の未来においても変革をもたらすことができます。

そのことについて心配しないでください。まずは自分の家を整え、さらに話を進めましょう。

単一のリソース

AIに関する情報を提供するための資料が今ではほぼ無限にあります。もちろん、多すぎます。あなたの好みの媒体を選んでください：本、ブログ、ニュースレター、ビデオ、ポッドキャスト、コース、そして占い。私はこの本を通じていくつかの重要な情報源にリンクしていますので、いくつかのランダムなリンクをクリックして、どこに連れて行かれるか見てみる価値があります。

初心者にとって唯一の優れたAIの本は、2024年4月初旬にリリースされたEthan Mollickの『Co-Intelligence』です。それは彼の同様に優れたニュースレター「One Useful Thing」から取材されています。

サイドノート：この本を書くための資格

この情報を紹介で提供したくなかったのですが、今日のAIについて執筆している人々に懐疑的な人々が多いことを認識しています。これらの著者は自分たちを現代のAI専門家として位置づけていると疑われています。確かにそのような人もいるでしょう。このプロジェクトに取り組むための資格があることを望んでいます。

私は1988年に人工知能についての最初の本を読みました。それは、テリー・ウィノグラードとフェルナンド・フローレスによるUnderstanding Computers and Cognition: A New Foundation for Designという、2年前に出版された本でした。この本は難解で、ほとんど理解できませんでしたが、出版における人工知能の可能性に初めて興奮しました。

その頃には、デスクトップパブリッシング、Appleコンピュータ、PageMakerなどの爆発的な普及に伴い、出版のデジタル化に深く関わっていました。1986年には、Page Oneという自動書籍出版ソフトウェアの開発を監督しました。このプログラムは、Microsoft Wordファイルとしての原稿を数分で全書籍に組版することができました。今日はそれが非常に簡単に行えますが、当時はそうではありませんでした。

その後も、Adobe、Apple、Microsoftなどの主要なソフトウェアおよびハードウェアベンダーと一緒にコンサルタントやアナリストとして出版技術の分野で働き続けました。また、Enfocusというソフトウェア会社に関与し、部分的に所有していました。我々は製版作業のための自動化システムを作成しました。

その時点ではAIにアクセスできませんでしたが、完全に自動化された出版生産システムを解放するのが得意でした。AIが魔法のように見えることがあるように、最高の自動化もAIのように見えることがあります。

2016年に早送りし、同僚のCliff Gurenが私が出版におけるAIに注目するのを助けました：ついに何かが起こり始めたように見えました。2016年9月にThe Bestseller Code（ArcherとJockers著）が登場し、コンピュータが文学の質感を高い洞察力と精度で解釈できることを明らかにしました。

その時点で、出版スタートアップに注目しており、少数の企業がソフトウェアにある程度のAI技術を組み込んで登場しました。

さらに2022年10月に早送り。

出版業界で話題になる数ヶ月前に、Tim O’ReillyがPageBreak Conferenceで「AIと出版の変革」について発表しました。O’Reillyは出版コミュニティでよく知られており、O’Reilly MediaとTools of Changeカンファレンスで有名です。彼はテクノロジー界のトップビジョナリーの一人です。

O’Reillyは新しいAIの進歩に対して単に熱狂的なだけでなく、非常に興奮していました。「1992年にワールドワイドウェブを発見したときと非常に似たポイントにいます」と述べ、「これはVisiCalc、PC、ウェブブラウザと同じくらい変革的です」と続けました。

彼は（その時点では）ユースケースがまだ曖昧であると認め、O’Reilly Mediaでのいくつかのパイロットプロジェクトを指摘しました。しかし、彼は「これは恐ろしいほど早く良くなっています。機械学習はもう未来のものではありません。これはAIの民主化に関するものです」と言いました。

O’Reillyは出版社がこれらの新技術にどのようにアプローチすべきかについて話し、「船を燃やして全力で取り組む時があります。コミットしなければならない時があります」と述べました。

ChatGPTはその1ヶ月後にリリースされました。PageBreakは、ティムの洞察を通じて、最初にこれを前面に押し出した出版会議でした。

開示

この本には5人のスポンサーがいます。本を書く際に、多くの利益が見込めないことは分かっていたため、スポンサーを招いて努力を支援してもらうことにしました。

私がウェブサイトで示しているように、コンサルタント、アナリスト、ジャーナリストとして働いている中で、私は国際ジャーナリスト連盟のグローバル倫理憲章を支持しています。第13条は、利益相反や「（私の）活動と広告やプロパガンダの混同」を避ける義務について明確に述べています。

スポンサーがいることは利益相反と広告の混同を意味します。もし私がニューヨーク・タイムズで働いていたら、簡単です：「いいえ」。自分自身のために働いているため、開示がこれらの義務を満たすための武器です：私は受け取った対価を説明し、あなたが私の仕事でそれが影響を受けたかどうかを判断できます。

このプロジェクトに招待したスポンサーは、その仕事だけでなく、彼らの組織に関わる個人にも精通していたために選びました。彼らは同僚であり友人です。彼らには、この本の中で彼らの製品について言及するかもしれないが、その言葉をコントロールすることはできないと伝えました。彼らがコントロールできるのは、本の最後に掲載される広告だけです—それをそのまま掲載しました。

この本の執筆に影響を与えた可能性のある他の支払いも受けました—以下に列挙します：

この本に記載されたAIベンダー（スポンサーを含む）に対して有償のコンサルティング業務は行っていません。
2023年9月のPublishers WeeklyのAIウェビナーに対して、一部の収益分配を受け取りました。
Publishers Weeklyの記事には標準料金で支払われています。

これらの関与から生じたかもしれない偏向を検出した場合はお知らせください。AIに対する偏向は、巨額の利益が流入する前から形成されていました。

謝辞

Publishers Weeklyのサポートがなければ、AIについて信頼性を持って話すことはできなかったでしょう。特に名誉編集長のジム・ミリオットとCEOのセビン・ブライアーマンに感謝します。ジムは私の初期のAIに関する執筆をサポートし、セビン（クリスタ・ラファネロとチームの他のメンバーと共に）は昨年秋の会議AIと出版革命の成功に重要な役割を果たしました。現在、アンドリュー・アルバネーゼがPWの編集長を務めており、エド・ナウォトカがシニアエディターを務めています。彼らと一緒に働けることを幸運に思います。

さらなる感謝を以下の多くの同僚に…

ピーター・ブラントリー
長年の仲間であり私の草稿を洞察深く読んでくれるクリフ・グレン
価値あるフィードバックを提供してくれた2人の「ベータ」版読者、ジョー・ウィケルトとブラッド・ファーマー
出版技術パートナーのケン・ブルックス、ビル・カスドーフ、ビル・ローゼンブラット、ビル・トリッペ、スティーブ・シーク、そして新しいパートナーのレッティ・コンラッドとリンダ・セコンダリ
出版スタートアップデータベースを最新に保ち、常に私の努力を活気づけてくれる妹のアン・パシュリー
毎月のAIウェビナーでのパートナー、ブロック・ホーンとBISGのブライアン・オリアリー
私の本のアクセシビリティ問題を深く掘り下げる手助けをしてくれたビル・カスドーフ
私の疑問に辛抱強く対応し、Leanpubプラットフォームで最良の結果を提供するプロセスを助けてくれたピーター・アームストロングとレン・エップ
オーディオブックのサポートをしてくれた ElevenLabs の Hugo Rayne。
私の執筆や論理の欠点を見つけてくれる良き友人、Bob McArthur。

付録：伝統的な出版の残る利点の探求

伝統的な出版の名声は、私たちがこの業界に参加した理由です。私たちは本が大好きで育ち、大学で英語やそれに類するものを学び、しばらくさまよい、書店で働いたり、出版の修士証明書を取得したりして、出版会社でインターンとして働き、今ここにいます。あなたは仕事が大好きですが、給料は悪く、働く環境も常に快適とは限りません。

その同じ名声が出版のサプライチェーンを支えています。サプライチェーンの入力側では：多くの作家にとって大いに意味があります。私たちはいつもそれを目にします。伝統的な出版の経済学は全く意味を成さず、印刷に至るまでに4倍の時間がかかりますが、もしかしたら、私は Delia Owens (ザリガニの鳴くところ) のようなデビューウィナーや、Amor Towles (モスクワの紳士) のような二度目のメガスターになるかもしれません。

それはラスベガスのようなものです：ただしネバダ州の方が確率は良いです。ルーレットで一つの番号に賭けると、勝率は36対1です。伝統的な出版に賭けると、確率は…はるかに悪いです。

大手5社のうちの一つでさえ、伝統的な商業出版社との契約を得る確率は低いです。しかし、それは作家の問題の中で最も小さいものです。実際に読者を見つけることがメガチャレンジです。

ベストセラーリストに乗ることが助けになるかもしれません。

Penguin Random House（PRH）を考えてみましょう。この会社は毎年15,000の新しいタイトルを発行しています。2021年には196冊の本をPublishers Weeklyのベストセラーリストに載せることができました。リンク先の記事が強調しているように： “PW は、成人向けのベストセラーリストを4つ公開しています。それぞれに20のタイトルがあります：ハードカバーフィクション、ハードカバーノンフィクション、トレードペーパーバック、マスマーケットペーパーバック。つまり1年間で、ハードカバーポジションに2,080、ペーパーバックポジションに2,080の枠があることになります。

すべてのベストセラーがその年に新たに発行されたわけではありません—90%がそうだったと仮定しましょう、1870の枠があります。

一方ニューヨーク・タイムズには、各書籍カテゴリごとに週に15のベストセラースロットがあります（フィクション、ノンフィクション、子供向け；YAとハウツーの別リスト；ハードカバーとペーパーバックの別リスト、さらに合併リスト）。個々の作家にとって、年間780の利用可能なスロットがありますが、そのほとんどはリピートセラーで埋められています。(The Body Keeps the Score by Bessel van der Kolk はペーパーバックリストに5年半も載っています！) なので、それを半分に分けると、390の利用可能なスロットになります。その一つを得るためには多くの本を売らなければなりません。

ニューヨーク・タイムズ・ブック・レビューのカバレッジはどうでしょうか？2016年、当時のレビューの編集者である Pamela Paul は、次のように主張しました「タイムズのブックレビューは、毎年発行される本の約1%をレビューしています。」明らかに彼女が言っているのは大手出版社からの本の1%です—彼女は小さな出版社や自費出版の著者のことを考えていないに違いありません。したがって、PRHの15,000の新しいタイトルのうち、年間でレビューされるのはおそらく150冊です。

ほとんどの観察者は、主要なメディアから注目を集めることが依然として重要であり、強力である一方で、レビューの影響はかつてほどではないと同意しています。その主な理由は、多くの書籍読者が主要なレビューアウトレットと関わらなくなったからです。

供給チェーンの下流である流通に目を向けましょう。出版社のブランドは著者に対して重みを持っていますが、他の多くの消費財とは異なり、出版社のブランドは書籍の購入者や読者にはほとんど重みを持ちません。しかし、流通業者や書店には非常に大きな重みを持っています。これは、出版業界が歴史的に企業対企業（B2B）であり、消費者向け（B2C）ではなかったことを反映しています。出版社のステータスは流通と小売チャネルを通じて普及されます。Barnes & NobleはPRHからの本を取り扱い、それを買い手の目の前に置きます。こうしてステータスは読者に普及されます。

スポンサー

「BOOK ADVISORS LLC 出版社向けの取引サービスとコンサルティング」と書かれたバナー

David Lamb と Susan Reich は2016年にBook Advisors LLCを設立し、出版業界の合併と買収に関するコンサルティングを行っています。これまでに十数件の取引を完了し、公正市場評価を含む様々な財務、流通、運営コンサルティングプロジェクトを手掛けてきました。最近では、 Clarke & Esposito 、The Future of Publishingの Thad McIlroy 、Ku Worldwideの Kuo-Yu Liang と提携して業務を行いました。

私たちは関係構築、勤勉さ、そして秘密保持に誇りを持っています。購入、販売、資金調達、またはコンサルティングに興味がある場合は、ぜひ秘密厳守の上、ご相談ください。

bookadvisorsllc.com | bookadvisors@gmail.com

3x2のバナーグリッド：Papercutzが2022年8月にMad Cave Studiosに買収されたことを発表するバナー（Ku Worldwide LLCと提携して）、DAW Booksが2022年7月にAstra Publishing Houseに買収されたことを発表するバナー（Ku Worldwide LLCと提携して）、Caslon Publishingが2022年4月にBrookes Publishing Co.に買収されたことを発表するバナー（Thad McIlroyと提携して）、B.E.S. Publishingが2021年11月にSourcebooksに買収されたことを発表するバナー、Applewood Booksが2023年4月にArcadia Publishingに買収されたことを発表するバナー、Erewhon Booksが2022年10月にKensington Publishingに買収されたことを発表するバナー

Firebrand Technologies は、書籍出版社にデータおよび作業管理ソリューションを提供して35年以上の歴史を持つソフトウェアおよびサービス会社です。

NetGalley は、出版社や著者をレビューアー、図書館員、書店員、メディア、教育者と結びつけ、新しい本を発見し、それを彼らのオーディエンスに推薦するオンラインプラットフォームです。

Firebrand TechnologiesとNetGalleyはソフトウェアおよびデジタルソリューションの開発者であり、出版コミュニティの積極的なメンバーでもあります。私たちのソリューションは、出版プロセスのすべての側面に利益をもたらします。取得から販売、マーケティングまで。

NetGalley は出版社がタイトルの話題を作り、迅速なフィードバックとレビューを受け取り、早期のトレンドを発見するのに役立ちます。
Title Management Enterprise およびそのコンパクトバージョンである Title Management Lite は、出版プロセス全体を通じて高度な作業管理を提供するFirebrandのコアソフトウェアアプリケーションです。
Eloquence on Demandは、出版業界で最も強力なONIX配信プラットフォームであり、ONIXおよびその他の形式で600以上の取引パートナーにメタデータとデジタル資産を配信しています。
Flywheelは、バックリストのマーケティングサービスであり、バックリスト内の隠れた機会を特定して、発見可能性と売上を向上させます。
Eloquence on Alertは、市場のライブタイトルデータとトレンドを監視し、出版社に販売に影響を与える重要な誤りや機会（購入ボタンの欠如、第三者の販売者など）について通知します。
FlightDeckは、最も高度なEPUB検証およびテストツールです。

NetGalleyが提供するさまざまなサービスを示すインフォグラフィック。書籍のプロモーション、出版ワークフロー管理、メタデータ配信、売上およびバックリストマーケティング、EPUBテストなどが含まれます。

Perfect Boundのバナー。出版社と世界中の印刷業者をつなぐマーケットプレイス。

より良い方法で書籍を印刷するための歓迎の言葉

Perfect Boundは、数年間出版業界を悩ませてきたサプライチェーンの問題に対処するために2022年に創設されました。印刷業者の過剰生産能力の期間は、供給不足による遅延の短い期間に続きます。Perfect Boundは、世界中の印刷業者が独立した出版社や著者と簡単に接続してビジネスを行えるようにすることで、印刷市場を開放しようとしています。

Perfect Boundとは何ですか？

Perfect Boundは、米国、カナダ、コロンビア、ブラジル、トルコ、中国、マレーシア、インドなどの独立した書籍出版社と印刷業者をつなぐ双方向のマーケットプレイスです。

ワンクリックで新しい出版パートナーを発見

当社の強力なプラットフォームにより、製品の見積もりを簡単に作成し、ボタン一つで何百もの印刷業者にリクエストを送信し、印刷実行を交渉および確定し、製品を印刷機から倉庫まで追跡することができます。印刷業者として、新しい出版社との接続、今後のプロジェクトへの入札、および支払いの受け取りがこれまでになく簡単かつ安全になりました。

瞬時に新しい出版パートナーと接続

世界中から印刷リクエストを送受信
印刷機から倉庫までの印刷実行を実行および追跡
プラットフォームを離れることなく、Stripeを通じてACH決済をシームレスに行う

perfectbound.io

自動広告で書籍を販売するShimmrの広告。売上の35％増加と広告費の2倍のリターンを示しています。

Shimmrの広告。例の広告、価格情報、デモを予約するためのQRコードが含まれています。

出版社向けに特化したAIプラットフォーム、Insightをご紹介

“Insightを採用したことで、出版社の業務が自転車からフェラーリに変わったような感じです。突然、すべてが速く動くようになりました。”

—-ドイツの児童書出版社とInsightの顧客

よりスマートに働き、より多くを達成

Veristageによって開発されたInsightは、進化するAIの世界で出版社が成功するために力を発揮します。AIと強力なデジタルツールのスイートを使用して、Insightはあなたの文書や書籍を分析し理解します。そして、それを助けるために：

メタデータの作成、改善、更新
タイトル固有のマーケティング、パブリシティ、販売資料の作成のスピードアップ
書籍の主要メッセージ、独自の売りポイント、ターゲットオーディエンス、競合タイトルなどの特定と評価
マーケティングおよび販売コンテンツを最適化し、最大のリーチ、エンゲージメント、売上の増加を実現

Insightは、一般的なAIプラットフォームとは異なり、出版のワークフロー内で機能するように設計されており、出版特有の情報と資産を作成するのに役立ちます。

作業の流れ

本をInsightプラットフォームにアップロード
InsightのAIツールがあなたの本を分析し理解します
数分で、Insightは編集、マーケティング、パブリシティ、販売、権利部門のための幅広いメタデータと重要情報を生成します
この情報のいずれかに手動で編集を加え、プラットフォーム内で直接行うことができます。あなたの本とAIコンテンツはInsight内に保存され、いつでもアクセスできます。
ドキュメント対応のAIチャットを使用して、タイトル情報を最適化し、本と対話し、コミュニケーションやその他の資料に本の詳細を取り入れます

セキュリティと著作権

Veristageチームは、出版社の知的財産を保護し、セキュアなAIサービスを提供することに尽力しています。当社のプラットフォームには高度な情報セキュリティシステムが導入されており、データを保存したり、将来のモデルをトレーニングするために使用したりすることのないAIモデルのみを使用しています。

すべての規模の出版社向けソリューション

Insightは、消費者向けから学術向け、3人のチームから多国籍企業まで、さまざまな規模の出版社に対応するように設計されています。競争力のある価格設定とスケーラブルなソリューションを提供します。

Insightがあなたのビジネスにどのように役立つかについて、お問い合わせください:

www.veristage.com

目次