Table of Contents
- Giới thiệu
- Tại sao AI lại quan trọng bây giờ?
- AI: Bắt đầu
- AI: Lịch sử rất ngắn gọn
- Hiểu về AI và Một Số Thuật Ngữ Chính
- Phần mềm AI: Những Hệ thống Nặng Ký
- Làm việc với phần mềm AI
- Đào tạo cho Chat AI
- Ảo giác: Con ruồi trong thuốc mỡ
- Còn Hình ảnh và Video thì sao?
- Phần mềm dành cho Nhà Xuất Bản Sách
- AI và Xuất bản Sách: Ngành Công nghiệp Đang Làm Gì Hiện Nay?
- AI và Xuất bản Sách: Các Công ty Xuất bản Đang Làm Gì?
- AI và Xuất bản Sách: Các Trường Hợp Sử Dụng
- Chiến lược tích hợp AI vào hoạt động xuất bản
- AI cho Sách Nói
- AI cho Dịch Sách
- AI cho Xuất bản Học thuật
- AI cho Tác giả
- Mối quan ngại và Rủi ro Xung quanh AI
- Sáng Tạo Có Thể Là Một Sáo Rỗng
- Một Suy Nghĩ Khác
- Những Điều Tốt Đẹp Ngoài Ngành Xuất Bản
-
Bài tiểu luận: Tác động của AI đối với ngành xuất bản sách
- Hậu quả thực tế của AI
- Ngành xuất bản đã suy thoái kinh tế trong nhiều thập kỷ
- Lương ngành xuất bản sách
- Ba (và một nửa) lợi thế còn lại cho các nhà xuất bản sách truyền thống
- Tự xuất bản
- Nhà xuất bản lai
- Xuất bản vượt ra ngoài các nhà xuất bản
- Đổi mới, công nghệ và xuất bản sách
- Tình thế tiến thoái lưỡng nan của người đổi mới
- Tiểu thuyết và phi tiểu thuyết
- Có phải tác giả đang đối mặt với mối đe dọa tồn tại?
- Sách chứa đựng những kho báu
- Các phương tiện chứa nội dung trong nhiều phương tiện truyền thông
- Các hộp chứa nội dung
- Khám phá và chuyển đổi
- Tương lai của bản quyền
- Tác giả và độc giả
- AI có thể giao tiếp
- Kết luận
- Một nguồn duy nhất
- Lưu ý bên lề: Thông tin xác thực về việc viết cuốn sách này
- Phụ lục: Khám phá những lợi thế còn lại của xuất bản truyền thống
- Nhà tài trợ
Giới thiệu
“Cuộc cách mạng tiếp theo sẽ làm chúng ta bất ngờ, như tất cả những cuộc cách mạng trước. Nói cách khác: nếu đám đông đang mong đợi cuộc cách mạng, nó không thể là cuộc cách mạng.” —Doc Searls, 2002
Đã hơn một năm rưỡi kể từ khi OpenAI giới thiệu ChatGPT với công chúng chủ yếu không quen thuộc với trí tuệ nhân tạo. Ban đầu nó dường như không có liên quan rõ ràng đến xuất bản sách. Kể từ đó, mọi thứ đã thay đổi. Và không có gì thay đổi. Các nhà xuất bản đang bắt đầu lấn vào các công cụ AI mới, khám phá các cạnh, và tham gia vào các cuộc trò chuyện dè dặt với ChatGPT. Nhưng không có dấu hiệu của một cuộc cách mạng thực sự trong thực hành xuất bản; chỉ là quá sớm.
Có rất nhiều sự không chắc chắn xung quanh AI trong việc viết và xuất bản. Nhiều tranh cãi lớn xoay quanh việc sử dụng AI. Tuy nhiên, đối với nhiều người, có sự phấn khích về những khả năng.
Tôi sẽ tập trung ở đây nhiều hơn vào lời hứa hơn là mối nguy hiểm, nhưng tôi cũng bao gồm một tổng quan về các mối quan tâm và rủi ro xung quanh AI đặc biệt là khi chúng áp dụng cho các tác giả và nhà xuất bản. Tôi không có ý định coi nhẹ các mối quan tâm. Chúng chỉ không phải là những gì cuốn sách này nói về.
Đây có phải là một cuốn sách không?
Tôi coi ấn phẩm này là một ‘cuốn sách nhỏ’ hơn là một cuốn sách. Định nghĩa của UNESCO về một cuốn sách là “ít nhất 49 trang” (tại sao không phải là 50?), và, ở mức 300 từ mỗi trang, cuốn này có thể không đủ tiêu chuẩn. Nhưng, quan trọng hơn, nó không nhằm là lời cuối cùng về bất cứ điều gì—nó giống như một báo cáo tiến độ hơn. Trí tuệ nhân tạo, và vai trò của nó trong xuất bản sách, đang thay đổi với tốc độ chóng mặt, không có dấu hiệu chậm lại. Vì vậy, cuốn sách nhỏ này, báo cáo này, chỉ là một bức ảnh chụp nhanh.
Sử dụng nền tảng Leanpub, tôi đã phát hành nghiên cứu và phân tích của mình như một công việc đang tiến hành—nó được sửa đổi như một tài liệu sống. Tôi chưa bao giờ thử điều này trước đây. Lý do của tôi là hai mặt: để cung cấp một cái gì đó hữu ích trong ngắn hạn, và có khả năng sửa đổi khi cần thiết. Câu chuyện AI còn lâu mới kết thúc.
Tôi hy vọng cách tiếp cận của tôi sẽ hữu ích cho người đọc, mặc dù tôi biết rằng quá nhiều cập nhật có thể sớm trở nên khó chịu. Tôi đã cố gắng giảm tính thời sự của cuốn sách này, để giảm sự tập trung vào những thứ sẽ thay đổi nhanh nhất.
Phiên bản đã được (âm thầm) có sẵn kể từ tháng 4 năm 2024 tôi đã đánh dấu là “hoàn thành 75%” và đã được cung cấp miễn phí cho người đọc. Ngày 23 tháng 7 là ngày xuất bản chính thức cho phiên bản “hoàn thành 100%”, sẽ được phân phối rộng rãi hơn ngoài Leanpub. Tôi sẽ tiếp tục cập nhật phiên bản 100%: nhưng những cập nhật đó sẽ chỉ có sẵn cho người mua Leanpub—thật không tiện khi liên tục cập nhật bản in, sách điện tử và sách nói được phân phối rộng rãi hơn.
Đau đớn của nhà xuất bản với chính AI
Tôi nghe hàng ngày về sự đau đớn mà mọi người trong ngành xuất bản đang phải đối mặt khi cố gắng làm quen với AI. Tại sao lại đau đớn như vậy? Dưới đây là ba lý do mà tôi thấy:
Công nghệ phức tạp và bí ẩn, quá phức tạp để những người không phải là nhà khoa học có thể hiểu. (Có một nghiên cứu thú vị đưa ra “thang đo lo lắng về AI (AIAS)” đo lường 21 lý do khác nhau mà mọi người lo lắng về AI.)
AI đã trở nên vô cùng gây tranh cãi trong xuất bản, chủ yếu là do các vấn đề bản quyền đánh vào trung tâm của việc viết và xuất bản.
Tuy nhiên, còn có một bầu không khí của FOMO—Nỗi Sợ Bỏ Lỡ. Mặc dù AI có nhiều sai sót, như với nhiều công nghệ hấp dẫn (đồng hồ Apple? Loa thông minh?), chúng ta đối mặt với cảm giác gặm nhấm: điều gì nếu tôi đang bỏ lỡ điều lớn lao tiếp theo, như tôi đã bỏ lỡ một vài điều lớn lao trước đây. Tôi cảm thấy ngu ngốc khi đó; tôi không muốn cảm thấy ngu ngốc lần nữa. Nó đau.
Được rồi: Có lý do rằng những người trong ngành xuất bản cảm thấy đau đớn về AI.
Vậy thì trường hợp sử dụng cho cuốn sách này là gì?
Trường hợp sử dụng là bạn làm việc trong ngành xuất bản sách, hoặc bạn là một tác giả đang cố gắng hiểu rõ hơn về ngành xuất bản sách, và bạn mệt mỏi vì cảm thấy ngu ngốc và bối rối về AI. Quá nhiều đồng nghiệp của bạn dường như hiểu nó tốt hơn bạn, và bạn mệt mỏi vì không thể tham gia vào cuộc trò chuyện một cách thông minh về chủ đề này.
Mục tiêu của tôi cho người đọc là, vào cuối cuốn sách này, họ sẽ cảm thấy có thể tham gia vào cuộc trò chuyện, để bày tỏ quan điểm thông thạo. Tôi muốn bạn cảm thấy được trang bị để đưa ra các lựa chọn cá nhân xung quanh công nghệ, và có một con đường để học cách sử dụng AI, nếu bạn chọn làm như vậy.
Tôi không muốn làm ngập độc giả với nhiều lý thuyết về nền tảng của công nghệ AI–tôi sẽ không nói nhiều về AI trong trừu tượng. Thay vào đó, tôi muốn cung cấp cho bạn một nền tảng về AI cụ thể cho việc viết và xuất bản sách. Nếu ai đó hỏi bạn, xử lý ngôn ngữ tự nhiên thực sự có nghĩa là gì, bạn có thể trả lời như tôi: Tôi không phải là chuyên gia về AI. Nhưng tôi biết cách AI đang được sử dụng trong ngành của mình.
Nó sẽ là những gì bạn cần biết chứ?
Tôi không thích cụm từ “những gì bạn cần biết” bởi vì nó hiếm khi đúng với sự thực, thường thiếu chính xác, hoặc quá nhiều hoặc quá ít so với những gì bạn cần biết. Liệu tôi có làm đúng không? Tôi nghiêm túc trong việc cố gắng truyền đạt tối thiểu những gì cần thiết. Tôi nghĩ rằng tôi biết những gì các nhà xuất bản cần biết về AI, vì tôi đã nói chuyện với nhiều người trong số họ, trong khi tổ chức các hội thảo và hội thảo trực tuyến được thiết kế rất cụ thể để cung cấp những kiến thức cơ bản.
Thay vì lặp đi lặp lại cụm từ “những gì bạn cần biết” tôi sẽ sử dụng một biểu tượng chìa khóa với một số văn bản thụt vào. |
Sau các bản tóm tắt giới thiệu nhiều phần, tôi sẽ mở rộng các khái niệm chính. Tôi cũng đã giữ chúng ngắn gọn nhất có thể, dù thành thật mà nói, đôi khi tôi cũng dài dòng.
Một dạng ngắn tôi sẽ sử dụng là “AI trò chuyện”. Khi OpenAI lần đầu tiên phát hành ChatGPT, nó là duy nhất, nhưng bây giờ có nhiều đối thủ quan trọng. Tôi sẽ đi vào chi tiết ngay sau đây, nhưng bạn đã nghe nói về một số trong số họ rồi, rõ ràng là Google và Microsoft. Họ (và một số công ty khác) giờ đây cung cấp phần mềm AI trò chuyện trực tuyến tương tự như ChatGPT. Và vì vậy thay vì nói “ChatGPT và các đối thủ” tôi sẽ chỉ đề cập đến toàn bộ danh mục là “AI trò chuyện”. Nếu tôi viết “ChatGPT” tôi sẽ đề cập cụ thể đến phần mềm của OpenAI.
Cuốn sách chủ yếu là thực tế, nhưng trong phần cuối cùng tôi đưa ra một bài luận về những hậu quả thực tế có thể có của AI đối với ngành xuất bản sách, cùng với một vài suy nghĩ suy đoán khác.
Cuốn sách này dành cho ai?
Đối tượng chính của cuốn sách này là các nhà xuất bản sách thương mại (người tiêu dùng). Đối tượng thứ cấp là tất cả các nhà xuất bản sách khác (học thuật, giáo dục…) trong chừng mực có sự chồng chéo trong các lĩnh vực công nghiệp này. Đối tượng thứ ba của tôi là các tác giả có lợi ích trong trò chơi, và nhiều người khác bị cuốn hút bởi ngành xuất bản sách.
Tiêu đề phụ nói rằng đây là hướng dẫn về AI cho cả nhà văn và nhà xuất bản. Một phần là vì tôi muốn các nhà xuất bản cũng hiểu những gì các nhà văn đang làm với công nghệ này. Tôi nghĩ điều đó quan trọng. Tại cuộc họp thường niên gần đây của BISG (Nhóm Nghiên Cứu Ngành Sách), tổ chức này chủ yếu đại diện cho các nhà xuất bản thương mại, đã chỉ ra rằng “họ đang tìm cách thu hút từ một nguồn rộng hơn bao gồm, các đại lý văn chương và các tác giả.” Đó là một động thái đáng hoan nghênh.
Tôi muốn các nhà văn đọc cuốn sách này, vì nó có thể giúp họ hiểu những gì các nhà xuất bản đang làm với bản thảo của họ. Các tác giả tự xuất bản luôn theo dõi xuất bản truyền thống, một phần vì họ, trên thực tế, là các nhà xuất bản tự xuất bản, và vì vậy công nghệ AI mà các nhà xuất bản quan tâm cũng có thể là mối quan tâm của họ.
Nhưng, hãy hiểu rõ, đây không phải là một hướng dẫn thực hành dành cho các tác giả về cách sử dụng AI để trở thành những nhà văn tốt hơn và năng suất hơn. Có rất nhiều cuốn sách về chủ đề đó (đáng buồn thay, nhiều trong số chúng chỉ là những cuốn sách lừa đảo trên Amazon). Và rất nhiều video trên YouTube (chất lượng khác nhau).
Trong ngành xuất bản sách thương mại, độc giả lý tưởng của tôi không nhất thiết phải là người ra quyết định, mà là một trong nhiều người làm việc trong ngành hàng ngày, tạo ra sách và tìm kiếm độc giả. Tôi sẽ nói về tất cả các chức năng chính của xuất bản trong cuốn sách này, từ biên tập đến bán hàng và phân phối. Và về sự giao thoa giữa các nhà văn và độc giả.
Mặc dù tôi lớn lên ở Canada và bắt đầu sự nghiệp xuất bản của mình ở đó, tôi sống ở San Francisco, Hoa Kỳ, và vì vậy tôi mặc định nghĩ về ngành xuất bản của Hoa Kỳ. Nhưng gần như mọi thứ trong cuốn sách nhỏ này nên có liên quan đến một nhà xuất bản ở Madagascar cũng như một nhà xuất bản ở Manhattan. Trong khi các nhà xuất bản ở các quốc gia nhỏ hơn đối mặt với các thách thức về quy mô, thì các nhà xuất bản nhỏ ở Mỹ cũng vậy, và cuốn sách này dành cho các công ty ở mọi quy mô.
Khi tôi nói chuyện với các nhà xuất bản nhỏ về AI, và khi tôi nói chuyện với các nhà xuất bản rất lớn về AI, sự khác biệt lớn mà tôi nhận thấy là khái niệm ‘doanh nghiệp’ xuất bản. Các nhà xuất bản lớn nhất thường là một phần của (hoặc liền kề với) các công ty công chúng, và một khi bạn là một công ty công chúng, các vấn đề về uy tín và an ninh trở nên lớn hơn nhiều so với các nhà xuất bản hàng ngày, không phải chịu trách nhiệm tương tự đối với cổ đông và truyền thông. Trong khi một biên tập viên tại một nhà xuất bản Big 5 có cùng mục đích sử dụng các công cụ AI như một biên tập viên tự do làm việc cho các đơn vị nhỏ hơn, thì bối cảnh mà họ sử dụng các công cụ là hoàn toàn khác nhau.
Bạn cần biết bao nhiêu về AI để đọc cuốn sách này?
Tôi giả định rằng độc giả của tôi hầu như không biết gì về nội tình của AI, nhưng họ là những người đọc thông minh. Vì vậy, tôi sẽ đi trên ranh giới giữa không có kiến thức và không nói chuyện hạ thấp độc giả.
Tôi tưởng tượng rằng hầu như mọi người đều đã nghe về thế hệ AI mới: một cuộc khảo sát của YouGov, vào tháng 3 năm 2024, cho thấy chỉ 7% người Mỹ biết “hoàn toàn không” về AI. Các nhà văn và nhà xuất bản gần như chắc chắn đã nghe về một số khiếu nại bản quyền, nhưng có lẽ không nắm rõ các vấn đề. Vì vậy, tôi không cần phải giải thích rằng AI là viết tắt của “Trí tuệ nhân tạo.” Nhưng tôi sẽ không giả định độc giả có thể định nghĩa AI là gì, nó có nghĩa là gì, tác động tiềm năng của nó, v.v. Đó là lý do tại sao bạn ở đây.
Khả năng tiếp cận, cả về mặt rộng và cụ thể
Châm ngôn của tôi khi xuất bản cuốn sách này là ‘khả năng tiếp cận.’
Đối với hầu hết mọi người, điều đó chỉ có nghĩa là ‘có sẵn,’ và, thực sự, tôi dự định làm cho cuốn sách này có sẵn trong nhiều hình thức và định dạng nhất có thể. Tôi muốn mở rộng bộ chứa. Tôi đang cố gắng làm cho cuốn sách của mình trở thành một ấn phẩm gương mẫu, nêu bật toàn bộ phạm vi những gì có thể đạt được ngày nay khi xuất bản một cuốn sách duy nhất.
Trên Leanpub, bạn sẽ thấy cuốn sách có sẵn dưới dạng tệp PDF, tệp EPUB và dưới dạng ấn phẩm web miễn phí. Bạn sẽ thấy các bản dịch sang 31 ngôn ngữ, bao gồm các ngôn ngữ chính ở châu Á và châu Âu. Sẽ có nhiều sách nói bằng các ngôn ngữ chính.
Tôi cũng sẽ làm cho cuốn sách có sẵn, dưới dạng in và kỹ thuật số, trên tất cả các nền tảng thương mại điện tử có thể truy cập qua Ingram và Amazon. Điều đó bao gồm hầu hết các trang bán sách trực tuyến, ở nhiều nơi trên thế giới. Bằng cách này, các thư viện cũng sẽ có thể mua cuốn sách, mặc dù, dễ hiểu, họ có ít không gian cho các tác phẩm tự xuất bản. (Tôi sẽ tặng các bản in và kỹ thuật số cho bất kỳ thư viện nào trên thế giới yêu cầu chúng.)
Bên cạnh phiên bản web miễn phí của toàn bộ cuốn sách, tôi sẽ tạo các đoạn trích miễn phí, một phần Hỏi & Đáp và các đồ họa thông tin, cho những ai chỉ muốn nếm thử hoặc lấy mẫu. Chúng sẽ có sẵn trên blog của tôi.
Không có lý do gì để quay video toàn bộ cuốn sách, khi sách nói đã có sẵn. Nhưng một số người thích truy cập nội dung qua video. Vì vậy, tôi sẽ cung cấp các phiên bản video rút gọn, với nhiều độ dài khác nhau.
Còn về yếu tố con người thì sao? Tôi cũng sẽ có mặt qua các hội thảo trực tuyến hoặc tư vấn trực tuyến một-một, qua trang web và blog của tôi. Tôi thậm chí có thể được thuê để xuất hiện trực tiếp!
‘Khả năng tiếp cận’ có nghĩa nhiều hơn định nghĩa từ điển của nó. Như những người tại Mạng lưới Quốc gia Canada về Dịch vụ Thư viện Bình đẳng (NNELS) đã đưa ra, “Một cuốn sách có thể truy cập là cuốn sách mà mọi người đều có thể sử dụng và hiểu được.” Và vì vậy tệp EPUB tiếng Anh của tôi đáp ứng khuyến nghị W3C 1.1 cho người khuyết tật về đọc, bao gồm các mô tả văn bản thay thế mạnh mẽ cho hình ảnh. Chúng tôi kỳ vọng sẽ đáp ứng tiêu chuẩn truy cập này cho các bản dịch ngôn ngữ nước ngoài.
Văn bản thay thế được tạo bởi ChatGPT. Tôi không chỉnh sửa phiên bản của ChatGPT, để bất kỳ ai đọc EPUB có thể thấy nó tốt như thế nào và điểm nào còn thiếu sót. Như đồng nghiệp của tôi, Bill Kasdorf nhắc nhở tôi, văn bản thay thế tốt mô tả những gì người đọc có thể nhìn thấy từ hình ảnh, không chỉ là nó trông như thế nào.
Đối với các nhà xuất bản sách, khả năng tiếp cận không còn là một tùy chọn: đó là một cài đặt mặc định.
(Tôi có hai mea culpas để chia sẻ: Do hạn chế trong các nền tảng xuất bản, tệp PDF mặc định sẽ không đáp ứng tiêu chuẩn PDF/UA, và tôi sẽ không thể cung cấp phiên bản in lớn của cuốn sách trên các trang thương mại điện tử. Nhưng cả hai đều có sẵn khi có yêu cầu.)
Một số công việc quản lý
Như đã chỉ ra, cuốn sách này (tương đối) ngắn. Khi bạn gọi một tài liệu ngắn là ‘một cuốn sách’ bạn có nguy cơ người mua phản đối, “Tôi nghĩ rằng tôi đã mua một cuốn sách, nhưng nó chỉ dài có 50 trang!” Tôi đã làm mọi thứ có thể để làm rõ trên trang bán hàng rằng đây không phải là một cuốn sách đầy đủ, nhưng nếu bạn thất vọng, hãy nhớ rằng Leanpub cung cấp bảo đảm hoàn tiền trong 60 ngày, và tôi sẽ vui vẻ kéo dài đề nghị hoàn tiền đó ‘mãi mãi.’ Tôi muốn độc giả hài lòng, không thất vọng. (Nếu bạn đã mua cuốn sách trên nền tảng khác, hãy email tôi: Tôi sẽ gửi séc!)
Cuốn sách này chứa rất nhiều liên kết siêu văn bản (chúng xuất hiện theo nhiều cách khác nhau trong các định dạng khác nhau, nhưng thường là dưới dạng chú thích cuối trang). Tôi luôn tin vào việc liên kết đến các nguồn gốc trong công việc của mình, để người đọc có thể kiểm chứng những tuyên bố đôi khi hoành tráng của tôi. Nhưng tôi cũng nhận thức rằng liên kết siêu văn bản và chú thích cuối trang có thể gây sao lãng, đặc biệt nếu bạn đang sử dụng một thiết bị đọc điện tử. Tôi xin lỗi vì điều đó. Cách tốt nhất là bỏ qua các liên kết khi đọc và quay lại chúng nếu bạn muốn tìm hiểu sâu hơn về một chủ đề.
Tôi không biết bạn đang đọc (hoặc nghe) ở định dạng nào ngay bây giờ. Cũng không biết bạn đang đọc bằng ngôn ngữ nào. Tôi đã cố gắng làm cho “công thái học” của cuốn sách này thân thiện với người dùng nhất có thể, nhưng các liên kết và chú thích cuối trang không phải lúc nào cũng tối ưu từ góc nhìn đó.
Cuốn sách này có nhà tài trợ, điều mà tôi biết là không bình thường đối với ‘một cuốn sách.’ Tôi giải thích cách tài trợ hoạt động trong phần ‘disclosures’ ở cuối văn bản.
Tại sao AI lại quan trọng bây giờ?
Khi tôi nói chuyện với các nhà xuất bản, tôi nghe thấy những mối quan tâm cấp bách, ngay lập tức. Và AI thường không phải là một trong số đó. |
Chi phí sản xuất in ấn tăng cao đã gây khó khăn trong nhiều năm, mặc dù hiện tại có vẻ như đang ổn định. Chi phí phân phối tăng cao đang thách thức tất cả các bên tham gia. Những điều này dẫn đến áp lực về giá cả – có bằng chứng cho thấy người đọc đang bắt đầu khó chịu với giá hiện tại của các cuốn sách bìa cứng và bìa mềm mới. Tôi xếp những điều này vào loại vấn đề ‘tương tự’ – công nghệ số mang lại ít giải pháp.
Sau đó là những vấn đề ‘tồn tại’ rộng lớn hơn, ngày càng được quan tâm, nhưng chúng là những vấn đề chưa rõ ràng, không có giải pháp rõ ràng. Bao gồm ở đây là:
Khám phá nội dung và tương tác với khán giả qua mạng và truyền thông xã hội.
Thay đổi hành vi tiêu dùng và thói quen đọc sách của người dùng.
Cạnh tranh từ các phương tiện truyền thông số khác.
Tôi tin rằng AI có thể cực kỳ hữu ích cho các nhà xuất bản trong các lĩnh vực này, nhưng các phương pháp không rõ ràng và sẽ mất thời gian để triển khai. Tôi sẽ mô tả điều này trong các chương sau của cuốn sách.
AI: Bắt đầu
Trước khi tôi đi vào nền tảng kỹ thuật nhàm chán, tôi mời bạn nhảy ngay vào phần mềm trực tuyến. Các công cụ hàng đầu đều miễn phí để trải nghiệm. Có ChatGPT. Và Claude.ai. Bạn có thể thử nghiệm với Microsoft Copilot. Hoặc thử Google’s Gemini.
Đó là cách hầu hết mọi người bắt đầu với AI – tôi cá là bạn đã thử một hoặc nhiều trong số những công cụ này rồi. Tôi cũng cá rằng bạn chưa thử chúng lâu. Hầu hết mọi người tôi nói chuyện chỉ dành vài phút. Họ thử vài câu hỏi, nhận lại vài câu trả lời khá rõ ràng, và họ chuyển sang việc khác.
Cách tiếp cận sai.
Tôi đồng ý với Ethan Mollick, người mà tôi sẽ mô tả vài lần trong cuốn sách này. Trong blog của mình và trong một buổi phỏng vấn gần đây, Mollick nói về ‘nguyên tắc 10 giờ’ của mình:
“Tôi muốn chỉ ra rằng 10 giờ là tùy ý như 10.000 bước. Như, không có cơ sở khoa học cho nó. Đây là một quan sát. Nhưng nó cũng đưa bạn vượt qua việc, tôi đã chọc vào cái này trong một buổi tối, và nó đưa bạn đến việc sử dụng nó một cách nghiêm túc. Tôi không biết liệu 10 giờ có phải là giới hạn thực sự hay không, nhưng có vẻ như nó khá là biến đổi. Chìa khóa là sử dụng nó trong lĩnh vực mà bạn có chuyên môn, để bạn có thể hiểu nó tốt hay xấu ở đâu, có thể học được hình dạng của khả năng của nó.”
Một người bình luận khác, khi xem xét cuốn sách gần đây về AI của Mollick, đã chỉ ra một ‘nguyên tắc mười’ đúng đắn không kém: “Một giờ thử nghiệm với những công cụ này đáng giá hơn mười giờ đọc về chúng.”
Bạn hiểu ý rồi đó. Đây là về việc làm, không phải suy nghĩ. Cuốn sách của tôi là một suy ngẫm. Bạn cần phải tự mình trải nghiệm.
AI: Lịch sử rất ngắn gọn
Cho đến vài năm trước, người bình thường chỉ nghe về AI như một khái niệm trừu tượng, hoặc là khoa học viễn tưởng hoặc là thứ có thể đánh bại một đại kiện tướng cờ vua hoặc cờ vây. Đột nhiên AI ở khắp mọi nơi, tạo ra ấn tượng sai lầm rằng nó mới. Ngay cả những thứ mới cũng không thực sự mới. Nhưng đó là một điểm không cần bàn cãi. AI có ý nghĩa rất ít đối với xuất bản sách trước ChatGPT. Bây giờ nó có ý nghĩa rất nhiều. |
Hiểu về quá trình phát triển khoảng 70 năm của AI có thể rất thú vị, nhưng không cần thiết để đánh giá cao những gì đang diễn ra ngày nay.
Our World In Data làm rất tốt việc ghi lại ngắn gọn lịch sử–tôi sẽ để lại cho họ.
Thế hệ AI hiện tại được phát triển chủ yếu trong thập kỷ qua. Sau đó, đột nhiên, ChatGPT xuất hiện vào ngày 30 tháng 11, 2022. Hai tháng sau, nó đã có 100 triệu người dùng hàng tháng, tốc độ nhanh nhất mà bất kỳ công nghệ nào từng tiến vào không gian tiêu dùng (để so sánh, Facebook mất hơn hai năm để đạt được 100 triệu người dùng).
Tại sao lại được chấp nhận nhanh chóng như vậy? Thứ nhất, nó thú vị và vui. Thứ hai, nó miễn phí. Thứ ba, bạn không cần mua thiết bị mới để sử dụng nó. Và thứ tư, bạn không cần bất kỳ đào tạo nào để truy cập ChatGPT (hoặc các đối thủ Chat AI của nó). Nhưng những yếu tố đó cũng áp dụng cho Facebook, vậy tại sao lại là ChatGPT?
Như Arthur C. Clarke nổi tiếng đã nói, “Bất kỳ công nghệ tiên tiến nào đủ đều không thể phân biệt được với phép thuật.” Chat AI là phép thuật. Trải nghiệm ‘nói chuyện’ bằng ngôn ngữ hàng ngày với một máy móc… giống như phép thuật. Trải nghiệm nói “Tôi muốn một hình ảnh của một cuốn sách trong một khinh khí cầu trong một đám mây gần mặt trời,” và, vài giây sau,
… cũng phép thuật. Các hình ảnh được tạo bởi GPT bắt đầu trông giống nhau về phong cách, đầy màu sắc và kỳ ảo. Vì vậy, tôi đã gửi một lời nhắc thứ hai “bây giờ theo phong cách trông giống như một minh họa thế kỷ 15.” Và vì vậy:
Nếu tôi muốn một video về một cuốn sách trong một khinh khí cầu trong một đám mây gần mặt trời, có hơn một chục công cụ để lựa chọn, và presto. Và một nhạc nền cho video. Vậy, điều này nghe như thế nào? Nó giống như phép thuật.
Vì sợ có vẻ coi thường khả năng phi thường của AI bằng cách xếp nó vào loại “phép thuật” không thể hiểu được, thật thú vị khi biết rằng nhiều nhà khoa học chịu trách nhiệm cho thế hệ AI hiện tại thừa nhận rằng họ thực sự không hiểu chính xác cách nó hoạt động. Như một báo cáo trong số gần đây của MIT Technology Review đã lưu ý, “dù đã thành công rực rỡ, không ai biết chính xác cách —- hoặc tại sao —- nó hoạt động.” Thú vị, nhưng hơi đáng sợ.
Hiểu về AI và Một Số Thuật Ngữ Chính
AI đi kèm với vô vàn công nghệ và thuật ngữ, phần lớn là không thể hiểu được đối với tất cả ngoại trừ các nhà khoa học dữ liệu. Người dùng của Chat AI không cần phải hiểu sâu về các thuật ngữ AI hay các khái niệm kỹ thuật liên quan. Tính chất đàm thoại của hệ thống cho phép tương tác trực quan mà không cần kiến thức chuyên môn về cách mọi thứ hoạt động. Tập trung vào những gì Chat AI thực sự có thể làm là quan trọng hơn. |
Trong quá trình chuẩn bị cuốn sách này, tôi đã phải đấu tranh với điều gì là ‘trách nhiệm’ mà tôi phải làm với tư cách là tác giả của một cuốn sách về AI. Cách tiếp cận thông thường là cung cấp một giải thích ngắn gọn về khoa học và một đánh giá về các thuật ngữ thường dùng.
Tôi sẽ không làm điều đó.
Tôi sẽ cung cấp ở đây một vài liên kết bên ngoài tới những gì tôi nghĩ là một số mô tả ngắn gọn về cơ bản AI dễ hiểu.
Tương lai của AI là gì?: McKinsey & Co. (tháng 4, 2024) có một bộ giải thích tốt.
Tương tự, Gartner’s Generative AI (không đề ngày) cũng không tệ.
Futurepedia cung cấp một bản tóm tắt không tồi về AI Fundamentals (tháng 5, 2024)
Sau khi đã xử lý cách thức, tôi sẽ giới thiệu một số thuật ngữ mà tôi nghĩ là có giá trị để hiểu. Không phải vì bạn cần biết chúng để sử dụng phần mềm. Chỉ là bộ thuật ngữ này tham chiếu đến một số khía cạnh chính của cách thức hoạt động của thế hệ AI hiện tại.
Trường hợp sử dụng của tôi để giải quyết các thuật ngữ và khái niệm này là các tác giả và nhà xuất bản muốn (i) đi sâu hơn về AI, vì bất kỳ lý do gì, hoặc (ii) muốn hiểu bối cảnh của những chỉ trích hiện tại về AI, hoặc (iii) muốn đóng góp vào các thảo luận chiến lược về cách các đồng nghiệp hoặc tổ chức của họ nên tiếp cận AI.
Nói cách khác, đây không phải là những điều bạn cần biết, mà là những điều bạn có thể muốn biết. Dưới đây là danh sách, không theo thứ tự bảng chữ cái:
Lời nhắc và Việc Đưa Ra Lời Nhắc
Bạn có thể mở phần mềm Chat AI và chỉ cần nhập câu hỏi, rất giống như bạn hiện đang làm trên Google.
Mô hình Ngôn ngữ Lớn (LLM)
Mô hình Ngôn ngữ Lớn hoạt động bằng cách phân tích lượng lớn tài liệu (chủ yếu) viết, cho phép chúng dự đoán những từ hoặc câu nên tiếp theo trong một cuộc trò chuyện hoặc một bài viết. Chúng không ‘hiểu’ ngôn ngữ theo nghĩa con người, thay vào đó xử lý văn bản bằng cách chia nhỏ nó thành các mảnh nhỏ hơn (gọi là tokens), sau đó chuyển đổi các tokens thành các con số. Chúng xử lý văn bản dưới dạng các con số, sau đó chuyển đổi lại thành văn bản khi đầu ra. Đó là một giải thích quá đơn giản về lý do tại sao Chat AI không ‘chứa’ tác phẩm có bản quyền: nó được xây dựng từ các con số đại diện cho một sự trừu tượng hóa lớn từ các văn bản gốc.
LLM được huấn luyện về cách ngôn ngữ thường được sử dụng và sau đó tạo ra các phản hồi dựa trên sự hiểu biết này. Chúng ta thường đánh giá thấp mức độ dự đoán được của ngôn ngữ. Chat AI có thể tạo ra văn bản giống (đôi khi đáng ngạc nhiên) với các tài liệu hiện có, nhưng, theo thiết kế, nó không có khả năng truy xuất các đoạn trích cụ thể hoặc sao chép các văn bản có bản quyền. (Tôi biết, nhiều người trong số các bạn đã nghe về vụ kiện của New York Times chống lại OpenAI—Times đã có thể khiến ChatGPT lặp lại một số đoạn của các bài viết đã xuất bản trước đó.)
AI Tạo sinh
Điều quan trọng nhất để hiểu thuật ngữ này là phần “tạo sinh”. AI Tạo sinh tạo ra văn bản mới.
Bộ Biến đổi Tạo sinh Được Huấn luyện Trước (GPT)
Đây là thuật ngữ thuộc loại nerd nhất trong danh sách này, mô tả một loại LLM cụ thể được phát triển bởi OpenAI. “Generative” ám chỉ khả năng tạo văn bản, “pre-trained” nghĩa là nó đã được huấn luyện trên một lượng lớn dữ liệu văn bản, và “transformer” đề cập đến phần mềm mà nó sử dụng. Biết GPT là gì chỉ hữu ích để bạn hiểu GPT trong ChatGPT đại diện cho điều gì.
ChatGPT
ChatGPT là phần mềm bạn nhìn thấy; GPT là thứ đứng sau phần mềm. Người dùng trải nghiệm ChatGPT, không phải GPT đứng sau nó. Như đã đề cập ở trên, ChatGPT chỉ là một trong số nhiều hệ thống Chat AI trực tuyến, với chức năng tương tự.
Một thuật ngữ nữa mà bạn sẽ thường xuyên gặp mà nhiều người không quen thuộc là:
Kho văn bản
Định nghĩa từ điển của kho văn bản là “một tập hợp các văn bản viết” (mặc dù thực tế, nó không phải luôn là văn bản). Thuật ngữ này được sử dụng để chỉ những gì mà GPT được huấn luyện: các kho văn bản (chủ yếu) khổng lồ. Chúng ta được biết rằng các kho lớn nhất chứa hàng trăm tỷ từ. Đối với người thường, điều đó là không thể tưởng tượng được. Bạn không nghĩ Wikipedia là khổng lồ, chứa một lượng từ vựng lớn sao? Chà, Wikipedia chỉ có khoảng 4,5 tỷ từ—GPT-4 được huấn luyện trên hơn một nghìn tỷ từ.
Tôi nghĩ rằng điều quan trọng là phải xem xét quy mô này. Các tác giả, dễ hiểu, lo lắng rằng 75.000 từ trong sách của họ có thể đã bị hút vào một mô hình ngôn ngữ lớn. Có lẽ là có (xem thêm bên dưới). Nhưng giả sử điều này là đúng, hãy xem xét giá trị của bất kỳ cuốn sách nào đối với tổng sức mạnh của các mô hình ngôn ngữ lớn ngày nay là ít ỏi như thế nào. Nó thực sự là không đáng kể. Ngay cả 10.000 cuốn sách cũng là một con số nhỏ.
Phần mềm AI: Những Hệ thống Nặng Ký
Tôi đã liệt kê ở trên bốn hệ thống Chat AI nặng ký: ChatGPT, Claude.ai, Microsoft Copilot và Google Gemini. |
Chúng hoạt động hơn kém giống nhau và cung cấp kết quả tương tự. Vậy cái nào tốt nhất? Câu hỏi đó dẫn bạn xuống một lối mòn. Nó giống như hỏi thị trấn nào có kỳ nghỉ bãi biển tốt nhất, hoặc SUV nào tốt nhất cho các gia đình. Có rất nhiều sắc thái trong các vấn đề và một lượng lớn niềm tự hào và định kiến lọc ra phản ứng của chúng ta.
Cũng như vậy với phần mềm phức tạp nhưng tưởng chừng đơn giản này. Mọi người tranh luận rằng Claude có kỹ năng ngôn ngữ tinh tế hơn, và ChatGPT giỏi hơn với mã phần mềm. Microsoft Copilot tích hợp với bộ phần mềm của Microsoft. Google Gemini có thể cắm vào Gmail, Google Maps và YouTube. Một số khác biệt là có ý nghĩa; nhiều cái khác là nhỏ. Và chúng liên tục thay đổi với mỗi lần phát hành phần mềm mới.
‘Phần mềm tốt nhất’ sẽ không được giải quyết trong thời gian sớm. Nếu bạn thử nghiệm đủ các công cụ có sẵn, bạn sẽ tìm ra một số cái yêu thích. |
Có hai tầng AI phần mềm hàng đầu. Đầu tiên là những gì có thể gọi là phần mềm nền tảng, phần mềm như ChatGPT và các đối thủ của nó (Chat AI). Đó là cách mà hầu hết mọi người trải nghiệm AI ngày nay.
Tầng tiếp theo là tất cả các phần mềm khác cung cấp cái nhìn vào phần mềm nền tảng. Người mới sử dụng AI chat phần lớn sẽ chưa gặp phần mềm này, mặc dù nó không hiếm hoặc khó tìm. Một số người quen thuộc với Jasper (phần mềm tiếp thị) hoặc Perplexity (tìm kiếm). Phần mềm này đơn giản sẽ không tồn tại nếu không có ChatGPT và các phần mềm tương tự.
Hãy nhớ rằng phần mềm phổ biến từ Adobe, Microsoft, Grammarly, Zoom, v.v., hiện nay đã tích hợp các công cụ AI, nhưng điều này khác với phần mềm được xây dựng từ đầu dựa trên các giao diện chatbot. (Những phần mềm khác như Otter (chuyển văn bản) có trước ChatGPT nhưng hiện nay được trang bị công nghệ mô hình ngôn ngữ lớn.)
Dưới đây chúng ta sẽ xem xét phần mềm chuyên về xuất bản tận dụng khả năng của AI tạo sinh.
Các Mô Hình Phần Mềm
Thời xa xưa, phần mềm là mã nguồn và chỉ có các kỹ sư mới hiểu cách nó hoạt động. Điều khiến máy tính cá nhân thành công, ngoài chi phí tương đối thấp, là phần mềm dễ sử dụng (tương đối). Chúng ta không nghĩ nhiều về tất cả những điều này; nó chỉ bao quanh chúng ta.
Nhưng hãy cân nhắc, trong giây lát, Microsoft Word, một chương trình mà tôi có thể an toàn cho rằng 99% độc giả của cuốn sách này sử dụng. Mất khoảng 10 phút để chỉ cho ai đó cách viết một đoạn văn bản trong Word. Sau đó bạn có thể chỉ họ cách tạo văn bản in đậm, in nghiêng, và cách thay đổi phông chữ cơ bản, có thể từ Calibri sang Arial hoặc Times Roman. Sau đó, cách lưu tệp và in tệp. Cách tìm kiếm và thay thế.
Và sau đó bạn để họ tự làm.
Nhiều năm sau, bạn phát hiện ra rằng họ vẫn định dạng các đoạn văn Word của họ bằng khoảng trắng và tab. Và vẫn quên lưu tệp của họ, hoặc bị nhầm lẫn về phiên bản nào họ đã lưu, đôi khi phải tạo lại văn bản từ đầu. Nhưng họ “biết cách sử dụng Word.”
Word có hàng trăm tính năng, nhưng một phần ba thời gian người dùng chỉ sử dụng 5 lệnh: Dán, Lưu, Sao chép, Hoàn tác và In đậm. Phải mất vài tuần đào tạo để học đúng cách các tính năng nâng cao của Word; những tính năng có thể giúp nhà xuất bản tiết kiệm hàng trăm giờ thời gian. Nhưng hầu hết không bao giờ làm thế. Tôi đã sử dụng Word từ năm 1985, gần bốn mươi năm, và tôi chưa bao giờ tham gia khóa học nào. Tôi thậm chí không biết những gì tôi không biết về cách khai thác toàn bộ sức mạnh từ phần mềm này.
Tôi nói về điều này vì nó là một cách hữu ích để hiểu tại sao phần mềm AI rất khác biệt so với bất kỳ phần mềm nào bạn từng làm việc cùng. Nó không đi kèm với sách hướng dẫn, thậm chí không có hướng dẫn Khởi động nhanh. Nó đi kèm với một màn hình trống và một câu hỏi: “Tôi có thể giúp gì cho bạn?”
Không có thanh menu, không có nút để nhấn, không có phím tắt. Bạn đặt câu hỏi, bắt đầu một cuộc trò chuyện, và bạn nhận được một số câu trả lời.
Phản hồi của Claude:
“Có một số điểm khác biệt chính giữa làm việc với AI hội thoại hiện đại như tôi so với các công cụ truyền thống như Microsoft Word hoặc Excel:
“1. Tương tác ngôn ngữ tự nhiên: Với AI hội thoại, bạn có thể giao tiếp ý định của mình bằng ngôn ngữ hàng ngày thay vì phải học và điều hướng các menu và chức năng phức tạp. Bạn chỉ cần giải thích những gì bạn muốn thực hiện một cách hội thoại.
“2. Hiểu ngữ cảnh: Trợ lý AI duy trì ngữ cảnh và hiểu dòng chảy của cuộc trò chuyện, cho phép đối thoại tự nhiên hơn. Phần mềm truyền thống không có ý thức về ngữ cảnh từ lệnh này sang lệnh khác.
“3. Khả năng thích ứng: AI có thể thích ứng và phản hồi linh hoạt với nhiều yêu cầu khác nhau, trong khi các công cụ truyền thống bị giới hạn trong một tập hợp các chức năng được xác định trước. Trợ lý AI có thể giúp viết lách, phân tích, toán học, mã hóa, ý tưởng và nhiều hơn thế trong một giao diện duy nhất.”
Điều đó hữu ích, nhưng tôi muốn một thứ gì đó dễ hiểu hơn. Vì vậy tôi hỏi:
Claude:
“Đây là một cách đơn giản để giải thích sự khác biệt cho một người không có nền tảng kỹ thuật:
“Hãy nghĩ về phần mềm truyền thống như Microsoft Word hoặc Excel như một công cụ, như cái búa hoặc máy tính. Nó có một tập hợp chức năng cố định mà nó có thể thực hiện, và bạn cần phải học cách sử dụng nó đúng cách để có được kết quả mong muốn.
“Mặt khác, hãy nghĩ về trí tuệ nhân tạo đối thoại hiện đại như một trợ lý thông minh, giống như một đồng nghiệp hoặc người bạn hiểu biết. Bạn chỉ cần nói chuyện với nó bằng tiếng Anh đơn giản, và nó hiểu bạn đang cố gắng làm gì. Nó có thể giúp bạn với nhiều loại nhiệm vụ khác nhau, từ viết lách đến toán học đến việc đưa ra ý tưởng.
“Bạn không cần phải học bất kỳ lệnh hay kỹ thuật đặc biệt nào—chỉ cần trò chuyện tự nhiên với nó. Nó thích ứng với nhu cầu của bạn và nhớ ngữ cảnh của cuộc trò chuyện. Theo thời gian, nó sẽ hiểu bạn và sở thích của bạn hơn.
“Vì vậy, trong khi phần mềm truyền thống giống như một công cụ tĩnh mà bạn sử dụng, trí tuệ nhân tạo đối thoại giống như một đối tác thông minh mà bạn tương tác tự nhiên để hoàn thành công việc. Đây là một cách làm việc linh hoạt, cá nhân hóa và hiệu quả hơn.”
Hmm. Không hoàn toàn như tôi mong muốn. Vì vậy tôi tiếp tục cuộc trò chuyện:
Claude:
“Chắc chắn rồi, để tôi thử lại mà không sử dụng thuật ngữ kỹ thuật:
“Hãy tưởng tượng bạn đang nói chuyện với một người bạn rất hiểu biết và hăng hái giúp bạn. Bạn có thể chỉ cần nói với họ bằng tiếng Anh đơn giản về những gì bạn đang cố gắng làm, dù là viết một bài tiểu luận, giải một bài toán, hay lên ý tưởng cho một dự án.
“Thay vì phải học và nhớ một loạt các bước hoặc lệnh cụ thể, bạn có thể chỉ cần giải thích những gì bạn cần bằng từ ngữ của mình. Người bạn của bạn hiểu ngữ cảnh và điều chỉnh sự giúp đỡ của họ dựa trên những gì bạn đã thảo luận.
“Đó là một cuộc trò chuyện qua lại, nơi bạn có thể đặt câu hỏi, làm rõ mọi thứ và nhận lời khuyên. Và càng nói chuyện với người bạn này, họ càng hiểu rõ nhu cầu và phong cách giao tiếp độc đáo của bạn.
“Bây giờ, hãy tưởng tượng nếu bạn có thể có kiểu tương tác dễ dàng và hữu ích đó, nhưng với một chương trình máy tính. Đó là ý tưởng cơ bản đằng sau các loại phần mềm mới mà bạn có thể đã nghe nói đến.
“Thay vì phong cách phần mềm cũ, nơi bạn có một bộ chức năng cứng nhắc và phải học cách sử dụng đúng, phần mềm mới này giống như một người bạn hiểu biết. Bạn có thể chỉ cần nói chuyện với nó theo cách đối thoại và nó sẽ tìm ra cách giúp bạn dựa trên dòng chảy tự nhiên của cuộc thảo luận.
“Vì vậy, đây là một cách thông minh hơn, cá nhân hóa hơn và dễ dàng hơn để nhận sự giúp đỡ với mọi nhiệm vụ trên máy tính của bạn, chỉ bằng cách nói chuyện với nó như bạn nói chuyện với một người. Đó là sự khác biệt chính so với phong cách phần mềm cũ, cứng nhắc.”
Tóm tắt: Tôi đang cố gắng làm hai điều với những ví dụ này. Một là đưa ra một ví dụ đơn giản về lý do tại sao phần mềm chatbot lại khác biệt so với bất kỳ phần mềm nào chúng ta từng sử dụng. Và hai là minh họa cách một cuộc trò chuyện có thể phát triển. Nó không chỉ là một câu hỏi và một câu trả lời. Đó là một cuộc trò chuyện. Đó là một phần lớn của đột phá.
Các AI trò chuyện là sự kết hợp giữa thực tập sinh và chuyên gia tư vấn hiểu biết. Bạn không thể giả định rằng họ biết bạn muốn gì. Bạn cần giải thích những gì bạn muốn, lý do bạn muốn nó và cách họ có thể giúp đỡ nhất.
Ba loại phần mềm AI
Nhìn chung, có ba loại phần mềm AI có sẵn ngày nay. Loại đầu tiên là các nền tảng AI cơ bản, như ChatGPT, công nghệ AI cốt lõi. Loại thứ hai là, hãy gọi nó là, các phần mềm bổ sung AI, phần mềm được xây dựng mới trên các nền tảng cốt lõi. Bạn sẽ không nghe nói nhiều về những công cụ này, như Jasper hoặc Rewind. |
Loại thứ ba của tôi là phần mềm có các công cụ AI được gắn vào sản phẩm hiện có. Ví dụ, bộ phần mềm của Microsoft có các công cụ AI mới trong Word, Excel và PowerPoint. Adobe đã thêm công nghệ AI vào Photoshop và Acrobat. Grammarly đang được xây dựng lại xung quanh công nghệ LLM thế hệ mới. Nó vẫn chủ yếu là sản phẩm cũ, nhưng có thêm AI.
Rõ ràng là gần như tất cả phần mềm bạn sử dụng ngày nay sẽ sớm tích hợp các tính năng AI. Bạn sẽ phải tự đánh giá liệu những công cụ đó có thực sự hữu ích hay chỉ là trang trí AI.
Tôi quan tâm hơn đến các công cụ mới, được xây dựng từ đầu để cung cấp giá trị mà chỉ AI mới có thể mang lại. Đó là thế hệ phần mềm tiếp theo.
Làm việc với phần mềm AI
Tôi là người dùng Windows, tiếc thay (có một câu chuyện dài về lý do tại sao), và vì vậy tôi đang nói về những trải nghiệm của tôi khi truy cập phần mềm AI qua máy tính Windows, không phải Mac. Vì tất cả phần mềm ở đây đều dựa trên trình duyệt, nên không nên có sự khác biệt khi sử dụng các công cụ này trên Mac. Nhưng tôi không đảm bảo.
Bạn sẽ cần một ít tiền để chơi trò chơi AI, nhưng không nhiều lắm. Như đã mô tả ở trên, nhiều phần mềm cơ bản có thể truy cập qua các phiên bản miễn phí. Nhưng thường bạn sẽ muốn một mô tả trả phí khi bạn thử nghiệm nó, và đăng ký nên khoảng $20/tháng. Hủy sau khi bạn đã thử nó (đừng quên!). Nếu bạn thấy cái gì đó là $79/tháng hoặc, trời ơi, $159/tháng, bạn có thể bỏ qua nó. Họ không nghĩ đến bạn như một người dùng tiềm năng; họ nghĩ đến người dùng doanh nghiệp lớn.
Đào tạo cho Chat AI
AI ngày nay có vẻ đơn giản một cách đánh lừa. Bất kỳ ai có thể gõ câu hỏi đều có thể sử dụng nó. Nhưng việc sử dụng nó một cách hiệu quả thì phức tạp, điều này không rõ ràng cho đến khi bạn khám phá những phức tạp xung quanh “lời nhắc” và các khái niệm liên quan. |
Để truy cập vào trí thông minh của nó, đôi khi bạn phải nói chuyện với nó như thể nó là một kẻ ngốc. Hoặc có lẽ là một thiên tài ngốc nghếch. Nó giống như nhân vật do Dustin Hoffman đóng trong Rain Man.
Bất kỳ ai cũng có thể sử dụng ChatGPT. Chỉ cần truy cập chat.openai.com và bạn có thể truy cập phiên bản mới nhất, GPT-4o miễn phí (có một số tính năng cao cấp có sẵn với giá thêm 20 đô la/tháng).
Khi bạn vào ChatGPT, bạn sẽ thấy màn hình trống và câu hỏi ngầm “Tôi có thể giúp gì cho bạn hôm nay?”
Bạn có thể hỏi nó câu hỏi. Tốt hơn nữa, bạn có thể tải lên một tệp PDF lớn và hỏi các câu hỏi về tệp đó. Bạn cũng có thể tải lên hình ảnh, mà nó có thể mô tả, hoặc một trang đã quét: nó có thể nhận ra văn bản, thậm chí nếu là chữ viết tay.
Vấn đề chính đã nổi lên trong việc sử dụng thành công Chat AI là học cách ‘nói chuyện’ với nó (mà bạn có thể thực sự làm trong phiên bản ứng dụng di động mới nhất). Trong ngôn ngữ Chat AI, điều này được gọi là tạo “lời nhắc” hoặc “việc đưa ra lời nhắc.” Người dùng đã phát hiện ra rằng lời nhắc của họ càng chính xác và chi tiết, thì câu trả lời họ nhận được từ ChatGPT càng tốt. Hơn nữa, lời nhắc không chỉ là một lần. Chat AI có thể tiếp tục cuộc trò chuyện trong một thời gian khá dài (dù không phải vô hạn), và nếu bạn không nhận được câu trả lời mà bạn đang tìm kiếm, bạn có thể chỉnh sửa và làm rõ lời nhắc của mình. Điều này đòi hỏi nhiều thời gian để làm quen, và đã sinh ra một loạt các hướng dẫn, viết và trực tuyến, để đào tạo người dùng cách tận dụng tối đa việc đưa ra lời nhắc.
Hãy thử yêu cầu bất kỳ phần mềm Chat AI nào giải thích một khái niệm như biên tập phát triển. Sau đó yêu cầu nó soạn thảo một lời giải thích mà một đứa trẻ 12 tuổi có thể hiểu. Kết quả sẽ khác biệt rõ rệt. Thật thú vị, Chat AI dường như cũng phản ứng với những lời cầu xin cảm xúc. Thêm “điều này rất quan trọng đối với sự nghiệp của tôi” vào lời nhắc có thể thúc đẩy những câu trả lời hữu ích hơn.
(Đây là thời điểm tốt để thêm một ghi chú trong ngoặc: Đây là điều vừa an tâm vừa đáng lo ngại khi các nhà khoa học hàng đầu làm việc trên AI dựa trên ngôn ngữ không thể giải thích được tại sao những điều như thế này xảy ra.)
Cách đưa ra lời nhắc
“Việc đưa ra lời nhắc” là một kỹ năng cụ thể cần thiết để sử dụng Chat AI hiệu quả. |
Trong số các thuật ngữ được sử dụng trong cơn sốt vàng AI, “lời nhắc” và “việc đưa ra lời nhắc” là những thuật ngữ tốt nhất. Bạn không thực sự “nói chuyện” với Chat AI. Bạn không “hỏi” nó câu hỏi (hoặc, bạn không nên—đó không phải cách nó hoạt động). Bạn đưa ra lời nhắc cho các động cơ này để nhận phản hồi, không phải để nhận câu trả lời đơn giản.
Ban đầu tôi nghĩ rằng một phép so sánh có thể là các lời nhắc trong nhà hát. Người nhắc nhở khuyến khích một diễn viên mất dòng, khiến họ quay trở lại hành động. Nhưng điều này không chính xác bởi vì một lời nhắc AI không nới lỏng một đoạn văn bản đã ghi nhớ—đó không phải cách AI tạo ra hoạt động. Hãy đưa cho một động cơ AI một lời nhắc duy nhất nhiều lần, và các câu trả lời sẽ luôn có ít nhất một chút khác biệt.
Vừa rồi tôi đã yêu cầu ChatGPT “liệt kê các yếu tố chính của việc đưa ra lời nhắc hiệu quả.” Tôi đã hỏi lần thứ hai và các câu trả lời có cùng chủ đề, nhưng khác biệt đáng kể về chi tiết. Các chủ đề được đề cập bao gồm:
Cụ thể
Tránh mơ hồ
Cung cấp bối cảnh
Sử dụng hướng dẫn rõ ràng
Ở một khía cạnh nào đó, điều này khá lạ: AI có sự nắm vững ngôn ngữ tốt—nó không nên có cảm giác về những gì bạn muốn nói mà không cần phải nhắc nhở tỉ mỉ? Nhưng chính sự nắm vững ngôn ngữ đó khiến việc đưa ra lời nhắc trở nên mạnh mẽ nhất. Nói cho nó chính xác những gì bạn muốn nói, không phải đại khái.
Nói chuyện với nó như trợ lý hữu ích, người cố vấn thông thái mà bạn muốn nó trở thành, không phải như một đứa trẻ ngoài đường.
Điểm rút ra ở đây là, ít nhất trong thời gian hiện tại, việc sử dụng hiệu quả các công cụ AI dựa trên mô hình ngôn ngữ lớn đòi hỏi ít nhất là sự thông thạo với các thực hành tốt nhất trong việc đưa ra lời nhắc. Một sự thành thạo trong việc đưa ra lời nhắc sẽ được thưởng xứng đáng.
Ảo giác: Con ruồi trong thuốc mỡ
AI, dựa trên các mô hình ngôn ngữ lớn, tạo ra những điều không có thật. Nó chỉ làm vậy. Điều này thường được gọi là “ảo giác.” Đây là một vấn đề thực sự, một vấn đề nghiêm trọng. Bạn cần hiểu về ảo giác nếu bạn định làm việc với AI. |
Từ của năm 2023 của Cambridge Dictionary là “Hallucinate” (Ảo giác), định nghĩa của nó đã được mở rộng để bao gồm “Khi một trí tuệ nhân tạo… ảo giác, nó sản xuất thông tin sai lệch.” (Các bổ sung khác vào từ điển năm 2023 bao gồm “kỹ thuật nhắc nhở,” “mô hình ngôn ngữ lớn,” và “GenAI.”)
Cambridge ghi chú rằng “Ảo giác AI đôi khi xuất hiện vô lý. Nhưng chúng cũng có thể dường như hoàn toàn hợp lý–ngay cả khi không chính xác về mặt thực tế hoặc cuối cùng là phi logic.” Điều này, đáng buồn thay, là hoàn toàn đúng, và từ tháng 7 năm 2024 vẫn là một hạn chế lớn đối với việc sử dụng AI tạo sinh cho các nhiệm vụ quan trọng. Đó là một trong những điều kỳ lạ lớn của AI, và mọi người cần thời gian để hiểu điều này. Hãy nhớ rằng, AI tạo sinh chủ yếu là một động cơ dự đoán từ tiếp theo, không phải là một cơ sở dữ liệu của các sự kiện. Do đó, cần có HITLs, Con người trong vòng lặp, như chúng ta được biết, kiểm tra lại đầu ra của AI. Và một lần nữa, thật đáng chú ý rằng chúng ta có thể thu được giá trị phi thường từ một công nghệ có thể sản xuất ra đầu ra không chính xác có thể chứng minh được. Thế là như vậy.
Gary Marcus, một nhà phê bình AI giàu kinh nghiệm và thông thái, so sánh ảo giác AI với đồng hồ hỏng, đúng hai lần một ngày. “Nó đúng một số thời gian,” ông nói, “nhưng bạn không biết phần nào của thời gian, và điều đó làm giảm đáng kể giá trị của nó.”
Ethan Mollick, diễn giả chính tại hội nghị Publishers Weekly tháng 9 năm 2023, lưu ý rằng những người sử dụng AI mong đợi độ chính xác 100%. Ảo giác, ông nói, tương tự như “tỷ lệ lỗi của con người” mà chúng ta chịu đựng hàng ngày.
Andrej Karpathy, một nhà khoa học nổi tiếng chuyên về AI, hiện đang làm việc tại OpenAI, viết về ảo giác:
“Tôi luôn gặp khó khăn một chút khi được hỏi về ‘vấn đề ảo giác’ trong các mô hình ngôn ngữ lớn. Bởi vì, theo một nghĩa nào đó, ảo giác là tất cả những gì các mô hình ngôn ngữ lớn làm. Chúng là những cỗ máy mơ.
“Chúng ta điều khiển giấc mơ của chúng bằng các nhắc nhở. Các nhắc nhở bắt đầu giấc mơ, và dựa trên ký ức mờ ảo của mô hình ngôn ngữ lớn về các tài liệu đào tạo của nó, hầu hết thời gian kết quả đi đến nơi hữu ích.
“Chỉ khi giấc mơ đi vào lãnh thổ bị coi là không chính xác về mặt thực tế, chúng ta mới gọi nó là ‘ảo giác.’ Nó trông như một lỗi, nhưng chỉ là mô hình ngôn ngữ lớn đang làm những gì nó luôn làm.”
Nó không chỉ là vấn đề tạo ra thông tin sai lệch. Chat AI là phần mềm có nhiều khuyết điểm.
Đối với nhiều truy vấn, đặc biệt là từ người mới, các phản hồi là tầm thường, lệch mục tiêu hoặc đơn giản là không hữu ích. Chat AI gặp khó khăn trong việc đếm: Hỏi nó một bài blog 500 từ và bạn sẽ may mắn nếu nhận được 150.
Và mỗi công ty AI, để giảm thiên vị và tránh trả lời các truy vấn “cách chế tạo bom,” đã dựng lên các rào cản phản hồi chặt chẽ xung quanh sản phẩm của họ: quá thường xuyên, phản hồi cho một câu hỏi là, về cơ bản, “Không, tôi sẽ không trả lời điều đó.” Tôi đã yêu cầu Google Gemini xem xét bản thảo của văn bản này và được cảnh báo rằng “rất quan trọng để có sự chấp thuận của tác giả trước khi xuất bản.”
Kiểm tra thực tế
Tôi lập luận, chủ yếu là với những tai điếc, rằng ảo giác là một vấn đề công nghệ, mà sẽ tìm ra giải pháp công nghệ. Vâng, chúng là đặc trưng của các mô hình ngôn ngữ lớn, nhưng chúng có thể được vượt qua. |
Hãy xem xét điều này: Tôi đã yêu cầu bốn Chat AI kiểm tra thực tế các tuyên bố sau:
Tính đến năm 2024, có 6 nhà xuất bản đa quốc gia lớn có trụ sở tại Thành phố New York. Họ được biết đến với tên gọi Big 6.
Ebook tiếp tục chiếm ưu thế trong việc bán sách ở Hoa Kỳ.
Borders và Barnes & Noble là hai chuỗi bán sách lớn nhất ở Hoa Kỳ.
Sau khi doanh số giảm trong thời gian Covid, doanh số sách ở Hoa Kỳ lại tăng trưởng hai chữ số.
Tất cả đều phát hiện ra các lỗi trong ba tuyên bố đầu tiên. Mỗi trong số chúng trở nên hơi bối rối về cái thứ tư, không chắc chắn về mức độ tăng doanh số Covid, và các mô hình doanh số sau đó. Đó là một thí nghiệm nhỏ, không đại diện, nhưng những Chat AI này, không có ý định dựa trên sự kiện, có thể thực hiện một công việc đáng tin cậy để đánh giá các sự kiện mà hầu hết các quan sát viên thông thường sẽ bỏ lỡ.
Còn Hình ảnh và Video thì sao?
Vì xuất bản sách thương mại phụ thuộc nhiều hơn vào văn bản hơn là hình ảnh, các nhà xuất bản có xu hướng bỏ qua các công cụ tiên tiến dựa trên AI cho hình ảnh và video. |
Chúng có liên quan đến sự hiểu biết của bất kỳ ai về cuộc cách mạng AI. Nhưng cuộc thảo luận quá lớn đối với không gian có sẵn: Tôi sẽ không thể làm nó công bằng.
Đề nghị cho các tác giả và nhà xuất bản: chơi với các tính năng tạo hình ảnh trong ChatGPT—chúng miễn phí và thú vị để sử dụng. Sau đó, thực hiện một tìm kiếm dưới “video và AI” và ngạc nhiên trước một số ví dụ bạn sẽ tìm thấy ở các trang web liên kết. Mặc dù công cụ này chưa có sẵn công khai, Sora của OpenAI cung cấp một số ví dụ tuyệt đẹp về các video được tạo chỉ từ các nhắc nhở văn bản.
Phần mềm dành cho Nhà Xuất Bản Sách
Có rất ít phần mềm AI được xây dựng từ đầu đặc biệt dành cho các nhà xuất bản sách (mặc dù có rất nhiều dành cho các tác giả).
Các nhà xuất bản học thuật có nhiều lựa chọn hơn, với một loạt các công cụ AI dành cho nghiên cứu, viết và xuất bản.
Đối với các nhà xuất bản thương mại, hầu hết các lựa chọn liên quan đến AI và âm thanh. Ngoài âm thanh, các lựa chọn đang tập trung vào các công cụ chỉnh sửa và tiếp thị. Cũng có một số công cụ phát hiện nội dung AI và các dịch vụ cấp phép nội dung.
Phần mềm chỉnh sửa được định vị hướng đến các tác giả, không phải các biên tập viên chuyên nghiệp — có nhiều tác giả hơn nhiều so với biên tập viên, và chất lượng được yêu cầu bởi các biên tập viên chuyên nghiệp đòi hỏi cao hơn nhiều so với các tác giả (phần lớn là tự xuất bản).
Các công cụ tiếp thị cũng nhắm đến rộng rãi hơn so với chỉ các nhà xuất bản sách, mà còn đến các nhà tiếp thị ở mọi nơi, với các công cụ dành cho nội dung web, tạo bản sao và SEO. Jasper.ai là một trong những công ty dẫn đầu trong danh mục này và tuyên bố HarperCollins là khách hàng của mình.
Shimmr, một nhà tài trợ của cuốn sách này, là một công cụ tạo quảng cáo được hỗ trợ bởi AI đặc biệt dành cho các nhà xuất bản sách. Công ty và người sáng lập của nó, Nadim Sadek, đã được giới thiệu trong một bài viết tháng 5 năm 2024 trên Publishers Weekly.
“Điều chúng tôi làm là sử dụng AI để xem xét hồ sơ tâm lý của một cuốn sách và kết hợp nó với khung tâm lý của một đối tượng cụ thể, đảm bảo một sự kết nối hiệu quả hơn giữa độc giả và sách,” Sadek nói với PW. “Chúng tôi gọi đó là ‘DNA Sách,’ và nó không chỉ bao gồm việc biết các nhân vật và cốt truyện của một cuốn sách, mà còn cả các giá trị, sở thích và cảm xúc của cuốn sách.”
Dựa trên DNA Sách, các công cụ AI của Shimmr sau đó tạo ra các quảng cáo nhắm mục tiêu cho các kênh tìm kiếm và mạng xã hội (hiện tại là Google và Meta). Các quảng cáo xuất hiện dưới dạng quảng cáo hiển thị, với hình ảnh được tạo bởi AI kèm theo các câu khẩu hiệu.
Tôi chỉ ra với các nhà xuất bản đang đánh giá Shimmr rằng nó có thể mang lại doanh thu tăng thêm, điều mà chúng tôi mong đợi từ một công cụ quảng cáo/tiếp thị mới.
Nếu bạn muốn trải nghiệm một công cụ phần mềm khác “chỉ với AI,” hãy xem Hypnovels, công cụ này hoạt hình hóa các chương trong sách viễn tưởng. “Tường thuật, hình ảnh và chuyển động, tất cả đều được tạo bởi AI, kết hợp với kể chuyện tuyệt vời theo cách ít thực tế hơn so với hoạt hình truyền thống (do đó có tên “hypno”) và thu hút cảm giác hơn so với sách nói, theo phong cách làm cho chương đó trở nên độc đáo và hấp dẫn.”
Một nhà cung cấp mới khác ra đời từ cơ hội với AI là Veristage (cũng là một nhà tài trợ của cuốn sách này). Veristage cung cấp Insight, “Trợ lý Xuất bản AI” của họ, một giao diện đầu vào đặc thù cho nhiều chức năng xuất bản.
Hành trình Insight bắt đầu với bản thảo. Tải lên một phiên bản sớm mở khóa một loạt các công cụ, một số có giá trị hơn cho biên tập, những công cụ khác có giá trị hơn cho tiếp thị. Sau khi làm việc với bất kỳ và tất cả các tính năng, bạn có thể tải xuống một báo cáo PDF bao gồm các khía cạnh biên tập, như giọng điệu viết, chủ đề, sáo rỗng và việc sử dụng trạng từ và tính từ, và sau đó là nội dung tiếp thị, như mô tả, siêu dữ liệu, điểm bán hàng độc đáo, so sánh, nội dung tối ưu hóa cho Amazon và các bài đăng trên mạng xã hội được đề xuất.
Điều tôi thích nhất về Insight là nó áp dụng một cách tiếp cận tổng thể để áp dụng AI vào quy trình xuất bản, thay vì phải thu thập nhiều công cụ phần mềm, mỗi cái cho một chức năng khác nhau.
Tôi cũng muốn nhấn mạnh ở đây nền tảng xuất bản của tôi, Leanpub. Họ đã tuyệt vời khi làm việc cùng. Nhỏ là đẹp: họ dám thử nghiệm với công nghệ và dịch vụ mà các công ty lớn hơn có thể tránh xa. Điều đặc biệt quan trọng đối với các tác giả và nhà xuất bản nhỏ là dịch vụ TranslateWord mới của họ, nơi bạn có thể dịch một cuốn sách được viết bằng Microsoft Word sang tới 31 ngôn ngữ, thông qua API GPT-4o (mà ChatGPT sử dụng). Đó là điều tôi đang sử dụng để dịch cuốn sách này.
Tôi đã tìm kiếm ở nơi khác để cố gắng tìm một dịch vụ dịch sách. Có rất nhiều công ty dịch thuật, một số sử dụng AI. Công ty duy nhất mà tôi có thể tìm thấy cung cấp dịch thuật sách là DeepL. Nhưng đó không phải là trọng tâm của công ty. Hiện tại, Leanpub là nơi cần đến.
Phần mềm kinh doanh cho xuất bản sách
Các nhà cung cấp hệ thống kinh doanh hiện tại phục vụ ngành công nghiệp xuất bản đang bắt đầu tích hợp các công nghệ AI, như chúng ta đã thấy ở các công ty quy mô doanh nghiệp, như Salesforce và Oracle. |
Tôi đã nói chuyện với một số nhà cung cấp phần mềm hệ thống xuất bản, bao gồm Firebrand, và tất cả đều đang xem xét các cơ hội, nhưng bước đi cẩn thận.
Tôi đang mong chờ cơ hội nói về AI với một nhóm đa dạng các người tham dự tại Diễn đàn Đổi mới Xuất bản của Firebrand vào tháng 9 năm 2024 tại Nashville, TN.
knk đã tổ chức hai hội thảo trực tuyến về trí tuệ nhân tạo, và phát hành một sách trắng, nhưng (tính đến ngày 26 tháng 6 năm 2024) vẫn chưa công bố bất kỳ tính năng trí tuệ nhân tạo nào trong các sản phẩm của mình.
Virtusales gần đây đã ra mắt bộ công cụ trí tuệ nhân tạo đầu tiên của mình, bao gồm gắn thẻ hình ảnh, tạo văn bản thay thế, công cụ biên tập bản thảo, tạo nội dung bán hàng và tiếp thị, và dịch các nội dung đó.
Tôi đã nói chuyện với Klopotek trên Klopotek Publishing Radio. Họ đã “bắt đầu một sáng kiến trí tuệ nhân tạo trong lĩnh vực Dịch vụ Khách hàng,” mặc dù chưa có chi tiết nào được công bố.
Supadu, cung cấp cho các nhà xuất bản “giải pháp thiết kế web, thương mại điện tử và dữ liệu,” hiện có “Supadu Smart AI,” (pdf) với “đánh giá video tiêu đề dẫn dắt bởi nhân vật ảo với Mua thông minh,” “tài liệu quảng cáo dẫn dắt bởi video nhân vật ảo cho các đội tiếp thị & bán hàng,” và “dịch dễ dàng nhiều ngôn ngữ của video tác giả & tiêu đề.”
Phần mềm trí tuệ nhân tạo cho các nhà xuất bản sách: các công ty khởi nghiệp
Một số người quen thuộc với công việc tôi đã làm xung quanh các công ty khởi nghiệp dựa trên công nghệ xuất bản sách. Có một báo cáo trong Publishers Weekly mô tả công việc này, và liên kết đến cơ sở dữ liệu.
Như bạn sẽ thấy trong báo cáo, tôi xem xét khá rộng rãi các công ty khởi nghiệp trên toàn bộ quang phổ xuất bản sách. Tôi không bao gồm các công ty xuất bản sách mới, trừ khi họ làm điều gì đó đặc biệt với công nghệ. Tiêu chí cơ bản là: bạn có sử dụng công nghệ để cố gắng làm mới một khía cạnh nào đó của quy trình xuất bản sách không? Tôi có hơn 1.600 công ty trong cơ sở dữ liệu, hầu hết được thành lập sau khi Amazon phát hành Kindle đầu tiên vào năm 2007.
Sau khi bạn có cái nhìn tổng quát về cơ sở dữ liệu, bạn có thể bắt đầu tìm hiểu sâu hơn. Ở tab bên phải, bạn sẽ thấy cách sắp xếp chỉ các công ty khởi nghiệp xuất bản liên quan đến trí tuệ nhân tạo.
Như bạn có thể thấy trong hình minh họa, có hơn 240 công ty khởi nghiệp xuất bản liên quan đến trí tuệ nhân tạo (tính đến đầu tháng 7 năm 2024). Chúng tôi tính các công ty xuất bản âm thanh sử dụng trí tuệ nhân tạo là một danh mục riêng biệt và tổng số của hai là hơn 300 công ty. Phần lớn, hơn 280, được thành lập sau khi ChatGPT xuất hiện lần đầu tiên vào tháng 11 năm 2022. Khối lượng các công ty khởi nghiệp mới này là chưa từng có trong ngành xuất bản sách. Thật đáng kinh ngạc.
Như đặc trưng của toàn bộ cơ sở dữ liệu, các công ty khởi nghiệp trí tuệ nhân tạo này chủ yếu nhắm mục tiêu đến tác giả (70%). Khoảng 13% nhắm đến việc phục vụ các công ty xuất bản. 10% tập trung vào xuất bản thiếu nhi.
Khoảng 50 công ty khởi nghiệp nhắm vào độc giả với một loạt các dịch vụ sáng tạo. Một số là các nền tảng kể chuyện. Có khá nhiều công cụ tóm tắt. Có nhiều trang web khám phá, “Sử dụng trí tuệ nhân tạo để tìm cuốn sách yêu thích mới của bạn.” Các giọng nói do trí tuệ nhân tạo tạo ra đang ngày càng cải thiện nhanh chóng đã dẫn đến một loạt các công cụ “đọc nó cho tôi.”
Và một số ý tưởng thú vị mà không thể thực hiện được nếu không có trí tuệ nhân tạo.
Bookshelf: Reading Tracker là một ứng dụng kết hợp khám phá sách và thư viện cá nhân bao gồm “theo dõi thời gian tự động, mục tiêu đọc sách & nhắc nhở, và thống kê & xu hướng sâu sắc.” Thủ thư trí tuệ nhân tạo của nó “có thể tạo ra các bản tóm tắt và flash cards, thảo luận về các ý tưởng chính và những điều rút ra, và nhiều hơn nữa.”
Bạn tôi Ron Martinez gần đây đã ra mắt một trang web gọi là Inventionarts.ai giới thiệu “một phương tiện hội thoại mới.” Như trang web giải thích, “Nói chuyện với nhiều nhân vật trí tuệ nhân tạo, mỗi nhân vật có bản sắc, chuyên môn và nhận thức riêng. Mời các nhân vật khác nhau tham gia vào các kịch bản. Và bạn cũng có thể đóng một vai hư cấu!” Một trò chơi văn học, theo một cách nào đó.
Như đặc trưng của nhóm khởi nghiệp lớn hơn, nhiều trong số các công ty khởi nghiệp này có quy mô từ rất nhỏ đến cực kỳ nhỏ, chỉ có một người với một trang web và một ý tưởng chưa hoàn thiện. Tôi bao gồm tất cả—ai biết họ sẽ đi đến đâu.
Tôi rất khuyến khích bạn chơi với cơ sở dữ liệu. Nhấp vào một vài liên kết. Tôi nghĩ bạn sẽ thích thú với sự đổi mới và táo bạo của nhiều tổ chức này.
Một trong những nhà tài trợ của cuốn sách này, Book Advisors, chuyên về sáp nhập và mua lại trong ngành xuất bản. Tôi luôn khuyến khích các startup sáng tạo tìm kiếm đối tác, và Book Advisors là nơi tôi giới thiệu họ để thảo luận về quy trình này. Ngành xuất bản sách có một số công ty M&A đáng kính để gọi đến, bao gồm The Fisher Company và Oaklins DeSilva+Phillips. Book Advisors là công ty duy nhất mà tôi biết cũng làm việc với các startup công nghệ.
AI và Xuất bản Sách: Ngành Công nghiệp Đang Làm Gì Hiện Nay?
Các hoạt động liên quan đến AI của nhiều nhóm thương mại xuất bản nổi bật dường như đang thêm tiếng nói của họ vào dàn hợp xướng lo lắng về bản quyền. Hiệp hội Các Nhà Xuất Bản Mỹ “đã nộp các bình luận phản hồi trong cuộc điều tra của Văn phòng Bản quyền Hoa Kỳ về sự giao thoa giữa luật bản quyền và trí tuệ nhân tạo (AI)...” |
Hiệp hội Các Nhà Xuất Bản Vương quốc Anh lưu ý rằng “điều quan trọng nhất là Chính phủ phải đưa ra các giải pháp cụ thể càng sớm càng tốt để bảo vệ sự sáng tạo và kiến thức của con người, những yếu tố nền tảng cho AI an toàn và đáng tin cậy.”
Mặt khác, Hiệp hội Các Nhà Xuất Bản Độc Lập (IPG), với hơn 600 thành viên, cung cấp hướng dẫn về AI và đào tạo cho các thành viên của mình, bao gồm “Hướng dẫn Thực tiễn về AI trong Xuất bản,” được thực hiện bởi chuyên gia nổi tiếng về AI và xuất bản, George Walkley.
Ở Hoa Kỳ, tôi tự hào là một phần của Nhóm Làm việc về AI của Nhóm Nghiên cứu Ngành Công nghiệp Sách (BISG), báo cáo cho Ủy Ban Quy trình. Nhóm Làm việc đã phác thảo một số sáng kiến chiến lược tiềm năng:
Phát triển các Thực hành Tốt nhất và Tiêu chuẩn: Đề xuất các thực hành tốt nhất liên quan đến việc sử dụng AI, liên kết với các hướng dẫn đạo đức, quy định hiện có và luật pháp. Điều này bao gồm sự minh bạch trong nội dung do AI tạo ra và việc tiết lộ nó cho người tiêu dùng.
Khảo sát và Định nghĩa Ngành: Tiến hành các cuộc khảo sát để thu thập những hiểu biết rộng rãi về việc sử dụng AI hiện tại và tiềm năng trong ngành công nghiệp và xác lập các định nghĩa và phạm vi rõ ràng về AI trong bối cảnh xuất bản sách.
Báo cáo và Đánh giá định kỳ: Cung cấp các báo cáo định kỳ để giúp ngành công nghiệp dự đoán và thích ứng với những thay đổi nhanh chóng do công nghệ AI mang lại.
Các hiệp hội viết và xuất bản khác cũng đang cố gắng đi trước chủ đề này. Một số phản đối AI; những người khác chỉ đang cố gắng giúp các thành viên của mình hiểu công nghệ và có thể thử nghiệm với nó.
AI và Xuất bản Sách: Các Công ty Xuất bản Đang Làm Gì?
Một năm trước, câu hỏi về việc các công ty xuất bản hiện đang làm gì sẽ nhận được câu trả lời là, “không nhiều lắm.” Không có nhiều thay đổi kể từ đó, nhưng đã có một số hoạt động. Tôi sẽ tập trung vào các nhà xuất bản sách thương mại; các nhà xuất bản học thuật và khoa học hoạt động tích cực hơn. Đây là một số điều tôi đã phát hiện ra.
Hachette: Theo một báo cáo tháng 11 năm 2023 trên The Bookseller ở Vương quốc Anh, Hachette đã công bố một tuyên bố về vị trí của mình đối với AI, đưa ra sự phân biệt giữa các sử dụng ‘vận hành’ và ‘sáng tạo’. Công ty “rõ ràng khuyến khích ‘thử nghiệm có trách nhiệm’ cho các sử dụng vận hành nhưng phản đối ‘sự sáng tạo của máy móc... để bảo vệ nội dung sáng tạo gốc do con người tạo ra’.”
HarperCollins: Theo một báo cáo tháng 4 năm 2023 trên Publishers Weekly của Andrew Albanese và Ed Nawotka, CEO của HarperCollins, Brian Murray nói:
“Chúng tôi biết rằng điều đó sẽ quan trọng và sẽ có tác động lớn đến ngành của chúng tôi trong vòng ba đến năm năm tới. Vì vậy, tôi nghĩ rằng nhiều người trong chúng ta đang cố gắng tìm ra cách và đảm bảo rằng chúng tôi sử dụng nó một cách đạo đức, có đạo đức để giúp chúng tôi phục vụ các tác giả và cung cấp dịch vụ chuyên nghiệp cho các tác giả và không cạnh tranh với các tác giả và kể chuyện.
“Và đó, tôi nghĩ, là một thách thức. Không nhiều lắm có thể đối với tất cả các nhà xuất bản ở đây, nhưng tôi đảm bảo với bạn rằng có rất nhiều nhóm công nghệ nhỏ trên khắp thế giới có thể đang nhắm đến công việc kinh doanh của chúng ta. Họ không phải là nhà xuất bản, họ không phải là biên tập viên. Họ là các nhà công nghệ và họ thấy một cơ hội.”
Penguin Random House (PRH): Bertelsmann, công ty mẹ của PRH, cung cấp một tài liệu trắng có tên là State of Play: Exploring Generative AI’s Transformative Effects on the Media & Entertainment Industry, trong đó bao gồm một phần về xuất bản sách.
Ngoài ra, theo một báo cáo trên Publishers Lunch, công ty “đã giới thiệu ứng dụng AI nội bộ của riêng mình, gọi là PRH ChatGPT.”
Bài báo nêu rằng các tài liệu nội bộ của PRH giải thích rằng chương trình này “‘có thể được sử dụng để tối ưu hóa quy trình, nâng cao sự sáng tạo, và cung cấp thông tin chi tiết từ dữ liệu’ trong các phòng ban. Công ty đề xuất rằng trong số các ứng dụng của app này có việc tóm tắt sách và tài liệu; chỉnh sửa email; viết blog hoặc mô tả công việc; phân tích dữ liệu văn bản, và ‘tạo ra ý tưởng cho nội dung.’”
Simon & Schuster: CEO của công ty, Jonathan Karp, đã được đề cập trong danh sách “Những khoảnh khắc văn học đáng nhớ nhất trong 25 năm qua” của New York Times với một câu trích dẫn ghi lại trong Publishers Weekly từ chương trình U.S. Book Show tháng 5 năm 2024. Ông nói rằng AI không phải là “con voi trong phòng” mà đúng hơn, “giống như con ve sầu trong thế giới. Bạn biết đấy, nhiều tiếng rì rầm và nhiều hoạt động.”
Ông thừa nhận rằng AI “chắc chắn là một công cụ có giá trị. Nó chắc chắn sẽ làm cho chúng ta hiệu quả hơn. Nó sẽ giúp chúng ta xử lý và thu thập thông tin tốt hơn, và hy vọng cho phép người lao động làm những công việc ở mức độ cao hơn, thú vị hơn và sáng tạo hơn.”
Vào tháng 3, tại Hội chợ Sách London, như được báo cáo trong The Bookseller, Karp nói rằng công ty cũng sẽ xem xét các phiên bản ngôn ngữ nước ngoài của sách nói được tạo bởi AI “tại những khu vực mà [tác phẩm của tác giả đó] sẽ không bao giờ có cơ hội vì chi phí sản xuất [sách nói].”
AI và Xuất bản Sách: Các Trường Hợp Sử Dụng
Các trường hợp sử dụng cụ thể cho AI và xuất bản sách, qua các chức năng khác nhau, rất dễ mô tả về mặt khái niệm. Nhưng không có nhiều thông tin về việc các nhà xuất bản thực sự đang làm gì. |
Keith Riegert, CEO của Ulysses Press và Perfect Bound, đã trình bày tại U.S. Book Show của Publishers Weekly vào tháng 5 năm 2024, cung cấp cái nhìn tổng quan toàn diện nhất mà tôi từng thấy về các trường hợp sử dụng AI trong các công ty xuất bản. Perfect Bound là nhà tài trợ của báo cáo này; tôi đồng ý với tuyên bố đó. Ông cung cấp “20 cách thực tế mà bạn, với tư cách là một chuyên gia xuất bản, có thể bắt đầu sử dụng AI ngay bây giờ.”
Bài thuyết trình của ông, Bắt Đầu Với AI, có thể xem và tải về từ trang web của Perfect Bound.
Chuyện gì xảy ra khi AI đọc một cuốn sách?
Tôi mượn tiêu đề phần này từ bản tin của Ethan Mollick một cách có chủ đích—không cần phải cố gắng cải thiện nó. Mollick là một giáo sư tại Wharton School của Đại học Pennsylvania, người nghiên cứu về khởi nghiệp & đổi mới. Bản tin của ông, mà tôi thường xuyên khuyến nghị, là điềm tĩnh, tươi mới và có những cái nhìn sắc bén độc đáo.
Trong số những điều làm cho Mollick trở thành một bình luận viên đủ điều kiện là ông không có lợi ích cá nhân trong vấn đề này. Ông không cần phải bán AI, cũng không cần phải hạ bệ nó. Ông chỉ cam kết khám phá AI trong nhiều tác động của nó, chủ yếu là đối với giáo dục, văn hóa, viết lách và xuất bản. Và ông là một nhà viết lách xuất sắc, rõ ràng.
Nếu bạn xem qua kho lưu trữ bản tin của Mollick, bạn sẽ thấy rằng ông không bắt đầu tập trung vào AI cho đến tháng 12 năm 2022. Đó không phải là lĩnh vực của ông—giống như hầu hết chúng ta, AI đã xuất hiện trong công việc hàng ngày của ông, và ông không thể rời mắt khỏi nó.
Trong bài viết này, những cái nhìn sâu sắc của ông rơi gần nhất vào mối quan tâm của chúng ta như là các chuyên gia xuất bản. “Liệu AI,” ông hỏi, “có thể thay đổi cách chúng ta tương tác với sách không?”
Để trả lời câu hỏi này, Mollick lưu ý, “chúng ta cần cả một AI có bộ nhớ đủ lớn để chứa một cuốn sách, và một tác giả biết cuốn sách của mình đủ rõ để đánh giá kết quả của AI.” Mollick kiểm tra một trong số các tiêu đề của mình (ông không chỉ rõ cuốn nào, nhưng từ các cuộc trò chuyện, rõ ràng đó là The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors, một cuốn sách được đánh giá tích cực trên Amazon, mặc dù không phải là bestseller hiện tại).
Mollick xem xét các khía cạnh khác nhau về giá trị tiềm năng của AI đối với tác giả, nhà xuất bản hoặc độc giả, bao gồm “AI như độc giả và biên tập viên,” và “một ứng dụng thực tế: giúp đỡ cho giảng viên.” Ông yêu cầu một mô hình ngôn ngữ lớn (LLM) - không phải ChatGPT - tóm tắt cuốn sách. Nó đã thành công đến mức hài lòng của Mollick.
Sau đó là một thử thách khó hơn: “Hãy cho tôi ví dụ về các phép ẩn dụ trong cuốn sách.” Ông chỉ ra rằng phép ẩn dụ “là thách thức ngay cả đối với người đọc, vì nó liên quan đến việc tìm kiếm cách sử dụng ngôn ngữ hình ảnh mà không có bất kỳ dấu hiệu rõ ràng nào (không giống như phép so sánh, không có từ ‘giống như’ hay ‘như’).” Các kết quả, ông ghi nhận, “rất ấn tượng, dù có một vài lỗi nhỏ.”
LLM ít thành công hơn trong vai trò biên tập viên: những thất bại trong lĩnh vực này, Mollick lưu ý, minh họa “điều gì đó đã trở nên rõ ràng về trạng thái hiện tại của AI: nếu bạn là một nhà văn hoặc biên tập viên rất giỏi, bạn giỏi hơn AI hiện tại…”
Tuy nhiên, “AI có, hoặc ít nhất có vẻ như có, sự hiểu biết về ngữ cảnh và ý nghĩa của một đoạn văn bản.” Do đó, Mollick tin rằng “cách chúng ta liên hệ với sách có khả năng thay đổi do AI.”
Tôi cũng nghĩ vậy.
AI và thiết kế & sản xuất sách
Các hệ thống chuyên gia và tự động hóa quy trình vẫn đi trước AI khi nói đến thiết kế và sản xuất sách. |
Phần mềm dàn trang tự động cho sách đã có từ ít nhất những năm 1970. Giữa những năm 1980, tôi giám sát một dự án phần mềm gọi là PageOne, dựa trên TeX của Donald Knuth, có thể dàn trang một cuốn sách chỉ trong vài phút. SGML đã xuất hiện vào khoảng cùng thời gian đó, dựa trên một tiêu chuẩn tài liệu được giới thiệu vào năm 1969. Nó phần lớn được thay thế bởi XML, được giới thiệu vào năm 1996. Những ngôn ngữ đánh dấu mạnh mẽ này tạo ra các cấu trúc vững chắc cho tự động hóa.
Xuất bản máy tính để bàn đã mở ra một vòng tự động hóa khác cho QuarkXPress và Adobe InDesign, cũng như Adobe Illustrator và Adobe Photoshop. Quy trình làm việc xuất bản có thể được quản lý bằng nhiều chương trình và hệ thống khác nhau.
Một tổ chức đáng chú ý là Coko Foundation. Họ cung cấp một loạt các công cụ quản lý sản xuất và xuất bản mã nguồn mở, bao gồm Kotahi, một nền tảng xuất bản học thuật, và Ketty cho sản xuất sách, bao gồm một Trợ lý AI. Kotahi AI PDF Designer, “biến thiết kế PDF thành một quy trình đơn giản và tương tác.”
Có một số sáng kiến ban đầu để mang AI vào quy trình làm việc của InDesign. Vào tháng Tư năm 2024, Adobe đã công bố một tính năng Text to Image. Các bên thứ ba có thể đang dẫn trước Adobe ở đây: các nhà cung cấp tiền xử lý và sản xuất sáng tạo ở Ấn Độ, chẳng hạn như Hurix Digital và Integra, đang tỏ ra sáng tạo hơn Adobe trong việc khai thác AI cho sản xuất.
AI & tiếp thị sách
Tác động của AI đối với tiếp thị sách sẽ nông trong ngắn hạn, nhưng trong dài hạn sẽ sâu sắc hơn nhiều. Nhiều điều phụ thuộc vào cách bạn nhận thấy ‘tiếp thị sách’ là gì; nó đang thay đổi. |
Các ‘quả treo thấp’ là rõ ràng. Yêu cầu Chat AI giúp với mô tả sản phẩm hoặc thông cáo báo chí. Yêu cầu nó gợi ý một số từ khóa. Điều này nó có thể làm, mà không đổ mồ hôi. Nhưng hầu hết các chuyên gia xuất bản cũng có thể làm điều tương tự, chỉ với một chút mồ hôi trên trán.
Các trường hợp sử dụng của Keith Riegert, được liên kết ở trên, bao gồm các gợi ý cho tiêu đề brainstorming, soạn thảo báo cáo tiếp thị kỹ thuật số, và tạo trình theo dõi chiến dịch tiếp thị kỹ thuật số trong Google Sheets.
Phần mềm Shimmr, được mô tả ở trên, gợi ý về hình dạng của tiếp thị tự động trong tương lai.
AI và siêu dữ liệu
AI có liên quan gì đến siêu dữ liệu, và ngược lại? Vai trò của nó dường như khiêm tốn cho đến nay; mong đợi những thay đổi lớn. |
Siêu dữ liệu là cốt lõi của khả năng khám phá sách. Bạn đã nghe điều đó đủ nhiều lần để buồn nôn vì lời khuyên này. Nó khó chịu chủ yếu vì “siêu dữ liệu” vẫn khó nắm bắt đối với hầu hết những người không chuyên về công nghệ. Nếu bạn nói, “nó chỉ là thông tin cơ bản về cuốn sách, tiêu đề, mô tả, giá cả, các danh mục chủ đề, những thứ như vậy,” mọi người thở phào. Điều đó họ cảm thấy thoải mái. Nhưng đó là tất cả.
Tôi rất tiếc phải nhắc nhở bạn rằng siêu dữ liệu thực sự còn nhiều hơn chỉ là một vài chi tiết về cuốn sách. Nó còn nhiều hơn thế. Nhiều hơn những gì tôi có thể bao quát trong cuốn sách nhỏ này. Tôi đã đồng tác giả một cuốn sách về chủ đề này. Ingram xuất bản Metadata Essentials, một tập sách ngắn xuất sắc. Tôi sẽ nói điều này ở đây, và không phải lần cuối cùng: các tác giả và nhà xuất bản coi nhẹ siêu dữ liệu của họ là tự chuốc lấy nguy hiểm.
Trí tuệ nhân tạo có thể giúp tạo siêu dữ liệu. Ví dụ, nhà cung cấp tự xuất bản PublishDrive, cung cấp “Trình tạo siêu dữ liệu sách dựa trên AI” cung cấp các đề xuất AI cho tiêu đề sách, mô tả ngắn, danh mục Amazon, danh mục BISAC và từ khóa.
Insight, từ Veristage, được mô tả ở trên, có thể tạo ra các mô tả, từ khóa, danh mục BISAC và xác định đối tượng mục tiêu.
Tuyên bố sử dụng AI trong siêu dữ liệu
Bạn có thể nghĩ rằng thế giới trang trọng của siêu dữ liệu sẽ chậm chạp để hiểu về AI. Không phải vậy! Tháng 11 năm ngoái, EDItEUR, người giữ tiêu chuẩn ONIX, đã phát hành một Ghi chú Ứng dụng ngắn gọi là “Các khía cạnh của AI trong ONIX.” (pdf) |
Với sự hiểu biết sâu sắc đặc trưng của mình, Graham Bell, giám đốc của tổ chức, lưu ý rằng “một phản ứng đối với (những tranh cãi xung quanh công nghệ) là từ chối sử dụng AI hoặc tránh buôn bán các sản phẩm do AI tạo ra. Một lựa chọn thực tế hơn là đơn giản là minh bạch với đối tác thương mại và độc giả khi AI đã được sử dụng. Và khi một số nhà bán lẻ hạn chế hoặc cấm nội dung dựa trên AI từ nền tảng của họ, điều quan trọng là các nhà xuất bản có uy tín phải làm nổi bật những sản phẩm sử dụng kỹ thuật AI tạo nội dung.”
Bell tiếp tục phác thảo các cách mà nhà xuất bản có thể chỉ định trong siêu dữ liệu:
Các tác giả AI
Giọng nói dựa trên AI trong sách nói
… cũng như một phương pháp để chỉ định trong siêu dữ liệu cho các sản phẩm kỹ thuật số rằng nhà xuất bản rõ ràng từ chối khai thác văn bản và dữ liệu (TDM) cho các mục đích khác ngoài nghiên cứu. Cũng có một cách để chỉ định một giấy phép riêng cho việc khai thác TDM thương mại hoặc không nghiên cứu.
Như thường lệ, điều được chỉ định trong ONIX có thể không được phát hiện xuống chuỗi giá trị, nhưng ít nhất đã có một nỗ lực tốt nhất.
Chiến lược tích hợp AI vào hoạt động xuất bản
Có rất ít điều mà các công ty xuất bản cảm thấy không thoải mái hơn là tích hợp các công nghệ kỹ thuật số phức tạp vào hoạt động hàng ngày của họ. Điều đó là dễ hiểu. AI, đặc biệt, đang gây ra lo lắng cho mọi người, không chỉ trong lĩnh vực xuất bản. Nó mới, nó bí ẩn, nó cá nhân hóa, nó mạnh mẽ. Mọi người cảm thấy bị đe dọa bởi AI vì nhiều lý do. Thay đổi thái độ cần thời gian. |
Nhưng đây không phải là thời điểm thích hợp để e ngại công nghệ.
Có những cách tiếp cận bình tĩnh và hợp lý để tích hợp AI vào hoạt động xuất bản của bạn, bất kể quy mô tổ chức của bạn.
Động lực phải đến từ trên cùng. Rất trên cùng. Các giám đốc điều hành cấp cao cần phải nắm bắt tầm nhìn về tác động có thể biến đổi của AI và truyền đạt một chương trình cho nhân viên trên toàn tổ chức. Chương trình có thể chỉ đơn giản là “thử nghiệm, ghi lại các thử nghiệm của bạn, và chia sẻ.” Đó là một khởi đầu tốt.
The Economist gần đây đã tham chiếu một chiến thuật tổ chức để áp dụng công nghệ mới gọi là “phương pháp ngọn hải đăng.” Bạn tạo ra một ngọn đèn bằng cách chọn một bằng chứng khái niệm nổi bật có thể được thực hiện nhanh chóng, mà mọi người đều có thể liên hệ đến.
Các công ty xuất bản đang bị cản trở bởi sự ồn ào xung quanh bản quyền: các tác giả đang phẫn nộ. Một cuộc khảo sát của Hội Tác giả vào tháng 5 năm 2023 cho thấy “90 phần trăm các nhà văn tin rằng các tác giả nên được bồi thường nếu tác phẩm của họ được sử dụng để huấn luyện các công nghệ AI tạo sinh,” và 67 phần trăm nói rằng họ “không chắc liệu hợp đồng xuất bản của họ hoặc các điều khoản dịch vụ nền tảng có bao gồm quyền sử dụng tác phẩm của họ cho bất kỳ mục đích liên quan đến AI nào hay không.” Những tác giả không chắc chắn đó hiện đang hỏi nhà xuất bản của họ liệu AI có được sử dụng trong việc chỉnh sửa hoặc sản xuất tác phẩm của họ hay không, và một số tác giả có tiếng nói đang yêu cầu rằng không được sử dụng. Họ đang tìm kiếm tương đương AI của một tiệm bánh không có đậu phộng.
Đây là một vấn đề gai góc cho các nhà xuất bản–nếu bạn không thể sử dụng AI trên những cuốn sách bạn dự định xuất bản, bạn có thể sử dụng nó cho gì?
Phát triển và truyền đạt chính sách AI
Mặc dù được sử dụng rộng rãi, ít nhà xuất bản đã định nghĩa công khai chính sách AI của họ và truyền đạt cách tiếp cận AI của họ tới công chúng. Thuật ngữ ‘công chúng’ có một ý nghĩa mơ hồ ở đây, khi bạn xem xét các công chúng khác nhau được nhắm đến bởi các nhà xuất bản thương mại, học thuật và giáo dục.
Đối với các nhà xuất bản thương mại, khán giả quan trọng nhất là các tác giả và đại diện của họ. Các nhà xuất bản học thuật gặp phải những trở ngại khác nhau khi họ xem xét tác động đầy hứa hẹn của trí tuệ nhân tạo đối với nghiên cứu, và sau đó là tác động phức tạp hơn của trí tuệ nhân tạo khi chuyển đổi nghiên cứu thành câu chuyện (Avi Staiman đã viết một bài viết suy ngẫm về chủ đề này). Đối với các nhà xuất bản giáo dục, việc thiết lập chính sách là khó khăn, vì sự xâm nhập của trí tuệ nhân tạo vào việc giảng dạy và giáo dục là đa diện và phức tạp.
Tôi nghĩ rằng các nhà xuất bản sẽ phải đối mặt với hai thách thức lớn khi tiến về phía trước với công nghệ trí tuệ nhân tạo. Thách thức đầu tiên là phát triển một vị trí công ty về cách tiếp cận trí tuệ nhân tạo một cách tổng thể, về cách tích hợp trí tuệ nhân tạo vào quy trình làm việc của họ. Thách thức thứ hai là truyền đạt rõ ràng và không mơ hồ vị trí đó đến các đối tượng của họ.
Các chính sách của nhà xuất bản mà tôi đã thấy phần lớn đều có khuyết điểm. Một số trong số đó thực sự là các chính sách hướng ngoại, đối với các tác giả, với một loạt các cảnh báo về những gì là thực hành chấp nhận được (không nhiều) và những gì là không chấp nhận được (rất nhiều). Chính sách “Sử Dụng Trí Tuệ Nhân Tạo cho Tài Năng Phát Triển Nội Dung cho O’Reilly” của O’Reilly kéo dài nhiều trang, với hướng dẫn chuyên ngành, chẳng hạn như “KHÔNG sử dụng bất kỳ mô hình OSS GenAI nào tạo ra phần mềm Output chịu sự điều chỉnh của giấy phép mã nguồn mở copyleft hoặc mạng lưới lan truyền.”
Mặt khác, nhà xuất bản học thuật Elsevier, trong phần “Chính Sách Elsevier” trên trang web của mình, bao gồm các tuyên bố về “Nguyên tắc Trí Tuệ Nhân Tạo Có Trách Nhiệm”, “Khai thác Văn bản và Dữ liệu”, và “Sử dụng công nghệ trí tuệ nhân tạo và trợ giúp trí tuệ nhân tạo trong viết bài cho Elsevier.”
Các chính sách nội bộ, chưa công bố của các nhà xuất bản mà tôi đã thấy thì bảo thủ, quá mức. Những nhà xuất bản này đã phản ứng quá nhanh với một loạt các mối đe dọa được nhận thức và có thể có, và với sự lo lắng của các tác giả của họ, và đã tự trói tay trong khả năng tham gia mạnh mẽ với công nghệ phát triển nhanh và thay đổi nhanh này.
Điều hiển nhiên là họ sẽ sử dụng trí tuệ nhân tạo ‘một cách có trách nhiệm,’ bất kể điều đó có nghĩa là gì. Điều hiển nhiên là họ có mối quan tâm cao nhất đối với tài sản trí tuệ của các tác giả và việc bảo vệ mạnh mẽ tác phẩm có bản quyền của tác giả. (Mặc dù, tất nhiên, những nguyên tắc rộng lớn này phải được công khai tuyên bố, và thường xuyên nhắc lại.)
Nhưng còn gì nữa?
Họ có cho phép trí tuệ nhân tạo đóng vai trò trong việc thâu nhận biên tập không? Trí tuệ nhân tạo có thể xem xét đống thư từ chối không?
Họ có cho phép trí tuệ nhân tạo đóng vai trò trong biên tập phát triển, biên tập dòng và biên tập bản thảo không?
Họ có cho phép trí tuệ nhân tạo đóng vai trò trong việc xác định số lượng bản in và phân bổ không?
Trong việc tạo ra các tệp sách điện tử dễ tiếp cận, bao gồm văn bản thay thế?
Trong hỗ trợ tạo sách nói trong trường hợp không khả thi về kinh tế để thuê người kể chuyện tài năng?
Trong hỗ trợ dịch ngôn ngữ sang các thị trường mà quyền không bao giờ được bán?
Trong phát triển tài liệu tiếp thị ở quy mô lớn?
Trong giao tiếp với các nhà bán lẻ?
Nếu có, họ phải làm rõ điều này, và giải thích rõ ràng suy nghĩ đằng sau những chính sách này. Các nhà xuất bản phải dũng cảm đối mặt với nhiều phản đối của hầu hết các tác giả trong thời điểm sợ hãi và nghi ngờ này.
Cân nhắc về công việc
Chỉ các nhà xuất bản lớn nhất mới có thể thuê nhân viên chuyên làm việc với phần mềm và hệ thống trí tuệ nhân tạo. Nhà xuất bản trung bình sẽ muốn tiếp xúc tất cả nhân viên của họ với các công cụ trí tuệ nhân tạo, mong đợi rằng mỗi người có thể khám phá việc sử dụng trí tuệ nhân tạo để tìm kiếm hiệu quả trong công việc của mình. |
Tại hội nghị PubWest tháng 2 năm 2024 ở Arizona, một diễn giả từ ngành công nghiệp ngoài ngành xuất bản đã gợi ý rằng một trong những cách sử dụng trí tuệ nhân tạo sẽ là thay thế thực tập sinh. Cả phòng bùng nổ. Cô ấy có ý tốt–thực sự một báo cáo ngày 10 tháng 4 năm 2024 trên New York Times mô tả cách các ngân hàng đầu tư Phố Wall đang tìm cách thay thế nhiều thực tập sinh của họ bằng trí tuệ nhân tạo. Tương tự như trường hợp trong ngành xuất bản, một mối quan tâm rõ ràng là: làm thế nào tìm được các nhà phân tích cấp cao nếu họ không thể bắt đầu như các nhà phân tích cấp thấp?
Ngành công nghiệp xuất bản luôn dựa vào các kỳ thực tập. Một nghiên cứu năm 2019 phát hiện rằng 80 phần trăm những người đã làm việc trong ngành xuất bản dưới mười lăm năm đã từng tham gia thực tập trước đây.
Một phần là để giải quyết công việc vặt với chi phí hợp lý. Nhưng điều đó nhạt nhòa so với thực tế lớn hơn rằng không trường học xuất bản nào có thể trang bị cho ai đó để gia nhập một công ty xuất bản ở cấp độ quản lý trung cấp. Cách duy nhất để phát triển nhân viên có kỹ năng của ngày mai là đào tạo thực tập sinh và học việc hôm nay.
Mục tiêu ở đây không phải là tìm cách thay thế thực tập sinh bằng trí tuệ nhân tạo, mà là làm cho công việc của họ hiệu quả hơn và đáng làm hơn bằng cách sử dụng các công cụ trí tuệ nhân tạo, mang lại lợi ích cho cả thực tập sinh và công ty xuất bản.
AI cho Sách Nói
AI cho sách nói hoạt động rất tốt. Nó không hoàn hảo, nhưng nó hoạt động. Các tác giả và nhà xuất bản hiện đang thường xuyên sử dụng các công cụ AI trong sản xuất sách nói, chủ yếu cho những cuốn sách mà việc sản xuất sách nói tập trung vào người kể chuyện không khả thi về mặt tài chính. Và không chỉ cho sách nói bằng tiếng Anh, mà còn cho sách nói được dịch. |
Sử dụng AI cho sách nói không phải là mới; Tôi đã báo cáo về xu hướng này trên Publishers Weekly vào năm 2021. Nhưng các mô hình ngôn ngữ lớn mới hơn đã làm sống lại công nghệ cho việc tường thuật sách nói tự động.
Vào năm 2021, tôi đã lưu ý “Nó có hoàn hảo không? Chắc chắn là không. Nó có thể đủ tốt không? Có lẽ, nếu nhà xuất bản sẵn sàng dành thời gian cần thiết trong giai đoạn chỉnh sửa giọng nói của dự án.” Hai năm rưỡi sau, theo nhiều báo cáo, giọng nói AI không thể phát hiện được so với giọng nói con người, trừ khi bạn lắng nghe rất kỹ.
Tháng 11 năm ngoái, Meta (Facebook) đã giới thiệu “Seamless,” có khả năng “chuyển giọng điệu, biểu cảm cảm xúc và phẩm chất phong cách giọng nói” vào việc dịch 200 ngôn ngữ. Một cuốn sách nói có thể được dịch ngay lập tức sang nhiều ngôn ngữ với chất lượng tuyệt vời.
Cũng vào năm 2021, tôi đã báo cáo rằng “Lệnh cấm của Audible đối với việc phân phối sách nói có người kể chuyện không phải là con người là một vấn đề thực sự có thể mất một thời gian để giải quyết.” Trong khi đó, cả Google và Apple đều công bố các chương trình cho phép các tác giả tạo sách nói với giọng nói được tạo bởi AI. Vào ngày 5 tháng 12, Findaway Voices của Spotify đã bắt đầu chấp nhận “sách nói được kể bởi giọng nói kỹ thuật số từ Google Play Books để phân phối cho các đối tác bán lẻ được chọn.”
Đầu tháng 11 năm 2023, Amazon thông báo rằng các tác giả của Kindle Direct Publishing (KDP) sẽ sớm có quyền truy cập vào một dịch vụ cho phép họ “nhanh chóng và dễ dàng sản xuất phiên bản sách nói của ebook của họ bằng cách sử dụng tường thuật giọng nói ảo, một công nghệ giọng nói tổng hợp.” Vào tháng 1, 2024, Jane Friedman đã báo cáo (paywall) “Audible âm thầm bắt đầu cho phép sách nói được kể bởi AI vào cửa hàng của mình vào cuối mùa thu năm ngoái, lâu sau khi các nhà bán lẻ khác đã làm điều tương tự.”
Và, tất nhiên, tôi đang sử dụng AI cho các phiên bản sách nói của cuốn sách này.
AI cho Dịch Sách
AI cho dịch sách hoạt động. Có lẽ không tốt bằng việc tạo sách nói tự động. Nhưng nó đang tiến rất gần, rất nhanh. Tiểu thuyết phi văn học có thể là đầu tiên. Tiểu thuyết văn học có thể theo sau. Phi hư cấu đặt ra một tập hợp thách thức khác. |
Tôi đã tổ chức một hội thảo trực tuyến về AI cho dịch sách, được tài trợ bởi BISG, vào tháng 6 năm 2024. Video có sẵn trên YouTube. Jane Friedman cũng mô tả chương trình trong bản tin Hot Sheet của cô ấy.
Chủ đề rất phức tạp và tinh tế. Một điều tôi thấy thú vị là con người đã cố gắng tự động hóa việc dịch thuật trong bao lâu. Nó nhắc nhở rằng sách, những thứ lấp đầy vũ trụ của chúng ta, chỉ là một tỷ lệ nhỏ của giao tiếp bằng văn bản, thậm chí còn nhỏ hơn trong thời đại trực tuyến này.
Warren Weaver, được coi là cha đẻ của dịch máy (MT), đã nói với một đồng nghiệp, “Khi tôi nhìn vào một bài viết bằng tiếng Nga, tôi nói: ‘Đây thực sự được viết bằng tiếng Anh, nhưng nó đã được mã hóa bằng một số ký hiệu lạ. Bây giờ tôi sẽ tiến hành giải mã.’” Đối với một máy, ngôn ngữ chỉ là mã. Nó không phải là văn hóa và cảm xúc và sự hùng vĩ của ngôn ngữ viết. Nó là một nhiệm vụ với các con số và mã.
Rõ ràng là sự phân chia giữa tiểu thuyết và phi hư cấu sẽ rất lớn trong dịch thuật AI. Chat AI mạnh về phong cách, nhưng thiếu sót về sự kiện. Đây là những ngày đầu, nhưng tôi có xu hướng nghĩ rằng Chat AI sẽ tỏa sáng với tiểu thuyết, nhưng thiếu sót với phi hư cấu. (Tuy nhiên, tôi vẫn đang tiến hành dịch máy cho cuốn sách đầy sự kiện này!)
Tiểu thuyết văn học rất giống như con voi trong phòng. Nó quý giá và được tôn kính và đúng như vậy. Các dịch giả có thể dành hàng giờ để tranh luận về một từ hoặc cụm từ. Chat AI phải đi cẩn thận trong những vùng nước đó.
Nhưng đây là vùng đất màu mỡ. Theo như tôi có thể xác định (từ dữ liệu ít ỏi), chỉ có 9.500 bản dịch sách thương mại vào năm 2023. Ngay cả khi tôi sai lệch lớn, rõ ràng là rất ít sách được dịch từ các ngôn ngữ nước ngoài sang tiếng Anh.
Tương tự, tôi đã tìm thấy một thống kê cho thấy vào năm 2023 chỉ có 7.230 bản dịch từ tiếng Anh sang tiếng Tây Ban Nha (trong thị trường sách tiếng Tây Ban Nha). Điều đó có vẻ nhỏ một cách lố bịch.
Có rất nhiều cơ hội ở đây.
Phần lớn việc sử dụng AI để dịch sách sẽ dành cho những cuốn sách mà việc dịch thuật chưa bao giờ được coi là khả thi về mặt kinh tế. Chắc chắn sẽ có tác động việc làm đối với các dịch giả của những cuốn sách “thị trường trung bình”; sự tăng trưởng việc làm sẽ nằm ở quản lý dự án và kiểm tra chất lượng. Liệu điều đó có bù đắp cho sự mất việc làm không? Khó có khả năng.
Giống như hầu hết các khía cạnh của AI, có những vấn đề thách thức cần giải quyết và không có câu trả lời dễ dàng.
Như tôi đã đề cập trong phần mềm, Leanpub và DeepL là hai công ty cung cấp dịch vụ dịch sách hỗ trợ AI cho các tác giả và nhà xuất bản.
AI cho Xuất bản Học thuật
Các nhà xuất bản thương mại và tác giả thuộc mọi lĩnh vực nên theo dõi quỹ đạo của AI trong cộng đồng xuất bản học thuật. Nó đang tiến bộ nhanh hơn nhiều so với trong xuất bản tiêu dùng. |
Tôi thấy có hai lý do cho sự tiến bộ này. Thứ nhất, các tác giả trong xuất bản học thuật là những người làm nghề học thuật, và trong lĩnh vực STM (khoa học, kỹ thuật và y tế), họ thường là các nhà khoa học có bằng cấp cao. Bên cạnh việc xuất bản, họ đang điều tra và thường chấp nhận AI trong công việc của mình. Họ sẽ ngạc nhiên hơn khi thấy nhà xuất bản của họ không khám phá việc sử dụng AI trong việc chỉnh sửa và xuất bản công việc của họ.
Điều này lan tỏa đến hệ sinh thái xuất bản học thuật, nơi mà, thường thì, các biên tập viên cũng là các học giả. Đối với họ, công nghệ không đáng sợ.
Tôi sẽ không đi sâu hơn vào chi tiết trong cuốn sách này; tôi sẽ báo cáo chi tiết hơn trên blog của mình.
AI cho Tác giả
Các tác giả và nhà xuất bản thường thấy mình sống trong hai thế giới cô lập, có liên hệ nhưng về cơ bản là tách biệt. Điều đó phần lớn đúng trong xuất bản hiện đại.
Thời gian thay đổi. Khi các nhà xuất bản từng không thể chạm tới, giờ đây các tác giả hàng đầu lại nắm quyền điều khiển. Như tôi đã thảo luận ở chỗ khác, các tác giả tự xuất bản là những người tiên phong. Họ mang ít gánh nặng hơn so với xuất bản truyền thống.
Khi các nhà xuất bản nhìn vào AI, họ thấy ít cơ hội. Khi tôi nói chuyện với các tác giả về AI, thế giới của họ như mở ra. Các khả năng gần như vô tận:
Tác giả và chỉnh sửa
Cố gắng viết & xuất bản toàn bộ sách
Cố gắng tạo ý tưởng cho một dự án mới
Cố gắng tạo ý tưởng trong một cuốn sách mới
Tinh chỉnh câu chuyện
Nghiên cứu
Kiểm tra sự thật
Bạn đồng hành viết lách
Chỉnh sửa phát triển
Chỉnh sửa bản sao
Kiểm tra chính tả và ngữ pháp
Đọc lại
Minh họa/hình ảnh
Tạo minh họa và biểu đồ
Thiết kế bìa nháp
Quảng cáo video
Tiếp thị
Tự động hóa các đệ trình tới các đại lý, nhà xuất bản, cuộc thi, bạn bè, yêu cầu lời giới thiệu
Tạo tài liệu tiếp thị: thông cáo báo chí, bài viết blog, mạng xã hội, v.v.
Tạo trang web
Các tác giả sẽ thúc đẩy nhiều thay đổi trong việc áp dụng AI trong ngành, dù ủng hộ hay phản đối.
Họ là những người hưởng lợi từ nhiều đổi mới khởi nghiệp xung quanh AI trong việc viết và xuất bản — khoảng 70% các công ty khởi nghiệp đang tìm cách làm việc với các tác giả trên hành trình của họ.
Mối quan ngại và Rủi ro Xung quanh AI
Những mối quan ngại xung quanh AI là nghiêm trọng. Những rủi ro là có thật. Đôi khi chúng được thể hiện một cách thổi phồng, nhưng, khi bạn đi sâu vào, tác động của AI có tiềm năng rất lớn để gây ra sự hủy diệt. |
Có rất nhiều vấn đề và mối quan ngại xung quanh AI, chúng có thể lấp đầy nhiều tập sách riêng. Đây là một đám mây từ các chủ đề mà tôi theo dõi. Tôi chắc rằng tôi còn bỏ sót một vài.
Có rất nhiều thông tin có sẵn về mỗi chủ đề này, và tôi khuyến khích bạn đọc càng sâu càng tốt. Có thể bạn sẽ kết luận rằng rủi ro vượt trội so với lợi ích, và rằng bạn không muốn theo đuổi việc sử dụng AI, dù là cá nhân hay trong tổ chức của bạn. Quyết định đó mang lại những rủi ro riêng của nó; thông thường, là bị bỏ lại phía sau. Nhưng đó là sự lựa chọn cá nhân.
Nếu bạn tìm kiếm trên Google “sách về các rủi ro của AI” bạn sẽ tìm thấy một loạt các tập sách đáng để đọc. Một podcast gần đây mà tôi thấy đặc biệt rùng mình là cuộc trò chuyện của Ezra Klein với Dario Amodei, đồng sáng lập và CEO của Anthropic (công ty phát triển Claude.ai). Bạn sẽ biết rằng các công ty này nhận thức được các rủi ro. Amodei đề cập đến một hệ thống phân loại rủi ro nội bộ gọi là A.S.L., cho “Cấp độ An toàn AI” (không phải Ngôn ngữ Ký hiệu Mỹ). Chúng ta hiện đang ở ASL 2, “hệ thống cho thấy dấu hiệu ban đầu của các khả năng nguy hiểm - ví dụ như khả năng đưa ra hướng dẫn về cách tạo vũ khí sinh học.” Ông mô tả ASL 4 là “cho phép các tác nhân cấp quốc gia tăng cường đáng kể khả năng của họ… nơi chúng tôi lo ngại rằng Triều Tiên, Trung Quốc hoặc Nga có thể tăng cường đáng kể khả năng tấn công của họ trong các lĩnh vực quân sự khác nhau với AI theo cách mà sẽ mang lại cho họ lợi thế đáng kể ở cấp độ địa chính trị.” Những điều rùng mình.
Trong bối cảnh ảm đạm này, tôi sẽ nhấn mạnh những vấn đề quan trọng nhất đối với các nhà văn và nhà xuất bản.
Bản quyền bị vi phạm?
Các vấn đề về bản quyền là một mớ hỗn độn phức tạp và mơ hồ. Có vẻ như một số sách vẫn đang còn bản quyền đã được bao gồm trong quá trình huấn luyện một số mô hình ngôn ngữ lớn (LLM). Nhưng chắc chắn không phải là, như một số tác giả lo sợ, tất cả tác phẩm của họ đã bị hút vào từng mô hình ngôn ngữ lớn. |
Các vấn đề về bản quyền vừa cụ thể vừa rộng lớn. Ai cũng biết rằng tất cả các LLM đều được huấn luyện trên web mở—mọi thứ có thể được quét từ 1,5 tỷ trang web hiện nay, dù là các bài báo, bài đăng trên mạng xã hội, blog web và, dường như, các bản ghi của video YouTube.
Đã được chứng minh rằng ít nhất một trong các LLM đã nuốt chửng văn bản thực tế của hàng ngàn cuốn sách không thuộc phạm vi công cộng.
Có hợp pháp không khi nuốt chửng tất cả văn bản này để xây dựng các công ty AI trị giá hàng tỷ đô la mà không cần bồi thường cho các tác giả? Các công ty AI lập luận về “sử dụng hợp lý”; các tòa án sẽ quyết định sau cùng. Ngay cả khi nó hợp pháp, liệu nó có đạo đức hay không? Khía cạnh đạo đức dường như ít phức tạp hơn các cân nhắc pháp lý. Bạn quyết định.
Các luật xung quanh bản quyền rõ ràng không dự đoán được những thách thức độc đáo mà AI mang lại cho vấn đề này, và tìm kiếm các giải pháp pháp lý sẽ mất thời gian, có thể là nhiều năm. (Nếu bạn muốn tìm hiểu sâu hơn về lý do tại sao các luật không phù hợp với vấn đề cụ thể này, hãy đọc bài báo xuất sắc của A. Feder Cooper và James Grimmelmann có tên “Các tệp tin nằm trong máy tính: Bản quyền, Ghi nhớ và AI sinh ra.”)
Dưới đây là danh sách mười ba vụ kiện nổi bật nhất, không phải tất cả đều liên quan đến sách; còn có hình ảnh và âm nhạc. Và đây là một danh sách khác cập nhật tình trạng của tất cả các vụ kiện.
Bản quyền và AI đối với các tác giả
Các tác giả đối mặt với các vấn đề bổ sung liên quan đến khả năng bản quyền của nội dung do AI tạo ra. |
Quan điểm của Văn phòng Bản quyền Hoa Kỳ về khả năng bản quyền của nội dung do AI tạo ra tuyên bố rằng AI không thể tự mình giữ bản quyền vì nó thiếu tình trạng pháp lý của một tác giả. Điều đó có lý. Nhưng điều này giả định 100% công việc được tạo ra bởi AI. Như đã thảo luận ở nơi khác, ít có tác giả nào sẽ để AI tạo ra toàn bộ cuốn sách. Có nhiều khả năng nó sẽ là 5%, hoặc 10% hoặc… Và đây là nơi Văn phòng Bản quyền gặp khó khăn (như tôi cũng vậy).
Trong một phán quyết gần đây, Văn phòng kết luận rằng một tiểu thuyết đồ họa gồm văn bản do con người viết kết hợp với hình ảnh do dịch vụ AI Midjourney tạo ra là một tác phẩm có thể bảo vệ bản quyền, nhưng các hình ảnh riêng lẻ không thể được bảo vệ bởi bản quyền. Thật khó chịu!
Đủ để nói rằng các tác giả và nhà xuất bản cần phải cảnh giác với các vấn đề bản quyền đang phát triển, trên nhiều mặt trận. |
Những tác động lâu dài là gì?
Một số so sánh vụ kiện hiện tại với vụ kiện sách Google, mất 10 năm để giải quyết về mặt pháp lý. Ai biết được quá trình kháng cáo sẽ kéo dài bao lâu cho những vụ kiện này. Trong khi đó, các nhà xuất bản có lý do để hành động như thể các công ty AI sẽ thua, điều này, ít nhất về mặt lý thuyết, sẽ khiến bất kỳ ai cấp phép hoặc thậm chí sử dụng AI Chat đều có thể phải chịu một số trách nhiệm liên đới.
Nhưng đó không phải là vấn đề nghiêm trọng nhất của nhà xuất bản. Đó là nhận thức. Đối với nhiều tác giả, một số nổi tiếng, một số ít được biết đến, nguồn cảm hứng đã bị nhiễm độc. AI là một chủ đề gây tranh cãi trong cộng đồng viết và xuất bản. Bất cứ điều gì thậm chí liên quan đến AI đều bị chỉ trích gay gắt.
Có rất nhiều ví dụ. Trong một sự cố gần đây, Angry Robot, một nhà xuất bản ở Vương quốc Anh “cống hiến cho những điều tốt nhất trong khoa học viễn tưởng hiện đại dành cho người lớn, kỳ ảo và WTF,” đã thông báo rằng họ sẽ sử dụng phần mềm AI, gọi là Storywise, để sàng lọc một loạt các bản thảo dự kiến sẽ được gửi đến. Chỉ mất năm giờ để công ty hủy bỏ kế hoạch và quay trở lại hộp thư cũ.
Sự tiến thoái lưỡng nan không thể chịu đựng được của các nhà xuất bản thương mại khi sử dụng các công cụ AI nội bộ: nếu các tác giả của bạn phát hiện ra, bạn sẽ gặp khó khăn trong việc đối phó với cơn bão kết quả. Tôi tin rằng các nhà xuất bản không còn lựa chọn nào khác ngoài việc can đảm, áp dụng (ít nhất là một số) công cụ, giải thích rõ ràng cách những công cụ đó được huấn luyện và cách chúng được sử dụng, và tiếp tục tiến lên.
Tại Vương quốc Anh, Hiệp hội Tác giả có cách tiếp cận cứng rắn: “Hãy yêu cầu nhà xuất bản của bạn xác nhận rằng họ sẽ không sử dụng AI một cách đáng kể cho bất kỳ mục đích nào liên quan đến tác phẩm của bạn - chẳng hạn như hiệu đính, chỉnh sửa (bao gồm đọc tính xác thực và kiểm tra sự thật), lập chỉ mục, kiểm tra pháp lý, thiết kế và bố cục, hoặc bất cứ điều gì khác mà không có sự đồng ý của bạn. Bạn có thể muốn cấm việc đọc sách nói, dịch thuật và thiết kế bìa do AI thực hiện.”
Hội Tác giả dường như chấp nhận rằng “các nhà xuất bản đang bắt đầu khám phá việc sử dụng AI như một công cụ trong quá trình hoạt động thông thường của họ, bao gồm cả việc biên tập và tiếp thị.” Tôi không nghĩ rằng nhiều thành viên của Hội lại hiểu được như vậy.
Cấp phép nội dung cho các công ty AI
Hầu hết các nhà xuất bản và nhiều tác giả đang tìm kiếm cách cấp phép nội dung cho các công ty AI. Mọi người đều có ý tưởng khác nhau về điều kiện cấp phép nên như thế nào và nội dung của họ có giá trị bao nhiêu, nhưng ít nhất thì cuộc thảo luận đang diễn ra.
Có một số công ty khởi nghiệp muốn hợp tác với các nhà xuất bản (và, trong một số trường hợp, các tác giả cá nhân). Calliope Networks và Created by Humans đều thú vị trong lĩnh vực này.
Vào giữa tháng 7, Trung tâm Cấp phép Bản quyền, từ lâu là người chơi chính trong ngành về cấp phép bản quyền tập thể, đã thông báo về việc cung cấp “quyền tái sử dụng trí tuệ nhân tạo (AI) trong Giấy phép Bản quyền Hàng năm (ACL), một giải pháp cấp phép nội dung trên toàn doanh nghiệp cung cấp quyền từ hàng triệu tác phẩm cho các doanh nghiệp đăng ký.”
Publishers Weekly đã đưa tin về thông báo này, trích lời Tracey Armstrong, chủ tịch và CEO của CCC, nói rằng “Có thể vừa ủng hộ AI vừa ủng hộ bản quyền, và kết hợp AI với sự tôn trọng đối với người sáng tạo.”
Mặc dù không toàn diện, điều này có thể là một bước đột phá trong việc đưa ngành xuất bản tiến gần hơn đến sự hợp tác với các nhà phát triển mô hình ngôn ngữ lớn.
Đã quá muộn để tránh AI
Đối với các tác giả và nhà xuất bản thích không bị bẩn với AI, tin tức là xấu: bạn đang sử dụng AI hôm nay và đã sử dụng nó trong nhiều năm. |
Trí tuệ nhân tạo, dưới nhiều hình thức khác nhau, đã được tích hợp vào hầu hết các công cụ và dịch vụ phần mềm mà chúng ta sử dụng hàng ngày. Mọi người dựa vào kiểm tra chính tả và ngữ pháp do AI cung cấp trong các chương trình như Microsoft Word hoặc Gmail. Microsoft Word và PowerPoint áp dụng AI để cung cấp đề xuất viết, đề xuất thiết kế và bố cục, và nhiều hơn nữa. Trợ lý ảo như Siri và Alexa sử dụng xử lý ngôn ngữ tự nhiên để hiểu các lệnh bằng giọng nói và trả lời các câu hỏi. Các dịch vụ email sử dụng AI để lọc tin nhắn, phát hiện thư rác và gửi cảnh báo. AI cung cấp năng lượng cho chatbot dịch vụ khách hàng và tạo ra các đề xuất sản phẩm dựa trên lịch sử mua hàng của bạn.
Và nhiều thứ này dựa trên Mô hình Ngôn ngữ Lớn, như với ChatGPT.
Đối với một tác giả hoặc biên tập viên nói rằng, “Tôi không muốn AI được sử dụng trên bản thảo của mình,” thì nói chung là gần như không thể, trừ khi cả họ và biên tập viên của họ làm việc với máy đánh chữ và bút chì.
Họ có thể thử nói, “Tôi không muốn AI tạo sinh” được sử dụng trên cuốn sách của họ. Nhưng đó là một vấn đề khó để phân chia. Phần mềm kiểm tra ngữ pháp ban đầu không được xây dựng trên AI tạo sinh. Grammarly đã thêm nó như một thành phần vào sản phẩm của họ, và tất cả các trình kiểm tra chính tả và ngữ pháp khác cũng sẽ như vậy. AI tạo sinh cũng là cốt lõi của phần mềm tiếp thị được cung cấp.
Khi các tác giả sử dụng AI
Một khía cạnh khác của các tác giả và việc sử dụng AI có những điểm tương đồng với vấn đề bản quyền được thảo luận ở trên. Trong trường hợp cực đoan, chúng ta đang thấy nội dung do AI tạo ra 100% được xuất bản trên Amazon. Hầu hết (tất cả?) đều có chất lượng tồi tệ, nhưng điều đó không ngăn cản nó được xuất bản. (Xem phần về Amazon.) Điều đáng lo ngại hơn đối với các nhà xuất bản là các bản thảo do AI tạo ra. Đúng, AI tăng số lượng, nhưng các nhà xuất bản lớn đã có bộ lọc cho số lượng. Các bộ lọc đó được gọi là đại lý. Họ là những người sẽ phải tìm cách xử lý vấn đề số lượng, và rõ ràng là họ sẽ phải tìm ra giải pháp mà không sử dụng AI.
Đây là một vấn đề hiện sinh - tôi có muốn xuất bản một cuốn sách được viết bởi ‘một cái máy’ không? Đối với hầu hết các nhà xuất bản, đó là một ‘không’ rõ ràng. Dễ dàng quá. Vậy còn một cuốn sách mà 50% nội dung được tạo ra bởi một LLM, dưới sự giám sát của một tác giả có năng lực thì sao? Hmm, hãy thử một ‘không’ với điều đó nữa. OK: vậy còn 25%, hoặc 10%, hoặc 5% thì sao? Bạn vạch ra giới hạn ở đâu?
Và, bây giờ bạn đã bước vào lĩnh vực vạch ra giới hạn, làm thế nào để bạn giải quyết được tình thế tiến thoái lưỡng nan rằng các công cụ kiểm tra chính tả và ngữ pháp hiện nay dựa, ít nhất là một phần, vào AI sinh tạo? Còn các công cụ chuyển giọng nói thành văn bản do AI điều khiển, như Otter.ai hoặc tính năng chuyển giọng nói thành văn bản tích hợp trong Microsoft Word thì sao?
Tôi không thể tìm thấy bất kỳ nhà xuất bản thương mại nào đã tuyên bố họ sẽ không xuất bản một tác phẩm với số lượng văn bản được tạo ra bởi AI được xác định trước. Đây là quan điểm của Hội Nhà Văn về vấn đề này:
“Nếu một lượng đáng kể văn bản, nhân vật hoặc cốt truyện được tạo ra bởi AI được tích hợp vào bản thảo của bạn, bạn phải tiết lộ điều đó cho nhà xuất bản của mình và cũng nên tiết lộ cho độc giả. Chúng tôi không nghĩ rằng cần thiết cho các tác giả phải tiết lộ việc sử dụng AI sinh tạo khi nó chỉ được sử dụng như một công cụ để động não, tạo ý tưởng hoặc chỉnh sửa bản thảo.”
Không cần phải nói, ‘đáng kể’ không được định nghĩa rõ ràng (Oxford định nghĩa nó là “đủ lớn để được chú ý hoặc được cho là quan trọng”), nhưng bài đăng tiếp tục giải thích rằng việc bao gồm hơn “de minimis văn bản được tạo ra bởi AI” sẽ vi phạm hầu hết các hợp đồng xuất bản. De minimis, trong thuật ngữ pháp lý, không được xác định chính xác, nhưng, nói chung, có nghĩa là không đáng kể.
AI có thể được phát hiện trong văn bản không?
Tôi đã tổ chức một hội thảo trên web về phát hiện AI, được tài trợ bởi BISG, vào tháng 5 năm 2024. Bản phát lại có sẵn trực tuyến trên YouTube. Jane Friedman đã cung cấp một bài viết tổng quan toàn diện về hội thảo trong bản tin Hot Sheet của cô ấy.
Đối với nhiều tác giả, sự độc hại của AI có nghĩa là giữ nó xa khỏi lời văn của họ. Các nhà xuất bản phải gánh một trách nhiệm đặc biệt - họ không tạo ra văn bản, nhưng, một khi đã xuất bản, họ phải chịu một trách nhiệm đáng kể đối với văn bản đó. Chúng ta đã thấy nhiều vụ nổ lớn gần những cuốn sách gây tranh cãi, dù là về những tác động xã hội của nội dung, hay việc ăn cắp ý tưởng và lời văn của các nhà văn khác. Bây giờ với AI, chúng ta đối mặt với một loạt các vấn đề đạo đức và pháp lý hoàn toàn mới, không có gì trong số đó được đề cập trong trường xuất bản.
Một phần của nó dường như tương tự như những gì mọi người lo lắng về học sinh, rằng việc sử dụng AI bằng cách nào đó là gian lận, tương tự như việc sao chép từ một bài viết trên Wikipedia, hoặc có thể chỉ là nhờ một người bạn viết bài luận của bạn.
Một trong những diễn giả của chúng tôi trong hội thảo trên web, một nhà giáo dục, José Bowen, đã chia sẻ bản tiết lộ của ông cho học sinh. Nó không hoàn toàn là những gì bạn sử dụng cho một tác giả, nhưng nó cho thấy một số mức độ “rủi ro” của việc sử dụng AI.
Mẫu Thỏa Thuận Tiết Lộ cho Học Sinh
Tôi đã tự mình hoàn thành tất cả công việc này mà không có sự trợ giúp từ bạn bè, công cụ, công nghệ hoặc AI.
-
Tôi đã hoàn thành bản thảo đầu tiên, nhưng sau đó nhờ bạn bè/gia đình, phần mềm paraphrase/kiểm tra ngữ pháp/kiểm tra đạo văn AI đọc và đưa ra đề xuất. Tôi đã thực hiện các thay đổi sau đây sau sự giúp đỡ này:
Sửa lỗi chính tả và ngữ pháp
Thay đổi cấu trúc hoặc thứ tự
Viết lại toàn bộ câu/đoạn văn
Tôi gặp khó khăn với các vấn đề và sử dụng từ điển, gọi bạn bè, đến trung tâm trợ giúp, sử dụng Chegg hoặc nhà cung cấp giải pháp khác.
Tôi đã sử dụng AI/bạn bè/gia sư để giúp tôi tạo ra ý tưởng.
Tôi đã sử dụng sự trợ giúp/công cụ/AI để làm dàn ý/bản thảo đầu tiên, sau đó tôi đã chỉnh sửa. (Mô tả bản chất của sự đóng góp của bạn.)
Và vì vậy một nhà xuất bản có thể soạn thảo một cái gì đó như thế này cho các tác giả của họ. Giả sử tác giả tiết lộ mức độ cao nhất: Tôi đã sử dụng AI một cách rộng rãi, sau đó chỉnh sửa kết quả. Vậy thì sao? Bạn có tự động từ chối bản thảo không? Nếu có, tại sao?
Và, trong khi đó, nếu bạn chú ý, bạn sẽ biết rằng bản thảo bạn vừa đọc và yêu thích, mà tác giả thề rằng thậm chí không được kiểm tra chính tả bởi Grammarly, thực tế có thể đã được tạo ra 90% bởi AI, bởi một tác giả chuyên ẩn giấu việc sử dụng AI của mình.
Sau đó, bạn bị buộc phải suy nghĩ lại câu hỏi. Nó trở thành, “Tại sao tôi lại quyết tâm đến thế để phát hiện ra thứ này mà không thể phát hiện được?”
Một phần là do lo ngại quá mức về khả năng bản quyền của văn bản do AI tạo ra. Văn phòng bản quyền sẽ không cung cấp bảo vệ bản quyền cho văn bản 100% do AI tạo ra (hoặc âm nhạc, hình ảnh, v.v.). Nhưng còn văn bản 50% do AI tạo ra thì sao? Chúng tôi chỉ bảo vệ 50% do tác giả tạo ra. Và làm sao bạn biết được phần nào? Chúng tôi sẽ quay lại với bạn về vấn đề này.
Sẽ thật tuyệt vời nếu bạn có thể chỉ cần đưa mỗi bản thảo vào một phần mềm nào đó mà sẽ cho bạn biết liệu AI có được sử dụng trong việc tạo ra văn bản hay không?
Bỏ qua vấn đề rằng cách duy nhất để làm điều này là sử dụng các công cụ AI, câu hỏi quan trọng hơn là, phần mềm đó có (đủ) chính xác không? Tôi có thể tin tưởng vào nó để cho tôi biết liệu AI có được sử dụng trong việc tạo ra một bản thảo hay không? Và tôi có thể dựa vào nó để không tạo ra “kết quả dương tính giả” - chỉ ra rằng AI đã được sử dụng, trong khi thực tế không phải vậy?
Hiện nay có rất nhiều phần mềm trên thị trường nhằm giải quyết những thách thức này. Nhiều nghiên cứu học thuật đánh giá phần mềm này chỉ ra sự không đáng tin cậy của nó. Văn bản do AI tạo ra vẫn lọt qua. Tệ hơn, văn bản không phải do AI tạo ra bị gán nhãn sai là đã bị nhiễm.
Nhưng các nhà xuất bản sách sẽ muốn có một số biện pháp bảo vệ. Có vẻ như, tốt nhất là những công cụ này có thể cảnh báo bạn về những mối quan ngại tiềm ẩn, nhưng bạn luôn cần phải kiểm tra lại. Vậy có lẽ nó có thể cảnh báo bạn về những văn bản cần được kiểm tra kỹ lưỡng hơn những văn bản khác? Đây có phải là một sự hiệu quả?
Sự hiệu quả thực sự sẽ được tìm thấy khi vượt qua những lo ngại về nguồn gốc của văn bản, thay vào đó duy trì các tiêu chí hiện có về chất lượng của nó.
Mất việc làm
“Bạn sẽ không bị thay thế bởi AI. Bạn sẽ bị thay thế bởi người biết cách sử dụng AI.” —Vô danh
Mất việc làm do việc áp dụng AI có thể rất nghiêm trọng. Ước tính khác nhau, nhưng con số rất đáng sợ. Có những ví dụ rõ ràng: taxi không người lái ở San Francisco loại bỏ… tài xế taxi và lái xe chia sẻ. Chẩn đoán hỗ trợ AI có thể giảm nhu cầu về kỹ thuật viên y tế.
Người lạc quan trong tôi chỉ ra, như một ví dụ, việc giới thiệu bảng tính và tác động của nó đến việc làm. Như bạn thấy trong biểu đồ dưới đây, việc làm trong lĩnh vực “Kế toán, Chuẩn bị Thuế, Ghi sổ Kế toán, và Dịch vụ Lương” đã gần như tăng gấp đôi kể từ năm 1990 - khó mà buộc tội bảng tính và các công nghệ khác đã tự động hóa phần lớn các công việc này.
Nghiên cứu của Ethan Mollick với Boston Consulting Group (BCG) là một thí nghiệm nhằm hiểu rõ hơn tác động của AI lên công việc, đặc biệt là các nhiệm vụ phức tạp và yêu cầu tri thức cao. Nghiên cứu liên quan đến 758 nhà tư vấn BCG, được phân ngẫu nhiên để sử dụng hoặc không sử dụng GPT-4 của OpenAI cho hai nhiệm vụ: đổi mới sản phẩm sáng tạo và giải quyết vấn đề kinh doanh. Nghiên cứu đo lường hiệu suất, hành vi và thái độ của những người tham gia, cũng như chất lượng và đặc điểm của đầu ra AI.
Một trong những phát hiện là “AI hoạt động như một công cụ nâng cao kỹ năng. Những nhà tư vấn có điểm số thấp nhất khi chúng tôi đánh giá họ vào đầu thí nghiệm có sự cải thiện lớn nhất trong hiệu suất, 43%, khi họ được sử dụng AI. Những nhà tư vấn hàng đầu vẫn có sự cải thiện, nhưng ít hơn.” Bài viết đầy đủ rất đáng đọc, và như tất cả các công trình của Mollick, vừa kích thích suy nghĩ vừa dễ tiếp cận.
Giáo dục
Giáo dục đã là trung tâm trong các cuộc tranh luận về ưu và nhược của AI. Việc đưa AI vào các lớp học phần lớn được coi là một lời nguyền, hoặc ít nhất là một thách thức. Những nhà giáo dục khác, như diễn giả chính của PW là Ethan Mollick, đón nhận AI như một công cụ mới tuyệt vời cho giáo viên; Mollick khẳng định rằng học sinh của ông phải làm việc với ChatGPT.
Cuốn sách hay nhất về chủ đề này là Teaching with AI: Hướng dẫn thực tế cho kỷ nguyên mới của học tập con người của José Antonio Bowen và C. Edward Watson.
Tôi sẽ không đi sâu vào xuất bản giáo dục trong cuốn sách này - đó là một chủ đề rộng lớn, đòi hỏi một báo cáo riêng biệt. Có thể nói xuất bản đang trở thành mối quan tâm thứ hai trong giáo dục: các công cụ AI là phần mềm, không phải nội dung, tự bản thân chúng.
Tương lai của tìm kiếm
Tìm kiếm là một chủ đề đầy thách thức trong AI. Tôi khuyến khích bạn truy cập perplexity.ai và You.com để có cái nhìn thoáng qua về hướng đi của mọi thứ. Lần tới khi bạn nghĩ đến việc bắt đầu một tìm kiếm trên Google, hãy truy cập Perplexity thay vì. Nó sẽ không có vẻ khác biệt nhiều - nó giống như các đồ thị kiến thức mà Google thường xuất hiện ở phía bên phải của màn hình tìm kiếm, hoặc đôi khi ở đầu danh sách kết quả tìm kiếm. Thay vì phải nhấp vào một liên kết, thông tin sẽ ở ngay đó cho bạn. |
Sự phức tạp đi xa hơn một bước nữa, diễn giải lại thông tin mà nó thu thập từ nhiều nguồn để bạn thực sự không cần phải nhấp vào liên kết. Nó cung cấp các liên kết đến các nguồn của nó, nhưng việc nhấp vào chúng thường là không cần thiết—bạn đã có câu trả lời cho câu hỏi của mình.
Sự thay đổi có vẻ khiêm tốn này có ý nghĩa to lớn đối với mọi công ty và mọi sản phẩm dựa vào việc được khám phá qua các công cụ tìm kiếm. Nếu người tìm kiếm không còn được gửi đến trang web của bạn, làm thế nào bạn có thể thu hút họ và chuyển đổi họ thành khách hàng? Câu trả lời đơn giản, bạn không thể.
Joanna Penn đang ở vị trí tiên phong trong việc suy nghĩ về tác động của các công nghệ mới đối với viết và xuất bản. Cô đã giải quyết chủ đề phức tạp này trên podcast và blog của cô vào tháng 12 năm ngoái.
Vẫn còn sớm đối với AI và sự biến đổi của tìm kiếm.
Sách rác trên Amazon
Sách rác do AI tạo ra trên Amazon là một vấn đề, mặc dù mức độ nghiêm trọng của chúng có thể cảm thấy hơn là thực sự. Một mặt, những cuốn sách này đang làm loạn cửa hàng sách trực tuyến với nội dung chất lượng thấp và sao chép, đôi khi sử dụng tên của các tác giả thực để lừa dối khách hàng và lợi dụng danh tiếng của họ. Những cuốn sách này không chỉ là phiền toái đối với người đọc mà còn là mối đe dọa đối với các tác giả, có thể làm mất đi tiền bản quyền mà họ đã khó khăn kiếm được. Sách do AI tạo ra cũng ảnh hưởng đến xếp hạng và khả năng hiển thị của sách và tác giả thật trên trang Amazon, khi chúng cạnh tranh cùng từ khóa, danh mục và đánh giá. |
Amazon hiện yêu cầu các tác giả phải tiết lộ chi tiết việc sử dụng AI trong việc tạo ra sách của họ. Không nghi ngờ gì điều này có thể bị lạm dụng.
Hãy thử tìm kiếm trên Amazon bằng từ khóa “sách do AI tạo ra.” Có rất nhiều. Một số kết quả là sách hướng dẫn về việc sử dụng AI để tạo sách. Nhưng những kết quả khác thì rõ ràng là do AI tạo ra. “Ảnh hài hước và dễ thương của mèo-Bạn không thể thấy loại ảnh này trên thế giới-PART-1” (stet) được ghi nhận cho Rajasekar Kasi. Không có chi tiết về tiểu sử của anh ta (?) trên trang tác giả, nhưng sáu tựa sách khác được ghi nhận dưới tên này. Cuốn sách, được xuất bản ngày 26 tháng 8 năm 2023, không có đánh giá và không có xếp hạng bán hàng. Tiêu đề không đúng ngữ pháp của ebook không khớp với tiêu đề không đúng ngữ pháp trên bìa của sách in.
Nhưng các tác giả khác rõ ràng đang sử dụng AI rộng rãi trong việc tạo ra sách của họ, và không tiết lộ. Như tôi đã thảo luận ở trên, việc phát hiện sử dụng AI là gần như không thể với những ‘kẻ giả mạo’ có kỹ năng. Sách tô màu, nhật ký, sách du lịch và sách nấu ăn đang được tạo ra với công cụ AI trong một khoảng thời gian và công sức ngắn hơn rất nhiều so với xuất bản truyền thống.
Tìm kiếm “sách nấu ăn chay Hàn Quốc” và bạn sẽ thấy tựa sách số một, của Joanne Lee Molinaro, đứng ở vị trí đầu tiên. Nhưng ngay phía sau nó là các tựa sách khác rõ ràng là sao chép. “Sách Nấu Ăn Chay Hàn Quốc: Các Công Thức Truyền Thống và Hiện Đại Đơn Giản và Ngon Cho Người Yêu Ẩm Thực Hàn Quốc” có hai đánh giá, bao gồm một đánh giá lưu ý rằng “Đây không phải là sách nấu ăn chay. Tất cả các công thức đều có nguyên liệu thịt và trứng.” Nhưng cuốn sách này xếp hạng #5,869,771 trong xếp hạng bán hàng, so với cuốn gốc đứng ở vị trí #2,852 trong danh sách.
Khó mà xác định mức độ thiệt hại gây ra. Không có gì tốt có thể đến từ việc này, nhưng nó tồi tệ đến mức nào?
Amazon có chính sách cho phép nó loại bỏ bất kỳ cuốn sách nào không “cung cấp trải nghiệm khách hàng tích cực.” Hướng dẫn nội dung Kindle cấm “nội dung mô tả nhằm lừa dối khách hàng hoặc không đại diện chính xác nội dung của cuốn sách.” Họ cũng có thể chặn “nội dung thường khiến khách hàng thất vọng.” Liệu có phải khối lượng lớn đánh bại người kiểm soát của Amazon? Hay còn lý do nào khác?
Thành kiến
LLMs được đào tạo trên những gì đã được xuất bản trực tuyến. Những gì đã được xuất bản trực tuyến đầy rẫy sự thiên vị và do đó LLMs phản ánh sự thiên vị đó. Và tất nhiên không chỉ là thiên vị, mà còn là sự thù hận, phản ánh trong việc học của chúng, và bây giờ là một sản phẩm tiềm năng trong các từ và hình ảnh do AI tạo ra. Porn là một lợi ích tự nhiên khác của khả năng phi thường của AI với hình ảnh, và có những câu chuyện gần đây đáng lo ngại về những hình ảnh khỏa thân bịa đặt của phụ nữ trẻ, với những người bạn cùng lớp nam là những nghi phạm khả dĩ. The New York Times đã báo cáo riêng về sự gia tăng các hình ảnh lạm dụng tình dục trẻ em trực tuyến.
Các tác giả và nhà xuất bản cần nhận thức về những hạn chế cài sẵn này khi sử dụng công cụ AI.
Sáng Tạo Có Thể Là Một Sáo Rỗng
Câu hỏi liệu máy móc có thể thực sự sáng tạo hay không vẫn là một chủ đề tranh luận sôi nổi. Nó phụ thuộc một phần vào cách chúng ta định nghĩa sáng tạo. |
“AI sẽ không bao giờ sáng tạo.” Đó là một câu thần chú quen thuộc.
Chúng ta đều biết sáng tạo là gì, phải không?
Cambridge: “khả năng tạo ra hoặc sử dụng những ý tưởng độc đáo và bất thường.”
Britannica: “khả năng tạo ra hoặc mang vào tồn tại một cái gì đó mới, cho dù là một giải pháp mới cho một vấn đề, một phương pháp hoặc thiết bị mới, hoặc một đối tượng hoặc hình thức nghệ thuật mới.”
Tôi không tranh cãi rằng sáng tạo, theo nghĩa này, là vượt xa tầm với của các LLMs.
Lập luận của tôi là hầu hết những gì được cho là sáng tạo - và thường xuất hiện khá sáng tạo —- thực tế là lặp lại. Điều này hoạt động rất tốt cho nhiều thứ, bao gồm hầu hết các quảng cáo.
Nhưng để nâng cao cột mốc ‘sáng tạo’ và sau đó hạ thấp LLMs, là đặt ra một rào cản quá cao mà AI không thể vượt qua. Sau đó, mọi người bác bỏ nó là “tôi đã nói nó không sáng tạo mà.”
Và do đó bỏ lỡ những thứ lặp lại mà nó rất giỏi.
Tôi sẽ đăng một bài tiểu luận dài về chủ đề này trong tương lai không xa, sau khi tôi hoàn thành đọc:
The Creativity Code, của Marcus du Sautoy, và
The Artist in the Machine, của Athur I. Miller
Literary Theory for Robots, của Dennis Yi Tenen
Một Suy Nghĩ Khác
Jeremiah Owyang là một nhà phân tích công nghiệp tại Silicon Valley. Anh ấy là một người ủng hộ AI, nhưng anh ấy đã từng trải qua sự cường điệu trước đó. Anh ấy nhận thấy rằng anh ấy “chưa bao giờ thấy sự tiến hóa nhanh chóng như vậy trong một thời gian ngắn.”
Như Owyang nói, các đội ngũ lập trình nhỏ bây giờ có thể sử dụng LLMs để lắp ráp “sinh vật có tri giác” - như một đứa trẻ 4 tuổi - trong hai ngày. Chúng có khả năng:
‘Nhìn’ với thị giác máy tính, những gì đang xảy ra trong thế giới thực,
‘Nghe’ qua lệnh thoại và âm thanh xung quanh trong thế giới thực,
‘Suy nghĩ’ thông qua việc xử lý đầu vào từ thế giới thực trên,
‘Học’ bằng cách truy cập dữ liệu đã được huấn luyện trước,
‘Tham khảo’ các tập dữ liệu độc quyền,
‘Nói’ với giọng nói sống động, có ngữ điệu và giọng điệu trong bất kỳ ngôn ngữ nào,
‘Viết’ thông qua giao tiếp văn bản, theo bất kỳ định dạng hoặc phong cách nào yêu cầu,
‘Vẽ’ bằng cách tạo ra hình ảnh ngay lập tức, và
‘Tương tác’: nó có thể chủ động tham gia vào đối thoại, đặt câu hỏi, hoặc chỉ định các tác nhân AI để hoàn thành các nhiệm vụ riêng.
Điều này thật phi thường và chưa từng có. Nó có quan trọng đối với ngành xuất bản không? Bạn quyết định.
Những Điều Tốt Đẹp Ngoài Ngành Xuất Bản
AI đứng sau một số thành tựu đột phá ngoài ngành xuất bản. Y học là biểu tượng của AI, nhưng cũng có những câu chuyện mạnh mẽ từ các ngành công nghiệp khác. Sự liên quan đến ngành xuất bản xuất phát từ một câu hỏi tu từ: AI có thể cứu sống. Nhưng bạn không nghĩ rằng nó có thể giúp các nhà xuất bản sao?
Mục tiêu của phần ngắn này chỉ đơn thuần là để phản bác lập luận rằng, không tin rằng AI sẽ giúp ngành xuất bản, liệu AI có thể giúp bất kỳ ai khác không?
AI và y học
Đọc một số tháng Ba 2024 của The Economist, tôi đã đào sâu vào phụ lục công nghệ về y tế và AI. Trong vài năm qua, y học liên tục xuất hiện như điểm sáng của trí tuệ nhân tạo. Hầu hết các báo cáo đều tích cực. Nhưng vẫn The Economist sẽ làm bạn ngạc nhiên. Họ đã thể hiện nhiều sự e ngại được diễn đạt rõ ràng. Nhưng bạn cũng sẽ đọc rằng AI trong y học “đại diện cho một cơ hội để cải thiện cuộc sống của hàng trăm triệu, thậm chí hàng tỷ người.”
Một câu hỏi tu từ khác cho những người muốn cấm công nghệ AI, hoặc ít nhất là đặt một lệnh cấm tạm thời về sự phát triển của nó: bạn có hy sinh giá trị tiềm năng của nó đối với sức khỏe của hàng triệu người để thỏa mãn sự lo lắng của bạn về một tương lai không chắc chắn?
AI và TSA tại các sân bay
Chúng ta đã từng ở đó: những hàng dài bất tận, sự di chuyển chậm chạp của hành lý xách tay qua máy quét X-ray.
Những thất bại trong việc phát hiện của TSA được ghi lại rõ ràng, nhưng không được thảo luận nhiều.
Điều làm tôi lo lắng nhất là những công nhân buồn bã, nhìn chằm chằm vào màn hình của họ, hàng giờ liền. Vì cái gì? Không chỉ là một công việc khổ sở, mà với tư cách là những con người bình thường, họ không giỏi việc này lắm.
Nhập AI vào. Nếu nó có thể phát hiện các khối u khó thấy trong phổi, tôi tin rằng nó có thể phát hiện hàng cấm trong hành lý xách tay. Và giảm bớt công việc vô ơn mà con người không phù hợp để xử lý.
Theo tài khoản này, chương trình sàng lọc bằng AI của TSA mới đang được triển khai.
Bài tiểu luận: Tác động của AI đối với ngành xuất bản sách
Gần đây tôi đã nói chuyện với Peter Brantley, đối tác của tôi trong các buổi hội thảo AI, về cách chúng tôi có thể định hình các chương trình AI sắp tới. Peter làm việc nhiều trong cộng đồng thư viện và vừa trở về từ một sự kiện kéo dài cả ngày ở Los Angeles với khoảng 150 đồng nghiệp thư viện của anh ấy, nơi họ khám phá tiềm năng tác động của AI đến lĩnh vực của họ. Cuộc trò chuyện rất sôi nổi và sâu sắc. Tại sao, anh ấy tự hỏi, các nhà xuất bản sách thương mại không có những buổi họp mặt như thế này? AI là một chủ đề tại mọi sự kiện xuất bản: tại sao nó không phải là chủ đề?
Hậu quả thực tế của AI
Câu trả lời mà anh ấy đưa ra là các nhà xuất bản sách thương mại chưa kết luận rằng AI sẽ có bất kỳ hậu quả thực tế nào đối với công việc kinh doanh của họ. Đối với cốt lõi của công việc kinh doanh của họ. Đối với khả năng tiến hành kinh doanh của họ. Chắc chắn, nó có thể giúp viết một thông cáo báo chí hoặc viết thư từ chối bản thảo, nhưng họ cho rằng việc xuất bản sẽ vẫn tiếp tục như đã làm trong nhiều thập kỷ, với thời gian trung bình từ hợp đồng đến sách in kéo dài đến hai năm.
Đồng thời, các nhà xuất bản tất nhiên phải đối mặt với những thách thức ngắn hạn cấp bách hơn AI. Giá giấy. Chi phí vận chuyển. Biên lợi nhuận thu hẹp. Doanh số chủ yếu là ổn định tổng thể. Với tất cả những áp lực đó, ai có thời gian hoặc năng lực để quan tâm đến AI?
Nhưng các ngành công nghiệp sáng tạo khác hiểu điều đó. Nghệ thuật và thiết kế hiểu điều đó. Quảng cáo hiểu điều đó. Hollywood thấy điều gì đang đến, cũng như ngành công nghiệp âm nhạc. Các nhà báo đang dõi theo với sự khiếp sợ.
Các lĩnh vực xuất bản sách khác đang bắt đầu nắm bắt tác động của AI. Xuất bản học thuật đang sâu vào công nghệ này. Nhưng các nhà xuất bản sách thương mại đang hành động như thể sẽ có ít hậu quả thực tế từ AI.
Hậu quả thực tế có thể là gì? Nó sẽ ảnh hưởng đến nguồn cung sách? Hay nhu cầu về sách?
Nguồn cung: Có, AI là thủ phạm đứng sau một loạt các cuốn sách rác mới trên Amazon. Hàng trăm? Chắc chắn. Hàng nghìn? Có thể. Hàng triệu? Không. Có bao nhiêu cuốn sách trên Amazon? Hơn 50 triệu. Nó đã rất đông đúc rồi.
Điều đó ngoài ra, rõ ràng là trong thời gian ngắn hạn, AI sẽ không viết toàn bộ sách mà mọi người thực sự muốn đọc. Giá trị của nó cho đến nay là như một người bạn viết—phê bình, gợi ý, thỉnh thoảng tạo ra một vài đoạn văn bản có thể sử dụng được. Không, trong thời gian ngắn hạn, AI sẽ không thay đổi căn bản sản lượng của việc xuất bản sách, nguồn cung sách mới.
Nhu cầu: Không, không ai yêu cầu sách do AI tạo ra. Đó không phải là yếu tố. Và tôi không thể dự đoán bất kỳ kịch bản nào mà AI sẽ ảnh hưởng đến nhu cầu về sách rộng rãi hơn.
Còn quá trình xuất bản thì sao? Có, điều đó sẽ thay đổi. Ít nhất là một chút. Như chúng tôi đã phát hiện tại sự kiện AI của Publishers Weekly vào mùa thu năm ngoái, các nhà xuất bản đang tìm kiếm sự trợ giúp của AI ở đây và ở đó: tiếp thị, biên tập, một chút cái này và một chút cái kia.
Liệu có thể rằng sẽ có rất ít hậu quả thực tế của AI đối với ngành xuất bản sách thương mại? Có lẽ nó chỉ là một món đồ chơi.
Vậy hãy lùi lại khỏi những chi tiết phức tạp của AI và xem xét lại tình trạng khó khăn của ngành xuất bản sách thương mại, và qua đó, tìm hiểu sâu hơn về nơi AI có khả năng có tác động lớn nhất.
Ngành xuất bản đã suy thoái kinh tế trong nhiều thập kỷ
Theo các ước tính khác nhau, toàn bộ ngành công nghiệp xuất bản sách ở Hoa Kỳ có doanh thu hàng năm dưới 35 tỷ đô la. Ngay cả khi họ đạt 40 tỷ đô la, doanh thu hàng năm của Apple Computer vẫn cao hơn gấp 10 lần. Lợi nhuận gộp của Apple là 44% doanh thu, cùng với lợi nhuận ròng là 25% doanh thu. Ngành xuất bản thậm chí không dám mơ đến các biên lợi nhuận như vậy.
Ngành xuất bản sách thương mại đã suy giảm kinh tế nhẹ nhàng trong nhiều thập kỷ, một số năm tăng vài phần trăm, một số năm giảm. Ở giữa năm 2024, doanh thu có vẻ ổn định so với năm trước, nhưng đó là loại tình yêu mùa hè mà các nhà xuất bản quen thuộc. Chúng tôi thắng một số, thua một số, nhưng nhìn chung, ngành xuất bản sách thương mại không phải là một ngành tăng trưởng.
Năm 2023, theo StatShot của AAP, “doanh thu thương mại giảm 0,3%, đạt 8,9 tỷ đô la trong năm dương lịch.” Theo tôi biết, dữ liệu của AAP không tính đến lạm phát. Với lạm phát 3,4%, sự suy giảm doanh số sẽ là 3,6%, gần với sự suy giảm 2,6% trong doanh số đơn vị được báo cáo bởi Circana.
Nếu không có sự tăng trưởng của các định dạng thay thế, sách điện tử và sách nói, ngành công nghiệp có thể đang ở trong tình trạng rất tồi tệ. Sách điện tử đã là một động cơ tăng trưởng trong nhiều năm. Doanh số sách nói tiếp tục tăng, tăng gần 15% trong năm 2022 và thêm 9% trong năm 2023. Vâng, một phần là doanh số thay thế, nhưng rất nhiều khách hàng của sách điện tử và sách nói là những khách hàng mới, không nhất thiết phải là những người đọc sách thường xuyên. Sách điện tử và sách nói chiếm 21% doanh số thương mại năm ngoái. Liệu tất cả những khách hàng đó có mua sách in nếu chỉ có sách in?
Giá bán lẻ đang trở thành một mối quan tâm ngày càng tăng khi chi phí và chiết khấu bán lẻ và bán buôn bóp biên lợi nhuận của nhà xuất bản. Các nghiên cứu học thuật cho thấy rằng có một mức độ co giãn giá cả cho sách, nhưng chắc chắn chúng ta đang đạt đến điểm kháng cự: những cuốn sách bán chạy bìa cứng đang đối mặt với một mức trần giá có thể là 35 đô la. “Mệt mỏi do đăng ký” đang khiến khách hàng video theo yêu cầu hủy dịch vụ, tập trung vào chi phí ngày càng tăng. Gói Premium của Netflix hiện chạy đến 22,99 đô la/tháng; gói Disney Plus Duo Premium là 19,99 đô la/tháng. Như một đồng nghiệp của tôi gần đây đã nhận xét, có bao nhiêu người đăng ký khó khăn về tài chính sẽ nói, ồ, hãy hủy đăng ký Netflix của chúng ta để tôi có thể mua một cuốn sách vào tháng tới?
Lương ngành xuất bản sách
Tôi sẽ không nói quá về điều này: không chỉ các tác giả phải vật lộn để kiếm sống–nhân viên xuất bản cũng bị trả lương thấp so với các nghề tương đương.
Tôi giữ một danh sách đại diện các tin tuyển dụng gần đây trong ngành xuất bản. Tôi đang xem một tin tuyển dụng, cho vị trí Quản lý Marketing tại một nhà xuất bản thương mại báo cáo doanh thu năm 2023 là hơn 30 triệu đô la. Vị trí này trả từ 60.000 đến 70.000 đô la mỗi năm. Đây là một tin khác, cho vị trí Quản lý Quảng cáo tại một trong những ấn bản của một nhà xuất bản báo cáo doanh thu hàng năm là 750 triệu đô la. “Vai trò này sẽ có mức lương hàng năm từ 74.000 đến 79.000 đô la,” danh sách ghi nhận.
Theo U.S. Bureau of Labor Statistics National Occupational Employment and Wage Estimates, các quản lý tiếp thị có mức lương trung bình là $166,410. Mức lương trung bình của “Quản lý Quan hệ Công chúng” là $159,420.
Ngành xuất bản sách vẫn không sánh được. Đây không phải là tin mới đối với những người làm trong lĩnh vực xuất bản. Nó luôn luôn như vậy. Nhưng liệu ngành xuất bản có thể tự duy trì ở mức lương này không? Không thể cung cấp cho ứng viên thậm chí một nửa tiêu chuẩn lương không phải là dấu hiệu tốt cho một ngành công nghiệp ngày càng trở nên số hóa.
Trong thời đại của TikTok, YouTube, mạng xã hội, SEO, dữ liệu mô tả và nền tảng tác giả, “quản lý quảng bá” thực sự là gì?
Ba (và một nửa) lợi thế còn lại cho các nhà xuất bản sách truyền thống
Ba lợi thế bền vững của các nhà xuất bản sách truyền thống là (i) uy tín, (ii) tiếp cận phương tiện truyền thông lớn, và (iii) tiếp cận phân phối sách. Điều này không áp dụng đồng đều cho tất cả các nhà xuất bản truyền thống - những nhà xuất bản lớn hơn có nhiều hơn: nhiều uy tín hơn, tiếp cận tốt hơn với các phương tiện truyền thông lớn và cơ hội tốt hơn để đưa sách của họ lên bàn trước ở nhiều hiệu sách nhất. Nhưng, xét tổng thể, đây là những ưu thế đặc trưng của ngành xuất bản sách truyền thống.
Một giá trị khác mà các nhà xuất bản có thể cung cấp là danh sách được quản lý kỹ lưỡng các tựa sách bổ sung, nơi mỗi tựa sách đơn lẻ được hưởng lợi từ các sách đồng hành. Hãy nghĩ đến một nhà xuất bản như Fox Chapel, chuyên về sách về thủ công: nếu bạn thích một trong những cuốn sách của họ, có khả năng cao bạn sẽ xem kỹ các cuốn sách (và tạp chí) khác của họ về cùng chủ đề, dù được viết bởi các tác giả khác.
Điều này liên quan đến một điều mà chỉ có một số ít nhà xuất bản đã phát triển được, một thương hiệu có thể tiếp thị. Hãy nghĩ đến các bộ sách như “For Dummies” của Wiley, hay “Very Short Introductions” của Oxford. Thương hiệu truyền tải sự nhất quán về cách tiếp cận biên tập và chất lượng, khuyến khích người đọc mua nhiều tựa sách. Các tác giả tự xuất bản thường khởi chạy bộ sách ngắn của riêng họ, chủ yếu là tiểu thuyết, mặc dù họ không thể có độ bao quát rộng như các danh mục lớn của các nhà xuất bản này.
Tất cả các dịch vụ khác mà các nhà xuất bản truyền thống cung cấp đều có thể mua trên thị trường mở, với chất lượng tương tự, với giá cả phải chăng (ví dụ như biên tập, thiết kế, sản xuất và các chức năng tiếp thị thiết yếu). Và, đối với các tác giả tự xuất bản, thu nhập trên mỗi cuốn sách bán ra cao gấp năm lần hoặc hơn so với lịch trình tiền bản quyền truyền thống.
Tôi sẽ đi sâu hơn về điều này trong một phụ lục ngắn ở cuối cuốn sách này. Nhưng hãy để tôi nhanh chóng làm giảm giá trị của ba lợi thế hàng đầu. Uy tín tốt để khoe khoang, nhưng có giá trị tiền mặt khiêm tốn. Các bài đánh giá sách và các phương tiện truyền thông lớn khác, giờ đây có ảnh hưởng rất nhỏ đến doanh số sách. Và các hiệu sách chiếm khoảng 15% doanh số ngành (và ít hơn nhiều đối với các tác giả tự xuất bản) - chúng không còn là yếu tố cốt lõi cho sự thành công của một cuốn sách.
Mọi thứ đã thay đổi.
Tự xuất bản
Tự xuất bản đã là động lực chính thúc đẩy sự phát triển của xuất bản sách tiêu dùng (thương mại) trong thập kỷ qua và hơn thế nữa. Dữ liệu bán hàng chính xác về tự xuất bản vẫn bị ẩn giấu - dễ dàng bỏ qua tầm quan trọng của nó. Nhưng dữ liệu có sẵn cho thấy rằng tự xuất bản chiếm một phần đáng kể của thị trường xuất bản thương mại.
Như CEO của Kobo, Michael Tamblyn (phần nào) nổi tiếng lưu ý, “Một trong bốn cuốn sách chúng tôi bán bằng tiếng Anh là tựa sách tự xuất bản, điều này có nghĩa là về cơ bản, đối với chúng tôi, tự xuất bản giống như có một Penguin Random House khác đang nằm ngoài thị trường mà không ai thấy. Nó giống như vật chất đen của ngành xuất bản.”
Các xu hướng trong thị trường tự xuất bản có lẽ là những xu hướng quan trọng duy nhất trong xuất bản thương mại. Các tác giả tự xuất bản đang chỉ đường. Họ táo bạo và không bị ràng buộc bởi các quy tắc của ngành truyền thống. Nhiều người trong số họ thông thạo mạng xã hội. Họ gần gũi với độc giả của họ, khách hàng của họ. Nếu bạn muốn học các kỹ thuật tiếp thị mới nhất, hãy theo dõi các diễn đàn, blog và bản tin của các tác giả.
Đi sâu vào số liệu thu nhập của tác giả, kinh tế học của việc viết, sau đó so sánh sự suy giảm thu nhập của các tác giả xuất bản truyền thống với sự gia tăng thu nhập của các tác giả tự xuất bản. Trong một khảo sát và báo cáo quốc tế mà tôi thực hiện cùng với Steve Sieck cho ALLi, vào năm 2023 (pdf), chúng tôi phát hiện rằng “thu nhập trung bình từ việc viết và tự xuất bản liên quan đến tất cả các tác giả tự xuất bản trả lời vào năm 2022 là $12,749, tăng 53% so với năm trước. Thu nhập trung bình (mean) cao hơn nhiều: $82,600 vào năm 2022, tăng 34%.”
Trong một khảo sát riêng, do Peter Hildick-Smith thực hiện cho Authors Guild, “các tác giả tự xuất bản toàn thời gian, những người đã xuất bản từ ít nhất năm 2018, báo cáo thu nhập trung bình là $24,000 so với $13,700 vào năm 2018, tăng 76 phần trăm.”
Nhà xuất bản lai
Để đảm bảo tính toàn diện, tôi cũng muốn đề cập đến nhà xuất bản lai. Tôi ngày càng cảm thấy hứng thú với mô hình lai, và phân khúc xuất bản lai đang ngày càng quan trọng và phát triển. Không ai ước tính riêng biệt doanh số bán hàng của nhà xuất bản lai. Nhưng tác động của họ được thấy rõ nhất trong sự thống trị của họ ở hai danh mục: sách của người nổi tiếng và sách kinh doanh phổ biến. Những danh mục này từ lâu đã là nguồn thu nhập đáng tin cậy cho các nhà xuất bản thương mại, nhưng “dịch vụ tư vấn” của các nhà xuất bản lai, và chia sẻ thu nhập thuận lợi hơn nhiều, là không thể cưỡng lại đối với nhiều tác giả danh tiếng.
Các trường hợp gần đây, như mối quan hệ chia sẻ lợi nhuận của Authors Equity với các tác giả của họ, và Keila Shaheen chia sẻ lợi nhuận 50/50 với Simon & Schuster, cho thấy một xu hướng hướng tới sự bình thường hóa của mô hình lai. Đây là tin tốt cho các tác giả; ít hứa hẹn hơn cho các nhà xuất bản truyền thống.
Xuất bản vượt ra ngoài các nhà xuất bản
Tôi đang đồng tác giả một báo cáo với Rüdiger Wischenbart, dựa trên nghiên cứu gốc của ông “Xuất bản vượt ra ngoài các nhà xuất bản.” Chúng tôi đang cố gắng hiểu và định lượng, tốt nhất có thể, tất cả các hoạt động xuất bản sách trên toàn thế giới, mà có thể (và nên) được bao gồm như một phần của cái nhìn toàn diện hơn về hệ sinh thái xuất bản hiện đại.
Khi bạn vượt ra khỏi cái hộp sách, bạn sẽ thấy những thoáng nhìn về nơi AI có thể thực sự tạo ra ảnh hưởng.
Đứa con cưng của dự án của chúng tôi là Wattpad, nơi “97 triệu người dành hơn 23 tỷ phút mỗi tháng để tham gia vào các câu chuyện gốc.” Các câu chuyện được trải nghiệm trực tuyến, chủ yếu trên điện thoại thông minh, trong các đoạn ngắn. Rất ít trở thành sách được xuất bản. Chúng cũng có khả năng tìm đường vào “Wattpad WEBTOON Studios, các đối tác truyền hình, phim và xuất bản của công ty.”
Độc giả trẻ tuổi nhạy bén hơn với việc đọc kỹ thuật số trực tuyến so với những người lớn tuổi của họ. Theo một khảo sát của Wattpad vào tháng 1 năm 2024, “các định dạng kỹ thuật số ngày càng phổ biến trong các thế hệ trẻ, với 65% Gen Z và 71% Millennials chấp nhận tiểu thuyết mạng, sách điện tử và truyện tranh mạng, trong khi chưa đến một nửa của các thế hệ Gen X và Boomer nói điều tương tự.”
Và, tất nhiên, như ngành công nghiệp xuất bản truyền thống hiện đang học hỏi: “Đa dạng là động lực chính để chấp nhận các định dạng kỹ thuật số: 61% Gen Z và 70% Millennials đồng ý rằng sách điện tử, tiểu thuyết mạng và truyện tranh mạng cho họ quyền truy cập vào nội dung khó tìm thấy ở các hiệu sách và thư viện, bao gồm nội dung tập trung vào LGBTQ+ và các nhóm thiểu số.”
Wattpad có các đối thủ cạnh tranh, bao gồm Inkitt, theo Publishers Weekly, gần đây đã huy động được $37 triệu từ các nhà đầu tư “bao gồm Stefan von Holtzbrinck, chủ sở hữu của Holtzbrinck Publishing Group, sở hữu Macmillan, và cựu CEO của Penguin Michael Lynton; hiện tại họ đã thu hút tổng cộng $117 triệu đầu tư. Vào tháng 2 năm 2023, Financial Times nói rằng Inkitt là công ty phát triển nhanh thứ tám ở Châu Âu, và đứng số 1 ở Đức.” Một bài báo ngày 9 tháng 7 trong Esquire đã mô tả việc sử dụng AI của Inkitt, vai trò của nó trong thành công của họ.
Bao nhiêu người trong số các bạn từng nghe nói về Inkitt, ghé thăm nền tảng xuất bản của họ, hoặc tải xuống ứng dụng đọc Galatea của họ?
Nhưng báo cáo “Xuất bản Vượt ra Ngoài Nhà xuất bản” của chúng tôi đi xa hơn các nền tảng câu chuyện trực tuyến để xem xét cách “nội dung có thể được tạo ra và phân phối dưới nhiều định dạng khác nhau (in, kỹ thuật số), phương tiện truyền thông (sách, âm thanh, phim, trò chơi), kênh phân phối (cộng đồng, nền tảng, dòng chảy) và mô hình kinh doanh (bán sản phẩm, đăng ký, phát trực tuyến, freemium, mô hình trả phí) trong các chuỗi cung ứng và tiếp thị chủ yếu được xác định bằng kỹ thuật số.” Có bao nhiêu cơ hội mà các nhà xuất bản sách đang bỏ lỡ vì chúng không phù hợp rõ ràng trong mô hình kinh doanh hiện tại của họ?
Đổi mới, công nghệ và xuất bản sách
Ngoại trừ sách điện tử, ngành xuất bản hiện đại chưa từng đối mặt với mối đe dọa từ công nghệ. (Sách nói kỹ thuật số được chào đón hơn là lo ngại.) Kỷ nguyên Internet mang lại cho các nhà xuất bản nhiều cơ hội hơn là đe dọa; chỉ có một nhà bán lẻ duy nhất, Amazon, được Internet hỗ trợ, đã làm đảo lộn thị trường.
Tôi chưa bao giờ thấy một nghiên cứu nào về việc liệu Amazon có phải là một lợi ích ròng cho ngành xuất bản sách (khi tất cả các khía cạnh của hoạt động và tác động của nó được xem xét đầy đủ) hay không. Nó tiếp cận nhiều người mua không được phục vụ bởi các cửa hàng truyền thống, và sẵn sàng hy sinh lợi nhuận để giữ giá thấp. Sách điện tử và sách nói được giao hàng ở quy mô lớn. Nhưng Amazon có thể giảm giá một phần vì nó yêu cầu giảm giá cao và phí từ nhà cung cấp, và nó làm nghẹt thở các kênh bán lẻ khác. Có những sự đánh đổi đau đớn.
Tuy nhiên, đừng cố gắng chỉ trích Amazon trước mặt một tác giả tự xuất bản. Họ sẽ không thể hoạt động nếu không có The Everything Store.
Tình thế tiến thoái lưỡng nan của người đổi mới
Để có cái nhìn về tác động sắp tới của AI đối với ngành xuất bản sách, tôi khuyên bạn nên đọc The Innovator’s Dilemma: When New Technologies Cause Great Firms to Fail của Clayton Christensen, lần đầu tiên xuất bản năm 1997 bởi Harvard Business Review Press.
Christensen xem xét cách các công ty hiện có (nhà đương nhiệm) có thể chịu thua trước các lực lượng đổi mới.
Các công ty thành công, quản lý tốt thường thất bại khi có những thay đổi đột phá đến với ngành của họ. Các thực hành quản lý thông thường, đã giúp họ trở thành những người dẫn đầu ngành, khiến các công ty này khó linh hoạt khi đối mặt với các công nghệ đột phá có thể ăn mòn thị trường của họ.
Họ bỏ qua các sản phẩm sinh ra bởi công nghệ đột phá, vì thoạt nhìn, chúng so sánh kém hơn với các sản phẩm hiện có của họ. Khách hàng có lợi nhuận cao nhất của họ thường không thể sử dụng các đổi mới được cho là và không muốn chúng. Các công ty cố gắng chống lại các mối đe dọa đột phá bằng cách tăng cường các sản phẩm và dịch vụ hiện có.
Điểm nhấn chính của Christensen là bằng cách làm điều “đúng” một cách rõ ràng, bao gồm cả việc lắng nghe khách hàng, các công ty thành công tự để mình rộng mở trước sự đổi mới đột phá. Họ tập trung vào khách hàng hiện tại của mình và bỏ qua các công nghệ mới quan trọng - ban đầu nhắm vào các thị trường nhỏ, kém lợi nhuận hơn. Nó tạo ra một cơ hội cho các công ty khởi nghiệp linh hoạt làm gián đoạn các nhà lãnh đạo.
Chris Dixon, khi thảo luận về cuốn sách, chỉ ra rằng “lý do những điều lớn lao mới lại lén lút qua mặt các nhà đương nhiệm là vì điều lớn lao tiếp theo luôn bắt đầu bằng việc bị coi là ‘đồ chơi’.” Hmm, đúng vậy, nhiều người xem Chat AI như một món đồ chơi.
Các nhà xuất bản có đang thất bại trong việc nhận ra rằng các đổi mới được xây dựng bằng AI tạo sinh có thể làm gián đoạn mô hình kinh doanh mong manh của họ không?
Tiểu thuyết và phi tiểu thuyết
Tác động của AI đối với ngành xuất bản sách chắc chắn sẽ có tác động khác biệt đáng kể đối với xuất bản tiểu thuyết so với xuất bản phi tiểu thuyết.
Ngành xuất bản sách thường không được phân tích đủ như hai ngành công nghiệp tách biệt, một ngành xuất bản sách tiểu thuyết và một ngành xuất bản sách phi tiểu thuyết.
Mặc dù hầu hết các nhà xuất bản thương mại đều cung cấp cả tiểu thuyết và phi tiểu thuyết, sự khác biệt rõ rệt giữa hai hình thức này là rõ ràng cả về số lượng đầu sách được xuất bản và doanh số bán sách. Ước tính khác nhau, nhưng các đầu sách tiểu thuyết chỉ chiếm khoảng 10% số sách được xuất bản mỗi năm. Tuy nhiên, doanh số bán sách lại rất ủng hộ tiểu thuyết. Lại có sự thay đổi theo từng năm, nhưng tiểu thuyết chiếm khoảng một nửa doanh số sách thương mại hàng năm. Năm ngoái, 21 trong số 25 cuốn sách bán chạy nhất là tiểu thuyết. Sử dụng bảng tổng hợp của Wikipedia, trong số các cuốn sách bằng tiếng Anh từng bán được 20 triệu bản trở lên, 84% là các đầu sách tiểu thuyết.
Xu hướng bán sách nổi tiếng là thất thường, nhưng doanh số bán sách hư cấu dường như đang trên đà tăng trưởng liên tục. Sau khi giảm xuống còn 32% vào năm 2019, chúng đã chiếm 40% thị trường người lớn vào năm 2022 và tăng nhẹ trở lại vào năm 2023. Doanh số bán sách hư cấu cho người lớn đã tăng thêm 6,3% trong nửa đầu năm 2024.
Mặc dù trí tuệ nhân tạo sẽ ngày càng được các tác giả hư cấu sử dụng để hỗ trợ trong quá trình sáng tạo, như đã thảo luận ở nơi khác, có vẻ ít khả năng rằng các câu chuyện do trí tuệ nhân tạo tạo ra sẽ chiếm lĩnh kệ bán chạy nhất. Một “mức đạt đủ tốt” cho một số thể loại hư cấu là có thể tưởng tượng được, nhưng một lần nữa, đó không phải là điều khiến các tác giả và nhà xuất bản mất ngủ.
Việc viết và xuất bản phi hư cấu, mặt khác, sẽ được hỗ trợ và xúc tiến bởi trí tuệ nhân tạo trên toàn diện. Điều này đã xảy ra rồi. Các tác giả phi hư cấu đang tận dụng nhiều tài năng của trí tuệ nhân tạo trò chuyện như một trợ lý nghiên cứu và công cụ viết. Và các nhà xuất bản phi hư cấu sẽ ngày càng kêu gọi trí tuệ nhân tạo trò chuyện giúp đỡ trong việc phát triển bản thảo, kiểm tra sự thật, biên tập, tiếp thị và phân phối.
Có phải tác giả đang đối mặt với mối đe dọa tồn tại?
Tôi đã nói chuyện với một đại diện tác giả rất thông minh, người đã suy nghĩ rất nhiều về ý nghĩa của trí tuệ nhân tạo đối với khách hàng của cô ấy và đối với tất cả các tác giả chuyên nghiệp. Cuộc trò chuyện chuyển sang ý tưởng về cuốn sách như một ‘container,’ và tôi đã yêu cầu cô ấy mở rộng về ý tưởng đó. Câu trả lời của cô ấy:
“Ý tưởng cơ bản là khi các tác giả/đại diện đang đưa một cuốn sách vào nhà xuất bản, nó chỉ là vậy: một cuốn sách. Có sự hiểu biết rằng nó có thể sau này trở thành một trong những hình thức công việc phái sinh mà chúng ta đã biết đến (dịch thuật, chuyển thể kịch, tiểu thuyết đồ họa, v.v.) nhưng tất cả những điều đó đều là thứ yếu so với ‘Công Trình’ chính. Công Trình không phải là một túi từ ngữ hay cụm từ hay sự kiện, nó là một thứ được cấu trúc bởi tác giả theo cách riêng của tác giả đó. Việc phá vỡ container, lắc túi Scrabble của các chữ cái và rút ra một lựa chọn ngẫu nhiên (không hoàn toàn ngẫu nhiên vì đó là một túi Scrabble gồm cú pháp và ngữ nghĩa và phong cách của tác giả cụ thể), không phải là điều đang được xem xét khi chúng tôi cấp quyền cho một nhà xuất bản.
“Cuốn sách là tổng thể không thể tách rời lớn hơn so với tổng của các phần của nó. Đó là sản phẩm của một sự khai sáng sáng tạo (và rất nhiều công việc trí tuệ sáng tạo) đã mang tất cả lại với nhau như một cuốn sách, không chỉ là ‘một’ cuốn sách, mà là cuốn sách của tác giả đặc biệt đó.”
Sách chứa đựng những kho báu
Khi tôi nghĩ về sách phi hư cấu, phá vỡ container là một trong những điểm tích cực của kỷ nguyên trí tuệ nhân tạo. Bạn phá vỡ container, và như những quả trứng Fabergé, có những kho báu chứa đựng bên trong.
Những ràng buộc của container vừa là một tính năng vừa là một hạn chế. Một mặt, “Công Trình không chỉ là một túi từ ngữ hay cụm từ hay sự kiện, nó là một thứ được cấu trúc bởi tác giả theo cách riêng của tác giả đó.” Mặt khác, trong việc tạo ra container, tác giả, do những hạn chế vốn có của container sách, đã buộc phải giảm, từ chối, viết lại và tái cấu trúc. Tác phẩm được đánh bóng, nhưng nó đã được chưng cất và một số thứ đã mất (trong khi những thứ khác được thêm vào) trên đường đi.
Mọi người không đọc những cuốn sách phi hư cấu dài một phần vì họ đã quen với việc lướt qua tất cả các văn bản họ gặp trên web - bao gồm cả trong email của họ. Ngay cả mô hình “tóm tắt sách” cũng thất bại - thay vì một cuốn sách phi hư cấu dài 250 trang khó tiêu hóa, bạn nhận được một bản tóm tắt 8 trang khó tiêu hóa về cuốn sách.
Sách giống như hộp cơm - tất cả mọi thứ ở một chỗ. Nhưng tôi chỉ muốn bánh quy.
Sẽ không dễ dàng để các tác giả đã thành danh thoát khỏi xiềng xích của họ. Nhưng họ có thể phải học cách làm như vậy, nếu không muốn bị lấn át bởi một thế hệ mới của các nhà nghiên cứu và nhà văn có kỹ năng, những người có thể thể hiện mình có hoặc không có các container chính thức, tùy theo dịp. Các container áp đặt quá nhiều hạn chế và giới hạn.
Điều quan trọng là việc viết lách đã thay đổi không thể đảo ngược. Nó giống như sự kết thúc của những người chép sách. Trong trường hợp này, các tác giả tu sĩ của chúng ta phải bước ra khỏi bàn làm việc của họ và quan điểm container hóa của họ về cuốn sách, và tham gia vào hình thức và khán giả của họ.
Ôi vâng, tôi biết rõ các phản hồi của tác giả: Nhưng tôi là một nhà văn, tôi không phải là một người quảng bá. Tôi không có trên mạng xã hội. Tôi không có hứng thú thực sự giao tiếp với độc giả của mình ngoài tác phẩm của tôi và những email thỉnh thoảng và những buổi xuất hiện càng ngày càng ít. Tôi có một trang web (nhưng, thật lòng mà nói, tôi không bao giờ cập nhật nó). Tác phẩm của tôi là món quà của tôi cho độc giả. Họ có thể chấp nhận tác phẩm của tôi, hoặc từ chối tác phẩm của tôi, nhưng tôi sẽ không tham gia cùng họ trong phòng khách của họ.
Chà, bạn có thể cất đi những cuộn giấy và mực làm từ máu của loài chồn. Nghề ‘tác giả’ bây giờ đòi hỏi bạn phải rời khỏi bàn làm việc và gặp gỡ độc giả của mình tại nơi họ sống, trong phòng khách của họ, và trên các trang Facebook của họ. Bạn có thể than thở bao nhiêu tùy thích, khi chúng tôi đóng cửa các khoản tài trợ và vị trí giảng viên của bạn và các cơ hội xuất bản của bạn. Đây là thế giới mới táo bạo của các nhà văn và độc giả, không có nhà xuất bản, những người trung gian đáng sợ, những người làm việc chăm chỉ để nâng cao công việc của bạn, nhưng liên tục làm gián đoạn kết nối trực tiếp của bạn với độc giả, những người đánh giá cao nó nhất.
Điều này không ngăn cản những cuốn sách phi hư cấu tuyệt vời đạt đến một khán giả tinh tế. Ngược lại. Những cuốn sách đó có thể tiếp tục tỏa sáng. Sẽ vẫn có những cuốn sách phi hư cấu bán chạy, mặc dù kinh tế học sẽ được phát hiện là không thể thực hiện được cho tất cả trừ những nhà văn bán chạy nhất. Mô hình hiện tại không cần phải biến mất để mô hình mới phát triển mạnh.
Tôi nghĩ về những cuốn sách phi hư cấu tuyệt vời này như ‘đẹp.’ ‘Đẹp’ như được viết đẹp mắt, chỉnh sửa cẩn thận, thiết kế với sự chăm sóc và cân nhắc, và được in, với các cạnh xé, trên giấy được chứng nhận FSC. Chúng được bán trong các cửa hàng sang trọng.
Các cửa hàng sang trọng được gọi là ‘hiệu sách,’ nhưng chúng có tất cả các đặc điểm của bán lẻ sang trọng—những vật đẹp, được chọn lựa kỹ lưỡng bởi chủ và quản lý, hơi đắt, nhưng đối với những người trân trọng những vật như vậy, rất đáng giá.
Nhiệm vụ của hầu hết các tác giả phi hư cấu hiện nay là vượt qua khỏi cái hộp chứa, cũng như nhà xuất bản như người gác cổng.
Các phương tiện chứa nội dung trong nhiều phương tiện truyền thông
Công chúng đọc, đặc biệt là những thành viên trẻ tuổi hơn của nó, ngày càng ‘không phân biệt phương tiện.’ Trong tìm kiếm giải trí hoặc kiến thức, họ có thể đang xem một video YouTube hoặc TikTok, một loạt phim Netflix, nghe trên Spotify, cuộn qua Instagram (“Insta”), cập nhật tin tức, hoặc thỉnh thoảng đọc một cuốn sách.
(Những người yêu sách in trên BookTok là một nhóm người có ảnh hưởng quý giá, nhưng có tác động thị trường khiêm tốn.)
Tuy nhiên, mô hình thị trường vẫn tập trung vào cái hộp chứa duy nhất. Ngành xuất bản. Ngành điện ảnh. Ngành truyền hình. Ngành âm nhạc.
Phim không phải là sách. Video YouTube không phải là phim. Podcast không phải là sách nói.
Những cái hộp chứa này không phải là một sự tất yếu lịch sử mà là kết quả của một loạt các quyết định kinh doanh được thực hiện bởi các tổ chức mạnh mẽ qua thời gian.
Không khó để làm gián đoạn một mô hình kinh doanh dựa trên một cái hộp chứa duy nhất.
Với tất cả sự thành thạo ngôn ngữ, thế hệ hiện tại của AI sáng tạo còn làm phép thuật của mình với âm thanh, hình ảnh và video một cách táo bạo hơn. AI cung cấp cho cuốn sách này với sách nói, trong nhiều ngôn ngữ, cùng với 31 bản dịch của ebook. Tất cả điều này sẽ không thể thực hiện được nếu không có AI—kinh tế học của sản xuất truyền thống không có ý nghĩa đối với tôi.
Các hộp chứa nội dung
Những người sáng tạo nội dung truyền thống được đào tạo để xuất sắc trong một cái hộp chứa duy nhất. Chúng ta có các chương trình viết và các chương trình phim và các chương trình âm nhạc. Hiếm khi chúng ta nghĩ rằng các nhà văn sáng tạo cũng có thể học một ‘chuyên ngành phụ’ trong phim hoặc âm nhạc. Hoặc trong lập trình máy tính hoặc phát triển ứng dụng.
Điều gì đã xảy ra với truyền thông xuyên phương tiện? Các chương trình dạy các nhà sáng tạo trở thành, như Apple từng mô tả, “Bậc thầy của Truyền thông Kỹ thuật số” ở đâu?
Nội dung tốt nhất sẽ luôn chiến thắng. Nhưng, qua thời gian, các hộp chứa nội dung càng ít quan trọng. Thế hệ kỹ thuật số có thể không phải là không phân biệt phương tiện. Nhưng họ là những người linh hoạt với phương tiện. Họ gặp hầu hết nội dung của họ trên kỹ thuật số, qua điện thoại thông minh. In ấn sẽ tiếp tục tìm thấy một khán giả, nhưng nó sẽ không bao giờ chiếm lại vị trí trung tâm.
“Nhà xuất bản của tương lai” cũng cần phải linh hoạt với phương tiện. Phần lớn sự tăng trưởng trong phân phối nội dung không phải qua mực trên giấy, cũng không phải qua từ ngữ trong các tệp EPUB. Sự tăng trưởng của sách nói không phải là ngẫu nhiên, cũng không phải là sự phổ biến của YouTube và TikTok.
Thách thức lớn hơn nằm ở sự cần thiết phải làm cho nội dung mới và hiện có được khám phá, bất kể hình thức của nó, và sau đó khi được khám phá, biến nhận thức thành quyết định mua.
Khám phá và chuyển đổi
Vấn đề khám phá trực tuyến đã tồn tại với chúng ta trong một thời gian; AI không tạo ra nó. Vấn đề là một điều mà chuyên gia kỳ cựu trong ngành Mike Shatzkin đã nhấn mạnh hơn một lần. Có quá nhiều đầu sách có sẵn ở dạng in, và các định dạng kỹ thuật số cho phép chúng vẫn liên tục được in. Hàng triệu cuốn sách đã hết bản quyền có thể được tìm thấy từ các nhà bán lẻ sách cũ. Trên tất cả, hai triệu hoặc nhiều hơn sách mới được xuất bản mỗi năm, chỉ riêng bằng tiếng Anh. AI sẽ làm cho vấn đề bão hòa trở nên tồi tệ hơn, nhưng nó đã vượt khỏi tầm kiểm soát.
Các thuật toán của Amazon không phải là vô tư—chúng làm rất tốt việc hiển thị những gì có thể bán được, cuốn sách mà bạn có khả năng mua tiếp theo nhất. Cuốn sách đó không chỉ được đặc trưng bởi số liệu bán hàng của nó. Nó bán chạy nhất không phải vì một kẻ lừa đảo nào đó tối ưu hóa danh sách trực tuyến. Nó bán chạy nhất vì nó là cuốn sách hay nhất, và những độc giả hài lòng đã nói với người khác mua nó, cả trực tuyến và trực tiếp. (Amazon đã khuyến khích quảng cáo làm sai lệch các thuật toán của nó, một phần của hiện tượng enshittification của nền tảng.)
Tôi đã nói ở trên về siêu dữ liệu. Chuyển đổi cũng khó khăn như khám phá. Liệu AI có thể giúp các tác giả biến người duyệt web thành người mua hàng không?
Tương lai của bản quyền
Khái niệm bản quyền đã trở nên vô lý bởi AI. Không phải là mọi người không muốn hoặc không xứng đáng được bảo vệ cho công việc của họ - có thể họ xứng đáng được bảo vệ hơn bao giờ hết. Và không phải AI làm cho bản quyền không thể thực thi được (ít nhất là dưới một số hình thức, nếu không phải là hình thức hiện tại).
Vấn đề là “bảo vệ bản quyền” cũng trở thành một bức màn đằng sau đó công việc của bạn biến mất. Nếu sách của bạn không thể được tham khảo thông qua một cuộc trò chuyện với ChatGPT thì thực tế nó không tồn tại. Các công ty AI chỉ sẽ cấp phép cho crème de la crème của nội dung. Họ không cần sữa gầy.
Tại sao phải bảo vệ cái mà không thể tìm thấy?
Đây là nơi vấn đề khám phá có thể trở thành thảm họa. Google làm rất tốt việc khám phá sách chỉ thông qua siêu dữ liệu của chúng. AI muốn toàn bộ enchilada. Không giống như các công cụ tìm kiếm truyền thống, AI không phản hồi các truy vấn của người dùng chỉ dựa trên siêu dữ liệu trừu tượng về một công việc.
Đồng thời, thay đổi các container nội dung, các container khác ngoài sách đầy đủ, gợi ý các loại thách thức bản quyền khác nhau. Nếu văn bản của một cuốn sách có thể thay đổi ngay lập tức, phản ứng với đầu vào của người đọc, thì bản quyền của văn bản đó là gì?
Tác giả và độc giả
Nhà xuất bản cần tác giả; tác giả không cần nhà xuất bản.
Tương lai của xuất bản là mối quan hệ thân thiết giữa tác giả và độc giả. Nó mạnh mẽ hơn nhiều so với mối quan hệ giữa tác giả và nhà xuất bản và giữa độc giả và nhà xuất bản. Nhà xuất bản có thể là một trở ngại trong mối quan hệ giữa tác giả và độc giả. Trong nhiều trường hợp, họ không tạo điều kiện cho mối quan hệ; họ cản trở nó.
Trong một thời gian dài, cách duy nhất để tiếp cận nội dung viết chất lượng cao là thông qua sách hoặc qua một số lượng nhỏ các tạp chí. Điều đó chắc chắn không còn là trường hợp nữa. Ngoài những phiền nhiễu của các phương tiện truyền thông khác, hiện nay có rất nhiều cách khác nhau để tiếp cận nội dung viết chất lượng cao (không có trong container). Sách không còn giữ vị trí ưu tiên như trước đây.
AI có thể giao tiếp
“Sách hoàn hảo tiếp theo để tôi đọc là gì?” AI tạo sinh có thể trả lời câu hỏi đó với sự lưu loát và chính xác chưa từng có trước đây. Khi AI trở thành một công cụ đề xuất đáng tin cậy, các tác giả sẽ cần giao tiếp qua công cụ đó. (Amazon, tất nhiên, đang làm việc này, và có lợi thế là biết được những gì bạn đã mua trước đây.)
Kết luận
Vậy điều này để lại cho chúng ta điều gì?
Tôi cảm thấy cần thiết phải liệt kê những thách thức mà xuất bản đang phải đối mặt. Chat AI đang đến vào thời điểm ngành xuất bản thương mại gặp khó khăn. Nó không đến vào thời điểm ngành công nghiệp này đang mạnh mẽ, và có thể nói: “chúng tôi không cần một công nghệ mới lạ nào; chúng tôi đang ổn.”
Tôi đã nói ở trên về những thách thức cấp bách nhất mà xuất bản phải đối mặt: chi phí tăng và lợi nhuận giảm.
Những con sói sẽ không bao giờ hài lòng với những yêu cầu giảm giá ngày càng dốc; lợi nhuận sẽ không cải thiện. Giá bán lẻ gần như đã đạt đến trần. Tương lai của mô hình xuất bản thương mại hiện tại nằm ở việc giảm chi phí.
Lương không thể giảm thêm, vì vậy chúng ta sẽ cần cắt giảm chi phí trong chu kỳ sản xuất.
Nhưng các nhà xuất bản đã cố gắng cắt giảm chi phí sản xuất trong nhiều thập kỷ. Đã có một số thành công đáng chú ý, nhưng chúng ta đã cạn kiệt các tùy chọn hiện tại.
Tôi đã chỉ ra rằng AI có thể mang lại hiệu quả cho xuất bản, trên toàn bộ quy trình làm việc. Chúng không tức thì và không dễ dàng: bạn cần làm việc với AI. Nhưng cơ hội đang ở đó.
Các nhà xuất bản không tìm cách giảm nhân viên, vì vậy mục tiêu phải là nhiều sách hơn ra thị trường nhanh hơn dựa trên nguồn lực nhân viên hiện tại. Công cụ AI có thể thúc đẩy mục tiêu đó.
Và tất nhiên, luôn có mục tiêu bán được nhiều bản sách hơn. AI cũng có thể giúp ở đó.
Tôi mô tả ở trên cách AI cũng có thể là yếu tố biến đổi cho tương lai của xuất bản.
Đừng lo lắng về điều đó. Hãy sắp xếp lại ngôi nhà của bạn, và chúng ta sẽ nói chuyện thêm.
Một nguồn duy nhất
Hiện nay có một nguồn tài liệu gần như vô tận để giúp bạn hiểu rõ về AI, dĩ nhiên là quá nhiều. Hãy chọn phương tiện ưa thích của bạn: sách, blog, bản tin, video, podcast, khóa học và bói toán tâm linh. Tôi đã liên kết đến một số nguồn chính trong cuốn sách này, đáng để nhấp vào một vài liên kết ngẫu nhiên để xem chúng dẫn bạn đến đâu.
Chỉ có một cuốn sách AI tuyệt vời cho người mới bắt đầu, Cuốn sách Co-Intelligence của Ethan Mollick, được phát hành vào đầu tháng Tư, 2024. Nó được rút ra từ bản tin xuất sắc không kém của ông, “One Useful Thing.”
Lưu ý bên lề: Thông tin xác thực về việc viết cuốn sách này
Tôi không muốn làm nặng phần giới thiệu với thông tin này, nhưng tôi nhận thức được rằng nhiều người nghi ngờ những người viết về AI ngày nay, nghi ngờ rằng những tác giả này đang tự biến mình thành các chuyên gia AI hiện đại. Chắc chắn có một số người như vậy. Tôi hy vọng rằng tôi có đủ thông tin xác thực để thực hiện dự án này.
Tôi đã đọc cuốn sách đầu tiên về trí tuệ nhân tạo vào năm 1988, một cuốn sách được xuất bản hai năm trước đó, Understanding Computers and Cognition: A New Foundation for Design của Terry Winograd và Fernando Flores. Cuốn sách rất dày đặc - nhiều phần vượt quá tầm hiểu biết của tôi - nhưng đó là lần đầu tiên tôi cảm thấy hào hứng về khả năng của trí tuệ nhân tạo trong xuất bản sách.
Lúc đó tôi đã rất sâu vào công việc số hóa xuất bản, do sự bùng nổ của xuất bản máy tính để bàn, máy tính Apple, PageMaker và những thứ tương tự. Vào năm 1986, tôi đã giám sát việc phát triển phần mềm xuất bản sách tự động Page One, một chương trình có thể lấy bản thảo sách dưới dạng tệp Microsoft Word và dàn trang thành một cuốn sách hoàn chỉnh trong vài phút. Điều đó rất dễ làm ngày nay; nhưng đã không dễ dàng vào thời điểm đó.
Tôi tiếp tục làm việc trong công nghệ xuất bản sau đó, với tư cách là một tư vấn viên và nhà phân tích, làm việc với một số nhà cung cấp phần mềm và phần cứng hàng đầu, bao gồm Adobe, Apple và Microsoft. Tôi cũng đã tham gia và trở thành đồng sở hữu của một công ty phần mềm tên là Enfocus. Chúng tôi đã tạo ra một hệ thống tự động cho quy trình làm việc trước khi in.
Chúng tôi không có quyền truy cập vào AI vào thời điểm đó, nhưng chúng tôi đã rất giỏi trong việc triển khai các hệ thống sản xuất xuất bản hoàn toàn tự động. Như AI có thể không thể phân biệt được với ma thuật, thì sự tự động hóa tốt nhất cũng có thể giống như AI.
Chuyển nhanh đến năm 2016, đồng nghiệp của tôi Cliff Guren đã giúp tôi tập trung vào AI trong xuất bản sách: có vẻ như cuối cùng cũng có điều gì đó đang xảy ra. The Bestseller Code (Archer và Jockers) xuất hiện vào tháng 9 năm 2016, làm rõ rằng máy tính có thể phân tích kết cấu của văn học với mức độ hiểu biết và chính xác cao.
Lúc đó tôi đã rất chú ý đến các công ty khởi nghiệp trong lĩnh vực xuất bản sách, và một số ít đã xuất hiện với một số công nghệ AI được tích hợp vào các sản phẩm phần mềm của họ.
Chuyển nhanh thêm một lần nữa đến tháng 10 năm 2022.
Nhiều tháng trước khi nó trở thành chủ đề mà mọi người trong ngành xuất bản đang nói về, Tim O’Reilly đã trình bày tại Hội nghị PageBreak về “AI và Sự biến đổi của Xuất bản.” O’Reilly nổi tiếng trong cộng đồng xuất bản, cả vì O’Reilly Media và hội nghị Tools of Change. Ông là một trong những nhà tiên tri hàng đầu của công nghệ.
O’Reilly không chỉ nhiệt tình về những tiến bộ mới trong AI, ông còn rất phấn khích. “Chúng ta đang ở một điểm rất giống với cảm giác của tôi khi chúng ta phát hiện ra Worldwide Web vào năm 1992,” ông nói, và tiếp tục với “điều này cũng mang tính cách mạng như VisiCalc, PC và trình duyệt web.”
Ông thừa nhận rằng (tại thời điểm đó) trường hợp sử dụng vẫn còn mơ hồ, chỉ ra một vài dự án thí điểm tại O’Reilly Media. Nhưng, ông nói, “điều này đang trở nên tốt hơn một cách đáng sợ. Học máy không còn là điều trong tương lai nữa. Đây là về việc dân chủ hóa AI.”
O’Reilly đã nói về cách các nhà xuất bản nên tiếp cận các công nghệ mới này, nói rằng họ cần phải “biết khi nào đốt thuyền và dồn hết nỗ lực. Có thời điểm bạn phải cam kết.”
ChatGPT chưa được phát hành cho đến một tháng sau đó. PageBreak là hội nghị xuất bản đầu tiên đặt nó làm trọng tâm, thông qua những hiểu biết của Tim.
Tiết lộ
Cuốn sách này có năm nhà tài trợ. Tôi biết khi viết cuốn sách rằng sẽ có ít tài sản để tìm thấy, và tôi quyết định bảo trợ cho nỗ lực của mình bằng cách mời các nhà tài trợ tham gia.
Như tôi đã chỉ ra trên trang web của mình, làm việc như một tư vấn viên, một nhà phân tích và một nhà báo, tôi ủng hộ Hiến chương Đạo đức Toàn cầu cho Nhà báo của Liên đoàn Nhà báo Quốc tế. Đoạn 13 rõ ràng về nghĩa vụ tránh xung đột lợi ích hoặc “bất kỳ sự nhầm lẫn nào giữa hoạt động của tôi và hoạt động quảng cáo hoặc tuyên truyền.”
Có nhà tài trợ đồng nghĩa với việc có xung đột lợi ích và nhầm lẫn về quảng cáo. Nếu tôi làm việc cho New York Times, câu trả lời sẽ đơn giản: “Không.” Làm việc cho chính mình, sự minh bạch là vũ khí của tôi để đáp ứng những nghĩa vụ này: Tôi sẽ mô tả sự xem xét mà tôi đã nhận được và bạn có thể đánh giá, trong công việc của tôi, liệu tôi có bị ảnh hưởng hay không.
Tôi đã chọn những nhà tài trợ mà tôi mời tham gia vào dự án này vì tôi không chỉ quen thuộc với công việc của họ mà còn với những cá nhân liên quan trong tổ chức của họ. Họ là đồng nghiệp và bạn bè của tôi. Tôi đã nói với họ rằng sản phẩm của họ có thể được đề cập trong văn bản của cuốn sách này và họ sẽ không có quyền kiểm soát những lời đó. Điều họ có thể kiểm soát là quảng cáo của họ ở cuối cuốn sách—tôi sẽ đăng những quảng cáo đó như đã được cung cấp. Đó là những gì tôi đã làm.
Tôi đã nhận được các khoản thanh toán từ những người khác có thể đã ảnh hưởng đến công việc của tôi về cuốn sách này—tôi có thể liệt kê những điều sau:
Tôi chưa làm bất kỳ công việc tư vấn nào được trả tiền cho các nhà cung cấp AI được mô tả trong cuốn sách này, bao gồm cả các nhà tài trợ.
Tôi đã nhận được một số doanh thu chia sẻ lợi nhuận từ Publishers Weekly cho các hội thảo trên web về AI vào tháng 9 năm 2023.
Tôi được trả mức lương tiêu chuẩn cho các bài viết của tôi trên Publishers Weekly.
Hãy cho tôi biết nếu bạn phát hiện bất kỳ sự thiên vị nào mà bạn nghĩ có thể đã xuất phát từ những cam kết này. Sự thiên vị của tôi đối với AI đã hình thành trước khi những khoản tiền lớn chảy vào.
Lời cảm ơn
Tôi sẽ không thể nói chuyện với bất kỳ sự tín nhiệm nào về AI nếu không có sự hỗ trợ của Publishers Weekly, bao gồm cả biên tập viên danh dự, Jim Milliot và CEO, Cevin Bryerman. Jim đã hỗ trợ bài viết đầu tiên của tôi về AI, và Cevin (cùng với Krista Rafanello và các thành viên khác của nhóm) đã đóng vai trò quan trọng trong sự thành công của hội nghị mùa thu vừa qua, AI and the Revolution in Book Publishing. Andrew Albanese hiện là biên tập viên điều hành tại PW; Ed Nawotka, một biên tập viên cao cấp. Tôi thật may mắn khi được làm việc với họ.
Và cảm ơn thêm nhiều đồng nghiệp…
Peter Brantley
Cliff Guren, đối tác tranh luận lâu năm và người đọc nhạy bén của các bản thảo của tôi
Hai người đọc phiên bản ‘beta’ khác, đã cung cấp phản hồi quý giá: Joe Wikert và Brad Farmer
Publishing Technology Partners của tôi, Ken Brooks, Bill Kasdorf, Bill Rosenblatt, Bill Trippe, Steve Sieck, và các đối tác mới nhất của chúng tôi, Lettie Conrad và Linda Secondari.
Em gái tôi, Anne Pashley, người giúp tôi cập nhật cơ sở dữ liệu khởi nghiệp xuất bản, và luôn tiếp thêm năng lượng cho nỗ lực của tôi.
Các đối tác của tôi trong các hội thảo trên web về AI hàng tháng: Brooke Horn và Brian O’Leary tại BISG.
Bill Kasdorf đã giúp tôi đi sâu vào các vấn đề về quyền truy cập cho cuốn sách của tôi.
Peter Armstrong và Len Epp tại Leanpub đã kiên nhẫn với những tranh cãi của tôi và giúp tôi qua quá trình cung cấp kết quả tốt nhất có thể trên nền tảng Leanpub.
Hugo Rayne tại ElevenLabs đã hỗ trợ sách nói.
Bạn thân của tôi và người phát hiện đáng tin cậy về những sai lầm trong viết và lý luận của tôi, Bob McArthur.
Phụ lục: Khám phá những lợi thế còn lại của xuất bản truyền thống
Uy tín của xuất bản truyền thống là lý do mà hầu hết chúng ta tham gia vào ngành công nghiệp này. Chúng tôi lớn lên yêu thích sách, sau đó học tiếng Anh hoặc một ngành tương tự ở đại học, thử làm nhiều công việc khác nhau, có lẽ nhận được một công việc tại cửa hàng sách, có lẽ một chứng chỉ Thạc sĩ Xuất bản, rồi làm việc như một thực tập sinh tại một công ty xuất bản, và đây chúng tôi ngày hôm nay. Bạn yêu thích công việc của mình, mặc dù lương chẳng được bao nhiêu và điều kiện làm việc không phải lúc nào cũng dễ chịu.
Uy tín đó nuôi dưỡng chuỗi cung ứng xuất bản. Ở phía đầu vào của chuỗi cung ứng: nó có ý nghĩa rất lớn với nhiều tác giả. Chúng ta thấy điều đó mọi lúc. Kinh tế của xuất bản truyền thống không có lý, và phải mất gấp bốn lần thời gian để được in, nhưng, có thể, chỉ có thể, tôi sẽ là người chiến thắng đầu tay tiếp theo, như Delia Owens (Where the Crawdads Sing) hoặc ngôi sao lần thứ hai, Amor Towles (A Gentleman in Moscow).
Nó giống như Vegas: ngoại trừ tỷ lệ cược tốt hơn ở Nevada. Chơi một số duy nhất trong trò roulette và tỷ lệ chống lại bạn là 36 chọi 1. Chơi xuất bản truyền thống và tỷ lệ chống lại bạn là… tệ hơn nhiều.
Tỷ lệ có được một hợp đồng với bất kỳ nhà xuất bản thương mại truyền thống nào, chưa kể đến một trong năm nhà xuất bản lớn, là rất thấp. Nhưng đó là vấn đề nhỏ nhất của một tác giả. Thực sự tìm được độc giả mới là thách thức lớn nhất.
Một điều có thể giúp ích là có mặt trong danh sách bán chạy nhất.
Hãy xem xét PRH, Penguin Random House. Công ty xuất bản chỉ 15.000 đầu sách mới mỗi năm. Năm 2021 họ đã đưa 196 cuốn sách vào danh sách bán chạy nhất của Publishers Weekly. Như bài viết liên kết nêu rõ: “PW công bố bốn danh sách bán chạy nhất dành cho người lớn, mỗi danh sách có 20 đầu sách: tiểu thuyết bìa cứng, phi hư cấu bìa cứng, sách bìa mềm thương mại và sách thị trường đại chúng bìa mềm. Điều đó có nghĩa là trong suốt một năm, có 2.080 vị trí bìa cứng trên các danh sách của chúng tôi và 2.080 vị trí bìa mềm.
Không phải tất cả các sách bán chạy đều được xuất bản mới trong năm đó—giả sử hào phóng rằng 90% là mới, 1870 vị trí.
Trong khi đó, The New York Times có 15 vị trí bán chạy nhất mỗi tuần cho mỗi danh mục sách (tiểu thuyết, phi hư cấu, sách thiếu nhi; danh sách riêng cho YA và hướng dẫn; bìa cứng riêng biệt từ bìa mềm, cộng với danh sách kết hợp). Đối với một tác giả cá nhân, điều đó có nghĩa là có 780 vị trí mỗi năm, mặc dù hầu hết các vị trí đó được lấp đầy bởi các sách bán chạy lặp lại. (The Body Keeps the Score của Bessel van der Kolk đã nằm trong danh sách bìa mềm suốt năm năm rưỡi!) Vì vậy, hãy chia đôi, 390 vị trí còn lại. Bạn phải bán rất nhiều sách để giành được một trong những vị trí đó.
Còn việc được đề cập trên New York Times Book Review thì sao? Năm 2016, Pamela Paul, lúc đó là biên tập viên của Review, tuyên bố rằng “The Book Review tại Times đánh giá khoảng 1% số sách xuất bản trong bất kỳ năm nào.” Rõ ràng cô ấy nói đến 1% số sách từ các nhà xuất bản hàng đầu—cô ấy không thể nghĩ đến các nhà xuất bản nhỏ hoặc các tác giả tự xuất bản. Và do đó, có lẽ 150 trong số 15.000 đầu sách mới của PRH được đánh giá mỗi năm.
Hầu hết các quan sát viên đều đồng ý rằng mặc dù việc được chú ý từ các phương tiện truyền thông hàng đầu vẫn quan trọng và có thể mạnh mẽ, tác động của các đánh giá không còn như trước đây, nếu không có lý do nào khác là vì số lượng người đọc sách tương tác với các kênh đánh giá chính giảm đi.
Hãy chuyển sự chú ý của chúng ta đến chuỗi cung ứng hạ lưu, đến phân phối. Trong khi thương hiệu nhà xuất bản có trọng lượng với các tác giả, thì luôn có một sự thật rằng, không giống như nhiều hàng tiêu dùng khác, thương hiệu nhà xuất bản gần như không có trọng lượng với người mua và đọc sách. Nhưng chúng có rất nhiều trọng lượng với các nhà phân phối và người bán sách. Điều này phản ánh tính chất kinh doanh với kinh doanh lịch sử của xuất bản (thay vì B2C—đến người tiêu dùng). Uy tín nhà xuất bản được truyền đạt qua kênh phân phối và bán lẻ: Barnes & Noble mang một cuốn sách vì nó từ PRH, sau đó đặt nó trước mặt người mua; do đó uy tín được truyền đạt đến người đọc.
Nhà tài trợ
David Lamb và Susan Reich thành lập Book Advisors LLC vào năm 2016 để tư vấn về sáp nhập và mua lại trong ngành xuất bản. Chúng tôi đã hoàn thành hơn một chục giao dịch, cũng như nhiều dự án tư vấn tài chính, phân phối và hoạt động khác nhau, bao gồm định giá thị trường công bằng. Chúng tôi rất vui mừng được làm việc gần đây với Clarke & Esposito; Thad McIlroy của The Future of Publishing; và Kuo-Yu Liang của Ku Worldwide.
Chúng tôi tự hào về các mối quan hệ, sự cẩn trọng và kín đáo của mình. Cho dù bạn quan tâm đến mua, bán, tài trợ hay tư vấn, vui lòng liên hệ để có cuộc thảo luận bảo mật.
bookadvisorsllc.com | bookadvisors@gmail.com
Firebrand Technologies là một công ty phần mềm và dịch vụ đã hỗ trợ các nhà xuất bản sách với các giải pháp quản lý dữ liệu và quy trình làm việc trong hơn 35 năm.
NetGalley là một nền tảng trực tuyến kết nối các nhà xuất bản và tác giả với các nhà phê bình, thủ thư, người bán sách, truyền thông và giáo viên, những người khám phá sách mới trên NetGalley và giới thiệu chúng đến khán giả của họ.
Là nhà phát triển phần mềm và giải pháp kỹ thuật số, Firebrand Technologies và NetGalley cũng là chuyên gia trong ngành và thành viên tích cực của cộng đồng xuất bản. Các giải pháp của chúng tôi mang lại lợi ích cho tất cả các khía cạnh của quy trình xuất bản, từ việc mua bản quyền đến bán hàng và tiếp thị.
NetGalley giúp các nhà xuất bản tạo tiếng vang cho các tựa sách, nhận phản hồi và đánh giá nhanh chóng, và phát hiện các xu hướng sớm.
Title Management Enterprise, cùng với phiên bản nhỏ gọn của nó, Title Management Lite, là ứng dụng phần mềm cốt lõi của Firebrand cung cấp quản lý quy trình làm việc xuất bản tiên tiến trong suốt quá trình xuất bản.
Eloquence on Demand là nền tảng phân phối ONIX mạnh mẽ nhất của ngành xuất bản, phân phối siêu dữ liệu và tài sản kỹ thuật số tới hơn 600 đối tác giao dịch bằng ONIX và các định dạng khác.
Flywheel là dịch vụ tiếp thị danh mục cũ giúp nhận diện các cơ hội ẩn trong danh mục cũ để tăng khả năng khám phá và bán hàng.
Eloquence on Alert giám sát dữ liệu tiêu đề trực tiếp và các xu hướng trên thị trường và cảnh báo các nhà xuất bản về các sai lầm và cơ hội quan trọng có thể ảnh hưởng đến doanh số bán hàng (thiếu nút mua, người bán bên thứ ba, v.v.).
FlightDeck là công cụ Kiểm tra và Xác thực EPUB tiên tiến nhất hiện có.
Chào mừng đến với cách in sách tốt hơn.
Perfect Bound được tạo ra vào năm 2022 để giúp giải quyết các vấn đề chuỗi cung ứng đã làm khó ngành xuất bản sách trong nhiều năm. Các giai đoạn thừa công suất tại các nhà in nối tiếp bởi những khoảng thời gian trì hoãn do thiếu nguồn cung. Perfect Bound tìm cách mở ra thị trường in ấn cho các nhà xuất bản và tác giả độc lập bằng cách cho phép các nhà in từ khắp nơi trên thế giới dễ dàng kết nối và kinh doanh với các nhà xuất bản đang tìm kiếm các nhà cung cấp mới và năng động.
Perfect Bound là gì?
Perfect Bound là một thị trường hai mặt kết nối các nhà xuất bản sách độc lập với các nhà in ở Mỹ, Canada, Colombia, Brazil, Thổ Nhĩ Kỳ, Trung Quốc, Malaysia, Ấn Độ và nhiều nước khác.
Khám phá đối tác xuất bản mới chỉ với một cú nhấp chuột
Nền tảng mạnh mẽ của chúng tôi cho phép bạn đơn giản xây dựng báo giá sản phẩm, gửi yêu cầu đến hàng trăm nhà in chỉ bằng một cú nhấp chuột, thương lượng và hoàn tất các đợt in của bạn và theo dõi sản phẩm từ nhà in đến kho hàng. Là một nhà in, kết nối với các nhà xuất bản mới, đấu thầu các dự án sắp tới và nhận thanh toán chưa bao giờ dễ dàng hoặc an toàn hơn.
Kết nối ngay lập tức với các đối tác xuất bản mới
Gửi và nhận yêu cầu in từ khắp nơi trên thế giới
Thực hiện và theo dõi đợt in từ nhà in đến kho hàng
Giao dịch liền mạch bằng thanh toán ACH qua Stripe mà không cần rời khỏi nền tảng
Gặp gỡ Insight, một nền tảng AI được xây dựng riêng cho các nhà xuất bản
“Áp dụng Insight cho nhà xuất bản của chúng tôi giống như chuyển từ xe đạp sang Ferrari. Đột nhiên, mọi thứ diễn ra nhanh hơn.”
—-Nhà xuất bản sách thiếu nhi Đức và khách hàng của Insight
Làm việc Thông minh hơn, Đạt được Nhiều hơn
Được phát triển bởi Veristage, Insight giúp các nhà xuất bản phát triển mạnh mẽ trong bối cảnh AI đang thay đổi. Sử dụng AI và một bộ công cụ kỹ thuật số mạnh mẽ, Insight phân tích và hiểu tài liệu và sách của bạn, để giúp bạn:
Tạo, cải thiện và làm mới siêu dữ liệu
Đẩy nhanh việc tạo ra các tài liệu tiếp thị, quảng bá và bán hàng cụ thể cho từng tựa sách
Xác định và đánh giá thông điệp chính của cuốn sách, điểm bán hàng độc đáo, khán giả mục tiêu, các tựa sách tương tự, và nhiều hơn nữa
Tối ưu hóa nội dung tiếp thị và bán hàng của bạn để đạt được phạm vi tiếp cận tối đa, sự tương tác và tăng doanh số
Khác với các nền tảng AI chung chung, Insight được thiết kế để hoạt động trong quy trình làm việc của ngành xuất bản và giúp bạn tạo ra thông tin và tài sản cụ thể cho xuất bản.
Cách Thức Hoạt Động
Tải sách của bạn lên nền tảng Insight
Các công cụ AI của Insight phân tích và hiểu sách của bạn
Trong vài phút, Insight tạo ra nhiều siêu dữ liệu và thông tin chính về cuốn sách của bạn cho các bộ phận biên tập, tiếp thị, quảng bá, bán hàng và bản quyền
Nhập chỉnh sửa thủ công cho bất kỳ thông tin nào này trực tiếp trên nền tảng. Sách của bạn và nội dung AI được lưu trong Insight, vì vậy bạn có thể truy cập bất cứ lúc nào.
Sử dụng AI Chat nhận biết tài liệu của chúng tôi để tối ưu hóa thông tin tiêu đề của bạn, tương tác với sách của bạn, và kết hợp chi tiết sách vào các liên lạc và tài liệu khác
Bảo mật và Bản quyền
Đội ngũ Veristage cam kết cung cấp các dịch vụ AI an toàn và bảo vệ tài sản trí tuệ của các nhà xuất bản. Nền tảng của chúng tôi có các hệ thống bảo mật thông tin tiên tiến, và chúng tôi chỉ làm việc với các mô hình AI không lưu trữ hoặc sử dụng dữ liệu của bạn để đào tạo các mô hình tương lai.
Giải pháp cho Nhà xuất bản Mọi Quy mô
Insight được thiết kế để hoạt động cho các nhà xuất bản mọi hình dạng và kích thước, từ tiêu dùng đến học thuật, từ đội ngũ ba người đến các tổ chức đa quốc gia. Chúng tôi cung cấp giá cả cạnh tranh và các giải pháp có thể mở rộng.
Hãy nói chuyện với chúng tôi để tìm hiểu Insight có thể mang lại lợi ích gì cho doanh nghiệp của bạn: