पुस्तक प्रकाशन में एआई क्रांति (हिंदी संस्करण)
पुस्तक प्रकाशन में एआई क्रांति (हिंदी संस्करण)
Thad McIlroy
Buy on Leanpub

Table of Contents

परिचय

“अगली क्रांति हम सभी को चौंका देगी, जैसा कि वे हमेशा करती हैं। दूसरे शब्दों में: यदि भीड़ क्रांति की प्रतीक्षा कर रही है, तो यह क्रांति नहीं हो सकती।” —डॉक सर्ल्स, 2002

यह डेढ़ साल से अधिक हो गया है जब OpenAI ने ChatGPT को एक सार्वजनिक मंच पर पेश किया, जो ज्यादातर कृत्रिम बुद्धिमत्ता से अपरिचित था। प्रारंभ में इसका किताब प्रकाशन के साथ कोई स्पष्ट सम्बन्ध नहीं दिखा। तब से, सब कुछ बदल गया है। और कुछ भी नहीं बदला है। प्रकाशक नए एआई टूल्स में गोता लगाने लगे हैं, किनारों की खोज कर रहे हैं, और ChatGPT के साथ प्रारंभिक वार्तालाप कर रहे हैं। लेकिन प्रकाशन की प्रथा में एक सच्ची क्रांति का कोई संकेत नहीं है; यह अभी भी बहुत जल्दी है।

लेखन और प्रकाशन में एआई के आसपास बहुत अधिक अनिश्चितता है। एआई के उपयोग को लेकर प्रमुख विवाद हैं। फिर भी, कई लोगों के लिए, संभावनाओं के बारे में उत्साह है।

मैं यहाँ वादे पर अधिक ध्यान केंद्रित करने जा रहा हूँ बजाय खतरे पर, लेकिन मैं लेखकों और प्रकाशकों पर लागू होने वाले एआई के आसपास की चिंताओं और जोखिमों का एक अवलोकन शामिल करता हूँ। मैं चिंताओं को तुच्छ नहीं बनाना चाहता। यह किताब बस इसके बारे में नहीं है।

क्या यह एक किताब है?

मैं इस प्रकाशन को ‘पुस्तिका’ के रूप में अधिक मानता हूँ बजाय एक किताब के। यूनेस्को की किताब की परिभाषा है “कम से कम 49 पृष्ठ” (क्यों नहीं 50?), और, 300 शब्द प्रति पृष्ठ पर, यह अर्हता प्राप्त करने में विफल हो सकता है। लेकिन, अधिक महत्वपूर्ण बात यह है कि इसका उद्देश्य किसी भी चीज़ पर अंतिम शब्द होना नहीं है—यह अधिक एक प्रगति रिपोर्ट है। कृत्रिम बुद्धिमत्ता, और किताब प्रकाशन में इसकी भूमिका, तेजी से बदल रही है, और धीमी होने का कोई संकेत नहीं है। इसलिए यह किताब(let), यह रिपोर्ट, सिर्फ एक स्नैपशॉट है।

Leanpub प्लेटफार्म का उपयोग करते हुए, मैंने अपने शोध और विश्लेषण को एक प्रगति कार्य के रूप में जारी किया है—यह एक जीवित दस्तावेज़ के रूप में संशोधित होता है। मैंने इससे पहले कभी ऐसा प्रयास नहीं किया। मेरे कारण दो गुना हैं: अल्पकालिक में कुछ उपयोगी पेश करने के लिए, और आवश्यकतानुसार इसे संशोधित करने की सुविधा रखने के लिए। एआई की कहानी अभी खत्म नहीं हुई है।

मुझे उम्मीद है कि मेरा दृष्टिकोण पाठकों के लिए उपयोगी साबित होगा, हालांकि मैं जानता हूँ कि बहुत अधिक अपडेट जल्द ही कष्टप्रद हो सकते हैं। मैंने इस किताब की समकालिकता को कम करने की कोशिश की है, ताकि उन चीजों पर ध्यान कम हो जो सबसे तेजी से बदलने वाली हैं।

जो संस्करण अप्रैल 2024 से (शांतिपूर्वक) उपलब्ध है उसे मैंने “75% पूर्ण” के रूप में चिह्नित किया था और पाठकों के लिए मुफ्त में पेश किया था। जुलाई 23 “100% पूर्ण” संस्करण की आधिकारिक प्रकाशन तिथि है, जो Leanpub के बाहर भी व्यापक वितरण में आएगी। मैं 100% संस्करण को अपडेट करता रहूंगा: लेकिन वे अपडेट केवल Leanpub खरीदारों के लिए उपलब्ध होंगे—प्रिंट, ईबुक और ऑडियोबुक को लगातार अपडेट करना बोझिल है जो व्यापक वितरण में हैं।

AI के साथ प्रकाशकों की पीड़ा

मैं रोजाना सुन रहा हूँ कि प्रकाशन उद्योग में लोग AI से तालमेल बैठाने की कोशिश में कितनी पीड़ा महसूस कर रहे हैं। यह इतनी पीड़ादायक क्यों है? यहाँ तीन कारण हैं जो मैं देख रहा हूँ:

  • प्रौद्योगिकी जटिल और रहस्यमय है, गैर वैज्ञानिकों के लिए समझने के लिए बहुत जटिल है। (एक रोचक अध्ययन एक “AI चिंता पैमाना (AIAS)” प्रस्तुत करता है जो 21 विभिन्न कारणों को मापता है जिनसे लोग AI के बारे में चिंतित हैं।)

  • कॉपीराइट मुद्दों के कारण प्रकाशन में AI अत्यधिक विवादास्पद हो गया है जो लेखन और प्रकाशन के मूल पर प्रहार करता है।

  • फिर भी, FOMO का एक वातावरण भी है - छूट जाने का डर। AI की कई खामियों के बावजूद, जैसे कई आकर्षक प्रौद्योगिकियों (Apple वॉच? स्मार्ट स्पीकर्स?) के साथ, हमें वह कुतरने वाली भावना होती है: क्या मैं अगली वास्तव में बड़ी चीज़ को मिस कर रहा हूँ, जैसे मैंने पिछली कुछ बड़ी चीज़ों को मिस किया था। तब मुझे मूर्खता महसूस हुई; मैं फिर से मूर्ख महसूस नहीं करना चाहता। यह चोट पहुँचाता है।

ठीक है: यह समझ में आता है कि प्रकाशन लोग AI की पीड़ा महसूस करते हैं।

तो फिर इस पुस्तक के लिए उपयोग का मामला क्या है?

उपयोग का मामला यह है कि आप पुस्तक प्रकाशन में काम करते हैं, या आप एक लेखक हैं जो पुस्तक प्रकाशन को बेहतर तरीके से समझने की कोशिश कर रहे हैं, और आप AI के आसपास मूर्ख और भ्रमित महसूस करने से थक चुके हैं। आपके बहुत से सहयोगी इसे आपसे बेहतर समझते प्रतीत होते हैं, और आप इस विषय पर बुद्धिमानी से चर्चा करने में सक्षम न होने से थक चुके हैं।

मेरी पाठकों के लिए लक्ष्य है कि, इस पुस्तक के अंत तक, वे बातचीत में शामिल होने, एक जानकार राय व्यक्त करने के लिए सक्षम महसूस करेंगे। मैं चाहता हूँ कि आप प्रौद्योगिकी के आसपास व्यक्तिगत विकल्प बनाने के लिए सक्षम महसूस करें, और AI का उपयोग कैसे करना है, यह सीखने के लिए एक मार्ग हो, यदि आप ऐसा करना चुनते हैं।

मैं पाठकों को AI प्रौद्योगिकी की नींव के बारे में बहुत सारी बातें करने से नहीं भरना चाहता हूँ - मैं AI के बारे में बहुत अधिक अमूर्त रूप से बात नहीं करने वाला हूँ। इसके बजाय, मैं आपको विशेष रूप से पुस्तक लेखन और प्रकाशन के लिए AI में एक आधार देना चाहता हूँ। यदि कोई आपसे पूछे, प्राकृतिक भाषा संसाधन का वास्तव में क्या मतलब है, तो आप उत्तर दे सकते हैं, जैसे मैं करता हूँ: मैं AI विशेषज्ञ नहीं हूँ। लेकिन मैं जानता हूँ कि AI का मेरे उद्योग में कैसे उपयोग हो रहा है।

क्या यह वही है जो आपको जानने की ज़रूरत है?

मुझे “जो आपको जानने की ज़रूरत है” वाक्यांश पसंद नहीं है क्योंकि यह शायद ही कभी अपनी उम्मीदों पर खरा उतरता है, अक्सर निशाने से बहुत दूर होता है, या तो बहुत अधिक जानकारी देता है या बहुत कम। क्या मैं इसे सही कर पाऊंगा? मैं न्यूनतम जानकारी देने की कोशिश में गंभीर हूं। मुझे लगता है कि मुझे पता है कि प्रकाशकों को एआई के बारे में क्या जानने की आवश्यकता है, क्योंकि मैंने बहुत से लोगों से बात की है, जबकि विशेष रूप से मूल बातें प्रदान करने के लिए डिज़ाइन किए गए संगोष्ठियों और वेबिनारों की मेजबानी की है।

An icon of a key

“जो आपको जानने की ज़रूरत है” वाक्यांश को बार-बार दोहराने के बजाय, मैं एक मुख्य लोगो का उपयोग करूंगा जिसमें कुछ इंडेंटेड टेक्स्ट होगा।

उन सारांशों के बाद जो कई अनुभागों की शुरुआत करते हैं, मैं मुख्य अवधारणाओं पर विस्तार से चर्चा करूंगा। मैंने इन्हें यथासंभव संक्षिप्त रखा है, हालांकि, सच्चाई यह है कि कभी-कभी मैं अधिक बोल जाता हूं।

एक छोटा रूप जिसका मैं उपयोग करने जा रहा हूं वह है “चैट एआई”। जब OpenAI ने पहली बार ChatGPT जारी किया, तो यह अकेला था, लेकिन अब कई महत्वपूर्ण प्रतियोगी हैं। मैं जल्द ही विशिष्टताओं में जाऊंगा, लेकिन आपने इनमें से कुछ के बारे में पहले ही सुना होगा, जाहिर है Google और Microsoft। वे (और कई अन्य कंपनियाँ) अब ऑनलाइन एआई चैट सॉफ़्टवेयर पेश करते हैं जो ChatGPT के समान है। इसलिए “ChatGPT और इसके प्रतियोगियों” कहने के बजाय मैं पूरी श्रेणी को “चैट एआई” कहूंगा। यदि मैं “ChatGPT” लिखता हूं तो मैं विशेष रूप से OpenAI के सॉफ़्टवेयर का उल्लेख कर रहा हूं।

पुस्तक ज्यादातर व्यावहारिक है, लेकिन अंतिम खंड में मैं एआई का किताब प्रकाशन उद्योग पर वास्तविक दुनिया के परिणामों पर एक निबंध प्रस्तुत करता हूं, साथ ही कुछ अन्य कल्पनात्मक विचार भी।

यह किताब किसके लिए है?

इस पुस्तक का मुख्य दर्शक व्यापार (उपभोक्ता) पुस्तक प्रकाशक हैं। द्वितीयक दर्शक सभी अन्य पुस्तक प्रकाशक हैं (विद्वतापूर्ण, शैक्षिक…) जहां तक इन उद्योग क्षेत्रों में ओवरलैप्स हैं। मेरा तीसरा दर्शक वे लेखक हैं जिनका इस खेल में हिस्सा है, और कई अन्य लोग जो पुस्तक प्रकाशन से मोहित हैं।

उपशीर्षक बताता है कि यह लेखकों और प्रकाशकों दोनों के लिए एआई गाइड है। आंशिक रूप से ऐसा इसलिए है क्योंकि मैं चाहता हूं कि प्रकाशक भी यह समझें कि लेखक इस तकनीक का उपयोग कैसे कर रहे हैं। मुझे लगता है कि यह महत्वपूर्ण है। अपनी हाल की वार्षिक बैठक में, बीआईएसजी (पुस्तक उद्योग अध्ययन समूह), जो ज्यादातर व्यापार प्रकाशकों का प्रतिनिधित्व करता है, ने संकेत दिया कि “यह एक व्यापक पूल से, साहित्यिक एजेंटों और लेखकों सहित, खींचने के लिए देख रहा है।” यह एक स्वागत योग्य कदम है।

मैं चाहता हूँ कि लेखक इस पुस्तक को पढ़ें क्योंकि यह उन्हें समझने में मदद कर सकती है कि प्रकाशक उनके पांडुलिपियों के साथ क्या कर रहे हैं। स्व-प्रकाशित लेखक हमेशा पारंपरिक प्रकाशन पर एक नजर रखते हैं, आंशिक रूप से क्योंकि वे स्वयं, वास्तव में, प्रकाशक होते हैं, और इसलिए एआई तकनीक जो प्रकाशकों के लिए रुचिकर हो सकती है, उनके लिए भी रुचिकर हो सकती है।

लेकिन, कोई गलती न करें, यह लेखकों के लिए एआई का उपयोग करके बेहतर और अधिक उत्पादक लेखक बनने के लिए हाथ-से-हाथ कैसे-करने की पुस्तक नहीं है। उस विषय पर कई पुस्तकें हैं (दुख की बात है, उनमें से कई सिर्फ अमेज़न की नकली प्रतियां हैं)। और बहुत सारे यूट्यूब वीडियो (विभिन्न गुणवत्ता के) भी हैं।

व्यावसायिक पुस्तक प्रकाशन में मेरा आदर्श पाठक जरूरी नहीं कि निर्णय लेने वाला हो, बल्कि उन कई लोगों में से एक हो जो हर दिन उद्योग में काम करते हैं, किताबें बनाते हैं और पाठकों को ढूंढ़ते हैं। मैं इस पुस्तक में सभी प्रमुख प्रकाशन कार्यों के बारे में बात करूंगा, संपादकीय से लेकर बिक्री और वितरण तक। और लेखकों और पाठकों के बीच के संबंध के बारे में।

हालांकि मैं कनाडा में बड़ा हुआ और वहीं से अपने प्रकाशन करियर की शुरुआत की, मैं संयुक्त राज्य अमेरिका के सैन फ्रांसिस्को में स्थित हूँ, और इसलिए मैं स्वाभाविक रूप से अमेरिकी प्रकाशन उद्योग के बारे में सोचता हूँ। लेकिन इस पुस्तिका में लगभग हर चीज मैडागास्कर के प्रकाशक के लिए उतनी ही प्रासंगिक होनी चाहिए जितनी मैनहट्टन के प्रकाशक के लिए। जबकि छोटे देशों के प्रकाशकों को पैमाने की चुनौतियों का सामना करना पड़ता है, वैसे ही छोटे अमेरिकी प्रकाशकों को भी, और यह पुस्तक सभी आकार की कंपनियों के लिए है।

जब मैं छोटे प्रकाशकों से एआई के बारे में बात करता हूँ, और जब मैं बहुत बड़े प्रकाशकों से एआई के बारे में बात करता हूँ, तो मैं जो बड़ा अंतर नोटिस करता हूँ वह है ‘उद्यम’ का विचार। सबसे बड़े प्रकाशक अक्सर सार्वजनिक कंपनियों का हिस्सा होते हैं (या उनके आस-पास होते हैं), और एक बार जब आप एक सार्वजनिक कंपनी होते हैं, तो प्रतिष्ठा और सुरक्षा के मुद्दे रोजमर्रा के प्रकाशक की तुलना में, जो शेयरधारकों और समाचार मीडिया के प्रति उसी तरह जिम्मेदार नहीं होते, बहुत बड़े हो जाते हैं। जबकि एक बड़े 5 प्रकाशक का संपादक एआई उपकरणों का वही उपयोग करता है जैसे छोटे संगठनों के लिए काम करने वाला एक स्वतंत्र संपादक, उपकरणों का उपयोग करने का संदर्भ काफी अलग है।

इस पुस्तक को पढ़ने के लिए आपको एआई के बारे में कितना जानना चाहिए?

मैं मान रहा हूँ कि मेरे दर्शकों के पास एआई की आंतरिक जानकारी के बारे में लगभग शून्य ज्ञान है, लेकिन वे समझदार पाठक हैं। इसलिए मैं उस महीन रेखा पर चलूंगा जो शून्य ज्ञान और पाठक को नीचा दिखाने के बीच है।

मुझे लगता है कि लगभग हर किसी ने एआई की नई पीढ़ी के बारे में सुना है: मार्च 2024 में एक YouGov सर्वेक्षण में सुझाव दिया गया है कि केवल 7% अमेरिकी “एआई के बारे में बिल्कुल कुछ भी नहीं” जानते हैं। लेखकों और प्रकाशकों ने लगभग निश्चित रूप से कुछ कॉपीराइट शिकायतों के बारे में सुना है, लेकिन शायद मुद्दों की समझ नहीं है। तो मुझे यह समझाने की जरूरत नहीं है कि एआई का मतलब “कृत्रिम बुद्धिमत्ता” है। लेकिन मैं यह नहीं मानूंगा कि पाठक एआई क्या है, इसका क्या मतलब है, इसका संभावित प्रभाव, और इसी तरह की परिभाषा कर सकते हैं। यही कारण है कि आप यहाँ हैं।

पहुंच, व्यापक और विशिष्ट दोनों रूपों में

इस किताब के प्रकाशन के लिए मेरा मंत्र है ‘पहुंच।’

ज्यादातर लोगों के लिए, इसका मतलब केवल ‘उपलब्धता’ जैसा कुछ होता है, और, वास्तव में, मैं इस पुस्तक को जितने अधिक रूपों और स्वरूपों में उपलब्ध करा सकता हूं, उतने में उपलब्ध कराने का इरादा रखता हूं। मैं कंटेनर का विस्तार करना चाहता हूं। मैं अपनी किताब को एक उदाहरण प्रकाशन बनाने की कोशिश कर रहा हूं, जो यह दर्शाता है कि आज एक ही किताब को प्रकाशित करते समय क्या-क्या हासिल किया जा सकता है।

लीनपब पर आपको किताब पीडीएफ फाइल, एक ईपब फाइल और मुफ्त वेब-आधारित प्रकाशन के रूप में उपलब्ध मिलेगी। आपको प्रमुख एशियाई और यूरोपीय भाषाओं सहित 31 भाषाओं में अनुवाद मिलेंगे। प्रमुख भाषाओं में कई ऑडियोबुक्स भी होंगी।

मैं किताब को प्रिंट और डिजिटल स्वरूपों में, इंग्राम और अमेज़ॅन के माध्यम से एक्सेस किए जा सकने वाले सभी ईकॉमर्स प्लेटफार्मों पर भी उपलब्ध कराऊंगा। इसमें दुनिया के अधिकांश पुस्तक ऑनलाइन रिटेल साइट्स शामिल हैं। इस तरह पुस्तकालय भी इस पुस्तक को खरीद सकेंगे, हालांकि, समझदारी से, उनके पास स्व-प्रकाशित कार्यों के लिए थोड़ी सी जगह होती है। (मैं दुनिया के किसी भी पुस्तकालय को जो अनुरोध करता है, प्रिंट और डिजिटल प्रतियाँ दान करूंगा।)

पूरी पुस्तक के मुफ्त वेब संस्करण के अलावा, मैं मुफ्त अंश, एक प्रश्नोत्तर, और इन्फोग्राफिक्स बनाऊंगा, उनके लिए जो बस स्वाद या नमूना लेना चाहते हैं। वे मेरे ब्लॉग के माध्यम से उपलब्ध होंगे।

पूरी किताब का वीडियो रिकॉर्ड करना तब समझ में नहीं आता जब ऑडियोबुक्स उपलब्ध हैं। लेकिन कुछ लोग वीडियो के माध्यम से सामग्री का उपयोग करना पसंद करते हैं। तो मैं संक्षिप्त वीडियो संस्करण पेश करूंगा, कई लंबाई में।

और मानवीय स्पर्श का क्या? मैं वेबिनार्स या मेरी वेबसाइट और ब्लॉग के माध्यम से एक-से-एक ऑनलाइन परामर्श के माध्यम से भी उपलब्ध रहूंगा। मुझे व्यक्तिगत रूप से उपस्थित होने के लिए भी किराए पर लिया जा सकता है!

‘पहुंच’ का मतलब केवल इसकी शब्दकोश परिभाषा से कहीं अधिक है। जैसा कि कनाडाई राष्ट्रीय नेटवर्क फॉर इक्विटेबल लाइब्रेरी सर्विस (NNELS) के लोग कहते हैं, “एक पहुंच वाली किताब वह है जिसे हर कोई उपयोग और समझ सकता है।” और इसलिए मेरी अंग्रेजी ईपब फ़ाइल प्रिंट-अपंगों के लिए W3C 1.1 अनुशंसा को पूरा करती है, जिसमें छवियों के लिए मजबूत alt text विवरण शामिल हैं। हम उम्मीद करते हैं कि विदेशी भाषा अनुवादों के लिए भी इस पहुंच मानक को पूरा करेंगे।

alt-text को ChatGPT के साथ बनाया गया था। मैंने ChatGPT के संस्करण को संपादित नहीं किया, ताकि EPUB पढ़ने वाला कोई भी व्यक्ति देख सके कि यह कितना अच्छा है, और कहाँ यह अभी भी कमी है। जैसा कि मेरे सहयोगी, Bill Kasdorf मुझे याद दिलाते हैं, अच्छा alt-text यह वर्णन करता है कि एक दृष्टिहीन पाठक छवि से क्या प्राप्त करता है, न कि केवल यह क्या प्रतीत होता है।

पुस्तक प्रकाशकों के लिए, सुलभता अब कोई विकल्प नहीं है: यह एक डिफ़ॉल्ट सेटिंग है।

(मुझे साझा करने के लिए दो mea culpas हैं: प्रकाशन प्लेटफ़ॉर्म की सीमाओं के कारण, डिफ़ॉल्ट PDF फ़ाइल दुर्भाग्यवश PDF/UA विनिर्देश को पूरा नहीं करेगी, और न ही मैं ईकॉमर्स साइटों पर पुस्तक का बड़ा प्रिंट संस्करण प्रदान करने में सक्षम हूँ। लेकिन दोनों अनुरोध पर उपलब्ध हैं।)

कुछ हाउसकीपिंग

जैसा कि इंगित किया गया है, यह पुस्तक (सापेक्ष रूप से) छोटी है। जब आप एक छोटी सी दस्तावेज़ को ‘एक पुस्तक’ कहते हैं तो आप खरीदारों के विरोध का जोखिम उठाते हैं, “मुझे लगा कि मैं एक पुस्तक खरीद रहा था, लेकिन यह केवल 50 पृष्ठ लंबी है!” मैंने बिक्री पृष्ठ पर यह स्पष्ट करने के लिए सब कुछ किया है कि यह पूर्ण लंबाई की पुस्तक नहीं है, लेकिन यदि आप निराश हैं, तो ध्यान में रखें कि Leanpub 60-दिन की मनी-बैक गारंटी प्रदान करता है, और मैं खुशी-खुशी इस रिफंड ऑफ़र को ‘हमेशा के लिए’ बढ़ा दूँगा। मैं चाहता हूँ कि पाठक आनंदित हों, निराश नहीं। (यदि आपने पुस्तक को किसी अन्य प्लेटफ़ॉर्म पर खरीदा है, तो मुझे ईमेल करें: मैं चेक भेज दूँगा!)

पुस्तक में भारी हाइपरलिंक्ड हैं (ये अलग-अलग प्रारूपों में विभिन्न तरीकों से दिखाई देते हैं, लेकिन अक्सर टिप्पणियों के रूप में)। मैंने हमेशा अपने कार्य में मूल स्रोतों से लिंक करने में विश्वास किया है, ताकि पाठक मेरे कभी-कभी बड़े दावों को सत्यापित कर सकें। लेकिन मुझे पता है कि हाइपरलिंक और टिप्पणियाँ विचलित कर सकते हैं, विशेष रूप से यदि आप एक ई-रीडिंग डिवाइस का उपयोग कर रहे हैं। इसके लिए मैं क्षमा चाहता हूँ। सबसे अच्छा विकल्प यह है कि पढ़ते समय लिंक को नज़रअंदाज़ करें, और किसी विषय पर गहराई में जाने की इच्छा हो तो उन्हें बाद में देखें।

मुझे नहीं पता कि आप अभी किस प्रारूप में पढ़ रहे हैं (या सुन रहे हैं)। न ही किस भाषा में। मैंने पुस्तक की “अर्ग्नॉमिक्स” को यथासंभव उपयोगकर्ता के अनुकूल बनाने की कोशिश की है, लेकिन लिंक और टिप्पणियाँ हमेशा उस दृष्टिकोण से इष्टतम नहीं होते हैं।

इस पुस्तक के प्रायोजक हैं, जो कि मुझे पता है कि ‘एक पुस्तक’ के लिए असामान्य है। मैं अपने ‘disclosures’ अनुभाग में पाठ के अंत में प्रायोजन कैसे काम करता है, इसकी व्याख्या करता हूँ।

क्यों AI अब?

An icon of a key

जब मैं प्रकाशकों से बात करता हूँ, तो मैं तात्कालिक और महत्वपूर्ण चिंताओं के बारे में सुनता हूँ। और एआई आमतौर पर उनमें से एक नहीं है।

प्रिंट निर्माण की बढ़ती लागत कई वर्षों से परेशान कर रही है, हालांकि अब यह स्थिर होती दिख रही है। बढ़ती वितरण लागत सभी खिलाड़ियों के लिए चुनौतीपूर्ण है। ये मूल्य निर्धारण पर दबाव डालते हैं—ऐसे सबूत हैं कि पाठक नई हार्डकवर और ट्रेड पेपरबैक के वर्तमान मूल्य से असंतुष्ट होना शुरू कर रहे हैं। मैं इन्हें ‘एनालॉग’ समस्याओं के रूप में वर्गीकृत करता हूँ—डिजिटल तकनीकें इन्हें हल करने के लिए बहुत कम योगदान देती हैं।

फिर वहाँ व्यापक ‘अस्तित्वात्मक’ समस्याएँ हैं जो लगातार बढ़ती चिंता का कारण बन रही हैं, लेकिन वे अस्पष्ट मुद्दे हैं, जिनका कोई स्पष्ट समाधान नहीं है। इसमें शामिल हैं:

  • ऑनलाइन और सोशल मीडिया के माध्यम से सामग्री की खोज और दर्शकों की सहभागिता।

  • उपभोक्ता व्यवहार और पढ़ने की आदतों में परिवर्तन।

  • अन्य डिजिटल मीडिया से प्रतिस्पर्धा।

मेरा मानना है कि इन क्षेत्रों में एआई प्रकाशकों के लिए बेहद सहायक हो सकता है, लेकिन तरीके स्पष्ट नहीं हैं और इन्हें लागू करने में समय लगेगा। मैं इस पुस्तक के आगामी अध्यायों में इसका वर्णन करूंगा।

एआई: शुरुआत करना

तकनीकी पृष्ठभूमि में जाने से पहले, मैं आपको ऑनलाइन सॉफ़्टवेयर में सीधे कूदने के लिए आमंत्रित करता हूँ। शीर्ष उपकरण खेलने के लिए मुफ्त हैं। वहाँ ChatGPT है। और Claude.ai। आप Microsoft Copilot के साथ मजा कर सकते हैं। या Google’s Gemini को आजमा सकते हैं।

यही वह तरीका है जिससे अधिकांश लोग एआई के साथ शुरू करते हैं—मुझे यकीन है कि आपने पहले ही इनमें से एक या अधिक उपकरणों को आजमाया होगा। मुझे यह भी यकीन है कि आपने इन्हें बहुत लंबे समय तक नहीं आजमाया होगा। जिन अधिकांश लोगों से मैं बात करता हूँ, वे कुछ ही मिनट समर्पित करते हैं। वे कुछ प्रश्न आजमाते हैं, कुछ स्पष्ट उत्तर प्राप्त करते हैं, और वे आगे बढ़ जाते हैं।

गलत तरीका।

मैं एथन मोलिक के पक्ष में हूँ, जिनके कार्य का मैं इस पुस्तक में कई बार वर्णन करूंगा। अपने ब्लॉग और हाल ही के एक साक्षात्कार में, मोलिक ने अपनी ‘10 घंटे का नियम’ के बारे में बात की है:

“मैं यह संकेत देना चाहता हूँ कि 10 घंटे उतने ही मनमाने हैं जितने कि 10,000 कदम। जैसे, इसके लिए कोई वैज्ञानिक आधार नहीं है। यह एक अवलोकन है। लेकिन यह आपको उस स्थिति से आगे बढ़ाता है, जहां आपने इसे एक शाम के लिए आजमाया था, और यह आपको इसे गंभीरता से उपयोग करने की ओर ले जाता है। मुझे नहीं पता कि 10 घंटे वास्तविक सीमा है या नहीं, लेकिन यह कुछ हद तक परिवर्तनकारी लगता है। कुंजी इसे उस क्षेत्र में उपयोग करना है जहां आपकी विशेषज्ञता हो, ताकि आप समझ सकें कि यह किसमें अच्छा है या बुरा, और इसकी क्षमताओं के आकार को जान सकें।”

एक अन्य टिप्पणीकार, मोलिक की हाल की किताब पर एआई पर समीक्षा करते हुए, एक समान रूप से सही ‘दस का नियम’ बताते हैं: “इन उपकरणों के साथ एक घंटे का प्रयोग उनके बारे में पढ़ने के दस घंटे के बराबर है।”

आप समझ गए होंगे। यह करने के बारे में है, विचार करने के बारे में नहीं। मेरी किताब एक विचार है। आपको अपने हाथ गंदे करने की जरूरत है।

एआई: एक बहुत ही संक्षिप्त इतिहास

An icon of a key

कुछ साल पहले तक, आम आदमी ने एआई के बारे में केवल एक अमूर्तता के रूप में सुना था, या तो विज्ञान कथा के रूप में या कुछ ऐसा जो शतरंज या गो में एक ग्रैंडमास्टर को हरा सकता है। अचानक एआई हर जगह है, यह गलत धारणा पैदा कर रहा है कि यह नया है। यहां तक ​​कि नया सामान भी बिल्कुल नया नहीं है। लेकिन यह एक व्यर्थ बिंदु है। चैटजीपीटी से पहले पुस्तक प्रकाशन के लिए एआई का कोई खास मतलब नहीं था। अब इसका बहुत मतलब है।

एआई के लगभग 70 साल के विकास को समझना दिलचस्प हो सकता है, लेकिन यह बिल्कुल भी आवश्यक नहीं है कि आप आज जो हो रहा है उसकी सराहना करें।

Our World In Data ने संक्षेप में इतिहास दर्ज किया है—मैं इसे उनके ऊपर छोड़ दूंगा।

वर्तमान पीढ़ी की एआई ज्यादातर पिछले दशक में विकसित हुई थी। फिर, अचानक, 30 नवंबर, 2022 को चैटजीपीटी सामने आया। दो महीने बाद इसके 100 मिलियन मासिक उपयोगकर्ता थे, जो किसी भी तकनीक के उपभोक्ता क्षेत्र में प्रवेश करने का सबसे तेज़ तरीका था (तुलना के लिए, Facebook को 100 मिलियन उपयोगकर्ताओं तक पहुंचने में दो साल से अधिक समय लगा)।

तेजी से अपनाने का कारण क्या है? सबसे पहले, यह आकर्षक और मजेदार है। दूसरा, यह मुफ्त है। तीसरा, इसे उपयोग करने के लिए आपको एक नया उपकरण खरीदने की आवश्यकता नहीं है। और चौथा, आपको ChatGPT (या इसके चैट एआई प्रतिस्पर्धियों) तक पहुंचने के लिए किसी प्रशिक्षण की आवश्यकता नहीं है। लेकिन वही कारक Facebook पर भी लागू होते थे, तो चैटजीपीटी क्यों?

जैसा कि आर्थर सी. क्लार्क ने प्रसिद्ध रूप से कहा था, “कोई भी पर्याप्त उन्नत प्रौद्योगिकी जादू से अप्रभेद्य है।” चैट एआई जादू है। एक मशीन के साथ रोज़मर्रा की भाषा में ‘बातचीत’ का अनुभव… यह जादुई है। “मैं एक गुब्बारे में एक बादल के पास सूर्य के पास एक पुस्तक की छवि चाहता हूँ,” कहने का अनुभव, और, कुछ ही सेकंड बाद,

एक खुली किताब जिसमें से एक गर्म हवा का गुब्बारा उसके पन्नों से उभरता हुआ, बादलों के बीच तैरता हुआ।

… जादुई भी। GPT-जनित चित्र शैली में समान दिखने लगे हैं, रंगीन और कल्पनापूर्ण। तो मैंने एक दूसरा प्रॉम्प्ट भेजा “अब एक शैली में जो 15वीं सदी के चित्रण जैसा दिखता है।” और फिर:

बादलों के बीच एक सूरज के साथ, जटिल पैटर्न वाले एक गर्म हवा के गुब्बारे का कलात्मक चित्रण।

यदि मैं एक वीडियो चाहता हूँ जिसमें एक किताब गुब्बारे में हो और बादलों में सूरज के पास हो, तो चुनने के लिए दर्जनों से अधिक उपकरण हैं, और प्रेस्टो। और वीडियो के साथ एक संगीतमय साउंडट्रैक भी। खैर, यह कैसा लगता है? यह बिल्कुल जादू जैसा है।

AI की असाधारण क्षमताओं को समझने में असमर्थता से इसे “जादू” की श्रेणी में रखने के भय के बावजूद, यह जानना मजेदार है कि वर्तमान पीढ़ी की AI के लिए जिम्मेदार कई वैज्ञानिक स्वीकार करते हैं कि वे वास्तव में नहीं समझते कि यह कैसे काम करता है। जैसा कि MIT Technology Review के हाल के अंक में एक रिपोर्ट में उल्लेख किया गया है, “सभी इसकी अद्भुत सफलता के बावजूद, कोई भी ठीक से नहीं जानता कि यह कैसे—-या क्यों—-काम करता है।” रोमांचक, लेकिन थोड़ा डरावना।

AI को समझना और कुछ प्रमुख शब्दावली

An icon of a key

AI कई तकनीक और शब्दावली के साथ आता है, जिनमें से अधिकांश केवल डेटा वैज्ञानिकों के लिए ही समझने योग्य है। Chat AI के उपयोगकर्ताओं को AI शब्दावली या संबंधित तकनीकी अवधारणाओं का गहन ज्ञान आवश्यक नहीं है। सिस्टम की संवादात्मक प्रकृति विशिष्ट पृष्ठभूमि ज्ञान के बिना सहज बातचीत की अनुमति देती है कि चीजें कैसे काम करती हैं। इस पर ध्यान केंद्रित करना अधिक महत्वपूर्ण है कि Chat AI वास्तव में क्या कर सकता है।

इस पुस्तक को तैयार करने में मैंने एक लेखक के रूप में ‘जिम्मेदार’ क्या है, इस पर संघर्ष किया है। पारंपरिक दृष्टिकोण विज्ञान की एक संक्षिप्त व्याख्या और अक्सर उपयोग किए जाने वाले शब्दों की समीक्षा प्रदान करना है।

मैं ऐसा नहीं करने जा रहा हूँ।

मैं यहाँ कुछ बाहरी लिंक की पेशकश करने जा रहा हूँ जो मुझे लगता है कि AI की मूल बातों की कुछ समझने योग्य संक्षिप्त व्याख्याएँ हैं।

AI का भविष्य क्या है?: McKinsey & Co. (अप्रैल, 2024) के पास अच्छे सेट के वर्णनकर्ता हैं।

इसी प्रकार गार्टनर का जनरेटिव एआई (तिथि नहीं दी गई) बुरा नहीं है।

फ्यूचरपेडिया एआई फंडामेंटल्स (मई, 2024) का एक अच्छा सारांश प्रदान करता है।

कैसे करना है, इस पर निपटने के बाद, अब मैं कुछ शब्दों का परिचय देने जा रहा हूँ जो मुझे लगता है कि समझने के लिए मूल्यवान हैं। ऐसा नहीं है कि आपको सॉफ़्टवेयर का उपयोग करने के लिए इन्हें जानने की आवश्यकता है। केवल यह कि इस शब्दावली का सेट यह बताता है कि वर्तमान पीढ़ी का एआई वास्तव में कैसे काम करता है।

इन शब्दों और अवधारणाओं को समझाने के लिए मेरा उपयोग मामला लेखक और प्रकाशक हैं जो (i) किसी भी कारण से एआई पर गहराई से जानना चाहते हैं, या (ii) एआई की वर्तमान आलोचनाओं के संदर्भ को समझना चाहते हैं, या (iii) यह समझना चाहते हैं कि उनके सहयोगियों या संगठनों को एआई के प्रति कैसे दृष्टिकोण अपनाना चाहिए।

दूसरे शब्दों में, यह वह नहीं है जो आपको जानना आवश्यक है, बल्कि वह है जो आप जानना चाह सकते हैं। यहाँ वे हैं, गैर-वर्णानुक्रमिक क्रम में:

प्रॉम्प्ट और प्रॉम्प्टिंग

आप चैट एआई सॉफ़्टवेयर खोल सकते हैं और बस एक प्रश्न टाइप कर सकते हैं, बिल्कुल वैसे ही जैसे आप वर्तमान में गूगल पर करते हैं।

बड़े भाषा मॉडल (एलएलएम)

बड़े भाषा मॉडल विशाल मात्रा में (मुख्य रूप से) लिखित सामग्री का विश्लेषण करके काम करते हैं, जिससे उन्हें यह भविष्यवाणी करने की अनुमति मिलती है कि बातचीत या लेखन के एक टुकड़े में अगला शब्द या वाक्य क्या होना चाहिए। वे मानव अर्थ में भाषा को ‘समझते’ नहीं हैं, बल्कि पाठ को छोटे टुकड़ों में विभाजित करके (जिन्हें टोकन कहा जाता है) और फिर टोकन को संख्याओं में परिवर्तित करके इसे संसाधित करते हैं। वे पाठ को संख्याओं के रूप में संसाधित करते हैं, और फिर अधिक संख्याओं को पुन: उत्पन्न करते हैं, जिन्हें फिर आउटपुट पर पाठ में परिवर्तित कर दिया जाता है। यह इस बात का अत्यधिक सरलित स्पष्टीकरण है कि चैट एआई ‘कॉपीराइटेड’ कार्य को क्यों नहीं ‘रखता’: यह उन संख्याओं से निर्मित है जो अंतर्निहित पाठों से एक विशाल अमूर्तता का प्रतिनिधित्व करती हैं।

एलएलएम को सिखाया जाता है कि सामान्यत: भाषा का उपयोग कैसे किया जाता है और फिर इस समझ के आधार पर प्रतिक्रियाएँ उत्पन्न होती हैं। हम सामान्यतः यह कम आंकते हैं कि अधिकांश भाषा कितनी पूर्वानुमेय होती है। चैट एआई ऐसा पाठ उत्पन्न कर सकता है जो (कभी-कभी चौंकाने वाले रूप से) मौजूदा साहित्य के समान होता है, लेकिन, डिज़ाइन द्वारा, इसमें विशिष्ट अंशों या कॉपीराइट किए गए पाठों की प्रतियों को पुनः प्राप्त करने की क्षमता नहीं होती है। (मुझे पता है, आप में से कई लोगों ने न्यू यॉर्क टाइम्स द्वारा ओपनएआई के खिलाफ मुकदमे के बारे में सुना होगा—टाइम्स चैटजीपीटी से कुछ पूर्व-प्रकाशित लेखों के हिस्सों को हूबहू पुनः प्रस्तुत करने में सक्षम था।)

जनरेटिव एआई

इस शब्द को समझने के लिए सबसे महत्वपूर्ण बात “जनरेटिव” भाग है। जनरेटिव एआई नया पाठ उत्पन्न करता है।

जनरेटिव प्री-प्रशिक्षित ट्रांसफार्मर (GPT)

यह यहाँ की सबसे तकनीकी शब्दावली है, जो OpenAI द्वारा विकसित एक विशिष्ट प्रकार के बड़े भाषा मॉडल का वर्णन करता है। “जनरेटिव” इसके पाठ उत्पन्न करने की क्षमता को इंगित करता है, “प्री-प्रशिक्षित” यह संकेत करता है कि इसे एक बड़े पाठ डेटा पर प्रशिक्षित किया गया है, और “ट्रांसफार्मर” उस सॉफ़्टवेयर को संदर्भित करता है जिसका यह उपयोग करता है। यह जानना उपयोगी है कि GPT का मतलब क्या है ताकि आप समझ सकें कि ChatGPT में GPT क्या दर्शाता है।

ChatGPT

ChatGPT वह सॉफ़्टवेयर है जिसे आप देखते हैं; GPT वह है जो सॉफ़्टवेयर के पीछे है। उपयोगकर्ता ChatGPT का अनुभव करते हैं, न कि उसके पीछे के GPT का। जैसा कि ऊपर बताया गया है, ChatGPT कई ऑनलाइन चैट एआई सॉफ़्टवेयर प्रणालियों में से एक है, जिनका समान कार्यक्षमता है।

एक और शब्द जो आपको अक्सर मिलेगा और कई लोगों के लिए अपरिचित है:

संग्रह

शब्दकोश परिभाषा के अनुसार संग्रह का अर्थ है “लिखित पाठों का संग्रह” (हालाँकि, वास्तव में, यह हमेशा पाठ नहीं होता)। इस शब्द का उपयोग GPTs को प्रशिक्षित करने के लिए किया जाता है: विशाल (मुख्यतः) पाठ संग्रह। हमें बताया गया है कि सबसे बड़े संग्रह में सैकड़ों अरबों शब्द होते हैं। साधारण मनुष्यों के लिए यह समझना असंभव है। क्या आपको विकिपीडिया को विशाल नहीं लगता, जिसमें बहुत सारे शब्द होते हैं? खैर, विकिपीडिया में मात्र 4.5 अरब शब्द हैं—GPT-4 को एक ट्रिलियन से अधिक शब्दों पर प्रशिक्षित किया गया था।

मुझे लगता है कि इस पैमाने पर विचार करना महत्वपूर्ण है। लेखक, स्वाभाविक रूप से, चिंतित हैं कि उनके पुस्तक के 75,000 शब्द, प्लस या माइनस, बड़े भाषा मॉडल में समा सकते हैं। शायद वे समा सकते हैं (नीचे और अधिक)। लेकिन अगर ऐसा है, तो विचार करें कि आज के बड़े भाषा मॉडलों की कुल शक्ति के लिए किसी एक पुस्तक का कितना कम मूल्य है। यह वास्तव में नगण्य है। नगण्य से भी कम। यहाँ तक कि 10,000 किताबें भी बहुत कम हैं।

एआई सॉफ़्टवेयर: सिस्टम हेवीवेट्स

An icon of a key

मैंने ऊपर चार चैट एआई हेवीवेट्स को सूचीबद्ध किया है: ChatGPT, Claude.ai, Microsoft Copilot और Google Gemini।

वे सभी लगभग एक ही तरह से काम करते हैं और समान परिणाम देते हैं। तो कौन सा सबसे अच्छा है? यह सवाल आपको एक गहरे रास्ते पर ले जाता है। यह पूछने जैसा है कि कौन सा शहर सबसे अच्छा समुद्र तट अवकाश प्रदान करता है, या कौन सा एसयूवी परिवारों के लिए सबसे अच्छा है। यहाँ मुद्दों में बहुत सी बारीकियाँ हैं और हमारे उत्तरों को बहुत सारा गर्व और पूर्वाग्रह फ़िल्टर करता है।

इसी प्रकार इस सादे दिखने वाले लेकिन अत्यंत जटिल सॉफ़्टवेयर के साथ भी है। लोग तर्क करते हैं कि क्लॉड की भाषा के साथ अधिक सूक्ष्म कौशल हैं, और चैटजीपीटी सॉफ़्टवेयर कोड के साथ बेहतर है। माइक्रोसॉफ्ट कोपायलट माइक्रोसॉफ्ट सॉफ़्टवेयर सूट के साथ एकीकृत होता है। गूगल जेमिनी जीमेल, गूगल मैप्स और यूट्यूब में प्लग कर सकता है। कुछ अंतर महत्वपूर्ण हैं; कई मामूली हैं। और वे प्रत्येक नए सॉफ़्टवेयर रिलीज़ के साथ लगातार बदलते रहते हैं।

An icon of a key

‘सबसे अच्छा’ सॉफ़्टवेयर अभी कुछ समय के लिए तय नहीं होगा। यदि आप उपलब्ध उपकरणों में से पर्याप्त प्रयोग करते हैं, तो आप कुछ पसंदीदा चुन लेंगे।

एआई सॉफ़्टवेयर के दो शीर्ष स्तर हैं। पहला वह है जिसे मूलभूत सॉफ़्टवेयर कहा जा सकता है, जैसे चैटजीपीटी और इसके प्रतिस्पर्धी (चैट एआई)। आज ज्यादातर लोग इस तरह एआई का अनुभव करते हैं।

अगला स्तर वह सारा सॉफ़्टवेयर है जो मूलभूत सॉफ़्टवेयर की मूल रूप से एक खिड़की प्रदान करता है। एआई चैट के नए आगंतुकों ने ज्यादातर इस सॉफ़्टवेयर का सामना नहीं किया है, हालांकि यह दुर्लभ या अस्पष्ट नहीं है। कुछ जैस्पर (मार्केटिंग सॉफ़्टवेयर) या पेर्प्लेक्सिटी (खोज) से परिचित हैं। यह सॉफ़्टवेयर चैटजीपीटी और इसके समकक्षों के बिना बस अस्तित्व में नहीं होता।

ध्यान रखें कि एडोब, माइक्रोसॉफ्ट, ग्रामरली, जूम, आदि जैसे मुख्यधारा के सॉफ़्टवेयर अब एआई उपकरणों को शामिल करते हैं, लेकिन यह चैटबॉट इंटरफेस के आधार पर शुरू से निर्मित सॉफ़्टवेयर से अलग है। (अन्य जैसे ओटर (प्रतिलेख) चैटजीपीटी से पहले के हैं लेकिन अब बड़े भाषा मॉडल तकनीक से प्रभावित हैं।)

नीचे हम प्रकाशन-विशिष्ट सॉफ़्टवेयर को देखेंगे जो जनरेटिव एआई की क्षमताओं का लाभ उठाता है।

सॉफ़्टवेयर प्रतिमान

बहुत पहले जब सॉफ़्टवेयर कोड था और केवल इंजीनियर ही समझते थे कि यह कैसे काम करता है। व्यक्तिगत कंप्यूटरों की सफलता का कारण, उनकी तुलनात्मक रूप से कम लागत के अलावा, सॉफ़्टवेयर था जो (तुलनात्मक रूप से) उपयोग में आसान था। हम इसके बारे में ज्यादा नहीं सोचते; यह बस हमें घेरे रहता है।

लेकिन, एक पल के लिए, माइक्रोसॉफ्ट वर्ड पर विचार करें, एक प्रोग्राम जिसे मैं सुरक्षित रूप से कह सकता हूं कि इस पुस्तक के 99% पाठकों द्वारा उपयोग किया जाता है। वर्ड में टेक्स्ट का एक पैराग्राफ लिखना सिखाने में लगभग 10 मिनट लगते हैं। फिर आप उन्हें बोल्ड टेक्स्ट कैसे बनाएं, और इटैलिक्स, और बेस फॉन्ट को बदलना सिखा सकते हैं, शायद कैलिब्री से एरियल या टाइम्स रोमन में। फिर, फ़ाइल को कैसे सेव करें और फ़ाइल को प्रिंट करें। खोज और प्रतिस्थापन कैसे करें।

और फिर आप उन्हें अपने हाल पर छोड़ देते हैं।

सालों बाद आपको पता चलता है कि वे अभी भी अपने वर्ड पैराग्राफ को स्पेस और टैब के साथ फॉर्मेट कर रहे हैं। और अभी भी अपनी फ़ाइलों को सेव करना भूल जाते हैं, या किस संस्करण को सेव किया है इस बारे में भ्रमित हो जाते हैं, कभी-कभी टेक्स्ट को फिर से बनाना पड़ता है। लेकिन वे “वर्ड का उपयोग करना जानते हैं।”

Word में सैकड़ों विशेषताएँ हैं, लेकिन उपयोगकर्ता एक तिहाई समय में केवल 5 कमांड का उपयोग करते हैं: चिपकाएँ, सहेजें, कॉपी करें, पूर्ववत करें और बोल्ड। Word की उन्नत विशेषताओं को सही से सीखने में कई सप्ताह लगते हैं; ऐसी विशेषताएँ जो एक प्रकाशक को कई सैकड़ों घंटे बचाने में मदद कर सकती हैं। लेकिन अधिकतर लोग ऐसा कभी नहीं करते। मैं 1985 से Word का उपयोग कर रहा हूँ, लगभग चालीस सालों से, और मैंने कभी कोई कोर्स नहीं किया। मुझे यह भी नहीं पता कि मैं सॉफ़्टवेयर की पूरी शक्ति को कैसे निकालूं।

मैं इस बारे में इसलिए बात कर रहा हूँ क्योंकि यह समझने में मदद करता है कि AI सॉफ़्टवेयर किसी भी सॉफ़्टवेयर से बहुत अलग क्यों है जिसका आपने अब तक उपयोग किया है। यह किसी मैनुअल के साथ नहीं आता है, यहां तक कि एक त्वरित प्रारंभ गाइड भी नहीं। यह एक खाली स्क्रीन और एक प्रश्न के साथ आता है: “मैं आपकी किस प्रकार मदद कर सकता हूँ।”

थेडियस को संबोधित एक वार्तालाप AI इंटरफ़ेस पर एक स्वागत संदेश, यह पूछते हुए कि यह कैसे मदद कर सकता है।

यहां कोई मेनू बार नहीं है, कोई बटन नहीं है, कोई कीबोर्ड शॉर्टकट नहीं है। आप एक प्रश्न पूछते हैं, एक चैट शुरू करते हैं, और आपको कुछ उत्तर मिलते हैं।

एक वार्तालाप AI इंटरफ़ेस जिसमें उपयोगकर्ता इनपुट पूछता है कि नई पीढ़ी के वार्तालाप AI और पारंपरिक उपकरण जैसे Microsoft Word या Excel के बीच अंतर कैसे समझाएं।

Claude का उत्तर:

“मेरे जैसे आधुनिक वार्तालाप AI के साथ काम करने और Microsoft Word या Excel जैसे पारंपरिक उपकरणों के साथ काम करने के बीच कई महत्वपूर्ण अंतर हैं:

“1. प्राकृतिक भाषा परस्पर क्रिया: वार्तालाप AI के साथ, आप अपनी मंशा को रोजमर्रा की भाषा का उपयोग करके संप्रेषित कर सकते हैं बजाय इसके कि आपको जटिल मेनू और कार्यों को सीखना और नेविगेट करना पड़े। आप बस बातचीत में समझाते हैं कि आप क्या हासिल करना चाहते हैं।

“2. संदर्भात्मक समझ: AI सहायक संदर्भ बनाए रखते हैं और बातचीत के प्रवाह को समझते हैं, जिससे अधिक स्वाभाविक बातचीत संभव होती है। पारंपरिक सॉफ़्टवेयर में एक कमांड से दूसरे तक कोई संदर्भात्मक जागरूकता नहीं होती।

“3. अनुकूलनशीलता: AI विभिन्न प्रकार के अनुरोधों को गतिशील रूप से अनुकूलित और प्रतिक्रिया दे सकता है, जबकि पारंपरिक उपकरण एक परिभाषित कार्यों के सेट तक सीमित होते हैं। एक AI सहायक लेखन, विश्लेषण, गणित, कोडिंग, विचार-निर्माण, और अधिक में एक ही इंटरफ़ेस के भीतर मदद कर सकता है।”

यह उपयोगी था, लेकिन मैं कुछ और आसान समझना चाहता था। इसलिए मैंने पूछा:

एक उपयोगकर्ता का बातचीत एआई इंटरफ़ेस पर सरल स्पष्टीकरण मांगा।

Claude:

“यहाँ तकनीकी पृष्ठभूमि के बिना किसी को अंतर समझाने का एक सरल तरीका है:

“पारंपरिक सॉफ़्टवेयर को माइक्रोसॉफ्ट वर्ड या एक्सेल जैसे उपकरण के रूप में सोचें, जैसे हथौड़ा या कैलकुलेटर। इसमें एक निश्चित सेट की कार्यक्षमताएँ होती हैं जिन्हें करने के लिए आपको इसे सही तरीके से उपयोग करना सीखना होता है।

“दूसरी ओर, आधुनिक वार्तालाप एआई को एक स्मार्ट सहायक के रूप में सोचें, जैसे एक जानकार सहयोगी या मित्र। आप इसे सामान्य अंग्रेज़ी में बात कर सकते हैं, और यह समझता है कि आप क्या करने की कोशिश कर रहे हैं। यह आपको लेखन से लेकर गणित तक और विचारों को उत्पन्न करने तक में मदद कर सकता है।

“आपको कोई विशेष कमांड या तकनीक सीखने की आवश्यकता नहीं है—बस इसके साथ स्वाभाविक रूप से बात करें। यह आपकी आवश्यकताओं के अनुसार अनुकूलित होता है और आपकी बातचीत के संदर्भ को याद रखता है। समय के साथ, यह आपको और आपकी प्राथमिकताओं को जानता है।

“तो जहाँ पारंपरिक सॉफ़्टवेयर एक स्थिर उपकरण की तरह है जिसे आप उपयोग करते हैं, वार्तालाप एआई एक बुद्धिमान साथी की तरह है जिसके साथ आप स्वाभाविक रूप से बातचीत करके काम करते हैं। यह काम करने का एक अधिक लचीला, व्यक्तिगत और कुशल तरीका है।”

हम्म। यह बिल्कुल वही नहीं था जो मैं चाहता था। इसलिए मैंने बातचीत जारी रखी:

एक बातचीत एआई प्रतिक्रिया जो तकनीकी शब्दजाल और गैर-तकनीकी लोगों से संबंधित संदर्भों से बचने की सलाह देती है।

Claude:

“ज़रूर, मुझे तकनीकी शब्दों का उपयोग किए बिना फिर से कोशिश करने दें:

“कल्पना करें कि आप एक मित्र से बात कर रहे हैं जो वास्तव में जानकार और आपकी मदद करने के लिए उत्सुक है। आप बस सामान्य अंग्रेज़ी में उनसे बात कर सकते हैं कि आप क्या करने की कोशिश कर रहे हैं, चाहे वह निबंध लिखना हो, गणित की समस्या को हल करना हो, या किसी परियोजना के लिए विचार उत्पन्न करना हो।

“कई विशिष्ट चरणों या कमांड्स को सीखने और याद रखने की बजाय, आप बस अपने शब्दों में समझा सकते हैं कि आपको क्या चाहिए। आपका मित्र संदर्भ को समझता है और पहले से चर्चा की गई बातों के आधार पर अपनी मदद को अनुकूलित करता है।

“यह एक आगे और पीछे की बातचीत है, जहाँ आप प्रश्न पूछ सकते हैं, चीजों को स्पष्ट कर सकते हैं, और सलाह प्राप्त कर सकते हैं। और जितना अधिक आप इस मित्र से बात करते हैं, उतना ही बेहतर वे आपकी अद्वितीय आवश्यकताओं और संचार शैली को समझते हैं।

“अब, कल्पना करें कि यदि आप उसी प्रकार की सहायक, आसान बातचीत कर सकते हैं, लेकिन एक कंप्यूटर प्रोग्राम के साथ। यही वह बुनियादी विचार है जो नए प्रकार के सॉफ़्टवेयर के पीछे है जिसके बारे में आप सुन सकते हैं।

“पुराने सॉफ़्टवेयर के बजाय, जहाँ आपके पास कार्यों का एक कठोर सेट होता है और आपको इसे उपयोग करने का सही तरीका सीखना पड़ता है, यह नया सॉफ़्टवेयर एक जानकार दोस्त की तरह है। आप इसे बस बातचीत की तरह बात कर सकते हैं और यह आपकी चर्चा के प्राकृतिक प्रवाह के आधार पर आपकी सहायता करने का तरीका निकाल लेता है।

“तो यह आपके कंप्यूटर पर सभी प्रकार के कार्यों के साथ सहायता प्राप्त करने का एक अधिक स्मार्ट, अधिक व्यक्तिगत और आसान तरीका है, बस उससे बात करके जैसे आप किसी व्यक्ति से बात करेंगे। यही पुरानी, कठोर शैली के सॉफ़्टवेयर से मुख्य अंतर है।”

सारांश: मैं इन उदाहरणों के साथ दो चीजें करने की कोशिश कर रहा था। एक था यह दिखाना कि चैटबॉट सॉफ़्टवेयर क्यों अब तक के किसी भी सॉफ़्टवेयर से इतना अलग है। और दूसरा था यह दर्शाना कि एक ही चैट कैसे विकसित हो सकती है। यह केवल एक सवाल और एक जवाब नहीं है। यह एक बातचीत है। यह एक बड़ी सफलता का हिस्सा है।

चैट एआई किसी प्रकार के इंटर्न और जानकार सलाहकार का मिश्रण होते हैं। आप यह मानकर नहीं चल सकते कि वे जानते हैं कि आपका मतलब क्या है। आपको यह समझाना होगा कि आप क्या चाहते हैं, क्यों चाहते हैं, और वे कैसे सबसे अधिक सहायक हो सकते हैं।

तीन प्रकार के एआई सॉफ़्टवेयर

An icon of a key

व्यापक तौर पर, आज तीन प्रकार के एआई सॉफ़्टवेयर उपलब्ध हैं। पहला है एआई आधारभूत प्लेटफ़ॉर्म, जैसे कि ChatGPT, मुख्य एआई तकनीक। दूसरा है, इसे हम एआई ऐड-ऑन कह सकते हैं, सॉफ़्टवेयर जिसे मुख्य प्लेटफ़ॉर्म पर नए सिरे से बनाया गया है। आप इनमें से कई के बारे में नहीं सुने होंगे, जैसे कि Jasper या Rewind।

मेरी तीसरी श्रेणी है सॉफ़्टवेयर जिसमें मौजूदा उत्पाद पर एआई उपकरण जोड़े गए हैं। उदाहरण के लिए, माइक्रोसॉफ्ट सॉफ़्टवेयर सूट में वर्ड, एक्सेल और पावरपॉइंट में नए एआई उपकरण हैं। एडोबी ने फ़ोटोशॉप और एक्रोबैट में एआई तकनीक जोड़ी है। ग्रामरली को नई पीढ़ी की LLM-आधारित तकनीक के चारों ओर पुनर्निर्मित किया जा रहा है। यह ज्यादातर वही उत्पाद है, लेकिन इसमें एआई जोड़ा गया है।

यह स्पष्ट होता जा रहा है कि आप आज जो भी सॉफ़्टवेयर उपयोग करते हैं उनमें से लगभग सभी में जल्द ही एआई सुविधाएँ शामिल होंगी। आपको यह आकलन करना होगा कि वे उपकरण वास्तव में उपयोगी हैं या केवल एआई का दिखावा।

मैं नए उपकरणों में अधिक रुचि रखता हूँ, जो केवल एआई द्वारा उत्पन्न मूल्य प्रदान करने के लिए जमीन से ऊपर बनाए गए हैं। यही अगली पीढ़ी का सॉफ़्टवेयर है।

एआई सॉफ़्टवेयर के साथ काम करना

मैं एक विंडोज़ उपयोगकर्ता हूँ, दुर्भाग्यवश (यह एक लंबी कहानी है क्यों), और इसलिए मैं विंडोज़ कंप्यूटर के माध्यम से एआई सॉफ़्टवेयर तक पहुँचने के अपने अनुभवों के बारे में बात कर रहा हूँ, न कि मैक के बारे में। क्योंकि यहाँ का सारा सॉफ़्टवेयर ब्राउज़र-आधारित है, इसलिए इन टूल्स का उपयोग मैक पर करने में कोई अंतर नहीं होना चाहिए। लेकिन मैं कोई गारंटी नहीं देता।

एआई खेल खेलने के लिए आपको कुछ पैसे की आवश्यकता होगी, लेकिन बहुत ज्यादा नहीं। जैसा कि ऊपर वर्णित है, बहुत सा बुनियादी सॉफ़्टवेयर नि:शुल्क संस्करणों के माध्यम से एक्सेस किया जा सकता है। लेकिन आप आमतौर पर परीक्षण करते समय एक सशुल्क सदस्यता चाहेंगे, और सदस्यता लगभग $20/महीना होनी चाहिए। इसे आज़माने के बाद रद्द कर दें (भूलें नहीं!)। यदि आप कुछ ऐसा देखते हैं जो $79/महीना या, भगवान न करे, $159/महीना है, तो आप इसे अनदेखा कर सकते हैं। वे आपको संभावित उपयोगकर्ता के रूप में नहीं सोच रहे हैं; वे बड़े मुख्यधारा के कॉर्पोरेट उपयोगकर्ताओं के बारे में सोच रहे हैं।

चैट एआई के लिए प्रशिक्षण

An icon of a key

आज की एआई धोखा देने वाली सरल है। कोई भी जो एक प्रश्न टाइप कर सकता है, इसका उपयोग कर सकता है। लेकिन इसका अच्छी तरह से उपयोग करना जटिल है, जो कोई स्पष्ट समझ नहीं बनाता है, जब तक कि आप “प्रांप्ट्स” और संबंधित अवधारणाओं की जटिलताओं में नहीं उतरते।

कभी-कभी इसकी बुद्धिमत्ता तक पहुँचने के लिए आपको इससे बात करनी पड़ती है जैसे कि यह एक मूर्ख हो। या शायद एक मूर्ख विद्वान। यह थोड़ा डस्टिन हॉफमैन द्वारा रेन मैन में निभाए गए चरित्र की तरह है।

कोई भी चैटजीपीटी का उपयोग कर सकता है। बस chat.openai.com पर जाएं और आप सबसे हाल के संस्करण, GPT-4o को मुफ्त में एक्सेस कर सकते हैं (कुछ प्रीमियम सुविधाएँ उपलब्ध हैं अतिरिक्त $20/महीना के लिए)।

जब आप चैटजीपीटी पर जाते हैं तो आपको मूल रूप से एक खाली स्क्रीन मिलती है और निहित प्रश्न “मैं आज आपकी कैसे मदद कर सकता हूँ?”

आप इससे प्रश्न पूछ सकते हैं। और भी बेहतर, आप एक बड़ा पीडीएफ अपलोड कर सकते हैं और फ़ाइल से प्रश्न पूछ सकते हैं। आप छवियाँ भी अपलोड कर सकते हैं, जिन्हें यह वर्णन कर सकता है, या एक स्कैन किया गया पृष्ठ: यह पाठ को पहचान सकता है, भले ही हस्तलिखित हो।

चैट एआई के सफल उपयोग के लिए एक महत्वपूर्ण मुद्दा यह उभर कर आया है कि ‘बातचीत’ कैसे की जाए (जो आप वास्तव में नवीनतम मोबाइल ऐप संस्करण में कर सकते हैं)। चैट एआई-ईज़ में इसे “प्रांप्ट्स” या “प्रांप्टिंग” बनाना कहा जाता है। उपयोगकर्ताओं ने खोजा है कि जितने सटीक और विस्तृत उनके प्रांप्ट्स होते हैं, उतने बेहतर उत्तर उन्हें चैटजीपीटी से प्राप्त होते हैं। इसके अलावा, प्रांप्ट्स सिर्फ एक बार के लिए नहीं होते हैं। चैट एआई थोड़ी देर (हालांकि अनिश्चितकाल तक नहीं) के लिए बातचीत जारी रख सकता है, और यदि आपको वह उत्तर नहीं मिलता जो आप ढूंढ रहे हैं तो आप अपने प्रांप्ट्स को संशोधित और परिष्कृत कर सकते हैं। इसमें बहुत अधिक आदत लगती है, और उपयोगकर्ताओं को प्रांप्टिंग का अधिकतम लाभ कैसे उठाया जाए, इस पर प्रशिक्षण देने के लिए एक श्रृंखला के रूप में कैसे-कैसे गाइड, लिखित और ऑनलाइन, उत्पन्न हुए हैं।

चैट एआई सॉफ़्टवेयर में से किसी एक से विकासात्मक संपादन जैसी अवधारणा को समझाने के लिए कहें। फिर उससे एक ऐसा स्पष्टीकरण तैयार करने के लिए कहें जो 12 साल के बच्चे को समझ में आ सके। परिणाम नाटकीय रूप से भिन्न होते हैं। मजेदार बात यह है कि चैट एआई भावनात्मक अपीलों का भी जवाब देता है। किसी प्रॉम्प्ट में “यह मेरे करियर के लिए बहुत महत्वपूर्ण है” जोड़ने से अधिक उपयोगी उत्तर मिल सकते हैं।

(यह एक उपयुक्त समय है कि एक पेरेंटथेटिकल जोड़ें: यह न केवल आश्वस्त करने वाला है बल्कि गहराई से परेशान करने वाला भी है कि भाषा-आधारित एआई पर काम करने वाले शीर्ष वैज्ञानिक यह समझाने में असमर्थ हैं कि इस तरह की चीजें क्यों होती हैं।)

प्रॉम्प्ट कैसे करें

An icon of a key

“प्रॉम्प्टिंग” एक विशिष्ट कौशल है जो चैट एआई का प्रभावी ढंग से उपयोग करने के लिए आवश्यक है।

एआई गोल्ड-रश के दौरान अपनाई गई विभिन्न सह-अपनाई गई शब्दावली में, “प्रॉम्प्ट” और “प्रॉम्प्टिंग” सर्वोत्तम में से हैं। आप वास्तव में चैट एआई से “बात” नहीं करते। आप इसे प्रश्न “पूछते” नहीं हैं (या, आपको नहीं करना चाहिए - यह कैसे काम करता है)। आप इन इंजनों को प्रतिक्रियाओं के लिए प्रॉम्प्ट करते हैं, सरल उत्तरों के लिए नहीं।

पहले मुझे लगा कि एक उपमा हो सकती है थियेट्रिकल प्रॉम्प्ट की। प्रॉम्प्टर एक अभिनेता को प्रेरित करता है जो एक पंक्ति का ट्रैक खो देता है, जिससे वे कार्रवाई में वापस कूद जाते हैं। लेकिन यह सटीक नहीं है क्योंकि एआई प्रॉम्प्ट एक याद किए गए पाठ का हिस्सा नहीं खोलता है - यह जनरेटिव एआई कैसे काम करता है। एक एआई इंजन को बार-बार एक ही प्रॉम्प्ट दें, और उत्तर हमेशा कम से कम थोड़े अलग होंगे।

अभी मैंने चैटजीपीटी से “प्रभावी प्रॉम्प्टिंग के प्रमुख तत्वों की सूची” मांगी। मैंने दूसरी बार पूछा और उत्तर विषयगत रूप से सुसंगत थे, लेकिन विशिष्टताओं में काफी अलग थे। हाइलाइट किए गए विषयों में शामिल थे:

  • विशिष्ट रहें

  • अस्पष्टता से बचें

  • पृष्ठभूमि प्रदान करें

  • स्पष्ट निर्देशों का उपयोग करें

एक अर्थ में यह काफी अजीब है: एआई को भाषा की अच्छी समझ है - क्या इसे बिना व्याकरणिक प्रॉम्प्टिंग के आपके मतलब का कोई अंदाजा नहीं होना चाहिए? लेकिन यह भाषा की महारत ही है जो प्रॉम्प्टिंग को सबसे शक्तिशाली बनाती है। इसे बिल्कुल वही बताएं जो आप मतलब रखते हैं, न कि लगभग।

इससे बात करें जैसे वह सहायक, सीखा हुआ परामर्शदाता है, जैसा आप चाहते हैं, न कि सड़क पर एक बच्चे की तरह।

यहां निष्कर्ष यह है कि, कम से कम फिलहाल, एलएलएम-आधारित एआई टूल्स का प्रभावी उपयोग प्रॉम्प्टिंग सर्वोत्तम प्रथाओं के साथ कम से कम परिचितता की आवश्यकता है। प्रॉम्प्टिंग में निपुणता को उपयुक्त रूप से पुरस्कृत किया जाएगा।

भ्रम: एक गड़बड़ी की मक्खी

An icon of a key

AI, जो बड़े भाषा मॉडल पर आधारित है, चीजें बना देता है। यह बस करता है। इसे सामान्यतः “भ्रम” कहा जाता है। यह एक वास्तविक समस्या है, एक गंभीर समस्या। यदि आप AI के साथ काम करने जा रहे हैं, तो आपको भ्रम को समझना होगा।

कैम्ब्रिज डिक्शनरी का 2023 का वर्ड ऑफ द ईयर “Hallucinate” था, जिसकी परिभाषा को विस्तारित किया गया है जिसमें शामिल है “जब एक कृत्रिम बुद्धिमत्ता… भ्रम पैदा करता है, तो यह गलत जानकारी उत्पन्न करता है।” (2023 डिक्शनरी में अन्य जोड़े गए शब्दों में “prompt engineering,” “large language model,” और “GenAI” शामिल हैं।)

AI भ्रम, कैम्ब्रिज नोट करता है, “कभी-कभी बेतुके दिखाई देते हैं। लेकिन वे पूरी तरह से संभावित भी लग सकते हैं–भले ही वे तथ्यात्मक रूप से गलत या अंततः अव्यवस्थित हों।” यह, दुख की बात है, काफी सच है, और जुलाई 2024 के अनुसार मिशन-क्रिटिकल कार्यों के लिए जनरेटिव AI का उपयोग करने के लिए यह एक नाटकीय सीमा बनी हुई है। यह AI की कई महान विषमताओं में से एक है, और इसे समझने में लोगों को कुछ समय लगता है। याद रखें, जनरेटिव AI मुख्यतः एक अगले शब्द की भविष्यवाणी इंजन है, न कि तथ्यों का डेटाबेस। इसलिए अब हमें AI आउटपुट की डबल-चेकिंग करने के लिए HITLs, Humans-In-The-Loop, की आवश्यकता है। और फिर भी, यह उल्लेखनीय है कि हम एक ऐसी तकनीक से इतनी असाधारण मूल्य प्राप्त कर सकते हैं जो प्रमाणित रूप से गलत आउटपुट उत्पन्न कर सकती है। तो यह चलता है।

Gary Marcus, एक अनुभवी और अच्छी तरह से सूचित AI-आलोचक, AI भ्रमों की तुलना टूटे हुए घड़ियों से करते हैं, जो दिन में दो बार सही होती हैं। “यह कुछ समय के लिए सही होता है,” वे कहते हैं, “लेकिन आप नहीं जानते कि किस समय के लिए, और यह इसकी मूल्य को बहुत कम कर देता है।”

Ethan Mollick, Publishers Weekly सितंबर 2023 सम्मेलन के मुख्य वक्ता, नोट करते हैं कि AI का उपयोग करने वाले लोग 100% सटीकता की उम्मीद करते हैं। भ्रम, वे कहते हैं, “मानव त्रुटियों की दर” के समान हैं जिन्हें हम दैनिक रूप से सहन करते हैं।

Andrej Karpathy, एक प्रसिद्ध वैज्ञानिक जो AI में विशेषज्ञता रखते हैं और वर्तमान में OpenAI में काम करते हैं, भ्रमों के बारे में लिखते हैं:

“जब मुझसे LLMs में ‘भ्रम समस्या’ के बारे में पूछा जाता है, तो मुझे हमेशा कुछ कठिनाई होती है। क्योंकि, कुछ मायनों में, भ्रम सब LLMs करते हैं। वे सपने मशीनें हैं।

“हम उनके सपनों को प्रॉम्प्ट्स के साथ निर्देशित करते हैं। प्रॉम्प्ट्स सपने की शुरुआत करते हैं, और LLM के प्रशिक्षण दस्तावेजों की धुंधली स्मृति के आधार पर, ज्यादातर समय परिणाम कहीं उपयोगी जगह पर जाता है।

“यह केवल तब होता है जब सपने तथाकथित तथ्यात्मक रूप से गलत क्षेत्र में जाते हैं कि हम इसे ‘भ्रम’ कहते हैं। यह एक बग की तरह दिखता है, लेकिन यह बस वही है जो LLM हमेशा करता है।”

यह केवल चीजें बनाने की समस्या नहीं है। चैट एआई एक गहराई से दोषपूर्ण सॉफ़्टवेयर है।

कई प्रश्नों के लिए, विशेष रूप से नौसिखियों से, प्रतिक्रियाएं आम, लक्ष्य से भटकी हुई या बस अनुत्पादक होती हैं। चैट एआई को गिनती में समस्या होती है: इसे 500 शब्दों का ब्लॉग पोस्ट पूछें और आपको 150 शब्द मिल जाएं तो आप भाग्यशाली होंगे।

और प्रत्येक एआई कंपनियों ने, पूर्वाग्रह को कम करने और “कैसे-बम-बनाएं” प्रश्नों का उत्तर देने से बचने के लिए, अपने उत्पादों के चारों ओर कठोर प्रतिक्रिया गार्डरेल बनाया है: अक्सर, प्रश्न के उत्तर में मूल रूप से यही कहा जाता है, “नहीं, मैं इसका उत्तर नहीं दूंगा।” मैंने गूगल जेमिनी से इस टेक्स्ट के एक मसौदे की समीक्षा करने के लिए कहा और मुझे चेतावनी दी गई कि “प्रकाशन से पहले लेखक की स्वीकृति प्राप्त करना आवश्यक है।”

तथ्य-जांच

An icon of a key

मैं तर्क करता हूँ, ज्यादातर बधिर कानों पर, कि भ्रम तकनीकी समस्या है, जिसका तकनीकी समाधान मिलेगा। हाँ, वे एलएलएम में स्थानिक हैं, लेकिन उन्हें टाला जा सकता है।

इसे देखें: मैंने चार चैट एआई को निम्नलिखित बयानों की तथ्य-जांच करने के लिए कहा:

  • 2024 के अनुसार, न्यूयॉर्क शहर में स्थित 6 बड़े बहुराष्ट्रीय प्रकाशक हैं। इन्हें बिग 6 के नाम से जाना जाता है।

  • ईबुक्स संयुक्त राज्य में किताबों की बिक्री पर हावी हैं।

  • बॉर्डर्स और बार्न्स एंड नोबल संयुक्त राज्य में दो सबसे बड़ी किताब बेचने वाली श्रृंखलाएं हैं।

  • कोविड के दौरान बिक्री में गिरावट के बाद, यू.एस. किताबों की बिक्री फिर से दो अंकों की संख्या में बढ़ रही है।

सभी ने पहले तीन बयानों में हुई त्रुटियों को पकड़ा। चौथे पर, वे थोड़े भ्रमित हो गए, कोविड बिक्री में उछाल और उसके बाद की बिक्री पैटर्न के बारे में अनिश्चित। यह एक छोटा, गैर-प्रतिनिधि प्रयोग है, लेकिन ये चैट एआई, जो तथ्य-आधारित होने के लिए नहीं हैं, उन तथ्यों का विश्वसनीय मूल्यांकन कर सकते हैं जिन्हें अधिकांश सामान्य पर्यवेक्षक चूक सकते हैं।

छवियों और वीडियो के बारे में क्या?

An icon of a key

क्योंकि व्यापार पुस्तक प्रकाशन छवियों की तुलना में पाठ पर अधिक निर्भर है, प्रकाशक छवियों और वीडियो के लिए ग्राउंड-ब्रेकिंग एआई-आधारित उपकरणों की अनदेखी करते हैं।

वे एआई क्रांति की किसी की समझ के लिए प्रासंगिक हैं। लेकिन चर्चा के लिए उपलब्ध स्थान बहुत बड़ा है: मैं इसे न्याय नहीं कर पाऊंगा।

लेखकों और प्रकाशकों के लिए अनुशंसित: ChatGPT में छवि निर्माण सुविधाओं के साथ खेलें - वे नि:शुल्क हैं और उपयोग करने में मजेदार हैं। फिर “वीडियो और एआई” के अंतर्गत एक खोज करें और उन साइटों में पाए जाने वाले कुछ उदाहरणों पर विस्मय करें। हालांकि यह उपकरण अभी सार्वजनिक रूप से उपलब्ध नहीं है, OpenAI का सोरा केवल टेक्स्ट प्रॉम्प्ट से उत्पन्न वीडियो के कुछ शानदार उदाहरण प्रदान करता है।

पुस्तक प्रकाशकों के लिए सॉफ्टवेयर

पुस्तक प्रकाशकों के लिए विशेष रूप से निर्मित कृत्रिम बुद्धिमत्ता (AI) सॉफ्टवेयर बहुत कम है (हालांकि लेखकों के लिए बहुत सारे उपलब्ध हैं)।

शैक्षणिक प्रकाशकों के पास अनुसंधान, लेखन और प्रकाशन के लिए विभिन्न AI उपकरणों के साथ अधिक विकल्प हैं।

व्यापारिक प्रकाशकों के लिए अधिकांश विकल्प AI और ऑडियो से संबंधित हैं। ऑडियो के अलावा, विकल्प संपादन और विपणन उपकरणों के आसपास संयोजित हो रहे हैं। कई AI सामग्री-डिटेक्शन उपकरण और सामग्री लाइसेंसिंग उपकरण और सेवाएं भी हैं।

संपादन सॉफ्टवेयर लेखकों की ओर केंद्रित है, पेशेवर संपादकों की नहीं — लेखकों की संख्या संपादकों से कहीं अधिक है, और पेशेवर संपादकों द्वारा मांगी गई गुणवत्ता (मुख्य रूप से स्व-प्रकाशित) लेखकों की तुलना में कहीं अधिक कठोर है।

विपणन उपकरण भी केवल पुस्तक प्रकाशकों के बजाय व्यापक रूप से विपणक के लिए लक्षित हैं, जिनमें वेब सामग्री, कॉपी जनरेशन और एसईओ के लिए उपकरण शामिल हैं। Jasper.ai इस श्रेणी में अग्रणी है, और हार्पर कॉलिन्स को ग्राहक के रूप में दावा करता है।

Shimmr, इस पुस्तक का एक प्रायोजक, विशेष रूप से पुस्तक प्रकाशकों के लिए एक AI-संचालित विज्ञापन निर्माण उपकरण है। कंपनी, और इसके संस्थापक, नादिम सादेक, को Publishers Weekly के मई 2024 लेख में प्रोफाइल किया गया था।

“हम जो करते हैं वह है AI का उपयोग करके एक पुस्तक की मनोवैज्ञानिक प्रोफ़ाइल पर विचार करना और इसे एक विशिष्ट दर्शकों की मानसिकता से मेल कराना, जिससे पाठकों और पुस्तकों के बीच एक अधिक प्रभावी संबंध सुनिश्चित हो सके,” सादेक ने PW को बताया। “हम इसे ‘पुस्तक डीएनए’ कहते हैं, और इसमें न केवल पुस्तक के पात्र और कथानक को जानना शामिल है, बल्कि पुस्तक के मूल्य, रुचियां और भावनाएं भी शामिल हैं।”

पुस्तक डीएनए का उपयोग करते हुए, Shimmr के AI उपकरण फिर खोज और सोशल मीडिया चैनलों (वर्तमान में Google और Meta) के लिए लक्षित विज्ञापन बनाते हैं। विज्ञापन डिस्प्ले विज्ञापनों के रूप में होते हैं, जिनमें AI-जनित छवियां टैगलाइन के साथ होती हैं।

मैं प्रकाशकों को Shimmr का मूल्यांकन करते समय यह बताना चाहता हूँ कि यह अतिरिक्त राजस्व प्रदान कर सकता है, जो कि हम एक नए विज्ञापन/विपणन उपकरण से उम्मीद करते हैं कि वह तालिका में लाएगा।

यदि आप “केवल AI के साथ” एक अन्य सॉफ्टवेयर उपकरण का अनुभव करना चाहते हैं, तो Hypnovels देखें, जो काल्पनिक पुस्तकों में अध्यायों को एनिमेट करता है। “AI द्वारा जनित कथन, छवि और गति, महान कहानी कहने के साथ एक साथ मिलते हैं, जो पारंपरिक एनिमेशन की तुलना में कम शाब्दिक (इसलिए “hypno”) और एक ऑडियोबुक की तुलना में अधिक संवेदनात्मक रूप से संलग्न होता है, एक शैली में जो अध्याय को अद्वितीय और आकर्षक बनाती है।”

एक और नया विक्रेता जो एआई के अवसर से उत्पन्न हुआ है, वह है Veristage (जो इस पुस्तक का प्रायोजक भी है)। Veristage अपनी “एआई प्रकाशन सहायक” नामक उत्पाद Insight प्रदान करता है, जो विभिन्न प्रकाशन कार्यों के लिए एक विशिष्ट फ्रंट-एंड है।

Insight की यात्रा पांडुलिपि से शुरू होती है। एक प्रारंभिक संस्करण अपलोड करने से विभिन्न उपकरणों की एक श्रृंखला खुल जाती है, जिनमें से कुछ संपादकीय के लिए अधिक मूल्यवान होते हैं, जबकि अन्य विपणन के लिए अधिक मूल्यवान होते हैं। किसी भी और सभी विशेषताओं के साथ काम करने के बाद, आप एक पीडीएफ रिपोर्ट डाउनलोड कर सकते हैं जिसमें संपादकीय पहलुओं जैसे लेखन का स्वर, ट्रॉप्स, क्लिच और क्रियाविशेषण और विशेषणों का उपयोग शामिल होता है, और फिर विपणन सामग्री जैसे विवरण, मेटाडेटा, विशिष्ट विक्रय बिंदु, कंप, Amazon-ऑप्टिमाइज़्ड सामग्री, और सुझाए गए सोशल मीडिया पोस्ट शामिल होते हैं।

Insight के बारे में मुझे जो सबसे अच्छा लगता है वह यह है कि यह प्रकाशन प्रक्रिया में एआई को लागू करने के लिए एक समग्र दृष्टिकोण अपनाता है, बजाय इसके कि प्रत्येक कार्य के लिए अलग-अलग सॉफ़्टवेयर उपकरण इकट्ठा करने पड़े।

मैं यहां अपने प्रकाशन मंच, Leanpub को भी उजागर करना चाहता हूं। उनके साथ काम करना अद्भुत रहा है। छोटा सुंदर है: वे प्रौद्योगिकी और सेवाओं के साथ अवसर लेते हैं जिनसे बड़ी कंपनियां दूर रहती हैं। लेखकों और छोटे प्रकाशकों के लिए विशेष रुचि का उनका नया TranslateWord सेवा है, जहां आप Microsoft Word में लिखी गई पुस्तक को GPT-4o API (जो ChatGPT को पावर देता है) के माध्यम से 31 भाषाओं में अनुवाद कर सकते हैं। यही मैं इस पुस्तक को अनुवाद करने के लिए उपयोग कर रहा हूं।

मैंने पुस्तक अनुवाद के लिए सेवा खोजने के लिए और जगहें देखीं। कई अनुवाद फर्म हैं, जिनमें से कुछ एआई का उपयोग करती हैं। केवल एक जिसे मैं ढूंढ पाया जो पुस्तक अनुवाद प्रदान करता है वह है DeepL। लेकिन यह कंपनी का फोकस नहीं है। अभी Leanpub ही जगह है जहां जाना चाहिए।

पुस्तक प्रकाशन के लिए व्यापार सॉफ्टवेयर

An icon of a key

मौजूदा व्यापार प्रणाली विक्रेता जो प्रकाशन उद्योग की सेवा कर रहे हैं, एआई प्रौद्योगिकियों को परतबद्ध करना शुरू कर रहे हैं, जैसा कि हमने एंटरप्राइज़-स्तरीय कंपनियों में देखा है, जैसे Salesforce और Oracle

मैंने कई प्रकाशन प्रणाली सॉफ़्टवेयर विक्रेताओं से बात की है, जिसमें Firebrand भी शामिल है, और सभी अवसरों को देख रहे हैं, लेकिन सावधानी से कदम उठा रहे हैं।

मैं Firebrand’s Publishing Innovation Forum में सितंबर, 2024 में नैशविले, TN में विविध समूह के उपस्थित लोगों के साथ एआई के बारे में बात करने के अवसर की प्रतीक्षा कर रहा हूं।

knk ने AI पर दो वेबिनार आयोजित किए हैं, और एक श्वेतपत्र जारी किया है, लेकिन (26 जून, 2024 तक) अपने उत्पादों में किसी भी AI फीचर की घोषणा नहीं की है।

Virtusales ने हाल ही में अपने पहले सेट के AI-सक्षम उपकरणों को लॉन्च किया है, जिसमें छवि टैगिंग, वैकल्पिक टेक्स्ट जनरेशन, कॉपीएडिटिंग उपकरण, बिक्री और विपणन कॉपी जनरेशन, और उस कॉपी का अनुवाद शामिल है।

मैंने Klopotek के साथ बात की उनके Klopotek Publishing Radio पर। उन्होंने “ग्राहक सेवाओं के क्षेत्र में एक AI पहल शुरू की है,” हालांकि कोई विवरण उपलब्ध नहीं है।

Supadu, जो प्रकाशकों को “वेब डिजाइन, ईकॉमर्स और डेटा समाधान” प्रदान करता है, अब “Supadu Smart AI” (pdf) की सुविधा प्रदान करता है, जिसमें “स्मार्ट बाय के साथ अवतार-लीड शीर्षक वीडियो समीक्षा,” “विपणन और बिक्री टीमों के लिए अवतार वीडियो-चालित प्रचार सामग्री,” और “लेखक और शीर्षक वीडियो का आसान बहुभाषी अनुवाद” शामिल है।

पुस्तक प्रकाशकों के लिए AI सॉफ्टवेयर: स्टार्टअप

कुछ लोग उस कार्य से परिचित हैं जो मैंने पुस्तक प्रकाशन तकनीक-आधारित स्टार्टअप के आसपास किया है। Publishers Weekly में एक रिपोर्ट है जो कार्य का वर्णन करती है, और डेटाबेस के लिंक प्रदान करती है।

जैसा कि आप रिपोर्ट में देखेंगे, मैं पुस्तक प्रकाशन स्पेक्ट्रम के पार स्टार्टअप्स को काफी व्यापक रूप से देखता हूं। मैं नई पुस्तक प्रकाशन कंपनियों को शामिल नहीं करता, जब तक कि वे प्रौद्योगिकी के साथ कुछ असामान्य काम नहीं कर रही हों। बुनियादी मानदंड है: क्या आप पुस्तक(संबंधी) प्रकाशन प्रक्रिया के किसी पहलू को पुनर्जीवित करने के लिए प्रौद्योगिकी का उपयोग करते हैं? मेरे डेटाबेस में 1,600 से अधिक कंपनियां हैं, जिनमें से अधिकांश ने 2007 में Amazon द्वारा पहला Kindle जारी करने के बाद लॉन्च किया।

डेटाबेस का समग्र ज्ञान प्राप्त करने के बाद, आप और अधिक गहराई से जांच शुरू कर सकते हैं। सबसे दाहिनी टैब पर, आपको केवल एआई-संबंधित प्रकाशन स्टार्टअप्स द्वारा सॉर्ट करने का एक तरीका दिखाई देगा।

एक स्क्रीनशॉट जिसमें एआई के लिए चयनित एक फ़िल्टर के साथ टूल्स और सेवाओं को सूचीबद्ध करने वाली तालिका दिखाई गई है, जिसमें 243 की गिनती हाइलाइट की गई है।

जैसा कि चित्रण में देखा जा सकता है, 240 से अधिक एआई-संबंधित प्रकाशन स्टार्टअप्स (जुलाई 2024 की शुरुआत के अनुसार) हैं। हम ऑडियो प्रकाशन स्टार्टअप्स की गिनती करते हैं जो एआई का उपयोग करते हैं, इसे एक अलग श्रेणी के रूप में रखते हैं और दोनों का कुल 300 से अधिक कंपनियाँ हैं। अधिकांश, 280 से अधिक, नवंबर 2022 में ChatGPT के पहली बार आने के बाद लॉन्च किए गए थे। पुस्तक प्रकाशन के भीतर यह नया व्यापार स्टार्टअप्स की मात्रा अभूतपूर्व है। यह आश्चर्यजनक है।

पूर्ण डेटाबेस की विशेषता के रूप में, ये एआई स्टार्टअप्स ज्यादातर लेखक (70%) को लक्षित करते हैं। लगभग 13% विशेष रूप से प्रकाशन कंपनियों की सेवा करने की कोशिश कर रहे हैं। 10% बच्चों के प्रकाशन पर केंद्रित हैं।

लगभग 50 स्टार्टअप्स पाठकों को विभिन्न आविष्कारशील पेशकशों के साथ लक्षित करते हैं। कई कहानी कहने वाले प्लेटफ़ॉर्म हैं। काफी सारे सारांशकार हैं। कई खोज साइटें हैं, “एआई का उपयोग करके अपनी नई पसंदीदा पुस्तक खोजें।” तेजी से सुधार होते एआई-जनित आवाज़ों ने “मुझे पढ़कर सुनाओ” टूल्स के चयन को जन्म दिया है।

और कुछ दिलचस्प विचार जो एआई के बिना संभव नहीं होते।

बुकशेल्फ़: रीडिंग ट्रैकर एक संयोजन पुस्तक खोज और व्यक्तिगत पुस्तकालय ऐप है जिसमें “स्वचालित समय ट्रैकिंग, पढ़ने के लक्ष्य और रिमाइंडर, और सूचनात्मक सांख्यिकी और रुझान” शामिल हैं। इसका एआई लाइब्रेरियन “सारांश और फ्लैश कार्ड्स बना सकता है, प्रमुख विचारों और निष्कर्षों पर चर्चा कर सकता है, और बहुत कुछ कर सकता है।”

मेरे मित्र रॉन मार्टिनेज ने हाल ही में Inventionarts.ai नामक एक साइट लॉन्च की है जो “एक नया संवादात्मक माध्यम” पेश करती है। जैसा कि साइट बताती है, “कई एआई व्यक्तित्वों से बात करें, प्रत्येक की अपनी पहचान, विशेषज्ञता और जागरूकता के साथ। विभिन्न व्यक्तित्वों को परिदृश्यों में शामिल होने के लिए आमंत्रित करें। और आप भी एक काल्पनिक भूमिका निभा सकते हैं!” एक तरह का साहित्यिक खेल।

बड़े स्टार्टअप समूह की विशेषता के रूप में, इनमें से कई स्टार्टअप छोटे से लेकर बहुत छोटे तक हैं, सिर्फ एक व्यक्ति एक वेबसाइट और आधा तैयार विचार के साथ। मैंने इन्हें सभी शामिल किया है—कौन जानता है ये कहाँ जा रहे हैं।

मैं आपको डेटाबेस के साथ खेलने के लिए दृढ़ता से प्रोत्साहित करता हूँ। कुछ लिंक पर क्लिक करें। मुझे लगता है कि आप इन संगठनों की नवाचार और साहसिकता से रोमांचित होंगे।

इस पुस्तक के प्रायोजकों में से एक, Book Advisors, प्रकाशन उद्योग में विलय और अधिग्रहण में विशेषज्ञता रखता है। मैं हमेशा नवोन्मेषी स्टार्टअप्स को यह सुझाव देता हूँ कि वे भागीदारों की तलाश करें, और Book Advisors वह जगह है जहाँ मैं उन्हें प्रक्रिया के बारे में बात करने के लिए भेजता हूँ। पुस्तक प्रकाशन में कई सम्मानित M&A फर्म्स हैं जिनसे संपर्क किया जा सकता है, जिनमें The Fisher Company और Oaklins DeSilva+Phillips शामिल हैं। Book Advisors एकमात्र फर्म है जिसे मैं जानता हूँ जो प्रौद्योगिकी स्टार्टअप्स के साथ भी काम करती है।

एआई और पुस्तक प्रकाशन: वर्तमान में उद्योग क्या कर रहा है?

An icon of a key

कई प्रमुख प्रकाशन व्यापार समूहों की एआई-संबंधित गतिविधियाँ कॉपीराइट-चिंता की आवाज़ में अपनी आवाज़ जोड़ती दिख रही हैं। The Association of American Publishers “ने अमेरिकी कॉपीराइट कार्यालय की कृत्रिम बुद्धिमत्ता (एआई) और कॉपीराइट कानून के बीच के संबंधों की जांच में उत्तर टिप्पणियाँ प्रस्तुत की हैं...”

ब्रिटेन के Publishers Association नोट करता है कि “यह अत्यंत महत्वपूर्ण है कि सरकार जल्द से जल्द ठोस समाधान लागू करे ताकि सुरक्षित और विश्वसनीय एआई को आधार देने वाली मानव रचनात्मकता और ज्ञान की रक्षा की जा सके।”

दूसरी ओर, Independent Publishers Guild (IPG), जिसमें 600 से अधिक सदस्य हैं, अपने सदस्यों को एआई मार्गदर्शन और प्रशिक्षण प्रदान करता है, जिसमें “प्रकाशन में एआई के लिए व्यावहारिक मार्गदर्शिका,” जो एक प्रसिद्ध एआई और प्रकाशन विशेषज्ञ, George Walkley द्वारा संचालित है।

यहाँ अमेरिका में, मुझे Book Industry Study Group (BISG) के एआई वर्किंग ग्रुप का हिस्सा बनने का सौभाग्य मिला है, जो Workflow Committee को रिपोर्ट करता है। वर्किंग ग्रुप ने कई संभावित रणनीतिक पहलों की रूपरेखा तैयार की है:

  • सर्वोत्तम प्रथाएँ और मानक विकास: नैतिक दिशा-निर्देशों, मौजूदा विनियमों और कानूनों से संबंधित सर्वोत्तम प्रथाओं की सिफारिश करना। इसमें कृत्रिम बुद्धिमत्ता-जनित सामग्री की पारदर्शिता और उपभोक्ताओं को इसका खुलासा शामिल है।

  • उद्योग सर्वेक्षण और परिभाषाएँ: वर्तमान और संभावित कृत्रिम बुद्धिमत्ता उपयोगों पर व्यापक उद्योग अंतर्दृष्टि एकत्र करने के लिए सर्वेक्षण करना और पुस्तक प्रकाशन के संदर्भ में कृत्रिम बुद्धिमत्ता का क्या अर्थ है, इसके लिए स्पष्ट परिभाषाएँ और दायरे स्थापित करना।

  • आवधिक रिपोर्टिंग और समीक्षाएँ: उद्योग को कृत्रिम बुद्धिमत्ता प्रौद्योगिकियों द्वारा लाए गए तेज बदलावों का पूर्वानुमान लगाने और अनुकूल बनाने में मदद करने के लिए आवधिक रिपोर्ट प्रदान करना।

अन्य लेखन और प्रकाशन संघ इस विषय पर आगे बढ़ने की कोशिश कर रहे हैं। कुछ कृत्रिम बुद्धिमत्ता के विरोध में खड़े हैं; अन्य सिर्फ अपने सदस्यों को इस तकनीक को समझने और शायद इसके साथ प्रयोग करने में मदद करने की कोशिश कर रहे हैं।

कृत्रिम बुद्धिमत्ता और पुस्तक प्रकाशन: प्रकाशन कंपनियाँ क्या कर रही हैं?

एक साल पहले यह सवाल था कि वर्तमान में प्रकाशन कंपनियाँ क्या कर रही हैं, जिसका जवाब था, “ज्यादा कुछ नहीं।” तब से ज्यादा कुछ नहीं बदला है, लेकिन कुछ गतिविधि हुई है। मैं ट्रेड बुक पब्लिशर्स पर ध्यान केंद्रित करूंगा; विद्वतापूर्ण और शैक्षणिक प्रकाशक अधिक सक्रिय हैं। यहाँ मेरे द्वारा पता लगाए गए कुछ बातें हैं।

Hachette: यूके में The Bookseller में नवंबर 2023 की रिपोर्ट के अनुसार, Hachette ने कृत्रिम बुद्धिमत्ता पर एक स्थिति बयान प्रकाशित किया है, जिसमें ‘संचालनात्मक’ उपयोगों और ‘रचनात्मक’ उपयोगों के बीच अंतर बताया गया है। कंपनी ने स्पष्ट किया है कि वह संचालनात्मक उपयोगों के लिए ‘जिम्मेदार प्रयोग’ को प्रोत्साहित करती है लेकिन ‘मशीन रचनात्मकता’ के विरोध में है… ताकि मानव द्वारा उत्पन्न मौलिक रचनात्मक सामग्री की रक्षा की जा सके।“

HarperCollins: Publishers Weekly में अप्रैल 2023 की रिपोर्ट के अनुसार, एंड्रयू अल्बानीस और एड नवोटका द्वारा, HarperCollins के सीईओ ब्रायन मरे ने कहा:

“हमें पता है कि यह महत्वपूर्ण होगा और अगले तीन से पांच वर्षों में हमारे उद्योग पर इसका बड़ा प्रभाव पड़ेगा। और इसलिए मुझे लगता है कि हममें से कई लोग यह पता लगाने की कोशिश कर रहे हैं कि इसे कैसे उपयोग करें और सुनिश्चित करें कि हम इसे नैतिक, नैतिक तरीके से लागू करें जो हमें लेखकों की सेवा करने और लेखकों को पेशेवर सेवाएँ प्रदान करने में मदद करता है और लेखकों और कहानी कहने के साथ प्रतिस्पर्धा नहीं करता है।

“और मुझे लगता है कि यह एक चुनौती है। शायद यहाँ के सभी प्रकाशकों के लिए नहीं, लेकिन मैं आपको गारंटी देता हूँ कि दुनिया भर में कई छोटे तकनीकी दल हैं जो हमारे व्यवसाय को निशाना बना सकते हैं। वे प्रकाशक नहीं हैं, वे संपादक नहीं हैं। वे तकनीकी विशेषज्ञ हैं और वे एक अवसर देखते हैं।”

पेंगुइन रैंडम हाउस (PRH): PRH की पैरेंट कंपनी बर्टेल्समन एक श्वेतपत्र प्रदान करती है जिसका शीर्षक है स्टेट ऑफ प्ले: मीडिया और एंटरटेनमेंट उद्योग पर जनरेटिव एआई के परिवर्तनकारी प्रभावों की खोज, जिसमें पुस्तक प्रकाशन पर एक खंड शामिल है।

इसके अलावा, पब्लिशर्स लंच की एक रिपोर्ट के अनुसार, कंपनी ने “अपने कर्मचारियों के लिए PRH ChatGPT नामक एक आंतरिक एआई अनुप्रयोग पेश किया।”

लेख में कहा गया है कि PRH के आंतरिक दस्तावेज बताते हैं कि यह कार्यक्रम “’प्रक्रियाओं को सरल बनाने, रचनात्मकता को बढ़ाने और विभागों में डेटा अंतर्दृष्टि प्रदान करने के लिए उपयोग किया जा सकता है। कंपनी का सुझाव है कि ऐप के उपयोगों में पुस्तकें और दस्तावेज़ों का संक्षेपण; ईमेल को संशोधित करना; ब्लॉग पोस्ट या नौकरी विवरण का मसौदा तैयार करना; पाठ-आधारित डेटा का विश्लेषण करना, और “सामग्री के लिए विचार उत्पन्न करना” शामिल हैं।”

साइमन एंड शूस्टर: कंपनी के सीईओ जोनाथन कार्प को न्यूयॉर्क टाइम्स “पिछले 25 वर्षों के सबसे यादगार साहित्यिक क्षणों” में एक उद्धरण के साथ उल्लेख किया गया जो पब्लिशर्स वीकली के मई 2024 यू.एस. बुक शो में रिपोर्ट किया गया था। उन्होंने कहा कि एआई “कमरे में हाथी” नहीं था बल्कि, “दुनिया में साइकाडा की तरह था। आप जानते हैं, बहुत सारा शोर और बहुत सारी गड़बड़ियाँ।”

उन्होंने स्वीकार किया कि एआई “निश्चित रूप से एक मूल्यवान उपकरण है। यह निश्चित रूप से हमें अधिक कुशल बनाएगा। यह हमें जानकारी को बेहतर ढंग से संसाधित और एकत्र करने में मदद करेगा, और उम्मीद है कि कर्मचारियों को उच्च स्तर का काम करने की अनुमति देगा जो अधिक रोचक और रचनात्मक है।”

मार्च में, लंदन बुक फेयर में, जैसा कि द बुकसेलर में रिपोर्ट किया गया था, कार्प ने कहा कि कंपनी एआई-जनित ऑडियोबुक के विदेशी भाषा संस्करणों को भी देखेगी “उन क्षेत्रों में जहां [उस लेखक के] कार्यों को ऑडियो उत्पादन की लागत के कारण कभी भी मौका नहीं मिल सकता।”

एआई और पुस्तक प्रकाशन: उपयोग के मामले

An icon of a key

विभिन्न कार्यों में एआई और पुस्तक प्रकाशन के विशिष्ट उपयोग के मामलों का वर्णन करना अवधारणात्मक रूप से आसान है। लेकिन वास्तव में प्रकाशक क्या कर रहे हैं, इसके बारे में ज्यादा जानकारी उपलब्ध नहीं है।

Keith Riegert, CEO of Ulysses Press and Perfect Bound, ने Publishers Weekly यू.एस. बुक शो में मई, 2024 में प्रस्तुति दी, जिसमें प्रकाशन कंपनियों में कृत्रिम बुद्धिमत्ता के उपयोग के मामलों का सबसे व्यापक अवलोकन प्रस्तुत किया। Perfect Bound इस रिपोर्ट का प्रायोजक है; मैं उस बयान के साथ खड़ा हूं। वह “20 व्यावहारिक तरीके जिनसे आप, एक प्रकाशन पेशेवर के रूप में, तुरंत कृत्रिम बुद्धिमत्ता का उपयोग शुरू कर सकते हैं” पेश करते हैं।

उनकी प्रस्तुति, कृत्रिम बुद्धिमत्ता के साथ शुरुआत करना, को Perfect Bound वेबसाइट से देखा और डाउनलोड किया जा सकता है

जब कृत्रिम बुद्धिमत्ता एक किताब पढ़ती है तो क्या होता है?

मैं इस सेक्शन का शीर्षक Ethan Mollick की न्यूज़लेटर से उधार ले रहा हूँ जानबूझकर – इसे सुधारने की कोई जरूरत नहीं है। Mollick पेंसिल्वेनिया विश्वविद्यालय के Wharton स्कूल में प्रोफेसर हैं, जो उद्यमिता और नवोन्मेष का अध्ययन करते हैं। उनकी न्यूज़लेटर, जिसे मैं अक्सर अनुशंसा करता हूँ, शांत, ताज़गी भरी और अद्वितीय अंतर्दृष्टिपूर्ण है।

Mollick को एक टिप्पणीकार के रूप में योग्य बनाता है कि उनके पास कोई व्यक्तिगत लाभ नहीं है। उन्हें कृत्रिम बुद्धिमत्ता बेचने की जरूरत नहीं है, न ही उसे नष्ट करने की। उन्होंने बस कृत्रिम बुद्धिमत्ता को इसके कई प्रभावों, मुख्य रूप से शिक्षा, संस्कृति, लेखन, और प्रकाशन पर, का पता लगाने का संकल्प लिया हुआ है। और वह एक अद्भुत, स्पष्ट लेखक हैं।

यदि आप Mollick की न्यूज़लेटर आर्काइव्स को ब्राउज़ करें तो आप देखेंगे कि उन्होंने दिसंबर 2022 तक कृत्रिम बुद्धिमत्ता पर ध्यान केंद्रित करना शुरू नहीं किया। यह उनका क्षेत्र नहीं था – जैसे अधिकांश हम में से, कृत्रिम बुद्धिमत्ता उनके दिन के काम में आई, और वह इससे अपनी नजरें हटा नहीं सके।

इस पोस्ट में उनके अंतर्दृष्टि हमारे प्रकाशन पेशेवरों के रूप में हमारी रुचि के सबसे करीब आती है। “क्या कृत्रिम बुद्धिमत्ता,” वह पूछते हैं, “हमारी किताबों के साथ बातचीत करने के तरीके को बदल सकती है?”

इस सवाल का जवाब देने के लिए, Mollick नोट करते हैं, “हमें एक कृत्रिम बुद्धिमत्ता की आवश्यकता है जिसकी मेमोरी इतनी बड़ी हो कि वह एक किताब को धारण कर सके, और एक लेखक जो अपनी किताब को अच्छी तरह से जानता हो ताकि कृत्रिम बुद्धिमत्ता के परिणामों का न्याय कर सके।” Mollick अपने कई शीर्षकों में से एक का परीक्षण करते हैं (वह यह नहीं बताते कि कौन सा, लेकिन चैट से यह स्पष्ट है The Unicorn’s Shadow: Combating the Dangerous Myths that Hold Back Startups, Founders, and Investors, एक किताब जो Amazon पर अनुकूल समीक्षा की गई है, हालांकि वर्तमान बेस्टसेलर नहीं है)।

मोलिक लेखक, प्रकाशक या पाठक के लिए एआई के संभावित मूल्य के विभिन्न पहलुओं पर विचार करते हैं, जिसमें “पाठक और संपादक के रूप में एआई,” और “एक व्यावहारिक उपयोग: प्रशिक्षकों के लिए सहायता।” वे एक एलएलएम—बड़ा भाषा मॉडल—न कि ChatGPT—से किताब का सारांश देने के लिए कहते हैं। यह मोलिक की संतुष्टि के लिए सफल होता है।

फिर एक कठिन चुनौती: “मुझे किताब में रूपकों के उदाहरण दें।” मेटाफर, वे बताते हैं, “यह मानव पाठकों के लिए भी चुनौतीपूर्ण है, क्योंकि इसमें स्पष्ट संकेतकों के बिना रूपक भाषा का उपयोग खोजने की आवश्यकता होती है (एक उपमा की तरह, इसमें कोई “जैसे” या “जैसा” नहीं होता)।” परिणाम, वे रिकॉर्ड करते हैं, “प्रभावशाली हैं, हालांकि कुछ छोटे त्रुटियाँ हैं।”

संपादक के रूप में एलएलएम कम सफल है: इसके इस विभाग में विफलताओं, मोलिक बताते हैं, “कुछ ऐसा है जो एआई की वर्तमान स्थिति के बारे में स्पष्ट हो गया है: यदि आप एक बहुत अच्छे लेखक या संपादक हैं, तो आप वर्तमान एआई से बेहतर हैं…”

फिर भी, “एआई के पास, या कम से कम ऐसा प्रतीत होता है कि उनके पास, एक पाठ के संदर्भ और अर्थ की समझ है।” परिणामस्वरूप, मोलिक मानते हैं कि “एआई के परिणामस्वरूप हम किताबों से कैसे संबंधित होते हैं, यह बदलने की संभावना है।”

मैं भी ऐसा ही सोचता हूँ।

एआई और पुस्तक डिज़ाइन और उत्पादन

An icon of a key

जब पुस्तक डिज़ाइन और उत्पादन की बात आती है, तो विशेषज्ञ प्रणाली और प्रक्रिया स्वचालन अभी भी एआई से आगे हैं।

पुस्तकों के स्वचालित टाइपसेटिंग के लिए सॉफ़्टवेयर कम से कम 1970 के दशक से है। 1980 के मध्य में मैंने एक सॉफ़्टवेयर प्रोजेक्ट PageOne की निगरानी की, जो डोनाल्ड कनुथ के TeX पर आधारित था, जो मिनटों में एक पुस्तक को टाइपसेट कर सकता था। SGML लगभग उसी समय प्रकट हुआ, जो 1969 में पेश किए गए एक दस्तावेज़ मानक पर आधारित था। इसे 1996 में पेश किए गए XML द्वारा बड़े पैमाने पर प्रतिस्थापित किया गया। ये मजबूत मार्कअप भाषाएँ स्वचालन के लिए ठोस संरचनाएँ बनाती हैं।

डेस्कटॉप पब्लिशिंग ने QuarkXPress और Adobe InDesign के साथ-साथ Adobe Illustrator और Adobe Photoshop के लिए स्वचालन का एक और दौर पेश किया। प्रकाशन वर्कफ़्लोज़ को विभिन्न कार्यक्रमों और प्रणालियों के साथ प्रबंधित किया जा सकता है।

देखने लायक एक संगठन Coko Foundation है। वे उत्पादन और प्रकाशन प्रबंधन टूल्स का एक सूट पेश करते हैं, जिसमें Kotahi, एक विद्वतापूर्ण प्रकाशन मंच, और Ketty पुस्तक उत्पादन के लिए शामिल हैं, जिसमें एक एआई सहायक भी शामिल हैKotahi AI PDF Designer, “PDF डिज़ाइन को एक सीधा, इंटरैक्टिव प्रक्रिया में बदल देता है।”

कृत्रिम बुद्धिमत्ता को InDesign कार्यप्रवाहों में लाने के लिए कुछ प्रारंभिक पहलें हैं। अप्रैल 2024 में Adobe ने Text to Image feature की घोषणा की। तीसरे पक्ष यहाँ Adobe से आगे हो सकते हैं: भारत में नवीनतम प्रीप्रेस और उत्पादन विक्रेता, जैसे Hurix Digital और Integra, उत्पादन के लिए कृत्रिम बुद्धिमत्ता का उपयोग करने में Adobe से अधिक पहल दिखा रहे हैं।

कृत्रिम बुद्धिमत्ता और पुस्तक विपणन

An icon of a key

कृत्रिम बुद्धिमत्ता का पुस्तक विपणन पर अल्पकालिक में प्रभाव उथला होगा, लेकिन दीर्घकालिक में अधिक गहरा। यह इस पर निर्भर करता है कि आप ‘पुस्तक विपणन’ को क्या मानते हैं; यह बदल रहा है।

‘लो-हैंगिंग फ्रूट’ स्पष्ट है। उत्पाद वर्णन या प्रेस रिलीज़ के लिए Chat AI से मदद मांगें। इसे कुछ कीवर्ड सुझाने के लिए कहें। यह बिना पसीना बहाए कर सकता है। लेकिन अधिकांश प्रकाशन पेशेवर भी यही कर सकते हैं, केवल थोड़ी नमी के साथ।

ऊपर लिंक किए गए Keith Riegert के उपयोग मामले में शीर्षक के लिए विचार-मंथन, डिजिटल मार्केटिंग रिपोर्ट का मसौदा तैयार करना, और Google Sheets में एक डिजिटल मार्केटिंग अभियान ट्रैकर बनाना शामिल है।

ऊपर वर्णित Shimmr सॉफ़्टवेयर स्वचालित विपणन के आकार का संकेत देता है।

कृत्रिम बुद्धिमत्ता और मेटाडाटा

An icon of a key

कृत्रिम बुद्धिमत्ता का मेटाडाटा से क्या संबंध है, और इसके विपरीत? इसकी भूमिका अब तक मामूली प्रतीत होती है; कुछ बड़े बदलावों की अपेक्षा करें।

मेटाडाटा पुस्तक खोजने की क्षमता का मूल है। आपने इसे कई बार सुना है कि चेतावनी से ऊब हो जाती है। यह मुख्य रूप से इसलिए निराशाजनक है क्योंकि “मेटाडाटा” अधिकांश गैर-तकनीकी लोगों के लिए मायावी रहता है। यदि आप कहते हैं, “यह बस पुस्तक के बारे में बुनियादी जानकारी है, शीर्षक, विवरण, मूल्य, विषय श्रेणियाँ, इस तरह की चीजें,” तो लोग साँस छोड़ते हैं। वे इसके साथ सहज होते हैं। लेकिन बस इतना ही।

मुझे आपको याद दिलाने का अफसोस है कि पुस्तक के बारे में कुछ विवरणों से कहीं अधिक मेटाडाटा है। इसमें बहुत कुछ है। इस छोटी सी पुस्तक में मैं जितना समाहित कर सकता हूँ, उससे कहीं अधिक। मैंने इस विषय पर एक पूरी पुस्तक सह-लेखन की है। Ingram Metadata Essentials प्रकाशित करता है, एक उत्कृष्ट संक्षिप्त मात्रा। मैं इसे यहाँ कहूंगा, और आखिरी बार नहीं: लेखक और प्रकाशक अपने मेटाडाटा को नजरअंदाज करने पर अपने जोखिम पर ऐसा करते हैं।

कृत्रिम बुद्धिमत्ता मेटाडाटा जनरेशन में मदद कर सकती है। उदाहरण के लिए, स्व-प्रकाशन विक्रेता PublishDrive, “एआई-पावर्ड बुक मेटाडाटा जेनरेटर” की पेशकश करता है जो पुस्तक के शीर्षक, ब्लर्ब, अमेज़ॅन श्रेणियाँ, बीआईएसएसी श्रेणियाँ और कीवर्ड्स के लिए एआई सिफारिशें प्रदान करता है।

Insight, Veristage से, जैसा कि ऊपर वर्णित है, विवरण, कीवर्ड्स, बीआईएसएसी श्रेणियाँ उत्पन्न कर सकता है, और लक्षित दर्शकों को परिभाषित कर सकता है।

मेटाडाटा में कृत्रिम बुद्धिमत्ता के उपयोग की घोषणा

An icon of a key

आप सोच सकते हैं कि मेटाडाटा की संकीर्ण दुनिया एआई को अपनाने में धीमी होगी। ऐसा नहीं है! पिछले नवंबर, ओनिक्स मानक के संरक्षक EDItEUR ने “ओनिक्स में एआई के पहलू” नामक एक छोटा एप्लीकेशन नोट जारी किया। (pdf)

अपनी विशिष्ट गहरी बुद्धिमत्ता के साथ, संगठन के निदेशक Graham Bell नोट करते हैं कि “इस तकनीक से संबंधित विवादों के प्रति एक प्रतिक्रिया एआई का उपयोग करने से इंकार करना या एआई-निर्मित उत्पादों में व्यापार करने से बचना हो सकती है। एक अधिक यथार्थवादी विकल्प यह है कि व्यापार भागीदारों और पाठकों के साथ पारदर्शी रहें जब एआई का उपयोग किया गया हो। और जैसा कि कुछ पुनर्विक्रेता एआई-आधारित सामग्री को अपने प्लेटफार्मों से प्रतिबंधित करते हैं, प्रतिष्ठित प्रकाशकों के लिए यह महत्वपूर्ण है कि वे उन उत्पादों को उजागर करें जो सामग्री बनाने के लिए जनरेटिव एआई तकनीकों का उपयोग करते हैं।”

Bell प्रकाशकों को मेटाडाटा में निर्दिष्ट करने के तरीकों को रेखांकित करते हैं:

  • एआई योगदानकर्ता

  • ऑडियोबुक में एआई-आधारित आवाजें

… साथ ही डिजिटल उत्पादों के मेटाडाटा में यह संकेत देने का एक तरीका है कि प्रकाशक स्पष्ट रूप से अनुसंधान के अलावा अन्य उपयोगों के लिए टेक्स्ट और डेटा माइनिंग (TDM) से बाहर हो जाते हैं। व्यावसायिक या गैर-अनुसंधान TDM को कवर करने के लिए एक अलग लाइसेंस निर्दिष्ट करने का भी एक तरीका है।

जैसा कि अक्सर होता है, ओनिक्स में निर्दिष्ट जो कुछ है वह खाद्य श्रृंखला में नीचे नहीं खोजा जा सकता है, लेकिन कम से कम एक सर्वोत्तम प्रयास किया गया है।

प्रकाशन संचालन में कृत्रिम बुद्धिमत्ता को एकीकृत करने की रणनीतियाँ

An icon of a key

कुछ चीजें हैं जो प्रकाशन कंपनियाँ अपने दिन-प्रतिदिन के संचालन में जटिल डिजिटल प्रौद्योगिकियों को एकीकृत करने की तुलना में कम आरामदायक महसूस करती हैं। यह समझ में आता है। कृत्रिम बुद्धिमत्ता, विशेष रूप से, सभी के लिए चिंता पैदा कर रही है, और न केवल प्रकाशन में। यह नया है, यह रहस्यमय है, यह व्यक्तिगत है, यह शक्तिशाली है। लोग कई कारणों से एआई से खतरा महसूस करते हैं। दृष्टिकोण बदलने में समय लगता है।

लेकिन यह प्रौद्योगिकी के साथ डरपोक होने का अच्छा समय नहीं है।

आपके संगठन के आकार की परवाह किए बिना, आपके प्रकाशन संचालन में कृत्रिम बुद्धिमत्ता को एकीकृत करने के लिए शांत और तर्कसंगत दृष्टिकोण उपलब्ध हैं।

प्रेरणा शीर्ष से आनी चाहिए। सबसे ऊपर से। वरिष्ठ अधिकारियों को कृत्रिम बुद्धिमत्ता के संभावित परिवर्तनकारी प्रभाव की दृष्टि को अपनाना चाहिए और पूरे संगठन में कर्मचारियों के साथ एक कार्यक्रम को संप्रेषित करना चाहिए। कार्यक्रम “प्रयोग करें, अपने प्रयोगों का दस्तावेजीकरण करें, और साझा करें” से अधिक कुछ नहीं हो सकता है। यह एक अच्छी शुरुआत है।

द इकॉनॉमिस्ट ने हाल ही में नई प्रौद्योगिकी अपनाने के लिए एक संगठनात्मक रणनीति का संदर्भ दिया जिसे “प्रकाश स्तंभ दृष्टिकोण” कहा जाता है। आप एक उच्च-प्रोफ़ाइल अवधारणा प्रमाण का चयन करके एक बीकन बनाते हैं जिसे जल्दी से लागू किया जा सकता है, जिससे हर कोई जुड़ सकता है।

प्रकाशन कंपनियां कॉपीराइट के आसपास की हलचल से बाधित हैं: लेखक आक्रोशित हैं। मई 2023 के लेखक संघ सर्वेक्षण में पाया गया कि “90 प्रतिशत लेखक मानते हैं कि यदि उनके काम का उपयोग जनरेटिव एआई तकनीकों को प्रशिक्षित करने के लिए किया जाता है तो लेखकों को क्षतिपूर्ति प्राप्त होनी चाहिए,” और 67 प्रतिशत ने कहा कि वे “निश्चित नहीं थे कि उनके प्रकाशन अनुबंध या प्लेटफार्म सेवा की शर्तों में किसी भी एआई-संबंधित उद्देश्यों के लिए उनके काम का उपयोग करने की अनुमति या अधिकार शामिल हैं।” वे अनिश्चित लेखक अब अपने प्रकाशकों से पूछ रहे हैं कि क्या उनके काम के संपादन या उत्पादन में एआई का उपयोग किया जा रहा है, और कुछ शक्तिशाली लेखक जोर दे रहे हैं कि इसका उपयोग न किया जाए। वे एक मूंगफली-मुक्त बेकरी के एआई समकक्ष की तलाश कर रहे हैं।

यह प्रकाशकों के लिए एक कांटेदार समस्या है—यदि आप उन पुस्तकों पर एआई का उपयोग नहीं कर सकते जिन्हें आप प्रकाशित करने की योजना बना रहे हैं, तो आप इसका उपयोग किस लिए कर सकते हैं?

एआई नीतियों को विकसित करना और संप्रेषित करना

इसके व्यापक उपयोग के बावजूद, कुछ ही प्रकाशकों ने सार्वजनिक रूप से अपनी एआई नीतियों को परिभाषित किया है, और एआई के प्रति अपने दृष्टिकोण को सार्वजनिक रूप से संप्रेषित किया है। ‘सार्वजनिक’ शब्द का यहाँ एक फिसलन भरा महत्व है, जब आप व्यापारिक, विद्वतापूर्ण और शैक्षिक प्रकाशकों द्वारा संबोधित विभिन्न सार्वजनिकों पर विचार करते हैं।

व्यापारिक प्रकाशकों के लिए सबसे महत्वपूर्ण दर्शक लेखक और उनके एजेंट हैं। विद्वतापूर्ण प्रकाशक अलग-अलग बाधाओं का सामना करते हैं, जब वे अनुसंधान पर एआई के आशाजनक प्रभाव पर विचार करते हैं, और फिर अनुसंधान को कथा में बदलने पर एआई के अधिक समस्याग्रस्त प्रभाव पर विचार करते हैं (अवी स्टेमन ने इस विषय पर एक विचारशील पोस्ट लिखी है)। शैक्षिक प्रकाशकों के लिए, नीतियों को स्थापित करना कठिन है, क्योंकि शिक्षा के अभ्यास पर एआई का अतिक्रमण बहुआयामी और जटिल है।

मुझे लगता है कि प्रकाशकों को AI तकनीकों के साथ आगे बढ़ते समय दो बड़े चुनौतियों का सामना करना पड़ता है। पहली चुनौती यह है कि वे AI को सामान्य रूप में कैसे अपनाएं, इस पर एक कंपनी की स्थिति विकसित करें और इसे अपने कार्यप्रवाहों में कैसे शामिल करें। दूसरी चुनौती यह है कि उस स्थिति को अपने हितधारकों को स्पष्ट और स्पष्ट रूप से संप्रेषित करें।

जिन प्रकाशक नीतियों को मैंने देखा है, वे ज्यादातर दोषपूर्ण हैं। उनमें से कुछ वास्तव में बाहरी रूप से लेखकों के लिए निर्देशित नीतियां हैं, जिनमें स्वीकार्य प्रथाओं (बहुत कम) और अस्वीकार्य प्रथाओं (काफी ज्यादा) की एक श्रृंखला शामिल होती है। ओ’रेली की “O’Reilly के लिए सामग्री विकसित करने वाले प्रतिभा के लिए AI उपयोग नीति” कई पृष्ठों में फैली हुई है, जिसमें “कोई भी OSS GenAI मॉडल का उपयोग न करें जो सॉफ़्टवेयर आउटपुट का उत्पादन करता है जो कॉपyleft या नेटवर्क वायरल ओपन सोर्स लाइसेंस की शर्तों के अधीन है” जैसे अस्पष्ट मार्गदर्शन शामिल है।

दूसरी ओर, शैक्षणिक प्रकाशक Elsevier की वेबसाइट के “Elsevier नीतियाँ” अनुभाग में, “जिम्मेदार AI सिद्धांतों,” “पाठ और डेटा माइनिंग,” और “Elsevier के लिए लेखन में जनरेटिव AI और AI-सहायता प्राप्त प्रौद्योगिकियों का उपयोग” पर बयान शामिल हैं।

जिन कुछ आंतरिक, अप्रकाशित, प्रकाशक नीतियों को मैंने देखा है, वे अत्यधिक रूढ़िवादी हैं। इन प्रकाशकों ने संभावित खतरों और उनके लेखकों की चिंताओं की एक श्रृंखला पर बहुत जल्दी प्रतिक्रिया दी है, और इस तेजी से विकसित हो रही, तेजी से बदलती प्रौद्योगिकी के साथ मजबूती से जुड़ने की अपनी क्षमता को बाधित कर दिया है।

यह मान लिया गया है कि वे AI का ‘जिम्मेदारी से’ उपयोग करेंगे, चाहे इसका कोई भी मतलब हो। यह मान लिया गया है कि वे लेखकों की बौद्धिक संपदा के लिए सबसे अधिक चिंता रखते हैं और लेखक के कॉपीराइट किए गए काम की आक्रामक रूप से रक्षा करने के लिए। (हालांकि, निश्चित रूप से, इन व्यापक सिद्धांतों को सार्वजनिक रूप से घोषित किया जाना चाहिए, और अक्सर दोहराया जाना चाहिए।)

लेकिन और क्या?

  • क्या वे संपादकीय अधिग्रहण में AI को एक भूमिका निभाने की अनुमति देंगे? क्या AI कचरा ढेर को देख सकता है?

  • क्या वे विकासात्मक संपादन, पंक्ति संपादन और कॉपी संपादन में AI को एक भूमिका निभाने की अनुमति देंगे?

  • क्या वे प्रिंट रनों और आवंटनों को निर्धारित करने में AI को एक भूमिका निभाने की अनुमति देंगे?

  • सुलभ ईबुक फाइलें बनाने में, जिसमें वैकल्पिक पाठ भी शामिल है?

  • उन मामलों में ऑडियोबुक निर्माण में सहायता करने में जहां प्रतिभाशाली मानव कथाकारों को नियुक्त करना आर्थिक रूप से यथार्थवादी नहीं है?

  • उन बाजारों में विदेशी भाषा अनुवाद में सहायता करने में जहां अधिकार कभी बेचे नहीं जाएंगे?

  • बड़े पैमाने पर विपणन सामग्री विकसित करने में?

  • पुनर्विक्रेताओं के साथ संचार करने में?

यदि ऐसा है तो उन्हें यह स्पष्ट करना चाहिए, और इन नीतियों के पीछे की सोच को स्पष्ट रूप से समझाना चाहिए। प्रकाशकों को इस समय के डर और संदेह में अधिकांश लेखकों की कई आपत्तियों का सामना करने में साहसी होना चाहिए।

नौकरी पर विचार

An icon of a key

केवल सबसे बड़े प्रकाशक एआई सॉफ्टवेयर और सिस्टम के साथ काम करने के लिए समर्पित कर्मचारियों को नियुक्त कर पाएंगे। औसत प्रकाशक अपने सभी कर्मचारियों को एआई उपकरणों से अवगत कराना चाहेंगे, यह अपेक्षा करते हुए कि प्रत्येक अपने काम में प्रभावशीलता खोजने के लिए एआई का उपयोग कर सकता है।

फरवरी 2024 में एरिजोना में हुए पबवेस्ट सम्मेलन में प्रकाशन उद्योग के बाहर के एक वक्ता ने सुझाव दिया कि एआई का एक उपयोग प्रशिक्षुओं को बदलने के लिए होगा। कमरा आग की लपटों में फूट पड़ा। उनका मतलब अच्छा था—वास्तव में 10 अप्रैल, 2024 की न्यूयॉर्क टाइम्स रिपोर्ट में बताया गया है कि वॉल स्ट्रीट निवेश बैंक अपने कई प्रशिक्षुओं को एआई से बदलने की सोच रहे हैं। प्रकाशन के मामले में भी, एक स्पष्ट चिंता है: यदि वरिष्ठ विश्लेषकों को जूनियर विश्लेषक के रूप में शुरुआत करने का मौका नहीं मिलता है तो आप वरिष्ठ विश्लेषकों को कैसे पाएंगे?

प्रकाशन उद्योग ने हमेशा इंटर्नशिप पर भरोसा किया है। 2019 के एक अध्ययन में पाया गया कि 80 प्रतिशत लोग जिन्होंने पंद्रह साल से कम समय के लिए प्रकाशन में काम किया था, उन्होंने पहले इंटर्नशिप की थी।

किसी हद तक यह एक उचित लागत पर मेहनत का काम निपटाने का तरीका है। लेकिन यह उस बड़ी सच्चाई के सामने फीका पड़ जाता है कि कोई भी प्रकाशन स्कूल किसी को मिडिल-मैनेजर के स्तर पर प्रकाशन कंपनी में शामिल होने के लिए तैयार नहीं कर सकता। कल के कुशल कर्मचारियों को विकसित करने का एकमात्र तरीका आज प्रशिक्षुओं और प्रशिक्षुओं को प्रशिक्षित करना है।

यहां उद्देश्य प्रशिक्षुओं को एआई से बदलने की कोशिश करना नहीं है, बल्कि एआई उपकरणों का उपयोग करके उनके काम को अधिक उत्पादक और पुरस्कृत बनाना है, जिससे प्रशिक्षु और प्रकाशन कंपनी दोनों को लाभ हो।

ऑडियोबुक्स के लिए एआई

An icon of a key

ऑडियोबुक्स के लिए एआई वास्तव में बहुत अच्छा काम करता है। यह परिपूर्ण नहीं है, लेकिन यह काम करता है। लेखक और प्रकाशक अब नियमित रूप से ऑडियोबुक उत्पादन में एआई उपकरणों का उपयोग कर रहे हैं, मुख्य रूप से उन पुस्तकों के लिए जहां पूर्ण-पैमाने पर कथावाचक-केंद्रित ऑडियोबुक उत्पादन वित्तीय रूप से संभव नहीं है। और न केवल अंग्रेजी भाषा की ऑडियोबुक्स के लिए, बल्कि अनुवाद में ऑडियोबुक्स के लिए भी।

ऑडियोबुक्स के लिए एआई का उपयोग नया नहीं है; मैंने सबसे पहले इस प्रवृत्ति की रिपोर्ट 2021 में पब्लिशर्स वीकली में की थी। लेकिन नए बड़े भाषा मॉडल ने स्वचालित ऑडियोबुक कथन के लिए प्रौद्योगिकी को पुनर्जीवित कर दिया है।

2021 में मैंने नोट किया था, “क्या यह परफेक्ट है? बिल्कुल नहीं। क्या यह काफी अच्छा हो सकता है? शायद, अगर एक प्रकाशक इस परियोजना के वॉयस एडिटिंग चरण में आवश्यक समय बिताने को तैयार है।” ढाई साल बाद, कई खातों के अनुसार, एआई-आवाजें मानव आवाजों से अप्रभेद्य हैं, जब तक आप बहुत करीब से सुन नहीं रहे होते।

पिछले नवंबर में मेटा (फेसबुक) ने “सीमलेस” पेश किया, जो “स्वर, भावनात्मक अभिव्यक्ति, और वोकल स्टाइल गुणों” को 200 भाषाओं के अनुवाद में स्थानांतरित कर सकता है। एक ऑडियोबुक को तुरंत कई भाषाओं में असाधारण गुणवत्ता के साथ अनुवादित किया जा सकता है।

2021 में मैंने यह भी रिपोर्ट किया था कि “नॉन-ह्यूमन नैरेटर्स के साथ ऑडियोबुक के वितरण पर ऑडिबल का प्रतिबंध एक वास्तविक समस्या है जिसे सुलझाने में कुछ समय लग सकता है।” इस बीच, गूगल और एप्पल दोनों ने लेखकों को एआई-जनित आवाज़ों के साथ ऑडियोबुक बनाने की अनुमति देने के कार्यक्रम घोषित किए। 5 दिसंबर को, Spotify के फाइंडअवे वॉयस ने “Google Play Books से डिजिटल वॉयस नैरेटेड ऑडियोबुक को चुनिंदा रिटेल पार्टनर्स के लिए वितरण के लिए स्वीकार करना शुरू किया।”

नवंबर 2023 की शुरुआत में अमेज़न ने घोषणा की कि किंडल डायरेक्ट पब्लिशिंग (KDP) लेखक जल्द ही एक सेवा तक पहुंच प्राप्त करेंगे जो उन्हें “आभासी आवाज़ वर्णन, एक सिंथेटिक स्पीच तकनीक का उपयोग करके अपने ईबुक का ऑडियोबुक संस्करण जल्दी और आसानी से बनाने की अनुमति देगा।” जनवरी 2024 में, जेन फ्राइडमैन ने रिपोर्ट किया (paywall) “ऑडिबल ने चुपचाप एआई-नैरेटेड ऑडियोबुक को पिछले पतझड़ में अपने स्टोरफ्रंट में प्रवेश करने की अनुमति देना शुरू कर दिया, जब अन्य रिटेलर्स ने पहले ही ऐसा कर दिया था।”

और, निश्चित रूप से, मैं इस पुस्तक के ऑडियोबुक संस्करणों के लिए एआई का उपयोग कर रहा हूँ।

पुस्तक अनुवाद के लिए एआई

An icon of a key

पुस्तक अनुवाद के लिए एआई काम करता है। शायद ऑटोमेटेड ऑडियोबुक निर्माण की तरह अच्छा न हो। लेकिन यह बहुत तेजी से बहुत करीब आ रहा है। गैर-साहित्यिक कथा पहले हो सकती है। साहित्यिक कथा इसके बाद आ सकती है। गैर-फिक्शन अलग-अलग चुनौतियों को पेश करता है।

मैंने जून 2024 में BISG द्वारा प्रायोजित पुस्तक अनुवाद के लिए एआई पर एक वेबिनार की मेजबानी की। वीडियो ऑनलाइन YouTube पर है। जेन फ्राइडमैन ने भी अपने हॉट शीट न्यूज़लेटर में इस कार्यक्रम का वर्णन किया है।

विषय जटिल और सूक्ष्म है। एक चीज जो मुझे आकर्षक लगती है वह है कि लोग कितने समय से अनुवाद को स्वचालित करने की कोशिश कर रहे हैं। यह याद दिलाता है कि किताबें, जो हमारे ब्रह्मांड को भरती हैं, लिखित संचार का केवल एक छोटा हिस्सा हैं, विशेष रूप से इस ऑनलाइन युग में।

मशीन अनुवाद (एमटी) के जनक के रूप में श्रेय प्राप्त वॉरेन वीवर ने एक सहकर्मी से कहा, “जब मैं रूसी में एक लेख देखता हूँ, तो मैं कहता हूँ: ‘यह वास्तव में अंग्रेजी में लिखा गया है, लेकिन इसे कुछ अजीब प्रतीकों में कोडित किया गया है। अब मैं इसे डिकोड करने जा रहा हूँ।’” मशीन के लिए, भाषा सिर्फ कोड है। यह संस्कृति और भावना और लिखित भाषा की भव्यता नहीं है। यह संख्याओं और कोड के साथ एक कार्य है।

स्पष्ट रूप से, कल्पना/गैर-कल्पना विभाजन एआई अनुवाद में प्रमुख भूमिका निभाएगा। चैट एआई शैली में मजबूत है, लेकिन तथ्यों में कमजोर है। यह बहुत प्रारंभिक दिन हैं, लेकिन मैं मानता हूँ कि चैट एआई कल्पना में चमकेगा, लेकिन गैर-कल्पना में कम आएगा। (फिर भी, मैं इस तथ्य-भरे पुस्तक को मशीन-ट्रांसलेट करने के लिए आगे बढ़ रहा हूँ!)

साहित्यिक कल्पना बहुत महत्वपूर्ण है। यह मूल्यवान और सम्मानित है और सही रूप से ऐसा है। अनुवादक एक शब्द या वाक्यांश पर घंटों बहस कर सकते हैं। चैट एआई को उन जलों में सावधानीपूर्वक चलना चाहिए।

लेकिन यह उपजाऊ क्षेत्र है। जहां तक मैं निर्धारित कर सकता हूँ (कम डेटा से), 2023 में केवल 9,500 व्यापार पुस्तक अनुवाद थे। भले ही मैं बड़े कारक से गलत हूँ, यह स्पष्ट है कि विदेशी भाषाओं से अंग्रेजी में बहुत कम किताबें अनुवादित हो रही हैं।

इसी प्रकार, मैंने एक आंकड़ा पाया जो दर्शाता है कि 2023 में केवल 7,230 अनुवाद अंग्रेजी से स्पेनिश में (स्पेनिश पुस्तक बाजारों में) थे। यह हास्यास्पद रूप से छोटा लगता है।

यहां एक बड़ा अवसर है।

पुस्तक अनुवाद के लिए एआई का अधिकांश उपयोग उन पुस्तकों के लिए होगा जहां अनुवाद को आर्थिक रूप से व्यवहार्य नहीं माना गया था। “मिड-मार्केट” पुस्तकों के अनुवादकों पर नौकरी का प्रभाव अवश्य होगा; नौकरी की वृद्धि परियोजनाओं के प्रबंधन और क्यूए में होगी। क्या यह नौकरी के नुकसान की भरपाई करेगा? असंभावित।

जैसा कि एआई के अधिकांश पहलुओं के साथ होता है, यहां चुनौतीपूर्ण मुद्दे हैं जिन्हें संबोधित किया जाना चाहिए, और कोई आसान उत्तर नहीं हैं।

जैसा कि मैं सॉफ़्टवेयर अनुभाग में नोट करता हूँ, Leanpub और DeepL दो कंपनियाँ हैं जो लेखकों और प्रकाशकों को एआई-सहायता प्राप्त पुस्तक अनुवाद सेवाएँ प्रदान कर रही हैं।

शैक्षणिक प्रकाशन के लिए एआई

An icon of a key

व्यापार प्रकाशकों और सभी प्रकार के लेखकों को शैक्षणिक प्रकाशन समुदाय में एआई के प्रक्षेपवक्र पर ध्यान देना चाहिए। यह उपभोक्ता प्रकाशन में तेजी से आगे बढ़ रहा है।

मुझे इस प्रगति के दो कारण दिखाई देते हैं। पहला, विद्वतापूर्ण प्रकाशन के लेखकों का पेशा अकादमिक होता है, और एसटीएम क्षेत्र (वैज्ञानिक, तकनीकी और चिकित्सा) में, वे अक्सर उच्च डिग्री वाले वैज्ञानिक होते हैं। प्रकाशन से अलग, वे अपने कार्य में एआई की जाँच कर रहे हैं और अक्सर उसे अपना रहे हैं। उनके लिए यह अधिक आश्चर्यजनक होता कि उनका प्रकाशक उनके कार्य को संपादित और प्रकाशित करने में एआई का उपयोग नहीं कर रहा होता।

यह विद्वतापूर्ण प्रकाशन पारिस्थितिकी तंत्र तक पहुँचता है, जहाँ संपादक अक्सर स्वयं विद्वान होते हैं। उनके लिए, प्रौद्योगिकी भयावह नहीं है।

मैं इस पुस्तक में विशेषताओं पर और अधिक गहराई से नहीं जाऊंगा; मैं इसे अपने ब्लॉग पर अधिक विस्तार से रिपोर्ट करूंगा।

लेखकों के लिए एआई

लेखक और प्रकाशक अक्सर खुद को दो अलग-अलग दुनियाओं में रहते हुए देखते हैं, जुड़े हुए, लेकिन मूल रूप से अलग। आधुनिक प्रकाशन में यह काफी हद तक सच रहा है।

समय बदलता है। जहाँ कभी प्रकाशक अछूत थे, अब शीर्ष लेखक निर्णय लेते हैं। जैसा कि मैंने अन्यत्र चर्चा की है, स्वयं-प्रकाशित लेखक अग्रदूत हैं। वे पारंपरिक प्रकाशन को बोझिल बनाने वाले बंधनों में फँसे नहीं हैं।

जब प्रकाशक एआई को देखते हैं, तो उन्हें कुछ अवसर दिखते हैं। जब मैं लेखकों से एआई के बारे में बात करता हूँ, तो दुनिया उनके लिए खुला खज़ाना है। संभावनाएँ लगभग अनंत हैं:

लेखन और संपादन

  • पूरी किताबें लिखने और प्रकाशित करने की कोशिश

  • नए परियोजना के लिए विचारशील होना

  • नई किताब के भीतर विचारशील होना

  • कहानी को ठीक करना

  • अनुसंधान

  • तथ्यों की जाँच

  • लेखन साथी

  • विकासात्मक संपादन

  • प्रतिलिपि संपादन

  • वर्तनी-जाँच और व्याकरण-जाँच

  • प्रूफरीडिंग

चित्रण/छवि निर्माण

  • चित्र और चार्ट बनाना

  • कवर डिज़ाइन का प्रारूप

  • वीडियो प्रमोशन

विपणन

  • एजेंटों, प्रकाशकों, प्रतियोगिताओं, मित्रों, ब्लर्ब अनुरोधों को स्वचालित रूप से सबमिट करना

  • विपणन सामग्री उत्पन्न करना: प्रेस विज्ञप्ति, ब्लॉग पोस्ट, सोशल मीडिया, आदि।

  • वेबसाइट निर्माण

लेखक उद्योग में एआई के अपनाने में परिवर्तन लाने वाले होंगे, चाहे इसके पक्ष में या विरोध में।

वे एआई के लेखन और प्रकाशन से संबंधित नवाचारों के काफी बड़े लाभार्थी हैं — लगभग 70% स्टार्टअप लेखक के साथ उनकी यात्रा पर काम करने की कोशिश कर रहे हैं।

एआई से संबंधित चिंताएँ और जोखिम

An icon of a key

एआई से संबंधित चिंताएँ गंभीर हैं। जोखिम वास्तविक हैं। कभी-कभी उन्हें उन्मादी तरीकों से व्यक्त किया जाता है, लेकिन, जब आप गहराई से देखते हैं, तो एआई का प्रभाव अत्यधिक विनाशकारी होने की संभावना है।

कृत्रिम बुद्धिमत्ता के आसपास इतनी सारी समस्याएँ और चिंताएँ हैं कि वे स्वयं में ही कई खंड भर देती हैं। यहाँ उन विषयों का एक शब्द बादल है जिन पर मैं नज़र रखता हूँ। मुझे यकीन है कि मैं कुछ को याद कर रहा हूँ।

कृत्रिम बुद्धिमत्ता शब्द के चारों ओर केंद्रित एक शब्द बादल, जिसमें संबंधित शब्द जैसे 'चिंताएँ', 'नैतिकता', और 'मानवता' शामिल हैं।

इनमें से प्रत्येक विषय पर बहुत सारी जानकारी उपलब्ध है, और मैं आपको जितना गहराई से संभव हो पढ़ने के लिए प्रोत्साहित करता हूँ। यह संभव है कि आप निष्कर्ष निकालें कि जोखिम लाभ से अधिक हैं, और आप व्यक्तिगत रूप से या अपने संगठन के भीतर कृत्रिम बुद्धिमत्ता का उपयोग नहीं करना चाहते हैं। वह निर्णय अपने स्वयं के जोखिम लाता है; सामान्यतः, पीछे छूट जाने का। लेकिन यह एक व्यक्तिगत निर्णय है।

यदि आप “कृत्रिम बुद्धिमत्ता के जोखिमों के बारे में किताबें” गूगल करेंगे तो आपको कुछ उपयोगी खंड मिलेंगे। एक हालिया पॉडकास्ट जो मुझे विशेष रूप से डरावना लगा वह था Ezra Klein की बातचीत Dario Amodei के साथ, Anthropic के सह-संस्थापक और सीईओ (वह कंपनी जो Claude.ai का विकास करती है)। आप सीखेंगे कि ये कंपनियाँ जोखिमों के बारे में जागरूक हैं। Amodei एक आंतरिक जोखिम वर्गीकरण प्रणाली का जिक्र करते हैं जिसे A.S.L. कहा जाता है, “AI Safety Levels” के लिए (अमेरिकी सांकेतिक भाषा नहीं)। हम वर्तमान में ASL 2 पर हैं, “ऐसी प्रणालियाँ जो खतरनाक क्षमताओं के शुरुआती संकेत दिखाती हैं—उदाहरण के लिए जैविक हथियार बनाने के निर्देश देने की क्षमता।” वह ASL 4 को “राज्य-स्तरीय अभिनेताओं को उनकी क्षमता को बहुत बढ़ाने में सक्षम बनाना… जहां हमें चिंता होगी कि उत्तर कोरिया या चीन या रूस एआई के साथ विभिन्न सैन्य क्षेत्रों में अपनी आक्रामक क्षमताओं को बहुत अधिक बढ़ा सकते हैं जिससे उन्हें भू-राजनीतिक स्तर पर महत्वपूर्ण लाभ मिल सकता है।” डरावनी चीजें।

इस गंभीर संदर्भ में, मैं लेखकों और प्रकाशकों के लिए सबसे प्रासंगिक मुद्दों को उजागर करूंगा।

कॉपीराइट उल्लंघन?

An icon of a key

कॉपीराइट मुद्दे जटिलता और अस्पष्टता की एक धुंध हैं। ऐसा निश्चित प्रतीत होता है कि कुछ पुस्तकें जो अभी भी कॉपीराइट में हैं, कुछ LLMs के प्रशिक्षण में शामिल थीं। लेकिन यह निश्चित रूप से नहीं कहा जा सकता है, जैसा कि कुछ लेखक डरते हैं, कि उनके सारे काम को हर बड़े भाषा मॉडल में समेट लिया गया है।

कॉपीराइट मुद्दे विशिष्ट और व्यापक दोनों हैं। यह अच्छी तरह से ज्ञात है कि सभी LLMs खुली वेब पर प्रशिक्षित किए जाते हैं - आज वेब पर मौजूद 1.5 बिलियन साइटों से जो कुछ भी स्क्रैप किया जा सकता है, चाहे वह समाचार पत्र लेख हों, सोशल मीडिया पोस्ट, वेब ब्लॉग और, जाहिर तौर पर, YouTube वीडियो के प्रतिलिपियाँ हों।

यह सिद्ध किया जा सकता है कि कम से कम एक LLM ने सार्वजनिक डोमेन में नहीं आने वाले हजारों पुस्तकों के वास्तविक पाठ को निगल लिया।

क्या यह कानूनी था कि इस सभी पाठ को अरबों डॉलर की AI कंपनियों के निर्माण में मदद करने के लिए निगल लिया जाए, बिना लेखकों को कोई मुआवजा दिए? AI कंपनियां उचित उपयोग के चारों ओर अपनी दलीलें देती हैं; अदालतें अंततः निर्णय लेंगी। भले ही यह कानूनी था, क्या यह नैतिक या नैतिक था? नैतिकता कानूनी विचारों की तुलना में कम जटिल प्रतीत होती है। आप निर्णय लें।

कॉपीराइट से संबंधित कानून स्पष्ट रूप से उन अनूठी चुनौतियों का पूर्वानुमान नहीं लगा सकते थे जो AI इस मुद्दे पर लाते हैं, और कानूनी समाधान खोजने में समय लगेगा, शायद वर्षों। (यदि आप जानना चाहते हैं कि कानून विशेष समस्या के लिए क्यों अनुपयुक्त हैं, तो A. Feder Cooper और James Grimmelmann द्वारा उत्कृष्ट पेपर पढ़ें जिसे “The Files are in the Computer: Copyright, Memorization, and Generative AI” कहा जाता है।)

यहाँ सबसे प्रमुख तेरह मामलों की सूची है, जिनमें सभी पुस्तकों से संबंधित नहीं हैं; बल्कि छवियाँ और संगीत भी शामिल हैं। और यहाँ एक और सूची है जो सभी मुकदमों की स्थिति को अपडेट करती है।

लेखकों के लिए कॉपीराइट और AI

An icon of a key

लेखकों को AI-जनित सामग्री की कॉपीराइट-क्षमता से संबंधित अतिरिक्त समस्याओं का सामना करना पड़ता है।

AI-जनित सामग्री की कॉपीराइट-क्षमता पर U.S. Copyright Office का रुख कहता है कि AI अकेले कॉपीराइट नहीं रख सकता क्योंकि इसके पास लेखक की कानूनी स्थिति नहीं है। यह समझ में आता है। लेकिन यह 100% काम AI-जनित होने की धारणा पर आधारित है। जैसा कि अन्यत्र चर्चा की गई है, कुछ ही लेखक AI को पूरी पुस्तक बनाने देंगे। संभावना है कि यह 5%, या 10% या… और यहाँ Copyright Office लड़खड़ा जाता है (जैसे मैं भी करता)।

हाल के एक निर्णय में ऑफिस ने निष्कर्ष निकाला कि एक ग्राफिक उपन्यास जिसमें मानव द्वारा लिखित पाठ और AI सेवा Midjourney द्वारा उत्पन्न छवियां शामिल हैं, एक कॉपीराइट योग्य कार्य है, लेकिन व्यक्तिगत छवियों को कॉपीराइट द्वारा संरक्षित नहीं किया जा सकता है।“ वाह!

An icon of a key

संक्षेप में कहें तो लेखकों और प्रकाशकों को कई मोर्चों पर विकसित हो रहे कॉपीराइट मुद्दों के प्रति सतर्क रहने की आवश्यकता है।

दीर्घकालिक प्रभाव क्या हैं?

कुछ लोग वर्तमान मुकदमेबाजी की तुलना Google पुस्तकों के मुकदमे से करते हैं, जिसे कानूनी रूप से हल करने में 10 साल लग गए। कौन जानता है कि इन फाइलिंग्स के लिए अपील की प्रक्रिया कितने समय तक चलेगी। इस बीच, प्रकाशक यह मान कर कार्य कर रहे हैं कि AI कंपनियां हार जाएंगी, जो कम से कम सैद्धांतिक रूप से, किसी को भी जो चैट AI का लाइसेंस या उपयोग करता है, किसी प्रकार की सशर्त देयता के लिए उजागर करता है।

लेकिन यह एक प्रकाशक की सबसे गंभीर समस्या नहीं है। यह धारणा है। कई लेखकों के लिए, कुछ प्रमुख, कुछ अस्पष्ट, कुएं में जहर घोल दिया गया है। लेखन और प्रकाशन समुदाय के भीतर AI रेडियोधर्मी है। AI की झलक भी तीव्र आलोचना को आमंत्रित करती है।

कई उदाहरण हैं। हाल के एक घटना में, यूके के एक प्रकाशक Angry Robot, जो “आधुनिक वयस्क विज्ञान कथा, फैंटेसी और WTF में सर्वश्रेष्ठ” को समर्पित है, ने घोषणा की कि वह Storywise नामक AI सॉफ़्टवेयर का उपयोग करेगा, एक अपेक्षित बड़ी बैच की पांडुलिपि प्रस्तुतियों को छांटने के लिए। कंपनी को योजना को छोड़ने और पुराने इनबॉक्स पर वापस जाने में सिर्फ पांच घंटे लगे।

AI उपकरणों का आंतरिक रूप से उपयोग करने में व्यापार प्रकाशकों के लिए असहनीय दुविधा: यदि आपके लेखकों को पता चलता है, तो आप परिणामी तूफान को झेलने में कठिन समय पाएंगे। मेरा मानना है कि प्रकाशकों के पास बहादुर बनने के अलावा कोई विकल्प नहीं है, (कम से कम कुछ) उपकरणों को अपनाने, स्पष्ट रूप से समझाने कि उन उपकरणों को कैसे प्रशिक्षित किया जाता है और उनका उपयोग कैसे किया जाता है, और आगे बढ़ने का।

यूके में, लेखक सोसायटी एक सख्त रुख अपनाती है: “अपने प्रकाशक से पुष्टि करने के लिए कहें कि वह आपके काम के संबंध में किसी भी उद्देश्य के लिए AI का पर्याप्त उपयोग नहीं करेगा - जैसे कि प्रूफ-रीडिंग, संपादन (प्रामाणिकता पठनों और तथ्य-जांच सहित), अनुक्रमण, कानूनी जांच, डिज़ाइन और लेआउट, या आपकी सहमति के बिना कुछ भी। आप AI द्वारा प्रस्तुत ऑडियोबुक वर्णन, अनुवाद और कवर डिज़ाइन को निषिद्ध करना चाह सकते हैं।”

लेखक संघ ऐसा स्वीकार करता प्रतीत होता है कि “प्रकाशक अपने संचालन के सामान्य कोर्स में संपादकीय और विपणन उपयोग सहित, एआई को एक उपकरण के रूप में उपयोग करने का पता लगाने लगे हैं।” मुझे नहीं लगता कि संघ के कई सदस्य उतने ही समझदार हैं।

एआई कंपनियों को सामग्री का लाइसेंस देना

अधिकांश प्रकाशक, और कई लेखक, एआई कंपनियों को सामग्री का लाइसेंस देने के तरीकों की खोज कर रहे हैं। हर किसी का विचार अलग है कि लाइसेंसिंग की शर्तें क्या होनी चाहिए, और उनकी सामग्री की कीमत कितनी होनी चाहिए, लेकिन कम से कम चर्चाएं चल रही हैं।

कई स्टार्टअप प्रकाशकों (और, कुछ मामलों में, व्यक्तिगत लेखकों) के साथ काम करने की तलाश में हैं। Calliope Networks और Created by Humans इस संबंध में दोनों दिलचस्प हैं।

मध्य जुलाई में, Copyright Clearance Center, जो लंबे समय से सामूहिक कॉपीराइट लाइसेंसिंग में उद्योग का मुख्य खिलाड़ी रहा है, ने घोषणा की कि “कृत्रिम बुद्धिमत्ता (एआई) पुन: उपयोग अधिकार” अपनी वार्षिक कॉपीराइट लाइसेंस (ACL) के भीतर उपलब्ध हैं, जो व्यवसायों को लाखों कार्यों के अधिकार प्रदान करता है जो सदस्यता लेते हैं।“

Publishers Weekly ने घोषणा को कवर किया, जिसमें CCC के अध्यक्ष और सीईओ ट्रेसी आर्मस्ट्रांग ने कहा “यह संभव है कि एआई समर्थक और कॉपीराइट समर्थक दोनों होना, और रचनाकारों के प्रति सम्मान के साथ एआई को जोड़ना।”

हालांकि यह सबको शामिल नहीं करता, यह संभवत: बड़े भाषा मॉडल डेवलपर्स के साथ प्रकाशन को एक स्तर की सहयोगिता की ओर ले जाने में एक सफलता है।

एआई से बचना अब देर हो चुकी है

An icon of a key

उन लेखकों और प्रकाशकों के लिए जो एआई के साथ नहीं जुड़ना पसंद करते हैं, खबर बुरी है: आप आज एआई का उपयोग कर रहे हैं, और वर्षों से इसका उपयोग कर रहे हैं।

कृत्रिम बुद्धिमत्ता, विभिन्न रूपों में, पहले से ही अधिकांश सॉफ्टवेयर टूल्स और सेवाओं में एकीकृत हो चुकी है जिनका हम हर दिन उपयोग करते हैं। लोग Microsoft Word या Gmail जैसे प्रोग्रामों में एआई-समर्थित वर्तनी और व्याकरण-जांच पर निर्भर करते हैं। Microsoft Word और PowerPoint लेखन सुझाव देने, डिजाइन और लेआउट सिफारिशें देने आदि के लिए एआई का उपयोग करते हैं। Siri और Alexa जैसे वर्चुअल असिस्टेंट प्राकृतिक भाषा प्रसंस्करण का उपयोग करते हैं ताकि वॉइस कमांड को समझ सकें और सवालों का जवाब दे सकें। ईमेल सेवाएं संदेशों को फ़िल्टर करने, स्पैम का पता लगाने और अलर्ट भेजने के लिए एआई का उपयोग करती हैं। एआई ग्राहक सेवा चैटबॉट्स को शक्ति देता है और आपके खरीद इतिहास के आधार पर उत्पाद अनुशंसाएँ उत्पन्न करता है।

और इसका अधिकांश हिस्सा बड़े भाषा मॉडलों पर आधारित है, जैसे कि यह ChatGPT के साथ है।

किसी लेखक या संपादक के लिए यह कहना, “मैं नहीं चाहता कि मेरे पांडुलिपि पर एआई का उपयोग हो,” व्यापक रूप से बोलते हुए, लगभग असंभव है, जब तक कि वे और उनके संपादक टाइपराइटर और पेंसिल का उपयोग नहीं करते।

वे कहने की कोशिश कर सकते हैं, “मैं नहीं चाहता कि जनरेटिव एआई” का उपयोग उनकी पुस्तक पर हो। लेकिन इसे टुकड़ों में बांटना मुश्किल है। व्याकरण-जांच सॉफ्टवेयर मूल रूप से जनरेटिव एआई पर नहीं बनाया गया था। Grammarly ने इसे अपने उत्पाद में एक घटक के रूप में जोड़ा है, जैसे कि सभी अन्य वर्तनी और व्याकरण जांचकर्ताओं ने किया है। जनरेटिव एआई विपणन सॉफ्टवेयर में भी प्रमुख है।

जब लेखक एआई का उपयोग करते हैं

लेखकों और एआई के उपयोग का एक अन्य पहलू उपरोक्त वर्णित कॉपीराइट मुद्दे के समान है। चरम स्थिति में, हम अमेज़न पर 100% एआई-जनित सामग्री प्रकाशित होते देख रहे हैं। इसका अधिकांश (सभी?) खराब गुणवत्ता का है, लेकिन इससे इसे प्रकाशित होने से नहीं रोका जा सकता। (अमेज़न अनुभाग भी देखें।) प्रकाशकों के लिए अधिक चिंताजनक है एआई-जनित सबमिशन। हाँ, एआई मात्रा बढ़ाता है, लेकिन बड़े प्रकाशकों के पास पहले से ही मात्रा के लिए एक फिल्टर है। इन फिल्टर को एजेंट कहा जाता है। उन्हें यह पता लगाना होगा कि मात्रा समस्या को कैसे संभालना है, और जाहिर तौर पर उन्हें एक ऐसा समाधान खोजना होगा जो एआई का उपयोग न करे।

यह कुछ हद तक एक अस्तित्वगत समस्या है—क्या मैं ‘मशीन द्वारा लिखी गई’ पुस्तक प्रकाशित करना चाहता हूँ? अधिकांश प्रकाशकों के लिए यह स्पष्ट ‘नहीं’ है। आसान काम। ठीक है, तो एक पुस्तक जिसमें 50% सामग्री एक सक्षम लेखक की निगरानी में एक LLM द्वारा जनित की गई है, के बारे में क्या? हम्म, चलो इसे भी ‘नहीं’ कहते हैं। ठीक है: फिर 25%, या 10%, या 5% के बारे में क्या? रेखा कहाँ खींचें?

और, अब जब आप रेखा खींचने के व्यवसाय में प्रवेश कर चुके हैं, तो आप उस दुविधा को कैसे हल करते हैं कि वर्तनी और व्याकरण उपकरण अब कम से कम आंशिक रूप से जनरेटिव एआई पर निर्भर करते हैं? AI-चालित प्रतिलेखन उपकरणों के बारे में क्या, जैसे Otter.ai, या Microsoft Word में निर्मित प्रतिलेखन सुविधा?

मुझे कोई व्यापारिक प्रकाशक नहीं मिला है जिसने घोषणा की है कि वे एक पूर्व-निर्धारित मात्रा में एआई-जनित पाठ के साथ काम प्रकाशित नहीं करेंगे। यहाँ इस विषय पर Authors Guild का कहना है:

“यदि आपके पांडुलिपि में एक प्रशंसनीय मात्रा में एआई-जनित पाठ, पात्र, या कथानक शामिल हैं, तो आपको इसे अपने प्रकाशक को प्रकट करना चाहिए और इसे पाठक को भी प्रकट करना चाहिए। हम नहीं सोचते कि लेखकों को विचार मंथन, विचार उत्पन्न करने, या प्रतिलिपि संपादन के लिए केवल एक उपकरण के रूप में एआई का उपयोग करने पर खुलासा करने की आवश्यकता है।”

बिना कहे ही, ‘प्रशंसनीय’ को परिभाषित नहीं किया गया है (ऑक्सफोर्ड इसे “इतना बड़ा कि ध्यान देने योग्य या महत्वपूर्ण समझा जाए” के रूप में परिभाषित करता है), लेकिन पोस्ट आगे बताता है कि “न्यूनतम एआई-जनित पाठ” से अधिक का समावेश अधिकांश प्रकाशन अनुबंधों का उल्लंघन करेगा। कानूनी शब्दों में, न्यूनतम को सटीक रूप से निर्दिष्ट नहीं किया गया है, लेकिन सामान्य रूप से इसका मतलब प्रशंसनीय के समान ही है।

क्या लेखन में एआई का पता लगाया जा सकता है?

मैंने मई, 2024 में BISG द्वारा प्रायोजित एआई पहचान पर एक वेबिनार की मेजबानी की। पुनःप्रसारण यूट्यूब पर ऑनलाइन उपलब्ध है। जेन फ्रीडमैन ने अपने हॉट शीट न्यूज़लेटर में वेबिनार का एक व्यापक लेख प्रस्तुत किया।

कई लेखकों के लिए, एआई की विषाक्तता का मतलब है कि इसे उनके शब्दों से दूर रखना। प्रकाशक एक विशेष भार वहन करते हैं - वे पाठ नहीं बनाते, लेकिन एक बार प्रकाशित होने के बाद, वे पाठ के प्रति एक महत्वपूर्ण दायित्व उठाते हैं। हमने कई बार ज्वलनशील पुस्तकों के पास डायनामाइट फटते देखा है, चाहे वह सामग्री के सामाजिक निहितार्थों के आसपास हो, या अन्य लेखकों के शब्दों और विचारों की साहित्यिक चोरी हो। अब एआई के साथ हम नैतिक और कानूनी मुद्दों का एक नया सेट सामना कर रहे हैं, जिनमें से कोई भी प्रकाशन स्कूल में रेखांकित नहीं किया गया था।

इसका एक हिस्सा ऐसा लगता है जैसे लोग छात्रों के लिए चिंतित हैं, कि एआई का उपयोग किसी न किसी तरह से धोखा देना है, जैसे कि विकिपीडिया लेख से नकल करना, या शायद किसी दोस्त से आपका निबंध लिखने के लिए कहना।

हमारे वेबिनार के वक्ताओं में से एक, एक शिक्षक, जोस बाउएन ने छात्रों के लिए अपना खुलासा साझा किया। यह बिल्कुल वैसा नहीं है जैसा आप किसी लेखक के लिए उपयोग करेंगे, लेकिन यह एआई उपयोग के कुछ प्रकार के “जोखिम स्तर” को प्रदर्शित करता है।

छात्रों के लिए टेम्पलेट डिस्क्लोजर एग्रीमेंट

  • मैंने इस पूरे काम को अपने दम पर बिना दोस्तों, उपकरणों, प्रौद्योगिकी, या एआई की सहायता के किया है।

  • मैंने पहला ड्राफ्ट किया, लेकिन फिर दोस्तों/परिवार, एआई पैराफ्रेज/व्याकरण/साहित्यिक चोरी सॉफ्टवेयर से इसे पढ़ने और सुझाव देने को कहा। मैंने इस मदद के बाद निम्नलिखित बदलाव किए:

    • वर्तनी और व्याकरण सही किया गया

    • संरचना या क्रम बदल दिया गया

    • पूरे वाक्य/अनुच्छेद दोबारा लिखे गए

  • मैंने समस्याओं पर अटककर थिसॉरस, डिक्शनरी का उपयोग किया, दोस्त को फोन किया, हेल्प सेंटर गया, Chegg या अन्य समाधान प्रदाता का उपयोग किया।

  • मैंने विचार उत्पन्न करने में मदद के लिए AI/दोस्तों/ट्यूटर का उपयोग किया।

  • मैंने रूपरेखा/पहला ड्राफ्ट बनाने के लिए सहायता/उपकरण/AI का उपयोग किया, जिसे मैंने फिर संपादित किया। (अपना योगदान वर्णन करें।)

और इस प्रकार एक प्रकाशक अपने लेखकों के लिए कुछ ऐसा तैयार कर सकता है। मान लीजिए लेखक शीर्ष स्तर पर यह प्रकट करता है: मैंने AI का व्यापक उपयोग किया, फिर परिणामों को संपादित किया। फिर क्या? क्या आप स्वचालित रूप से पांडुलिपि को अस्वीकार कर देंगे? यदि हां, तो क्यों?

और, इस बीच, यदि आप ध्यान दे रहे हैं, तो आप सीखते हैं कि वह पांडुलिपि जिसे आपने अभी पढ़ा और पसंद किया, जिसे लेखक ने कसम खाई थी कि वह Grammarly द्वारा भी स्पेल-चेक नहीं की गई थी, वास्तव में 90% AI द्वारा उत्पन्न हो सकती थी, एक लेखक द्वारा जो इसके उपयोग को छिपाने में विशेषज्ञ है।

आप फिर से सवाल पर पुनर्विचार करने के लिए मजबूर होते हैं। यह बन जाता है, “मैं इस चीज़ का पता लगाने के लिए इतना दृढ़ क्यों हूँ जो अप्राप्य है?”

आंशिक रूप से यह AI-जनित पाठ की कॉपीराइट योग्यता के बारे में चिंताजनक चिंता है। कॉपीराइट कार्यालय 100% AI-जनित पाठ (या संगीत, या छवियाँ, आदि) को कॉपीराइट सुरक्षा नहीं देगा। लेकिन 50% AI-जनित पाठ का क्या? खैर, हम केवल लेखक द्वारा उत्पन्न 50% को कवर करेंगे। और आप कैसे जानेंगे कि कौन सा आधा? हम उस पर वापस आएंगे।

क्या यह अच्छा नहीं होगा यदि आप प्रत्येक पांडुलिपि को किसी सॉफ़्टवेयर में डाल सकते जो आपको बता सके कि पाठ बनाने में AI का उपयोग किया गया था?

यह मुद्दा छोड़ते हुए कि इसे करने का एकमात्र तरीका AI उपकरणों का उपयोग करना होगा, अधिक महत्वपूर्ण प्रश्न यह है कि, क्या सॉफ़्टवेयर (पर्याप्त रूप से) सटीक होगा? क्या मैं इस पर भरोसा कर सकता हूँ कि यह मुझे बता सकेगा कि पांडुलिपि बनाने में AI का उपयोग किया गया था? और क्या मैं इस पर निर्भर कर सकता हूँ कि यह “झूठे सकारात्मक परिणाम” उत्पन्न नहीं करेगा - यह संकेत देने के लिए कि AI का उपयोग किया गया था, जबकि वास्तव में ऐसा नहीं किया गया था?

अब बाजार में बहुत सारे सॉफ़्टवेयर हैं जो इन चुनौतियों का सामना करते हैं। इस सॉफ़्टवेयर का मूल्यांकन करने वाले कई शैक्षणिक अध्ययन इसकी अविश्वसनीयता की ओर इशारा करते हैं। AI-जनित पाठ फिसल जाता है। इससे भी बदतर, जो पाठ AI द्वारा उत्पन्न नहीं किया गया था उसे झूठे-सकारात्मक के रूप में चिह्नित किया जाता है।

लेकिन पुस्तक प्रकाशक कुछ प्रकार की सुरक्षा उपायों की आवश्यकता महसूस करेंगे। ऐसा प्रतीत होता है कि, सर्वोत्तम स्थिति में, ये उपकरण आपको संभावित चिंताओं की ओर सचेत कर सकते हैं, लेकिन आपको हमेशा दोबारा जांच करनी होगी। तो शायद यह आपको उन पाठों की ओर सचेत कर सकता है जिन्हें अन्य की तुलना में अधिक सावधानीपूर्वक जांचने की आवश्यकता है? क्या यह एक दक्षता है?

सच्ची दक्षता पाठ की उत्पत्ति के बारे में चिंताओं से परे जाकर, इसके गुणवत्ता के हमारे मौजूदा मानदंडों को बनाए रखने में पाई जाएगी।

नौकरी का नुकसान

“आपकी जगह एआई नहीं लेगा। आपकी जगह वह व्यक्ति लेगा जो एआई का उपयोग करना जानता है।” —अनाम

एआई अपनाने से नौकरी का नुकसान गंभीर हो सकता है। अनुमान भिन्न हो सकते हैं, लेकिन संख्या निराशाजनक है। कुछ स्पष्ट उदाहरण हैं: सैन फ्रांसिस्को की चालक रहित टैक्सियाँ टैक्सी और राइडशेयर ड्राइवरों को समाप्त कर देती हैं। एआई-सupported निदान चिकित्सा तकनीशियनों की आवश्यकता को कम कर सकता है।

मेरे भीतर का आशावादी एक उदाहरण के रूप में स्प्रेडशीट के परिचय और इसके रोजगार पर प्रभाव की ओर इशारा करता है। जैसा कि आप नीचे दिए गए चार्ट में देख सकते हैं, “लेखांकन, कर तैयारी, बहीखाता, और पेरोल सेवाओं” में रोजगार 1990 से लगभग दोगुना हो गया है - यह स्प्रेडशीट और अन्य प्रौद्योगिकियों के लिए एक आरोप नहीं है जिन्होंने इन कार्यों को बड़े पैमाने पर स्वचालित कर दिया है।

एक रेखा ग्राफ जो 1990 से 2020 तक लेखांकन, कर तैयारी, बहीखाता, और पेरोल सेवाओं में कर्मचारियों की संख्या दिखा रहा है।

ईथन मोलिक का बोस्टन कंसल्टिंग ग्रुप (BCG) के साथ अध्ययन एक प्रयोग था जिसका उद्देश्य काम पर एआई के प्रभाव को बेहतर ढंग से समझना था, विशेष रूप से जटिल और ज्ञान-गहन कार्यों पर। अध्ययन में 758 BCG सलाहकार शामिल थे, जिन्हें दो कार्यों के लिए OpenAI के GPT-4 का उपयोग करने या न करने के लिए यादृच्छिक रूप से असाइन किया गया था: रचनात्मक उत्पाद नवाचार और व्यावसायिक समस्या समाधान। अध्ययन ने प्रतिभागियों के प्रदर्शन, व्यवहार, और दृष्टिकोण के साथ-साथ एआई आउटपुट की गुणवत्ता और विशेषताओं को मापा।

निष्कर्षों में से एक यह था कि “एआई एक कौशल स्तर को समान करने वाला काम करता है। जिन सलाहकारों ने प्रयोग की शुरुआत में सबसे खराब स्कोर किया था, जब उन्हें एआई का उपयोग करने का मौका मिला, तो उनके प्रदर्शन में सबसे बड़ा उछाल, 43%, आया। शीर्ष सलाहकारों को भी एक बूस्ट मिला, लेकिन कम।” पूरा लेख खुलासा करने वाला है, और मोलिक के सभी कामों की तरह, उत्तेजक फिर भी सुलभ है।

शिक्षा

एआई के बारे में पक्ष और विपक्ष की बहस में शिक्षा सबसे आगे रही है। कक्षाओं में एआई का परिचय आमतौर पर एक अभिशाप, या कम से कम एक चुनौती के रूप में देखा जाता है। अन्य शिक्षक, जैसे कि PW के मुख्य वक्ता एथन मोलिक, एआई को शिक्षकों के लिए एक उल्लेखनीय नए उपकरण के रूप में अपनाते हैं; मोलिक जोर देते हैं कि उनके छात्र ChatGPT के साथ काम करें।

इस विषय पर सबसे अच्छी पुस्तक है Teaching with AI: A Practical Guide to a New Era of Human Learning जोस एंटोनियो बोवेन और सी. एडवर्ड वॉटसन द्वारा लिखित।

मैं इस पुस्तक में शैक्षिक प्रकाशन में गहराई से नहीं जाऊंगा - यह एक विशाल विषय है, जिसके लिए एक अलग रिपोर्ट की आवश्यकता है। यह तर्क दिया जा सकता है कि शिक्षा के भीतर प्रकाशन द्वितीयक रुचि का विषय बनता जा रहा है: एआई उपकरण सॉफ़्टवेयर हैं, सामग्री नहीं।

खोज का भविष्य

An icon of a key

एआई में खोज एक विवादास्पद विषय है। मैं आपको perplexity.ai और You.com पर जाने के लिए प्रोत्साहित करता हूँ ताकि आप देख सकें कि चीजें किस दिशा में जा रही हैं। अगली बार जब आप गूगल खोज शुरू करने के बारे में सोच रहे हों, तो पर्प्लेक्सिटी पर जाएं। यह नाटकीय रूप से अलग नहीं लगेगा - यह उन ज्ञान ग्राफ़ों के समान है जो गूगल अक्सर खोज स्क्रीन के दाहिने तरफ या कभी-कभी खोज परिणाम सूची के शीर्ष पर पॉप करता है। लिंक पर क्लिक करने की आवश्यकता के बजाय, जानकारी वहीं आपके लिए होती है।

पर्प्लेक्सिटी एक कदम आगे बढ़ता है, यह कई स्रोतों से एकत्रित जानकारी को पुनः प्रकट करता है ताकि आपको लिंक पर क्लिक करने की वास्तव में आवश्यकता न पड़े। यह अपने स्रोतों के लिंक प्रदान करता है, लेकिन उन पर क्लिक करना आमतौर पर अनावश्यक होता है - आपके प्रश्न का उत्तर पहले से ही मिल गया होता है।

यह मामूली सा बदलाव उन सभी कंपनियों और उत्पादों के लिए बड़े निहितार्थ रखता है जो कम से कम आंशिक रूप से खोज इंजन के माध्यम से खोजे जाने पर निर्भर करते हैं। यदि खोजकर्ता अब आपकी साइट पर नहीं भेजे जा रहे हैं, तो आप उन्हें कैसे आकर्षित कर सकते हैं और उन्हें ग्राहकों में परिवर्तित कर सकते हैं? सरल उत्तर है, आप नहीं कर सकते।

जोआना पेन नई तकनीकों के लेखन और प्रकाशन पर प्रभाव के बारे में सोचने में सबसे आगे हैं। उन्होंने इस जटिल विषय को अपने पॉडकास्ट और ब्लॉग में पिछले दिसंबर में निपटाया।

एआई और खोज के रूपांतरण के लिए अभी भी शुरुआती दिन हैं।

अमेज़न पर कचरा किताबें

An icon of a key

अमेज़न पर एआई-जनरेटेड कचरा किताबें एक समस्या हैं, हालाँकि उनकी गंभीरता अधिक भावनात्मक हो सकती है न कि वास्तविक। एक ओर ये किताबें ऑनलाइन बुकस्टोर को कम गुणवत्ता और साहित्यिक चोरी वाले सामग्री से भर रही हैं, कभी-कभी वास्तविक लेखकों के नाम का उपयोग करके ग्राहकों को धोखा देती हैं और उनकी प्रतिष्ठा का लाभ उठाती हैं। ये किताबें न केवल पाठकों के लिए एक परेशानी हैं बल्कि लेखकों के लिए भी खतरा हैं, जिससे उन्हें उनकी मेहनत की कमाई की रॉयल्टी से वंचित किया जा सकता है। एआई-जनरेटेड किताबें अमेज़न की साइट पर वास्तविक किताबों और लेखकों की रैंकिंग और दृश्यता को भी प्रभावित करती हैं, क्योंकि वे उन्हीं कीवर्ड्स, श्रेणियाँ और समीक्षाओं के लिए प्रतिस्पर्धा करती हैं।

एक प्यारा बिल्ली का बच्चा समुद्र तट पर फूलों के बीच बैठा है और एक कैप्शन कह रहा है 'मजेदार और प्यारी बिल्ली की तस्वीरें जो आप दुनिया में नहीं देख सकते'।

अब अमेज़न लेखकों से अपनी किताबों के निर्माण में एआई के उपयोग का विवरण प्रकट करने की मांग करता है। इसमें कोई संदेह नहीं कि इसका दुरुपयोग किया जा सकता है।

अमेज़न पर “एआई-जनरेटेड किताबें” खोजने का प्रयास करें। वहां बहुत सारी हैं। कुछ परिणाम एआई का उपयोग करके किताबें बनाने के बारे में कैसे-करें किताबें हैं। लेकिन अन्य, बिना किसी शर्म के, एआई-जनरेटेड हैं। “Funny and Cute cat images-You are can’t see this types of photos in the world-PART-1” (stet) राजसेकर कासी को श्रेय दिया गया है। उनके (?) लेखक पृष्ठ पर उनकी बायो का कोई विवरण नहीं है, लेकिन छह अन्य शीर्षक उस नाम को श्रेय दिए गए हैं। यह किताब, 26 अगस्त, 2023 को प्रकाशित हुई, न ही कोई समीक्षाएँ हैं और न ही कोई बिक्री रैंक है। ईबुक का अशुद्ध शीर्षक मुद्रित किताब के कवर पर अशुद्ध शीर्षक से मेल नहीं खाता।

लेकिन अन्य लेखक स्पष्ट रूप से अपनी किताबों के निर्माण में एआई का व्यापक रूप से उपयोग कर रहे हैं, और इसका खुलासा नहीं कर रहे हैं। जैसा कि मैंने ऊपर चर्चा की है, कुशल ‘फोर्जर्स’ के साथ एआई का उपयोग पहचानना लगभग असंभव है। रंग भरने की किताबें, जर्नल्स, यात्रा किताबें और रसोई की किताबें एआई उपकरणों का उपयोग करके पारंपरिक प्रकाशन की तुलना में बहुत कम समय और प्रयास में बनाई जा रही हैं।

“कोरियाई वेगन कुकबुक” खोजें और आपको पहले स्थान पर जोआन ली मोलिनारो द्वारा शीर्षक मिलेगा। लेकिन इसके ठीक पीछे अन्य शीर्षक हैं जो स्पष्ट रूप से नकल हैं। “द कोरियाई वेगन कुकबुक: सरल और स्वादिष्ट पारंपरिक और आधुनिक व्यंजन कोरियाई व्यंजन प्रेमियों के लिए” के दो समीक्षाएँ हैं, जिनमें से एक नोट करती है “यह एक वेगन कुकबुक नहीं है। सभी व्यंजनों में मांस और अंडे की सामग्री है।” लेकिन किताब #5,869,771 की बिक्री रैंक में है, जबकि मूल किताब #2,852 की सूची में है।

यह निर्धारित करना कठिन है कि हानि की सीमा कितनी है। इससे कुछ अच्छा नहीं हो सकता, लेकिन यह कितना बुरा है?

Amazon के पास ऐसी नीतियाँ हैं जो उसे किसी भी किताब को हटाने की अनुमति देती हैं जो “ग्राहक अनुभव को सकारात्मक प्रदान करने में विफल” होती है। Kindle सामग्री दिशानिर्देश “वर्णनात्मक सामग्री जो ग्राहकों को गुमराह करने के लिए है या जो पुस्तक की सामग्री का सही ढंग से प्रतिनिधित्व नहीं करती है” को मना करते हैं। वे “सामग्री जो आमतौर पर ग्राहकों को निराश करती है” को भी ब्लॉक कर सकते हैं। क्या यह मात्रा ही है जो Amazon के निरीक्षकों को हरा देती है? या कोई और कारण है?

पक्षपात

बड़े भाषा मॉडल (LLMs) का प्रशिक्षण उस पर आधारित होता है जो पहले से ही ऑनलाइन प्रकाशित हो चुका है। जो ऑनलाइन प्रकाशित किया गया है, वह पक्षपात से भरा हुआ है और इसलिए LLMs उस पक्षपात को दर्शाते हैं। और निश्चित रूप से केवल पक्षपात ही नहीं, बल्कि नफ़रत भी, इसके शिक्षण में परिलक्षित होती है, और अब AI-जनित शब्दों और छवियों में संभावित रूप से उत्पन्न हो सकती है। पोर्न एक और प्राकृतिक लाभार्थी है AI की छवियों के साथ अद्वितीय सुविधा का, और हाल ही में युवा महिलाओं के नकली नग्न चित्र मिलने की परेशान करने वाली कहानियाँ सामने आई हैं, जिनके पुरुष सहपाठी संभावित संदेहास्पद हैं। द न्यूयॉर्क टाइम्स ने अलग से ऑनलाइन बच्चों के यौन शोषण की छवियों में वृद्धि की रिपोर्ट की है।

लेखकों और प्रकाशकों को AI उपकरणों का उपयोग करते समय इन अंतर्निहित सीमाओं के बारे में जागरूक होना चाहिए।

रचनात्मकता एक क्लिच हो सकती है

An icon of a key

यह सवाल कि मशीनें वास्तव में रचनात्मक हो सकती हैं या नहीं, एक गर्म बहस का विषय बना हुआ है। यह आंशिक रूप से इस बात पर निर्भर करता है कि हम रचनात्मकता को कैसे परिभाषित करते हैं।

“AI कभी भी रचनात्मक नहीं होगा।” यह एक परिचित मंत्र है।

हम सब जानते हैं कि रचनात्मकता क्या है, है ना?

कैम्ब्रिज: “मूल और असामान्य विचारों का उत्पादन या उपयोग करने की क्षमता।”

ब्रिटानिका: “किसी समस्या का नया समाधान, नई विधि या उपकरण, या नई कलात्मक वस्तु या रूप के रूप में कुछ नया बनाने या अस्तित्व में लाने की क्षमता।”

मैं इस बात से असहमत नहीं हूं कि इस अर्थ में रचनात्मकता LLMs की पहुंच से बहुत परे है।

मेरा तर्क है कि अधिकांश जो रचनात्मक के रूप में प्रस्तुत किया जाता है—और अक्सर काफी रचनात्मक दिखाई देता है—वास्तव में पुनरावृत्त है। जो कई चीजों के लिए पूरी तरह से काम करता है, जिसमें अधिकांश विज्ञापन शामिल हैं।

लेकिन ‘रचनात्मकता’ के मानक को उठाना, और फिर LLMs को कम करना, एक असंभव उच्च बाधा स्थापित करना है, जिस पर AI हमेशा विफल रहता है। फिर लोग इसे खारिज कर देते हैं जैसे “ठीक है, मैंने कहा था कि यह रचनात्मक नहीं है।”

और इस प्रक्रिया में उस पुनरावृत्त सामग्री को नजरअंदाज कर देते हैं जिसमें यह बहुत अच्छा है।

मैं इस विषय पर भविष्य में एक लंबा निबंध पोस्ट करूंगा, जब मैं पढ़ना समाप्त करूँगा:

The Creativity Code, मार्कस डू सॉटॉय द्वारा, और

The Artist in the Machine, आर्थर आई. मिलर द्वारा

Literary Theory for Robots, डेनिस यी टेनेन द्वारा

एक और विचार

जेरेमिया ओवयांग सिलिकॉन वैली में स्थित एक उद्योग विश्लेषक हैं। वह एक AI के समर्थक हैं, लेकिन उन्होंने पहले भी प्रचार देखा है। वह नोट करते हैं कि उन्होंने “इतने कम समय में ऐसी तेजी से विकास कभी नहीं देखा।”

जैसा कि ओवयांग कहते हैं, छोटे प्रोग्रामरों की टीमें अब LLMs का उपयोग करके दो दिनों में “संवेदनशील प्राणियों” — जैसे कि 4 साल के बच्चे — को असेंबल कर सकती हैं। वे सक्षम हैं:

  • कंप्यूटर दृष्टि के साथ ‘देखने’ में, वास्तविक दुनिया में क्या हो रहा है,

  • वॉयस कमांड और वास्तविक दुनिया में परिवेशी ध्वनियों के माध्यम से ‘सुनने’ में,

  • उपरोक्त वास्तविक दुनिया के इनपुट को प्रोसेस करके ‘सोचने’ में,

  • पूर्व-प्रशिक्षित डेटा तक पहुंचकर ‘सीखने’ में,

  • विशेष डेटा सेट्स को ‘संदर्भित’ करने में,

  • जीवन जैसी ऑडियो आवाज़ों के साथ ‘बोलने’ में, जिनमें किसी भी भाषा में उतार-चढ़ाव और स्वर होते हैं,

  • आवश्यक किसी भी प्रारूप या शैली में टेक्स्ट संचार के माध्यम से ‘लिखने’ में,

  • स्वतःस्फूर्त रूप से छवियां ‘ड्रॉ करने’ में, और

  • ‘इंटरैक्ट’ करने में: यह संवाद में सक्रिय रूप से शामिल हो सकता है, प्रश्न पूछ सकता है, या AI एजेंटों को स्वयं कार्यों को पूरा करने के लिए नियुक्त कर सकता है।

यह असाधारण और अभूतपूर्व है। क्या यह प्रकाशन के लिए महत्वपूर्ण होगा? आप तय करें।

प्रकाशन के बाहर की अच्छी चीज़ें

प्रकाशन के बाहर कुछ क्रांतिकारी उपलब्धियों के पीछे AI है। चिकित्सा AI का पोस्टर चाइल्ड है, लेकिन अन्य उद्योगों से भी शक्तिशाली कहानियाँ हैं। प्रकाशन से संबंधित प्रासंगिकता एक रेटोरिकल प्रश्न से उत्पन्न होती है: AI जीवन बचा सकता है। लेकिन आपको नहीं लगता कि यह प्रकाशकों की मदद कर सकता है?

इस छोटे खंड का उद्देश्य केवल उस तर्क का प्रतिकार करना है कि, यह विश्वास नहीं करते हुए कि AI प्रकाशन में मदद करेगा, क्या AI किसी और की भी मदद कर सकता है?

AI और चिकित्सा

मार्च 2024 के द इकोनॉमिस्ट के एक अंक को पढ़ते हुए, मैंने इसके स्वास्थ्य और AI पर प्रौद्योगिकी पूरक में गहराई से अध्ययन किया। पिछले कुछ वर्षों में, चिकित्सा लगातार कृत्रिम बुद्धिमत्ता की उज्ज्वल बिंदु के रूप में चित्रित की गई है। अधिकांश रिपोर्टें सकारात्मक हैं। लेकिन फिर भी द इकोनॉमिस्ट फीचर आपको चौंका देगा। वे कई अच्छी तरह से व्यक्त आरक्षण व्यक्त करते हैं। लेकिन आप यह भी पढ़ेंगे कि चिकित्सा में AI “सैकड़ों मिलियनों, यहां तक कि अरबों लोगों के जीवन को बेहतर बनाने का एक अवसर प्रदान करता है।”

जो लोग एआई तकनीक को प्रतिबंधित करने या कम से कम उसके विकास पर रोक लगाने की कोशिश कर रहे हैं, उनके लिए एक और विचारणीय प्रश्न: क्या आप एक अनिश्चित भविष्य के बारे में अपनी चिंता को संतुष्ट करने के लिए लाखों लोगों के स्वास्थ्य के संभावित मूल्य को बलिदान करेंगे?

हवाई अड्डों पर एआई और टीएसए

हम वहाँ रहे हैं: अंतहीन कतारें, एक्स-रे स्कैनरों से हमारे कैरी-ऑन का धीमा गति से गुजरना।

टीएसए द्वारा की गई पहचान की विफलताएँ अच्छी तरह से प्रलेखित हैं, लेकिन बहुत अधिक चर्चा नहीं की गई।

जो बात मुझे सबसे अधिक परेशान करती है, वह है उदास कर्मचारी, जो घंटों तक अपनी स्क्रीन को घूरते रहते हैं। किस लिए? न केवल यह एक दुखद नौकरी है, बल्कि, साधारण मनुष्यों के रूप में, वे इसमें बहुत अच्छे नहीं हैं।

यहां एआई आता है। यदि यह फेफड़ों में कठिन-से-पहचानने वाले ट्यूमर का पता लगा सकता है, तो मुझे विश्वास है कि यह कैरी-ऑन में अवैध वस्तुओं का पता लगा सकता है। और मनुष्यों को एक निराशाजनक कार्य से मुक्त कर सकता है जिसे वे संभालने के लिए उपयुक्त नहीं हैं।

इस लेख के अनुसार, नया टीएसए एआई-सहायता प्राप्त स्क्रीनिंग कार्यक्रम प्रगति पर है।

निबंध: पुस्तक प्रकाशन उद्योग पर एआई का प्रभाव

मैं हाल ही में अपने एआई वेबिनार साझेदार पीटर ब्रेंटली से बात कर रहा था, कि हम आगामी एआई कार्यक्रमों को कैसे आकार दे सकते हैं। पीटर अधिकांश समय पुस्तकालय समुदाय के भीतर काम करते हैं और हाल ही में लॉस एंजिल्स में अपने 150 पुस्तकालय सहयोगियों के साथ एक दिन के कार्यक्रम से लौटे थे, जहां उन्होंने व्यक्तिगत रूप से अपने क्षेत्र पर एआई के संभावित प्रभाव का पता लगाया। बातचीत जीवंत और गहन थी। उन्होंने सोचा, व्यापार पुस्तक प्रकाशकों के पास इस तरह की बैठकें क्यों नहीं होतीं? एआई हर प्रकाशन कार्यक्रम में एक विषय है: यह मुख्य विषय क्यों नहीं है?

एआई के वास्तविक-विश्व परिणाम

उन्होंने जो उत्तर दिया वह यह है कि व्यापार पुस्तक प्रकाशकों ने अभी तक यह निष्कर्ष नहीं निकाला है कि एआई का उनके व्यवसाय पर कोई वास्तविक-विश्व परिणाम होगा। उनके व्यवसाय के कोर पर। उनके व्यवसाय को संचालित करने की उनकी क्षमता पर। निश्चित रूप से, यह एक प्रेस विज्ञप्ति लिखने या एक पांडुलिपि अस्वीकृति पत्र लिखने में मदद कर सकता है, लेकिन वे मानते हैं कि प्रकाशन अभी भी वैसे ही चलता रहेगा जैसा कि दशकों से चलता आ रहा है, अनुबंध से मुद्रित पुस्तक तक औसतन दो साल तक खींचता रहेगा।

उसी समय, प्रकाशक निश्चित रूप से निकट-अवधि की चुनौतियों का सामना कर रहे हैं जो कृत्रिम बुद्धिमत्ता से अधिक दबावपूर्ण हैं। कागज की कीमतें। शिपिंग लागत। घटते मार्जिन। कुल मिलाकर ज्यादातर स्थिर बिक्री। इन सभी दबावों के साथ, किसके पास कृत्रिम बुद्धिमत्ता की परवाह करने का समय या बैंडविड्थ है?

लेकिन अन्य रचनात्मक उद्योग इसे समझते हैं। कला और डिजाइन इसे समझते हैं। विज्ञापन इसे समझता हैहॉलीवुड देख रहा है कि क्या आ रहा है, जैसा कि संगीत उद्योग भी देख रहा है। पत्रकार भय के साथ देख रहे हैं

अन्य पुस्तक प्रकाशन क्षेत्र कृत्रिम बुद्धिमत्ता के प्रभाव को समझना शुरू कर रहे हैं। विद्वतापूर्ण प्रकाशन इस तकनीक में गहराई से जुड़ा हुआ है। लेकिन व्यापारिक प्रकाशक ऐसा व्यवहार कर रहे हैं जैसे कृत्रिम बुद्धिमत्ता से वास्तविक दुनिया के परिणाम बहुत कम होंगे।

वास्तविक दुनिया के परिणाम क्या हो सकते हैं? क्या यह पुस्तकों की आपूर्ति को प्रभावित करेगा? या पुस्तकों की मांग को?

आपूर्ति: हां, कृत्रिम बुद्धिमत्ता अमेज़न पर बहुत सारी नई बेकार किताबों के लिए जिम्मेदार है। सैकड़ों? निश्चित रूप से। हजारों? शायद। लाखों? नहीं। अमेज़न पर कितनी किताबें हैं? 50 मिलियन से अधिक। यह पहले से ही बहुत भीड़भाड़ है।

इसके अलावा, यह स्पष्ट है कि निकट भविष्य में, कृत्रिम बुद्धिमत्ता पूरी किताबें नहीं लिखने वाली है जिन्हें लोग वास्तव में पढ़ना चाहेंगे। इसका मूल्य अब तक एक लेखन साथी के रूप में है - आलोचना करना, सुझाव देना, कभी-कभी उपयोगी टेक्स्ट के कुछ पैराग्राफ तैयार करना। नहीं, निकट भविष्य में, कृत्रिम बुद्धिमत्ता पुस्तक प्रकाशन के आउटपुट, नई पुस्तकों की आपूर्ति को मौलिक रूप से बदलने वाली नहीं है।

मांग: नहीं, कोई भी AI-जनित पुस्तकों की मांग नहीं कर रहा है। यह कोई कारक नहीं है। और मैं ऐसी कोई स्थिति नहीं देख सकता जहाँ AI पुस्तकों की मांग पर व्यापक रूप से प्रभाव डालेगा।

प्रकाशन की प्रक्रिया के बारे में क्या? हाँ, वह बदलेगी। कम से कम थोड़ा। जैसा कि हमने पिछले पतझड़ में हमारे Publishers Weekly AI इवेंट में खोजा, प्रकाशक यहाँ-वहाँ मदद के लिए AI की ओर देख रहे हैं: विपणन, संपादकीय, थोड़ा यह और थोड़ा वह।

क्या यह संभव है कि व्यापार पुस्तक प्रकाशन पर AI का कोई वास्तविक-world प्रभाव नहीं होगा? शायद यह सिर्फ एक खिलौना है।

तो चलिए AI की उलझनों से पीछे हटते हैं और व्यापार प्रकाशन की समस्याग्रस्त स्थिति को फिर से देखते हैं, और उसके माध्यम से, यह समझते हैं कि AI का सबसे बड़ा प्रभाव कहाँ पड़ सकता है।

प्रकाशन दशकों से आर्थिक गिरावट में है

विभिन्न अनुमानों के अनुसार, संयुक्त राज्य में पूरी पुस्तक प्रकाशन उद्योग की वार्षिक बिक्री $35 बिलियन से कम है। यदि वे $40 बिलियन भी हों, तो भी Apple Computer की वार्षिक बिक्री अकेले 10 गुना अधिक है। Apple का सकल लाभ बिक्री का 44% है, जबकि शुद्ध लाभ बिक्री का 25% है। प्रकाशन ऐसे मार्जिन का सपना भी नहीं देखता।

व्यापार पुस्तक प्रकाशन दशकों से एक हल्की आर्थिक गिरावट में है, कुछ वर्षों में कुछ प्रतिशत ऊपर, कुछ वर्षों में नीचे। 2024 के मध्य में बिक्री वर्ष-दर-वर्ष ठोस दिख रही है, लेकिन यह वही ग्रीष्मकालीन रोमांस है जिससे प्रकाशक परिचित हैं। हम कुछ जीतते हैं, हम कुछ हारते हैं, लेकिन, समग्र रूप से, व्यापार पुस्तक प्रकाशन कोई विकास उद्योग नहीं है।

2023 में, AAP के StatShot के अनुसार “व्यापार राजस्व 0.3% घटकर कैलेंडर वर्ष के लिए $8.9 बिलियन हो गया।” जहाँ तक मैं देख सकता हूँ, AAP के डेटा में मुद्रास्फीति का हिसाब नहीं है। 3.4% मुद्रास्फीति पर, बिक्री में गिरावट 3.6% होगी, जो कि 2023 में Circana द्वारा रिपोर्ट की गई 2.6% इकाई बिक्री में गिरावट के करीब है।

वैकल्पिक प्रारूपों, ईबुक्स और ऑडियोबुक्स के बढ़ते उपयोग के बिना, उद्योग की स्थिति बहुत खराब हो सकती थी। कई वर्षों तक ईबुक्स वृद्धि का इंजन रहे। ऑडियोबुक बिक्री में लगातार वृद्धि हो रही है, 2022 में लगभग 15% की वृद्धि और 2023 में 9% की और वृद्धि। हाँ, इसमें से कुछ बिक्री प्रतिस्थापन बिक्री है, लेकिन ईबुक्स और ऑडियोबुक्स के बहुत से ग्राहक नए ग्राहक हैं, जरूरी नहीं कि वे नियमित पुस्तक पाठक हों। पिछले साल व्यापारिक बिक्री का 21% ईबुक्स और ऑडियोबुक्स ने संभाला था। क्या ये सभी ग्राहक मुद्रित पुस्तकें खरीदते अगर मुद्रित पुस्तकें ही एकमात्र विकल्प होतीं?

खुदरा मूल्य निर्धारण एक बढ़ती हुई चिंता बनती जा रही है क्योंकि लागत और खुदरा और थोक छूट प्रकाशक के मार्जिन को प्रभावित कर रही है। शैक्षणिक अध्ययनों से पता चलता है कि पुस्तकों के लिए मूल्य लोचशीलता की एक डिग्री है, लेकिन निश्चित रूप से हम प्रतिरोध बिंदु तक पहुँच रहे हैं: हार्डकवर बेस्टसेलर $35 मूल्य सीमा को छू रहे हैं। “सदस्यता थकान” वीडियो-ऑन-डिमांड ग्राहकों को सेवाएं छोड़ने के लिए मजबूर कर रही है, जो प्रत्येक की बढ़ती लागत पर केंद्रित है। नेटफ्लिक्स की प्रीमियम योजना अब 22.99 डॉलर प्रति माह पर चल रही है; डिज़्नी प्लस डुओ प्रीमियम 19.99 डॉलर प्रति माह है। जैसा कि एक सहयोगी ने हाल ही में मुझसे कहा, कितने नकदी-संकटग्रस्त ग्राहक कहेंगे, ओह, चलो अपनी नेटफ्लिक्स सदस्यता रद्द कर दें ताकि मैं अगले महीने एक पुस्तक खरीद सकूं?

पुस्तक प्रकाशन वेतन

मैं इसे अधिक नहीं खींचूंगा: केवल लेखक ही नहीं जो जीवन यापन के लिए संघर्ष करते हैं—प्रकाशन कर्मियों को तुलनीय व्यवसायों की तुलना में अत्यधिक कम वेतन मिलता है।

मैं हाल की प्रकाशन नौकरी पोस्टिंग का एक प्रतिनिधि विविधता रखता हूँ। मैं एक को देख रहा हूँ, एक व्यापार प्रकाशक के लिए एक विपणन प्रबंधक के लिए जिसने 2023 में $30 मिलियन से अधिक की बिक्री की सूचना दी। यह पद प्रति वर्ष $60,000 और $70,000 के बीच भुगतान करता है। यहाँ एक और है, एक प्रकाशक की एक छाप के प्रचार प्रबंधक के लिए जिसने प्रति वर्ष $750 मिलियन की वार्षिक बिक्री की सूचना दी। “इस भूमिका का वार्षिक वेतन $74,000–$79,000 होगा,” सूची नोट करती है।

अमेरिकी श्रम सांख्यिकी ब्यूरो राष्ट्रीय व्यावसायिक रोजगार और वेतन अनुमान के अनुसार, विपणन प्रबंधक सभी उद्योगों में औसतन $166,410 कमाते हैं। “जनसंपर्क प्रबंधक” की औसत आय $159,420 है।

पुस्तक प्रकाशन तो इस मानक के आस-पास भी नहीं है। यह किसी के लिए भी नई बात नहीं है जो प्रकाशन में काम कर रहा है। यह हमेशा से ऐसा ही रहा है। लेकिन क्या प्रकाशन इन वेतन स्तरों पर खुद को बनाए रख सकता है? उम्मीदवारों को मानक वेतन का आधा भी नहीं देने की क्षमता इस उद्योग के लिए अच्छा संकेत नहीं है, खासकर तब जब यह उद्योग तेजी से डिजिटल हो रहा है।

TikTok, YouTube, सोशल मीडिया, SEO, मेटाडेटा, और लेखक प्लेटफार्मों के युग में, “प्रचार प्रबंधक” आखिर क्या होता है?

पारंपरिक पुस्तक प्रकाशकों के लिए तीन (और आधा) शेष लाभ

पारंपरिक पुस्तक प्रकाशकों के लिए तीन स्थायी लाभ हैं (i) प्रतिष्ठा, (ii) प्रमुख मीडिया तक पहुंच, और (iii) बुकस्टोर वितरण तक पहुंच। यह सभी पारंपरिक प्रकाशकों पर समान रूप से लागू नहीं होता है - सबसे बड़े प्रकाशकों के पास इनमें से अधिक होता है: अधिक प्रतिष्ठा, प्रमुख मीडिया तक बेहतर पहुंच, और सबसे अधिक संख्या में बुकस्टोर के सामने की टेबलों पर अपनी किताबें प्राप्त करने के बेहतर अवसर। लेकिन, इन्हें एक साथ लिया जाए, तो ये पारंपरिक पुस्तक प्रकाशन उद्योग के विशिष्ट लाभ हैं।

एक और मूल्य जो प्रकाशक प्रदान कर सकते हैं, वह है एक क्यूरेटेड सूची के पूरक शीर्षक, जहां प्रत्येक एकल शीर्षक अपने साथी शीर्षकों से लाभान्वित होता है। एक प्रकाशक जैसे Fox Chapel के बारे में सोचें, जो शिल्प के बारे में पुस्तकों में विशेषज्ञता रखता है: यदि आपको उनके एक शीर्षक में रुचि है, तो यह संभावना है कि आप उनके अन्य पुस्तकों (और पत्रिकाओं) को भी ध्यान से देखेंगे, भले ही वे अन्य लेखकों द्वारा लिखी गई हों।

कुछ ही प्रकाशकों ने जो हासिल किया है, वह है एक विपणन योग्य ब्रांड का विकास। वाइली की “फॉर डमीज” या ऑक्सफोर्ड की “वेरी शॉर्ट इंट्रोडक्शंस” जैसी श्रृंखलाओं के बारे में सोचें। ब्रांड संपादकीय दृष्टिकोण और गुणवत्ता की एक निरंतरता का संकेत देता है जो पाठकों को कई शीर्षक खरीदने के लिए प्रोत्साहित करता है। स्व-प्रकाशक अक्सर अपनी छोटी श्रृंखला लॉन्च करते हैं, ज्यादातर कथा के लिए, हालांकि वे इन बड़े प्रकाशक कैटलॉग की व्यापकता को नहीं भर सकते।

पारंपरिक प्रकाशकों द्वारा प्रदान की जाने वाली अन्य सभी सेवाओं को खुले बाजार में खरीदा जा सकता है, समान गुणवत्ता के साथ, किफायती कीमतों पर (उदाहरण के लिए, संपादकीय, डिज़ाइन, उत्पादन और आवश्यक विपणन कार्य)। और, स्व-प्रकाशकों के लिए, प्रति पुस्तक बिकने वाली आय पारंपरिक रॉयल्टी समय-सारणी से पांच गुना या उससे अधिक होती है।

मैं इस पर इस पुस्तक के अंत में एक छोटे परिशिष्ट में थोड़ा और गहराई से जाऊंगा। लेकिन मैं जल्दी से शीर्ष तीन लाभों के मूल्य को कम कर दूं। कैशेट डींग मारने के अधिकार के लिए अच्छा है, लेकिन इसका नगण्य नकदी मूल्य है। पुस्तक समीक्षाएँ, और अन्य प्रमुख मीडिया प्रदर्शन, अब पुस्तक बिक्री पर काफी कम प्रभाव डालते हैं। और पुस्तकालय उद्योग की बिक्री का लगभग 15% प्रतिनिधित्व करते हैं (और स्व-प्रकाशित लेखकों के लिए बहुत कम)—वे अब पुस्तक की सफलता के लिए मुख्य नहीं हैं।

चीजें बदल गई हैं।

स्व-प्रकाशन

पिछले दशक और उससे अधिक समय में उपभोक्ता (व्यापार) प्रकाशन में वृद्धि का मुख्य चालक स्व-प्रकाशन रहा है। स्व-प्रकाशन के चारों ओर सटीक बिक्री डेटा छिपा हुआ रहता है—इसकी महत्ता को नजरअंदाज करना आसान है। लेकिन उपलब्ध डेटा दिखाता है कि स्व-प्रकाशन व्यापार प्रकाशन बाजार का एक महत्वपूर्ण हिस्सा दावा करता है।

जैसा कि कोबो के सीईओ माइकल टैम्ब्लिन (कुछ हद तक) प्रसिद्ध रूप से नोट किया गया, “हम जो किताबें अंग्रेजी में बेचते हैं उनमें से एक चौथाई स्व-प्रकाशित शीर्षक है, जिसका अर्थ है कि प्रभावी रूप से, हमारे लिए, स्व-प्रकाशन ऐसा है जैसे कि बाजार में एक पूरा दूसरा पेंगुइन रैंडम हाउस बैठा हो जिसे कोई नहीं देखता। यह प्रकाशन का डार्क मैटर जैसा है।”

स्व-प्रकाशन बाजार के भीतर के रुझान तर्कसंगत रूप से व्यापार प्रकाशन में एकमात्र महत्वपूर्ण रुझान हैं। स्व-प्रकाशित लेखक रास्ता दिखा रहे हैं। वे साहसी हैं और पारंपरिक उद्योग की प्रथाओं से अप्रभावित हैं। कई सोशल मीडिया के साथ परिचित हैं। वे अपने पाठकों, अपने ग्राहकों के करीब हैं। यदि आप नवीनतम विपणन तकनीकों को सीखना चाहते हैं, तो लेखक फोरम, ब्लॉग्स, और न्यूज़लेटर्स का पालन करें।

लेखक की आय के आंकड़ों, लेखन की अर्थशास्त्र की गहराई में जाएं, और फिर पारंपरिक रूप से प्रकाशित लेखकों की आय में गिरावट की तुलना स्व-प्रकाशित लेखकों की आय में वृद्धि से करें। 2023 में, मैंने स्टीव सीक के साथ मिलकर ALLi के लिए एक अंतरराष्ट्रीय सर्वेक्षण और रिपोर्ट (pdf) का आयोजन किया, जिसमें हमने पाया कि “2022 में सभी स्व-प्रकाशकों के लेखन और स्व-प्रकाशन से संबंधित आय का माध्य $12,749 था, जो पिछले वर्ष की तुलना में 53% की वृद्धि है। औसत (माध्य) आय बहुत अधिक थी: 2022 में $82,600, जो 34% की वृद्धि है।”

एक अन्य सर्वेक्षण में, जो पीटर हिल्डिक-स्मिथ द्वारा लेखक संघ के लिए किया गया था, “पूर्णकालिक स्व-प्रकाशित लेखकों, जिन्होंने कम से कम 2018 से प्रकाशित किया था, ने 2018 में $13,700 की तुलना में $24,000 की औसत आय की रिपोर्ट की, 76 प्रतिशत वृद्धि।”

हाइब्रिड प्रकाशक

पूर्णता के लिए, मैं हाइब्रिड प्रकाशक का भी उल्लेख करना चाहता हूं। मैं हाइब्रिड मॉडल को लेकर बेहद उत्साहित हो गया हूं, और हाइब्रिड प्रकाशन खंड महत्वपूर्ण और बढ़ रहा है। कोई भी हाइब्रिड बिक्री का अलग से अनुमान नहीं लगाता है। लेकिन प्रभाव सबसे स्पष्ट रूप से दो श्रेणियों में देखा जाता है: सेलिब्रिटी द्वारा किताबें, और लोकप्रिय व्यापार पुस्तकें। ये श्रेणियां लंबे समय से ट्रेड प्रकाशकों के लिए विश्वसनीय आय स्रोत रही हैं, लेकिन हाइब्रिड प्रकाशकों की “कंसीयज सेवाएं,” और अधिक अनुकूल आय साझा करना, कई उच्च-प्रोफ़ाइल लेखकों के लिए अट्रैक्टिव हैं।

हाल की घटनाओं, जैसे ऑथर्स इक्विटी का अपने लेखकों के साथ मुनाफा साझा करने का संबंध, और केइला शाहीन का साइमन & शूस्टर के साथ 50/50 मुनाफा साझा करना, यह सुझाव देते हैं कि संकर मॉडल का सामान्यीकरण हो रहा है। यह लेखकों के लिए अच्छी खबर है; पारंपरिक प्रकाशकों के लिए कम वादा करने वाला है।

प्रकाशकों से परे प्रकाशन

मैं रुडिगर विशेनबार्ट के साथ एक रिपोर्ट सह-लेखक कर रहा हूँ, जो उनके मूल अध्ययन “प्रकाशकों से परे प्रकाशन” पर आधारित है। हम यह समझने और मापने की कोशिश कर रहे हैं कि जितना हो सके, दुनिया भर में सभी पुस्तक-संबंधी प्रकाशन गतिविधि को, जिसे आधुनिक प्रकाशन इकोस्फीयर के व्यापक दृष्टिकोण का हिस्सा माना जाना चाहिए।

एक बार जब आप पुस्तक-संबंधी कंटेनर से परे जाते हैं, तो आपको झलक मिलती है कि एआई वास्तव में कहाँ प्रभाव डाल सकता है।

हमारे प्रोजेक्ट का मुख्य उदाहरण वॉटपैड है, जहां “97 मिलियन लोग हर महीने 23 बिलियन मिनट से अधिक समय मूल कहानियों में बिताते हैं।” कहानियों का अनुभव ऑनलाइन, ज्यादातर स्मार्टफोन पर, छोटे टुकड़ों में किया जाता है। कुछ ही प्रकाशित पुस्तकें बन पाती हैं। वे “वॉटपैड वेबटून स्टूडियोज, कंपनी के टीवी, फिल्म, और प्रकाशन समकक्षों” में भी अपना रास्ता बना सकते हैं।

छोटे पाठक अपने वरिष्ठ भाइयों से अधिक ऑनलाइन डिजिटल पढ़ने के प्रति संवेदनशील हैं। जनवरी 2024 के वॉटपैड सर्वेक्षण के अनुसार, “डिजिटल प्रारूप युवा पीढ़ियों के बीच तेजी से लोकप्रिय हो रहे हैं, जिसमें जनरेशन जेड के 65% और मिलेनियल्स के 71% वेबनोवेल्स, ईबुक्स और वेबकॉमिक्स को अपना रहे हैं, जबकि जनरेशन एक्स और बूमर पीढ़ियों में से आधे से भी कम ऐसा कहते हैं।”

और, निश्चित रूप से, जैसा कि पारंपरिक प्रकाशन उद्योग अब सीख रहा है: “विविधता डिजिटल प्रारूपों को अपनाने का एक प्रमुख चालक है: जनरेशन जेड के 61% और मिलेनियल्स के 70% सहमत हैं कि ईबुक्स, वेबनोवेल्स, और वेबकॉमिक्स उन्हें ऐसी सामग्री तक पहुंच देते हैं जो बुकस्टोर और लाइब्रेरियों में खोजना मुश्किल होता है, जिसमें LGBTQ+ और अल्पसंख्यक केंद्रित सामग्री शामिल है।”

Wattpad के प्रतियोगी हैं, जिनमें Inkitt भी शामिल है, जिसने Publishers Weekly के अनुसार हाल ही में निवेशकों से $37 मिलियन जुटाए “जिनमें Stefan von Holtzbrinck, Holtzbrinck Publishing Group के मालिक, जो Macmillan का मालिक है, और पूर्व Penguin CEO Michael Lynton शामिल हैं; अब तक इसने कुल $117 मिलियन का निवेश प्राप्त किया है। फरवरी 2023 में, Financial Times ने कहा कि Inkitt यूरोप में आठवीं सबसे तेजी से बढ़ती कंपनी थी, और जर्मनी में #1।” Esquire के जुलाई 9 के एक लेख ने Inkitt के AI के उपयोग और उनकी सफलता में इसकी भूमिका का विस्तृत विवरण दिया।

आप में से कितने लोगों ने Inkitt का नाम सुना है, उसके प्रकाशन प्लेटफॉर्म पर गए हैं, या उसके Galatea रीडिंग ऐप को डाउनलोड किया है?

लेकिन हमारी “प्रकाशन से परे प्रकाशक” रिपोर्ट ऑनलाइन कहानी प्लेटफार्मों से आगे बढ़कर इस बात पर विचार करती है कि “सामग्री को विभिन्न प्रारूपों (प्रिंट, डिजिटल), मीडिया (पुस्तकें, ऑडियो, फिल्में, गेम्स), वितरण चैनल (समुदाय, प्लेटफॉर्म, स्ट्रीम्स) और व्यवसाय मॉडल (उत्पादों की बिक्री, सदस्यता, स्ट्रीमिंग, फ्रीमियम, भुगतान मॉडल) में कैसे बनाया और प्रसारित किया जा सकता है, जो मुख्य रूप से डिजिटल रूप से परिभाषित आपूर्ति और विपणन श्रृंखलाओं में होता है।” कितने अवसर पुस्तक प्रकाशक खो रहे हैं क्योंकि वे अपने वर्तमान व्यवसाय मॉडल में एक स्पष्ट फिट नहीं हैं?

नवाचार, प्रौद्योगिकी और पुस्तक प्रकाशन

ईबुक्स को छोड़कर, आधुनिक प्रकाशन ने कभी भी प्रौद्योगिकी से खतरे का सामना नहीं किया है। (डिजिटल ऑडियोबुक्स को आशंका से अधिक खुशी के साथ स्वागत किया गया।) इंटरनेट युग की शुरुआत ने प्रकाशकों को खतरों से अधिक अवसर प्रदान किए; यह सिर्फ एक खुदरा विक्रेता, Amazon है, जो इंटरनेट द्वारा सक्षम है, जिसने सेब की गाड़ी को उलट दिया।

मैंने कभी भी इस पर अध्ययन नहीं देखा है कि Amazon ने (जब इसके सभी कार्यों और प्रभावों को पूर्ण रूप से ध्यान में रखा जाए) पुस्तक प्रकाशन उद्योग के लिए एक शुद्ध सकारात्मक रहा है या नहीं। यह कई खरीदारों तक पहुँचता है जिन्हें ईंट और मोर्टार द्वारा सेवा नहीं दी जाती है, और कीमतों को कम रखने के लिए मार्जिन का बलिदान करने को तैयार है। ईबुक्स और ऑडियोबुक्स को बड़े पैमाने पर वितरित किया जाता है। लेकिन Amazon आंशिक रूप से इसलिए कीमतें कम करने में सक्षम है क्योंकि यह आपूर्तिकर्ताओं से उच्च छूट और शुल्क की मांग करता है, और यह अन्य खुदरा चैनलों को रोकता है। यहां दर्दनाक समझौते होते हैं।

फिर भी, किसी स्व-प्रकाशित लेखक के सामने Amazon की आलोचना करने की कोशिश न करें। वे बिना The Everything Store के व्यापार में नहीं होते।

द इनोवेटर’स डिलेमा

पुस्तक प्रकाशन पर AI के आने वाले प्रभाव पर दृष्टिकोण प्राप्त करने के लिए, मैं क्लेटन क्रिस्टेंसन की द इनोवेटर’स डिलेमा: व्हेन न्यू टेक्नोलॉजीज कॉज़ ग्रेट फर्म्स टू फेल, जिसे 1997 में हार्वर्ड बिजनेस रिव्यू प्रेस द्वारा पहली बार प्रकाशित किया गया था, की सिफारिश करता हूँ।

क्रिस्टेंसन इस बात पर विचार करते हैं कि कैसे मौजूदा (स्थापित) कंपनियां नवाचार की ताकतों के आगे झुक सकती हैं।

सफल, अच्छी तरह से प्रबंधित कंपनियां अक्सर विघटनकारी परिवर्तनों के आने पर विफल हो जाती हैं। पारंपरिक प्रबंधन प्रथाएँ, जिन्होंने उन्हें उद्योग के नेता बनने में मदद की थी, इन कंपनियों के लिए उन विघटनकारी तकनीकों का सामना करने में लचीला होना मुश्किल बना देती हैं जो उनके बाजारों को नष्ट कर सकती हैं।

वे विघटनकारी तकनीकों द्वारा उत्पन्न उत्पादों को नजरअंदाज कर देते हैं, क्योंकि पहली नजर में, वे उनके मौजूदा उत्पादों की तुलना में खराब लगते हैं। उनके सबसे लाभदायक ग्राहक आम तौर पर इन नवाचारों का उपयोग नहीं कर सकते और उन्हें नहीं चाहते। कंपनियां मौजूदा उत्पादों और सेवाओं पर जोर देकर विघटनकारी खतरों से लड़ने की कोशिश करती हैं।

क्रिस्टेंसन की प्रमुख अंतर्दृष्टि यह है कि स्पष्ट रूप से ‘सही’ काम करके, जिसमें ग्राहकों की सुनना भी शामिल है, सफल कंपनियां खुद को विघटनकारी नवाचार के लिए चौड़ा खुला छोड़ देती हैं। वे अपने मौजूदा ग्राहकों पर ध्यान केंद्रित करते हैं और महत्वपूर्ण नई तकनीकों को नजरअंदाज कर देते हैं - जो प्रारंभ में छोटे, कम लाभदायक बाजारों को लक्षित करती हैं। यह फुर्तीले स्टार्टअप्स के लिए नेताओं को विघटित करने का एक अवसर पैदा करता है।

क्रिस डिक्सन, इस पुस्तक पर चर्चा करते हुए, बताते हैं कि “बड़ी नई चीजें स्थापित कंपनियों द्वारा इसलिए अनदेखी की जाती हैं क्योंकि अगली बड़ी चीज हमेशा ‘खिलौने’ के रूप में खारिज कर दी जाती है।” हाँ, बहुत से लोग Chat AI को एक खिलौना मानते हैं

क्या प्रकाशक यह पहचानने में विफल हो रहे हैं कि जनरेटिव AI के साथ निर्मित नवाचार उनके नाजुक व्यवसाय मॉडल को विघटित कर सकते हैं?

कथा साहित्य बनाम गैर-कथा साहित्य

पुस्तक प्रकाशन पर कृत्रिम बुद्धिमत्ता का प्रभाव कथा साहित्य प्रकाशन पर गैर-कथा साहित्य की तुलना में काफी अलग होगा।

पुस्तक प्रकाशन उद्योग को अक्सर दो विभाजित उद्योगों के रूप में विश्लेषित नहीं किया जाता है, एक जो कथा साहित्य प्रकाशित करता है और दूसरा जो गैर-कथा साहित्य प्रकाशित करता है।

जबकि अधिकांश व्यापारिक प्रकाशक कथा और गैर-कथा दोनों शीर्षक प्रदान करते हैं, दोनों रूपों के बीच उद्योग-व्यापी अंतर शीर्षकों की संख्या और पुस्तक बिक्री दोनों में स्पष्ट है। अनुमान भिन्न होते हैं, लेकिन प्रत्येक वर्ष प्रकाशित पुस्तकों में से केवल लगभग 10% कथा साहित्य शीर्षक होते हैं। हालांकि, बिक्री में कथा साहित्य को काफी बढ़त मिलती है। फिर से, इसमें साल दर साल बदलाव होते रहते हैं, लेकिन कथा साहित्य वार्षिक व्यापारिक पुस्तक बिक्री का लगभग आधा हिस्सा लेता है। पिछले साल शीर्ष 25 बेस्टसेलर्स में से 21 कथा साहित्य थे। विकिपीडिया का संकलन का उपयोग करते हुए, अंग्रेजी में वे पुस्तकें जिन्होंने कभी 20 मिलियन प्रतियाँ बेची हैं, उनमें से 84% कथा साहित्य शीर्षक हैं।

पुस्तक बिक्री के रुझान कुख्यात रूप से अनिश्चित होते हैं, लेकिन कथा साहित्य की बिक्री लगातार ऊपर की ओर जाती दिखाई दे रही है। 2019 में 32% पर घटने के बाद, 2022 में उन्होंने वयस्क बाजार का 40% हिस्सा ले लिया, और 2023 में फिर थोड़ी बढ़त मिली। 2024 की पहली छमाही में वयस्क कथा साहित्य की बिक्री में अतिरिक्त 6.3% की वृद्धि हुई।

जहाँ कृत्रिम बुद्धिमत्ता कथा साहित्य लेखकों द्वारा सृजन प्रक्रिया में सहायता के लिए बढ़ती जा रही है, जैसा कि अन्यत्र चर्चा की गई है, ऐसा लगता है कि AI-जनित कहानियाँ बेस्टसेलर शेल्फ पर कब्जा नहीं करेंगी। कुछ शैली के कथा साहित्य के लिए एक “पर्याप्त अच्छा” पहुँचना संभव है, लेकिन फिर भी यह कुछ ऐसा नहीं है जो लेखकों और प्रकाशकों को नींद से वंचित कर दे।

दूसरी ओर, गैर-कथा साहित्य का लेखन और प्रकाशन व्यापक रूप से कृत्रिम बुद्धिमत्ता द्वारा सहायता प्राप्त होगा। यह पहले से ही हो रहा है। गैर-कथा लेखक चैट AI की कई क्षमताओं का लाभ उठा रहे हैं, दोनों एक शोध सहायक और लेखन सहायक के रूप में। और गैर-कथा प्रकाशक पांडुलिपि विकास, तथ्य-जाँच, संपादन, विपणन और वितरण में मदद के लिए बढ़ती मात्रा में चैट AI का आह्वान करेंगे।

क्या लेखकों के लिए अस्तित्वगत खतरा है?

मैंने एक बहुत ही समझदार लेखक की एजेंट से बात की, जो अपने ग्राहकों और सभी पेशेवर लेखकों के लिए कृत्रिम बुद्धिमत्ता का क्या मतलब है, इस बारे में बहुत सोच रही हैं। बातचीत पुस्तक को ‘कंटेनर’ के रूप में देखने के विचार पर आ गई, और मैंने उनसे उस विचार का विस्तार करने के लिए कहा। उनका उत्तर:

“मूल विचार यह है कि जब लेखक/एजेंट किसी पुस्तक को प्रकाशक के साथ रख रहे होते हैं, तो यह सिर्फ एक पुस्तक होती है। यह समझ होती है कि बाद में यह उन अनेक प्रकार के व्युत्पन्न कार्यों में से एक बन सकती है जिन्हें हम जानते हैं (अनुवाद, नाटकीय रूपांतरण, ग्राफिक उपन्यास, आदि) लेकिन यह सब ‘कर्म’ स्वयं के लिए गौण है। कर्म शब्दों, वाक्यांशों या तथ्यों का बैग नहीं है, यह लेखक द्वारा एक विशिष्ट तरीके से संरचित कुछ है। कंटेनर को तोड़ना, स्क्रैबल बैग को हिलाना और एक यादृच्छिक चयन निकालना (जो पूरी तरह यादृच्छिक नहीं है क्योंकि यह स्क्रैबल बैग उस विशिष्ट लेखक की व्याकरण और अर्थवत्ता और शैली से बना है), वह नहीं है जिसे हम प्रकाशक को अधिकार देने के समय विचार करते हैं।

“पुस्तक एक अभिन्न संपूर्णता है जो उसके भागों के योग से अधिक है। यह एक रचनात्मक अंतर्दृष्टि (और बहुत सारा रचनात्मक बौद्धिक कार्य) का उत्पाद है जिसने इसे एक पुस्तक के रूप में एकत्र किया, न कि केवल ‘एक’ पुस्तक, बल्कि उस विशेष लेखक द्वारा लिखी गई पुस्तक।”

पुस्तकों में खज़ाने होते हैं

जब मैं गैर-कल्पना पुस्तकों के बारे में सोचता हूँ, तो कंटेनर को तोड़ना एआई युग के लाभों में से एक है। आप कंटेनर को तोड़ते हैं, और जैसे फ़ैबरशे अंडे, अंदर खज़ाने होते हैं।

कंटेनर की सीमाएँ दोनों एक विशेषता और एक कमी हैं। एक ओर “कार्य केवल शब्दों या वाक्यांशों या तथ्यों की एक थैली नहीं है, यह लेखक द्वारा एक विशेष तरीके से संरचित कुछ है।” दूसरी ओर, कंटेनर बनाने में, लेखक, पुस्तक कंटेनर की अंतर्निहित सीमाओं के कारण, को कम करने, अस्वीकृत करने, पुनर्लेखन करने और पुनः कॉन्फ़िगर करने के लिए मजबूर किया गया था। कार्य चमकाया गया है, लेकिन यह आसुत है, और कुछ चीजें रास्ते में खो गईं (जबकि अन्य प्राप्त हुईं)।

लोग लंबी गैर-कल्पना पुस्तकों को नहीं पढ़ते हैं, आंशिक रूप से क्योंकि वे वेब पर मिलने वाले सभी पाठों को स्किम करने के लिए अभ्यस्त हो गए हैं - जिसमें उनके ईमेल भी शामिल हैं। यहां तक कि “पुस्तक सारांश” मॉडल भी विफल रहता है - एक अपचनीय 250-पृष्ठ की गैर-कल्पना पुस्तक के बजाय आपको पुस्तक का एक अपचनीय 8-पृष्ठ का सारांश मिलता है।

पुस्तकें लंच बॉक्स की तरह हैं - सभी चीजें एक जगह में। लेकिन मुझे सिर्फ कुकीज़ चाहिए।

स्थापित लेखकों के लिए अपनी जंजीरों को फेंकना आसान नहीं होगा। लेकिन उन्हें ऐसा करना सीखना पड़ सकता है, या नए कुशल शोधकर्ताओं और लेखकों की एक नई पीढ़ी द्वारा छायांकित होने का जोखिम उठाना पड़ सकता है जो खुद को औपचारिक कंटेनरों के साथ या बिना व्यक्त कर सकते हैं, जैसा अवसर हो। कंटेनर बहुत अधिक सीमाएँ और सीमाएँ लगाते हैं।

मुद्दा यह है कि लेखन का व्यवसाय अपरिवर्तनीय रूप से बदल गया है। यह लिपिकों के अंत की तरह है। इस मामले में, हमारे साधु लेखक अपने डेस्क और उनकी कंटेनरीकृत पुस्तक दृष्टिकोण से बाहर निकलने और फ़ॉर्म और अपने दर्शकों के साथ जुड़ने चाहिए।

ओह हाँ, मैं लेखक की प्रतिक्रियाओं को अच्छी तरह जानता हूँ: लेकिन मैं एक लेखक हूँ, मैं प्रचारक नहीं हूँ। मैं सोशल मीडिया पर नहीं हूँ। मैं अपने पाठकों के साथ वास्तव में संवाद करने में कोई रुचि नहीं रखता, सिवाय अपने काम के और कभी-कभार ईमेल और कभी-कभार उपस्थितियों के। मेरी एक वेबसाइट है (लेकिन, सच कहूँ, मैं इसे कभी अपडेट नहीं करता)। मेरा काम मेरे पाठकों के लिए मेरा उपहार है। वे मेरे काम को स्वीकार कर सकते हैं, या मेरे काम को अस्वीकार कर सकते हैं, लेकिन मैं उनके लिविंग रूम में शामिल नहीं होऊँगा।

खैर, आप स्क्रॉल्स और हर्माइन के खून से बने स्याही को दूर रख सकते हैं। ‘लेखक’ का पेशा अब यह मांग करता है कि आप अपनी डेस्क के पीछे से बाहर निकलें और अपने पाठकों से मिलें जहां वे रहते हैं, उनके लिविंग रूम में और उनके फेसबुक पेज पर। आप इसे जितना चाहें शोक मना सकते हैं, क्योंकि हम आपकी ग्रांट्स और आपके कार्यकाल और आपके प्रकाशन के अवसरों को बंद कर देते हैं। यह लेखकों और पाठकों की बहादुर नई दुनिया है, प्रकाशकों के बिना, वे भयानक मध्यस्थ जो आपके काम को बढ़ाने के लिए कड़ी मेहनत करते हैं, फिर भी आपके पाठकों के साथ सीधे जुड़ाव को लगातार बाधित करते हैं, जो इसे सबसे अधिक महत्व देते हैं।

इसमें से कोई भी महान कथा गैर-कल्पना पुस्तकों को एक संवेदनशील दर्शकों तक पहुंचने से नहीं रोकता है। इसके विपरीत। वे पुस्तकें चमकना जारी रख सकती हैं। अभी भी बेस्टसेलिंग नॉनफिक्शन होगी, हालांकि अर्थशास्त्र केवल शीर्ष-बिक्री लेखकों के लिए असंभव साबित होगा। वर्तमान मॉडल को गायब होने की जरूरत नहीं है ताकि नए मॉडल को फलने-फूलने के लिए।

मैं इन महान गैर-कल्पना पुस्तकों को ‘सुंदर’ मानता हूं। ‘सुंदर’ का मतलब है खूबसूरती से लिखा गया, सावधानीपूर्वक संपादित, ध्यान और विचारशीलता के साथ डिज़ाइन किया गया, और FSC प्रमाणित कागज पर छपा हुआ, डेकल्ड किनारों के साथ। वे बुटीक में बेचे जाते हैं।

बुटीक को ‘बुकस्टोर’ कहा जाता है, लेकिन उनमें बुटीक रिटेल के सभी गुण होते हैं—सुंदर वस्तुएं, मालिक और प्रबंधकों द्वारा सावधानी से चुनी गई, थोड़ी महंगी, लेकिन जो लोग ऐसी वस्तुओं को संजोते हैं, उनके लिए कीमत अच्छी होती है।

अधिकांश नॉनफिक्शन लेखकों का कार्य अब कंटेनर के परे जाने के साथ-साथ गेटकीपर के रूप में प्रकाशक के परे जाने का है।

कई मीडिया में सामग्री कंटेनर

पढ़ने वाली जनता, विशेष रूप से इसके युवा सदस्य, तेजी से ‘मीडिया-अज्ञेय’ होती जा रही है। मनोरंजन या ज्ञान की खोज में, वे YouTube या TikTok वीडियो देख सकते हैं, एक Netflix श्रृंखला, Spotify पर सुन सकते हैं, Instagram (“Insta”) के माध्यम से स्क्रॉल कर सकते हैं, समाचारों पर पकड़ बना सकते हैं, या, कभी-कभी, एक किताब पढ़ सकते हैं।

(प्रिंट-बुक-प्यार करने वाले BookTok के निवासी एक मूल्यवान समूह हैं, लेकिन कुल मिलाकर उनका बाजार पर मामूली प्रभाव है।)

फिर भी बाजार मॉडल अभी भी अद्वितीय कंटेनर पर केंद्रित है। प्रकाशन उद्योग। फिल्म उद्योग। टेलीविजन उद्योग। संगीत उद्योग।

फिल्में किताबें नहीं हैं। YouTube वीडियो फिल्में नहीं हैं। पॉडकास्ट ऑडियोबुक्स नहीं हैं।

ये साइलो ऐतिहासिक अनिवार्यता नहीं थे, बल्कि समय के साथ शक्तिशाली संगठनों द्वारा किए गए एक श्रृंखला व्यापार निर्णयों का परिणाम थे।

एकल कंटेनर पर निर्मित एक व्यापार मॉडल को बाधित करना कठिन नहीं है।

भाषा के साथ इसकी सुविधा के लिए, जनरेटिव एआई की वर्तमान पीढ़ी ध्वनियों, चित्रों और वीडियो का उत्पादन करने में और भी अधिक आत्मविश्वास के साथ अपना जादू दिखा रही है। एआई इस पुस्तक को ऑडियोबुक्स के साथ, कई भाषाओं में, और ईबुक के 31 अनुवादों के साथ प्रस्तुत करता है। पारंपरिक उत्पादन की अर्थव्यवस्था मेरे लिए कोई मतलब नहीं रखती, इसलिए एआई के बिना यह सब कुछ भी संभव नहीं होता।

कंटेनर साइलो

सामग्री निर्माताओं को पारंपरिक रूप से केवल एक कंटेनर साइलो में उत्कृष्टता प्राप्त करने के लिए प्रशिक्षित किया जाता है। हमारे पास लेखन कार्यक्रम, फिल्म कार्यक्रम और संगीत कार्यक्रम हैं। यह शायद ही कभी होता है कि रचनात्मक लेखक फिल्म या संगीत में भी ‘माइनर’ लें। या कंप्यूटर प्रोग्रामिंग या ऐप विकास में।

ट्रांसमीडिया को क्या हुआ? वे कार्यक्रम कहाँ हैं जो रचनाकारों को, जैसा कि Apple ने एक बार इसे कहा था, “डिजिटल मीडिया के मास्टर्स” बनने के लिए सिखाते हैं?

सबसे अच्छी सामग्री हमेशा जीत जाएगी। लेकिन, समय के साथ, सामग्री कंटेनर कम महत्वपूर्ण होते जाते हैं। डिजिटल पीढ़ी कंटेनर-एग्नोस्टिक नहीं हो सकती है। लेकिन वे कंटेनर-फ्लेक्सिबल हैं। वे अपने अधिकांश सामग्री को डिजिटल रूप से, स्मार्टफोन के माध्यम से प्राप्त करते हैं। प्रिंट एक दर्शक वर्ग को ढूंढना जारी रखेगा, लेकिन यह फिर कभी केंद्र की कमान नहीं करेगा।

“भविष्य का प्रकाशक” भी कंटेनर-फ्लेक्सिबल होना चाहिए। सामग्री वितरण में अधिकांश वृद्धि कागज पर स्याही के माध्यम से नहीं है, और न ही ईपब फाइलों में शब्दों के माध्यम से। ऑडियोबुक्स की वृद्धि कोई दुर्घटना नहीं है, और न ही YouTube और TikTok की लोकप्रियता।

बड़ी चुनौती नई और मौजूदा सामग्री को खोजने योग्य बनाने की आवश्यकता में है, चाहे उसका रूप कुछ भी हो, और फिर खोज के बाद, जागरूकता को खरीद निर्णय में बदलने में।

खोज और रूपांतरण

ऑनलाइन खोज समस्या हमारे साथ कुछ समय से है; एआई ने इसे नहीं बनाया। यह समस्या एक है जिसे उद्योग के अनुभवी माइक शैट्जकिन ने कई बार उजागर किया है। प्रिंट में उपलब्ध शीर्षकों की संख्या बहुत अधिक है, और डिजिटल प्रारूप उन्हें निरंतर प्रिंट में रहने की अनुमति देते हैं। लाखों आउट ऑफ प्रिंट किताबें प्रयुक्त पुस्तक विक्रेताओं से मिल सकती हैं। इसके अलावा, प्रत्येक वर्ष दो मिलियन या अधिक नई पुस्तकें प्रकाशित होती हैं, सिर्फ अंग्रेजी में। एआई संतृप्ति समस्या को और खराब कर देगा, लेकिन यह पहले से ही नियंत्रण से बाहर है।

अमेज़ॅन के एल्गोरिदम निःस्वार्थ नहीं हैं - वे जो बिक्री योग्य है उसे उजागर करने का बहुत अच्छा काम करते हैं, वह पुस्तक जिसे आप सबसे अधिक संभावना से अगली खरीदेंगे। वह पुस्तक केवल इसकी बिक्री के आंकड़ों द्वारा विशेषता नहीं है। यह सबसे अच्छा इसलिए बिका क्योंकि यह सबसे अच्छा था, और प्रसन्न पाठकों ने दूसरों से इसे खरीदने के लिए कहा, दोनों ऑनलाइन और व्यक्तिगत रूप से। (अमेज़ॅन ने विज्ञापन को प्रोत्साहित किया है जो इसके एल्गोरिदम को विकृत करता है, जो प्लेटफ़ॉर्म की एन्शिटिफिकेशन का हिस्सा है।)

मैंने ऊपर मेटाडेटा के बारे में बात की। रूपांतरण उतना ही पेचीदा है जितना कि खोज। क्या AI लेखकों को ब्राउज़रों को खरीदारों में बदलने में मदद कर सकता है?

कॉपीराइट का भविष्य

कृत्रिम बुद्धिमत्ता द्वारा कॉपीराइट की अवधारणा को बेतुका बना दिया गया है। ऐसा नहीं है कि लोग अपने काम के लिए संरक्षण नहीं चाहते या लायक नहीं हैं - तर्कसंगत रूप से वे पहले से कहीं अधिक इसके लायक हैं। और ऐसा नहीं है कि AI कॉपीराइट को अप्रवर्तनीय बनाता है (कम से कम किसी रूप में, यदि वर्तमान रूप में नहीं)।

यह है कि “कॉपीराइट का संरक्षण” भी एक ऐसा पर्दा बन जाता है जिसके पीछे आपका काम गायब हो जाता है। यदि आपकी पुस्तक को ChatGPT के साथ बातचीत के माध्यम से संदर्भित नहीं किया जा सकता है तो यह, वास्तव में, मौजूद नहीं है। AI कंपनियां केवल सामग्री के सर्वोत्तम को ही लाइसेंस देने वाली हैं। उन्हें तुच्छ सामग्री की जरुरत नहीं है।

उस चीज़ की रक्षा करने की जहमत क्यों उठाई जाए जिसे ढूंढा नहीं जा सकता?

यहीं पर खोज की समस्या एक आपदा बन सकती है। गूगल केवल उनके मेटाडेटा के माध्यम से पुस्तकों की खोज में उत्कृष्ट कार्य करता है। AI को संपूर्ण सामग्री चाहिए। पारंपरिक खोज इंजनों के विपरीत, AI किसी काम के बारे में केवल सार मेटाडेटा के आधार पर उपयोगकर्ता प्रश्नों का उत्तर नहीं देता है।

साथ ही, सामग्री कंटेनरों को बदलना, संपूर्ण पुस्तकों के अलावा अन्य कंटेनर, विभिन्न प्रकार की कॉपीराइट चुनौतियों का सुझाव देता है। यदि पुस्तक का पाठ पाठक इनपुट के जवाब में ऑन-द-फ्लाई बदल सकता है, तो फिर पाठ का कॉपीराइट क्या है?

लेखक और पाठक

प्रकाशकों को लेखकों की आवश्यकता होती है; लेखकों को प्रकाशकों की आवश्यकता नहीं होती।

प्रकाशन का भविष्य लेखकों और पाठकों के बीच का अंतरंग संबंध है। यह लेखकों और प्रकाशकों और पाठकों और प्रकाशकों के बीच के संबंध से कहीं अधिक मजबूत है। प्रकाशक लेखकों और पाठकों के बीच संबंध में बाधा हो सकते हैं। कई मामलों में वे संबंध को सक्षम नहीं करते; वे इसे बाधित करते हैं।

लंबे समय तक, उच्च-गुणवत्ता वाली लिखित सामग्री तक पहुंचने का एकमात्र तरीका किताबों या कुछ चुनिंदा पत्रिकाओं के माध्यम से था। यह अब निश्चित रूप से मामला नहीं है। अन्य मीडिया के विकर्षणों से अलग, अब उच्च-गुणवत्ता वाली लिखित सामग्री तक पहुंचने के कई अलग-अलग तरीके हैं। किताबें अब उस प्रमुखता को नहीं रखतीं जो उन्होंने पहले कभी आनंद ली थी।

AI संवाद कर सकता है

“मेरे लिए अगली पढ़ने के लिए सही पुस्तक क्या है?” जेनरेटिव AI उस प्रश्न का उत्तर एक ऐसी वाक्पटुता और सटीकता के साथ दे सकता है जो पहले कभी संभव नहीं थी। जैसे-जैसे AI एक विश्वसनीय अनुशंसा इंजन बनता जा रहा है, लेखकों को उस इंजन के माध्यम से संवाद करने की आवश्यकता होगी। (अमेज़न, निश्चित रूप से, इस पर काम कर रहा है, और यह जानने का लाभ है कि आपने पहले क्या खरीदा है।)

निष्कर्ष

तो इससे हमें क्या निष्कर्ष मिलता है?

मुझे ऐसा लगा कि प्रकाशन के सामने आने वाली चुनौतियों को दर्ज करना आवश्यक है। चैट एआई एक ऐसे समय पर आ रहा है जब व्यावसायिक प्रकाशन संकट में है। यह उस समय पर नहीं आ रहा है जब उद्योग मजबूत है और कह सकता है: “हमें किसी नई तकनीक की आवश्यकता नहीं है; हम बिलकुल ठीक हैं।”

मैंने ऊपर उन सबसे महत्वपूर्ण चुनौतियों के बारे में बात की जिनका प्रकाशन सामना कर रहा है: बढ़ती लागतें और घटते मार्जिन।

भेड़िये कभी अपनी और भी अधिक छूटों की मांगों में संतुष्ट नहीं होंगे; मार्जिन में सुधार नहीं होगा। खुदरा मूल्य एक सीमा के निकट हैं। वर्तमान व्यावसायिक प्रकाशन मॉडल का भविष्य लागत में कमी में निहित है।

वेतन अब और कम नहीं हो सकते, इसलिए हमें उत्पादन चक्र के भीतर लागत में कटौती करनी होगी।

लेकिन प्रकाशक दशकों से उत्पादन लागत में कटौती करने की कोशिश कर रहे हैं। कुछ उल्लेखनीय सफलताएँ मिली हैं, लेकिन हमने वर्तमान विकल्पों को समाप्त कर दिया है।

मैंने दिखाया है कि एआई प्रकाशन में, कार्यप्रवाह के पार दक्षता ला सकता है। वे तुरंत नहीं हैं और वे आसान नहीं हैं: आपको एआई पर काम करने की आवश्यकता है। लेकिन अवसर वहाँ है।

प्रकाशक स्टाफिंग को कम करना नहीं चाह रहे हैं, इसलिए उद्देश्य यह होना चाहिए कि वर्तमान स्टाफ संसाधनों के आधार पर अधिक किताबें तेजी से बाजार में आएं। एआई उपकरण इस उद्देश्य को आगे बढ़ा सकते हैं।

और, निश्चित रूप से, हमेशा एक लक्ष्य होता है कि प्रकाशित हो रही पुस्तकों की अधिक प्रतियां बेची जाएं। एआई इसमें भी मदद कर सकता है।

मैंने ऊपर वर्णन किया है कि एआई प्रकाशन के भविष्य के लिए भी परिवर्तनकारी हो सकता है।

उसकी चिंता मत करो। अपना घर व्यवस्थित करें, और हम आगे बात करेंगे।

एकल संसाधन

अब एआई के बारे में जानकारी देने के लिए एक अंतहीन आपूर्ति सामग्री उपलब्ध है, ज़ाहिर है, बहुत अधिक। अपनी पसंदीदा माध्यम चुनें: किताबें, ब्लॉग, न्यूज़लेटर, वीडियो, पॉडकास्ट, कोर्स और मानसिक भविष्यवाणी। मैंने इस पुस्तक के माध्यम से कुछ प्रमुख स्रोतों के लिंक दिए हैं, यह देखने के लिए कुछ यादृच्छिक लिंक पर क्लिक करना उचित है कि वे आपको कहाँ ले जाते हैं।

शुरुआत के लिए केवल एक उत्कृष्ट एआई किताब है, इथन मॉलिक की को-इंटेलिजेंस, जो अप्रैल 2024 की शुरुआत में जारी की गई थी। यह उनकी समान रूप से उत्कृष्ट न्यूज़लेटर, “वन यूजफुल थिंग” से ली गई है।

साइड नोट: इस पुस्तक को लिखने के लिए क्रेडेंशियल्स

मैंने इस जानकारी के साथ परिचय को बोझ नहीं डालना चाहा, लेकिन मुझे पता है कि आज एआई के बारे में लिखने वाले लोगों के प्रति कई लोग संदेहपूर्ण हैं, संदिग्ध हैं कि ये लेखक खुद को आधुनिक एआई विशेषज्ञ बना रहे हैं। निस्संदेह कुछ हैं। मुझे आशा है कि इस परियोजना को करने के लिए मेरे पास स्वीकार्य क्रेडेंशियल्स हैं।

मैंने 1988 में कृत्रिम बुद्धिमत्ता पर अपनी पहली पुस्तक पढ़ी, जो दो साल पहले प्रकाशित हुई थी, Understanding Computers and Cognition: A New Foundation for Design टेरी विनोग्राड और फर्नांडो फ्लोरेस द्वारा। पुस्तक गहन है—इसका अधिकांश हिस्सा मेरी समझ से परे था—लेकिन यह पहली बार था जब मैं पुस्तक प्रकाशन में कृत्रिम बुद्धिमत्ता की संभावनाओं के बारे में उत्साहित हुआ।

उस समय तक मैं डेस्कटॉप प्रकाशन, एप्पल कंप्यूटर, पेजमेकर आदि के विस्फोट के कारण, प्रकाशन के डिजिटलीकरण में गहराई से शामिल था। 1986 में मैंने पेज वन स्वचालित पुस्तक प्रकाशन सॉफ्टवेयर के विकास की निगरानी की, एक प्रोग्राम जो माइक्रोसॉफ्ट वर्ड फ़ाइल के रूप में एक पुस्तक पांडुलिपि को ले सकता था और कुछ ही मिनटों में इसे पूरी पुस्तक में सेट कर सकता था। आज यह करना बहुत आसान है; तब यह आसान नहीं था।

उसके बाद मैं एक सलाहकार और विश्लेषक के रूप में, कुछ प्रमुख सॉफ्टवेयर और हार्डवेयर विक्रेताओं के साथ काम करते हुए, प्रकाशन प्रौद्योगिकी में काम करना जारी रखा, जिसमें एडोबी, एप्पल और माइक्रोसॉफ्ट शामिल थे। मैं एक सॉफ्टवेयर कंपनी जिसका नाम एनफोकस था, के साथ भी शामिल हो गया और उसका भाग-मालिक बन गया। हमने प्रीप्रेस वर्कफ़्लो के लिए एक स्वचालित प्रणाली बनाई।

हमारे पास उस समय पर AI की पहुंच नहीं थी, लेकिन हम पूरी तरह से स्वचालित प्रकाशन उत्पादन प्रणालियों को जारी करने में बहुत अच्छे हो गए थे। जैसा कि AI जादू से अप्रभेद्य हो सकता है, वैसे ही स्वचालन का सर्वश्रेष्ठ भी AI जैसा प्रतीत हो सकता है।

तेजी से 2016 की ओर बढ़ते हुए, और मेरे सहयोगी क्लिफ ग्युरेन ने मुझे पुस्तक प्रकाशन में AI पर ध्यान केंद्रित करने में मदद की: यह लगने लगा था कि आखिरकार कुछ हो रहा था। The Bestseller Code (आर्चर और जोकर्स) सितंबर, 2016 में आई, जिससे यह स्पष्ट हो गया कि कंप्यूटर उच्च स्तर की अंतर्दृष्टि और सटीकता के साथ साहित्य की बनावट की व्याख्या कर सकते हैं।

उस समय तक मैं पुस्तक प्रकाशन स्टार्टअप्स पर करीब से ध्यान दे रहा था, और कुछ स्टार्टअप्स उभरे जिनकी सॉफ्टवेयर पेशकशों में कुछ हद तक AI तकनीक शामिल थी।

फिर से अक्टूबर 2022 में तेजी से आगे बढ़ें।

प्रकाशन में चर्चा का विषय बनने से कुछ महीने पहले, टिम ओ’राइली ने पेजब्रेक कॉन्फ्रेंस में “एआई और प्रकाशन परिवर्तन” पर प्रस्तुति दी। ओ’राइली प्रकाशन समुदाय में ओ’राइली मीडिया और टूल्स ऑफ चेंज कॉन्फ्रेंस के लिए जाने जाते हैं। वह टेक्नोलॉजी के शीर्ष दूरदर्शियों में से एक हैं।

ओ’राइली नए एआई प्रगति के बारे में केवल उत्साही नहीं थे, वे अत्यधिक उत्साहित थे। “हम एक ऐसे बिंदु पर हैं जो बहुत हद तक वैसा ही है जैसा मैंने 1992 में वर्ल्ड वाइड वेब की खोज के समय महसूस किया था,” उन्होंने कहा, और इसके साथ जोड़ते हुए कहा, “यह VisiCalc, पीसी, और वेब ब्राउज़र जितना परिवर्तनीय है।”

उन्होंने स्वीकार किया कि (उस समय) उपयोग का मामला अभी भी अस्पष्ट था, उन्होंने ओ’राइली मीडिया में कुछ पायलट परियोजनाओं की ओर इशारा किया। लेकिन, उन्होंने कहा, “यह खतरनाक रूप से तेजी से बेहतर हो रहा है। मशीन लर्निंग अब भविष्य की बात नहीं रही। यह एआई के लोकतंत्रीकरण के बारे में है।”

ओ’राइली ने बताया कि प्रकाशकों को इन नई तकनीकों से कैसे निपटना चाहिए, यह कहते हुए कि उन्हें “यह जानना चाहिए कि कब नावों को जलाना है और पूरी तरह से समर्पित होना है। एक समय होता है जब आपको प्रतिबद्ध होना पड़ता है।”

ChatGPT एक महीने बाद तक जारी नहीं हुआ था। पेजब्रेक पहला प्रकाशन सम्मेलन था जिसने इसे टिम की अंतर्दृष्टियों के माध्यम से सामने और केंद्र में रखा।

खुलासे

इस पुस्तक के पाँच प्रायोजक हैं। मुझे पुस्तक लिखते समय पता था कि अधिक धन नहीं मिलने वाला है, और मैंने प्रायोजकों को भाग लेने के लिए आमंत्रित करके अपने प्रयासों को निधि देने का निर्णय लिया।

जैसा कि मैंने अपनी वेबसाइट पर इंगित किया है, एक सलाहकार, विश्लेषक, और पत्रकार के रूप में काम करते हुए, मैं अंतर्राष्ट्रीय पत्रकार महासंघ के पत्रकारों के लिए वैश्विक आचार संहिता का समर्थन करता हूं। अनुच्छेद 13 स्पष्ट रूप से कहता है कि हितों के टकराव या “मेरी गतिविधि और विज्ञापन या प्रचार की गतिविधि के बीच किसी भी भ्रम से बचने का दायित्व है।”

प्रायोजकों का होना हितों के टकराव और विज्ञापन के बारे में भ्रम का संकेत देता है। यदि मैं न्यूयॉर्क टाइम्स के लिए काम कर रहा होता तो यह सरल होता: “नहीं।” स्वयं के लिए काम करते हुए, खुलासा मेरा हथियार है इन दायित्वों को संतुष्ट करने का: मैं प्राप्त किए गए प्रतिफल का वर्णन करूंगा और आप मेरे काम में न्याय कर सकते हैं कि क्या मैं समझौता किया हूं।

मैंने इस परियोजना के लिए जिन प्रायोजकों को आमंत्रित किया, उन्हें इसलिए चुना क्योंकि मैं न केवल उनके कार्य से परिचित था बल्कि उनके संगठनों में शामिल व्यक्तियों से भी परिचित था। वे सहकर्मी और मित्र हैं। मैंने उन्हें बताया कि उनकी उत्पादों पर इस पुस्तक के पाठ में चर्चा हो सकती है और उन शब्दों पर उनका कोई नियंत्रण नहीं होगा। जो वे नियंत्रित कर सकते थे, वह था पुस्तक के अंत में उनके विज्ञापन—मैं उन विज्ञापनों को जैसा दिया गया था, वैसा ही पोस्ट करता। यही मैंने किया है।

मुझे दूसरों से भुगतान प्राप्त हुए हैं जिन्होंने इस पुस्तक पर मेरे कार्य को प्रभावित किया हो सकता है—मैं निम्नलिखित को सूचीबद्ध कर सकता हूँ:

  • मैंने इस पुस्तक में वर्णित AI विक्रेताओं के लिए, जिनमें प्रायोजक भी शामिल हैं, कोई भुगतान परामर्श कार्य नहीं किया है।

  • मुझे सितंबर, 2023 में Publishers Weekly के AI वेबिनार्स के लिए कुछ लाभ-साझाकरण राजस्व प्राप्त हुआ।

  • मुझे Publishers Weekly के मेरे लेखों के लिए मानक दर पर भुगतान किया जाता है।

कृपया मुझे बताएं यदि आपको कोई पक्षपात नजर आता है जो इन संलग्नताओं के परिणामस्वरूप हो सकता है। AI के पक्ष में मेरा पूर्वाग्रह विशाल संपत्ति के प्रवाह से पहले ही बना था।

आभार

मैं AI के बारे में किसी भी विश्वसनीयता के साथ बात नहीं कर सकता था यदि Publishers Weekly का समर्थन न होता, जिसमें संपादक एमेरिटस, जिम मिलिओट, और सीईओ, केविन ब्रायरमैन शामिल हैं। जिम ने AI के बारे में मेरी प्रारंभिक लेखन का समर्थन किया, और केविन (क्रिस्टा रफनेलो और बाकी टीम के साथ) पिछले पतझड़ के सम्मेलन, AI and the Revolution in Book Publishing की सफलता के लिए महत्वपूर्ण थे। एंड्रयू अल्बानी अब PW के कार्यकारी संपादक हैं; एड नवोत्का, एक वरिष्ठ संपादक। मैं उनके साथ काम करने के लिए भाग्यशाली हूँ।

और कई सहकर्मियों को आगे धन्यवाद…

  • पीटर ब्रैंटली

  • क्लिफ गुरेन, लंबे समय से स्पैरिंग पार्टनर और मेरे ड्राफ्ट का गहन पाठक

  • दो अन्य ‘बीटा’ संस्करण पाठक, जिन्होंने मूल्यवान प्रतिक्रिया दी: जो विकर्ट और ब्रैड फार्मर

  • मेरे पब्लिशिंग टेक्नोलॉजी पार्टनर्स, केन ब्रूक्स, बिल कस्डॉर्फ, बिल रोसेनब्लैट, बिल ट्रिप्पे, स्टीव सिएक, और हमारे नवीनतम पार्टनर, लेटी कोंराड और लिंडा सेकंडारी।

  • मेरी बहन, ऐनी पाशले, जो मुझे प्रकाशन स्टार्टअप डेटाबेस को अद्यतन रखने में मदद करती हैं, और निरंतर मेरी प्रयासों को ऊर्जा प्रदान करती हैं।

  • मेरे मासिक AI वेबिनार्स में मेरे साझेदार: ब्रुक हॉर्न और ब्रायन ओ’लेरी BISG से।

  • बिल कसडॉर्फ ने मेरी किताब के लिए पहुंचनीयता मुद्दों पर ध्यान केंद्रित करने में मेरी मदद की।

  • लीपब के पीटर आर्मस्ट्रांग और लेन एप ने मेरे सवालों पर धैर्य रखा और लीपब प्लेटफॉर्म पर सर्वोत्तम संभव परिणाम की पेशकश करने की प्रक्रिया में मेरी मदद की।

  • ऑडियोबुक समर्थन के लिए इलेवनलैब्स के ह्यूगो रेने।

  • मेरे अच्छे दोस्त और मेरे लेखन और तर्क त्रुटियों के विश्वसनीय पहचानकर्ता, बॉब मैकआर्थर।

परिशिष्ट: पारंपरिक प्रकाशन के शेष लाभों की खोज

पारंपरिक प्रकाशन की प्रतिष्ठा ही वह कारण है जिसके लिए हम में से अधिकांश इस उद्योग में शामिल हुए। हम किताबों से प्यार करते हुए बड़े हुए, कॉलेज में अंग्रेजी या कुछ समान अध्ययन किया, कुछ समय के लिए इधर-उधर भटकते रहे, शायद एक बुकस्टोर में नौकरी मिली, शायद एक मास्टर्स ऑफ पब्लिशिंग प्रमाणपत्र प्राप्त किया, फिर एक प्रकाशन कंपनी में इंटर्न के रूप में काम किया, और आज हम यहां हैं। आपको अपनी नौकरी से प्यार है, भले ही वेतन कम हो और काम की शर्तें हमेशा सुखद न हों।

वही प्रतिष्ठा प्रकाशन आपूर्ति श्रृंखला को पोषित करती है। आपूर्ति श्रृंखला के इनपुट पक्ष पर: यह कई लेखकों के लिए बहुत मायने रखता है. हम इसे हर समय देखते हैं। पारंपरिक प्रकाशन का अर्थशास्त्र कोई मतलब नहीं रखता, और प्रिंट में आने में चार गुना अधिक समय लगता है, लेकिन, शायद, शायद, मैं अगला डेब्यू विजेता हो सकता हूँ, जैसे डेलिया ओवन्स (व्हेयर द क्रॉडैड्स सिंग) या दूसरी बार का मेगास्टार, अमोर टॉव्ल्स (ए जेंटलमैन इन मॉस्को).

यह वेगास की तरह है: सिवाय इसके कि नेवादा में संभावना बेहतर है। रूले में एकल संख्या खेलें और आपके खिलाफ संभावना 36 से 1 है। पारंपरिक प्रकाशन खेलें और आपके खिलाफ संभावना… कहीं अधिक खराब है।

किसी भी पारंपरिक व्यापार प्रकाशकों के साथ अनुबंध प्राप्त करने की संभावना, बड़े 5 में से एक का तो छोड़िए, खराब हैं। लेकिन यह एक लेखक की समस्या का सबसे कम हिस्सा है। असल में पाठकों को खोजना ही सबसे बड़ी चुनौती है।

एक चीज जो मदद कर सकती है वह है बेस्टसेलर सूची में एक स्थान प्राप्त करना।

आइए पीआरएच, पेंगुइन रैंडम हाउस पर विचार करें। कंपनी हर साल सिर्फ 15,000 नए शीर्षक प्रकाशित करती है. 2021 में उन्होंने पब्लिशर्स वीकली बेस्टसेलर सूची में 196 किताबें शामिल कीं. जैसा कि लिंक किए गए लेख में बताया गया है: “PW चार वयस्क बेस्टसेलर सूची प्रकाशित करता है, प्रत्येक में 20 शीर्षक: हार्डकवर फिक्शन, हार्डकवर नॉनफिक्शन, ट्रेड पेपरबैक, और मास मार्केट पेपरबैक। इसका मतलब है कि एक वर्ष के दौरान, हमारी सूचियों में 2,080 हार्डकवर स्थान और 2,080 पेपरबैक स्थान हैं।

सभी बेस्टसेलर उस वर्ष नए प्रकाशित नहीं थे—आइए उदारतापूर्वक अनुमान लगाएं कि 90% थे, 1870 स्लॉट्स।

इस बीच, The New York Times के पास प्रत्येक श्रेणी की पुस्तक के लिए प्रति सप्ताह 15 बेस्टसेलर स्लॉट्स हैं (कथा, गैर-कथा, बच्चों की; YA और कैसे-करें के लिए अलग-अलग सूचियाँ; हार्डकवर पेपरबैक से अलग, साथ ही संयुक्त सूचियाँ)। एक व्यक्तिगत लेखक के लिए, इसका मतलब है कि प्रति वर्ष 780 उपलब्ध स्लॉट्स, हालांकि इनमें से अधिकांश स्लॉट्स को दोहराए गए विक्रेताओं द्वारा भरा जाता है। (The Body Keeps the Score बाय Bessel van der Kolk पेपरबैक सूची में पांच-साढ़े साल से है!) इसलिए इसे आधा कर दें, 390 उपलब्ध स्लॉट्स। उन स्लॉट्स में से एक को पाने के लिए आपको बहुत सारी किताबें बेचनी होंगी।

New York Times Book Review में कवरेज के बारे में क्या? 2016 में, उस समय के Review की संपादक Pamela Paul ने दावा किया था कि “The Book Review at the Times किसी भी वर्ष में आने वाली पुस्तकों का लगभग 1% समीक्षा करता है।” स्पष्ट रूप से उनका मतलब शीर्ष प्रकाशकों की पुस्तकों का 1% है—वह छोटे प्रेस या स्व-प्रकाशित लेखकों के बारे में नहीं सोच रही होंगी। और इसलिए शायद PRH की 15,000 नई शीर्षकों में से 150 की समीक्षा प्रति वर्ष की जाती है।

अधिकांश पर्यवेक्षकों का मानना है कि जबकि शीर्ष मीडिया से ध्यान प्राप्त करना अभी भी महत्वपूर्ण है, और शक्तिशाली हो सकता है, समीक्षाओं का प्रभाव अब पहले जैसा नहीं रहा, यदि किसी अन्य कारण से नहीं तो इसलिए कि कम पुस्तक पाठक प्रमुख समीक्षा आउटलेट्स के साथ बातचीत करते हैं।

आइए वितरण के लिए आपूर्ति श्रृंखला पर ध्यान केंद्रित करें। जबकि प्रकाशक ब्रांड लेखकों के साथ वजन रखते हैं, यह हमेशा एक सच्चाई रही है कि, कई उपभोक्ता वस्तुओं के विपरीत, पुस्तक खरीदारों और पाठकों के साथ प्रकाशक ब्रांड का वजन लगभग नहीं होता। लेकिन वे वितरकों और किताब विक्रेताओं के साथ बहुत वजन रखते हैं। यह प्रकाशन के ऐतिहासिक बी 2 बी प्रकृति (उपभोक्ताओं के लिए बी 2 सी के बजाय) को दर्शाता है। प्रकाशक की ख्याति वितरण और खुदरा चैनलों के माध्यम से फैलाई जाती है: Barnes & Noble एक किताब को वहन करता है क्योंकि यह PRH से है, और फिर इसे खरीदारों के सामने रखता है; इस प्रकार ख्याति पाठकों तक फैलाई जाती है।

प्रायोजक

एक बैनर जिसमें लिखा है 'BOOK ADVISORS LLC Transaction services and consulting for publishers'.

डेविड लैम्ब और सुसान रीच ने 2016 में प्रकाशन में विलय और अधिग्रहण पर सलाह देने के लिए बुक एडवाइजर्स LLC की स्थापना की। हमने एक दर्जन से अधिक लेन-देन पूरे किए हैं, साथ ही वित्तीय, वितरण और परिचालन परामर्श परियोजनाओं की विविधता भी शामिल है, जिसमें निष्पक्ष बाजार मूल्यांकन भी शामिल है। हमें हाल ही में क्लार्क और एस्पोसिटो; थाड मैकइलरोय ऑफ द फ्यूचर ऑफ पब्लिशिंग; और कुओ-यू लियांग ऑफ कु वर्ल्डवाइड के साथ काम करने पर गर्व है।

हम अपने संबंधों, परिश्रम और गोपनीयता पर गर्व करते हैं। चाहे आप खरीदने, बेचने, वित्तपोषण या परामर्श में रुचि रखते हों, कृपया गोपनीय चर्चा के लिए संपर्क करें।

bookadvisorsllc.com | bookadvisors@gmail.com

3x2 बैनरों की एक ग्रिड: एक बैनर जो घोषणा करता है कि पेपरकट्ज़ को अगस्त 2022 में मैड केव स्टूडियोज़ द्वारा अधिग्रहित किया गया है, कु वर्ल्डवाइड LLC के सहयोग से; एक बैनर जो घोषणा करता है कि DAW बुक्स को जुलाई 2022 में एस्ट्रा पब्लिशिंग हाउस द्वारा अधिग्रहित किया गया है, कु वर्ल्डवाइड LLC के सहयोग से; एक बैनर जो घोषणा करता है कि कैसलन पब्लिशिंग को अप्रैल 2022 में ब्रूक्स पब्लिशिंग कंपनी द्वारा अधिग्रहित किया गया है, थाड मैकइलरोय के सहयोग से; एक बैनर जो घोषणा करता है कि B.E.S. पब्लिशिंग को नवंबर 2021 में सोर्सबुक्स द्वारा अधिग्रहित किया गया है; एक बैनर जो घोषणा करता है कि एप्पलवुड बुक्स को अप्रैल 2023 में अर्केडिया पब्लिशिंग द्वारा अधिग्रहित किया गया है; एक बैनर जो घोषणा करता है कि एरेव्हॉन बुक्स को अक्टूबर 2022 में केंसिंग्टन पब्लिशिंग द्वारा अधिग्रहित किया गया है
फायरब्रांड टेक्नोलॉजीज और नेटगैली का लोगो।

फायरब्रांड टेक्नोलॉजीज एक सॉफ्टवेयर और सेवा कंपनी है जो 35 से अधिक वर्षों से पुस्तक प्रकाशकों को डेटा और कार्यप्रवाह प्रबंधन समाधानों के साथ सहायता कर रही है।

नेटगैली एक ऑनलाइन प्लेटफॉर्म है जो प्रकाशकों और लेखकों को समीक्षकों, लाइब्रेरियन, पुस्तक विक्रेताओं, मीडिया और शिक्षकों से जोड़ता है जो नेटगैली पर नई किताबें खोजते हैं और उन्हें अपने दर्शकों को सुझाते हैं।

सॉफ्टवेयर और डिजिटल समाधानों के डेवलपर्स के रूप में, फायरब्रांड टेक्नोलॉजीज और नेटगैली भी उद्योग विशेषज्ञ और प्रकाशन समुदाय के सक्रिय सदस्य हैं। हमारे समाधान अधिग्रहण से लेकर बिक्री और विपणन तक प्रकाशन प्रक्रिया के सभी पहलुओं को लाभान्वित करते हैं।

  • नेटगैली प्रकाशकों को खिताबों के लिए प्रचार बनाने, शीघ्र प्रतिक्रिया और समीक्षाएँ प्राप्त करने और प्रारंभिक रुझानों की खोज में मदद करता है।

  • Title Management Enterprise, और इसका संक्षिप्त संस्करण, Title Management Lite, Firebrand का मुख्य सॉफ़्टवेयर एप्लिकेशन है जो पूरे प्रकाशन प्रक्रिया के दौरान उन्नत प्रकाशन कार्यप्रवाह प्रबंधन प्रदान करता है।

  • Eloquence on Demand प्रकाशन उद्योग का सबसे शक्तिशाली ओएनआईएक्स वितरण मंच है, जो ओएनआईएक्स और अन्य प्रारूपों में 600 से अधिक व्यापारिक साझेदारों को मेटाडाटा और डिजिटल संपत्ति वितरित करता है।

  • Flywheel एक बैकलिस्ट मार्केटिंग सेवा है जो खोज और बिक्री में वृद्धि के लिए बैकलिस्ट में छुपी हुई संभावनाओं की पहचान करती है।

  • Eloquence on Alert बाजार में लाइव शीर्षक डेटा और रुझानों की निगरानी करता है और प्रकाशकों को महत्वपूर्ण गलतियों और अवसरों के बारे में सूचित करता है जो बिक्री को प्रभावित कर सकते हैं (खरीद बटन का गायब होना, तीसरे पक्ष के विक्रेता आदि)।

  • FlightDeck उपलब्ध सबसे उन्नत ईपीयूबी मान्यता और परीक्षण उपकरण है।

NetGalley द्वारा पेश की जाने वाली विभिन्न सेवाओं को दिखाने वाला एक इन्फोग्राफिक जिसमें पुस्तक प्रचार, प्रकाशन कार्यप्रवाह प्रबंधन, मेटाडाटा वितरण, बिक्री और बैकलिस्ट मार्केटिंग, और ईपीयूबी परीक्षण शामिल हैं।
Perfect Bound का एक बैनर जो विश्व भर के प्रिंटरों के साथ प्रकाशकों को जोड़ने वाला एक बाजार है।

पुस्तकें प्रिंट करने का एक बेहतर तरीका में आपका स्वागत है।

Perfect Bound को 2022 में उन आपूर्ति श्रृंखला समस्याओं को हल करने में मदद करने के लिए बनाया गया था जो वर्षों से पुस्तक प्रकाशन उद्योग को परेशान कर रही थीं। प्रिंटरों में अतिरिक्त क्षमता की अवधि के बाद आपूर्ति की कमी के कारण विलंब की छोटी खिड़कियां आती हैं। Perfect Bound स्वतंत्र प्रकाशकों और लेखकों को मुद्रण बाजार खोलने की कोशिश करता है ताकि दुनिया भर के प्रिंटर आसानी से जुड़ सकें और प्रकाशकों के साथ व्यापार कर सकें जो नए और गतिशील आपूर्तिकर्ताओं की तलाश कर रहे हैं।

Perfect Bound क्या है?

Perfect Bound एक दो-तरफा बाजार है जो स्वतंत्र पुस्तक प्रकाशकों को यू.एस., कनाडा, कोलंबिया, ब्राज़ील, तुर्की, चीन, मलेशिया, भारत और अन्य देशों के प्रिंटरों के साथ जोड़ता है।

एक मुद्रण प्रेस का चित्रण जिसमें विभिन्न प्रकार की पुस्तकों और प्रकाशनों का उत्पादन होता हुआ दिखाया गया है।

एक क्लिक से नए प्रकाशन साझेदार खोजें

हमारा मजबूत प्लेटफ़ॉर्म आपको उत्पाद उद्धरण बनाने, एक बटन के क्लिक से सैकड़ों प्रिंटरों को अनुरोध भेजने, अपने मुद्रण संचालन को अंतिम रूप देने और प्रेस से गोदाम तक उत्पादों को ट्रैक करने की अनुमति देता है। एक प्रिंटर के रूप में, नए प्रकाशकों के साथ जुड़ना, आगामी परियोजनाओं पर बोली लगाना और भुगतान प्राप्त करना पहले कभी इतना आसान या सुरक्षित नहीं था।

नए प्रकाशन साझेदारों से तुरंत जुड़ें

  • दुनिया भर से प्रिंट अनुरोध भेजें और प्राप्त करें

  • प्रेस से गोदाम तक मुद्रण संचालन को निष्पादित और ट्रैक करें

  • प्लेटफ़ॉर्म छोड़े बिना Stripe के माध्यम से ACH भुगतान का उपयोग करके निर्बाध रूप से लेन-देन करें

Shimmr का एक विज्ञापन जो स्वचालित विज्ञापन दिखाता है जो किताबें बेचता है, जिसमें बिक्री में 35% की वृद्धि और विज्ञापन खर्च पर 2 गुना बेहतर रिटर्न का उल्लेख है।
Shimmr का एक विज्ञापन जिसमें उदाहरण विज्ञापन, मूल्य निर्धारण जानकारी और एक डेमो बुक करने के लिए QR कोड शामिल है।

Insight से मिलें, एक एआई प्लेटफ़ॉर्म जो विशेष रूप से प्रकाशकों के लिए बनाया गया है

एक व्यक्ति का क्लोज-अप चित्र जिसमें एक खुली किताब पकड़े हुए है और पन्नों से चमकते तत्व निकल रहे हैं।

“हमारे प्रकाशन गृह के लिए Insight को अपनाना साइकिल की जगह फेरारी का उपयोग करने जैसा था। अचानक, सब कुछ तेजी से चलने लगा।”

—-जर्मन बच्चों की पुस्तक प्रकाशक और Insight ग्राहक

स्मार्ट तरीके से काम करें, अधिक हासिल करें

Veristage द्वारा विकसित, Insight प्रकाशकों को विकसित होते एआई परिदृश्य में फलने-फूलने में सक्षम बनाता है। एआई और डिजिटल उपकरणों के एक मजबूत सूट का उपयोग करते हुए, Insight आपके दस्तावेज़ों और पुस्तकों का विश्लेषण और समझ करता है, ताकि आपकी मदद कर सके:

  • मेटाडेटा बनाएँ, सुधारें और ताज़ा करें

  • शीर्षक-विशिष्ट विपणन, प्रचार और बिक्री सामग्री के निर्माण को तेज़ करें

  • किसी पुस्तक की प्रमुख संदेशों, अद्वितीय विक्रय बिंदुओं, लक्षित दर्शक, प्रतिस्पर्धी शीर्षक, और अधिक की पहचान और मूल्यांकन करें

  • अपने विपणन और बिक्री सामग्री को अधिकतम पहुंच, जुड़ाव और बिक्री में वृद्धि के लिए अनुकूलित करें

सामान्य एआई प्लेटफ़ॉर्म के विपरीत, Insight को प्रकाशन वर्कफ़्लोज़ के भीतर कार्य करने और प्रकाशन-विशिष्ट जानकारी और संसाधनों को बनाने में आपकी मदद करने के लिए डिज़ाइन किया गया है।

यह कैसे काम करता है

  1. अपनी पुस्तक को इनसाइट प्लेटफ़ॉर्म पर अपलोड करें

  2. इनसाइट के एआई उपकरण आपकी पुस्तक का विश्लेषण और समझ करते हैं

  3. कुछ ही मिनटों में, इनसाइट आपकी पुस्तक के बारे में संपादकीय, विपणन, प्रचार, बिक्री, और अधिकार विभागों के लिए विस्तृत मेटाडेटा और महत्वपूर्ण जानकारी उत्पन्न करता है

  4. आप इस जानकारी में से किसी भी जानकारी को सीधे प्लेटफ़ॉर्म में मैन्युअल संपादन कर सकते हैं। आपकी पुस्तक और एआई सामग्री इनसाइट में संग्रहीत रहती है, जिससे आप इसे कभी भी एक्सेस कर सकते हैं।

  5. हमारे दस्तावेज़-सचेत एआई चैट का उपयोग करके अपनी शीर्षक जानकारी का अनुकूलन करें, अपनी पुस्तकों के साथ इंटरेक्ट करें, और संचार और अन्य सामग्री में पुस्तक विवरण शामिल करें

सुरक्षा और कॉपीराइट

वेरिस्टेज टीम एआई सेवाएँ प्रदान करने के लिए प्रतिबद्ध है जो सुरक्षित हैं और प्रकाशकों की बौद्धिक संपदा की सुरक्षा करती हैं। हमारे प्लेटफ़ॉर्म में उन्नत सूचना सुरक्षा प्रणाली मौजूद हैं, और हम केवल उन्हीं एआई मॉडलों के साथ काम करते हैं जो आपके डेटा को भविष्य के मॉडलों को प्रशिक्षित करने के लिए संग्रहीत या उपयोग नहीं करते।

सभी आकार के प्रकाशकों के लिए समाधान

इनसाइट को सभी आकार और प्रकार के प्रकाशकों के लिए डिज़ाइन किया गया है, चाहे वे उपभोक्ता हों या अकादमिक, तीन व्यक्ति की टीम हो या बहुराष्ट्रीय संगठन। हम प्रतिस्पर्धी मूल्य निर्धारण और विस्तार योग्य समाधान प्रदान करते हैं।

जानें कि इनसाइट आपके व्यवसाय को कैसे लाभ पहुंचा सकता है:

नीले रंग में एक अमूर्त डिज़ाइन के साथ वेरिस्टेज का लोगो।