AI को समझना और कुछ प्रमुख शब्दावली

An icon of a key

AI कई तकनीक और शब्दावली के साथ आता है, जिनमें से अधिकांश केवल डेटा वैज्ञानिकों के लिए ही समझने योग्य है। Chat AI के उपयोगकर्ताओं को AI शब्दावली या संबंधित तकनीकी अवधारणाओं का गहन ज्ञान आवश्यक नहीं है। सिस्टम की संवादात्मक प्रकृति विशिष्ट पृष्ठभूमि ज्ञान के बिना सहज बातचीत की अनुमति देती है कि चीजें कैसे काम करती हैं। इस पर ध्यान केंद्रित करना अधिक महत्वपूर्ण है कि Chat AI वास्तव में क्या कर सकता है।

इस पुस्तक को तैयार करने में मैंने एक लेखक के रूप में ‘जिम्मेदार’ क्या है, इस पर संघर्ष किया है। पारंपरिक दृष्टिकोण विज्ञान की एक संक्षिप्त व्याख्या और अक्सर उपयोग किए जाने वाले शब्दों की समीक्षा प्रदान करना है।

मैं ऐसा नहीं करने जा रहा हूँ।

मैं यहाँ कुछ बाहरी लिंक की पेशकश करने जा रहा हूँ जो मुझे लगता है कि AI की मूल बातों की कुछ समझने योग्य संक्षिप्त व्याख्याएँ हैं।

AI का भविष्य क्या है?: McKinsey & Co. (अप्रैल, 2024) के पास अच्छे सेट के वर्णनकर्ता हैं।

इसी प्रकार गार्टनर का जनरेटिव एआई (तिथि नहीं दी गई) बुरा नहीं है।

फ्यूचरपेडिया एआई फंडामेंटल्स (मई, 2024) का एक अच्छा सारांश प्रदान करता है।

कैसे करना है, इस पर निपटने के बाद, अब मैं कुछ शब्दों का परिचय देने जा रहा हूँ जो मुझे लगता है कि समझने के लिए मूल्यवान हैं। ऐसा नहीं है कि आपको सॉफ़्टवेयर का उपयोग करने के लिए इन्हें जानने की आवश्यकता है। केवल यह कि इस शब्दावली का सेट यह बताता है कि वर्तमान पीढ़ी का एआई वास्तव में कैसे काम करता है।

इन शब्दों और अवधारणाओं को समझाने के लिए मेरा उपयोग मामला लेखक और प्रकाशक हैं जो (i) किसी भी कारण से एआई पर गहराई से जानना चाहते हैं, या (ii) एआई की वर्तमान आलोचनाओं के संदर्भ को समझना चाहते हैं, या (iii) यह समझना चाहते हैं कि उनके सहयोगियों या संगठनों को एआई के प्रति कैसे दृष्टिकोण अपनाना चाहिए।

दूसरे शब्दों में, यह वह नहीं है जो आपको जानना आवश्यक है, बल्कि वह है जो आप जानना चाह सकते हैं। यहाँ वे हैं, गैर-वर्णानुक्रमिक क्रम में:

प्रॉम्प्ट और प्रॉम्प्टिंग

आप चैट एआई सॉफ़्टवेयर खोल सकते हैं और बस एक प्रश्न टाइप कर सकते हैं, बिल्कुल वैसे ही जैसे आप वर्तमान में गूगल पर करते हैं।

बड़े भाषा मॉडल (एलएलएम)

बड़े भाषा मॉडल विशाल मात्रा में (मुख्य रूप से) लिखित सामग्री का विश्लेषण करके काम करते हैं, जिससे उन्हें यह भविष्यवाणी करने की अनुमति मिलती है कि बातचीत या लेखन के एक टुकड़े में अगला शब्द या वाक्य क्या होना चाहिए। वे मानव अर्थ में भाषा को ‘समझते’ नहीं हैं, बल्कि पाठ को छोटे टुकड़ों में विभाजित करके (जिन्हें टोकन कहा जाता है) और फिर टोकन को संख्याओं में परिवर्तित करके इसे संसाधित करते हैं। वे पाठ को संख्याओं के रूप में संसाधित करते हैं, और फिर अधिक संख्याओं को पुन: उत्पन्न करते हैं, जिन्हें फिर आउटपुट पर पाठ में परिवर्तित कर दिया जाता है। यह इस बात का अत्यधिक सरलित स्पष्टीकरण है कि चैट एआई ‘कॉपीराइटेड’ कार्य को क्यों नहीं ‘रखता’: यह उन संख्याओं से निर्मित है जो अंतर्निहित पाठों से एक विशाल अमूर्तता का प्रतिनिधित्व करती हैं।

एलएलएम को सिखाया जाता है कि सामान्यत: भाषा का उपयोग कैसे किया जाता है और फिर इस समझ के आधार पर प्रतिक्रियाएँ उत्पन्न होती हैं। हम सामान्यतः यह कम आंकते हैं कि अधिकांश भाषा कितनी पूर्वानुमेय होती है। चैट एआई ऐसा पाठ उत्पन्न कर सकता है जो (कभी-कभी चौंकाने वाले रूप से) मौजूदा साहित्य के समान होता है, लेकिन, डिज़ाइन द्वारा, इसमें विशिष्ट अंशों या कॉपीराइट किए गए पाठों की प्रतियों को पुनः प्राप्त करने की क्षमता नहीं होती है। (मुझे पता है, आप में से कई लोगों ने न्यू यॉर्क टाइम्स द्वारा ओपनएआई के खिलाफ मुकदमे के बारे में सुना होगा—टाइम्स चैटजीपीटी से कुछ पूर्व-प्रकाशित लेखों के हिस्सों को हूबहू पुनः प्रस्तुत करने में सक्षम था।)

जनरेटिव एआई

इस शब्द को समझने के लिए सबसे महत्वपूर्ण बात “जनरेटिव” भाग है। जनरेटिव एआई नया पाठ उत्पन्न करता है।

जनरेटिव प्री-प्रशिक्षित ट्रांसफार्मर (GPT)

यह यहाँ की सबसे तकनीकी शब्दावली है, जो OpenAI द्वारा विकसित एक विशिष्ट प्रकार के बड़े भाषा मॉडल का वर्णन करता है। “जनरेटिव” इसके पाठ उत्पन्न करने की क्षमता को इंगित करता है, “प्री-प्रशिक्षित” यह संकेत करता है कि इसे एक बड़े पाठ डेटा पर प्रशिक्षित किया गया है, और “ट्रांसफार्मर” उस सॉफ़्टवेयर को संदर्भित करता है जिसका यह उपयोग करता है। यह जानना उपयोगी है कि GPT का मतलब क्या है ताकि आप समझ सकें कि ChatGPT में GPT क्या दर्शाता है।

ChatGPT

ChatGPT वह सॉफ़्टवेयर है जिसे आप देखते हैं; GPT वह है जो सॉफ़्टवेयर के पीछे है। उपयोगकर्ता ChatGPT का अनुभव करते हैं, न कि उसके पीछे के GPT का। जैसा कि ऊपर बताया गया है, ChatGPT कई ऑनलाइन चैट एआई सॉफ़्टवेयर प्रणालियों में से एक है, जिनका समान कार्यक्षमता है।

एक और शब्द जो आपको अक्सर मिलेगा और कई लोगों के लिए अपरिचित है:

संग्रह

शब्दकोश परिभाषा के अनुसार संग्रह का अर्थ है “लिखित पाठों का संग्रह” (हालाँकि, वास्तव में, यह हमेशा पाठ नहीं होता)। इस शब्द का उपयोग GPTs को प्रशिक्षित करने के लिए किया जाता है: विशाल (मुख्यतः) पाठ संग्रह। हमें बताया गया है कि सबसे बड़े संग्रह में सैकड़ों अरबों शब्द होते हैं। साधारण मनुष्यों के लिए यह समझना असंभव है। क्या आपको विकिपीडिया को विशाल नहीं लगता, जिसमें बहुत सारे शब्द होते हैं? खैर, विकिपीडिया में मात्र 4.5 अरब शब्द हैं—GPT-4 को एक ट्रिलियन से अधिक शब्दों पर प्रशिक्षित किया गया था।

मुझे लगता है कि इस पैमाने पर विचार करना महत्वपूर्ण है। लेखक, स्वाभाविक रूप से, चिंतित हैं कि उनके पुस्तक के 75,000 शब्द, प्लस या माइनस, बड़े भाषा मॉडल में समा सकते हैं। शायद वे समा सकते हैं (नीचे और अधिक)। लेकिन अगर ऐसा है, तो विचार करें कि आज के बड़े भाषा मॉडलों की कुल शक्ति के लिए किसी एक पुस्तक का कितना कम मूल्य है। यह वास्तव में नगण्य है। नगण्य से भी कम। यहाँ तक कि 10,000 किताबें भी बहुत कम हैं।