فهم الذكاء الاصطناعي وبعض المصطلحات الأساسية

يأتي الذكاء الاصطناعي مع وفرة من التكنولوجيا والمصطلحات، الكثير منها غامض للجميع باستثناء علماء البيانات. لا يحتاج مستخدمو الذكاء الاصطناعي الحواري إلى معرفة عميقة بمصطلحات الذكاء الاصطناعي ولا المفاهيم التقنية المتضمنة. الطبيعة الحوارية للنظام تتيح تفاعلات بديهية دون الحاجة إلى معرفة خلفية متخصصة بكيفية عمل الأشياء. التركيز على ما يمكن للذكاء الاصطناعي الحواري فعله بالفعل هو الأهم.

في إعداد هذا الكتاب، كافحت مع ما هو الشيء ‘المسؤول’ الذي يجب علي القيام به كمؤلف لكتاب عن الذكاء الاصطناعي. النهج التقليدي هو تقديم شرح قصير للعلم ومراجعة المصطلحات المستخدمة بشكل متكرر.

لن أفعل ذلك.

سأقدم هنا بعض الروابط الخارجية لما أعتقد أنها بعض الأوصاف القصيرة المفهومة لأساسيات الذكاء الاصطناعي.

ما هو مستقبل الذكاء الاصطناعي؟: لدى McKinsey & Co. (أبريل 2024) مجموعة جيدة من الشروحات.

وبالمثل، فإن الذكاء الاصطناعي التوليدي (غير مؤرخ) من Gartner ليس سيئًا.

Futurepedia تقدم ملخصًا ليس سيئًا لـ أساسيات الذكاء الاصطناعي (مايو 2024)

بعد التخلص من الجزء التعليمي، سأقدم الآن بعض المصطلحات التي أعتقد أنها جديرة بالفهم. ليس لأنك تحتاج إلى معرفتها لاستخدام البرنامج. فقط لأن هذه المجموعة من المصطلحات تشير إلى بعض الجوانب الرئيسية لكيفية عمل الجيل الحالي من الذكاء الاصطناعي بالفعل.

حالة الاستخدام الخاصة بي لمعالجة هذه المصطلحات والمفاهيم هي المؤلفون والناشرون الذين (i) يريدون التعمق في الذكاء الاصطناعي لمختلف الأسباب، أو (ii) يريدون فهم سياق الانتقادات الحالية للذكاء الاصطناعي، أو (iii) يريدون المساهمة في المناقشات الاستراتيجية حول كيفية تعامل زملائهم أو منظماتهم مع الذكاء الاصطناعي.

بعبارة أخرى، هذا ليس ما تحتاج إلى معرفته، بل ما قد ترغب في معرفته. ها هي، بترتيب غير أبجدي:

التحفيز والمحفزات

يمكنك فتح برنامج الذكاء الاصطناعي والدردشة وكتابة سؤال، تمامًا كما تفعل حاليًا على Google.

نموذج اللغة الكبير (LLM)

تعمل نماذج اللغة الكبيرة من خلال تحليل كميات هائلة من المواد المكتوبة (في الغالب)، مما يسمح لها بالتنبؤ بالكلمات أو الجمل التي يجب أن تأتي بعد ذلك في محادثة أو قطعة كتابة. إنها لا “تفهم” اللغة بالمفهوم البشري، بل تعالج النص عن طريق تقسيمه إلى أجزاء أصغر (تسمى الرموز)، ثم تحويل الرموز إلى أرقام. تعالج النص كأرقام، وتعيد إنتاج المزيد من الأرقام، التي يتم تحويلها بعد ذلك مرة أخرى إلى نص في الناتج. هذه هي التفسير المبسط للغاية لسبب أن الذكاء الاصطناعي للدردشة لا “يحتوي” على أعمال محمية بحقوق الطبع والنشر: إنه مبني بأرقام تمثل تجريدًا واسعًا من النصوص الأساسية.

تُدرب نماذج اللغة الكبيرة على كيفية استخدام اللغة بشكل نموذجي ثم تولد استجابات بناءً على هذا الفهم. نحن نميل إلى التقليل من مدى تكرار اللغة. يمكن للذكاء الاصطناعي للدردشة توليد نص مشابه (أحيانًا بشكل صادم) للأدب الحالي، ولكن بحكم التصميم، ليس لديه القدرة على استرجاع مقتطفات محددة أو نسخ من النصوص المحمية بحقوق الطبع والنشر. (أعلم، كثير منكم قد سمع عن دعوى نيويورك تايمز ضد OpenAI - كانت التايمز قادرة على جعل ChatGPT يعيد إنتاج بعض أجزاء المقالات المنشورة سابقًا حرفيًا.

الذكاء الاصطناعي التوليدي

أهم شيء يجب فهمه في هذا المصطلح هو الجزء “التوليدي”. الذكاء الاصطناعي التوليدي يولد نصوصًا جديدة.

المحول المولد المدرب مسبقًا (GPT)

هذا، الأكثر تقنيًا في المصطلحات هنا، يصف نوعًا معينًا من نماذج اللغة الكبيرة التي طورتها OpenAI. يشير “التوليدي” إلى قدرته على إنشاء نص، و“المدرب مسبقًا“ يدل على أنه تم تدريبه على كمية كبيرة من بيانات النصوص، و“المحول“ يشير إلى البرنامج الذي يستخدمه. معرفة ما يعنيه GPT مفيد فقط حتى تفهم ما تمثله الأحرف GPT في ChatGPT.

ChatGPT

ChatGPT هو البرنامج الذي تراه؛ GPT هو ما وراء البرنامج. المستخدمون يتعاملون مع ChatGPT، وليس مع GPT الذي خلفه. كما ذكرنا أعلاه، ChatGPT هو واحد فقط من عدة برامج ذكاء اصطناعي للدردشة عبر الإنترنت، وله وظائف مشابهة.

مصطلح آخر ستواجهه كثيرًا والذي قد يكون غير مألوف للكثيرين هو:

مجموعة نصوص

التعريف القاموسي لمجموعة نصوص هو “مجموعة من النصوص المكتوبة” (على الرغم من أنها ليست دائمًا نصوصًا). يستخدم المصطلح للإشارة إلى ما يتم تدريب GPT عليه: مجموعات ضخمة من النصوص (في الغالب نصوص). نحن نعلم أن أكبر المجموعات تحتوي على مئات المليارات من الكلمات. بالنسبة للبشر العاديين، هذا مستحيل الفهم. ألا تعتقد أن ويكيبيديا ضخمة، تحتوي على عدد هائل من الكلمات؟ حسنًا، هناك مجرد 4.5 مليار كلمة في ويكيبيديا - تم تدريب GPT-4 على أكثر من تريليون.

أعتقد أنه من المهم أن نأخذ هذا النطاق بالحسبان. المؤلفون، بشكل مفهوم، قلقون من أن 75,000 كلمة، زائد أو ناقص، في كتابهم قد تكون قد امتصت في نموذج لغة كبير. ربما تكون كذلك (المزيد أدناه). ولكن افترض أن هذا هو الحال، فكر فقط في مدى قلة قيمة أي كتاب واحد للقوة الإجمالية لنماذج اللغة الكبيرة اليوم. إنه غير مهم حقًا. حتى 10,000 كتاب هو مبلغ قليل جدًا.

Up next

برامج الذكاء الاصطناعي: الأوزان الثقيلة في النظام