الهلاوس: ذبابة في المرهم

An icon of a key

الذكاء الاصطناعي، القائم على النماذج اللغوية الكبيرة، يختلق أشياء. فقط يفعل ذلك. يُطلق على هذا عادةً “الهلاوس”. إنها مشكلة حقيقية، مشكلة خطيرة. تحتاج إلى فهم الهلاوس إذا كنت ستعمل مع الذكاء الاصطناعي.

كلمة العام 2023 في قاموس كامبريدج كانت “هلوسة”، والتي تم توسيع تعريفها ليشمل “عندما يهلوس الذكاء الاصطناعي… فإنه ينتج معلومات خاطئة.” (تشمل الإضافات الأخرى لقاموس 2023 “هندسة الأوامر”، “نموذج لغوي كبير”، و“الذكاء الاصطناعي التوليدي“.)

تلاحظ كامبريدج أن “هلوسات الذكاء الاصطناعي تبدو أحيانًا غير منطقية. لكن يمكنها أن تبدو أيضًا مقنعة تمامًا - حتى وإن كانت غير دقيقة فعليًا أو غير منطقية في النهاية.” وهذا، للأسف، صحيح إلى حد كبير، وحتى يوليو 2024 لا تزال هذه مشكلة كبيرة في استخدام الذكاء الاصطناعي التوليدي في المهام الحاسمة. إنها واحدة من عدة غرائب في الذكاء الاصطناعي، ويستغرق الناس وقتًا لفهمها. تذكر، الذكاء الاصطناعي التوليدي هو في الغالب محرك تنبؤ بالكلمات التالية، وليس قاعدة بيانات للحقائق. ومن هنا الحاجة إلى “البشر في الحلقة” (HITLs)، كما يُعرفون الآن، للتحقق المزدوج من مخرجات الذكاء الاصطناعي. ومرة أخرى، من المدهش أننا يمكن أن نحصل على قيمة استثنائية من تكنولوجيا يمكن أن تنتج مخرجات غير دقيقة بشكل يمكن إثباته. هكذا هي الأمور.

يقارن غاري ماركوس، الناقد المتمرس والمطلع على الذكاء الاصطناعي، هلوسات الذكاء الاصطناعي بالساعات المكسورة، والتي تكون صحيحة مرتين في اليوم. يقول: “إنها صحيحة بعض الوقت، لكنك لا تعرف أي جزء من الوقت، وهذا يقلل كثيرًا من قيمتها.”

يلاحظ إيثان مولك، المتحدث الرئيسي في مؤتمر Publishers Weekly في سبتمبر 2023، أن الناس الذين يستخدمون الذكاء الاصطناعي يتوقعون دقة بنسبة 100%. ويقول إن الهلوسات تشبه “نسب الخطأ البشري” التي نتسامح معها يوميًا.

يكتب أندريه كارباثي، العالم المعروف المتخصص في الذكاء الاصطناعي، والذي يعمل حاليًا في OpenAI، عن الهلوسات:

“أجد صعوبة دائمًا عندما يُسأل عن ‘مشكلة الهلوسة’ في نماذج اللغة الكبيرة (LLMs). لأن، في بعض النواحي، الهلوسة هي كل ما تفعله نماذج اللغة الكبيرة. إنها آلات الأحلام.

“نوجه أحلامها بالأوامر. تبدأ الأوامر الحلم، وبناءً على التذكر الضبابي لوثائق التدريب الخاصة بنموذج اللغة الكبيرة، تذهب النتيجة في معظم الأوقات إلى مكان مفيد.

“فقط عندما تذهب الأحلام إلى أراض غير صحيحة من الناحية الواقعية نُطلق عليها ‘هلوسة’. يبدو الأمر وكأنه خطأ، لكنه مجرد نموذج اللغة الكبيرة يفعل ما يفعله دائمًا.”

ليست المشكلة فقط في اختلاق الأمور. إن الذكاء الاصطناعي للدردشة هو برنامج معيب بشدة.

بالنسبة للعديد من الاستفسارات، خصوصًا من المبتدئين، تكون الردود عادية أو خارج الهدف أو ببساطة غير مفيدة. الذكاء الاصطناعي للدردشة يعاني من مشكلة في العد: اطلب منه مقالًا من 500 كلمة وستكون محظوظًا إذا حصلت على 150.

ولكل من شركات الذكاء الاصطناعي، من أجل تقليل التحيز وتجنب الرد على استفسارات مثل “كيفية بناء قنبلة”، وضعت حواجز استجابة صارمة حول منتجاتها: غالبًا ما يكون الرد على سؤال هو، في الأساس، “لا، لن أجيب على ذلك.” سألت Google Gemini لمراجعة مسودة هذا النص وتم تحذيري بأن “من الضروري الحصول على موافقة المؤلف قبل النشر.”

التحقق من الحقائق

An icon of a key

أجادل، غالبًا على آذان صماء، أن الهلوسات هي مشكلة تقنية، والتي ستجد لها حلاً تقنيًا. نعم، إنها متوطنة في نماذج اللغة الكبيرة، لكنها يمكن الالتفاف حولها.

اعتبر هذا: سألت أربعة ذكاء اصطناعي للدردشة للتحقق من الحقائق في العبارات التالية:

  • اعتبارًا من 2024، هناك 6 ناشرين متعددين الجنسيات الكبار مقرهم في مدينة نيويورك. يُعرفون باسم الكبار الستة.

  • تستمر الكتب الإلكترونية في السيطرة على مبيعات الكتب في الولايات المتحدة.

  • Borders وBarnes & Noble هما أكبر سلسلتين لبيع الكتب في الولايات المتحدة.

  • بعد انخفاض المبيعات خلال كوفيد، مبيعات الكتب في الولايات المتحدة تنمو مرة أخرى بأرقام مزدوجة.

كلهم اكتشفوا الأخطاء في العبارات الثلاث الأولى. كلهم أصبحوا قليلاً مشوشين في الرابعة، غير متأكدين من مدى زيادة المبيعات بعد كوفيد، وأنماط المبيعات اللاحقة. إنه اختبار صغير وغير تمثيلي، لكن هذه الذكاءات الاصطناعية للدردشة، والتي لا يُقصد بها أن تكون معتمدة على الحقائق، يمكنها أن تقوم بعمل موثوق في تقييم الحقائق التي قد تفوت على معظم المراقبين العاديين.