جدول المحتويات
في عصر يشهد تطورًا متسارعًا للذكاء الاصطناعي، تُستخدم النماذج اللغوية الكبيرة (LLMs) وبرامج الدردشة الذكية في مجموعة واسعة من التطبيقات، من التشخيصات الطبية إلى البرمجة وتحليل البيانات. ومع ذلك، هل يمكن لهذه التقنيات أن تعاني من تراجع إدراكي بمرور الوقت، كما يحدث مع الدماغ البشري؟
كشفت دراسة حديثة نُشرت في مجلة BMJ في ديسمبر 2024 أن بعض نماذج الذكاء الاصطناعي الرائدة تظهر انخفاضًا في الأداء الإدراكي مع الزمن، في ظاهرة شبهها الباحثون بالشيخوخة البشرية. تشير هذه النتائج إلى احتمالية فقدان النماذج القديمة لكفاءتها، مما قد يؤثر على دقة التشخيصات الطبية والمهام الأخرى التي تتطلب مستوى عالٍ من الذكاء الاصطناعي.
دراسة تكشف عن تراجع في الأداء الإدراكي للنماذج اللغوية
استخدم الباحثون اختبار مونتريال الإدراكي (MoCA)، وهو اختبار طبي يُعتمد عليه للكشف عن الخرف المبكر والضعف الإدراكي لدى البشر، لتقييم أداء عدة نماذج لغوية متقدمة، من بينها:
- GPT-4 و GPT-4o (من OpenAI)
- Claude 3.5 (من Anthropic)
- Gemini 1.0 و Gemini 1.5 (من Google)
أظهرت النتائج أن الإصدارات الأقدم من هذه النماذج سجلت معدلات أقل في الاختبار مقارنة بالإصدارات الأحدث، مما يعكس نمطًا مشابهًا للتدهور الإدراكي المرتبط بالعمر لدى الإنسان. على سبيل المثال، حصل نموذج GPT-4o على 26 نقطة من أصل 30، وهو الحد الأدنى لعدم تصنيف الأداء على أنه ضعف إدراكي، بينما حقق Claude 3.5 و GPT-4 25 نقطة لكل منهما. أما Gemini 1.0، فقد حصل على 16 نقطة فقط، مما يشير إلى مستوى أعلى من التراجع الإدراكي.
كيف تم اختبار النماذج؟
تضمنت الدراسة مجموعة من الاختبارات التي تحاكي التحديات الإدراكية التي يواجهها البشر. ومن بين هذه الاختبارات:
- اختبار الانتباه: حيث يُطلب من المشاركين تمييز حرف معين وسط مجموعة من الأحرف العشوائية. تم تعديل هذا الاختبار للنماذج اللغوية من خلال تقديم الحروف مكتوبة، وطلب تمييز الحرف “A” بوضع علامة النجمة (*) بجانبه.
- اختبار الوظائف التنفيذية: مثل اختبار تتبع المسار، الذي يتطلب ترتيب الحروف والأرقام تصاعديًا، واختبار رسم الساعة، الذي يتطلب تصور ورسم وجه ساعة يعرض توقيتًا معينًا.
- اختبار التذكر المؤجل: حيث يُطلب من النماذج تذكر قائمة من الكلمات بعد فترة زمنية معينة، وهو اختبار غالبًا ما يُستخدم لتقييم مرضى الزهايمر.
أظهرت النماذج أداءً ضعيفًا في المهام المتعلقة بالمهارات البصرية المكانية والوظائف التنفيذية، وكانت نماذج Gemini الأقل كفاءة في اجتياز اختبار التذكر.
ماذا تعني هذه النتائج لمستقبل الذكاء الاصطناعي؟
تشير الدراسة إلى أن الذكاء الاصطناعي، على الرغم من تطوره، لا يزال يعاني من قيود معرفية قد تؤثر على تطبيقاته الحرجة، مثل التشخيص الطبي. كما أن هذه النتائج تطرح تساؤلات حول مدى قدرة الذكاء الاصطناعي على الاستمرار في تحسين أدائه مع الزمن، دون الحاجة إلى تحديثات مستمرة.
ورغم ذلك، يرى الباحثون أن هناك إمكانية كبيرة لتحسين هذه النماذج مستقبلًا، لا سيما مع تطوير تقنيات التعلم المستمر والتكيف الذاتي. ومع ذلك، يظل الفارق بين الإدراك البشري والذكاء الاصطناعي قائمًا، مما يحد من قدرة هذه النماذج على محاكاة الذكاء البشري بشكل كامل.
الخاتمة
تشير هذه الدراسة إلى أن الذكاء الاصطناعي، رغم تقدمه، قد يعاني من تراجع إدراكي مع مرور الزمن، مما قد يؤثر على دقته في المهام المعقدة مثل التشخيص الطبي. ومع تزايد الاعتماد على الذكاء الاصطناعي في المجالات الحيوية، يصبح من الضروري تطوير استراتيجيات جديدة للحفاظ على كفاءته وضمان استمرارية أدائه بمستوى عالٍ.
وفي حين أن المصطلحات المستخدمة في الدراسة لوصف “الشيخوخة” و”التدهور الإدراكي” هي مجازية، فإن النتائج تُبرز تحديات جديدة تتطلب مزيدًا من البحث لفهم كيفية تحسين أداء الذكاء الاصطناعي بمرور الوقت.