جدول المحتويات
الذكاء الاصطناعي يواجه تحديات في فهم التاريخ
على الرغم من التقدم الهائل الذي أحرزه الذكاء الاصطناعي في مجالات متعددة، لا يزال يواجه عقبات كبيرة في فهم التاريخ وتحليله. فقد أثبتت النماذج اللغوية الكبيرة مثل GPT-4 وLlama وGemini قدرتها على أداء مهام تقنية وإبداعية معقدة، مثل كتابة الأكواد البرمجية وإنشاء المحتوى، لكنها لا تزال تعاني من ضعف واضح في التعامل مع المعلومات التاريخية الدقيقة.
كشفت دراسة حديثة، عُرضت في مؤتمر (NeurIPS)، وهو أحد أبرز المؤتمرات العالمية في الذكاء الاصطناعي، عن نتائج مخيبة للآمال عند اختبار هذه النماذج في الإجابة عن أسئلة تاريخية معقدة. حيث لم يتمكن نموذج GPT-4 Turbo، الذي حقق أفضل أداء بين النماذج المختبرة، من تحقيق سوى 46% دقة فقط، وهو ما يشير إلى أن أداءه لم يكن أفضل بكثير من التخمين العشوائي.
معيار جديد لاختبار دقة النماذج اللغوية في التاريخ
لتحليل مدى قدرة الذكاء الاصطناعي على فهم التاريخ، قام فريق من الباحثين بتطوير معيار جديد يُسمى (Hist-LLM)، والذي يعتمد على قاعدة بيانات شاملة تُعرف باسم (Seshat)، وهي قاعدة بيانات ضخمة تجمع معلومات تاريخية من مصادر متعددة. يهدف هذا المعيار إلى تقييم دقة المعلومات التي تقدمها النماذج اللغوية ومدى موثوقيتها مقارنةً بالحقائق التاريخية الموثقة.
وقد اختُبرت ثلاثة نماذج لغوية كبيرة رائدة في هذه الدراسة، وهي:
- GPT-4 من OpenAI
- Llama من Meta
- Gemini من Google
يركز معيار Hist-LLM على تحليل قدرة هذه النماذج على فهم السياق التاريخي والتفريق بين المعلومات الصحيحة والخاطئة. لكن النتائج كشفت عن قصور واضح في استيعاب التفاصيل التاريخية، مما يشير إلى أن هذه النماذج لا تزال تفتقر إلى المهارات التحليلية المطلوبة لفهم التاريخ بشكل عميق.
لماذا تعاني النماذج اللغوية الكبيرة في فهم التاريخ؟
1. استناد النماذج إلى البيانات الشائعة فقط
أحد الأسباب الرئيسية لهذا القصور هو ميل النماذج اللغوية إلى الاستقراء من المعلومات الشائعة والمتكررة، مما يجعلها غير قادرة على تقديم إجابات دقيقة حول الموضوعات التاريخية المعقدة أو الأقل شهرة. على سبيل المثال، عندما طُلب من GPT-4 Turbo تحديد ما إذا كانت الدروع الحرشفية مستخدمة في مصر القديمة في فترة معينة، قدم إجابة خاطئة، حيث أشار إلى استخدامها رغم أنها لم تظهر إلا بعد 1500 عام من تلك الحقبة الزمنية.
2. عدم القدرة على التحليل النقدي للمصادر التاريخية
أكدت ماريا ديل ريو-شانونا، الأستاذة المشاركة في علوم الحاسوب في جامعة كوليدج لندن، أن النماذج اللغوية الكبيرة تستطيع استرجاع المعلومات العامة بسهولة، لكنها تعجز عن تحليل المصادر التاريخية بشكل نقدي أو تقديم تفسيرات جديدة للأحداث التاريخية.
هذا يعني أن الذكاء الاصطناعي يمكنه تقديم بيانات تاريخية موثقة، لكنه غير قادر حاليًا على التحليل العميق أو استنتاج ارتباطات تاريخية جديدة، وهو ما يمثل تحديًا كبيرًا إذا تمت محاولة استخدامه في البحوث التاريخية المتقدمة.
3. التحيز في بيانات التدريب
أبرزت الدراسة أيضًا وجود تحيزات واضحة في بيانات التدريب، حيث كان أداء GPT-4 وLlama ضعيفًا عند الإجابة عن أسئلة تتعلق بتاريخ أفريقيا جنوب الصحراء الكبرى، مما يشير إلى نقص البيانات الموثوقة حول هذه المناطق في مجموعات التدريب الخاصة بهذه النماذج.
وقد أوضح بيتر تورتشين، قائد الدراسة، أن هذه النتائج تؤكد أن الذكاء الاصطناعي لا يزال غير مؤهل ليحل محل المؤرخين في تحليل ودراسة التاريخ، لكنه قد يكون أداة مساعدة في جمع المعلومات الأولية أو تسريع بعض جوانب البحث التاريخي.
كيف يمكن تحسين فهم الذكاء الاصطناعي للتاريخ؟
1. تحسين جودة بيانات التدريب
للتغلب على هذه المشكلات، يجب توسيع نطاق البيانات التاريخية المستخدمة في تدريب النماذج اللغوية، مع ضمان تمثيل عادل لمختلف الفترات الزمنية والمناطق الجغرافية.
2. تطوير نماذج لغوية أكثر قدرة على التحليل النقدي
يحتاج البحث في هذا المجال إلى تطوير نماذج ذكاء اصطناعي يمكنها تحليل المصادر التاريخية بشكل نقدي، بدلاً من الاعتماد فقط على استرجاع المعلومات النصية.
3. تعزيز المعايير المستخدمة في التقييم
يعمل الباحثون حاليًا على تحسين معايير التقييم، مثل (Hist-LLM)، من خلال إضافة المزيد من البيانات وتحليل الأخطاء بشكل أكثر تفصيلاً، مما قد يساعد في تحسين أداء النماذج المستقبلية.
الخلاصة: هل يمكن للذكاء الاصطناعي أن يفهم التاريخ؟
على الرغم من التطورات الكبيرة في تقنيات الذكاء الاصطناعي، لا تزال النماذج اللغوية الكبيرة تواجه تحديات جوهرية في فهم وتحليل التاريخ. أظهرت الدراسات الحديثة أن هذه النماذج تعتمد بشكل مفرط على البيانات المتاحة، وتفتقر إلى القدرة على التحليل النقدي والتفسير العميق للأحداث التاريخية.
ومع ذلك، فإن هذه النماذج تظل أداة واعدة يمكن تحسينها بمرور الوقت، من خلال تطوير قواعد بيانات أكثر شمولًا، وتحسين استراتيجيات التدريب، وتعزيز قدرتها على التعامل مع المعلومات التاريخية المعقدة.
في المستقبل، قد يصبح الذكاء الاصطناعي شريكًا فعالًا في البحث التاريخي، لكنه لن يكون بديلاً عن المؤرخين والخبراء البشريين الذين يمتلكون القدرة على التحليل والتفسير النقدي للأحداث التاريخية.