جدول المحتويات
في عالم الذكاء الاصطناعي، تتسابق الشركات للحصول على البيانات الضرورية لتدريب نماذجها، مما يثير تساؤلات أخلاقية وقانونية حول طرق الحصول على هذه البيانات. مؤخرًا، كشفت وثائق قضائية عن تكتيكات مثيرة للجدل اعتمدتها شركة أنثروبيك، المطورة للمساعد الذكي “Claude”، حيث أنفقت ملايين الدولارات لشراء وتدمير كتب ورقية بهدف استخدامها في تدريب نماذجها. يطرح هذا الأمر العديد من الأسئلة حول ممارسات الشركات في مجال الذكاء الاصطناعي وحقوق النشر.
أنثروبيك وتدمير الكتب
استراتيجيات جمع البيانات
في مطلع عام 2024، عيّنت شركة أنثروبيك توم تيرفي، المسؤول السابق عن مشروع “كتب جوجب”، لجمع “كافة كتب العالم”. استخدمت الشركة أسلوب المسح المدمر “Destructive Scanning”، حيث قامت بإزالة أغلفة الكتب وقطع الصفحات لتسهيل مسحها ضوئيًا، ثم تخلصت من النسخ الورقية بالكامل بعد تحويلها إلى ملفات رقمية.
الحكم القضائي
في قرار مثير للجدل، حكم القاضي ويليام ألسوب بأن عملية تدمير الكتب تندرج ضمن الاستخدام العادل، حيث أكدت أنثروبيك أنها اشترت الكتب بشكل قانوني، ولم تنشر النسخ الرقمية الممسوحة، بل استخدمتها داخليًا فقط. ومع ذلك، فإن اعتمادها على نسخ مقرصنة من الكتب في مراحل سابقة قد أضعف موقفها القانوني.
ممارسات بديلة في الذكاء الاصطناعي
طرق الأرشفة الحديثة
بينما اعتمدت أنثروبيك على أساليب تدميرية، تتبنى جهات أخرى مثل “أرشيف الإنترنت” تقنيات تضمن الحفاظ على النسخ الأصلية بجانب النسخ الرقمية. كما أعلنت شركتا OpenAI ومايكروسوفت عن تعاون مع مكتبات جامعة هارفارد لتدريب نماذجهم على نحو مليون كتاب من المجال العام دون تدمير أي نسخة.
استنتاج
إن قضية أنثروبيك تلقي الضوء على التحديات الأخلاقية والقانونية التي تواجهها صناعة الذكاء الاصطناعي في سعيها للحصول على البيانات. على الرغم من أن استخدام الكتب المدمرة قد يكون قانونيًا، إلا أن التساؤلات حول أخلاقيات هذا النهج تبقى قائمة. في الوقت الذي تسعى فيه الشركات إلى تحسين نماذجها، يجب أن يتم ذلك بطريقة تحترم حقوق المؤلفين والأصول الثقافية. إن التوازن بين الابتكار والحفاظ على التراث الأدبي هو أمر بالغ الأهمية لمستقبل الذكاء الاصطناعي.