بدأت خدمة جوجل للكتب في فهرسة الكتب ذات الجودة المنخفضة، وهذا قد يؤثر على كيفية عمل أداة تتبع اللغة Ngram.
تعد خدمة الكتب من أهم خدمات محرك البحث، حيث تساعد في تقديم فهرسة للمواد المنشورة وأصبحت ضرورية بالنسبة للأكاديميين.
تقارير تشير إلى أن خدمة الكتب من جوجل تحتوي على العديد من الكتب التي يبدو أنها كتبها الذكاء الاصطناعي.
أجرى التقرير استفسارًا في خدمة Google Books باستخدام المصطلح “منذ آخر تحديث لمعلوماتي”، والذي يستخدمه الروبوتات الذكية في الدردشة مثل ChatGPT لإعلامك بأن هناك قيود زمنية على البيانات التي يمكنها الوصول إليها.
يمكنك البحث عن الكتب في خدمة البحث الضخمة باستخدام جمل أو مصطلحات معينة، حيث تعرض الخدمة عادة الأعمال المكتوبة التي تحتوي على تلك العبارات.
وأظهر التقرير أن معظم الكتب التي تم استعراضها في الصفحات الأولى من البحث كانت تتناول موضوع الذكاء الاصطناعي، على الرغم من وجود بعض الكتب التي لا تتعلق بالتكنولوجيا ويبدو أنها عن الذكاء الاصطناعي.
ذكر التقرير أن الكتب التي وُجدت تبدو مأخوذة من مقالات ويكيبيديا، مثل جملة “منذ آخر تحديث لمعلوماتي”.
تتوفر هذه الكتب المكتوبة بتقنية الذكاء الاصطناعي للشراء على موقع أمازون وفي محلات البيع بالتجزئة الأخرى.
تضم الكتب الأخرى التي تناولت مواضيع مثل تويتر معلومات تعود إلى عام 2021، حين حصلت بعض أنماط الذكاء الاصطناعي على بيانات التدريب في ذلك الوقت.
خدمة كتب جوجل تمثل معظم البيانات التي تدعم Ngram، وهي أداة بحث تحلل تطور اللغة عبر الزمن من خلال مراقبة استخدامها في النصوص المكتوبة.
قامت خدمة جوجل للكتب بمسح الأعمال المكتوبة التي يعود تاريخها إلى القرن السادس عشر وفهرستها، وقُمِرت بتحديث بيانات Ngram التي تم الرجوع إليها آخر مرة في عام 2019.
لا يعتبر أداة Ngram مثالية تماما، ومع ذلك فإن العديد من اللغويين والأكاديميين يستفيدون من استخدامها في جمع البيانات البحثية.
أشارت جوجل إلى أن الأعمال الجديدة في خدمة الكتب التابعة لها لا تظهر في نتائج Ngram في الوقت الحالي، ولكن قد تظهر في التحديثات القادمة للبيانات.
قالت الشركة إنها مستمرة في تقييم استراتيجيتها بما يتماشى مع تطور عالم نشر الكتب، دون الإشارة إلى إزالة هذه النتائج من الخدمة.