استخدام زواحف خفية بواسطة Perplexity لتخطي ملفات robots.txt

جدول المحتويات

في انتهاك صارخ لقواعد الإنترنت، تم رصد محاولات من قبل منصة Perplexity AI لاستخدام زواحف خفية لتجاوز توجيهات منع الزحف المحددة في ملفات robots.txt. هذه الأساليب أثارت الكثير من المخاوف حول الخصوصية والشفافية، مما يستدعي الانتباه إلى كيفية تعامل المنصات مع البيانات والسلوكيات غير الأخلاقية في هذا السياق.

السلوك غير الأخلاقي لمنصة Perplexity AI

في تقرير نُشر بتاريخ 4 أغسطس 2025، كشف باحثون من Cloudflare عن تفاصيل مثيرة تتعلق بسلوكيات غير عادية من منصة Perplexity AI. حيث بدأت هذه المنصة أعمال الزحف باستخدام وكيل مستخدم رسمي، لكنها ما لبثت أن انتقلت لاستخدام وكيل غير مرئي يشبه متصفح Google Chrome. اللافت هنا هو عدم احترام المحتويات الموجودة في ملفات robots.txt، بل إن بعض الأحيان لم تتم محاولة تحميلها من الأساس.

كيف تعمل الزواحف الخفية؟

تستخدم زواحف خفية من قبل Perplexity عناوين IP من شبكات غير معلنة (ASNs) وغير مدرجة ضمن قوائمها الرسمية. كما تم استعمال أسماء نطاقات تم إعدادها خصيصًا لاختبار توجيهات منع الزحف، مع اكتشاف أن المنصة تمكنت من الوصول لمحتويات المواقع رغم وجود قيود صارمة. يُظهر السلوك أن الزاحف الخفي يرسل من 3 إلى 6 ملايين طلب يوميًا، مقارنةً بـ 20 إلى 25 مليون طلب من الزاحف الرسمي، مما يعكس استراتيجية التفاف معقدة.

التأثير السلبي على المواقع

يُعتبر استخدام زواحف خفية انتهاكًا واضحًا لقواعد الشفافية والاحترام المتبادل بين مقدمي المحتوى ومزودي الذكاء الاصطناعي. فقد تمت ملاحظة نشاط الزاحف الخفي على آلاف المواقع، مستخدمًا تقنيات تناوب IP وسلوكيات التهرب الآلي. وعندما يتم حظر الزاحف، تلجأ المنصة إلى مصادر بيانات خارجية للإجابة، لكن بجودة أقل، مما يؤثر على دقة نتائجها وموثوقيتها.

الأهداف المستقبلية من هذا الكشف

يسعى التقرير إلى تحقيق مجموعة من الأهداف التي تضمن حماية الإنترنت كمجتمع شفاف ومحترم. من بين هذه الأهداف:

1. التأكيد على أهمية احترام ملفات robots.txt: كأداة رسمية للتحكم في زحف البيانات، ينبغي أن تكون مبدأً أساسيًا في ممارسات الزحف عبر الإنترنت.
2. كشف محاولات التحايل على الحظر: فقد أظهرت النتائج تحايل بعض مزودي خدمات الذكاء الاصطناعي على القيود الأمنية، مما يتطلب الكثير من الانتباه.
3. تمكين أصحاب المواقع: يمكن لأصحاب المواقع التعرف على زواحف خفية غير مرغوبة وحظرها تلقائيًا للحفاظ على جودة بياناتهم.
4. دعم أدوات إدارة البوتات: يجب وضع توقيعات رقمية للزاحف الخفي المستخدم من قبل Perplexity لتيسير عملية التعرف عليه.
5. التعاون مع منظمات مثل IETF: بهدف تطوير معايير أكثر صرامة لزواحف الإنترنت، مما يعزز من الأمن والشفافية على الشبكة.

أهمية حماية البيانات والامتثال

مع تزايد اعتماد العالم على البيانات المفتوحة، يكون من الضروري على جميع الأطراف المعنية الالتزام بالقواعد التي تحمي الخصوصية وتضمن الاستخدام الأخلاقي للبيانات. إن السلوكيات مثل تلك التي تظهرها زواحف خفية غير مقبولة ويجب مواجهتها بصرامة.

الخلاصة

يعد انكشاف سلوكيات Perplexity AI من قبل Cloudflare بمثابة دعوة لجميع الأطراف لإعادة النظر في الطرق التي يتم بها استخدام وتعامل البيانات. فالشفافية والاحترام المتبادل هما أساس العلاقة بين مزودي المحتوى ومزودي الذكاء الاصطناعي. يجب أن يلتزم الجميع بقواعد الإنترنت لضمان بيئة أكثر أمانًا وموثوقية.

قد تعجبك أيضاً

شراكات

منصة Bawaba AI تعمل بأدوات مدعومة من شركة مايكروسوفت تحت برنامج دعم المشاريع الناشئة.

Perplexity وكيفية تجاوز ملفات robots.txt باستخدام الزواحف الخفية