قدمت شركة جوجل مشروع أسترا، وهو وكيل ذكاء اصطناعي طموح، وتقول الشركة إنه يمثل مستقبل المساعدين الذكاء الاصطناعي الذين يتفاعلون مع العالم بنفس الطريقة التي يتفاعل بها البشر، ويتذكرون ما يرون ويسمعونه من أجل الإجابة عن الأسئلة المتعلقة بالمحيط الذي يتواجدون فيه.
خلال مؤتمرها السنوي للمطورين، قدمت الشركة شرحًا لكيفية عمل مثل هذا الوكيل، حيث عرضت مقطع فيديو سجل سابقًا يظهر أحد الموظفين يتجول في المكتب ويستخدم مساعد الذكاء الاصطناعي عبر كاميرا الهاتف للرؤية والرد على الأسئلة المتعلقة بالمشهد.
أجاب وكيل الذكاء الاصطناعي بشكل صحيح على سؤال حول موقع المكتب في أي حي في لندن بناءً على الإطلالة من النافذة، وأخبر الموظف أيضًا عن مكان ترك نظارته.
هذا يعني أن مشروع أسترا يتعامل مع البيانات المرئية في الزمن الفعلي، ويحتفظ أيضًا بما شاهده ويراه، ويعرض المعلومات المخزنة.
وبحسب الشركة، يتم تصميم الوكلاء لمعالجة المعلومات بسرعة من خلال الترميز المستمر لإطارات الفيديو والجمع بين إشارات الفيديو والصوت في جدول زمني للأحداث وتخزين هذه البيانات مؤقتًا لتمكين استرجاعها بكفاءة.
قالت جوجل في منشور: “لقد حققنا تقدمًا كبيرًا في تطوير أنظمة الذكاء الاصطناعي التي تستطيع فهم المعلومات من مصادر متعددة، ورغم أن تقليل وقت الاستجابة لشيء حواري يشكل تحديًا هندسيًا صعبًا”.
تعمل جوجل أيضًا على توفير نطاق واسع من الذكاء الاصطناعي لتعزيز التعبير الصوتي، من خلال استخدام نماذج الكلام لتحسين جودة الصوت ومنح العملاء تجربة صوتية متنوعة.
يشبه هذا النوع من التعبير البشري في الردود بتوقفات نظام دوبلكس التي دفعت الناس إلى الاعتقاد بأن الذكاء الاصطناعي من جوجل قد يكون مرشحًا لاختبار تورينج.
بحسب جوجل، يُتوقع أن تصل بعض ميزات مشروع أسترا Project Astra إلى Gemini في الربع الثالث من هذا العام.