Home أخبار يستخدم مشروع Astra من Google كاميرا هاتفك والذكاء الاصطناعي للعثور على مصادر...

يستخدم مشروع Astra من Google كاميرا هاتفك والذكاء الاصطناعي للعثور على مصادر الضوضاء والعناصر الموضوعة في غير مكانها وغير ذلك الكثير.

7
0

عندما عرضت جوجل لأول مرة تقنية المساعد الصوتي دوبلكس في مؤتمر المطورين في عام 2018، كان الأمر مثيرًا للإعجاب ومثيرًا للقلق. اليوم، في I/O 2024، قد تطرح الشركة ردود الفعل نفسها مرة أخرى، هذه المرة من خلال عرض تطبيق آخر لذكاء الذكاء الاصطناعي الخاص بها من خلال شيء يسمى Project Astra.

لم تتمكن الشركة حتى من الانتظار حتى خطابها الرئيسي اليوم لإثارة مشروع Astra، حيث نشرت مقطع فيديو على وسائل التواصل الاجتماعي الخاصة بها لتطبيق الذكاء الاصطناعي القائم على الكاميرا أمس. ومع ذلك، في كلمته الرئيسية اليوم، شارك ديميس هاسابيس، الرئيس التنفيذي لشركة DeepMind في Google، أن فريقه “أراد دائمًا تطوير عوامل ذكاء اصطناعي عالمية يمكن أن تكون مفيدة في الحياة اليومية”. مشروع أسترا هو نتيجة التقدم على تلك الجبهة.

وفقًا لمقطع فيديو عرضته جوجل خلال مؤتمر صحفي بالأمس، يبدو أن Project Astra هو تطبيق يحتوي على عدسة الكاميرا كواجهة رئيسية له. قام شخص يحمل هاتفًا بتوجيه كاميرته نحو أجزاء مختلفة من المكتب وقال شفهيًا “أخبرني عندما ترى شيئًا يصدر صوتًا”. عندما ظهر مكبر صوت بجوار الشاشة، أجاب الجوزاء “أرى مكبر صوت يصدر صوتًا”.

توقف الشخص الذي يقف خلف الهاتف ورسم سهمًا على الشاشة إلى الدائرة العلوية على مكبر الصوت وقال: “ما اسم هذا الجزء من مكبر الصوت؟” أجاب جيميني على الفور “هذا هو مكبر الصوت. إنه يصدر أصواتًا عالية التردد.”

بعد ذلك، في مقطع الفيديو الذي قالت Google إنه تم تسجيله في لقطة واحدة، انتقل القائم بالاختبار إلى كوب من أقلام التلوين في أسفل الطاولة وسأل “أعطني جناسًا إبداعيًا حول هذه”، فقال له الجوزاء “أقلام التلوين الإبداعية تلون بشكل مبهج. إنهم بالتأكيد يصنعون إبداعات ملونة.”

يستمر باقي الفيديو لإظهار Gemini في Project Astra وهو يحدد ويشرح أجزاء من التعليمات البرمجية على الشاشة، ويخبر المستخدم بالحي الذي كان فيه بناءً على المنظر من النافذة. والأكثر إثارة للإعجاب هو أن أسترا كانت قادرة على الإجابة “هل تتذكر أين رأيت نظارتي؟” على الرغم من أن النظارات المذكورة كانت خارج الإطار تمامًا ولم تتم الإشارة إليها مسبقًا. قال جيميني: “نعم، أعتقد ذلك”، مضيفًا: “كانت نظارتك على مكتب بالقرب من تفاحة حمراء”.

بعد أن حددت شركة Astra تلك النظارات، قام القائم بالاختبار بارتدائها وانتقل الفيديو إلى منظور ما تراه على الجهاز القابل للارتداء. وباستخدام الكاميرا الموجودة على متنها، قامت النظارات بمسح محيط مرتديها لرؤية أشياء مثل رسم تخطيطي على السبورة البيضاء. ثم سأل الشخص الموجود في الفيديو “ما الذي يمكنني إضافته هنا لجعل هذا النظام أسرع؟” أثناء تحدثهم، تحرك شكل موجة على الشاشة للإشارة إلى أنه كان يستمع، وعندما استجاب، ظهرت التسميات التوضيحية النصية جنبًا إلى جنب. قالت Astra “إن إضافة ذاكرة تخزين مؤقت بين الخادم وقاعدة البيانات قد يؤدي إلى تحسين السرعة.”

ثم نظر القائم بالاختبار إلى زوج من القطط المرسومة على السبورة وسأل “بماذا يذكرك هذا؟” قال أسترا “قطة شرودنجر”. أخيرًا، التقطوا لعبة نمر فخمة، ووضعوها بجوار كلب جولدن ريتريفر لطيف وطلبوا “اسم فرقة لهذا الثنائي”. أجاب أسترا بإخلاص “خطوط ذهبية”.

وهذا يعني أن Astra لم تكن تقوم بمعالجة البيانات المرئية في الوقت الفعلي فحسب، بل كانت تتذكر أيضًا ما شاهدته وتعمل مع تراكم مثير للإعجاب من المعلومات المخزنة. وقد تم تحقيق ذلك، وفقًا لهاسابيس، لأن هؤلاء “الوكلاء” “مصممون لمعالجة المعلومات بشكل أسرع من خلال تشفير إطارات الفيديو بشكل مستمر، والجمع بين مدخلات الفيديو والكلام في جدول زمني للأحداث، وتخزين هذه المعلومات مؤقتًا لاسترجاعها بكفاءة.”

ومن الجدير بالذكر أيضًا أن Astra، على الأقل في الفيديو، كانت تستجيب بسرعة. وأشار هاسابيس في منشور على مدونته إلى أنه “على الرغم من أننا حققنا تقدمًا مذهلاً في تطوير أنظمة الذكاء الاصطناعي التي يمكنها فهم المعلومات متعددة الوسائط، فإن تقليل وقت الاستجابة لشيء تحادثي يعد تحديًا هندسيًا صعبًا.”

تعمل Google أيضًا على منح الذكاء الاصطناعي الخاص بها نطاقًا أكبر للتعبير الصوتي، وذلك باستخدام نماذج الكلام الخاصة بها “لتعزيز طريقة الصوت، مما يمنح العملاء نطاقًا أوسع من النغمات”. هذا النوع من تقليد التعبير البشري في الاستجابات يذكرنا بتوقفات دوبلكس وأقواله التي دفعت الناس إلى الاعتقاد بأن الذكاء الاصطناعي من جوجل قد يكون مرشحًا لاختبار تورينج.

في حين أن Astra لا تزال ميزة مبكرة مع عدم وجود خطط واضحة للإطلاق، كتب هاسابيس أنه في المستقبل، يمكن أن يكون هؤلاء المساعدون متاحين “من خلال هاتفك أو نظاراتك”. لا توجد معلومات حتى الآن حول ما إذا كانت هذه النظارات هي في الواقع منتج أو خليفة لـ Google Glass، لكن هاسابيس كتب أن “بعض هذه الإمكانات ستأتي إلى منتجات Google، مثل تطبيق Gemini، في وقت لاحق من هذا العام”.

تابع جميع الأخبار من Google I/O 2024 هنا!

مصدر

LEAVE A REPLY

Please enter your comment!
Please enter your name here