Home أخبار جوجل تكشف النقاب عن Veo، وهو مولد فيديو عالي الدقة يعمل بالذكاء...

جوجل تكشف النقاب عن Veo، وهو مولد فيديو عالي الدقة يعمل بالذكاء الاصطناعي والذي قد ينافس Sora

9
0

تكبير / الصور الثابتة مأخوذة من مقاطع الفيديو التي تم إنشاؤها بواسطة Google Veo.

جوجل / بينج إدواردز

في يوم الثلاثاء في Google I/O 2024، أعلنت جوجل عن Veo، وهو نموذج جديد لتركيب الفيديو بالذكاء الاصطناعي يمكنه إنشاء مقاطع فيديو عالية الدقة من النصوص أو الصور أو مطالبات الفيديو، على غرار Sora من OpenAI. ويمكنه إنشاء مقاطع فيديو بدقة 1080 بكسل تدوم أكثر من دقيقة وتحرير مقاطع الفيديو من التعليمات المكتوبة، ولكن لم يتم إصدارها بعد للاستخدام على نطاق واسع.

يقال إن Veo يتضمن القدرة على تحرير مقاطع الفيديو الموجودة باستخدام أوامر نصية، والحفاظ على الاتساق البصري عبر الإطارات، وإنشاء تسلسلات فيديو تصل مدتها إلى 60 ثانية وأكثر من مطالبة واحدة أو سلسلة من المطالبات التي تشكل سردًا. وتقول الشركة إنها تستطيع إنشاء مشاهد تفصيلية وتطبيق تأثيرات سينمائية مثل الفواصل الزمنية واللقطات الجوية والأنماط المرئية المتنوعة

منذ إطلاق DALL-E 2 في أبريل 2022، شهدنا عرضًا لنماذج تركيب الصور وتركيب الفيديو الجديدة التي تهدف إلى السماح لأي شخص يمكنه كتابة وصف مكتوب بإنشاء صورة أو مقطع فيديو مفصل. على الرغم من أنه لم يتم تحسين أي من التقنيتين بشكل كامل، إلا أن مولدات الصور والفيديو ذات الذكاء الاصطناعي تنمو بشكل مطرد أكثر قدرة.

في شهر فبراير، قمنا بتغطية معاينة لمولد الفيديو Sora من OpenAI، والذي اعتقد الكثيرون في ذلك الوقت أنه يمثل أفضل تركيب فيديو يعمل بالذكاء الاصطناعي يمكن أن تقدمه الصناعة. لقد أثار إعجاب تايلر بيري بدرجة كافية لدرجة أنه أوقف توسعات استوديو الأفلام الخاص به. ومع ذلك، حتى الآن، لم توفر OpenAI وصولاً عامًا إلى الأداة، وبدلاً من ذلك، قصرت استخدامها على مجموعة مختارة من المختبرين.

الآن، يبدو للوهلة الأولى أن برنامج Veo من Google قادر على إنتاج مقاطع فيديو مشابهة لما حققه Sora. لم نقم بتجربته بأنفسنا، لذلك لا يمكننا سوى الاطلاع على مقاطع الفيديو التوضيحية المنتقاة بعناية والتي قدمتها الشركة على موقعها الإلكتروني. وهذا يعني أن أي شخص يشاهدها يجب أن يأخذ ادعاءات جوجل بقدر كبير من الشك، لأن نتائج الإنشاء قد لا تكون نموذجية.

تتضمن مقاطع الفيديو النموذجية من Veo راعي بقر يمتطي حصانًا، ولقطة سريعة في أحد شوارع الضواحي، وكباب مشوي على الشواية، ولقطة متتابعة لفتحة عباد الشمس، والمزيد. من الواضح أن هناك غيابًا لأي تصوير تفصيلي للبشر، والذي كان تاريخيًا صعبًا بالنسبة لنماذج الصور والفيديو التي تعمل بالذكاء الاصطناعي لإنشاءها دون تشوهات واضحة.

إعلان

تقول Google إن Veo يعتمد على نماذج إنشاء الفيديو السابقة للشركة، بما في ذلك Geneative Query Network (GQN)، وDVD-GAN، وImagen-Video، وPhenaki، وWALT، وVideoPoet، وLumiere. لتعزيز الجودة والكفاءة، تتضمن بيانات تدريب Veo تعليقات فيديو أكثر تفصيلاً، وتستخدم تمثيلات فيديو “كامنة” مضغوطة. ولتحسين جودة إنشاء فيديو Veo، قامت Google بتضمين تسميات توضيحية أكثر تفصيلاً لمقاطع الفيديو المستخدمة لتدريب Veo، مما يسمح للذكاء الاصطناعي بتفسير المطالبات بشكل أكثر دقة.

يبدو Veo أيضًا ملحوظًا لأنه يدعم أوامر صناعة الأفلام: “عند إعطاء أمر إدخال الفيديو وأمر التحرير، مثل إضافة قوارب الكاياك إلى لقطة جوية لخط ساحلي، يمكن لـ Veo تطبيق هذا الأمر على الفيديو الأولي وإنشاء فيديو جديد محرر، “تقول الشركة.

في حين أن العروض التوضيحية تبدو مثيرة للإعجاب للوهلة الأولى (خاصة بالمقارنة مع ويل سميث وهو يتناول السباغيتي)، فإن جوجل تعترف بصعوبة إنشاء فيديو بتقنية الذكاء الاصطناعي. وكتبت الشركة: “إن الحفاظ على الاتساق البصري يمكن أن يشكل تحديًا لنماذج إنشاء الفيديو”. “يمكن أن تومض الشخصيات أو الكائنات أو حتى المشاهد بأكملها، أو تقفز، أو تتحول بشكل غير متوقع بين الإطارات، مما يعطل تجربة المشاهدة.”

لقد حاولت Google التخفيف من هذه العيوب باستخدام “محولات الانتشار الكامنة المتطورة”، والتي هي في الأساس حديث تسويقي لا معنى له بدون تفاصيل. لكن الشركة واثقة بما فيه الكفاية من النموذج لدرجة أنها تعمل مع الممثل دونالد جلوفر والاستوديو الخاص به، جيلجا، لإنشاء فيلم توضيحي تم إنشاؤه بواسطة الذكاء الاصطناعي والذي سيتم عرضه لأول مرة قريبًا.

في البداية، سيكون Veo متاحًا لمبدعين مختارين من خلال VideoFX، وهي أداة تجريبية جديدة متاحة على موقع Google AI Test Kitchen الإلكتروني، labs.google. يمكن لمنشئي المحتوى الانضمام إلى قائمة انتظار VideoFX ليتمكنوا من الوصول إلى ميزات Veo في الأسابيع المقبلة. تخطط Google لدمج بعض إمكانيات Veo في YouTube Shorts والمنتجات الأخرى في المستقبل.

لا توجد معلومات حتى الآن حول المكان الذي حصلت فيه Google على بيانات التدريب الخاصة بـ Veo (إذا كان علينا أن نخمن، فمن المحتمل أن يكون موقع YouTube متورطًا). لكن جوجل تقول إنها تتخذ نهجًا “مسؤولًا” مع Veo. وفقًا للشركة، “تم وضع علامة مائية على مقاطع الفيديو التي أنشأتها Veo باستخدام SynthID، أداتنا المتطورة لوضع العلامات المائية وتحديد المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، ويتم تمريرها عبر مرشحات الأمان وعمليات التحقق من الحفظ التي تساعد في تخفيف مخاطر الخصوصية وحقوق الطبع والنشر والتحيز.”

مصدر

LEAVE A REPLY

Please enter your comment!
Please enter your name here