صوت وصورة... فيديوهات مولدة بالذكاء الاصطناعي من غوغل تدهش المستخدمين

السبت 2025-05-24

دخل الذكاء الاصطناعي حياتنا الشخصية والمهنية من الباب العريض، وتكاد كل الوظائف والقطاعات تتأثر بالأدوات الجديدة التي تُطرح باستخدام هذه التكنولوجيا، من الصحة والتعليم إلى الفن والسينما.

ومؤخراً، يتداول رواد مواقع التواصل الاجتماعي فيديوهات مولَّدة بالذكاء الاصطناعي عبر أداة طوَّرتها شركة «غوغل»، حيث يعبّر المستخدمون عن دهشتهم من دقة المشاهد والسيناريوهات ووضوحها وحتى الأصوات.

وانتشرت عبر الإنترنت فيديوهات عدة تُظهر شخصيات تبدو وكأنها بشر حقيقيون، مع دقة في الصوت والأداء والتعبير عن المشاعر؛ الأمر الذي صدم المستخدمين، وأرعب بعضهم.

I did more tests with Google's #Veo3. Imagine if AI characters became aware they were living in a simulation! pic.twitter.com/nhbrNQMtqv

— Hashem Al-Ghaili (@HashemGhaili) May 21, 2025

وتسعى «غوغل» لتسهيل إنشاء مقاطع فيديو مُولَّدة بالذكاء الاصطناعي، ولديها أداة جديدة لتحقيق ذلك. تُسمى هذه الأداة Flow، وأعلنت عنها «غوغل» إلى جانب نموذجها الجديد لتوليد الفيديو Veo 3، والمزيد من عناصر التحكم في نموذج Veo 2، ونموذج جديد لتوليد الصور Imagen 4.

وكتب أحد المستخدمين عبر منصة «إكس»: «يطمس veo3 الخطوط الفاصلة بين الواقع والخيال من خلال الصوت، والالتزام الأقوى بالنص، والتفاصيل المرئية الأكثر ثراءً».

وقال آخر: «الذكاء الاصطناعي يخرج عن السيطرة. في غضون بضع سنوات، أشك في أننا سنتمكن من التمييز بين ما هو حقيقي وما هو زائف».

AI is getting out of hand. In a few years, I doubt we’ll be able to tell what’s real and what’s not#Veo3 pic.twitter.com/55TSjbTXwe

— CrackRBIHub | Abhishek (@CrackRBIHub) May 22, 2025

باستخدام Flow، يمكنك استعمال أدوات مثل تحويل النص ومكونات عدة إلى فيديو. يمكنك القيام بذلك ببساطة، عبر مشاركة بعض الصور التي يمكن لـFlow استخدامها مع بعض العناصر لمساعدة النموذج على تحديد ما تبحث عنه لإنشاء مقاطع مُولَّدة بالذكاء الاصطناعي مدتها ثماني ثوانٍ. بعد ذلك، يمكنك استخدام أدوات بناء المشاهد في Flow لربط مقاطع متعددة معاً، وإنتاج فيديوهات متناسقة ومتكاملة.

تُنافس أداة الذكاء الاصطناعي هذه مُولّد الفيديو Sora من OpenAI، لكن قدرتها على دمج الصوت في الفيديو الذي تُنتجه تُمثّل ميزةً رئيسة. صرّحت الشركة بأنّ Veo 3 يُمكنه دمج الصوت الذي يتضمن حواراً بين الشخصيات، بالإضافة إلى أصوات الحيوانات.

ALL this is AI using Google's #Veo3. Everything. People, spoken words, background noise. Body language still a bit mechanic, but... WTH pic.twitter.com/DKCZfyimNG

— Jesús Enrique Rosas - The Body Language Guy (@Knesix) May 22, 2025

وصرح إيلي كولينز، نائب رئيس قسم منتجات Google DeepMind، في تدوينة يوم الثلاثاء: «يتميّز Veo 3 بأمور بدءاً من النصوص والصور، وصولاً إلى فيزياء العالم الواقعي ومزامنة الشفاه الدقيقة».

تُتاح أداة الذكاء الاصطناعي للفيديو والصوت لمشتركي خطة Google Ultra الجديدة بقيمة 249.99 دولاراً أميركياً شهرياً، والمُوجّهة لعشاق الذكاء الاصطناعي المُتحمّسين. كما سيُتاح Veo 3 لمستخدمي منصة Vertex AI للمؤسسات من «غوغل».

aawsat.com