خلال الفترة الأخيرة، أصبح سباق الذكاء الاصطناعي في مجال الفيديو أكثر قوة من أي وقت مضى. لم نعد نتحدث فقط عن أدوات تولّد فيديو من نص، أو تحوّل صورة إلى حركة بسيطة، بل بدأنا نرى نماذج قادرة على فهم الفيديو نفسه، والتعديل عليه، وتغيير عناصره، وخلفياته، وأسلوبه البصري من خلال أوامر نصية فقط.
ومن هنا يأتي اسم Gemini Omni، أحد النماذج الجديدة المرتبطة بمنظومة جوجل للذكاء الاصطناعي، والذي يركّز على فكرة مهمة جدًا: Video-to-Video Editing، أي تعديل الفيديو الموجود بالفعل بدلًا من إنشاء فيديو جديد من الصفر فقط.
الفكرة تبدو بسيطة، لكنها قوية جدًا. بدلًا من أن تبدأ من شاشة فارغة وتطلب من الذكاء الاصطناعي توليد مشهد كامل، يمكنك أن ترفع فيديو موجودًا، ثم تطلب منه تغييرات محددة، مثل تغيير الخلفية، تغيير الملابس، تحويل المشهد إلى ستايل سينمائي، أو حتى نقل الشخصية إلى بيئة مختلفة تمامًا.
وهذا بالضبط ما يجعل Gemini Omni مثيرًا للاهتمام، لأنه لا يتعامل مع الفيديو كملف عادي، بل يحاول فهم ما يحدث داخله: الشخصية، الحركة، الإضاءة، الخلفية، والستايل العام، ثم يعيد بناء المشهد بناءً على البرومبت الذي تكتبه.
في التجربة العملية، ظهرت قدرات Gemini Omni بشكل واضح داخل أدوات مثل Gemini Videos و Google Flow. داخل Gemini، يمكن للمستخدم الدخول إلى قسم الفيديوهات واختيار قوالب جاهزة، ثم تجربة تحويل الفيديو إلى مشاهد مختلفة. على سبيل المثال، يمكن أخذ فيديو لشخصية حقيقية وتحويله إلى مشهد فضائي، أو جعله يبدو وكأنه مصوّر على القمر، مع تأثيرات إضاءة وخلفية مختلفة تمامًا.
اللافت هنا ليس فقط أن الخلفية تتغير، بل أن النموذج يحاول الحفاظ على الشخصية نفسها، ملامحها، اتجاه الحركة، والإحساس العام بالفيديو. بالطبع النتائج ليست مثالية دائمًا، وقد تظهر بعض الأخطاء في تفاصيل الوجه أو اليدين أو الحركة، لكن مستوى التحويل أصبح أقرب بكثير لما كنا نتخيله قبل سنوات.
واحدة من التجارب المهمة أيضًا هي تحويل الفيديو إلى ستايل Noir أو أبيض وأسود بأسلوب سينمائي. هنا لا يغيّر النموذج الخلفية فقط، بل يغيّر الإضاءة والمزاج البصري بالكامل، ليجعل الفيديو يبدو وكأنه مشهد درامي قديم. هذه النقطة مهمة لصناع المحتوى، لأنها تفتح الباب أمام تحويل فيديو بسيط إلى مشهد أكثر احترافية دون الحاجة إلى معدات تصوير أو مونتاج معقد.
لكن التجربة تصبح أكثر إثارة عند الانتقال إلى Google Flow، حيث يمكن اختبار Omni Flash بشكل أعمق. داخل Flow، تظهر خيارات متقدمة مثل اختيار نسبة الفيديو، عدد النتائج، واستخدام نماذج مرتبطة بتوليد الصور والفيديو مثل Nano Banana 2 أو Omni Flash. هنا يمكن كتابة برومبت تفصيلي يطلب من النموذج تغيير الملابس، الخلفية، المشهد، أو تحويل الفيديو إلى بيئة مختلفة تمامًا.
وهنا نصل إلى السؤال الأهم: هل Gemini Omni مجرد أداة ممتعة للتجربة، أم أنه يمكن أن يكون مفيدًا فعلًا لصناع المحتوى؟
الإجابة تعتمد على طريقة الاستخدام. بالنسبة لصانع محتوى، هذه التقنية قد تختصر وقتًا كبيرًا في إنتاج مشاهد بصرية مختلفة. بدلًا من إعادة التصوير أو البحث عن خلفيات أو استخدام برامج مونتاج معقدة، يمكن تجربة أكثر من نسخة من نفس الفيديو باستخدام برومبت فقط. هذا مفيد جدًا في الإعلانات، الفيديوهات القصيرة، المحتوى التعليمي، وحتى الفيديوهات التسويقية.
بالنسبة للمسوقين، يمكن استخدام Gemini Omni لتجربة عدة نسخ من نفس الإعلان بسرعة. مثلًا: نسخة بخلفية مكتبية، نسخة بخلفية مستقبلية، نسخة بأسلوب سينمائي، ونسخة موجهة لجمهور مختلف. كل ذلك دون الحاجة لإعادة تصوير الإعلان من البداية.
أما بالنسبة للمصممين والمبدعين، فالأداة تفتح مساحة جديدة للتجريب البصري. يمكنك اختبار أفكار مختلفة، ألوان مختلفة، أجواء مختلفة، وستايلات مختلفة بسرعة. وهذا قد يجعل مرحلة التخطيط والإبداع أسرع بكثير.
لكن رغم كل ذلك، يجب أن نكون واقعيين. Gemini Omni ليس بديلًا كاملًا للمونتاج الاحترافي حتى الآن. النتائج قد تحتوي على أخطاء، خصوصًا في التفاصيل الدقيقة مثل اليدين، تعبيرات الوجه، أو ثبات الهوية البصرية للشخصية في بعض اللقطات. كذلك قد تحتاج إلى أكثر من محاولة للحصول على نتيجة مناسبة، لأن جودة البرومبت تلعب دورًا كبيرًا في النتيجة النهائية.
النقطة المهمة هنا أن Gemini Omni لا يمثل مجرد تحديث صغير، بل يعكس اتجاهًا جديدًا في أدوات الذكاء الاصطناعي: الانتقال من توليد المحتوى فقط إلى فهم المحتوى وتعديله. وهذا فرق كبير. لأن المستقبل لن يكون فقط في إنشاء فيديوهات من الصفر، بل في القدرة على أخذ فيديو حقيقي وتحويله إلى نسخة أفضل، أو مختلفة، أو أكثر احترافية.
إذا نجحت جوجل في تطوير هذه التقنية وتحسين ثبات الشخصيات وجودة الحركة ودقة التفاصيل، فقد نكون أمام أداة قوية جدًا ستغير طريقة صناعة الفيديوهات. خاصة إذا تم دمجها بشكل أعمق داخل Gemini وGoogle Flow وباقي أدوات جوجل.
شاهد التجربة العملية كاملة
في النهاية، تجربة Gemini Omni توضح أن جوجل بدأت تتحرك بقوة في مجال تعديل الفيديو بالذكاء الاصطناعي. النتائج ليست كاملة، لكنها واعدة جدًا. والأهم أنها تعطينا لمحة عن المستقبل: مستقبل يستطيع فيه أي شخص تعديل فيديو كامل من خلال وصف نصي بسيط.
قد لا نكون وصلنا بعد إلى مرحلة الاستغناء الكامل عن برامج المونتاج، لكننا اقتربنا من مرحلة يصبح فيها الذكاء الاصطناعي مساعدًا حقيقيًا في صناعة الفيديو، ليس فقط لتوليد مشاهد جديدة، بل لإعادة تخيل الفيديو نفسه.
وهنا يبقى السؤال: هل Gemini Omni سيكون بداية ثورة حقيقية في صناعة الفيديو؟ أم مجرد خطوة من خطوات كثيرة في سباق الذكاء الاصطناعي؟
الإجابة ستظهر مع التجارب القادمة، لكن الواضح أن جوجل لا تريد أن تبقى خارج سباق الفيديو. بل تريد أن تنافس بقوة، وربما تغيّر قواعد اللعبة بالكامل.
