معرفی Veo 3.1؛ گام تازه گوگل برای ساخت ویدیوهای سینمایی با هوش مصنوعی
در ادامه رقابت شرکتهای بزرگ فناوری در حوزه هوش مصنوعی ویدیویی، گوگل از نسخه جدید مدل تولید ویدیو خود با نام Veo 3.1 رونمایی کرد. این نسخه نسبت به مدل قبلی، Veo 3، که در کنفرانس Google I/O در اردیبهشت ۱۴۰۴ معرفی شده بود، پیشرفتهای چشمگیری در کیفیت بصری، واقعگرایی و تولید صدا ارائه میدهد.
علاوه بر این، گوگل ابزار Flow را نیز بهروزرسانی کرده تا از قابلیتهای جدید Veo 3.1 بهرهمند شود و تجربهای خلاقانهتر و کنترلشدهتر در تولید و ویرایش ویدیو به کاربران ارائه دهد.
Veo 3.1 با واقعگرایی و صدای بهتر
مدل جدید Veo 3.1 اکنون قادر است ویدیوهایی با جزئیات واقعگرایانهتر و بافتهای طبیعیتر تولید کند. گوگل میگوید این نسخه از درک عمیقتری نسبت به روایت، سبکهای سینمایی و تعامل میان شخصیتها برخوردار است تا به کاربران امکان کنترل بهتر در ساخت ویدیوهای داستانمحور را بدهد.
قابلیت image-to-video نیز بهبود یافته و اکنون با دقت بیشتری به دستور کاربر پاسخ میدهد و هماهنگی بهتری میان تصویر و صدا برقرار میکند.
مدلهای Veo 3.1 و Veo 3.1 Fast از امروز در اپلیکیشن Gemini، رابط برنامهنویسی Gemini API و پلتفرم Vertex AI در دسترس هستند. کاربران میتوانند خروجیها را در نسبتهای افقی (۱۶×۹) یا عمودی (۹×۱۶) تولید کنند.
بهروزرسانی بزرگ در ابزار Flow
گوگل ابزار Flow را که برای فیلمسازی با هوش مصنوعی طراحی شده، نیز همزمان بهروزرسانی کرده است. این نسخه جدید، امکانات صوتی و ویرایشی پیشرفتهتری را ارائه میدهد:
Ingredients to Video: ترکیب چند تصویر از شخصیتها، اشیاء و سبکهای مختلف برای ساخت یک ویدیو با صدا.
Scene Extension: امکان ادامه دادن صحنهای که از قبل وجود دارد، بر اساس آخرین ثانیه آن کلیپ.
Frames to Video: تعیین تصویر آغاز و پایان و تولید ویدیو بین آن دو توسط Flow.
بهگفته گوگل، قابلیتهای ویرایشی جدید Flow شامل افزودن اشیا، کاراکترها و جزئیات به صحنهها است؛ بهگونهای که نورپردازی و سایهها بهصورت خودکار تنظیم میشوند تا جلوهای طبیعی ایجاد شود.
قابلیتی که بهزودی به Flow اضافه خواهد شد، حذف اشیا یا افراد از صحنه است. در این حالت، Flow با بازسازی پسزمینه و عناصر اطراف، ویدیو را به شکلی یکپارچه و طبیعی اصلاح میکند. این ویژگی مشابه قابلیتهای نسل جدید ادوبی Firefly و Runway است، اما اکنون بهصورت بومی در اکوسیستم گوگل در دسترس خواهد بود.
عرضه Veo 3.1 و بهروزرسانی Flow نشان میدهد گوگل با جدیت در حال تثبیت موقعیت خود در رقابت مدلهای ویدیوساز است. ترکیب تولید ویدیو با درک روایی، صداگذاری هوشمند و ابزار ویرایش تعاملی میتواند آینده تولید محتوای دیجیتال را متحول کند. این حرکت، گامی استراتژیک برای رقابت با مدلهایی مانند Sora 2 از OpenAI و Runway Gen-3.