گوگل مدل تصویری جدید «nano banana» را در جمینای معرفی کرد
گوگل بهتازگی از ارتقای بزرگ قابلیتهای تولید تصویر در اپلیکیشن Gemini رونمایی کرده است. مدل تازهای با نام Gemini 2.5 Flash Image که با لقب «nano banana» شناخته میشود، اکنون بهعنوان برترین ویرایشگر تصویر جهان در جدول ردهبندی LMArena معرفی شده و بازخوردهای مثبتی از کاربران دریافت کرده است.
این مدل جدید هم از طریق اپلیکیشن جمینای و هم برای توسعهدهندگان در Gemini API ،Google AI Studio و Vertex AI در دسترس قرار گرفته است. نکته کلیدی در nano banana، رفع یکی از بزرگترین مشکلات تولید تصویر با هوش مصنوعی یعنی ثبات در ویرایشها است. به بیان ساده، اگر کاربر تصویری را بارگذاری کرده و فقط قصد تغییر جزئیات کوچکی مثل مدل مو یا لباس را داشته باشد، کل تصویر دچار تغییرات ناخواسته نمیشود.
گوگل توضیح داده است که با nano banana میتوان یک شخصیت را در محیطهای مختلف قرار داد، محصولی را از زوایای گوناگون به نمایش گذاشت یا داراییهای برند را در قالبهای متفاوت تولید کرد، بدون اینکه چهره یا سوژه اصلی دچار اعوجاج شود. حتی امکان ترکیب خلاقانه وجود دارد؛ برای مثال کاربر میتواند عکس یک فرد و حیوان خانگیاش را آپلود کرده و آنها را در یک صحنه جدید ادغام کند.
ویژگی دیگر ویرایش چندمرحلهای (Multi-turn editing) است که امکان میدهد کاربر بهصورت پیوسته تغییرات را روی یک تصویر اعمال کند. همچنین قابلیت ترکیب سبکها وجود دارد؛ بهطور مثال میتوان طرح بال پروانه را به لباس یک فرد انتقال داد.
البته با پیشرفت این ابزارها، نگرانیها درباره سوءاستفاده نیز افزایش یافته است. گوگل برای جلوگیری از این مسئله، روی هر تصویر یک واترمارک مرئی و همچنین نشان دیجیتال نامرئی SynthID قرار داده است که حتی پس از ویرایش نیز قابل شناسایی خواهد بود.
رقابت میان غولهای فناوری در حوزه تصویرسازی با هوش مصنوعی بسیار شدید شده است. در حالی که ChatGPT با قابلیت تولید تصویر، کاربران میلیونی جذب کرده و Grok ایلان ماسک با «حالت Spicy» سر و صدا به پا کرده، حالا گوگل با nano banana جایگاه خود را بهعنوان یک پیشرو تثبیت کرده است.
با توجه به رشد سریع رقابت میان پلتفرمهای هوش مصنوعی، معرفی nano banana نشان میدهد که گوگل مصمم است استانداردهای جدیدی در تصویرسازی هوش مصنوعی تعریف کند. این ابزار میتواند آینده طراحی، تبلیغات و حتی تولید محتوای بصری را دگرگون کند و نقش مهمی در رقابت میان گوگل، اوپنایآی و متا ایفا کند.