شرکت گوگل در اقدامی تازه و در راستای رقابت فشرده در بازار هوش مصنوعی مولد، روز پنجشنبه ۲۹ آبان ۱۴۰۴ (۲۰ نوامبر ۲۰۲۵) از جدیدترین پلتفرم تولید تصویر خود با نام تجاری «نانو بنانا پرو» (Nano Banana Pro) رونمایی کرد. این ابزار که با نام فنی «جمنای ۳ پرو ایمیج» (Gemini 3 Pro Image) نیز شناخته میشود، به عنوان بخشی از اکوسیستم مدل زبانی پیشرفتهی «جمنای ۳» معرفی شده است و وعدهی رفع نواقص نسخههای پیشین و ارائه کیفیتی در سطح استودیوهای طراحی را میدهد.
طبق بیانیه رسمی گوگل، «نانو بنانا پرو» با تمرکز بر کنترل بیسابقه کاربر بر خروجی و رندرینگ (Rendering) بدون نقص متن توسعه یافته است. یکی از چالشهای اصلی مدلهای تولید تصویر تا به امروز، ناتوانی در نگارش صحیح کلمات و متون بر روی تصاویر بود. گوگل مدعی است که در این نسخه، این مشکل به طور کامل مرتفع شده و کاربران میتوانند اینفوگرافیکها، نمودارها و پوسترهای تبلیغاتی غنی از متن را با پشتیبانی از زبانهای متعدد تولید کنند. این قابلیت، نانو بنانا پرو را به ابزاری کارآمد برای طراحان گرافیک و بازاریابان تبدیل میکند.
علاوه بر قابلیتهای متنی، این پلتفرم امکانات ویرایشی پیشرفتهای را ارائه میدهد. کاربران قادر خواهند بود تا ۱۴ تصویر مجزا را در یک ترکیببندی واحد (Composition) ادغام کنند. همچنین ابزارهای ویرایش دقیق (In-painting) به کاربر اجازه میدهد تا با انتخاب هر بخشی از تصویر تولید شده، تغییراتی نظیر اصلاح زاویه دوربین، تغییر نقطه فوکوس، تنظیم درجهبندی رنگ (Color Grade) و حتی تغییر نورپردازی از روز به شب را اعمال کند.
در راستای تعهد به اصول اخلاقی هوش مصنوعی و مقابله با جعل عمیق (Deepfake)، تمامی تصاویر خروجی این پلتفرم حاوی متادیتای استاندارد C2PA خواهند بود. این استاندارد که اخیراً توسط پلتفرمهایی مانند تیکتاک نیز برای برچسبگذاری محتوا مورد استفاده قرار میگیرد، امکان تشخیص تصاویر تولید شده توسط هوش مصنوعی را فراهم میسازد.
دسترسی به «نانو بنانا پرو» از طریق اپلیکیشن جمنای و با انتخاب مدل «تفکر» (Thinking) امکانپذیر است. گوگل اعلام کرده است که استفاده از این سرویس رایگان است، اما کاربران عادی با محدودیت سهمیه روزانه مواجه خواهند بود. مشترکین سرویسهای گوگل AI، پلاس، پرو و اولترا از سهمیه بیشتر و امکانات گستردهتری در بخش جستجو و «نوتبوکالام» (NotebookLM) برخوردار خواهند شد.
این ابزار جدید نشاندهنده جهش فنی گوگل در نسل سوم مدلهای جمنای است و با هدف بازپسگیری سهم بازار از رقبایی همچون میدجرنی و دال-ای طراحی شده است. گوگل امیدوار است با ترکیب دقت متنی و ابزارهای ویرایشی قدرتمند، استاندارد جدیدی را در صنعت هوش مصنوعی بصری تعریف کند.
