رونمایی گوگل از «نانو بنانا پرو»؛ تحولی نوین در تولید تصویر با قدرت جمنای ۳

تیم پلازا - انتشار: 30 آبان 1404 15:50
ز.م مطالعه: 2 دقیقه
-

شرکت گوگل در اقدامی تازه و در راستای رقابت فشرده در بازار هوش مصنوعی مولد، روز پنج‌شنبه ۲۹ آبان ۱۴۰۴ (۲۰ نوامبر ۲۰۲۵) از جدیدترین پلتفرم تولید تصویر خود با نام تجاری «نانو بنانا پرو» (Nano Banana Pro) رونمایی کرد. این ابزار که با نام فنی «جمنای ۳ پرو ایمیج» (Gemini 3 Pro Image) نیز شناخته می‌شود، به عنوان بخشی از اکوسیستم مدل زبانی پیشرفته‌ی «جمنای ۳» معرفی شده است و وعده‌ی رفع نواقص نسخه‌های پیشین و ارائه کیفیتی در سطح استودیوهای طراحی را می‌دهد.

طبق بیانیه رسمی گوگل، «نانو بنانا پرو» با تمرکز بر کنترل بی‌سابقه کاربر بر خروجی و رندرینگ (Rendering) بدون نقص متن توسعه یافته است. یکی از چالش‌های اصلی مدل‌های تولید تصویر تا به امروز، ناتوانی در نگارش صحیح کلمات و متون بر روی تصاویر بود. گوگل مدعی است که در این نسخه، این مشکل به طور کامل مرتفع شده و کاربران می‌توانند اینفوگرافیک‌ها، نمودارها و پوسترهای تبلیغاتی غنی از متن را با پشتیبانی از زبان‌های متعدد تولید کنند. این قابلیت، نانو بنانا پرو را به ابزاری کارآمد برای طراحان گرافیک و بازاریابان تبدیل می‌کند.

علاوه بر قابلیت‌های متنی، این پلتفرم امکانات ویرایشی پیشرفته‌ای را ارائه می‌دهد. کاربران قادر خواهند بود تا ۱۴ تصویر مجزا را در یک ترکیب‌بندی واحد (Composition) ادغام کنند. همچنین ابزارهای ویرایش دقیق (In-painting) به کاربر اجازه می‌دهد تا با انتخاب هر بخشی از تصویر تولید شده، تغییراتی نظیر اصلاح زاویه دوربین، تغییر نقطه فوکوس، تنظیم درجه‌بندی رنگ (Color Grade) و حتی تغییر نورپردازی از روز به شب را اعمال کند.

در راستای تعهد به اصول اخلاقی هوش مصنوعی و مقابله با جعل عمیق (Deepfake)، تمامی تصاویر خروجی این پلتفرم حاوی متادیتای استاندارد C2PA خواهند بود. این استاندارد که اخیراً توسط پلتفرم‌هایی مانند تیک‌تاک نیز برای برچسب‌گذاری محتوا مورد استفاده قرار می‌گیرد، امکان تشخیص تصاویر تولید شده توسط هوش مصنوعی را فراهم می‌سازد.

دسترسی به «نانو بنانا پرو» از طریق اپلیکیشن جمنای و با انتخاب مدل «تفکر» (Thinking) امکان‌پذیر است. گوگل اعلام کرده است که استفاده از این سرویس رایگان است، اما کاربران عادی با محدودیت سهمیه روزانه مواجه خواهند بود. مشترکین سرویس‌های گوگل AI، پلاس، پرو و اولترا از سهمیه بیشتر و امکانات گسترده‌تری در بخش جستجو و «نوتبوک‌ال‌ام» (NotebookLM) برخوردار خواهند شد.

این ابزار جدید نشان‌دهنده جهش فنی گوگل در نسل سوم مدل‌های جمنای است و با هدف بازپس‌گیری سهم بازار از رقبایی همچون میدجرنی و دال-ای طراحی شده است. گوگل امیدوار است با ترکیب دقت متنی و ابزارهای ویرایشی قدرتمند، استاندارد جدیدی را در صنعت هوش مصنوعی بصری تعریف کند.

دیدگاه های کاربران
هیچ دیدگاهی موجود نیست