گوگل مدلهای جدید Imagen 4 را در Gemini API و AI Studio عرضه کرد
گوگل بهتازگی و با انتشار پستی در حساب کاربری Google AI Developers در ایکس، اعلام کرده است که مدل جدید تولید تصویر مبتنی بر هوش مصنوعی خود با نام Imagen 4 اکنون بهطور عمومی در Gemini API و Google AI Studio در دسترس توسعهدهندگان قرار گرفته است. این اقدام یک گام مهم در پیشرفت فناوری متن به تصویر به شمار میرود و کیفیت رندر متن و وضوح تصاویر را نسبت به نسلهای قبلی به شکل قابل توجهی بهبود داده است.
علاوه بر Imagen 4، گوگل از مدل جدیدی با نام Imagen 4 Fast نیز رونمایی کرده است. این نسخه با تمرکز بر سرعت بالا و هزینه کمتر طراحی شده و برای تولید سریع و انبوه تصاویر ایدهآل است. هزینه هر تصویر تولیدشده با این مدل تنها ۰٫۰۲ دلار خواهد بود. به این ترتیب، خانواده Imagen 4 اکنون شامل سه نسخه اصلی است:
Imagen 4 Fast: مناسب برای پروژههایی با نیاز به تولید سریع و پرحجم تصاویر با قیمت اقتصادی.
Imagen 4: نسخه اصلی با کیفیت بالا که در تولید طیف وسیعی از تصاویر کاربرد دارد و در زمینه رندر متن عملکرد بسیار بهتری دارد.
Imagen 4 Ultra: قدرتمندترین نسخه که نتایج بسیار دقیق و منطبق بر متن ورودی ارائه میدهد.
یکی دیگر از تغییرات مهم، پشتیبانی Imagen 4 و Imagen 4 Ultra از تولید تصاویر با وضوح ۲K است. این قابلیت امکان خلق تصاویر بسیار شفاف و جزئیات خیرهکننده را فراهم میکند؛ از طراحی محتوای تبلیغاتی گرفته تا آثار هنری پیچیده. گوگل همچنین تایید کرده که تمام تصاویری که توسط خانواده Imagen 4 تولید میشوند، بهطور نامحسوس با فناوری SynthID واترمارک میخورند. این واترمارک برای حفظ شفافیت و اطمینان از اصالت محتوای تولیدشده به کار میرود، بدون اینکه کیفیت بصری تصاویر کاهش یابد.
عرضه عمومی Imagen 4 و معرفی نسخه سریع آن، نشاندهنده تمرکز گوگل بر ارتقای کیفیت و سرعت در تولید تصاویر هوش مصنوعی است. پشتیبانی از رزولوشن ۲K و کاهش هزینه تولید تصویر، میتواند این مدلها را به گزینهای جذاب برای توسعهدهندگان، طراحان و شرکتهای بازاریابی تبدیل کند. بهنظر میرسد گوگل با این اقدام جایگاه خود را در رقابت جهانی هوش مصنوعی بیش از پیش تثبیت کرده است.