اپلیکیشن Gemini پس از ارائه قابلیتهای تولید متن، تصویر، ویدئو و خلاصه صوتی، اکنون امکان تولید موسیقی را نیز در اختیار کاربران قرار داده است. این قابلیت بر پایه مدل Lyria 3 توسعه یافته؛ مدلی که توسط Google DeepMind بهعنوان پیشرفتهترین سامانه تولید موسیقی این شرکت معرفی شده است.
طبق توضیحات رسمی، Lyria 3 نسبت به نسخههای پیشین پیشرفت محسوسی داشته و دیگر نیازی نیست کاربر بهصورت دستی ترانه وارد کند. سامانه میتواند بر اساس توضیح متنی (پرامپت)، بهصورت خودکار شعر تولید کرده و آن را با ملودی هماهنگ کند.
کنترل سبک، تمپو و حالوهوا
کاربران هنگام ثبت درخواست میتوانند سبک موسیقی، حالوهوا، سرعت (تمپو)، نوع وکال و دیگر عناصر را مشخص کنند. به گفته گوگل، این مدل قادر است قطعاتی «واقعگرایانهتر و از نظر موسیقی پیچیدهتر» نسبت به نسلهای قبلی تولید کند.
برای مثال، کاربر میتواند در بخش Tools گزینه «Music» را انتخاب کرده و در توضیح خود بنویسد که آهنگی نوستالژیک درباره خاطرات کودکی با حالوهوای Afrobeat ساخته شود. همچنین امکان بارگذاری عکس یا ویدئو نیز فراهم شده تا جمنای بر اساس فضای بصری فایل، قطعهای متناسب با آن تولید کند.
خروجی نهایی معمولاً قطعهای ۳۰ ثانیهای است که میتواند شامل ترانه یا نسخه بیکلام باشد. در کنار فایل صوتی، یک تصویر کاور اختصاصی نیز تولید میشود. کاربران امکان دانلود مستقیم فایل یا دریافت لینک اشتراکگذاری را دارند.
رویکرد حقوقی و جلوگیری از تقلید مستقیم
گوگل تاکید کرده این قابلیت برای خلاقیت طراحی شده و هدف آن تقلید از هنرمندان دیگر نیست. در صورتی که نام یک هنرمند در پرامپت ذکر شود، سیستم تنها از آن بهعنوان الهام کلی در سبک یا حالوهوا استفاده میکند و اثری مشابه اما غیرکپی تولید میشود.
این شرکت اعلام کرده در فرآیند آموزش مدل، ملاحظات مرتبط با حق نشر و توافقنامههای شرکای تجاری را رعایت کرده است. افزون بر این، فیلترهایی برای بررسی شباهت خروجی با آثار موجود در نظر گرفته شده است. کاربران نیز میتوانند در صورت مشاهده محتوای ناقض حقوق کپیرایت، آن را گزارش دهند.
واترمارک SynthID و قابلیت راستیآزمایی
از منظر ایمنی، تمامی قطعات تولیدشده با واترمارک SynthID نشانهگذاری میشوند. این فناوری پیشتر برای تصاویر و ویدئوهای تولیدشده با هوش مصنوعی گوگل نیز استفاده شده بود. کاربران میتوانند یک فایل صوتی را در جمنای بارگذاری کرده و از سیستم بپرسند آیا این فایل با هوش مصنوعی گوگل تولید شده است یا خیر؛ قابلیتی که به شفافیت بیشتر در اکوسیستم محتوای هوش مصنوعی کمک میکند.
دسترسی و برنامههای آینده
مدل Lyria 3 در حال حاضر برای تمامی کاربران بالای ۱۸ سال در زبانهای انگلیسی، آلمانی، اسپانیایی، فرانسوی، هندی، ژاپنی، کرهای و پرتغالی فعال شده است. مشترکان طرحهای پولی شامل گوگل AI پلاس، Pro و Ultra از سقف استفاده بالاتری برخوردار خواهند بود. گوگل اعلام کرده در آینده دامنه پشتیبانی زبانی گسترش خواهد یافت و کیفیت خروجیها نیز ارتقا پیدا میکند.
افزوده شدن تولید موسیقی به جمنای نشاندهنده حرکت گوگل به سمت یک پلتفرم جامع چندرسانهای مبتنی بر هوش مصنوعی است. مدل Lyria 3 با امکان تولید خودکار شعر، کنترل جزئیات موسیقایی و بهرهگیری از واترمارک SynthID، تلاش میکند میان خلاقیت کاربران و ملاحظات حقوقی توازن برقرار کند.
