آپدیت حالت صوتی ChatGPT با صدای طبیعی‌تر و قابلیت ترجمه هم‌زمان

تیم پلازا - انتشار: 18 خرداد 1404 07:56
ز.م مطالعه: 2 دقیقه
-

شرکت OpenAI در سال گذشته همراه با عرضه‌ی GPT-4o، قابلیت حالت صوتی پیشرفته (Advanced Voice Mode) را معرفی کرد. این ویژگی مبتنی بر مدل‌های چندرسانه‌ای بومی است و می‌تواند با پاسخگویی صوتی لحظه‌ای، با تاخیر ۲۳۲ تا ۳۲۰ میلی‌ثانیه، همانند یک مکالمه‌ی طبیعی، به صحبت‌های کاربران پاسخ دهد. علاوه بر این، حالت صوتی پیشرفته قادر است با تشخیص نشانه‌های غیرکلامی مانند سرعت گفتار و انتقال احساسات، پاسخ‌هایی با ظرافت عاطفی تولید کند.

اوایل امسال، OpenAI یک به‌روزرسانی جزئی برای این حالت ChatGPT منتشر کرد که تمرکز آن بر کاهش قطع و وصل صدا و اصلاح لهجه‌ها بود. اما امروز این شرکت از یک آپدیت بزرگ رونمایی کرده است که کیفیت صدای تولیدی را بسیار طبیعی‌تر و انسان‌گونه‌تر می‌کند. در نسخه‌ی جدید می‌توان تغییرات زیر را مشاهده کرد:

  • آواشناسی طبیعی‌تر در پاسخ‌ها

  • فاصله‌گذاری و تاکید دقیق‌تر روی کلمات

  • انتقال دقیق‌تر احساساتی مانند همدردی و طعنه

یکی از قابلیت‌های برجسته‌ی این به‌روزرسانی، پشتیبانی از ترجمه‌ی صوتی است. کاربران ChatGPT اکنون می‌توانند حالت صوتی پیشرفته را برای مکالمه به زبان‌های مختلف نیز به‌کار گیرند: تنها کافی است بگویید «لطفاً شروع به ترجمه کن» و تا زمانی که دستور «ترجمه را متوقف کن» را ندهید، تمامی گفتگو به زبان مقصد ترجمه خواهد شد. این ویژگی می‌تواند جایگزین اپلیکیشن‌های ترجمه‌ی صوتی شود و تجربه‌ی یکپارچه‌تری ارائه دهد. فعلاً این آپدیت برای کاربران پولی (ChatGPT Plus) در دسترس است. با این حال، OpenAI به برخی محدودیت‌های شناخته‌شده نیز اشاره کرده:

  • کاهش جزئی در کیفیت صدا، از جمله تغییرات غیرمنتظره در لحن و زیر و بمی صدا، به‌ویژه در برخی گزینه‌های صوتی

  • ایرادهای نادر که ممکن است صداهای ناخواسته مانند اجزای موسیقی یا گویش‌های نامفهوم تولید کند

با وجود این کاستی‌های اندک، روند بهبود مداوم نشان می‌دهد که مرز میان گفتگوی انسانی و هوش مصنوعی روزبه‌روز کمتر خواهد شد. آپدیت جدید حالت صوتی پیشرفته ChatGPT با لحن طبیعی‌تر، آوای واقع‌گرایانه و قابلیت ترجمه صوتی، گام مهمی در جهت ارتقای تجربه‌ی مکالمه‌ی با هوش مصنوعی محسوب می‌شود. هرچند هنوز نواقصی باقی است، اما پیشرفت‌های اخیر نوید آینده‌ای را می‌دهد که تعامل با AI به اندازه‌ی یک گفتگوی انسانی واقعی نزدیک خواهد شد. کاربران علاقه‌مند به بهترین کیفیت صوتی می‌توانند با اشتراک ChatGPT Plus از این قابلیت بهره‌مند شوند.

تگ ها:
دیدگاه های کاربران
هیچ دیدگاهی موجود نیست