آپدیت حالت صوتی ChatGPT با صدای طبیعیتر و قابلیت ترجمه همزمان
شرکت OpenAI در سال گذشته همراه با عرضهی GPT-4o، قابلیت حالت صوتی پیشرفته (Advanced Voice Mode) را معرفی کرد. این ویژگی مبتنی بر مدلهای چندرسانهای بومی است و میتواند با پاسخگویی صوتی لحظهای، با تاخیر ۲۳۲ تا ۳۲۰ میلیثانیه، همانند یک مکالمهی طبیعی، به صحبتهای کاربران پاسخ دهد. علاوه بر این، حالت صوتی پیشرفته قادر است با تشخیص نشانههای غیرکلامی مانند سرعت گفتار و انتقال احساسات، پاسخهایی با ظرافت عاطفی تولید کند.
اوایل امسال، OpenAI یک بهروزرسانی جزئی برای این حالت ChatGPT منتشر کرد که تمرکز آن بر کاهش قطع و وصل صدا و اصلاح لهجهها بود. اما امروز این شرکت از یک آپدیت بزرگ رونمایی کرده است که کیفیت صدای تولیدی را بسیار طبیعیتر و انسانگونهتر میکند. در نسخهی جدید میتوان تغییرات زیر را مشاهده کرد:
آواشناسی طبیعیتر در پاسخها
فاصلهگذاری و تاکید دقیقتر روی کلمات
انتقال دقیقتر احساساتی مانند همدردی و طعنه
یکی از قابلیتهای برجستهی این بهروزرسانی، پشتیبانی از ترجمهی صوتی است. کاربران ChatGPT اکنون میتوانند حالت صوتی پیشرفته را برای مکالمه به زبانهای مختلف نیز بهکار گیرند: تنها کافی است بگویید «لطفاً شروع به ترجمه کن» و تا زمانی که دستور «ترجمه را متوقف کن» را ندهید، تمامی گفتگو به زبان مقصد ترجمه خواهد شد. این ویژگی میتواند جایگزین اپلیکیشنهای ترجمهی صوتی شود و تجربهی یکپارچهتری ارائه دهد. فعلاً این آپدیت برای کاربران پولی (ChatGPT Plus) در دسترس است. با این حال، OpenAI به برخی محدودیتهای شناختهشده نیز اشاره کرده:
کاهش جزئی در کیفیت صدا، از جمله تغییرات غیرمنتظره در لحن و زیر و بمی صدا، بهویژه در برخی گزینههای صوتی
ایرادهای نادر که ممکن است صداهای ناخواسته مانند اجزای موسیقی یا گویشهای نامفهوم تولید کند
با وجود این کاستیهای اندک، روند بهبود مداوم نشان میدهد که مرز میان گفتگوی انسانی و هوش مصنوعی روزبهروز کمتر خواهد شد. آپدیت جدید حالت صوتی پیشرفته ChatGPT با لحن طبیعیتر، آوای واقعگرایانه و قابلیت ترجمه صوتی، گام مهمی در جهت ارتقای تجربهی مکالمهی با هوش مصنوعی محسوب میشود. هرچند هنوز نواقصی باقی است، اما پیشرفتهای اخیر نوید آیندهای را میدهد که تعامل با AI به اندازهی یک گفتگوی انسانی واقعی نزدیک خواهد شد. کاربران علاقهمند به بهترین کیفیت صوتی میتوانند با اشتراک ChatGPT Plus از این قابلیت بهرهمند شوند.