انتشار به‌روزرسانی Terminus هوش مصنوعی دیپ سیک با بهبودهای زبانی

تیم پلازا - بروزرسانی: 1 مهر 1404 08:30
ز.م مطالعه: 2 دقیقه
-

شرکت دیپ‌سیک که در ماه‌های اخیر با مدل‌های هوش مصنوعی خود توجهات زیادی را جلب کرده است، به‌تازگی به‌روزرسانی جدیدی با نام DeepSeek V3.1-Terminus ارائه داده است. این نسخه در ادامه مدل DeepSeek V3.1 عرضه می‌شود که تنها دو ماه پیش معرفی شده بود. هدف اصلی این به‌روزرسانی، پاسخ به بازخورد کاربران و ارتقای کیفیت تجربه کاربری است.

یکی از مشکلات اصلی کاربران در نسخه قبلی، اختلاط متون انگلیسی و چینی و همچنین تولید کاراکترهای غیرعادی بود. دیپ‌سیک اعلام کرده که این باگ‌ها در نسخه Terminus برطرف شده‌اند. همچنین، هماهنگی زبانی در خروجی‌ها بهبود یافته تا نتایج نهایی پایدارتر و قابل‌اعتمادتر باشند.

در کنار تغییرات زبانی، عملکرد Code Agent و Search Agent نیز ارتقا یافته است. این بهبودها باعث شده تا دیپ‌سیک در وظایف تخصصی کارآمدتر عمل کند. افزون بر این، کاربران اکنون می‌توانند از دو حالت عملیاتی استفاده کنند:

  • deepseek-chat (حالت غیرتفکری) برای گفتگوهای سریع

  • deepseek-reasoner (حالت تفکری) برای وظایف پیچیده‌تر و نیازمند استدلال

انتشار به‌روزرسانی Terminus هوش مصنوعی دیپ سیک با بهبودهای زبانی

بر اساس آزمایش‌های انجام‌شده، نسخه جدید موفق به کسب نتایج بهتر در چندین معیار کلیدی شده است. به‌عنوان نمونه، امتیاز در MMLU-Pro از 84.8 به 85.0 افزایش یافته و در GPQA-Diamond از 80.1 به 80.7 رسیده است. در تست Humanity’s Last Exam نیز جهشی قابل توجه از 15.9 به 21.7 گزارش شده است. همچنین پیشرفت‌هایی در بنچمارک‌هایی مانند BrowseComp، SWE-bench Multilingual و Terminal-bench دیده می‌شود که نشان‌دهنده پایداری بیشتر خروجی‌هاست.

نسخه DeepSeek V3.1-Terminus هم‌اکنون روی اپلیکیشن (اندروید و iOS)، وب و API در دسترس کاربران قرار گرفته است. علاوه بر این، مدل جدید بلافاصله در Hugging Face عرضه شده و به‌زودی در AnyCoder و API بدون سرور NovitaLabs نیز اضافه خواهد شد.

انتشار DeepSeek V3.1-Terminus نشان می‌دهد این شرکت به بازخورد کاربران اهمیت زیادی می‌دهد و با بهبود مستمر محصولات خود، قصد دارد رقابت با بازیگران بزرگ حوزه هوش مصنوعی را جدی‌تر دنبال کند. ارتقای هماهنگی زبانی، افزایش امتیازهای بنچمارک و دسترسی آسان‌تر به این نسخه می‌تواند آن را به گزینه‌ای جذاب برای توسعه‌دهندگان و پژوهشگران بدل کند.

دیدگاه های کاربران
هیچ دیدگاهی موجود نیست