دیپ سیک R2 اواخر آگوست با هدف استقلال چین در حوزه هوش مصنوعی عرضه می‌شود

تیم پلازا - انتشار: 22 مرداد 1404 17:33
ز.م مطالعه: 2 دقیقه
-

چند روز پس از عرضه ChatGPT-5، خبرها حاکی از آن است که شرکت دیپ‌سیک در حال آماده‌سازی برای معرفی DeepSeek-R2 بین ۱۵ تا ۳۰ آگوست ۲۰۲۵ است. این بازه زمانی در جریان گفت‌وگو با یکی از مدل‌های هوش مصنوعی خود شرکت فاش شده و نشان می‌دهد عرضه رسمی این مدل بسیار نزدیک است.

مدل DeepSeek-R2 نسبت به نسخه قبلی خود پیشرفت قابل توجهی در معماری خواهد داشت. این مدل با بهره‌گیری از سیستم Mixture of Experts پیشرفته‌تر و شبکه‌های گیتینگ هوشمندتر، عملکرد بهتری در پردازش وظایف سنگین پیش‌بینی می‌کند. بر اساس اطلاعات موجود، این مدل می‌تواند تا ۱.۲ تریلیون پارامتر را پشتیبانی کند، که تقریباً دو برابر نسخه قبلی DeepSeek-R1 با ۶۷۱ میلیارد پارامتر است. با این حال، همچنان از نظر ابعاد از ChatGPT-4/5 با بیش از ۱.۸ تریلیون پارامتر کوچک‌تر خواهد بود.

از سمت دیگر، در یک حرکت استراتژیک برای خودکفایی در حوزه AI، این مدل به طور کامل با استفاده از تراشه‌های هواوی Ascend 910B آموزش داده شده است. خوشه پردازشی هوآوی با توان ۵۱۲ PFLOPS در دقت FP16 و بهره‌وری ۸۲٪، طبق گزارش‌ها به ۹۱٪ کارایی خوشه Nvidia A100 می‌رسد. این موضوع می‌تواند وابستگی چین به سخت‌افزارهای آمریکایی را به میزان قابل توجهی کاهش دهد. هزینه آموزش DeepSeek-R2 به لطف استفاده از سخت‌افزار بومی و تکنیک‌های بهینه‌سازی، ۹۷٪ کمتر از GPT-4 بوده است. کارشناسان پیش‌بینی می‌کنند دیپ‌سیک دسترسی API این مدل را با قیمت‌های پایین‌تر ارائه دهد، که می‌تواند بازار قیمت‌گذاری فعلی تحت سلطه OpenAI و Anthropic را دگرگون کند.

این خبر باعث رشد چشمگیر سهام شرکت‌های فناوری چین شده است. سهام Cambricon، سازنده تراشه‌های AI، با رشد ۲۰ درصدی، ارزش بازار خود را به بیش از ۳۵۵ میلیارد یوان (حدود ۴۹.۷ میلیارد دلار) رساند.

در خبر مرتبط، هوآوی چارچوب جدیدی به نام Unified Cache Manager (UCM) معرفی کرده است که با بهینه‌سازی مدیریت داده‌های KV Cache در سطوح مختلف حافظه (HBM ،DRAM ،SSD)، می‌تواند زمان تأخیر را تا ۹۰٪ کاهش و ۲۲ برابر بازدهی را افزایش دهد. این فناوری در همکاری با China UnionPay آزمایش شده و قرار است در سپتامبر به صورت متن‌باز منتشر شود.

معرفی DeepSeek-R2 و فناوری UCM هوآوی، نشانه‌ای از جهش بزرگ چین در مسیر استقلال هوش مصنوعی است. این اقدامات می‌تواند زمینه‌ساز ساخت و اجرای سیستم‌های AI قدرتمند بدون وابستگی به تراشه‌ها و ابزارهای نرم‌افزاری غربی باشد؛ حرکتی که احتمالاً رقابت جهانی در حوزه هوش مصنوعی را داغ‌تر خواهد کرد.

دیدگاه های کاربران
هیچ دیدگاهی موجود نیست