دیپ‌سیک با چارچوب DSpark سرعت هوش مصنوعی را ۸۵ درصد افزایش داد

تیم پلازا - انتشار: 8 تیر 1405 21:57
ز.م مطالعه: 3 دقیقه
-

استارتاپ چینی دیپ‌سیک (DeepSeek) با معرفی چارچوب نوآورانه DSpark، ادعای مهمی را مطرح کرده است: افزایش ۸۵ درصدی سرعت پاسخ‌گویی مدل‌های هوش مصنوعی، آن هم بدون تکیه بر تراشه‌های پیشرفته و تحریم‌شده‌ی غربی. این دستاورد در حالی رخ می‌دهد که محدودیت‌های صادراتی ایالات متحده، شرکت‌های چینی را با چالش جدی دسترسی به پردازنده‌های گرافیکی قدرتمند انویدیا مواجه کرده است.

تکنولوژی پشت پرده؛ هوشمندی به جای سخت‌افزار

هسته اصلی این فناوری بر پایه روش «رمزگشایی حدسی» بنا شده است. در فرآیند معمول تولید متن توسط هوش مصنوعی، مدل‌ها توکن‌ها را تک‌به‌تک تولید می‌کنند که فرآیندی زمان‌بر و سنگین است. دیپ‌سیک با DSpark، از یک مدل سبک و کوچک برای پیش‌بینی و تولید سریع پاسخ‌های احتمالی استفاده می‌کند و مدل اصلی و بزرگ، تنها وظیفه اعتبارسنجی این پاسخ‌ها را بر عهده می‌گیرد.

این رویکرد به مدل اجازه می‌دهد تا در صورت صحیح بودن پیش‌بینی‌ها، بدون توقف به مسیر خود ادامه دهد. علاوه بر این، چارچوب مذکور از تولید «نیمه خودرگرسیو» بهره می‌برد که در آن، به‌جای تولید تک‌تک توکن‌ها، پاسخ‌ها در قالب بسته‌های کوچک ایجاد می‌شوند. تمامی این پردازش‌ها مستقیماً بر روی پردازنده گرافیکی (GPU) انجام می‌شود و نیاز به انتقال داده به پردازنده مرکزی (CPU) را حذف می‌کند که خود عامل مهمی در کاهش گلوگاه‌های پردازشی است.

اهمیت استراتژیک در سایه تحریم‌ها

دیپ‌سیک نتایج این پژوهش را که با همکاری دانشگاه پکن انجام شده، به‌صورت متن‌باز در GitHub و Hugging Face منتشر کرده است. اگرچه این فناوری «قابلیت‌های کلی» یا «هوش» مدل را افزایش نمی‌دهد، اما با افزایش بهره‌وری، به شرکت‌ها اجازه می‌دهد بدون سرمایه‌گذاری‌های سنگین برای خرید سخت‌افزارهای جدید، از زیرساخت‌های فعلی خود خروجی بسیار بیشتری بگیرند. برای نمونه، طبق اعلام این شرکت، پردازنده‌ای که پیش‌تر قادر به مدیریت ۱۰۰ درخواست هم‌زمان بود، اکنون می‌تواند ۱۸۵ درخواست را مدیریت کند.

این دستاورد در حالی مطرح می‌شود که رقابت بر سر بهینه‌سازی هوش مصنوعی در چین به اوج رسیده است؛ اوایل همین ماه نیز تیم هوش مصنوعی شیائومی موفق شده بود سرعت تولید خروجی مدل خود را به بیش از ۱۰۰۰ توکن در هر ثانیه برساند. دیپ‌سیک اکنون با معرفی مدل‌های خانواده V4، به‌ویژه نسخه V4-Flash که بر سرعت و هزینه کمتر متمرکز است، به دنبال تسلط بر بازار مدل‌های مقرون‌به‌صرفه و سریع است.

تکنولوژی پشت پرده؛ هوشمندی به جای سخت‌افزار

هسته اصلی این فناوری بر پایه روش «رمزگشایی حدسی» بنا شده است. در فرآیند معمول تولید متن توسط هوش مصنوعی، مدل‌ها توکن‌ها را تک‌به‌تک تولید می‌کنند که فرآیندی زمان‌بر و سنگین است. دیپ‌سیک با DSpark، از یک مدل سبک و کوچک برای پیش‌بینی و تولید سریع پاسخ‌های احتمالی استفاده می‌کند و مدل اصلی و بزرگ، تنها وظیفه اعتبارسنجی این پاسخ‌ها را بر عهده می‌گیرد.

این رویکرد به مدل اجازه می‌دهد تا در صورت صحیح بودن پیش‌بینی‌ها، بدون توقف به مسیر خود ادامه دهد. علاوه بر این، چارچوب مذکور از تولید «نیمه خودرگرسیو» بهره می‌برد که در آن، به‌جای تولید تک‌تک توکن‌ها، پاسخ‌ها در قالب بسته‌های کوچک ایجاد می‌شوند. تمامی این پردازش‌ها مستقیماً بر روی پردازنده گرافیکی (GPU) انجام می‌شود و نیاز به انتقال داده به پردازنده مرکزی (CPU) را حذف می‌کند که خود عامل مهمی در کاهش گلوگاه‌های پردازشی است.

اهمیت استراتژیک در سایه تحریم‌ها

دیپ‌سیک نتایج این پژوهش را که با همکاری دانشگاه پکن انجام شده، به‌صورت متن‌باز در GitHub و Hugging Face منتشر کرده است. اگرچه این فناوری «قابلیت‌های کلی» یا «هوش» مدل را افزایش نمی‌دهد، اما با افزایش بهره‌وری، به شرکت‌ها اجازه می‌دهد بدون سرمایه‌گذاری‌های سنگین برای خرید سخت‌افزارهای جدید، از زیرساخت‌های فعلی خود خروجی بسیار بیشتری بگیرند. برای نمونه، طبق اعلام این شرکت، پردازنده‌ای که پیش‌تر قادر به مدیریت ۱۰۰ درخواست هم‌زمان بود، اکنون می‌تواند ۱۸۵ درخواست را مدیریت کند.

این دستاورد در حالی مطرح می‌شود که رقابت بر سر بهینه‌سازی هوش مصنوعی در چین به اوج رسیده است؛ اوایل همین ماه نیز تیم هوش مصنوعی شیائومی موفق شده بود سرعت تولید خروجی مدل خود را به بیش از ۱۰۰۰ توکن در هر ثانیه برساند. دیپ‌سیک اکنون با معرفی مدل‌های خانواده V4، به‌ویژه نسخه V4-Flash که بر سرعت و هزینه کمتر متمرکز است، به دنبال تسلط بر بازار مدل‌های مقرون‌به‌صرفه و سریع است.

دیدگاه های کاربران
هیچ دیدگاهی موجود نیست