استارتاپ چینی دیپسیک (DeepSeek) با معرفی چارچوب نوآورانه DSpark، ادعای مهمی را مطرح کرده است: افزایش ۸۵ درصدی سرعت پاسخگویی مدلهای هوش مصنوعی، آن هم بدون تکیه بر تراشههای پیشرفته و تحریمشدهی غربی. این دستاورد در حالی رخ میدهد که محدودیتهای صادراتی ایالات متحده، شرکتهای چینی را با چالش جدی دسترسی به پردازندههای گرافیکی قدرتمند انویدیا مواجه کرده است.
تکنولوژی پشت پرده؛ هوشمندی به جای سختافزار
هسته اصلی این فناوری بر پایه روش «رمزگشایی حدسی» بنا شده است. در فرآیند معمول تولید متن توسط هوش مصنوعی، مدلها توکنها را تکبهتک تولید میکنند که فرآیندی زمانبر و سنگین است. دیپسیک با DSpark، از یک مدل سبک و کوچک برای پیشبینی و تولید سریع پاسخهای احتمالی استفاده میکند و مدل اصلی و بزرگ، تنها وظیفه اعتبارسنجی این پاسخها را بر عهده میگیرد.
این رویکرد به مدل اجازه میدهد تا در صورت صحیح بودن پیشبینیها، بدون توقف به مسیر خود ادامه دهد. علاوه بر این، چارچوب مذکور از تولید «نیمه خودرگرسیو» بهره میبرد که در آن، بهجای تولید تکتک توکنها، پاسخها در قالب بستههای کوچک ایجاد میشوند. تمامی این پردازشها مستقیماً بر روی پردازنده گرافیکی (GPU) انجام میشود و نیاز به انتقال داده به پردازنده مرکزی (CPU) را حذف میکند که خود عامل مهمی در کاهش گلوگاههای پردازشی است.
اهمیت استراتژیک در سایه تحریمها
دیپسیک نتایج این پژوهش را که با همکاری دانشگاه پکن انجام شده، بهصورت متنباز در GitHub و Hugging Face منتشر کرده است. اگرچه این فناوری «قابلیتهای کلی» یا «هوش» مدل را افزایش نمیدهد، اما با افزایش بهرهوری، به شرکتها اجازه میدهد بدون سرمایهگذاریهای سنگین برای خرید سختافزارهای جدید، از زیرساختهای فعلی خود خروجی بسیار بیشتری بگیرند. برای نمونه، طبق اعلام این شرکت، پردازندهای که پیشتر قادر به مدیریت ۱۰۰ درخواست همزمان بود، اکنون میتواند ۱۸۵ درخواست را مدیریت کند.
این دستاورد در حالی مطرح میشود که رقابت بر سر بهینهسازی هوش مصنوعی در چین به اوج رسیده است؛ اوایل همین ماه نیز تیم هوش مصنوعی شیائومی موفق شده بود سرعت تولید خروجی مدل خود را به بیش از ۱۰۰۰ توکن در هر ثانیه برساند. دیپسیک اکنون با معرفی مدلهای خانواده V4، بهویژه نسخه V4-Flash که بر سرعت و هزینه کمتر متمرکز است، به دنبال تسلط بر بازار مدلهای مقرونبهصرفه و سریع است.
تکنولوژی پشت پرده؛ هوشمندی به جای سختافزار
هسته اصلی این فناوری بر پایه روش «رمزگشایی حدسی» بنا شده است. در فرآیند معمول تولید متن توسط هوش مصنوعی، مدلها توکنها را تکبهتک تولید میکنند که فرآیندی زمانبر و سنگین است. دیپسیک با DSpark، از یک مدل سبک و کوچک برای پیشبینی و تولید سریع پاسخهای احتمالی استفاده میکند و مدل اصلی و بزرگ، تنها وظیفه اعتبارسنجی این پاسخها را بر عهده میگیرد.
این رویکرد به مدل اجازه میدهد تا در صورت صحیح بودن پیشبینیها، بدون توقف به مسیر خود ادامه دهد. علاوه بر این، چارچوب مذکور از تولید «نیمه خودرگرسیو» بهره میبرد که در آن، بهجای تولید تکتک توکنها، پاسخها در قالب بستههای کوچک ایجاد میشوند. تمامی این پردازشها مستقیماً بر روی پردازنده گرافیکی (GPU) انجام میشود و نیاز به انتقال داده به پردازنده مرکزی (CPU) را حذف میکند که خود عامل مهمی در کاهش گلوگاههای پردازشی است.
اهمیت استراتژیک در سایه تحریمها
دیپسیک نتایج این پژوهش را که با همکاری دانشگاه پکن انجام شده، بهصورت متنباز در GitHub و Hugging Face منتشر کرده است. اگرچه این فناوری «قابلیتهای کلی» یا «هوش» مدل را افزایش نمیدهد، اما با افزایش بهرهوری، به شرکتها اجازه میدهد بدون سرمایهگذاریهای سنگین برای خرید سختافزارهای جدید، از زیرساختهای فعلی خود خروجی بسیار بیشتری بگیرند. برای نمونه، طبق اعلام این شرکت، پردازندهای که پیشتر قادر به مدیریت ۱۰۰ درخواست همزمان بود، اکنون میتواند ۱۸۵ درخواست را مدیریت کند.
این دستاورد در حالی مطرح میشود که رقابت بر سر بهینهسازی هوش مصنوعی در چین به اوج رسیده است؛ اوایل همین ماه نیز تیم هوش مصنوعی شیائومی موفق شده بود سرعت تولید خروجی مدل خود را به بیش از ۱۰۰۰ توکن در هر ثانیه برساند. دیپسیک اکنون با معرفی مدلهای خانواده V4، بهویژه نسخه V4-Flash که بر سرعت و هزینه کمتر متمرکز است، به دنبال تسلط بر بازار مدلهای مقرونبهصرفه و سریع است.
