نسخه جدید دیپ سیک با ظرفیت متنی معادل یک کتاب ۳۰۰ صفحهای منتشر میشود

به گزارش خبرگزاری آنا؛ استارتاپ هوش مصنوعی چینی DeepSeek مدل پایه V۳ خود را بهروزرسانی کرده و اشاره به مدل استدلالی R۱ را از قابلیت «تفکر عمیق» چتبات خود حذف کرده است؛ اقدامی که گمانهزنیهایی درباره تغییر جهت تحقیقاتی این شرکت بهدنبال داشته است.
شرکت DeepSeek روز سهشنبه در پیامی کوتاه به یکی از گروههای کاربران خود در ویچت، از انتشار مدل V۳.۱ خبر داد. این نسخه جدید ظرفیت متنی را به ۱۲۸ هزار توکن افزایش داده است؛ ظرفیتی معادل یک کتاب ۳۰۰ صفحهای که امکان نگهداری اطلاعات بیشتر در تعاملات کاربر را فراهم میکند.
این شرکت هیچگونه اطلاعرسانی عمومی درباره این بهروزرسانی در شبکههای اجتماعی خود انجام نداده است. همچنین، DeepSeek اشاره به مدل R۱ را از قابلیت «تفکر عمیق» چتبات خود حذف کرده که موجب طرح پرسشهایی درباره روند توسعه مدل نسل بعدی R۲ شده است.
جهان در انتظار اعلام برنامههای توسعهای دیپسیک است
DeepSeek توسط کارآفرین چینی لیانگ ونفنگ بهعنوان پروژه جانبی شرکت معاملات الگوریتمیاش تأسیس شد. این شرکت با عرضه مدل V۳ در دسامبر و مدل R۱ در ژانویه، توجه جهانی را به خود جلب کرد و موجی از استقبال از مدلهای متنباز هوش مصنوعی در چین به راه انداخت. با این حال، تاکنون هیچ جدول زمانی یا برنامه مشخصی برای توسعه مدلهای آینده از سوی این شرکت اعلام نشده است.
کاهش سهم بازار و عقبماندن از رقبا
این استارتاپ کمحاشیه در ماههای اخیر، با کاهش تعداد کاربران مواجه شده است؛ چرا که مدلهای متنباز شرکتهای بزرگتر چینی مانند خانواده Qwen متعلق به گروه علیبابا، در میان کسبوکارها و مصرفکنندگان محبوبیت بیشتری یافتهاند. طبق دادههای ارائهشده توسط سرویس ابری PPIO، سهم DeepSeek از استفاده مدلهای متنباز در سهماهه نخست سال بیش از ۹۹ درصد بود، اما این رقم در ماه ژوئن به حدود ۸۰ درصد کاهش یافت. در اواخر ماه مه، استفاده از مدلهای Qwen علیبابا از محصولات DeepSeek پیشی گرفت.
محدودیتهای فنی و رقابت با مدلهای چندرسانهای
یکی از دلایل عقبماندن DeepSeek، عدم توسعه قابلیتهای چندرسانهای و برنامهنویسی در مدلهایش است؛ در حالی که سایر شرکتها این قابلیتها را گسترش دادهاند. مدل Kimi-K۲-Instruct، محصول استارتاپ MoonShot AI که تحت حمایت علیبابا فعالیت میکند، نیز با استقبال جهانی روبهرو شده است.
مدل V۳.۱ که نخستین نسخه اصلاحشده V۳ از ماه مارس تاکنون محسوب میشود، اکنون در سکوی Hugging Face، بزرگترین جامعه متنباز هوش مصنوعی جهان در دسترس قرار گرفته است. برخی آزمایشهای مستقل نشان میدهند که این مدل در زمینه برنامهنویسی عملکرد بهتری دارد.
رتبهبندی در آزمونهای تخصصی برنامهنویسی
بر اساس معیار Aider Benchmark که تواناییهای برنامهنویسی مدلهای هوش مصنوعی را ارزیابی میکند، مدل V۳.۱ DeepSeek در میان سیستمهای چینی رتبه نخست را کسب کرده است. با این حال، در مقایسه با رقبای بینالمللی، این مدل پس از Claude Opus ۴، یکی از برترین مدلهای برنامهنویسی جهان قرار گرفته است.
تأخیر در عرضه مدل R۲ بهدلیل مشکلات فنی
طبق گزارشی از روزنامه Financial Times، عرضه مدل R۲ بهدلیل چالشهای فنی در آموزش با تراشههای هوش مصنوعی Ascend متعلق به شرکت Huawei به تعویق افتاده است. این گزارش با استناد به منبعی ناشناس، از «مشکلات فنی مداوم» در روند آموزش این مدل خبر داده است. DeepSeek اعلام کرده بود که مدل اولیه V۳ با استفاده از ۲۰۴۸ تراشه Nvidia H۸۰۰ آموزش داده شده است.
خبرنگار آناتک در ادامۀ این گزارش به بررسی سه مدل زبانی DeepSeek، Qwen Kimi-K۲-Instruct میپردازد و نقاط قوت هریک نسبت به دیگری را مورد اشاره قرار میدهد.
دیپسیک پیشگام در استدلال و منطق چندمرحلهای
مدلهای دیپسیک، بهویژه نسخه R۱ و V۳.۱، توسط استارتاپ چینی دیپسیک توسعه یافتهاند و تمرکز اصلی آنها بر توانایی استدلال، حل مسائل پیچیده ریاضی و تولید کد است. این مدلها با بهرهگیری از معماری Mixture-of-Experts و یادگیری تقویتی چندمرحلهای، قادرند فرآیندهای منطقی را بهصورت زنجیرهای نمایش دهند. نسخه R۱ بهویژه در حل مسائل ریاضی و کدنویسی عملکردی نزدیک به مدلهای تجاری مانند GPT-۴ داشته و با هزینهای بسیار پایینتر توسعه یافته است. همچنین، دیپسیک بهعنوان یک مدل متنباز، امکان استقرار محلی و شخصیسازی را برای پژوهشگران و توسعهدهندگان فراهم کرده است.
کوئن انعطافپذیری چندزبانه و استدلال ترکیبی
مدل کوئن، محصول گروه علیبابا، با نسخه سوم خود (Qwen ۳) توانسته است قابلیتهای چندزبانه، استدلال ترکیبی و معماری MoE را در قالبی متنباز ارائه دهد. این مدل از «بودجه تفکر» قابل تنظیم بهره میبرد که به کاربران اجازه میدهد بین سرعت و دقت در پاسخدهی تعادل برقرار کنند. کوئن از ۱۱۹ زبان پشتیبانی میکند و برای کاربردهای جهانی، از جمله ترجمه، تولید محتوا، و تحلیل دادههای چندزبانه بسیار مناسب است. همچنین، قابلیت شخصیسازی بالا و پشتیبانی از ابزارهای جانبی، این مدل را به گزینهای مطلوب برای صنایع مختلف تبدیل کرده است.
Kimi-K۲-Instruct: دقت بالا در کدنویسی و استدلال تخصصی
مدل Kimi-K۲-Instruct، توسعهیافته توسط Moonshot AI با حمایت علیبابا، یکی از قدرتمندترین مدلهای متنباز در زمینه کدنویسی و استدلال تخصصی است. این مدل با ۱۰۰۰ میلیارد پارامتر و پنجره متنی ۱۲۸ هزار توکن، توانایی پردازش متون بسیار طولانی را دارد. در آزمونهای معیار مانند GSM۸k، MMLU و LiveCodeBench، عملکرد Kimi-K۲-Instruct بهطور قابل توجهی از نسخه پایه خود و بسیاری از مدلهای رقیب پیشی گرفته است. این مدل برای کاربردهای سازمانی، تحلیل دادههای پیچیده و تولید کدهای دقیق بسیار مناسب است.
مقایسه قابلیتهای استدلالی و معماری
باید گفت در مقایسه میان سه مدل، دیپسیک در استدلال چندمرحلهای و نمایش فرآیند منطقی برجسته است، در حالی که کوئن با ارائه دو حالت تفکر و پاسخ سریع، انعطافپذیری بیشتری در تعاملات دارد. Kimi-K۲-Instruct نیز با تمرکز بر استدلال تخصصی و ابزارهای جانبی، برای وظایف فنی و کدنویسی عملکردی بینظیر دارد. هر سه مدل از معماری Mixture-of-Experts بهره میبرند، اما کوئن و Kimi با فعالسازی بخشی از پارامترها در هر درخواست، هزینه محاسباتی را کاهش دادهاند.
نقاط قوت در کاربردهای صنعتی و پژوهشی
دیپسیک بهدلیل متنباز بودن و هزینه پایین، گزینهای مناسب برای مؤسسات پژوهشی و دانشگاهی است. کوئن با پشتیبانی از زبانهای متعدد و قابلیت شخصیسازی، در صنایع جهانی مانند سلامت، حقوق و آموزش کاربرد دارد. Kimi-K۲-Instruct نیز با دقت بالا در تولید کد و تحلیل داده، برای شرکتهای فناوری و توسعهدهندگان نرمافزار بسیار ارزشمند است. هر سه مدل امکان استقرار محلی و استفاده تجاری را فراهم کردهاند، اما Kimi و کوئن در مقیاسپذیری و سرعت پاسخدهی برتری دارند.
نیاز شما میگوید که کدام مدل بهتر است
با توجه به روند توسعه، دیپسیک در مسیر ارتقای مدلهای استدلالی قرار دارد، اما با چالشهایی در زمینه چندرسانهای و تعاملات گسترده مواجه است. Qwen با تمرکز بر تعاملات انسانی و پشتیبانی چندزبانه، چشمانداز روشنی در کاربردهای عمومی دارد. Kimi-K۲-Instruct نیز با عملکرد بالا در آزمونهای تخصصی، جایگاه خود را در میان مدلهای پیشرفته تثبیت کرده است. انتخاب میان این سه مدل بستگی به نیازهای خاص کاربر دارد.
انتهای پیام/