مدل Kimi K۲ با تمرکز بر هوش عاملمحور رونمایی شد

به گزارش خبرگزاری آنا؛ شرکت «مونشات اِیآی» با معرفی مدل جدید Kimi K۲ گام تازهای در مسیر توسعه مدلهای زبانی متنباز و عاملمحور برداشته است. این مدل با معماری Mixture-of-Experts طراحی شده و در هر بار استفاده، ۳۲ میلیارد پارامتر فعال میشود؛ درحالیکه مجموع پارامترهای آن به یک تریلیون میرسد.
Kimi K۲ در دو نسخه منتشر شده است: نسخهی Base برای پژوهشگران و توسعهدهندگانی که قصد دارند این مدل را مطابق نیاز خود تغییر دهند، و نسخهی Instruct برای استفاده مستقیم در چتباتها و انجام وظایف مشخص. به گفته «مونشات اِیآی»، این مدل نهفقط پاسخگوی پرسشهاست، بلکه توانایی انجام کارهای چندمرحلهای و تصمیمگیری خودکار را نیز دارد.
به گزارش Rysysth، در یکی از نمونههای ارائهشده، مدل Kimi K۲ یک پروژه کامل تحلیل داده را به اجرا درآورده است. این پروژه شامل ۱۶ مرحله کدنویسی در محیط IPython بوده و طی آن، دادههای مربوط به حقوق سالهای ۲۰۲۰ تا ۲۰۲۵ تحلیل شدهاند تا تأثیر میزان دورکاری بر حقوق افراد در سطوح مختلف تجربه شغلی بررسی شود. در پایان، خروجی این تحلیل به شکل یک وبسایت تعاملی عرضه شده که کاربران میتوانند با وارد کردن اطلاعات شخصی خود، نتیجهای متناسب دریافت کنند.
این مدل در آزمایشهای معتبر از جمله LiveCodeBench ،OJBench ،SWE-bench و AIME عملکرد قابلتوجهی داشته و در برخی از آنها توانسته مدلهای پیشرفتهای، چون «جیپیتی ۴» (متعلق به شرکت «اوپنایآی»)، «کلود ۴» (از شرکت «آنتروپیک») و «جِمینای ۲.۵» (توسعهیافته توسط «گوگل دیپمایند») را پشت سر بگذارد یا با آنها رقابت کند. عملکرد خاص این مدل در انجام وظایف عاملمحور، آن را در میان مدلهای اصطلاحاً «غیرفکری» به یکی از گزینههای شاخص تبدیل کرده است.
Kimi K۲ با بهینهسازی به نام MuonClip آموزش داده شده که نسخهای پیشرفته از بهینهساز Muon به شمار میرود. در این بهینهساز، از تکنیکی به نام qk-clip برای مقابله با ناپایداری در آموزش مدل استفاده شده است. دادههای آموزشی Kimi K۲ شامل بیش از ۱۵.۵ تریلیون توکن است و تیم توسعه برای ارتقاء توانمندیهای عاملمحور، از روشهایی مانند دادهسازی هدفمند و یادگیری تقویتی عمومی بهره گرفتهاند. این نوع آموزش موجب شده مدل در کارهایی که معیار مشخصی ندارند – مانند نگارش گزارش یا کنترل ابزارهای نرمافزاری – نیز توانایی تصمیمگیری پیدا کند.
از امروز، دسترسی رایگان به این مدل برای عموم فراهم شده است. همچنین، نسخهی رابط برنامهنویسی (API) آن منتشر شده که با استانداردهای شرکتهای «اوپنایآی» و «آنتروپیک» سازگار است و برای ساخت برنامههای عاملمحور قابل استفاده خواهد بود. با اینکه مدل هنوز ورودی تصویری را پشتیبانی نمیکند و ممکن است در برخی وظایف پیچیده خروجی ناقصی ارائه دهد، «مونشات اِیآی» اعلام کرده این محدودیتها در نسخههای آینده برطرف خواهند شد.
انتهای پیام/