10:03 25 / 04 /1404

مدل Kimi K۲ با تمرکز بر هوش عامل‌محور رونمایی شد

مدل Kimi K۲ با تمرکز بر هوش عامل‌محور رونمایی شد
شرکت «مون‌شات اِی‌آی» از مدل زبانی جدید خود با نام Kimi K۲ رونمایی کرده است؛ مدلی با معماری Mixture-of-Experts و تمرکز ویژه بر انجام وظایف عامل‌محور که در قالب نسخه‌های Base و Instruct در اختیار عموم قرار گرفته. این مدل که از امروز به‌صورت رایگان در دسترس کاربران قرار دارد، با بهره‌گیری از بیش از ۱۵.۵ تریلیون توکن آموزشی و بهینه‌ساز جدیدی به نام MuonClip توسعه یافته و قابلیت‌هایی نظیر تحلیل داده، برنامه‌نویسی چندمرحله‌ای و ساخت ابزار‌های تعاملی را از ابتدا تا پایان برعهده می‌گیرد.

به گزارش خبرگزاری آنا؛ شرکت «مون‌شات اِی‌آی» با معرفی مدل جدید Kimi K۲ گام تازه‌ای در مسیر توسعه مدل‌های زبانی متن‌باز و عامل‌محور برداشته است. این مدل با معماری Mixture-of-Experts طراحی شده و در هر بار استفاده، ۳۲ میلیارد پارامتر فعال می‌شود؛ درحالی‌که مجموع پارامتر‌های آن به یک تریلیون می‌رسد.

Kimi K۲ در دو نسخه منتشر شده است: نسخه‌ی Base برای پژوهشگران و توسعه‌دهندگانی که قصد دارند این مدل را مطابق نیاز خود تغییر دهند، و نسخه‌ی Instruct برای استفاده مستقیم در چت‌بات‌ها و انجام وظایف مشخص. به گفته «مون‌شات اِی‌آی»، این مدل نه‌فقط پاسخگوی پرسش‌هاست، بلکه توانایی انجام کار‌های چندمرحله‌ای و تصمیم‌گیری خودکار را نیز دارد.

به گزارش Rysysth، در یکی از نمونه‌های ارائه‌شده، مدل Kimi K۲ یک پروژه کامل تحلیل داده را به اجرا درآورده است. این پروژه شامل ۱۶ مرحله کدنویسی در محیط IPython بوده و طی آن، داده‌های مربوط به حقوق سال‌های ۲۰۲۰ تا ۲۰۲۵ تحلیل شده‌اند تا تأثیر میزان دورکاری بر حقوق افراد در سطوح مختلف تجربه شغلی بررسی شود. در پایان، خروجی این تحلیل به شکل یک وب‌سایت تعاملی عرضه شده که کاربران می‌توانند با وارد کردن اطلاعات شخصی خود، نتیجه‌ای متناسب دریافت کنند.

این مدل در آزمایش‌های معتبر از جمله LiveCodeBench ،OJBench ،SWE-bench و AIME عملکرد قابل‌توجهی داشته و در برخی از آنها توانسته مدل‌های پیشرفته‌ای، چون «جی‌پی‌تی ۴» (متعلق به شرکت «اوپن‌ای‌آی»)، «کلود ۴» (از شرکت «آنتروپیک») و «جِمینای ۲.۵» (توسعه‌یافته توسط «گوگل دیپ‌مایند») را پشت سر بگذارد یا با آنها رقابت کند. عملکرد خاص این مدل در انجام وظایف عامل‌محور، آن را در میان مدل‌های اصطلاحاً «غیرفکری» به یکی از گزینه‌های شاخص تبدیل کرده است.

Kimi K۲ با بهینه‌سازی به نام MuonClip آموزش داده شده که نسخه‌ای پیشرفته از بهینه‌ساز Muon به شمار می‌رود. در این بهینه‌ساز، از تکنیکی به نام qk-clip برای مقابله با ناپایداری در آموزش مدل استفاده شده است. داده‌های آموزشی Kimi K۲ شامل بیش از ۱۵.۵ تریلیون توکن است و تیم توسعه برای ارتقاء توانمندی‌های عامل‌محور، از روش‌هایی مانند داده‌سازی هدفمند و یادگیری تقویتی عمومی بهره گرفته‌اند. این نوع آموزش موجب شده مدل در کار‌هایی که معیار مشخصی ندارند – مانند نگارش گزارش یا کنترل ابزار‌های نرم‌افزاری – نیز توانایی تصمیم‌گیری پیدا کند.

از امروز، دسترسی رایگان به این مدل برای عموم فراهم شده است. همچنین، نسخه‌ی رابط برنامه‌نویسی (API) آن منتشر شده که با استاندارد‌های شرکت‌های «اوپن‌ای‌آی» و «آنتروپیک» سازگار است و برای ساخت برنامه‌های عامل‌محور قابل استفاده خواهد بود. با این‌که مدل هنوز ورودی تصویری را پشتیبانی نمی‌کند و ممکن است در برخی وظایف پیچیده خروجی ناقصی ارائه دهد، «مون‌شات اِی‌آی» اعلام کرده این محدودیت‌ها در نسخه‌های آینده برطرف خواهند شد.

انتهای پیام/

ارسال نظر
رسپینا
گوشتیران
قالیشویی ادیب