۲ مدل جدید هوش مصنوعی Anthropic رونمایی شد

در جریان نخستین کنفرانس توسعهدهندگان شرکت Anthropic که روز پنجشنبه برگزار شد، این شرکت از دو مدل جدید هوش مصنوعی با نامهای Claude Opus 4 و Claude Sonnet 4 رونمایی کرد. این مدلها جدیدترین اعضای خانواده Claude 4 هستند و به گفته Anthropic، توانایی تحلیل حجم بالای دادهها، انجام وظایف پیچیده و تصمیمگیری در مراحل چندگانه را دارند.
دسترسی کاربران و هزینه استفاده
طبق اعلام Anthropic، مدل Sonnet 4 برای همه کاربران چتبات این شرکت در دسترس قرار دارد؛ اما مدل Opus 4 تنها برای کاربران اشتراکی قابل استفاده است. هزینه دسترسی API این مدلها روی پلتفرمهای Amazon Bedrock و Google Vertex AI برای یک میلیون توکن ورودی و خروجی بهترتیب برای Opus 4 معادل ۱۵ و ۷۵ دلار و برای Sonnet 4 برابر با ۳ و ۱۵ دلار تعیین شده است.
ویژگیها و عملکرد مدلها
Opus 4، بهعنوان مدل شاخص این سری، برای انجام وظایف طولانیتر و با فراوانی بالاتر مراحل محاسباتی بهینهسازی شده و سعی دارد تمرکز خود را روی مسیرهای پیچیده حفظ کند. از سوی دیگر، Sonnet 4 که نسخه ارتقاءیافته مدل Sonnet 3.7 محسوب میشود، در حوزههای کدنویسی و ریاضیات بهبود پیدا کرده و قابلیت دنبالکردن دقیقتر دستورها را دارد.
طبق ارزیابیهای داخلی Anthropic، نسل جدید مدلهای Claude نسبت به نسخه قبلی خود، کمتر با پدیده reward hacking (یافتن پاسخ صحیح از مسیر میانبر یا اشکالات دستور) مواجه میشوند.
نتایج بنچمارک و مقایسه با رقبا
بر اساس نتایج بنچمارک منتشرشده، مدل Opus 4 توانسته در بنچمارک SWE-bench Verified که برای سنجش توانایی کدنویسی است، عملکرد بهتری نسبت به مدلهایی مانند Gemini 2.5 Pro از گوگل و مدلهای o3 و GPT-4.1 از OpenAI ثبت کند. اما در آزمونهای پیچیدهتر و چندبعدی با عناوینی چون MMMU یا GPQA Diamond، این مدل قادر به برتری نسبت به رقبا نبوده است.
ملاحظات امنیتی و دستهبندی مدل
مدل Opus 4 قرار است با سامانههای امنیتی بیشتر عرضه شود که از جمله آن، شناسایی محتوای مخرب در سطح بالاتر است. بنا به اعلام Anthropic، ارزیابیهای داخلی نشان داده که این مدل ممکن است توانایی افراد متخصص برای دسترسی یا نگهداری دانش در حوزههای حساس را ارتقا دهد و به همین دلیل، در سطح ASL-3 طبقهبندی شده است.
ساختار هیبریدی و ویژگیهای فنی
مدلهای جدید Opus 4 و Sonnet 4 دارای ساختار هیبریدی هستند و توانایی ارائه پاسخ سریع همزمان با انجام تحلیل عمیقتر و «reasoning» با صرف زمان بیشتر را دارند. در صورت فعال بودن حالت reasoning، مدل ابتدا راهحلهای مختلف را ارزیابی کرده و در نهایت خلاصهای از فرآیند تفکر خود را نمایش میدهد. جزئیات کامل فرآیند تحلیل به دلایل مربوط به حفظ مزیت رقابتی شرکت منتشر نمیشود.
این مدلها همچنین میتوانند همزمان از ابزارهایی مانند موتور جستوجو استفاده کنند و بر اساس نیاز، بین حالت reasoning و ابزارهای جانبی سوئیچ کنند تا کیفیت پاسخها افزایش یابد. قابلیت ذخیرهسازی و بهرهگیری اطلاعات کاربردی برای عملکرد پایدارتر نیز در این نسخهها دیده میشود.
ارتقاء ابزارهای جانبی
همزمان با معرفی این مدلها، شرکت Anthropic از ارتقاء ابزار Claude Code خبر داد. این ابزار امکان تعامل مستقیم توسعهدهندگان با مدلها از طریق ترمینال را فراهم میکند و در نسخه جدید، به محیطهای توسعه یکپارچه (IDE) متصل میشود. همچنین Anthropic یک کیت توسعه نرمافزاری (SDK) جدید عرضه کرده که باعث تعامل Claude Code با نرمافزارها و اپلیکیشنهای دیگر خواهد شد.
انتهای پیام/