اوپن‌ای‌آی دو مدل متن‌باز جدید معرفی کرد

شرکت اوپن‌ای‌آی پس از سال‌ها تمرکز بر مدل‌های بسته، دو مدل زبانی متن‌باز با قابلیت استدلال پیشرفته را معرفی کرد. این مدل‌ها با نام‌های gpt-oss-۱۲۰b و gpt-oss-۲۰b عرضه شده‌اند و برای استفاده تجاری رایگان و اجرای محلی بهینه شده‌اند.

نویسنده : اشکان حاسبی

کد خبر : 989411

اشتراک گذاری

اوپن‌ای‌آی، یکی از بزرگ‌ترین شرکت‌های فعال در حوزه هوش مصنوعی، دو مدل زبانی جدید را با نام‌های gpt-oss-۱۲۰b و gpt-oss-۲۰b به‌صورت متن‌باز معرفی کرد. این اولین بار پس از سال ۲۰۱۹ و انتشار GPT-۲ است که اوپن‌ای‌آی تصمیم به عرضه مدلی با وزن باز می‌گیرد. هر دو مدل اکنون به رایگان از طریق پلتفرم Hugging Face در دسترس علاقه‌مندان و توسعه‌دهندگان است.

مدل کوچک‌تر این مجموعه، gpt-oss-۲۰b، به گونه‌ای طراحی شده که روی یک GPU انویدیا یا حتی لپ‌تاپ‌های معمولی با ۱۶ گیگابایت رم قابل اجرا باشد. مدل بزرگ‌تر یعنی gpt-oss-۱۲۰b، با توجه به معماری پیشرفته‌تر، به منابع سخت‌افزاری قوی‌تری نیاز دارد.

این مدل‌ها از نظر عملکرد به مدل‌های سری o این شرکت نزدیک هستند و می‌توانند در صورت ناتوانی در انجام برخی وظایف، درخواست را به مدل‌های قدرتمندتر و غیرمتن‌باز اوپن‌ای‌آی در فضای ابری منتقل کنند. این در حالی است که اوپن‌ای‌آی طی سال‌های گذشته بیشتر به سمت مدل‌های اختصاصی و بسته حرکت کرده و کمتر به انتشار مدل‌های باز تمایل نشان داده بود.

تحلیلگران دلایل این تغییر رویکرد را فشار رقابتی از سوی آزمایشگاه‌های چینی مانند DeepSeek ،Qwen و Moonshot AI و همچنین درخواست اخیر دولت ایالات متحده برای متن‌باز کردن بخشی از فناوری‌های پیشرفته می‌دانند.

در تست Codeforces، مدل gpt-oss-۱۲۰b امتیاز ۲۶۲۲ و gpt-oss-۲۰b امتیاز ۲۵۱۶ را به دست آورده که بالاتر از مدل دیپ‌سیک R۱، اما کمی کمتر از مدل‌های o۳ و o۴-mini این شرکت ثبت شده است. در آزمون Humanity’s Last Exam این دو مدل به ترتیب ۱۹ و ۱۷.۳ درصد امتیاز کسب کرده‌اند. با وجود این، میزان خطا یا «هذیان‌گویی» آنها بالاست و طبق آزمون PersonQA به ۴۹ و ۵۳ درصد رسیده که بیش از سه برابر مدل o۱ ارزیابی شده است.

اوپن‌ای‌آی اعلام کرده که برای آموزش این مدل‌ها همچون مدل‌های اختصاصی خود از معماری mixture-of-experts و روش‌های یادگیری تقویتی با استفاده از منابع محاسباتی سنگین بهره گرفته است. همچنین به کاربران امکان فراخوانی ابزار‌هایی مثل جستجوی وب و اجرای کد پایتون داده شده، اما این مدل‌ها صرفاً متنی بوده و از پردازش تصویر و صوت پشتیبانی نمی‌کنند.

مدل‌های جدید تحت مجوز Apache ۲.۰ منتشر شده‌اند، به این ترتیب شرکت‌ها و توسعه‌دهندگان می‌توانند بدون پرداخت هزینه برای مقاصد تجاری از این مدل‌ها استفاده کنند. با این وجود، داده‌های آموزشی مدل‌ها منتشر نمی‌شود و اطلاعات مربوط به دیتاست‌ها به صورت عمومی در دسترس قرار نگرفته است.

اوپن‌ای‌آی فرآیند عرضه این مدل‌ها را طی ماه‌های اخیر به دلیل بررسی‌های ایمنی به تعویق انداخته بود. آزمایش‌های داخلی نشان داده‌اند که gpt-oss به میزانی از توانایی پردازش داده‌های زیستی رسیده، اما از آستانه خطرناک فراتر نرفته است. شرکت تاکید کرده که به نظارت و به‌روزرسانی‌های امنیتی ادامه می‌دهد.

در روز‌های آینده، بازار مدل‌های باز هوش مصنوعی با انتشار دیپ‌سیک R۲ و مدل جدید شرکت متا رقابتی‌تر خواهد شد.

همچنین کاربرانی که امکان اجرای محلی این مدل‌ها را ندارند، می‌توانند با مراجعه به وبسایت gpt-oss.com مدل‌ها را به صورت آنلاین آزمایش کنند.

انتهای پیام/