اوپنایآی دو مدل متنباز جدید معرفی کرد

اوپنایآی، یکی از بزرگترین شرکتهای فعال در حوزه هوش مصنوعی، دو مدل زبانی جدید را با نامهای gpt-oss-۱۲۰b و gpt-oss-۲۰b بهصورت متنباز معرفی کرد. این اولین بار پس از سال ۲۰۱۹ و انتشار GPT-۲ است که اوپنایآی تصمیم به عرضه مدلی با وزن باز میگیرد. هر دو مدل اکنون به رایگان از طریق پلتفرم Hugging Face در دسترس علاقهمندان و توسعهدهندگان است.
مدل کوچکتر این مجموعه، gpt-oss-۲۰b، به گونهای طراحی شده که روی یک GPU انویدیا یا حتی لپتاپهای معمولی با ۱۶ گیگابایت رم قابل اجرا باشد. مدل بزرگتر یعنی gpt-oss-۱۲۰b، با توجه به معماری پیشرفتهتر، به منابع سختافزاری قویتری نیاز دارد.
این مدلها از نظر عملکرد به مدلهای سری o این شرکت نزدیک هستند و میتوانند در صورت ناتوانی در انجام برخی وظایف، درخواست را به مدلهای قدرتمندتر و غیرمتنباز اوپنایآی در فضای ابری منتقل کنند. این در حالی است که اوپنایآی طی سالهای گذشته بیشتر به سمت مدلهای اختصاصی و بسته حرکت کرده و کمتر به انتشار مدلهای باز تمایل نشان داده بود.
تحلیلگران دلایل این تغییر رویکرد را فشار رقابتی از سوی آزمایشگاههای چینی مانند DeepSeek ،Qwen و Moonshot AI و همچنین درخواست اخیر دولت ایالات متحده برای متنباز کردن بخشی از فناوریهای پیشرفته میدانند.
در تست Codeforces، مدل gpt-oss-۱۲۰b امتیاز ۲۶۲۲ و gpt-oss-۲۰b امتیاز ۲۵۱۶ را به دست آورده که بالاتر از مدل دیپسیک R۱، اما کمی کمتر از مدلهای o۳ و o۴-mini این شرکت ثبت شده است. در آزمون Humanity’s Last Exam این دو مدل به ترتیب ۱۹ و ۱۷.۳ درصد امتیاز کسب کردهاند. با وجود این، میزان خطا یا «هذیانگویی» آنها بالاست و طبق آزمون PersonQA به ۴۹ و ۵۳ درصد رسیده که بیش از سه برابر مدل o۱ ارزیابی شده است.
اوپنایآی اعلام کرده که برای آموزش این مدلها همچون مدلهای اختصاصی خود از معماری mixture-of-experts و روشهای یادگیری تقویتی با استفاده از منابع محاسباتی سنگین بهره گرفته است. همچنین به کاربران امکان فراخوانی ابزارهایی مثل جستجوی وب و اجرای کد پایتون داده شده، اما این مدلها صرفاً متنی بوده و از پردازش تصویر و صوت پشتیبانی نمیکنند.
مدلهای جدید تحت مجوز Apache ۲.۰ منتشر شدهاند، به این ترتیب شرکتها و توسعهدهندگان میتوانند بدون پرداخت هزینه برای مقاصد تجاری از این مدلها استفاده کنند. با این وجود، دادههای آموزشی مدلها منتشر نمیشود و اطلاعات مربوط به دیتاستها به صورت عمومی در دسترس قرار نگرفته است.
اوپنایآی فرآیند عرضه این مدلها را طی ماههای اخیر به دلیل بررسیهای ایمنی به تعویق انداخته بود. آزمایشهای داخلی نشان دادهاند که gpt-oss به میزانی از توانایی پردازش دادههای زیستی رسیده، اما از آستانه خطرناک فراتر نرفته است. شرکت تاکید کرده که به نظارت و بهروزرسانیهای امنیتی ادامه میدهد.
در روزهای آینده، بازار مدلهای باز هوش مصنوعی با انتشار دیپسیک R۲ و مدل جدید شرکت متا رقابتیتر خواهد شد.
همچنین کاربرانی که امکان اجرای محلی این مدلها را ندارند، میتوانند با مراجعه به وبسایت gpt-oss.com مدلها را به صورت آنلاین آزمایش کنند.
انتهای پیام/