هوش مصنوعی گروک مجهز به تحلیل تصویر شد

شرکت xAI در تاریخ ۷ آبان ۱۴۰۳ از بهروزرسانی مهمی برای دستیار هوش مصنوعی خود، گروک، رونمایی کرد. این نسخه جدید، با افزودن قابلیتهای بصری، گروک را قادر میسازد تا تصاویر مرتبط با پستهای پلتفرم ایکس را تحلیل کرده و محتوای بصری مانند اسناد، نمودارها و عکسها را تفسیر کند. همچنین، این دستیار میتواند روابط فضایی درون تصاویر را درک کرده و توضیحات دقیقتری از محتوا ارائه دهد.
کاربران بهزودی دکمهای جدید در پستهای حاوی تصویر در پلتفرم ایکس مشاهده خواهند کرد. با کلیک بر این دکمه، تصویر به گروک ارسال میشود و کاربران میتوانند سؤالاتی درباره محتوای بصری بپرسند یا درخواست تحلیل کنند. این قابلیت میتواند برای پیشنهاد دستور پخت غذا بر اساس عکس مواد اولیه، شناسایی مکان یک بنای تاریخی در تصاویر به اشتراک گذاشتهشده در ایکس، یا توضیح نتایج یک نمودار استفاده شود. این ویژگی بهویژه در پلتفرمی خبرمحور مانند ایکس کاربردی است.
گروک پیشتر از مدل فلاکس آزمایشگاه بلک فورست برای تولید تصویر استفاده میکرد، اما فاقد قابلیت تحلیل تصویر بود و آخرین محصول عمده هوش مصنوعی بود که این ویژگی را نداشت. xAI مدعی است که قابلیتهای بصری گروک با مدلهای مطرح شرکتهایی مانند اوپنایآی، گوگل و آنتروپیک رقابت میکند. برای ارزیابی این تواناییها، xAI معیاری جدید به نام RealWorldQA معرفی کرده است که مهارت گروک در درک و استدلال درباره جهان فیزیکی از طریق تصاویر را میسنجد.
این قابلیت همچنین میتواند به افراد دارای مشکلات بینایی در توصیف تصاویر کمک کند. با این حال، هنوز معیارهای رسمی برای سنجش عملکرد گروک منتشر نشده است. واکنشهای جامعه هوش مصنوعی و کاربران به این بهروزرسانی متفاوت بوده است؛ برخی از سرعت پیشرفت گروک هیجانزدهاند، اما برخی دیگر نسبت به عملکرد آن در مقایسه با مدلهای تثبیتشده محتاط هستند.
tomsguide نوشت: ایلان ماسک، مالک xAI، اعلام کرده که این قابلیت در مراحل اولیه است و بهسرعت بهبود خواهد یافت. انتظار میرود در آینده قابلیتهایی مانند تحلیل اسناد و فایلهای PDF نیز به گروک اضافه شود. این بهروزرسانی گروک را به رقیبی جدیتر در برابر چتباتهایی مانند چتجیپیتی و جمنای تبدیل میکند که پیشتر قابلیتهای بصری را ارائه کردهاند.
انتهای پیام/