روزی که هوش مصنوعی فراموش کرد یک ماشین است

شرکت ساکانا (Sakana)، استارتاپ هوش مصنوعی ژاپنی و تأسیسشده توسط دو پژوهشگر سابق برتر گوگل، لیون جونز (Llion Jones) و دیویدها (David Ha)، معماری جدیدی از مدلهای هوش مصنوعی به نام ماشینهای فکر پیوسته (Continuous Thought Machines - CTM) را معرفی کرده است و هدف این معماری، انتقال مدلهای زبانی بزرگ (LLMs) به مرحلهای جدید است که در آن، مدلها انعطافپذیرتر باشند و طیف گستردهتری از وظایف شناختی مانند حل مسیرهای پیچیده یا ناوبری در محیطهای ناشناخته را بدون نیاز به اطلاعات مکانی یا نقشههای فضایی انجام دهند.
«تفکر» به جای «پردازش»
معماریهای غالب امروزی مانند Transformer، از لایههای ثابت و موازی استفاده میکنند که تمام ورودیها را یکباره پردازش میکنند اما ماشینهای فکر پیوسته (CTM)، به طور کامل متفاوت عمل میکنند بطوری که هر واحد پردازشی (که شبیه یک نرون مصنوعی است)، دارای یک حافظه کوتاهمدت از وضعیت قبلی خود است و بر اساس آن تصمیم میگیرد که چه زمانی دوباره فعال شود. این فرآیند به صورت گامبهگام و در واحدهای زمانی به نام تیک (tick) اتفاق میافتد. این امر به مدل اجازه میدهد تا عمق و مدت زمان استدلال خود را بر اساس پیچیدگی ورودی تنظیم کند؛ این رویکرد از نظر فنی و فلسفی با مدلهای یادگیری عمیق سنتی تفاوت دارد و به سمت الگویی نزدیک به مغز انسان حرکت میکند.
وقتی شبکه عصبی خودش تصمیم میگیرد که فکر کند
دو مکانیسم اصلی، حافظه محلی نرون که هر نرون اطلاعاتی از فعالیتهای قبلی خود را حفظ میکند و از آن برای تصمیمگیری درباره زمان بعدی فعالیتش استفاده میکند و هماهنگی گروهی نرونها که گروههایی از نرونها تصمیم میگیرند که چه موقع با هم و بدون دخالت مستقیم از بیرون فعال شوند و این امر به مدل کمک میکند تا توجه خود را به نقاط مهم معطوف کند، CTM را تشکیل میدهند و این رویکرد به CTM اجازه میدهد تا تصمیمات خود را در زمان و مشابه با نحوه فکر کردن انسان در مواجهه با مسائل پیچیده توسعه دهد.
در بیانیهای، ساکانا اعلام کرده است که هدف نهایی آنها رسیدن به سطحی از عملکرد برابر یا بالاتر از مغز انسان است؛ این مدلها قادر هستند در مواقع لزوم، استدلال عمیقتری انجام دهند، در موارد ساده، منابع کمتری مصرف کنند و نحوه تصمیمگیری خود را به صورت شفاف نشان دهند
هوشمصنوعی که خودش «میفهمد» چقدر قوی است
به گزارش venturebeat ، ساکانا در تستهای مختلف از جمله طبقهبندی تصاویر (ImageNet)، حل مسیرهای دوبعدی، یادگیری تقویتی (Reinforcement Learning) نتایجی را منتشر کرده است که نشان میدهد این مدلها قابلیت تفسیر بیشتری دارند، در وظایف پیچیده و پویا بهتر عمل میکنند و دقت منطقی دارند بطوری که اطمینان خود را بدون نیاز به تنظیمات پسازآموزش با دقت واقعی هماهنگ میکنند؛ برای مثال در حل مسیرهای دشوار، CTM بدون استفاده از اطلاعات مکانی، موفق به حرکت از نقطه A به B شده است و ردیابی نشان داده است که مدل به روشی شبیه به انسان، بخشهای مختلف تصویر را یکی پس از دیگری مورد توجه قرار میدهد.
آینده نزدیک یا دور دست؟
با وجود تمام این توانمندیها، ماشینهای فکر پیوسته هنوز در مرحله آزمایشی هستند و برای استفاده گسترده در محیطهای تجاری نیاز به بهینهسازی بیشتری از جمله هزینه آموزش بالاتر، نیاز به ابزارهای جدید برای دیباگ و پروفایلگیری و نیاز به بهینهسازی منابع محاسباتی دارند؛ اما ساکانا تمامی کدهای CTM را در اختیار عموم قرار داده است و مجموعهای از ابزارهای تحلیلی، اسکریپتهای آموزشی و دموهای تعاملی را در GitHub منتشر کرده است.
آیا CTM میتواند هوش مصنوعی را «انسانی»تر کند؟
با توجه به ویژگیهای منحصربهفرد CTM از جمله، صرفهجویی در مصرف انرژی در محیطهای بزرگ مقیاس، قابلیت توضیحپذیری بالا در تصمیمگیری و انعطافپذیری در پردازش ورودیهای پیچیده، این معماری میتواند در برنامههایی که نیاز به شفافیت، ایمنی و کارایی دارند، بسیار ارزشمند باشد و با اینکه هنوز جایگزینی برای Transformer نیست، میتواند گامی جدید در جهت هوشی مشابه انسان باشد.
سابقه تحقیقاتی ساکانا
لازم به ذکر است که ساکانا در گذشته با برخی انتقادات مواجه شده است؛ برای مثال در فوریه سال جاری، مدل «AI CUDA Engineer» آنها به دلیل استفاده غیرقانونی از اشکالات محیط تستی، انتقادهایی را به همراه داشتند، اما این شرکت به سرعت واکنش نشان داد و اعلام کرد که به بهبود ابزارهای ارزیابی و افزایش شفافیت در پروژههای آینده ادامه خواهد داد.
معرفی ماشینهای فکر پیوسته (CTM) از سوی ساکانا، گامی مهم در جهت توسعه مدلهای هوش مصنوعی با الهام از مغز انسان است و این معماری نه تنها به مدلها اجازه میدهد هوشمندانهتر عمل کنند بلکه شفافیت و انعطافپذیری بیشتری را نیز فراهم میکند؛ اگرچه هنوز در ابتدای راه است اما میتواند آغازگر تحولی عمیق در نحوه طراحی و استفاده از هوش مصنوعی در آینده باشد.
انتهای پیام/