روزی که هوش مصنوعی فراموش کرد یک ماشین است

روزی که هوش مصنوعی فراموش کرد یک ماشین است
شرکت ژاپنی ساکانا (Sakana) معماری جدیدی به نام «ماشین‌های فکر پیوسته» را رونمایی کرد، مدلی که می‌خواهد هوش مصنوعی را از چارچوب ماشین بیرون بکشد و به تفکر و تصمیم‌گیری در محیط‌های ناشناخته وادار کند.

شرکت ساکانا (Sakana)، استارتاپ هوش مصنوعی ژاپنی و تأسیس‌شده توسط دو پژوهشگر سابق برتر گوگل، لیون جونز (Llion Jones) و دیوید‌ها (David Ha)، معماری جدیدی از مدل‌های هوش مصنوعی به نام ماشین‌های فکر پیوسته (Continuous Thought Machines - CTM) را معرفی کرده است و هدف این معماری، انتقال مدل‌های زبانی بزرگ (LLMs) به مرحله‌ای جدید است که در آن، مدل‌ها انعطاف‌پذیرتر باشند و طیف گسترده‌تری از وظایف شناختی مانند حل مسیر‌های پیچیده یا ناوبری در محیط‌های ناشناخته را بدون نیاز به اطلاعات مکانی یا نقشه‌های فضایی انجام دهند. 

 «تفکر» به جای «پردازش»

معماری‌های غالب امروزی مانند Transformer، از لایه‌های ثابت و موازی استفاده می‌کنند که تمام ورودی‌ها را یکباره پردازش می‌کنند اما ماشین‌های فکر پیوسته (CTM)، به طور کامل متفاوت عمل می‌کنند بطوری که هر واحد پردازشی (که شبیه یک نرون مصنوعی است)، دارای یک حافظه کوتاه‌مدت از وضعیت قبلی خود است و بر اساس آن تصمیم می‌گیرد که چه زمانی دوباره فعال شود. این فرآیند به صورت گام‌به‌گام و در واحد‌های زمانی به نام تیک (tick) اتفاق می‌افتد. این امر به مدل اجازه می‌دهد تا عمق و مدت زمان استدلال خود را بر اساس پیچیدگی ورودی تنظیم کند؛ این رویکرد از نظر فنی و فلسفی با مدل‌های یادگیری عمیق سنتی تفاوت دارد و به سمت الگویی نزدیک به مغز انسان حرکت می‌کند.

وقتی شبکه عصبی خودش تصمیم می‌گیرد که فکر کند

دو مکانیسم اصلی، حافظه محلی نرون که هر نرون اطلاعاتی از فعالیت‌های قبلی خود را حفظ می‌کند و از آن برای تصمیم‌گیری درباره زمان بعدی فعالیتش استفاده می‌کند و هماهنگی گروهی نرون‌ها که گروه‌هایی از نرون‌ها تصمیم می‌گیرند که چه موقع با هم و بدون دخالت مستقیم از بیرون فعال شوند و این امر به مدل کمک می‌کند تا توجه خود را به نقاط مهم معطوف کند، CTM را تشکیل می‌دهند و این رویکرد به CTM اجازه می‌دهد تا تصمیمات خود را در زمان و مشابه با نحوه فکر کردن انسان در مواجهه با مسائل پیچیده توسعه دهد.

در بیانیه‌ای، ساکانا اعلام کرده است که هدف نهایی آنها رسیدن به سطحی از عملکرد برابر یا بالاتر از مغز انسان است؛ این مدل‌ها قادر هستند در مواقع لزوم، استدلال عمیق‌تری انجام دهند، در موارد ساده، منابع کمتری مصرف کنند و نحوه تصمیم‌گیری خود را به صورت شفاف نشان دهند

هوش‌مصنوعی که خودش «می‌فهمد» چقدر قوی است

به گزارش venturebeat ، ساکانا در تست‌های مختلف از جمله طبقه‌بندی تصاویر (ImageNet)، حل مسیر‌های دوبعدی، یادگیری تقویتی (Reinforcement Learning) نتایجی را منتشر کرده است که نشان می‌دهد این مدل‌ها قابلیت تفسیر بیشتری دارند، در وظایف پیچیده و پویا بهتر عمل می‌کنند و دقت منطقی دارند بطوری که اطمینان خود را بدون نیاز به تنظیمات پس‌ازآموزش با دقت واقعی هماهنگ می‌کنند؛ برای مثال در حل مسیر‌های دشوار، CTM بدون استفاده از اطلاعات مکانی، موفق به حرکت از نقطه A به B شده است و ردیابی نشان داده است که مدل به روشی شبیه به انسان، بخش‌های مختلف تصویر را یکی پس از دیگری مورد توجه قرار می‌دهد.

آینده نزدیک یا دور دست؟

با وجود تمام این توانمندی‌ها، ماشین‌های فکر پیوسته هنوز در مرحله آزمایشی هستند و برای استفاده گسترده در محیط‌های تجاری نیاز به بهینه‌سازی بیشتری از جمله هزینه آموزش بالاتر، نیاز به ابزار‌های جدید برای دیباگ و پروفایل‌گیری و نیاز به بهینه‌سازی منابع محاسباتی دارند؛ اما ساکانا تمامی کد‌های CTM را در اختیار عموم قرار داده است و مجموعه‌ای از ابزار‌های تحلیلی، اسکریپت‌های آموزشی و دمو‌های تعاملی را در GitHub منتشر کرده است.

آیا CTM می‌تواند هوش مصنوعی را «انسانی»‌تر کند؟

با توجه به ویژگی‌های منحصر‌به‌فرد CTM از جمله، صرفه‌جویی در مصرف انرژی در محیط‌های بزرگ مقیاس، قابلیت توضیح‌پذیری بالا در تصمیم‌گیری و انعطاف‌پذیری در پردازش ورودی‌های پیچیده، این معماری می‌تواند در برنامه‌هایی که نیاز به شفافیت، ایمنی و کارایی دارند، بسیار ارزشمند باشد و با اینکه هنوز جایگزینی برای Transformer نیست، می‌تواند گامی جدید در جهت هوشی مشابه انسان باشد.

سابقه تحقیقاتی ساکانا

لازم به ذکر است که ساکانا در گذشته با برخی انتقادات مواجه شده است؛ برای مثال در فوریه سال جاری، مدل «AI CUDA Engineer» آنها به دلیل استفاده غیرقانونی از اشکالات محیط تستی، انتقاد‌هایی را به همراه داشتند، اما این شرکت به سرعت واکنش نشان داد و اعلام کرد که به بهبود ابزار‌های ارزیابی و افزایش شفافیت در پروژه‌های آینده ادامه خواهد داد.

معرفی ماشین‌های فکر پیوسته (CTM) از سوی ساکانا، گامی مهم در جهت توسعه مدل‌های هوش مصنوعی با الهام از مغز انسان است و این معماری نه تنها به مدل‌ها اجازه می‌دهد هوشمندانه‌تر عمل کنند بلکه شفافیت و انعطاف‌پذیری بیشتری را نیز فراهم می‌کند؛ اگرچه هنوز در ابتدای راه است اما می‌تواند آغازگر تحولی عمیق در نحوه طراحی و استفاده از هوش مصنوعی در آینده باشد.

انتهای پیام/

ارسال نظر
رسپینا
گوشتیران
قالیشویی ادیب