مدل‌های هوش مصنوعی T۵Gemma با معماری رمزگذار-رمزگشا عرضه شد

گوگل با انتشار مدل‌های زبانی جدید تحت عنوان T۵Gemma، امکان استفاده از معماری رمزگذار-رمزگشا را برای توسعه‌دهندگان فراهم کرده است؛ این مدل‌ها با تغییر رویکرد نسبت به نسل‌های قبلی و ارائه قابلیت‌های تازه، در سکو HuggingFace برای استفاده در دسترس قرار گرفته‌اند.

نویسنده : اشکان حاسبی

کد خبر : 984120

اشتراک گذاری

گوگل نسل تازه‌ای از مدل‌های زبانی خود را با نام T۵Gemma معرفی نمود. این مدل‌ها بر پایه معماری رمزگذار-رمزگشا طراحی و عرضه شده‌اند؛ معماری‌ای متشکل از دو بخش، که به ترتیب ابتدا داده ورودی را تحلیل کرده و سپس پاسخ متناسب را تولید می‌کند. این طراحی تفاوت عمده‌ای با ساختار مدل‌هایی مانند سری GPT دارد که عموماً تنها بخش رمزگشایی را شامل می‌شوند.

در توسعه T۵Gemma، گوگل با بهره‌گیری از تکنیک انطباق‌پذیری، مدل‌هایی که صرفاً دارای قابلیت رمزگشایی بودند را با افزودن بخش رمزگذار، به مدل‌هایی با توانایی پردازش دقیق‌تر تبدیل کرده است. در این شیوه، ابتدا کل جمله ورودی توسط رمزگذار تحلیل می‌شود و پس از آن رمزگشا کار تولید پاسخ را انجام می‌دهد. این فرآیند باعث افزایش دقت مدل در درک محتوا و تولید خروجی متناسب می‌شود.

به گزارش وبلاگ گوگل توسعه‌دهندگان، مدل‌های T۵Gemma در اندازه‌های پارامتری مختلف ارائه شده‌اند، به طوری که ترکیبی از مدل‌هایی با ۲ میلیارد و ۹ میلیارد پارامتر عرضه گردیده است. این تنوع به توسعه‌دهندگان فرصت می‌دهد تا با توجه به نیاز خود، از مدل مناسب بهره ببرند.

علاقه‌مندان و توسعه‌دهندگان می‌توانند مدل‌های جدید T۵Gemma را از طریق پلتفرم HuggingFace دانلود و در پروژه‌های خود مورد استفاده قرار دهند. گوگل هدف از این اقدام را ایجاد امکان بالاتر رفتن دقت و بهبود درک رایانه‌ای زبان در کاربرد‌های مختلف عنوان کرده است.

انتهای پیام/