مدلهای هوش مصنوعی T۵Gemma با معماری رمزگذار-رمزگشا عرضه شد

گوگل نسل تازهای از مدلهای زبانی خود را با نام T۵Gemma معرفی نمود. این مدلها بر پایه معماری رمزگذار-رمزگشا طراحی و عرضه شدهاند؛ معماریای متشکل از دو بخش، که به ترتیب ابتدا داده ورودی را تحلیل کرده و سپس پاسخ متناسب را تولید میکند. این طراحی تفاوت عمدهای با ساختار مدلهایی مانند سری GPT دارد که عموماً تنها بخش رمزگشایی را شامل میشوند.
در توسعه T۵Gemma، گوگل با بهرهگیری از تکنیک انطباقپذیری، مدلهایی که صرفاً دارای قابلیت رمزگشایی بودند را با افزودن بخش رمزگذار، به مدلهایی با توانایی پردازش دقیقتر تبدیل کرده است. در این شیوه، ابتدا کل جمله ورودی توسط رمزگذار تحلیل میشود و پس از آن رمزگشا کار تولید پاسخ را انجام میدهد. این فرآیند باعث افزایش دقت مدل در درک محتوا و تولید خروجی متناسب میشود.
به گزارش وبلاگ گوگل توسعهدهندگان، مدلهای T۵Gemma در اندازههای پارامتری مختلف ارائه شدهاند، به طوری که ترکیبی از مدلهایی با ۲ میلیارد و ۹ میلیارد پارامتر عرضه گردیده است. این تنوع به توسعهدهندگان فرصت میدهد تا با توجه به نیاز خود، از مدل مناسب بهره ببرند.
علاقهمندان و توسعهدهندگان میتوانند مدلهای جدید T۵Gemma را از طریق پلتفرم HuggingFace دانلود و در پروژههای خود مورد استفاده قرار دهند. گوگل هدف از این اقدام را ایجاد امکان بالاتر رفتن دقت و بهبود درک رایانهای زبان در کاربردهای مختلف عنوان کرده است.
انتهای پیام/