شرکت متا از عرضه Llama 3.1، جدیدترین نسخه از مدل زبانی بزرگ خود خبر داد که بنا به ادعای متا با OpenAI و Anthropic رقابت میکند. OpenAI و Anthropic نیز کمی قبل نسخههای جدیدی از مدلهای هوش مصنوعی خود را منتشر کردهاند، که این موضوع نشان میدهد رقابت جنون آمیز هوش مصنوعیها در سیلیکون ولی به این زودیها از تب و تاب نمیافتد.
متا گفت که مدل جدید به نام Llama 3.1 405B اولین مدل در دسترس عموم است که میتواند در دانش عمومی، مهارتهای ریاضی و ترجمه در چندین زبان با سایر رقبا رقابت کند. این مدل روی بیش از 16000 پردازنده گرافیکی NVIDIA H100 آموزش دیده است (که در حال حاضر سریعترین تراشهای موجود هستند که هر کدام حدود 25000 دلار قیمت دارند) و طبق ادعای متا میتواند رقبای خود را در بیش از 150 معیار شکست دهد.
«405B» مخفف 405 میلیارد پارامتر است، که متغیرهای داخلی هستند که یک مدل هوش مصنوعی برای استدلال و تصمیم گیری از آنها استفاده میکند. هر چه تعداد پارامترهای یک مدل هوش مصنوعی بیشتر باشد، از نظر ما باهوشتر است. به عنوان نمونه و جهت مقایسه، مدل GPT-4 OpenAI به طور تقریبی 1.5 تریلیون پارامتر دارد، اگرچه این شرکت تاکنون این عدد را به طور رسمی فاش نکرده است.
توسعه دهندگان میتوانند Llama 3.1 را از وب سایت رسمی آن دانلود کنند، و کاربران عادی نیز میتوانند از طریق Meta AI در واتساپ یا در meta.ai با آن کار کنند. پست وبلاگ متا بیان می کند:
قابلیتهای استدلال بهبود یافته Llama 405B این امکان را برای Meta AI فراهم میکند تا سوالات پیچیدهتر شما، به ویژه در مورد موضوعات ریاضی و کد نویسی را درک و پاسخ دهد.شما می توانید با توضیحات و بازخورد گام به گام روی تکالیف ریاضی خود کمک بگیرید یا کدها را اشکالزدایی و بهینهسازی کنید.
برخلاف OpenAI، گوگل، مایکروسافت و Anthropic که مدلهای هوش مصنوعی خود را اختصاصی نگه میدارند، مدلهای هوش مصنوعی متا متنباز هستند، به این معنی که هر کسی میتواند بدون به اشتراک گذاشتن دادههای شخصی با متا، آنها را به صورت رایگان تغییر و استفاده کند. مارک زاکربرگ، مدیرعامل متا میگوید که رویکرد متن باز، توسعه هوش مصنوعی و دسترسی گستردهتر به مزایای این فناوری را تضمین میکند، از تمرکز قدرت در بین چند شرکت بزرگ جلوگیری میکند و استقرار ایمنتر هوش مصنوعی را در سراسر جامعه امکان پذیر میکند.
منبع: engadget.com
دیدگاه خود را بنویسید