مدل Llama 4: شرکت متا نسل چهارم از مدلهای زبانی Llama را معرفی کرد
متا از نسل جدید هوش مصنوعی خود با نام Llama 4 رونمایی کرد؛ مدلی چندوجهی و پیشرفته که میتواند معادلات دنیای هوش مصنوعی را دگرگون کند. 🤖🚀
✨ اولین عضو این مجموعه، Llama 4 Scout، با بهرهگیری از ۱۷ میلیارد پارامتر فعال و معماری مبتنی بر Mixture of Experts (MoE)، عملکردی فراتر از انتظار ارائه داده است. نکته چشمگیر این مدل، امکان اجرای آن تنها بر روی یک GPU از نوع H100 است! ⚡️
💬 همچنین این مدل با داشتن پنجره کانتکست ۱۰ میلیون توکنی، یکی از طولانیترین حافظهها در بین مدلهای زبانی را داراست؛ قابلیتی که باعث بهبود چشمگیر آن در حوزههایی مانند برنامهنویسی، درک تصویر و متن، و حتی مکالمههای پیچیده و بلندمدت شده است.
🚀 مدل دوم این خانواده، Maverick، با همان حجم پارامتر اما با ۱۲۸ متخصص فعال، موفق شده در تستهای گسترده، عملکردی بهتر از GPT-4o ثبت کند. پشتوانهی این موفقیت، مدلی عظیم با نام Behemoth است؛ مدلی ۲ تریلیونی با ۲۸۸ میلیارد پارامتر فعال که به عنوان معلم در فرآیند آموزش سایر مدلها ایفای نقش کرده است.
🧠 تمامی این مدلها با بهرهگیری از مجموعهای بزرگ از دادههای متنی، تصویری و ویدیویی و با استفاده از روشهای نوآورانهای همچون MetaP و یادگیری تقویتی آنلاین، آموزش دیدهاند تا عملکردی هوشمند، امن و قابلاعتماد ارائه دهند.
📌 خانواده Llama 4 بهصورت چندوجهی بومی (natively multimodal) طراحی شدهاند؛ بهطوریکه قابلیت پردازش همزمان ورودیهای متنی و تصویری را دارا میباشند. این مدلها اکنون بهصورت Open Weight در اختیار توسعهدهندگان قرار گرفتهاند و در پلتفرمهایی مانند WhatsApp، Messenger، Instagram Direct و نسخه وب Meta AI قابل استفادهاند.
🛡 متا همچنین بر موضوع ایمنی تأکید ویژهای داشته و ابزارهایی مانند Llama Guard، Prompt Guard و سامانهی تست GOAT را برای جلوگیری از خروجیهای نامناسب و سوءاستفاده از مدلها توسعه داده است.
📚 اطلاعات بیشتر:
🔗 بلاگ رسمی: ai.meta.com/blog/llama-4
🔗 مدل: llama.com/llama4
هوشمصنوعی در پژوهش، بروزترین ارائه دهنده خدمات هوش مصنوعی در ایران
دیدگاهتان را بنویسید