Meta представила Llama 4 — нову серію флагманських моделей штучного інтелекту

Компанія Meta випустила нову колекцію моделей штучного інтелекту під назвою Llama 4, яка включає три основні моделі: Llama 4 Scout, Llama 4 Maverick та Llama 4 Behemoth. Ці моделі були навчені на великих обсягах неструктурованих текстових, зображувальних та відеоданих для забезпечення широкого розуміння візуальної інформації.
Llama 4 Scout — компактна модель, оптимізована для роботи на одному графічному процесорі Nvidia H100, з контекстним вікном у 10 мільйонів токенів. Вона перевершує кількох конкурентів, зокрема Google Gemma 3 та Mistral 3.1, за різними показниками. Llama 4 Maverick — більш потужна модель, порівнянна за продуктивністю з OpenAI GPT-4o та DeepSeek-V3 у завданнях з кодування та логічного мислення, використовуючи при цьому менше активних параметрів. Llama 4 Behemoth, яка наразі перебуває на стадії розробки, матиме 288 мільярдів активних параметрів і загалом 2 трильйони параметрів, що, за твердженням Meta, перевершує моделі, такі як GPT-4.5 та Claude Sonnet 3.7, у тестах науково-технічного спрямування.
Усі моделі серії Llama 4 використовують архітектуру “міксу експертів” (MoE), яка підвищує ефективність обробки даних, розподіляючи завдання між спеціалізованими підмоделями. Meta також інтегрувала ці моделі у свого AI-асистента, доступного на платформах WhatsApp, Messenger та Instagram. Однак ліцензія на використання Llama 4 містить обмеження: компанії з більш ніж 700 мільйонами активних користувачів мають отримати спеціальний дозвіл від Meta, що викликало критику з боку Open Source Initiative.
Цей випуск підкреслює прагнення Meta зміцнити свої позиції у сфері штучного інтелекту, пропонуючи потужні та гнучкі моделі для різноманітних застосувань.