
Meta ha anunciado Llama 4, su nueva colección de modelos de IA que ahora alimentan al asistente de Meta AI en la web y en WhatsApp, Messenger e Instagram. Los dos nuevos modelos, también disponibles para descargar desde Meta o Hugging Face, son Llama 4 Scout, un pequeño modelo capaz de «encajar en una sola GPU NVIDIA H100», y Llama 4 Maverick, que es más similar a GPT-4O y Gemini 2.0 Flash. Meta dice que todavía está en el proceso de entrenamiento de Llama 4 Behemoth, que Meta CEO Mark Zuckerberg dice que es «el modelo base de mayor rendimiento del mundo».
Según Meta, Llama 4 Scout tiene una ventana de contexto de 10 millones de token, la memoria de trabajo de un modelo de IA, y supera los modelos Gemma 3 y Gemini 2.0 Flash-Lite de Google, así como el Mistral 3.1 de código abierto «,» a través de una amplia gama de puntos de referencia ampliamente informados «, mientras que todavía» se ajustan en una sola GPU de NVIDIA H100 «. Meta hace afirmaciones similares sobre el rendimiento de su modelo Maverick más grande versus GPT-4O de OpenAI y Gemini 2.0 Flash de Google, y dice que sus resultados son comparables a Deepseek-V3 en tareas de codificación y razonamiento utilizando «menos de la mitad de los parámetros activos».
Mientras tanto, Llama 4 Behemoth tiene 288 mil millones de parámetros activos con 2 billones de parámetros en total. Si bien aún no se ha lanzado, Meta dice que Behemoth puede superar a sus competidores (en este caso GPT-4.5 y Claude Sonnet 3.7) «en varios puntos de referencia STEM».
Para Llama 4, Meta dice que cambió a una arquitectura de «mezcla de expertos» (MOE), un enfoque que conserva los recursos mediante el uso solo de las partes de un modelo que se necesitan para una tarea determinada. La compañía planea discutir planes futuros para modelos y productos de IA en su conferencia de Llamacon, que tendrá lugar el 29 de abril.
Al igual que con sus modelos anteriores, Meta llama a la colección LLAMA 4 «Source Open-Source», aunque Llama ha sido criticado por sus restricciones de licencia. Por ejemplo, la licencia LLAMA 4 requiere que las entidades comerciales con más de 700 millones de usuarios activos mensuales soliciten permiso de Meta antes de usar sus modelos, que la iniciativa de código abierto escribió en 2023 lo saca «de la categoría de ‘código abierto'».