Serie Alibaba Qwen3 AI-El último avance de AI de código abierto de China

Serie Alibaba Qwen3 AI-El último avance de AI de código abierto de China

QWEN3 es el debut de Alibaba en los llamados «modelos de razonamiento híbrido», que dice combina las capacidades tradicionales de LLM con el «razonamiento avanzado y dinámico».

Imágenes SOPA | LighTrocket | Getty Images

Alibaba lanzó la próxima generación de sus modelos de idiomas grandes de código abierto, QWEN3, el martes, y los expertos lo llaman otro avance en el auge espacio de inteligencia artificial de código abierto de China.

En una publicación de blog, el gigante tecnológico chino dijo que QWEN3 promete mejoras en el razonamiento, el seguimiento de la instrucción, el uso de herramientas y las tareas multilingües, rivalizando con otros modelos de primer nivel, como el R1 de Deepseek en varios puntos de referencia de la industria.

La serie LLM incluye ocho variaciones que abarcan una gama de arquitecturas y tamaños, ofreciendo a los desarrolladores flexibilidad cuando usan QWEN para construir aplicaciones de IA para dispositivos de borde como teléfonos móviles.

QWEN3 también es el debut de Alibaba en los llamados «modelos de razonamiento híbrido», que dice combina las capacidades tradicionales de LLM con el «razonamiento avanzado y dinámico».

Según Alibaba, dichos modelos pueden hacer una transición sin problemas entre un «modo de pensamiento» para tareas complejas, como la codificación y un «modo no pensativo» para respuestas más rápidas de uso general.

«En particular, el modelo QWEN3-235B-A22B MOE reduce significativamente los costos de despliegue en comparación con otros modelos de vanguardia, reforzando el compromiso de Alibaba con la IA accesible de alto rendimiento», dijo Alibaba.

Los nuevos modelos ya están disponibles gratuitamente para usuarios individuales en plataformas como abrazar Face y GitHub, así como la interfaz web de Alibaba Cloud. QWEN3 también se está utilizando para alimentar al asistente de IA de Alibaba, Quark.

Avance de la IA de China

Los analistas de IA dijeron a CNBC que el QWEN3 representa un desafío serio para las homólogos de Alibaba en China, así como a los líderes de la industria en los Estados Unidos.

En una declaración a CNBC, Wei Sun, analista principal de inteligencia artificial en la investigación de contrapunto, dijo que la serie QWEN3 es un «avance significativo, no solo para su mejor rendimiento en la clase», sino también por varias características que apuntan al «potencial de aplicación de los modelos».

Esas características incluyen el modo de pensamiento híbrido de Qwen3, su soporte multilingüe que cubre 119 idiomas y dialectos y su disponibilidad de código abierto, agregó Sun.

El software de código abierto generalmente se refiere al software en el que el código fuente está disponible gratuitamente en la web para una posible modificación y redistribución. A principios de este año, el modelo R1 de código abierto de Deepseek sacudió el mundo de la IA y rápidamente se convirtió en un catalizador para el espacio de IA de China y la adopción del modelo de código abierto.

«El lanzamiento de Alibaba de la serie QWEN 3 subraya aún más las fuertes capacidades de los laboratorios chinos para desarrollar modelos altamente competitivos, innovadores y de código abierto, a pesar de la creciente presión de los controles de exportación estadounidenses más ajustados», dijo Ray Wang, un analista con sede en Washington que se centra en la competencia económica y de tecnología de los Estados Unidos-China.

Según Alibaba, Qwen ya se ha convertido en una de las series de modelos AI de código abierto más ampliamente adoptada del mundo, atrayendo más de 300 millones de descargas en todo el mundo y más de 100,000 modelos derivados en la cara abrazada.

Wang dijo que esta adopción podría continuar con Qwen3, y agregó que sus reclamos de rendimiento pueden convertirlo en el mejor modelo de código abierto a nivel mundial, aunque aún detrás de los modelos más de vanguardia del mundo como O3 y O4-Mini de OpenAi.

Competidores chinos como Baidu también se han apresurado a lanzar nuevos modelos de IA después de la aparición de Deepseek, incluyendo hacer planes para cambiar hacia un modelo de negocio más abierto.

Mientras tanto, Reuters informó en febrero que Deepseek está acelerando el lanzamiento de su sucesor a su R1, citando fuentes anónimas.

«En el contexto más amplio de la raza US-China AI, la brecha entre los laboratorios estadounidenses y chinos se ha reducido, probablemente hasta unos meses, y algunos podrían discutir, incluso solo semanas», dijo Wang.

«Con el último lanzamiento de Qwen 3 y el próximo lanzamiento de Deepseek’s R2, es poco probable que esta brecha se amplíe, e incluso puede continuar reduciéndose».

Check Also

Tesla Doxxing ataca erróneamente a los no propietarios en todo Estados Unidos

Tesla Doxxing ataca erróneamente a los no propietarios en todo Estados Unidos

El reciente aumento de los ataques contra los propietarios de Tesla, los concesionarios y las …