lunes, 9 de septiembre de 2024

Alibaba Cloud lanzó Qwen2-VL, su nuevo modelo de Inteligencia Artificial (IA)

 Alibaba Cloud lanzó Qwen2-VL, su nuevo modelo de Inteligencia Artificial (IA), que promete superar a modelos como GPT-4o de OpenAI y Claude 3.5 Sonnet de Anthropic. 

El modelo de código abierto, especialmente la versión Qwen2-VL-72B, ha demostrado un rendimiento superior en tareas complejas, como la resolución de problemas matemáticos y la comprensión de documentos.

Qwen2-VL mejora notablemente en la comprensión de imágenes y videos, siendo capaz de analizar videos de más de 20 minutos para facilitar tareas como la respuesta a preguntas, diálogos y la creación de contenido. Además, sus avanzadas capacidades de toma de decisiones y razonamiento lo hacen ideal para su integración en dispositivos móviles y robots.

Entre las mejoras más destacadas, se encuentra un reconocimiento de objetos mejorado, que le permite comprender relaciones complejas entre múltiples elementos en una escena, así como un mayor reconocimiento de texto escritos a mano y en varios idiomas.

Además, el modelo cuenta con avanzadas capacidades de razonamiento visual, interpretando gráficos y resolviendo problemas matemáticos a partir de ellos. Qwen2-VL también funciona como un agente visual, capaz de interactuar con herramientas externas para la recuperación de datos en tiempo real, ampliando así sus capacidades para percibir y responder a su entorno.


Qwen2-VL está disponible en tres variantes: 

Qwen2-VL-72B (72 mil millones de parámetros), 

Qwen2-VL-7B y 

Qwen2-VL-2B. 

Las versiones 7B y 2B, diseñadas para un uso comercial más accesible, ya están disponibles en plataformas como Hugging Face y ModelScope. Sin embargo, la variante 72B, la más potente, se lanzará más adelante a través de una licencia separada y una API de Alibaba.


No hay comentarios:

Publicar un comentario