Hoy se ha anunciado la presentación de Pixtral 12B, un modelo de lenguaje visual altamente avanzado desarrollado por
Mistral AI. Este modelo ya está accesible para los clientes a través de
Amazon SageMaker JumpStart, ofreciendo la capacidad de abordar tanto tareas de texto como multimodales. Pixtral 12B promete un rendimiento excepcional en una variedad de aplicaciones del mundo real, el razonamiento multimodal y el seguimiento de instrucciones.
El modelo se destaca por su capacidad de procesar imágenes en su resolución y relación de aspecto naturales, todo ello sin sacrificar el rendimiento en tareas textuales. La arquitectura de Pixtral 12B consta de un codificador de visión con 400 millones de parámetros y un decodificador transformador multimodal con 12 mil millones de parámetros, lo que le permite realizar inferencias rápidas y precisas.
disponible bajo la licencia comercial Apache 2,0, Pixtral 12B ofrece a empresas y startups una opción poderosa para desarrollar aplicaciones multimodales complejas. Su integración con SageMaker JumpStart facilita el acceso y despliegue de modelos de aprendizaje automático en un entorno seguro, permitiendo personalizaciones profundas para adaptarse a casos de uso específicos.