En estos últimos días, tanto
OpenAI (inmerso en su campaña de 12 días consecutivos de anuncios navideños) como
Google han ofrecido novedades relativas a sus más importantes IAs,
ChatGPT (y Sora), por un lado, y
Gemini, por otro. Mientras que la compañía liderada por
Sam Altman ostenta el liderato en la carrera por la IA,
Google está obligado a ser más ambicioso y superar el listón impuesto por su rival.
Y todo indica que el asalto de esta semana se lo lleva
Google, que, con la presentación de
Gemini 2,0 Flash, logra marcar un hito en la evolución de la IA multimodal (combinando texto, imágenes, vídeo y audio en tiempo real) y redefinir cómo interactuamos con la tecnología.
La presentación de
Gemini 2,0 Flash representa un cambio de paradigma en la IA. Ahora, los clientes pueden interactuar en tiempo real con vídeos capturados desde sus teléfonos móviles, algo que antes sólo habíamos podido ver en demostraciones. A través de
Google AI Studio, cualquiera puede probar esta tecnología, que promete aplicaciones revolucionarias en educación, creación de contenido y más.
Empecemos respondiendo por el final: su sistema de análisis de vídeo en tiempo real es gratis, está disponible en escritorio y se puede usar en la UE... mientras que su función rival para
ChatGPT no hace ninguna de esas cosas.