Gemini 2,5 Pro es el mejor modelo de IA de la historia. El más inteligente. Al menos, ahora mismo. No lo digo yo, lo dice la clasificación de
Chatbot Arena, una plataforma en la que se ejecutan diversas pruebas o benchmarks para tratar de medir la capacidad global de los modernos modelos de IA.
Según esas pruebas, en estos momentos
Gemini 2,5
Pro Experimental, lanzado el pasado 25 de marzo, tiene una puntuación de 1,440 puntos, bastante por encima de GPT-4o (1,406), Grok 3 (1,404), GPT-4,5 (1,398) y desde luego que un DeepSeek R1 que a pesar de su fama está en séptimo lugar con una puntuación de 1,359 puntos.
En ranking actual de
Chatbot Arena coloca a
Gemini Pro 2,5 Experimental como el modelo de IA más capaz en estos momentos. Eso (probablemente) no dure mucho.
La propia Google presumía de la capacidad de
Gemini 2,5
Pro Experimental en la noticia oficial. Como suele ocurrir en estas noticias, las empresas muestran una tabla en las que comparan su rendimiento con el de otros modelos equiparables en distintas pruebas.
En casi todas ellas Google aplastaba a sus rivales en pruebas muy conocidas en este segmento. Está por ejemplo el Humanity's Last Exam (conocimientos generales y razonamiento), LiveCodeBench v5 y SWE-bench verified (programación) o MMMU (razonamiento visual).