SÁB 12

ABR 2025

Actualidad

Tecnología

Ocio

Deportes

Negocios

Ranking de blogs

Actualizado: hace 3 hora/s

Relaciones

1 a 11 de 1 entradas relacionadas en blodico

No sabemos qué miden los benchmarks de IA. Así que hemos hablado con el español que ha creado uno de los más complicados

por Weblogs SL

Xataka

12.04.2025 09:45

Gemini 2,5 Pro es el mejor modelo de IA de la historia. El más inteligente. Al menos, ahora mismo. No lo digo yo, lo dice la clasificación de Chatbot Arena, una plataforma en la que se ejecutan diversas pruebas o benchmarks para tratar de medir la capacidad global de los modernos modelos de IA.

Según esas pruebas, en estos momentos Gemini 2,5 Pro Experimental, lanzado el pasado 25 de marzo, tiene una puntuación de 1,440 puntos, bastante por encima de GPT-4o (1,406), Grok 3 (1,404), GPT-4,5 (1,398) y desde luego que un DeepSeek R1 que a pesar de su fama está en séptimo lugar con una puntuación de 1,359 puntos.

En ranking actual de Chatbot Arena coloca a Gemini Pro 2,5 Experimental como el modelo de IA más capaz en estos momentos. Eso (probablemente) no dure mucho.

La propia Google presumía de la capacidad de Gemini 2,5 Pro Experimental en la noticia oficial. Como suele ocurrir en estas noticias, las empresas muestran una tabla en las que comparan su rendimiento con el de otros modelos equiparables en distintas pruebas.

En casi todas ellas Google aplastaba a sus rivales en pruebas muy conocidas en este segmento. Está por ejemplo el Humanity's Last Exam (conocimientos generales y razonamiento), LiveCodeBench v5 y SWE-bench verified (programación) o MMMU (razonamiento visual).

Fuente | Más entradas de este blog

Pro Experimental, Chatbot Arena, Gemini

¿Qué opinas?

	Actualidad
	Tecnología
	Ocio
	Deportes
	Negocios

Blodico brinda un panorama global de los temas que son noticia ahora en los blogs más influyentes de la blogosfera hispana. Además, Blodico organiza a diario estos blogs en un Ranking.

parezca jamas inofensivo White Lotus White The White Lotus The Last ofUs The Guardian Seguir Secretaría Nintendo Neil Druckmann Naughty Dog Microsoft Word Microsoft Office Lotus LibreOffice Inteligencia Artificial Hoy No Circula Famicom Doctor Who Disney Disk Writer Craig Mazin CDMX Boarding Black Mirror

ABRIL 2025

	EEUU finalmente ha oficializado el arancel del 104% a China. Acto seguido Apple ha dejado de ser la ...
	por Weblogs SL Xataka

	Vamos a tener adaptaciones de videojuegos como "Una película de Minecraft" a patadas. Todas ellas va...
	por Weblogs SL Vaya Tele!

	Mientras todo el mundo miraba a los aranceles, EEUU hacía historia con su primera ley 'cripto'
	por Weblogs SL Genbeta

	Samsung lanza Ballie, un adorable robot impulsado por Gemini que vas a querer en tu casa
	por Hipertextual TVlia

	Ni correr ni spinning: tres formas diferentes de hacer cardio de forma entretenida para perder gras...
	por Weblogs SL Vitónica

	Nintendo perdería dinero con la venta de cada Switch 2 por culpa de Trump
	por Hipertextual ExtraCine

	La UE se preocupó tanto de regular la IA que se había olvidado de desarrollarla. Ahora promete medid...
	por Weblogs SL Genbeta

	Llevaba años cansado de pulsar botones para subir o bajar el volumen. He descubierto que iOS 18 esco...
	por Weblogs SL Applesfera

	Cuánto costaban la NES y sus juegos cuando llegaron a España hace casi 40 años
	por Weblogs SL Vida Extra

	La Nueva Bambu Lab H2D: Innovación en 3D Ahora Disponible en 3Dworld
	por Alan, Jsrelinque, Cifra, Carlos Mantero IncubaWeb

	EEUU finalmente ha oficializado el arancel del 104% a China. Acto seguido Apple ha dejado de ser la ...
	por Weblogs SL Xataka

	ChatGPT rompe récord gracias a las imágenes de Studio Ghibli
	por Hipertextual Apple Weblog

	Vamos a tener adaptaciones de videojuegos como "Una película de Minecraft" a patadas. Todas ellas va...
	por Weblogs SL Vaya Tele!

	Mientras todo el mundo miraba a los aranceles, EEUU hacía historia con su primera ley 'cripto'
	por Weblogs SL Genbeta

	Samsung lanza Ballie, un adorable robot impulsado por Gemini que vas a querer en tu casa
	por Hipertextual TVlia

	'Adolescencia' rompe récords y ya es una de las series de Netflix más vistas de la historia. Pero su...
	por Weblogs SL Blog de Cine

	Ni correr ni spinning: tres formas diferentes de hacer cardio de forma entretenida para perder gras...
	por Weblogs SL Vitónica

	Sony presenta sus nuevos Bravia 8 II, Bravia 5 y Bravia 3 de 2025
	por Eduardo Arcos ALT1040

	Claustrofobia y lucha de clases en un tren sin fin en esta apasionante y distópica film de ciencia f...
	por Weblogs SL Vida Extra

	Nintendo perdería dinero con la venta de cada Switch 2 por culpa de Trump
	por Hipertextual ExtraCine