El entrenamiento de modelos avanzados de inteligencia artificial, como el nuevo Llama 3 con 70 mil millones de parámetros, plantea desafíos significativos para la computación moderna. Este tipo de procesos requiere un sistema distribuido que puede integrar cientos o incluso miles de instancias aceleradas, funcionando durante semanas o meses para completar un único trabajo.