Groq apuesta 650 millones a que el dinero de la IA está en ejecutar, no en entrenar

🕒 Publicado en Zendoric: 25 de junio de 2026 · 09:00
La empresa del chip LPU cierra una ronda de 650 millones de dólares con un foco quirúrgico: ser la nube de inferencia líder del mundo. Y un detalle cambia la lectura de todo: NVIDIA ha licenciado su tecnología en lugar de replicarla.
En la economía de la inteligencia artificial se ha hablado durante años casi exclusivamente del entrenamiento: los modelos gigantes, los clústeres descomunales, las cifras de cómputo récord. Groq acaba de poner 650 millones de dólares —ronda liderada por los fondos Disruptive e Infinitum— detrás de la tesis contraria: que el grueso del valor a largo plazo no está en construir el modelo, sino en ejecutarlo millones de veces al día. Es una apuesta de especialización radical, y tiene la virtud de ser fácil de enunciar y endiabladamente difícil de ejecutar.
Los números que la propia compañía comparte dan cuerpo a esa ambición: 13 centros de datos operativos en cuatro regiones del mundo, más de cinco millones de desarrolladores en GroqCloud y billones de tokens procesados cada semana. Detrás está una decisión tomada en 2016 que entonces parecía contracorriente: diseñar desde cero un chip propio, la LPU (Language Processing Unit), optimizado para inferencia en lugar de adaptar GPU pensadas para otra cosa. Que esa apuesta haya tardado años en alcanzar escala operativa no es un defecto, sino el patrón habitual de las jugadas de hardware verdaderamente diferenciales.
El punto de inflexión merece leerse con atención y sin sobreinterpretar. En diciembre de 2025 Groq firmó un acuerdo de licencia no exclusivo con NVIDIA, y en el GTC de 2026 el gigante de los chips presentó su plataforma LPX incorporando tecnología de inferencia de Groq. Un movimiento así podría haberse leído como rendición; el comunicado lo presenta justo al revés, y la interpretación tiene fundamento. Que el líder absoluto del mercado de aceleradores opte por licenciar una arquitectura en lugar de copiarla internamente es, normalmente, la señal de mercado más elocuente posible sobre el valor de esa tecnología. Conviene recordar, eso sí, que es un acuerdo no exclusivo: Groq gana validación y alcance, pero no blindaje frente a la competencia.
La reestructuración del equipo directivo refuerza la hipótesis de una ofensiva hacia el segmento enterprise. Junto a líderes internos como el CEO Adam Winter y el CFO Matt Eng, llegan perfiles muy concretos: Alan Rice como COO, con experiencia en xAI, Meta Datacenters y, antes, en operaciones de submarinos nucleares de la Marina estadounidense; y a partir de julio, Sinclair Schuller (fundador de Apprenda y Nuvalence) como CTO y Rakesh Malhotra, una década en cloud de Microsoft, como CPO. La combinación no es decorativa: gestionar una nube de inferencia que compite en disponibilidad, latencia y coste por token se parece mucho más a operar infraestructura crítica que a entrenar un modelo, y los fichajes apuntan exactamente ahí.
El plan industrial es ambicioso pero deliberadamente acotado: escalar a 200 megavatios antes de finales de 2027, equipando los centros ya operativos —incluido el nuevo sistema LPX— en lugar de levantar infraestructura desde cero. Esa elección reduce el time-to-market y el riesgo de ejecución, una disciplina que se agradece en un sector propenso a los anuncios faraónicos.
La tesis de fondo la resume John Yetimoglu, de Infinitum: la inferencia será el mayor mercado de infraestructura tecnológica, y podría exigir entre 15 y 20 veces más cómputo que el entrenamiento. La cifra no se atribuye en el texto a una fuente externa concreta y conviene tomarla como estimación de parte, no como dato cerrado. Pero la dirección es sólida: a medida que la IA pasa del laboratorio al uso cotidiano, el centro de gravedad económico se desplaza hacia quien ejecute más barato y más rápido. Groq ha decidido jugárselo todo a esa carta.