IA soberana: por qué casi ningún país quiere ya "su ChatGPT" (y casi todos eligen el código abierto)

🔬 Análisis en profundidadInvestigación con 8 fuentes · ~7 min de lectura · nuestra opinión · 2 de julio de 2026 · 14:23

🎧 Escucha el análisis

Portugal estrenó ayer Amália, su primer gran modelo para portugués europeo, totalmente abierto y construido sobre EuroLLM. La pregunta de moda —¿debe cada país tener su LLM nacional?— está mal planteada. La buena no es "sí o no", sino "¿de qué capa de la pila quieres ser dueño, y para qué?". Y ahí el open source ha dejado de ser una opción ideológica para convertirse en la única estrategia racional para casi todo el mundo que no se llame Estados Unidos o China.

🎬 Nuestro Short

El 1 de julio de 2026, un consorcio de universidades portuguesas (NOVA de Lisboa, Instituto Superior Técnico, Coímbra, Oporto y Minho, con la Fundação para a Ciência e a Tecnologia) presentó Amália, el primer gran modelo de lenguaje pensado específicamente para el portugués europeo. Es abierto de arriba abajo —modelo, datos y código—, multimodal, está construido sobre el europeo EuroLLM-9B y no aspira a ser un chatbot de consumo, sino una plataforma sobre la que administraciones, empresas y grupos de investigación levanten sus propias aplicaciones. El nombre homenajea a Amália Rodrigues, la voz del fado. Con 7 millones de euros comprometidos hasta 2027, no es una apuesta faraónica: es, deliberadamente, una apuesta modesta y bien dirigida.

NUESTRA TESIS: la pregunta que ha resonado con la audiencia —"¿debe cada país tener su propio LLM?"— está mal formulada, y por eso genera respuestas caricaturescas (el orgullo patrio contra el despilfarro). La pregunta útil es otra: ¿de qué capa de la pila de IA conviene ser soberano, y a qué coste? Soberanía no es tener "tu ChatGPT". Es controlar lo que de verdad importa: los datos de entrenamiento, los pesos del modelo, la infraestructura que lo ejecuta y las reglas con las que responde. Y cuando se desglosa así, la respuesta de casi todos los países medianos converge: no hace falta entrenar un modelo frontera desde cero; hace falta poseer y adaptar uno abierto en tu lengua, tus valores y tu marco legal. Por eso Amália, EuroLLM, el suizo Apertus y —tras un arranque doloroso— el español ALIA apuntan todos en la misma dirección: código abierto.

El contraste entre Amália y ALIA es la mejor lección de la temporada. España presentó en enero de 2025 la familia ALIA, con su modelo estrella ALIA-40B entrenado DESDE CERO con 9,2 billones de tokens y soporte para 35 lenguas, incluidas las cooficiales, bajo licencia Apache 2.0 y coordinado por el Barcelona Supercomputing Center en MareNostrum 5. La ambición era encomiable; la ejecución, según la prensa especializada, fue errática. Xataka y Genbeta documentaron que el modelo se presentó sin terminar su entrenamiento inicial, que en pruebas rendía a la altura de modelos abiertos de 2023 (comparable a Llama-2-34B) y que, con 10,2 millones de euros de gasto público, registraba apenas 174 descargas al mes a comienzos de 2026. Sus propios creadores matizaron después: "el objetivo no es competir con ChatGPT", y meses más tarde, ya completado el entrenamiento, ALIA reivindicaba ser el mejor modelo en euskera y el segundo en catalán y gallego. Puede ser cierto. Pero la secuencia —anuncio político primero, modelo terminado después— es exactamente el error que hay que evitar.

NUESTRA LECTURA: ALIA y Amália no fracasan ni triunfan por ser "soberanos", sino por el método. Entrenar un modelo frontera desde cero es carísimo, lento y te expone a comparaciones que casi siempre vas a perder frente a Anthropic, OpenAI o los grandes abiertos chinos. Construir sobre una base abierta compartida —como hacen Amália sobre EuroLLM y Suiza con su propio pipeline— es más barato, más rápido y concentra el esfuerzo donde un Estado sí tiene ventaja comparativa: su lengua, sus corpus, su regulación. Suiza lo ha llevado al extremo con Apertus (EPFL, ETH y el CSCS), publicado en septiembre de 2025 bajo Apache 2.0 en versiones de 8.000 y 70.000 millones de parámetros, entrenado en más de 1.000 lenguas y, sobre todo, con TODO abierto: pesos, recetas de entrenamiento e incluso los scripts para reconstruir los datos, respetando el opt-out de los titulares. Ese es el verdadero foso defensivo europeo: no la potencia bruta, sino la transparencia y el cumplimiento como diseño de fábrica.

El mapa global confirma que el open source ganó el debate por goleada. La Declaración de Bangkok, firmada por más de 100 países en febrero de 2026, consagra la soberanía de la IA como objetivo compartido; McKinsey proyecta un mercado de IA soberana de 600.000 millones de dólares en 2030. Y en él conviven modelos muy distintos: Emiratos con Falcon (TII), que presume de liderar el ranking de LLM árabes abiertos; Arabia Saudí con HUMAIN y su ALLaM, respaldados por decenas de miles de GPU; India con BharatGen, anclado en el IIT Bombay y ya con 22 lenguas indias; Singapur con SEA-LION, Japón con LLM-jp, Ucrania con su modelo nacional en beta y Malasia con ILMU. Casi todos, abiertos. Frente a ellos, dos excepciones instructivas: China, que ha convertido el open-weight en arma geopolítica (DeepSeek, Qwen, GLM, Kimi), y Francia, que apuesta por un campeón PRIVADO, Mistral. La abrumadora mayoría, sin embargo, ha entendido que el peso abierto es el gran igualador: soberanía sin tener que ganar la carrera de capital que solo pueden correr un puñado de gigantes.

Ahora, el corto plazo, sin edulcorar. Hay tres riesgos reales. El primero es el "sovereign washing": envolver en bandera un proyecto que sigue dependiendo de GPU de Nvidia, de arquitecturas ajenas y de datos scrapeados sin control; la geografía del servidor no es soberanía si el resto de la pila es prestada. El segundo es el despilfarro por vanidad política: el caso ALIA muestra lo que ocurre cuando el calendario lo marca un acto de gobierno y no el estado real del entrenamiento, y cuando el éxito se mide en titulares en lugar de en adopción (174 descargas al mes es un dato demoledor). El tercero es la fragmentación: cien modelos nacionales mediocres y desconectados sirven peor al ciudadano que unos pocos modelos abiertos compartidos y bien mantenidos —de ahí que la vía europea colaborativa (EuroLLM alimentando a Amália) tenga más futuro que cien esfuerzos aislados.

Y el largo plazo, que es donde ponemos nuestro optimismo —matizado—. Un modelo abierto en tu lengua no es un juguete nacionalista: es infraestructura pública digital, del mismo orden que las carreteras o la red eléctrica. Preserva lenguas minorizadas que los modelos angloparlantes tratan como ruido estadístico (que ALIA rinda mejor en euskera o Apertus entienda el romanche no es anecdótico: es cultura que sobrevive a la homogeneización algorítmica). Da a un hospital, un juzgado o una escuela la capacidad de desplegar IA sin enviar datos sensibles a un servidor extranjero ni depender de un precio que fija otro. Y encaja con la dirección de fondo que defendemos: la frontera abierta sube deprisa y democratiza el acceso, y esa democratización es precisamente el camino hacia la abundancia —hacia un mundo donde erradicar enfermedades, alargar la vida y liberar tiempo humano no sean privilegio de quien controla un modelo cerrado, sino capacidad instalada en cada país.

IMPLICACIONES. Para los gobiernos: dejen de preguntar "¿tenemos nuestro LLM?" y empiecen a preguntar "¿de qué capa somos dueños y para qué caso de uso?". Construir sobre bases abiertas compartidas, invertir en datos y evaluación en la lengua propia, y medir el éxito en adopción y servicios públicos desplegados, no en presentaciones. Para Europa: su ventaja no será la potencia bruta —esa carrera la lideran Estados Unidos y China—, sino la confianza: modelos auditables, cumplimiento por diseño y soberanía real sobre datos y pesos. Y para el ciudadano: la buena noticia de fondo es que la soberanía de la IA, bien entendida, no va de banderas, sino de que la tecnología que ya está cambiando el mundo hable tu idioma, respete tus reglas y no pueda apagártela nadie desde fuera. Amália, con su nombre de cantante de fado y su código abierto, lo entiende mejor que muchos proyectos con diez veces su presupuesto.

IA soberana: por qué casi ningún país quiere ya "su ChatGPT" (y casi todos eligen el código abierto)

Fuentes y referencias