Los patrones de workflow de IA: la unidad real de adopción empresarial en 2026

🕒 Publicado en Zendoric: 5 de julio de 2026 · 04:36
Este artículo forma parte de la serie "The Org Age of AI" de Turing Post, escrita por Will Schenk (cofundador de TheFocus.AI) y Ksenia Se. Es la quinta entrega de una serie que lleva cuatro artículos insistiendo en una idea incómoda: los debates sobre adopción de IA en las organizaciones se libran en el nivel…
Te enviaremos un email para confirmar tu suscripción (doble opt-in). Privacidad.
Este artículo forma parte de la serie "The Org Age of AI" de Turing Post, escrita por Will Schenk (cofundador de TheFocus.AI) y Ksenia Se. Es la quinta entrega de una serie que lleva cuatro artículos insistiendo en una idea incómoda: los debates sobre adopción de IA en las organizaciones se libran en el nivel equivocado. Se habla de modelos, de agentes, de frameworks, de "casos de uso", pero la unidad que realmente se puede señalar, inspeccionar, automatizar y mejorar es más pequeña y más concreta: el workflow (flujo de trabajo).
Los autores definen un workflow como "una secuencia repetitiva de decisiones y acciones que convierte un input en un output, con puntos a lo largo del camino donde un humano ejerce su juicio". La clave está en esos puntos de juicio: si se eliminan, lo que queda es un pipeline —un script, un cron job, fontanería—; si se mantienen, es un workflow. La pregunta interesante, dicen, no es si se puede automatizar algo, sino qué puntos de juicio puede asumir un agente, cuáles siguen necesitando a un humano, y cómo sabe el humano cuándo debe intervenir.
Un diagnóstico organizativo importante que aportan es que la mayoría de las empresas tienen decenas de workflows corriendo en cada departamento —soporte, finanzas, ingeniería, ventas— que nunca se han documentado, porque los empleados que los ejecutan absorbieron su complejidad hace años. El primer paso para adoptar IA de forma seria no es elegir una herramienta, sino descubrir estos workflows informales: es lo que llaman el "problema L0-a-L2", es decir, hacer que la organización sea legible para sí misma antes de poder mejorar nada.
A partir de la operación de unos treinta sistemas de producción reales en TheFocus.AI —pipelines de contenido, herramientas de conciliación financiera, automatización de ingeniería, plataformas de scoring de deals, monitores de API, entrega de newsletters— los autores identifican siete "primitivos" que son las acciones atómicas que un agente puede ejecutar en un solo paso, independientemente del dominio: Watch (esperar un disparador o condición: ¿ha pasado algo ya?), Validate (comprobar contra criterios conocidos: ¿es esto correcto?), Classify (asignar una categoría o ruta: ¿qué tipo de cosa es esto?), Enrich (añadir información útil: ¿qué podemos agregar para hacerlo más útil?), Generate (producir un artefacto nuevo: ¿qué debería crearse?), Execute (tomar una acción con consecuencias reales: ¿debería ocurrir esto ahora?) y Elicit (pedir a un humano que reduzca la ambigüedad: ¿qué necesitamos saber todavía?). Ninguno de estos primitivos basta por sí solo para constituir un workflow —una simple llamada de "validate" no es un workflow—, pero encadenados con lógica de ramificación y uno o dos puntos de control humano, sí lo son.
A partir de ahí, el artículo despliega ocho patrones de workflow que, según los autores, se repiten una y otra vez en sistemas de producción reales (inicialmente creían que eran cinco, pero una auditoría más profunda de su propio código, sumada a patrones operativos observados en Bloomberg, Zapier, Cursor y OpenRouter, sacó a la luz tres más):
1) Triage (clasificar → enrutar): un ítem llega, el agente decide de qué tipo es y lo envía por el camino correcto. No se produce ningún artefacto ni se ejecuta ninguna acción; el valor está en la decisión de enrutamiento. La intervención humana suele ser nula, porque un enrutamiento erróneo es barato de corregir. Como ejemplo citan las operaciones de Tezlab, donde se combinan eventos de DevOps y soporte para decidir el nivel de reacción necesario, y un sistema propio ("twitter-collator") que vigila listas de cuentas de X y clasifica cada tuit por relevancia y engagement, enrutando los de alta prioridad a una cola de notificaciones y archivando el resto.
2) Investigación y recomendación (validar + enriquecer → generar una recomendación): el agente reúne contexto de múltiples fuentes, lo analiza y produce una recomendación —no un borrador, sino un juicio respaldado por evidencia— para que un humano actúe. Ejemplos: un sistema que analiza filings de la SEC y comunicados de prensa para decidir si la salida de un ejecutivo fue un evento ordenado o la respuesta a un escándalo; y un sistema de conciliación ("qbsync") para una constructora que cruza datos de QuickBooks con presupuestos en Google Sheets, calcula curvas de gasto por partida y genera informes de varianza (por ejemplo, detectando que la demolición está un 40% por encima de presupuesto en la etapa del 20% de avance). El agente hace el trabajo de reunir y cruzar información en minutos en vez de en media hora, pero la decisión de actuar sigue siendo humana.
3) Borrador y revisión (generar artefacto → revisión humana → revisión opcional): el agente produce un artefacto completo —documento, email, informe, presentación— y lo presenta para revisión antes de que se envíe a ningún sitio. Ejemplo: un sistema para una firma de private equity con 2.000 millones bajo gestión que genera borradores de presentaciones "Go-To-Offer" a partir de notas de reuniones en Markdown, memorandos de información confidencial en PDF y exportaciones financieras de QuickBooks, produciendo un deck de dos páginas más un libro de Excel de respaldo. El responsable del deal siempre edita tono, énfasis y encuadre de riesgos, pero parte de algo que antes tomaba horas de un analista y ahora toma minutos al agente.
4) Ejecución con aprobación (proponer acción → aprobación humana → ejecutar): el agente está listo para tomar una acción con consecuencias reales —enviar un email, publicar en redes, desplegar código, cargar datos en producción— y espera el visto bueno humano. La pregunta de diseño clave es la granularidad de esa aprobación (por ítem, por lote o por parámetro). Ejemplo: un pipeline de email construido sobre la API de Buttondown que redacta newsletters a partir de fuentes Markdown; el agente prepara el borrador y lo sube como email sin enviar, y un humano revisa tono, enlaces y contenido antes de programar el envío, con una ventana clara de reversibilidad.
5) Monitorización y escalado (vigilar → validar → ramificar entre silencio si todo va bien o escalada a un humano si hay problema): el agente vigila condiciones según un horario; si todo está normal, no pasa nada; si algo se rompe o se sale de rango, el agente escala el problema con contexto suficiente para actuar. Ejemplo: un sistema ("usage-monitor") que rastrea claves de API y saldos de crédito de catorce proveedores de IA distintos (OpenAI, Anthropic, Google, Mistral y otros veintitrés) para múltiples organizaciones, comprobando cada hora la validez, el saldo y los límites de tasa, y disparando alertas a Slack, Discord o email solo cuando algo falla —por ejemplo, un fallo de autenticación de una clave de producción a las dos de la madrugada—.
6) Elicitación (preguntar → el humano responde → preguntar de nuevo… → entregar para generar o ejecutar): el agente y el humano co-construyen una especificación mediante un diálogo estructurado; el agente pregunta de una en una y se niega a actuar hasta tener suficiente entendimiento compartido. Aquí el humano no revisa un output, sino que aporta el input que hace posible un buen output. Ejemplo: un sistema para una firma de private equity que redacta Cartas de Intención (LOI) a partir de términos de trato descritos conversacionalmente por el responsable del deal; el agente no genera de inmediato, sino que primero hace preguntas aclaratorias basándose en el corpus histórico de LOIs ejecutadas de la firma —por ejemplo, señalando que las últimas cinco LOIs con earnout incluían una cláusula de aceleración por cambio de control, o que el lenguaje de no-competencia en sanidad ha sido distinto al estándar—. El valor está en las preguntas, no en la generación del documento en sí.
7) Sincronización y transformación (vigilar/disparador → validar → enriquecer → ejecutar/cargar): los datos se mueven de un sistema A a un sistema B, transformándose en el camino, sin juicio humano en el camino normal porque las reglas de transformación se conocen de antemano. Es el patrón con más probabilidad de correr desatendido durante semanas. Ejemplo: una plataforma de analítica de medios que ingiere datos de cinco proveedores distintos (audiencias en CSV, métricas de streaming en Excel, datos de reconocimiento de celebridades en archivos SPSS, seguidores sociales, puntuaciones de afinidad de audiencia), cada uno con su propio formato y calendario; el pipeline valida el archivo, renormaliza nombres de columnas, normaliza los datos (nombres de títulos, contenido en español) y cruza referencias entre fuentes (por ejemplo, emparejando el nombre de una celebridad con un ID de talento, o etiquetando eventos especiales como debates presidenciales). Tras cada carga corre una batería de pruebas de integridad, y el humano solo interviene cuando algo fallla —una columna nueva, un cambio en la convención de nombres del proveedor, una hoja con estructura inesperada—.
8) Curación y entrega programada (vigilar el reloj → clasificar y enriquecer → generar → ejecutar/entregar): según un calendario, el agente recopila material de múltiples fuentes, lo sintetiza y entrega un producto terminado a los suscriptores, sin que ningún humano dispare el proceso ni lo revise antes de la entrega. El contenido descargado se corta justo en la descripción de este último patrón, por lo que no se dispone del ejemplo completo ni de la sección final sobre cómo encadenar estos patrones en pipelines más amplios, ni del marco práctico prometido para decidir qué workflows automatizar primero.
En conjunto, el artículo defiende una tesis clara para quienes evalúan la adopción de IA agéntica en la empresa: en lugar de comprar "agentes" o adoptar un framework de moda, conviene primero hacer el trabajo —aparentemente poco glamuroso— de identificar los workflows reales y no documentados que ya existen en la organización, describirlos según estos siete primitivos, y reconocer en qué de los ocho patrones encajan. Esto permite decidir con criterio dónde el juicio humano es imprescindible (aprobaciones, elicitación, revisión de borradores) y dónde puede desaparecer casi por completo (triage, sincronización, monitorización), gestionando así el riesgo de forma proporcional al coste de un error en cada patrón. Es un enfoque pragmático y basado en casos reales de producción —fondos de private equity, firmas de construcción, plataformas de analítica de medios, monitorización de infraestructura de IA— más que en promesas abstractas sobre agentes autónomos, y encaja con el tono general de la serie "The Org Age of AI", que ya había argumentado en entregas anteriores que el ROI de la IA sigue siendo esquivo precisamente porque las conversaciones se centran en las herramientas y no en los procesos organizativos subyacentes.
Fuentes y referencias
Recibe el análisis por email · gratis
Un correo al día con el análisis de lo esencial de la IA. Gratis, sin spam y te das de baja cuando quieras.
Te enviaremos un email para confirmar tu suscripción (doble opt-in). Privacidad.