La pregunta que más nos hacen los CFOs no es '¿podemos hacer esto con IA?'. Es '¿cuánto cuesta y cuánto ahorra?'. Y la respuesta honesta es: si no medís el baseline antes de arrancar, no vas a poder responder esa pregunta después.
La mayoría de los pilotos de IA 'funcionan' en sentido literal — el agente responde, el modelo predice, la automatización ejecuta. Pero un piloto que funciona técnicamente no es lo mismo que un piloto que generó ROI. La diferencia está en si midieron el costo unitario del proceso ANTES de la automatización y lo compararon con el costo unitario DESPUÉS.
Nuestro framework: antes de tocar código, definimos cuatro métricas. Volumen actual del proceso (transacciones/mes). Costo unitario actual (humano + sistema). Tasa de error o re-trabajo actual. Tiempo de ciclo end-to-end. Estas cuatro métricas son el baseline. Sin ellas, no hay forma de calcular ROI.
Después de implementar, medimos las mismas cuatro métricas con el agente en producción. La fórmula es simple: (costo_baseline × volumen) - (costo_agente × volumen) - (costo_de_implementación / vida_útil_estimada) = ROI mensual. Si es positivo desde el mes 3-4, seguimos escalando. Si no lo es al mes 6, pivotamos o cerramos el piloto. Sin culpa.
La trampa más común es enamorarse del piloto sin métricas. Una empresa argentina con la que trabajamos pasó nueve meses con un agente que 'funcionaba bien según el equipo' pero nunca midieron ahorro real. Cuando finalmente lo medimos, descubrimos que el agente costaba 1.4x lo que costaba el proceso humano. El piloto se cerró. Mejor saberlo en mes 9 que en mes 24.