Los agentes de IA están atrapados en modo piloto porque los bancos todavía no confían en ellos

La IA agente está ganando atención en el sector financiero, pero el mayor obstáculo de la industria ya no es si los modelos son lo suficientemente potentes. El problema más difícil es si los bancos, los administradores de activos y las oficinas de tesorería tienen la infraestructura para delegar tareas financieras a sistemas autónomos sin perder el control del dinero, la responsabilidad o el cumplimiento.

Una encuesta de Deloitte a más de 3.300 profesionales de finanzas y contabilidad mostró claramente la brecha: el 80,5% dijo que las herramientas impulsadas por IA, como los agentes y los chatbots GenAI, podrían convertirse en estándar dentro de cinco años, pero sólo el 13,5% dijo que sus organizaciones ya estaban usando IA agente.

Citi Sky demostró por qué es importante el debate sobre infraestructura

Citi lanzó Citi Sky, un asistente patrimonial impulsado por inteligencia artificial creado con las tecnologías Google Cloud y Google DeepMind, el 22 de abril. La herramienta se desarrolló utilizando la plataforma Gemini Enterprise Agent de Google y está programada para un lanzamiento gradual para los clientes de Citigold en los EE. UU. este verano.

El lanzamiento brindó al debate sobre la IA un ejemplo de banca en vivo. El director de tecnología patrimonial de Citi, Dipendra Malhotra, señaló la memoria como una limitación central para la IA de asesoramiento de alto riesgo y preguntó cuánto tiempo puede un cliente mantener una conversación antes de que el sistema comience a alucinar.

La mayoría de los agentes dependen de la generación con recuperación aumentada para ampliar la memoria a través de bases de datos externas. Las ventanas de contexto todavía limitan la cantidad de información que un agente puede contener a la vez.

En el asesoramiento financiero, la gestión de tesorería o la ejecución de carteras, ese límite de memoria se convierte en algo más que una cuestión técnica. Se convierte en un riesgo operativo.

MihnChi Park, cofundador de CoinFello, dijo que las condiciones para una delegación confiable son simples: el agente solo puede actuar siguiendo las instrucciones del usuario, el usuario puede detenerla y los activos subyacentes nunca pasan a un tercero.

Ethereum redacta primitivas en cadena para la identidad del agente

La propuesta de Ethereum ERC-8004 introduce sistemas para la identidad, reputación y validación de los agentes. El proyecto de norma establece tres registros: un Registro de Identidad, un Registro de Reputación y un Registro de Validación.

Juntos, están destinados a ayudar a los agentes autónomos a demostrar quiénes son, crear un registro de comportamiento y respaldar la verificación por parte de otros participantes del mercado.

ERC-8183 toma una ruta más estrecha. Propone un estándar de depósito en garantía de trabajos con certificación del evaluador, donde un cliente financia un trabajo, un proveedor envía el trabajo y un evaluador completa o rechaza el resultado.

La propuesta no proporciona arbitraje ni resolución formal de disputas, pero brinda a los mercados basados en agentes un marco para tareas en custodia y una finalización verificable.

El artículo de arXiv “La economía de los agentes: una base basada en blockchain para agentes autónomos de IA” traza una arquitectura de cinco capas para este cambio, que abarca la infraestructura física, la identidad en cadena, las herramientas cognitivas, la liquidación económica y la gobernanza colectiva.

La capa de reputación todavía conlleva una vulnerabilidad estructural. Los agentes pueden generar actividad a una velocidad y escala que los humanos no pueden igualar, lo que hace posible inflar las señales de confianza en períodos cortos.

Eso deja a las instituciones financieras con una pregunta difícil: cuando un agente tiene un buen historial, ¿es ese registro evidencia de confiabilidad o simplemente evidencia de actividad automatizada repetida?

McKinsey pone en su alcance entre el 50% y el 60% de las operaciones bancarias

McKinsey estima que entre el 50% y el 60% de los equivalentes de tiempo completo en los bancos están vinculados a las operaciones. Los expertos advierten sobre un “purgatorio piloto”, donde las instituciones realizan pruebas de concepto limitadas sin reconfigurar el modelo operativo.

Como informó Cryptopolitan en el Festival Web3 de Hong Kong, McKinsey proyectó que el mercado de IA agente crecería de 5.250 millones de dólares en 2024 a aproximadamente 200.000 millones de dólares en 2034.

Porter Stowell, director ejecutivo de W3.io, dijo: "Las empresas no tienen forma de ver, controlar o auditar lo que los sistemas autónomos están haciendo con su dinero. La supervisión humana no desaparece. Simplemente asciende en la pila".

Quedan cuatro preguntas sin resolver: quién es responsable cuando un agente de IA causa pérdidas financieras, si se puede confiar en su reputación, quién tiene el control una vez que estos sistemas se implementan a escala y qué marco regulatorio se aplica cuando un agente actúa fuera de su alcance.