人工智能代理陷入试点模式,因为银行仍然不信任它们

代理人工智能正在引起金融界的关注,但该行业最大的障碍不再是模型是否足够强大。更困难的问题是银行、资产管理公司和财务部门是否拥有将财务任务委托给自治系统的基础设施,而不会失去对资金、责任或合规性的控制。
德勤对 3,300 多名财务和会计专业人士进行的民意调查清楚地显示了这一差距:80.5% 的人表示代理和 GenAI 聊天机器人等人工智能驱动的工具可能会在五年内成为标准,但只有 13.5% 的人表示他们的组织已经在使用代理人工智能。
Citi Sky 展示了基础设施辩论为何重要
花旗于 4 月 22 日推出了 Citi Sky,这是一款采用 Google Cloud 和 Google DeepMind 技术构建的人工智能财富助手。该工具是使用 Google 的 Gemini Enterprise Agent Platform 开发的,预计今年夏天向美国的 Citigold 客户分阶段推出。
此次发布为关于代理人工智能的争论提供了一个实时银行业务的例子。花旗财富技术主管迪彭德拉·马尔霍特拉(Dipendra Malhotra)指出,记忆力是高风险咨询人工智能的核心制约因素,他询问客户在系统开始出现幻觉之前可以让对话持续多久。
大多数代理依靠检索增强生成来通过外部数据库扩展内存。上下文窗口仍然限制了代理一次可以保存的信息量。
在财务建议、财务管理或投资组合执行中,内存上限不仅仅是一个技术问题。它成为一种操作风险。
CoinFello 联合创始人 MihnChi Park 表示,可信委托的条件很简单:代理只能按照用户指令行事,用户可以阻止它,并且底层资产永远不会转移给第三方。
以太坊起草了代理身份的链上原语
以太坊提案 ERC-8004 引入了代理身份、声誉和验证系统。该标准草案规定了三个注册表:身份注册表、信誉注册表和验证注册表。
它们共同旨在帮助自主代理证明自己是谁,建立行为记录,并支持其他市场参与者的验证。
ERC-8183走的是一条更窄的路线。它提出了一个带有评估者证明的工作托管标准,其中客户资助工作,提供者提交工作,评估者完成或拒绝结果。
该提案不提供仲裁或正式的争议解决,但它为基于代理的市场提供了托管任务和可验证完成情况的框架。
arXiv 论文《代理经济:基于区块链的自主人工智能代理基础》为这一转变描绘了一个五层架构,涵盖物理基础设施、链上身份、认知工具、经济结算和集体治理。
声誉层仍然存在结构性漏洞。代理可以以人类无法比拟的速度和规模产生活动,从而可以在短时间内夸大信任信号。
这给金融机构留下了一个难题:当代理人拥有良好的记录时,该记录是可靠性的证据还是只是重复自动化活动的证据?
麦肯锡将 50% 至 60% 的银行业务纳入范围
麦肯锡估计 50% 到 60% 的银行全职员工与运营相关。专家警告说,“试点炼狱”是指机构在不重新构建运营模式的情况下进行狭隘的概念验证。
正如 Cryptopolitan 在香港 Web3 节上报道的那样,麦肯锡预计代理人工智能市场将从 2024 年的 52.5 亿美元增长到 2034 年的约 2000 亿美元。
W3.io 首席执行官波特·斯托厄尔 (Porter Stowell) 表示:“企业无法查看、控制或审计自主系统如何使用其资金。人类监督不会消失。它只是在堆栈中向上移动。”
有四个问题仍未解决:当人工智能代理造成财务损失时,谁该负责;其声誉是否可信;一旦这些系统大规模部署,谁负责控制;当代理超出其范围时,适用什么监管框架。