Cryptonews

技术故障和错误修复相结合,导致 Sui 主网第三次陷入瘫痪

Source
CryptoNewsTrend
Published
技术故障和错误修复相结合,导致 Sui 主网第三次陷入瘫痪

Sui 基金会周日发布了一份关于 5 月 28 日和 29 日导致其第 1 层瘫痪的三次主网中断的事后分析,将前两次中断归咎于 v1.72“地址平衡”升级引入的气体充电错误,第三次中断则归因于验证者重新启动以安装临时修复程序时暴露的单独随机状态故障,该团队承认它在知道其具有低概率停止风险的情况下发布。

据 CoinGecko 报道,该网络的原生代币 SUI 在事后 24 小时内下跌 6.6%,7 天内下跌 18.5%,至 0.82 美元,使 Sui 的市值降至 33.1 亿美元。该链锁定的总价值为 4.7966 亿美元,在 DefiLlama 追踪的网络中排名第 13 位,仅次于 Avalanche,领先于 Monad。周日,位于 Sui 的 DEX 24 小时交易量达到 7733 万美元,其中 DeepBook V3 的交易量领先,交易量为 2669 万美元。

上周,Sui 在与同一个 1.72 版本连续暂停后重新启动。这也是今年发布的更详细的第 1 层事件报告之一,其中命名了特定的代码路径,并承认验证器网络短暂地运行了 Mysten Lab 工程师知道可能会失败的修复程序。

毒气粉碎虫

前两次暂停可追溯到执行的一个角落,Sui 称之为“gas 粉碎”——运行时将交易的所有输入币组合成一个币,并在交易本身运行之前将其扣除 Gas 的过程。 v1.72 版本引入了“地址余额”功能,该功能允许用户通过发出系统结算交易协调每个块的余额增量来同时从单个地址提取和存款到单个地址。

根据基金会的说法,极端情况是:当一笔交易试图透支地址余额来支付 Gas 费用时,它被正确地标记为取消,并出现“InsufficientFundsForWithdraw”错误,但 Gas 粉碎随后在同一个预留对象上再次运行,花费了该交易刚刚被告知无法访问的资金。结算层收到了零余额的负增量,验证器崩溃了。一旦输入管道中出现崩溃错误,每个诚实的验证器都会遇到相同的错误输入,并且链会停止。

已知风险补丁

Sui 周四部署的临时解决方案是为了恢复该链,即停止对因“InsufficientFundsForWithdraw”取消的交易进行气体粉碎。该基金会现在表示,该团队“接受了该提案所带来的风险,以便尽快恢复停止的网络,同时开发出强有力的修复方案。”周五早上,网络遇到了同一边缘情况的变体,并第二次停止。随后出现了第二个补丁。

数小时后,第三次停顿发生在下一个预定的纪元变更时。重新开始采用周五补丁的验证者未能满足新纪元分布式密钥生成的参与阈值——初始化纪元随机性的协议步骤。 DKG 在设计上禁用了自身,但潜在的错误意味着失败判决从未写入磁盘。随着进一步的重新启动,每个验证器都在不知道 DKG 失败的情况下恢复,依赖于随机性的事务队列增长,并且纪元结束逻辑停止等待永远不会运行的 DKG。永久修复在重新启动后保持了 DKG 状态,并添加了强制关闭机制以在卡住的纪元上聚合验证器。

发生了什么

根据基金会的说法,在这三个暂停期间,没有用户资金面临风险,也没有承诺的交易被回滚。这些事件与流量负载无关,也与外部漏洞无关,并且交易在第三次重启后恢复到亚秒级最终结果。该基金会还表示,能够访问生产验证器日志的内部人工智能代理“大大加速了诊断速度”。

可靠性栏

背景信息:Solana 上次官方确认的主网停止是在 2024 年 2 月 6 日,当时验证器程序缓存中的错误迫使其协调重启大约五个小时。相比之下,Sui 在 2024 年 11 月因拥塞控制主张而短暂停止,并在 2026 年 1 月最近一次运行之前陷入了 6 小时的共识停滞。

基金会指定了四个补救重点:将 Sui 的“安全模式”优雅降级模式扩展到重新配置路径的其余部分;将 Gas-Charging 逻辑重建为可与 Move VM 或 Mysticeti 共识协议相媲美的代码质量标准;扩大生产调试人工智能代理程序;并添加一个深度防御层,让验证器跳过导致崩溃的输入,而不是停止链。

截至本文发布时,Mysten Labs 首席执行官 Evan Cheng 和首席产品官 Adeniyi Abiodun 尚未对尸检发表公开评论。 Defiant 已请求隋基金会发表评论。

技术故障和错误修复相结合,导致 Sui 主网第三次陷入瘫痪