Coinbase 表示中断“不可接受”,首席执行官权衡速度与弹性之间的权衡

在 AWS 数据中心冷却故障导致多项交易服务离线、阻止部分账户访问并延迟客户余额显示后,Coinbase 正在审查其交易所基础设施。首席执行官布莱恩·阿姆斯特朗 (Brian Armstrong) 称此次中断“不可接受”,并表示 Coinbase 将重新考虑基础设施故障期间速度、主机托管和更快恢复方面的权衡。
要点:
Coinbase 首席执行官布莱恩·阿姆斯特朗 (Brian Armstrong) 表示,与 AWS 相关的交易所中断对于客户来说是不可接受的。
多个 Coinbase 交易服务的交易、账户访问和客户账户信息均受到干扰。
Coinbase 计划重新审视弹性权衡,以减少未来的中断持续时间和客户影响。
阿姆斯特朗表示将审查弹性权衡
加密货币交易所 Coinbase(纳斯达克股票代码:COIN)解释了 AWS 数据中心冷却故障如何引发服务中断,从而中断整个平台的交易、交易所访问和客户账户数据。 Coinbase 首席执行官 Brian Armstrong 在 X 上讨论了这一事件,而工程主管 Rob Witoff 详细介绍了恢复过程和客户影响。
阿姆斯特朗在 5 月 8 日写道:“昨晚我们在 Coinbase 经历了一次停机,这是绝对不能接受的。”他补充说,大多数 Coinbase 系统的设计都能够承受一个 AWS 可用区的停机时间,但中心化交易所在停机期间并没有做出这样的响应。阿姆斯特朗表示:“让交易所能够抵抗可用区故障是可能的,但这可能会带来延迟,而且会破坏客户的主机托管,这是不希望的。”他补充道:
“鉴于这一事件,我们将重新审视这些权衡,以确保为您提供最佳的交易场所。至少,当需要移动可用区时,中断的持续时间应该能够大大缩短。”
阿姆斯特朗指出,Coinbase 将审查如何平衡交换速度、客户托管和基础设施故障后的恢复时间。他的评论重点是减少未来影响客户访问和交易活动的中断的影响和持续时间。
Coinbase 如何恢复交易和余额更新
Coinbase 工程负责人 Rob Witoff 在 X 上发帖称,中断始于 5 月 7 日晚些时候,当时内部系统开始出现故障,应急小组开始调查。此次中断影响了现货交易、Prime、国际和衍生品交易所。客户在访问兑换服务、进行交易和查看账户余额时也遇到了问题。
维托夫解释说,由于基础设施中断期间交易系统无法继续安全运行,交易被暂停。他还指出,内部消息系统速度变慢,导致一些帐户信息滞后,直到恢复过程赶上。他承认:
“失去对帐户的访问权限,即使是暂时的,也是不可接受的。”
恢复是分阶段进行的,而不是一次性完成。 Coinbase 将受影响的工作负载移出问题区域,恢复了处理交易所需的系统,并允许延迟的客户数据赶上。市场谨慎地重新开放,从仅取消模式开始,然后是产品检查、拍卖模式,然后恢复了 Coinbase 交易所的交易。