别太依赖AI!亚马逊电商本月出4次大包,数百万笔订单全蒸发

为了厘清局势,亚马逊电子商务基础设施资深副总裁戴夫・崔德威尔(Dave Treadwell)在周二名为「TWiST」的例行内部会议中,特别针对近期因软体程式码部署引发的问题进行深入探讨。
北美数百万笔订单蒸发!亚马逊内部文件揭防护网漏洞与AI 隐忧
根据内部文件,亚马逊在3 月上旬经历多次严重的营运中断。 3 月2 日,由于系统显示错误的送货时间,导致购物车结帐异常,引发了160 万次网站错误,并造成近12 万笔订单流失。
亚马逊早期内部审查一度指出,自家开发的AI 写程式助手Q 是促发该事件的因素之一;然而,亚马逊官方随后澄清,近期仅有一起事件与AI 相关,且所有事件「均未涉及由AI 撰写的程式码」,并在会议前删除了文件中将矛头指向生成式AI 的描述。
3 月5 日灾情进一步扩大,北美市场订单量瞬间崩跌99%,导致高达630 万笔订单在系统中蒸发。当天有长达6 小时的时间,用户无法结帐、无法查看帐户资讯,甚至连商品价格都无法显示。
内部文件指出,引发后续巨大灾情的核心原因,是一项没有经过正式文件记录与审核流程就上线的「生产环境变更」,使得单一工程师在毫无自动化验证与防护网的情况下,直接执行了破坏力极强的改动。

AI 酿祸不是头一次!亚马逊曾陷Vibe Coding 灾难
AI 写程式造成的系统风险,在亚马逊其实早有先例。回顾2025 年7 月, 亚马逊旗下云端运算服务AWS 高调推出AI 程式工具Kiro 预览版,正式加入科技圈盛行的Vibe Coding 战局,借此与斥资24 亿美元布局的Google 以及微软(Microsoft)抗衡。
然而,高度依赖AI 的风险很快就浮现。根据《金融时报》(Financial Times)报导,AWS 2025 年12 月就曾发生一起长期系统当机,导致成本管理功能停摆,当时有消息指出,当机是因为工程师放手让Kiro 执行变更所致。
尽管事后亚马逊官方将该起事故归咎于使用者的失误,而非AI,但AWS 内部网站也曾坦承,目前以Vibe Coding 的形式执行任务仍太复杂,团队很难追踪过程中的所有决策并留下纪录。
一周内出4 次大包!当机事件揭AI 开发工具致命伤
崔德威尔在给员工的备忘录中坦言,公司在短短一周内就发生了4 次「Sev 1」(最高严重级别)事故。内部文件原本指出,生成式AI 辅助变更是引发近期一系列事故的因素之一,并警告在控制系统中使用AI,会更快踩到系统中缺乏安全防护的危险死角,一旦出错,就会引发波及范围极大的灾难性后果。
尽管亚马逊发言人事后澄清,近期仅有一起事件与AI 相关,且「没有任何事件涉及到由AI 撰写的程式码」,但危机感已在内部蔓延。
当机事件反映AI 开发工具的根本缺陷:「代理性(Agentic)」与「决定性(Deterministic)」的冲突。 AI 模型本质上并非百分之百可预测,同一个指令可能产生不同的程式码;然而,对于庞大且牵一发动全身的电商核心系统而言,任何变动都必须具备绝对的「决定性」与精准度。
不只亚马逊,微软执行长萨蒂亚・纳德拉(Satya Nadella)先前曾表示,微软内部高达30% 的程式码由AI 编写,但公司在2026 年1 月也不得不耗费大量资源去修复Windows 11 的诸多漏洞。
让外界不禁推测,科技巨头在享受AI 带来的高效产出时,是否也面临着过度依赖AI 导致品质不稳定的隐忧,凸显人类监督与完善防护机制皆不可或缺。
亚马逊强制回归「双人审核」机制,变更程式前都需要记录
作为暂时性的防护措施,亚马逊针对约335 个由副总经理(VP)级别管理的一级系统,展开为期90 天的安全重置计划。这些系统直接攸关消费者体验,且自去年以来已多次发生影响订单的事故。
新规定要求,工程师在进行任何程式码变更前,强制回归传统的「双人审核」机制,必须由2 名人员授权并详细记录变更内容;此外,工程师也被规定必须使用内部核准工具,和严格遵守公司规则的自动化程式码系统。同时,所有高阶主管也必须全面稽核组织内的程式码变更活动,以严格控管风险。

































