全球网络再度大瘫痪：亚马逊AWS宕机引发互联网混乱数小时-城市新闻网icitynews

亚马逊云计算平台 Amazon Web Services（AWS）在10月20日（周一）发生故障，导致互联网大范围瘫痪数小时，多家主要网站和应用程序无法使用。从银行服务到社交网络，从航空订票网站到网上购物平台，成千上万的服务受到影响。全球数百万人无法使用关键应用程序或通过手机点咖啡，尤其是在美国东海岸早高峰时段。这次宕机再次提醒人们：即使只是短暂中断，互联网的“脊梁”依然脆弱，而整个世界对在线服务的依赖已深不见底。

尽管 AWS 及其竞争对手通常十分稳健，但互联网本质上是一个由无数相互依存的服务构成的复杂网络，其可靠性取决于最薄弱的一环。10月20日（周一）故障的根本原因尚未查明，但有消息称，一个负责将网址转换为 IP 地址的网络服务无法与数千家托管在亚马逊上的大型数据库正常通信。

以往类似规模的宕机可能源自多种原因：错误的软件更新、意外注入的错误代码、第三方软件的不兼容，或极少数情况下，因网络光缆被切断、网络攻击或拒绝服务攻击（DDoS）导致服务器过载。然而，这类事件频发，暴露出网络缺乏必要的冗余系统与竞争机制。部分网络专家指出，许多公司“把所有鸡蛋都放进了同一个云服务篮子里”。

网络安全公司 NymVPN 的首席数字官罗布·贾丁（Rob Jardin）表示，目前“没有迹象表明这是网络攻击”，更可能是“亚马逊主要数据中心之一的技术故障”。他补充说：“互联网最初的设计是去中心化和具备弹性的，但如今我们的线上生态系统却高度集中在少数几个云区域。当其中一个区域出现问题，影响立刻广泛而深远。”贾丁指出：“这些问题往往在系统超负荷或网络关键节点宕机时发生；由于太多网站和应用依赖 AWS，影响会迅速蔓延。”

AWS 并不常出现如此规模的中断。上一次重大宕机还要追溯到 2021 年。圣母大学商学院网络安全专家迈克·查普尔（Mike Chapple）表示：“与其他主要云服务商相比，这样的频率并不算高。事实上，他们能在如此庞大的规模下维持运行而不更频繁地出问题，已经相当惊人。”“这些事件之所以引发巨大关注，是因为影响范围太广，”他对 CNN 说。“如果一家公司的数据中心出问题，只会影响自家服务；但 AWS 出问题，就意味着全球数以千计的网站无法运行。”

2024 年，全球曾爆发史上最大 IT 宕机事故。CrowdStrike 软件系统出现严重漏洞，导致全球多地计算机崩溃、航班取消、医院瘫痪，直接造成约 50 亿美元的经济损失。CrowdStrike 的云端测试系统将一个有缺陷的更新推送到了全球电脑上。同年，美国 AT&T 网络多次中断，其中一次持续达 11 小时，使大量零工无法工作。

周一究竟出了什么问题？AWS 是一家云计算服务商，为全球众多常用的在线服务提供支持。在亚马逊早期，为应对假日购物季网站流量暴增，公司需要预留大量服务器资源。后来，亚马逊意识到在非高峰期可以出租这些服务器给其他企业使用，由此诞生了 AWS。AWS 的服务之一是 DynamoDB，这是一个托管数据库系统，为企业存储客户等关键信息。亚马逊在10月20日（周一）表示，客户无法访问 DynamoDB 中的数据，原因是域名系统（DNS）出现了故障。DNS 相当于互联网的“电话簿”，它将诸如 amazon.com 这样的友好网址转换成 IP 地址——一串可被其他网站和程序识别的数字。

查普尔解释道：“亚马逊的数据本身是安全的，但数小时内没人能找到它——导致应用程序与自身数据短暂‘断联’。这就像互联网的大部分区域突然患上了短期失忆症。”目前尚不清楚是什么导致了 DNS 故障，但问题仅持续了数小时。到美国东部时间早上 6:35，亚马逊修复了该问题，并建议企业清除缓存（临时存储文件）以加快服务恢复。亚马逊表示，此次宕机还波及其他 AWS 服务，包括许多公司用于构建在线应用的虚拟服务器 EC2。预计亚马逊将在接下来的几天内发布事故报告，说明其 DNS 系统出现故障的具体原因。

未经允许不得转载：城市新闻网icitynews » 全球网络再度大瘫痪：亚马逊AWS宕机引发互联网混乱数小时

精彩推荐