千眼公司是思科公司的一部分   了解更多→
现场网络研讨会
介绍Thous和Eyes

互联网报告

互联网报道:每周脉搏

By 迈克·希克斯
| 2021年12月13日

Summary

12月13日当周, 2021年12月13日,互联网专家迈克·希克斯讨论了互联网中断趋势和终端用户的不满, 2021.


在因感恩节假期而中断了两周的网络中断和在此期间似乎已经生效的网络更改冻结的解除之后,本周标志着网络中断的恢复. 

全面, 我们发现我们对停机数量的跟踪有所增加, 与前一周相比,全球总宕机数增加了24%. 这反映在国内, 与前一周相比,中断增加了26%,与感恩节假日周相比增加了40%, 这与我们在经历了一段强制的平静期后的预期一致吗.

图- 1 -网络-故障趋势- 12月- 13 - 2021.png

本周,亚马逊网络服务(AWS)也出现了几周以来的第一次大故障。 有经验的问题 通过它的一些服务, 在美国东部-1地区,哪些地区受到网络拥塞的影响, 导致访问服务的延迟和失败.

US-EAST-1传统上对许多AWS服务的技术运营很重要, 在这个事件中, 和之前的人一样, 我们观察到对EMEA和亚太地区用户的更广泛的影响, 尽管事件发生在北美.

关于中断的详细分析可以在 Thous和Eyes博客,但有一些东西值得拆解.

首先, AWS’ cloud services operate as a full-suite; that is, 可以将多层服务缝合在一起,以支持工作流或创建一个全新的产品或服务. AWS使用api将平台中所有不同的服务连接在一起, 允许在所有这些底层服务之间交换信息,以便整个系统能够正常工作.

每个底层服务和api都代表关键的相互依赖关系——也就是说, 如果一个优惠, 它可以对其他人产生连锁效应, 同时也会导致整个系统无法使用. 作为我的同事安吉丽·梅迪纳 告诉路透,“AWS的复杂服务通常是建立在自己更基本的服务之上的. 像网络这样的基本功能突然出现的问题可能会导致依赖它的服务级联.”

根据亚马逊, 触发该事件的是一个自动活动,目的是扩展托管在AWS主网络中的一个AWS服务的容量. 这导致了AWS内部网络的大规模拥塞, 这反过来又会影响多个api的连接性能. 这打破了各种服务的关键部分之间的结缔组织. 个人服务本身仍然在线, 但是网络连接问题阻止了一些AWS服务访问, 包括管理职能(e.g.如扩展EC2或S3). 

这就打破了许多与客户打交道的事情. CBNC指出,“机器人真空吸尘器无法召唤. 全食超市的订单突然被取消了. 亚马逊庞大的零售业务部分陷入停顿.”

这似乎把终端用户推到了崩溃的边缘, 然而, 是不是AWS服务状态页面在近一小时内没有显示任何具体问题.

这个博客的忠实读者可能还记得我们 前面介绍了服务状态的主题 页面, 具体来说,用户遇到的问题可能不会反映在官方状态更新中, 或者可能只会在一段较长时间的中断后反映出来.

我不打算重复太多, 但是,我们的建议仍然是相同的:在停机场景中,拥有自己对问题形成的独立可见性是非常有价值的. 在这种情况下,任何有独立监控的人都可能远远领先于那些依赖官方AWS状态页面的人.

一般来说, 用户有时会觉得特定于供应商的状态页面没有及时更新. 状态页面也只提供有限的视图——而不是完整的服务交付链, 要了解更广泛的影响,以及用户如何体验这个问题,哪些是需要的. 最终, 这就是为什么用户有责任对其产品或服务的端到端交付所需的所有元素和相互依赖关系拥有独立的整体视图.

订阅千眼博客

保持与博客更新和中断报告的联系,当它们仍然是新鲜的.

升级您的浏览器以正确浏览我们的网站.

请下载最新版本的 , 火狐 or 微软的优势.

更详细地