对云计算和下一代有线和无线服务的需求,推动了对照明和非照明光纤容量的数亿(甚至数十亿)美元投资的推出. 随着越来越多的电信基础设施,特别是深层光纤的部署, 网络的规模和复杂性都在扩大. 随着链接的增加, 连接和互联, 还有更多潜在的故障或破损点. 因此,人们可以合理地预测未来发生的中断的增加.
我们已经在云服务提供商(csp)身上看到了这一点 越来越多地推销他们日益增长的电信网络 和伙伴关系的额外容量接入作为一个不同点.
尽管如此, 自10月初以来,我们已经看到美国CSP网络中断的数量增加了66%. 然而,没有出现面向公众的重大故障.
所以我们到底在看什么?
本周的许多CSP“中断”显示了维护工作的行为特征, 哪些是持续时间短且不影响公众的. 最大停机时间为25分钟,但平均只有3到4分钟.
尽管有一些计划维护的特点, 这些中断的原因可能很容易来自计划外的中断, 这取决于网络的架构和管理方式, 是捡起来和补救更快吗.So, 一系列三到四分钟的中断也有助于自动纠正操作的发生:这种操作可以归因于软件定义的网络(SDN) 自愈能力.
规模的挑战
毫无疑问,投资网络是最重要的 最有效的方法 减少网络相关停机的影响. 而这正是csp正在做的. csp是 不断扩大其网络基础设施的覆盖面和深度,并在世界范围内扩大电缆足迹.
而这意味着更多的连接点和更多的依赖, 他们正在构建软件定义的网络, 具有多个不同的故障转移和弹性路由, 还有自动触发装置,在预定或非预定的问题上移动交通.
随着网络架构变得更加软件定义, we won’t necessarily see fewer outages; in fact, 它可能会增加诸如配置更改等方面的需求,从而增加风险, 软件和补丁更新, 等., 但我们将更多地看到这些中断的“爆炸半径”(受影响的区域)大幅减少. 哪些地方的中断是高度本地化的, 远离核心和较低的持续时间,因为它们更容易处理.
而csp则处于投资和网络扩展模式, 我们预计,他们的每周停机数量的波动将会持续下去,中期趋势是出现更多的停机. 如果我看看每年而不是每周的CSP中断的数量, 就绝对数字而言,我看到了280%的增长, 随着2021年的发展,这已经成为一种趋势.
这并不是CSP网络相对于任何其他类型网络的不稳定性的控诉, 或者一种提供商比另一种提供商更擅长网络管理. 这只是CSP网络不断增长的副产品, 这需要更多的维护(导致更多计划中的停机),并引入更多的潜在故障点或依赖点(导致更多非计划的停机).
但随着这些网络的不断建设和铺设, 并对网络监控和管理的自愈方面进行了优化, 也许这些中断可以被更好地管理到一个几乎察觉不到的程度——甚至比现在更少.