找工位
空间入驻
小程序

阿里腾讯云网进化之路与云网之问

2020-06-30 00:00:00
文章转载自"ToB行业头条"

来源 / 力博睿生

作者 / 李昕 ·  编辑 /   瑞雪



最近阿里云和腾讯云密集发布关于软件定义网络以及软件定义广域网的技术文章,尽管双方的关注点各异,但追求的目标都是如何在一个高度云化的网络中重建网络资源组织调度技术架构以及核心组件。

没错,是重建,而不是优化。

尽管TCP/IP中的基础协议并没有发生变化,云网与传统网络之间的互联互通也没有任何受到影响的迹象,但在管理平面和控制平面,很多堪称颠覆性的变化正在发生。

而这种颠覆性的力量,表面上看是因为网络规模、流量模型等等传统网络属性所发生的变化已经超出了很多传统网络技术扩展性的极限,但深层次的原因则是由于应用层的高速扩张以及快速迭代,正在对网络服务提出越来越精细化、动态化的要求。而围绕尽力而为服务展开的传统网络技术体系,并不具备与这种颗粒度、精准度以及灵活性需求相匹配的网络资源调度能力。

是应用层的进化驱动网络技术走上了一条非线性发展的路线,并演化出云网这样一个新物种。

甚至云计算本身,也是应用层在计算和存储资源组织调度领域引发的必然结果。贝佐斯和马云能够特立独行看懂云计算的战略价值,更多是因为他们比同行更早面对来自应用层的巨大压力。当计算和存储资源自由流动的瓶颈被突破之后,作为数据传输管道的网络自然而然地被推上了变革的快车道。

尽管软件定义网络技术已经出现了十年以上,在生产环境中也获得了广泛的部署,但我认为网络技术的这种系统性变革才刚刚开始,甚至网络行业对软件定义的理解,也是最近这两年才形成了相对理性和建设性的共识。

软件定义网络并不是一个从传统网络技术体系中线性衍生出的技术,互联网大厂自研网络协议和网络设备也并非码农充沛,而是来自传统网络设备制造商的产品已经越来越难以适应云网的独特属性,而应用层快速迭代的节奏以及大张大驰的弹性需求,也非传统厂商所能理解,互联网行业除了自己理解自己,自己动手丰衣足食,并没有太多其他选择。

除了应用层驱动的快速变革,云网技术体系本身也开始演化出很多独特的属性。这些属性有些是显性而具体的,从公开的技术文章中能够看到详细的介绍。但另外一些则是隐性和抽象的,局中人也未必能够清晰描绘其面目。然而,对这些隐性和抽象属性的理解与关注,能够让我们更加清晰地理解云网与传统网络的差异性,并且避免偏移到网络中心论,陷入以更大的复杂性对抗复杂性的恶性循环当中去。

这些问题包括但不限于:

第一,云网当中的用户行为特征和流量特征是什么。

在云网环境中,网络行为已经不仅仅是人的行为的集合,还包括机器行为的集合,过去基于人联网数据得出的结论还能否解释人机混合网络的问题?网络是为用户服务的,用户如果没有发生根本的变化,那么服务用户的网络更多只是在原有技术基础上进行优化,而不需要进行架构层面的变革。

第二,分布式控制与集中式控制应该以什么样的方式协作。

分布式控制和集中控制的差异并不仅仅体现在算力和获取网络信息的能力上,它们分别代表了即时决策和长期决策两种决策模式。尽管软件定义系统非常强调集中控制的重要性,也并不否认分布式控制的不可替代性,但并没有一套成熟的规则去定义双方如何实现优势互补。其中最突出的一个问题,是如何将集中控制系统的能力向外开放。例如将其所维护的网络长期特征模型,转化为分布式控制系统化解准确性和时效性矛盾的决策依据。

第三,如何在网络状态维护成本与网络资源调度效率之间寻求动态平衡。

任何控制都会向网络中注入新的状态和复杂性,云网由于不依赖专用硬件转发,所以能够承受的复杂性高于传统路由器网络。但这种承受力的瓶颈在哪里,如何在架构设计阶段就把这种复杂性考虑在内,避免追求短期和局部优化的控制模式向网络中注入过多复杂性,如何在云网中理解和践行“核心简单 边缘复杂”的网络设计理念。

第四,如何借助应用层视角破解网络管控中的瓶颈问题。

网络管控中的核心问题在于决策依据而非决策算法。以网络层视图为依据对网络资源进行调度,仍是以网络为中心的模式,并不能真正服务于应用层。但应用层网络视图与网络层存在巨大的差异,要真正从应用视角对网络管控方式进行重塑,并不是一个简单的跨层映射问题。真正意义上的网络切片,也应该是以应用视角为出发点,而非简网络层QoS指标的阈值组合。这不仅仅是一个技术问题,更是一个观念问题。

第五,如何重新定义各层网络之间的接口。

在现有的三层网络(Underlay、Overlay、App)资源组织调度体系中,每一层应该向上层提供哪些服务,这些服务如何定义,网络中的哪些问题因为被解耦到三个独立的层面而消失或缓解了,哪些问题因为三层网络之间状态信息的隔绝而加重了。三个层次之间的接口,应该传递哪些信息,才有可能将各层的能力由单纯的资源转化为服务,并且保持各层的独立性。

第六,如何重新定义网络收敛性问题。

在一个混合了集中式与分布式控制、提供精细颗粒度网络服务、能够像软件工程那样迭代的云网系统中,收敛性问题如何解决?云网系统的收敛性和传统网络收敛性的本质区别是什么?如何将收敛性作为一种基本属性渗透到云网的研发和运维体系之中?

这些问题都没有确定的答案,甚至连对问题的描述都不确定。欢迎大家留言,发表自己的看法。
---------
长按下图二维码即可进【ToB行业交流群】


推荐阅读



点击图片即可阅读

转载/投稿/内容合作/寻求报道

请联系微信:qifuxiaozhushou3W


觉得有价值,点个“在看”,和朋友们一起成长