华为徐文伟:用数学和系统工程方法推进未来网络研究

6月17-18日,在2021第五届未来网络发展大会上,来自产业界、学术界、研究机构等领域的专家、行业领袖,围绕网络操作系统、6G通信、网络安全、工业互联网等热点话题,共同探讨新型网络技术的攻关与变革。华为董事、战略研究院院长徐文伟就未来网络的研究与突破发表了主题演讲,他特别呼吁:“我们要加强产学研用合作,用数学和系统工程方法推进未来网络研究,以场景需求驱动理论研究、技术创新。我们和合作伙伴一起开展了确定性广域网的研究,取得良好进展,下一步将加速成果转化,为先进工业网络的发展注入新动能。”

华为徐文伟:用数学和系统工程方法推进未来网络研究

  以下为演讲全文

  01从世界构成的三要素理解未来的挑战与方向

  物质、能量、信息是世界构成的三要素,这也是我们把握未来挑战和方向的出发点。下一个十年,联接数量将达到千亿级,宽带速度每人将达到10Gbps,算力实现100倍提升、存储能力实现100倍提升,可再生能源的使用将超过50%。围绕信息和能量的产生、传送、处理和使用,技术需要不断演进。

  02产业互联中的智能机器联接:千亿节点,万亿市场

  近十几年以来,消费互联网的蓬勃发展,极大地丰富了人们的沟通和生活,当前按照人口计算的互联网普及率已经达到70%。展望未来,随着5G2B能力的提升、IPv6协议的规模部署,智能机器的联接数量将迎来爆炸式的增长。根据ARM的预测报告,预计2035年全球机器联接累计数量达到10000亿。

  消费互联网主要面向人提供联接,而人的感官反应速度是有限的,对于网络质量波动带来的体验波动,人的容忍度较高。比如,消费者可以接受200ms以内的电视频道切换速度,不容易觉察200ms以内的话音通信中断。以机器为主的产业互联网,要求低时延、低抖动的确定性承载。AGV自动导向车要求工业网络时延小于50ms,抖动小于10ms,钢铁行业某些工业控制场景要求工业网络时延小于4ms,抖动小于50us。

  03现场少人化、无人化是趋势,远程集中控制的生产模式需要确定性广域网

  我们看到,企业生产系统正在走向现场少人化、无人化,实现降本增效、安全生产,这是必然的趋势。工业控制系统加速走向远程集中控制模式,让操作人员可以在更安全、更舒适的集中控制室完成生产任务,也让大型企业得以在更大范围内实现总部、多基地之间的生产要素调度和优化。

  为此,工业控制系统需要走向广域化,工业网络需要同时保证确定性和大网可扩展性。其中的核心技术挑战就是,降低确定性网络调度算法的存储和计算复杂度,使之在大规模网络中可以部署。

  04面向产业互联,提升IP网络的确定性、安全性、灵活性

  今天,网络支撑的主体是百亿级的消费互联,2030年,网络支撑的主体是万亿级的产业互联,网络协议面临三个考验。

  第一是确定性。需要确定性时延保障能力,通过“网络演算新理论和协议”,将当前尽力而为的网络时延,变为可提前计算的确定时延。

  第二是安全性。万物互联的场景下,安全防御体系提出严峻挑战。无人机、摄像机、边缘计算、传感器等大量外挂设备,引入了新的不安全因素,必须构建端到端的内生安全框架和协议。

  第三是灵活性。千行百业的需求是多样的,有的需要IP地址长一点,有的需要短一点,必须将固定长度的IP地址,扩展为可灵活定义语义、语法的新IP协议。

  而确定性广域网的建模、优化,涉及网络级的排队论,较为复杂,我们希望借助数学工具和系统工程方法,来提供一些帮助。

  05用网络演算理论,为网络确定性进行建模和定量分析

  网络演算理论是网络建模和时延分析的重要数学工具,它通过描述流量到达和节点服务的包络曲线,基于最小加代数,计算端到端的确定性时延上限。UCLA大学Cruz教授在1991年的论文中发明了网络演算,后由瑞士科学家Boudec进一步整理、完善。

  最小加代数(Min-Plus Algebra)是用于数字电路、通信网络以及制造工业等离散事件系统( Discrete Event Systems)建模的一种数学工具。

  基于网络演算理论,由于IP网络存在复用,流间会相互碰撞。所以一个流经过一个网络节点后,突发度会增长,时延和抖动都会增长。而传统IP的聚合调度,流间穿插碰撞、甚至循环阻塞,导致突发度和时延上限,随着跳数滚雪球式开放增长,即便网络轻载时也会出现时延很大的情况。

  06通过系统工程方法进一步优化,解决大规模广域网的确定性

  为了解决IP网络的时延不确定问题,几十年了业界做了大量研究,也提出了很多具有确定性保障的技术。但这些技术基本都依赖于在网络节点中维护流状态、或者调度复杂度很高,所以扩展性不好,没有办法应用在大规模网络中。

  为了同时解决确定性与可扩展性,我们采用系统工程的方法,采用周期聚合调度,将状态维护在边缘节点、并携带在报文中,避免核心节点的状态爆炸。核心节点仅需维护4个聚合周期队列、调度复杂度为O(1),同时实现了计算和存储的可扩展性。

  07优化效果:E2E时延与跳数的线性关系,时延抖动与跳数无关

  从理论分析来看,相比于传统IP的时延随跳数超线性增长,我们的确定性广域网技术(DIP),其端到端时延上限与跳数呈线性关系,并且端到端抖动是常数,与跳数无关。工程上,我们已经具备能力,达到单跳十微秒级的时延上限,端到端±10us的抖动上限。

  08基于CENI试验网络环境,完成了确定性广域网技术试验

  基于网络演算理论,业界在确定性广域网技术取得了一定的突破。

  2020年6月,华为与紫金山实验室等合作,在CENI网络进行了确定性广域网技术试验,跨3000公里、13跳设备的网络中,把时延抖动控制在100μs以内。而未启用确定性广域网技术的传统IP流量,时延抖动达到了2.8ms。需要注意的是,是时延抖动控制在100μs以内。而时延与距离相关,无法缩小。

  背景干扰流持续增加时,确定性广域网时延抖动保持恒定,而传统IP流量的时延抖动随背景流增加而增长。

  09基于确定性广域网技术,完成全球首个广域云化PLC场景化技术试验

  在过去的一年,我们进一步开展了产学研用合作创新,将确定性广域网技术运用到工业网络场景中,联合紫金山实验室、上海交大、宝信软件开展了广域云化PLC合作,完成了全球首个广域云化PLC场景化技术试验。

  试验中,云化PLC部署在上海,采用IP协议、经CENI的确定性广域网联接、在600公里之外控制部署在南京的执行端,在重度背景流量冲击下,广域云化PLC系统正常稳定运行。试验中,网络时延小于4ms,时延抖动小于20us。

  值得一提的是,这次试验采用了鲲鹏CPU、欧拉操作系统、以及上海交大提供的基于IEC 61499标准的PLC集成开发环境和运行环境,基于通用计算和标准IP协议,构筑了工控边缘计算节点,实现了全栈国产化系统的雏形。我相信,在向下一代工控架构升级的过程中,国内高校、研究机构还将发挥更大的作用,彻底解决工控系统七国八制的问题。

  10确定性广域网在有限域丰富了IP技术能力集,加速工业网络IP化

  确定性广域网是有限域内网络演算和系统工程优化的成果,面向特定的工业场景,丰富了IP技术能力集,使之可以服务更多的工业网络场景。确定性广域网等新的技术能力,和IPv6、5G2B等相结合,将加速工业网络IP化,进一步扩大消费+产业互联网的服务范围。我们可以参考5G的做法,面向不同的场景,提供eMBB、uRLLC等不同的能力集合。

  消费互联网和产业互联网的需求不尽相同,我们也可以不断地丰富IP技术能力集,使消费+产业互联网基于通用能力集实现互联互通,同时在有限域内基于增强能力集来服务更多的场景,不断扩大互联网的服务范围。

  11探索端到端系统的确定性:从确定性的网络到确定性的系统

  在确定性广域网的研究基础之上,现在,我们也在探索完整的端到端确定性系统。比如,确定性的5G空口、确定性的WiFi、确定性且极致低时延的工业现场网络、以及确定性的主机协议栈等技术,这些研究中需要应用到随机网络演算、鞅论等数学理论,也要用到系统工程优化的方法,利用最少的网络资源,确定性或概率性的满足业务的时延。又如,面向关键应用类场景,探索E2E的确定性系统,不只是确定性网络,也包括确定性的计算、操作系统、芯片、云服务。

  12数学与系统工程方法,还可以发挥更多作用

  数学工具和系统工程方法,在未来网络的发展中还可以发挥更多的作用。

  如网络级的MBB体验优化,可以借助“网络级香农容量模型”,来实现网络能效最优、用户体验最优。用这个方法,华为协助瑞士Sunrise,在频谱、站点数劣势的情况下,5G网络排名第一,体验是第二名的1.5倍以上。

  又比如,在基站的散热系统能耗优化中,通过系统调度优化,理论分析预计,可以降低空调能耗30%,降低站点运行成本10%。下一步,我们还要在实际环境中,验证实际的效果。

  还有,在数据中心的算效比优化方面,通过优化数据中心网络,针对特定的计算场景,实现网络零丢包,减少数据重传带来的CPU空耗,可以显著优化算效比。这里面也会涉及到图论等数学方法,以及系统工程优化方法。

  13面向未来开展前瞻性合作,加速产学研用的进程

  人类发展的需求以及解决所面临的问题,需要汇集全人类的智慧和创新能力,必须以开放包容、协同创新的机制,跨越挑战。工业界必须与高校和科研机构紧密合作,用工业界的挑战和世界级难题牵引科学研究方向。

  面向未来不确定性的创新,我们从三个层面来开展前瞻性合作,加速产学研用的进程。

  第一个层面,面向基础科学研究的合作,通过人才Funding战略合作、Gift Funding等举措,支持全球优秀人才,聚焦ICT基础技术领域研究方向,推动基础理论突破。

  第二个层面,是面向基础技术研究的合作,通过联合实验室、创新实验室、校级框架协议等举措,以5到10年为周期,以每年百万美元的规模为基线,联合世界级研究人才,构建世界顶级先进技术实验室,开展ICT领域前沿研究,创造与发明重大新技术。

  第三个层面,是面向项目技术创新的合作,我们发起了HIRP OPEN、Fellow试错、顾问委员会等项目,把高校科研优势与企业问题场景结合起来,多路径探索,深度合作突破关键技术。

  我们希望,基于学术界的理论研究突破,开展技术的研究创新,打造出更加满足用户需求的产品和方案;而用户不断发展的需求和未来场景,也会促进我们更加关注理论突破,合作研究开发新的产品,从而形成产学研用的良好循环,推动产业向前发展,促进社会进步,真正实现我们的愿景,把数字世界带入每个人、每个家庭、每个组织,构建万物互联的世界。

文章只代表原作者观点,边缘云致力于打造独立、客观的资讯信息平台,转载请注明来源于边缘云信息平台。
分享到
长按二维码关注

参与讨论 抢沙发

评论前必须登录!

立即登录   注册

边缘云生态研究

关于我们