艾瑞咨询合伙人兼CEO邹蕾女士:“音视频+” 重塑产业格局,5G+边缘云让远程实时控制成为可能

在2021年11月4日举办的腾讯数字生态大会音视频专场,艾瑞咨询合伙人兼CEO邹蕾女士受邀发表了《发力云端音视频,共创全真互联新时代》的主题演讲,从音视频产业的变革出发,探讨音视频与各行业、场景融合的价值,展望音视频在全真互联时代的技术趋势与想象空间。以下为演讲内容摘录。

窥见全真互联时代

全真互联以全和真为特征,强调虚实结合。而音视频作为线下在线上映射的关键表现形式,是全真互联时代重要的基础设施。

4G网络的广泛渗透让视频应用跃升为新一代的现象级产品。尽管视频应用的月活规模早已步入10亿的区间,但在过去的三年里依然表现出了稳定的增长态势。2020年初受到疫情影响,视频应用的活跃首次触及13.9亿台的高位。对视频应用的使用习惯因为疫情得到了进一步的强化,即使此后出现了一定的回落,但到2021年初再次回到这一水平。与月活相比,使用时间的增长更加夸张。2018年以来,视频应用的月度总有效使用时间快速攀升,三年时间增长三倍。

在一众视频应用之中,短视频的表现尤其优异,其月度总有效时间的占比从2020年1月的52.7%上涨到7月的57.4%,增长势头强劲。网络和硬件基础设施的升级,让视频的创作门槛急剧下降,根植的自我表达基因得到激发。算法加持之下,不仅是少数的大V,越来越多的普通用户也习惯了利用短视频表达自我,视频的消费甚至生产的模式都愈发趋于短、频、快。

回顾人类信息传播方式的演进,最早期的肢体语言过于耗能,且容易产生歧义,不方便在沟通的同时进行狩猎、生产等活动。于是人类发明了语言,或者说是口语。但口口相传在时间、空间以及准确性方面有诸多限制,直到文字的出现才解决了这些问题。

随着技术的快速发展,低维度图文形式的信息传播演变为高维度的音视频。而从点播到直播再到互动直播的兴起,则是对音视频从延时到实时的追求。现如今,音视频已经成为大规模信息交流的重要形式。

随着音视频在各行业领域越来越广泛的应用,它开始被逐渐独立出来,成为一项基础能力,变得容易被集成、容易被调用、容易被计量。企业对于音视频通信能力的需求向着更低廉的成本、更弹性的扩容、更敏捷的试错、更快速的生产演进,音视频上云的重要性日益凸显。

经过多年发展,音视频云由最早期的聚焦CDN加速到以PaaS服务助力视频应用快速开发,进一步延伸服务链条,对视频从生产到处理、传输以及最终消费的全流程进行全方位支撑。音视频云不仅大幅降低了音视频应用的开发准入门槛,更通过促进产业效率提升不断推动音视频产业的繁荣。

为灵活满足不同场景的个性化需求,音视频云厂商搭建aPaaS、低代码平台,让音视频的开发更加便捷高效开发效率高。一方面,在通用能力模块化封装的基础上,aPaaS平台针对不同场景进行了大量业务层面的功能整合,无需开发人员写代码,非技术人员也可按需完成应用开发。另一方面,aPaaS平台通过开放各类标准API接口,扩展自有业务所需功能,满足个性化开放需求。

“音视频+” 重塑产业格局

就像云计算不该被看作一个单独的行业一样,我们看待音视频也不应该再将其作为一个单独的行业。音视频应用于教育,让在线教育解决了长久面临的变现难题,缩短了知识之间的距离,促进教育公平化;应用于电商,形成了直播带货的新模式,让流量中心从传统电商平台向短视频平台转移,同时加速电商行业去中心化;应用于办公场景,以视频会议为切入口通过加速远程协同,改变传统办公模式,孕育新一轮的组织变革。实时交互赋予了音视频应用更多的价值,它所改变的绝不仅仅是产品,更将重塑产业格局。

赋能场景一:直播电商常态化,低信息差重塑供应链

直播作为营销方式与销售渠道,在电商行业的应用日益常态化。然而,传统的直播技术难以满足直播电商对实时互动的高要求,普通直播几秒的延时带来不仅会损害用户互动体验,更会直接影响交易达成。尤其在618、双11等大促期间,更需要保证在千万级并发情况下的画面清晰不卡顿,稳定且低时延的音视频不可或缺。

通过直播电商跳过中间商,直连工厂与消费者,大幅缩减了用户信息的反馈时间,一个单品的直播结果迅速反馈到生产端。直播期间数据集中爆发,极大缩短了数据收集和分析的周期,数据的可用性和结论性更强,品牌商可以更迅速、准确并且真实的获得前端的消费者洞察,从而灵活控制研发设计与产销情况的匹配。

赋能场景二:视频会议流量激增,迎来跳跃式发展

视频会议市场发展至今已有30年的历史,但其对于协同办公的价值却是因为突发的疫情事件才实现了突飞猛进。1)疫情突发期,政企单位开启居家办公模式,企业内部协同需求高涨,原本不用视频会议的企业和用户“被迫使用”相关产品,短期内形成流量暴增现象;2)疫情消退期,由突发期带来的非刚需流量褪去,留存用户因对视频会议专业性、安全性的容忍度降低,将大范围转用专业的视频会议系统,推动硬件设备与云产品升级;3)后疫情发展期,远程办公概念普及,疫情教育用户作用明显,整个产业链,从硬件商、解决方案商到渠道商等开始思变,他们将通过细化行业需求,提供专业服务推动整个价值链抬升。

赋能场景三:策采编发全流程线上协同,助力高效内容生产

策、采、编、发的全流程线上协同是内容产业的未来趋势。尤其对于传统媒体行业,过去成熟且模式化的策、采、编、发流程,严谨有余但效率不足,为适应新媒介的消费习惯,必须向更加高效智能的生产模式发展。音视频云不仅可以提供分布式的内容分发网络,通过超清转码、窄带高清、画质重生等满足传媒行业高质量视频更低时延、更低成本的传播需求,更能够以云端的一体化生产平台,让摄像、审片、剪辑、导播、运营等各环节的人员实时线上协作,促进内容生产效率的提升。

赋能场景四:实时云渲染从游戏行业出发,延伸至全行业通用能力

对于游戏行业而言,在云端体验、不需要任何高端处理器和显卡的云游戏将是全真互联时代下的主流游戏模式。云游戏背后是实时的云渲染技术,即依靠后台服务器集群的强大算力进行渲染处理,渲染完成后再将渲染结果下载到本地。中国云渲染市场发展至今经历了从无序到有序,从私有云到公有云的转变。随着云渲染行业的不断成熟,其所应用的场景也从云游戏开始更多向产业领域拓展。如在数字文旅场景,企业可以利用云渲染技术将现实场景完美复原,用户打开小程序就能享受沉浸式体验;在影视制作场景,《长津湖》、《金刚川》等国产大片的后期制作已经采用了云渲染技术;此外,工业仿真、智慧园区、智慧城市等领域也都有云渲染的应用价值。

赋能场景五:5G+边缘云让远程实时控制成为可能

车联网由最早期的车载信息服务发展至今,已经能够基于C-V2X技术实现单车智能,但要实现L4级的自动驾驶还需要“人-车-路-云”的全方位协同,还需要引入5G和边缘云技术。基于5G网络和云边协同,将复杂的数据处理、分析和控制策略交由中心云,将实时性要求高的计算和服务交给边缘云,可以实现在毫秒级时延下的远程控制。在车联网类似的智慧港口、智能制造等存在远程控制需求的场景中,实时音视频无疑发挥着重要的作用。

云服务与产业互联网的结合不断加深,音视频云厂商场景化、私有化能力加强,能更好地匹配传统行业的部署需求,在传媒、教育、平台电商化、协同办公等领域的应用也正变得越来越多。音视频云厂商和其他场景化解决方案商积极合作,两者携手共建生态,为企业提供面向全场景的音视频一站式解决方案。

全真互联时代的进阶之道

纵观互联网发展的历史进程,消费互联网打开了物理世界数字化的窗口。流量红利消失加之传统行业数字化转型的深入,让互联网行业的概念扩展到了产业互联网。依托于5G、云计算、人工智能等技术,音视频尤其是实时音视频的应用将使得物理世界的数字化程度进一步加深,推动互联网将走向“全真”的新时代。

发展趋势一:音视频互动创造沉浸式、实时社交体验

今年年初爆红的Clubhouse就是实时音视频技术应用的典型代表。相比图文、传统的直播、点播,实时音视频为用户带来了沉浸式的社交体验。音视频互动在互联网应用中表现出了强劲的生命力,衍生出语聊房、太空狼人杀、在线K歌、互动健身等等多种不同的应用形态。超低时延拉进了人与人之间的距离,成为互联网应用提升用户粘性的杀手锏,音视频互动类应用正在全球范围内流行。

发展趋势二:技术驱动,VR/AR硬件与内容协同发展

对于发展尚不成熟的VR/AR产业来说,硬件承载内容、内容支撑硬件的相互关系是产业链无法实现协同发展的根本原因。参考PC、智能手机、IMAX的发展路径,内容的升级依托于硬件的迭代,两者叠加带来用户体验的飞跃才能促进产业整体形成良性循环。5G和云计算分别解决了VR/AR的传输能力问题和计算能力问题,将推动头显设备的无线化、移动化,降低用户的使用门槛。加之交互、沉浸式技术的升级迭代,VR/AR产业将有望以更低的生产成本创造更加丰富的内容体验,破解当前的商业化难题。

发展趋势三:迈向社交终极形态,全球掀起构建超级数字场景的浪潮

从VRChat到Rec Room,VR在社交终极形态上的探索一直在持续。VRChat定位VR+社交,玩家能够在平台上创建世界和虚拟人物,其3D音效环绕和全身骨骼系统让远在天边的互动也可以身临其境。而Rec Room相比其他主打聊天交友的平台,更注重以多人互动游戏增加娱乐向与参与感,波板球、乒乓球、篮球、扔飞镖甚至是吃鸡等给玩家带来了全新的体验。

作为超级数字场景的实现基础,VR被视为是打造真正虚拟世界的钥匙。Facebook当属在VR领域布局最为高调的互联网公司。早在2014年Facebook就以20亿美元收购了Oculus公司后,截至目前已经打造了包括Facebook Horizon VR社交平台、主打虚拟赛事观看的Venues、虚拟家庭影院Oculus TV、虚拟游戏中心Rooms等众多VR应用。

发展趋势四:全球音视频云为全真互联应用保驾护航

在全球全真互联的浪潮之下,建立全球化的音视频通信能力尤为重要。面对更加复杂的海外网络环境,如何保证高质量的跨境传输是一大难题。目前,行业内领先的音视频云厂商在海外都拥有相当数量的服务节点,并基于同当地运营商之间的合作关系设有跨境专线,能够实现灵活的视频流调度,为海内外用户提供同等的播放体验。对于全真互联时代的企业来说,引入音视频云可以充分发挥规模效应的优势,解决自主搭建基础网络环境的成本、技术难题,而音视频云厂商在跨境运营方面积累的经验,也有助于企业应对海外不确定环境带来的挑战。

构建面向全真互联的技术体系

立足于全真互联时代,企业应当构建线上线下一体、虚实结合的技术体系。超高清、低时延、沉浸式和强交互是其中的重点。

视频处理和传输环节是音视频技术攻坚的重点方向,以更高的压缩比呈现更高质量的视频,保障在高并发、弱网环境下的低时延、去抖动、抗丢包。一方面,音视频云厂商将进一步精研软件算法,运用人工智能技术降低视频处理的计算量、提高网络传输效率,另一方面,音视频云厂商也将积极同芯片厂商合作,利用其提供的高性能芯片、AI硬件加速产品、边缘智能产品等实现性能优化和成本下降。

沉浸式技术强调将现实和虚拟混合,一个完全沉浸式、感知真实的环境将由多个组件组成。虽然当前市面上的VR设备以3Dof为主,但6Dof才是真正能够体现VR的魅力。6Dof是指物体除了具备在X、Y、Z 三轴上旋转的能力之外,也具备在X、Y、Z三轴上移动的能力。人体的运动大致分为旋转和位移两大类,因此6Dof的VR设备几乎可以模拟所有的头部动态。在此基础上,加入对头部歪头、缩脖子、半身前倾等微动作的识别,并利用手柄实现抓取、射击、打斗等动作,将可以实现1+1>2的效果,实现对真实世界以假乱真的模拟。

随着音视频技术的发展演进,音视频云将能为企业带来更加高清、实时、沉浸的互动体验。音视频将通过融入到各行业、各场景,重新定义未来应用,在全真互联时代发挥巨大的价值。

文章只代表原作者观点,边缘云致力于打造独立、客观的资讯信息平台,转载请注明来源于边缘云信息平台。
分享到
长按二维码关注

参与讨论 抢沙发

评论前必须登录!

立即登录   注册

边缘云生态研究

关于我们