涌现科技

为全面数字化赋能的国民科技企业

Emergence of science and technologyNational science and technology enterprises enabling comprehensive digitalization

人才为本、崇尚科学

无界创新、自驱担当

Boundless innovation and self driven responsibility

3分钟读懂“智能视频编码”,拥抱万亿新蓝海

2023-02-14 15:42:43

随着5G、人工智能、虚拟现实、超高清等技术的快速发展,视频新型应用已经不再局限于娱乐场景,而是向工业制造、金融医疗、生产办公等场景拓展。视频大数据时代,视频编码的任务不再局限于节约存储空间和传输带宽,以及提供好的主观质量,而且还要能为视频分析处理需求提供更智能的视觉数据表示支撑,智能视频编码是视频产业未来发展的必由之路。

55af43184bf661051fbdfd72c745ae30_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

作为国家高新技术企业,涌现科技一直处于智能视频编码领域创新研究的第一梯队,创新性地定义了智能视频编码:智能视频编码是指同时面向人眼视觉和机器视觉,运用神经网络等人工智能技术,改善甚至重构现有视频编码框架,实现智能视频高效编码以及视频信息的高效处理。智能视频编码包含“AI for Coding”和“Coding for AI”两个部分:


AI for Coding


“AI for Coding”是指用AI来增强视频编码的效率和质量,同时满足视频处理中更广泛的智能化需求。在执行信号压缩任务中,对编码场景、参数、模式选择等信息进行面向应用场景和内容特征的分析,利用AI技术对去噪声、图像增强、细节改善等环节进行预处理,基于最佳模式的配置与编码,实现精准化编码控制,在压缩效率、图像质量、场景功能扩展上实现全面优化。

当前智能视频编码的主要应用为研究各类可替代或优化传统编码技术的神经网络编码工具,通过在各个编码模块中嵌入离线训练好的神经网络模型以提升编码性能或进行编码优化,比如AI视频增强、ROI智能编码、AI精准编码、AI快速编码等。

e70e6b9fc19a3f725f21ce904518c8eb_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

AI视频增强:AI视频增强技术通过在编码环节对视频进行预处理,能够对采集设备较差、网络环境欠佳、拍摄时间久远等导致效果不佳的视频进行优化,包括视频降噪、去马赛克、色彩增强、智能补帧等,能够大幅提升视频质量,优化终端用户体验;

ROI智能编码:在云会议、安防监控等场景中,ROI智能编码可以将动态的人物和近乎静态的背景进行分离,并采用不同的编码方式分开编码整合,对关注度更高的人物区域进行针对性地画质以及编码参数调整,实现不同等级的码率分配,有效实现编码码率和画面质量之间的平衡;

AI快速编码:当前的视频编码标准中编码非常复杂,每个像素块编码都可以选择不同的编码模式,AI快速编码利用神经网络算法,能够对多种可用编码模式进行比较,并选择最佳的模式,实现对每个像素块的最优编码,从而提升视频编码效率;

AI精准编码:AI精准编码能够全面利用AI性能,实现像素块级别的精准控制、分析和判断,从而针对其信息特征进行专门的编码优化,在控制码率的前提下大大提升人眼视觉清晰度、流畅度的感知。

目前AI for Coding已经在互联网视频、云会议、安防监控、工业医疗等多个领域都有成功落地的技术应用,未来智能视频编码有望实现从端到端的全神经网络编码,从整体上对编码框架实现最优设计。


Coding for AI

95001e67f4493e4a2d7f527954b34fbd_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

传统视频编码都是基于像素块的处理,对像素块做预测变换编码,“Coding for AI”则为视频编码提供了全新的思路,即通过特征分析、特征提取,按照智能分析需求进行特征编码,从而优化解码应用端的智能分析过程,减少解码端重复调用AI进行特征提取分析和处理,为后续针对性重构视频场景、执行智能分析任务奠定基础。

在执行智能分析任务中,完整的视频信息中存在大量冗余,如果我们能够实现针对所有特征信息的智能编码,就可以大幅提升智能分析任务的效率。比如在人脸识别、AI质检等任务中,算法只需要提取其中人脸或者产品瑕疵相关的特征信息进行判断,从而简化了任务处理流程,大量的冗余消除又降低了带宽、时延等方面的要求,进一步提升智能编码效率。

445ef92b387b6b575af6e89ab153df57_640_wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1.jpg

智能视频编码打破了传统编码模式下压缩编码与智能分析相割裂的“1+1”分布式模式,整合了编码、重组、解码及智能应用等视频链环节,实现从视频编码到重构分析的一体化智构编码,达到通用数据表示意义下媒体编码与理解分析的统一,在节省存储与传输宽带成本、降低时延、保障视觉质量的基础上满足对视频感知、分析、理解等智能应用方面的需求,将成为AIoT全场景下的视频图像人机高效处理的重要动力引擎。

随着智能编码技术的场景渗透和虚拟终端、VR/AR等下游新兴市场的增量起势,智能视频编码的市场规模加速提升。根据艾瑞咨询测算,2021年中国智能视频编码整体市场规模为237亿元,较2020年增长64.5%,预计2025年智能视频编码市场规模有望超600亿元,基于智能视频编码及软硬件整体解决方案衍生的泛视频产业整体市场规模已突破万亿级别。未来,涌现科技将持续推动产品创新,深入“产学研用”深度融合,引领智能编码行业,加速实现“智构视频”,促进视频产业高效、快速发展。

回到顶部图片