腾讯多媒体实验室参与机器视频编解码标准研究,迈向视频技术探索新纪元

来源:中国网    2023-04-12 15:41
来源: 中国网
2023-04-12 15:41 
分享
分享到
分享到微信

后疫情时代,随着技术的不断发展,机器已经转化为人们生活中的第三只“眼”,如工业质检,无人驾驶,智慧城市等应用愈加依赖与视频信息分析与理解,而使得视频能够更利于机器分析的同时能够进一步节省带宽成的压缩技术成为了这一系列行业应用的刚需,面向机器的视频编码VCM(video coding for machine)应运而生。

2019年运动图像专家组(Moving Picture Experts Group, MPEG)第127次会议宣布成立AHG VCM(Ad Hoc Group on Video Coding for Machines)机器视觉编码工作组,工作组研究面向机器视觉或者人机混合视觉的下一代视频编码标准,为机器视觉应用场景提供高压缩率、高任务精度的视频/特征压缩技术。Nokia, Ericsson, Intel, Sumsung, Interdigital,腾讯,阿里巴巴,中国电信, oppo, vivo,中科院等公司和组织参与该工作组。

1681218292833.png

腾讯在VCM的工作中担任了重要的角色,担任AHG联合主席,为工作组提供了包含标注的视频数据集(Tencent Video Dataset, TVD) [1][2],并被工作组采纳成为检测、分割和跟踪任务的通用测试数据集。另外,腾讯牵头制定了通用测试条件(Common test conditions, CTC)和评测框架,为相关技术的验证提供规范化的流程。同时,腾讯也一直积极参与技术路线的推进,成功响应了工作组的多次证据征集(Call for Evidence, CfE)和提案征集(Call for Proposals, CfP),并在后续标准化进程中担任核心实验(Core experiments, CE)召集人等角色来推动技术方案的发展。

过去几年中,工作组进行了大量的基础调研,证明了在机器视觉任务场景下传统视频编码技术存在着较大的提升空间,同时针对目标检测、分割、跟踪等典型机器视觉任务建立了规范的测试数据集和通用测试条件。基于这些前期工作,工作组于2022年4月正式发布提案征集(Call for Proposal, CfP),获得了来自工业界和学术界的积极参与响应,展示了机器视觉编码的巨大应用潜力。目前,标准化仍在持续进行中。

去年,制定了H.266/VVC标准的工作组JVET(Joint Video Experts Team)也成立了新的 AHG专题组(AHG15),该工作组将针对H.266/VVC与H.265/HEVC这一系列标准进行进一步优化,帮助其在面向机器场景下可以更大程度的提升机器识别精度和进一步节省带宽。目前最新一代编码标准H.266/VVC相较上一代编码标准H.265/HEVC,在相同质量下可以节省约50%带宽,而该工作组预期可在H.266/VVC的基础上更近一步节省50%带宽。随着这一技术的逐渐成熟,可以预见未来面向机器的编码器将有更广阔的应用前景。

[1] An Open Dataset for Video Coding for Machines Standardization | IEEE Conference Publication | IEEE Xplore

[2] A Video Dataset for Learning-based Visual Data Compression and Analysis | IEEE Conference Publication | IEEE Xplore

 

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn