首页   实验室与人员介绍   科学研究   授权专利   人才培养   论文著作   学术讲座   合作交流   招贤纳士   招生指南   联系我们
greyback

博士生王钊荣获 ICIP 2018 Best Student Paper Award

2018-10-15       阅读:230次       来源:PKUVCL

近日,图像领域著名国际会议 2018 IEEE International Conference on Image Processing(ICIP) 在希腊首都雅典举行(10.7-10.10)。ICIP 2018共收到投稿文章近3000篇,录用839余篇,录取率约28%。来自北京大学信息科学技术学院的博士生王钊在该会议上发表的文章 “FAST QTBT PARTITIONING DECISION FOR INTER FRAME CODING WITH CONVOLUTION NEUTRAL NETWORK” 获得 Best Student Paper Award 的荣誉。

该论文由我校数字视频编解码技术国家工程实验室博士生王钊,在导师马思伟教授的指导下,与香港城市大学王诗淇老师、美国南加州大学张新峰博士后,北京大学王苫社老师等合作完成。博士生王钊此前在视频编码领域已发表十余篇论文,包括图像领域顶级期刊TIP 2篇,数据压缩领域顶级会议DCC 3篇,并获得VCIP2016的Top 10% Best Paper Award。所在课题组由马思伟教授带领,是国内外最优秀的视频编码团队之一,每年在视频编码领域发表多篇顶级期刊/会议论文,并负责推动我国自主视频编码标准AVS的制定与产业化。

该论文提出了一种基于卷积神经网络的快速四叉树-二叉树编码单元划分决策技术。四叉树-二叉树编码单元划分是正在制定的最近国际视频编码标准 Versatile Video Coding所使用的划分结构的技术原型。相比于2013年国际标准HEVC中的划分结构,四叉树-二叉树划分结构尽管性能优越,但编码复杂度较高。为了对四叉树-二叉树划分结构进行优化加速,论文中提出了一种卷积神经网络对图像块的划分深度进行预测。主要地,论文详细论述了如何确定网络的输入与输出,并对其原因给出了充分的分析和解释。另一方面,论文算法利用时域相邻帧之间的编码信息和网络输出,对当前网络输出的准确度进行估计与控制,从而降低网络的误判率。该论文在四叉树-二叉树划分结构上获得了优秀的编码时间加速比,是已经发表的首篇使用深度学习对四叉树-二叉树划分结构进行优化的论文,且论文思想可指导借鉴于多个视频编码问题的解决。

 

Copyright © 2009-2018  数字视频编解码技术国家工程实验室