首页   实验室与人员介绍   科学研究   人才培养   论文著作   学术讲座   合作交流   招贤纳士   招生指南   联系我们
greyback

数字媒体研究所师生参加第98届MPEG会议

2011-12-5       阅读:5417次       来源:NELVT


执笔人:段凌宇




第98届国际运动图像专家组会议(The 98th Moving Picture Experts Group Meeting, MPEG-98)于2011年11月28 - 12月2日在瑞士日内瓦召开。北京大学数字媒体所黄铁军教授、段凌宇副教授、马思伟副教授、王春雨同学参加了本次会议。北京大学视觉搜索小组代表在MPEG CDVS Ad-hoc Group 上对“Peking Compact Descriptor – MCVD Coupled with PQ-SIFT”提案做了口头宣讲,并顺利完成了程序代码层面的交叉验证(Cross-Checking)。



MPEG CDVS是运动图像专家组根据全球智能移动终端市场爆发式增长带来的视觉搜索、移动搜索、手机增强现实等广泛应用而开展的紧凑视觉描述子 (Compact Descriptors for Visual Search) 国际标准制定工作。针对移动视觉搜索等崭新3G业务带来的较高带宽要求、移动设备电池消耗等挑战,紧凑视觉描述子旨在大大缩短移动终端用户视觉查询等待时间、降低带宽要求,保证理想的检索性能与效率。此项工作于MPEG-93次日内瓦会议启动,历时近一年于MPEG-97都灵会议完成需求提案,并发出Call for Proposal (CFP)。在高文教授领导下,北京大学数字媒体所于MPEG-94次广州会议开始参与MPEG CDVS的标准制定工作。



本次会议上,CDVS Ad-hoc Group总共收到9份提案,分别来自斯坦福大学、意大利电信、日电、北大等多家单位。通过成员专家的初步评价,北大的MCVD Coupled with PQ-SIFT,在目标搜索定位性能获得第一;在目标匹配与搜索方面,多项指标(mean Average Precision、Top Match Accuracy)处于第二或第三的位置。



针对手机增强现实应用对精确匹配位置信息的较高要求,北大视觉搜索小组提出的双阶段(Twin-Stage)匹配算法,较理想地解决了低比特传输环境下的位置无损压缩编码,支持精准的RANSAC以及Homograph计算。在视觉特征紧凑表示方面,北大提出了融合TSVQ (Tree-Structured Vector Quantizer)与PQ(Product Quantizer)的局部特征压缩方式,进一步拓展了MPEG-96日内瓦会议上北大提出的基于视觉词典的多通道词典编码MCVD (Multiple Channel Vocabulary Coding) 紧凑描述子压缩方案。



本次会议上,北京大学与意大利电信分别独立提出了TSVQ + PQ技术的词典压缩技术方案。根据MPEG CDVS Ad-Hoc成员专家的讨论以及突出的搜索、匹配性能,TSVQ + PQ初步确定为MPEG CDVS Test Model。下一次MPEG会议上, CDVS Ad-hoc Group将基于Test Model,展开Core Experiments。北大视觉搜索小组将在Vocabulary Pruning以及全局与局部特征融合等多方面,继续深化研究。



下一届MPEG会议(MPEG 99th)将于明年二月在美国San José举办。

 

Copyright © 2009-2016  数字视频编解码技术国家工程实验室