位置 : 首页 > 新闻动态

高文院士:AI科学家获诺奖,提醒我们重视科学大赛

视频与视觉技术国家工程研究中心

(文章来源于人民日报)

今年,诺贝尔物理学奖授予约翰·J·霍普菲尔德(John J. Hopfield)和杰弗里·E·辛顿(Geoffrey E Hinton),“以表彰他们在使用人工神经网络实现机器学习方面奠基性发现和发明”,诺贝尔化学奖一半授予大卫·贝克(David Baker),“以表彰在计算蛋白质设计方面的贡献”,另一半共同授予德米斯·哈萨比斯(Demis Hassabis)和约翰·M·詹珀(John M. Jumper),“以表彰他们在蛋白质结构预测方面的成就”。两项大奖实际授予从事人工智能研究的科学家,引起科学界巨大反响。

中国工程院院士、鹏城实验室主任、北京大学博雅讲席教授、视频与视觉技术国家工程研究中心主任高文在接受记者采访时表示,国际科学大奖和科学发展的热点大事挂钩很正常,这也是一种“指挥棒”,鼓励科学家选择对社会发展有重大影响的研究领域作为自己的研究目标。此外,高文认为,今年的两个诺奖,都和国际科学大赛关系密切,应鼓励研究人员尤其是年轻学者积极参与所在领域的科学大赛,通过比赛增长才干、获得认可。

记者:诺奖是否真的在蹭人工智能热点?是否存在追求短期效益的冲动?

高文:当前,人工智能就是对社会发展有重大影响的研究领域之一,诺奖向该领域“蹭热点”,再正常不过。就像全球抗击新冠肺炎疫情期间,诺奖评委会也会向与疫苗相关的研究成果倾斜一样。

当然,向人工智能倾斜并不是短期效益的举动,把诺贝尔奖授给人工智能学者不是第一次,也不会是最后一次。高文举例说,1978年的诺贝尔经济学奖,就授给了赫伯特·A·西蒙(Herbert A. Simon)。西蒙教授时任卡内基梅隆大学教授,是人工智能三大学派中的符号主义学派的旗手。西蒙教授曾获得1975年的图灵奖,这和辛顿教授也曾获得2018年图灵奖类似,只是间隔更短一点。诺贝尔奖奖励委员会给西蒙教授的获奖理由是:“以表彰他对经济组织内部决策过程的开创性研究”。而图灵奖奖励委员会给他的获奖理由是:“以表彰他对人工智能、人类认知心理学和表处理的基本贡献”。外行很难看出这两个获奖理由有什么关联,实际上西蒙教授最重要的工作是和他的学生艾伦·纽威尔(图灵奖联合获奖人)一起,设计了基于逻辑推理的通用问题求解器GPS,可以应用于经济组织决策,因此就和经济学发生了关联。因此,如果说诺贝尔奖当年也是想蹭计算机科学和人工智能的热点,也不为过。

记者:什么样的研究成果能够获得诸如诺贝尔奖这一类的国际大奖?获奖成果的国际影响力如何评判?对我们有何启示?

高文:以往评奖可能在选定领域里寻找最原始最重要的贡献人,为了公正一般是在公开发表刊物中寻找,当然也有别的线索,比如在国际科学大赛中的获胜者中寻找。而今年的两个诺奖,都和国际科学大赛关系密切,这也是今年的一个特色。

先看今年的诺贝尔物理学奖。这一轮的人工智能浪潮,技术核心是深度神经网络,起点是2006年,核心人物是三个人,辛顿、本杰奥(Yoshua Bengio)和杨立昆(Yann LeCun),当年,他们分别发表了关于深度神经网络如何降维、分层训练以及快速训练的论文,也同时获得了2018年度的图灵奖。

但更多人认为,本轮人工智能红遍天的导火索是ImageNet比赛,如果没有这个比赛,也许根本没有今天人工智能几乎无所不在的局面。ImageNet是2007年由斯坦福大学教授李飞飞提出的,是利用互联网众包的方式建成的大规模图像数据库,其中含有超过1000万张经过标注的互联网图像,超过两万种图像类别,比如人、车、猴子、狗、落日等等。其后,李飞飞和她的学生利用ImageNet数据库组织了“大规模视觉识别挑战赛ILSVRC”。参赛队中,谁的图像分类算法得到的结果错误最少,谁就可以获得冠军。前两年,各参赛队八仙过海,使用基于不同理论和方法的模型,设计各种各样的分类算法。2010年获得第一名的队,错误率是28%;2011年获得第一名的队,错误率是26%。一年分类性能提高了2%,结果中规中矩。2012年,获得第一名的队是辛顿的学生,使用的是称为AlexNet的八层神经网络,错误率是15.3%,一下子性能提高了10%多,震惊赛场,让大家对深度神经网络刮目相看。2013年开始,参加大赛的队清一色都是用深度神经网络,只是层数、参数、网络架构等不同而已。所以,2012年的ImageNet分类比赛,常被人工智能同行称为是深度神经网络应用的“第一滴血”。

我认为,诺奖评委会应该是从人工智能深度神经网络的第一滴血AlexNet,顺藤摸瓜找到辛顿,再从辛顿找到霍普菲尔德。所以,辛顿和霍普菲尔德能够获得物理学诺贝尔奖,最重要的科学裁判就是ImageNet比赛。顺便说一句,2015年的ImageNet大赛,由何恺明、张祥雨、任少卿、孙剑等四人组成的微软亚洲研究院代表队获得了第一名,将错误率降低到了3.57%,超过了人类的平均值(5%)。他们所提出的ResNet网络成果,也获得了2023年未来科学大奖,奖金100万美元。所以依据这个裁判给出的判据,已经产生了至少两个科学大奖。

再看今年的诺贝尔化学奖,也是与科学大赛密切相关。蛋白质是由20种氨基酸排列组合的序列所形成的线性高分子,而不同氨基酸的序列编码能够折叠成非常不同的三维结构形状,从而可以承载蛋白质的不同功能。蛋白质的序列信息通过基因组测序可以批量获取,但这些序列所形成的三维结构主要通过实验方法解析。科学家使用昂贵的电子显微镜或者X射线晶体分析仪,需要花费几个月甚至几年时间,才能实验解析得到一个蛋白质的三维结构,这个过程耗时长、成本高。利用实验方法,全世界结构生物学家一年也就能解析一万多个蛋白质的三维结构,但已知的蛋白质的氨基酸序列数目已达10亿,因此靠实验方法来解析所有蛋白质结构,困难极大。科学家们一直尝试绕过实验,直接通过计算来精确预测蛋白质序列的三维结构。1994年,马里兰大学的John Moult教授等人发起了CASP(蛋白质预测关键评估)大赛,每两年举行一次。1994年到2016年的22年里,CASP比赛的结构预测精度提高进展不快,最好成绩也就40分左右(100分满分)。2018年的CASP13大赛,DeepMind公司用AlphaFold把分数提高到60分,达到及格线,而2020年的AlphaFold 2更是升到92分,成绩达到优秀,从而初步解决了蛋白质折叠预测这个困扰了生物科学界50年的难题。可见,正是2018年和2020年这两次CASP比赛,让AlphaFold和AlphaFold2得到科学界的认可,也才引起了社会对于人工智能引入科学发现的广泛关注。

我认为,德米斯·哈萨比斯和约翰·M·詹珀得奖,就是因为AlphaFold2在CASP中的表现优越,解决了生物学过去50年的重大挑战。因此可以说,德米斯·哈萨比斯和约翰·M·詹珀能够获得化学诺贝尔奖,最重要的科学裁判就是CASP比赛。

因此,科学大赛作为科学裁判,必须引起我们足够的重视。特别是在我们去“五唯”的今天,更要鼓励年轻研究人员积极参与所在领域的科学大赛,通过比赛增长才干、获得认可。