合作是一种普遍存在的现象,从病毒、细菌、变形虫到昆虫、社会动物、人类。如何让智能体学会合作对于一些应用来说至关重要,例如,自动驾驶,交通灯控制,多摄像头协同监控,多机器人控制等等。本研究组的主要研究内容是多智能体学习算法与边缘智能系统,致力于让多智能体系统实现像人类一样的合作。
基于注意力机制的多智能体通信
在多智能体场景中,智能体间的通信可以使智能体获得其他智能体的信息,从而帮助决策。全通信可以最大化智能体获得的信息量,但是智能体很难从这些冗余的信息中提取有用的信息。针对这些问题,我们首次提出了采用注意力机制的多智能体间动态通信模型,智能体在判断需要通信时与周围智能体组成通信组,通过共享信息帮助决策。这样的动态通信模型适应于大规模多智能体场景,可以有效降低通信代价。
图卷机多智能体强化学习
在高动态的多智能体环境中,很难提取智能体间的关系,而它对于多智能体合作来说至关重要。我们首次提出了图卷积多智能体强化学习:其中图卷积能适应动态的多智能体环境,关系核则能有效提取智能体间的关系,时序关系正则进一步促进多智能体间的合作。实验证实图卷积多智能体强化学习大幅优于其他多智能体合作算法。
AI@Edge
https://z0ngqing.github.io/project/