视频与视觉技术国家工程研究中心
论文题目:合作多智能体强化学习策略优化算法研究
论文摘要:下载此PDF 文件
答辩时间:2025年5月12日
答辩委员会主席:赵冬斌中国科学院自动化所研究院
答辩委员会成员:
刘勇中国人民大学高领人工智能学院长聘副教授
马思伟北京大学计算机学院教授
张史梁北京大学计算机学院长聘副教授
施柏鑫北京大学计算机学院长聘副教授
研究方向:多智能体强化学习
导师:卢宗青北京大学计算机学院长聘副教授
毕业去向:字节跳动
从左到右:张史梁、马思伟、赵冬斌、苏可凡、卢宗青、刘勇、施柏鑫