祝贺 | 陈昱蓉荣获北京大学优秀毕业生和计算机学院优秀博士论文
近日,北京大学优秀毕业生与计算机学院优秀博士论文评选结果确定。前沿计算研究中心 DaGAME 实验室博士毕业生陈昱蓉同学荣获2024年度北京大学优秀毕业生和计算机学院优秀博士论文奖。
陈昱蓉与导师邓小铁教授合影
博士学位论文介绍
学习智能体参与的博弈:私有信息学习、使用与协同
本论文考虑学习智能体参与的私有信息博弈问题,该博弈是由于机器学习广泛应用而涌现的重要的新兴博弈场景,理解其中的玩家行为将为机器学习和博弈论可靠、高效地应用于实际,平衡私有信息的学习与隐私保护打下基础。本论文重在综合两个领域的视角,聚焦于私有信息的学习与策略性使用的两个基本算法问题,从学习理论、算法设计和性质刻画等角度,探索私有信息学习和操纵的算法能力边界,并且尤其侧重于新视角的引入对双方研究的改变。
在学习私有信息方面,本文研究了:合同设计中的最优合同学习。本研究提出了两种学习算法,在文献中的两个假设——一阶随机占优和分布函数的凹性条件下,能够通过多项式数量的查询找到近似最优的有界合同。技术上,与以往的研究关注如何高效地离散化策略空间不同,本研究注重学习问题实例的结构性质;结果上,本研究结果表明这两个假设可以改进一般情况下的指数下界。
在理解博弈玩家对私有信息策略性使用方面,本文研究了:斯塔克尔伯格均衡下跟随者的效用设计。本方向的第一个研究,聚焦于跟随者在完美信息拓展形式博弈中最优地选择效用函数以模仿的算法问题。对于考虑的四种情况,本研究完全刻画了跟随者通过模仿某个效用函数能够诱导得到的可能的博弈结果,并提供了计算最优函数以最大化真实效用的多项式时间算法。研究的第二部分关注双矩阵博弈中此问题的查询版本,证明了,通过多项式数量的查询和操作,跟随者可学到足够的领导者的效用信息,找到最优的效用函数。本研究是第一个从跟随者角度在非完全信息条件下学习领导者私有信息的研究。
在利用信息优势进行策略协同方面,本文研究了:重复在线广告拍卖中的竞价协同。本研究关注带预算约束的重复二价拍卖,提出了协同竞价在线算法,从理论和实验两个方面保证了参与协同竞价的每个人相对于独立竞价下的效用提升。并且,本研究证明所提算法具有良好博弈性质。之前的工作大多研究一个竞价者的算法设计,本研究创新性地研究了多个玩家的协同竞价算法,并得到了理论和实验的保障。
陈昱蓉博士答辩现场
获奖者简介
陈昱蓉,北京大学计算机学院2019级博士生,导师为北京大学讲席教授、前沿计算研究中心执行主任邓小铁。她的研究方向为算法博弈论和计算经济学,聚焦于学习智能体参与的博弈中的私有信息的学习、利用与协同问题,科研成果在 IJCAI、WINE、ICML、NeurIPS、KDD、ACM EC 等国际顶级会议上发表。其中,她关于斯塔克尔伯格均衡下跟随者的效用谎报问题的研究获得了 WINE 2022 国际会议的最佳学生论文奖。陈昱蓉曾获得北京大学三好学生、鸿升奖学金、社会工作奖等奖励。博士毕业后,陈昱蓉将加入机器学习泰斗 Michael Jordan 教授团队作为博士后继续进行学术研究。
陈昱蓉获WINE 2022最佳学生论文奖
导师简介
邓小铁,北京大学讲席教授,ACM/IEEE /CSIAM Fellow,欧洲科学院外籍院士。主要科研方向为算法及博弈论、互联网经济、在线算法,及并行计算。作为项目负责人,他曾承担十几项加拿大、香港、英国,及国家基金委科研项目,并担任多种国际期刊编委。发表论文200余篇,被引用上万次;多次做国际学术会议特邀报告;曾获得 IEEE 理论计算机学术会议 FOCS 最佳论文奖;其成果“关于图与组合优化的若干经典问题的研究”获2015年度高等学校科学研究优秀成果奖。应用方面获得多项美国专利及国家专利。
陈昱蓉毕业感言
我在五院度过了博士五年的绝大部分时间。这里留下了我的泪水与欢笑,承载了我的焦虑与喜悦。每一个开心的瞬间,都有老师与同学与我一同分享;每一个难熬的时刻,也总有人听见我的苦闷,给予帮助与陪伴。中心早已成为我家一样的地方。感谢一路上遇见的老师与朋友,我才有足够的勇气与信心,可以克服困难,顺利毕业。