新闻动态
新闻动态

前沿计算研究中心2019级博士学位论文答辩顺利完成

  2024年5月24日,前沿计算研究中心2019级博士学位论文答辩工作顺利完成。中国人民大学副教授祁琦、王子贺,中心执行主任邓小铁教授,中心助理教授孔雨晴、程宽、王若松作为答辩评委参加。2位2019级博士生进行了毕业论文报告并顺利通过答辩,1人获评北京大学计算机学院优秀博士论文。祝贺!

 

陈昱蓉答辩合影

 

王骞答辩合影

 

2024年度北京大学计算机学院优秀博士论文

学习智能体参与的博弈:私有信息学习、使用与协同

陈昱蓉,计算机学院2019级博士生

 

      博弈论被广泛用于建模研究多智能体交互的实际场景,其中不同智能体拥有不同的利益,受彼此的决策所影响。博弈论的一个核心议题,是在假设模型已经构建的情况下,通过各种解概念来预测博弈结果。这些博弈模型通常认为所有的博弈参数,比如博弈结构、信息结构、玩家的策略空间以及玩家的效用函数等,是部分、完全公开的,或者在玩家之间形成了某种公共知识。然而,许多实际情况中,不论是博弈论研究学者,还是参与博弈的博弈玩家,她们都几乎无法直接获取所有博弈参数。例如,建模推荐系统的序贯博弈中,用户的效用函数通常是用户的私有信息。

 

      在这种情况下,机器学习作为一种工具,尝试从数据和与博弈玩家的互动中学习这些难以直接获得的博弈参数。然而,当拥有私有信息的玩家意识到他们的信息正在被学习时,作为保卫隐私的手段,他们有动机修改所提供的信息给学习算法。当这些学习算法的学习结果会影响他们的利益时,玩家有可能通过精心设计提供给算法的信息,改变学习算法结果,从而达到提升自己效用的目的。

 

      因此,基于上述讨论,本论文考虑机器学习智能体参与的私有信息博弈问题,重在综合机器学习和博弈论的双重视角,聚焦于私有信息的学习及私有信息的策略性使用这两个该博弈中的基本算法问题,从学习理论、算法设计和性质刻画等角度,探索私有信息学习和使用的能力边界。本论文尤其侧重于新视角的引入对双方研究的改变,为机器学习和博弈论可靠、高效地应用于实际,平衡私有信息的学习与隐私保护打下基础。

  

陈昱蓉与论文指导老师邓小铁合影

 

重复拍卖中带预算约束的无悔学习

王骞,计算机学院2019级博士生

 

      随着越来越多的在线广告通过实时拍卖的方式出售,自动出价已经成为广告主在当今在线广告市场中优化广告宣传日益重要的工具。自动出价算法的设计具有两个关键要求:第一,需要引入成本控制策略来保证投放周期内的总支出不超过给定预算约束;第二,需要有能力学习当前竞争环境以优化出价策略,降低后悔值(Regret)。因此,可以将自动出价算法的设计问题建模为重复拍卖中带预算约束的无悔学习问题,该问题近年来得到了学术界和工业界的广泛关注。

 

      然而,以往关于自动出价算法的研究存在一定的局限性,许多实际应用场景尚未得到充分探讨。从成本控制策略的角度看,大部分研究聚焦于配速出价,而忽略了其他流行的成本控制方式。从广告拍卖机制的角度看,大部分研究侧重于诚实拍卖,而少有工作针对非诚实拍卖情形下带预算约束的自动出价开展研究。此外,从广告竞价主体的角度看,大部分研究着眼于为在线广告市场中的单个广告主设计自动出价算法,而在实际情况中,广告主普遍会把出价任务委托给专业的广告代理。这些代理有机会利用多方信息设计合作出价算法,从而同时提高多位广告主的收益,但这方面的研究相对稀缺。

 

      本研究积极探索了自动出价算法的前沿领域,尝试在更加真实且复杂的应用场景中设计并分析自动出价算法,帮助优化广告投放效果,提高整个广告市场的运行效率。

 

王骞与论文指导老师孔雨晴合影

 

中心2019级博士学位论文信息

按学生姓氏首字母排序,*为优秀毕业论文

 

1. 陈昱蓉*:学习智能体参与的博弈:私有信息学习、使用与协同
2. 王骞:重复拍卖中带预算约束的无悔学习