新闻动态
新闻动态

新人新语 | 姜少峰:立足前沿交叉的算法研究

  2021年,前沿计算研究中心又迎来了一位理论计算方向的新体制助理教授:姜少峰。收到北京大学入职通知时,他正在芬兰阿尔托大学任助理教授,是什么让他放弃了欧洲教职,选择回归呢?

  

  姜少峰,2017年在香港大学获博士学位,2021年6月加入北京大学前沿计算研究中心,任助理教授、博士生导师。加入中心前,曾在以色列魏茨曼科学研究学院(Weizmann Institute of Science)进行博士后研究,并曾在芬兰阿尔托大学(Aalto University)任助理教授。他的研究方向为理论计算机科学,近期侧重于大数据算法及其在机器学习中的应用,其成果在 FOCS,SICOMP,SODA,ICML,NeurIPS 等相关领域国际顶级期刊和会议上发表。姜少峰博士目前致力于理论计算机科学、数据科学理论基础等方面的教学和科研,并与国际知名机构积极展开合作,推进相关方向的人才培养和科研产出,提升中心的国际影响力。

 

  问:可否介绍一下你的研究方向?

 

  姜少峰:我的研究方向主要是理论计算机科学中的算法,目前专注于研究新兴的大数据、人工智能领域中的算法挑战。我的一个代表性的研究方向是高维数据上的算法。高维数据在最坏情况下通常是难以处理的,例如著名的“维数灾难”(curse of dimensionality)现象即广泛出现在包括机器学习、组合优化等诸多领域。然而,实际情况与这种理论最坏情况大为不同,存在着很多有效的针对高维、大数据的启发式方法。产生这种理论与实际不符现象的一个原因是传统上针对“最坏”情况产生的理论分析太过悲观,没有利用数据广泛存在的结构性质。因此,我的研究侧重于利用数据的本征维度来解决高维的问题。

 

  Doubling dimension 即是这样一种对度量空间本征维度的度量。由于很多高维数据都具有低本征维度(例如高维数据通常是稀疏的、且维度之间有相关性的),那些复杂性仅依赖于本征维度的算法将可以有效处理高维数据,从而成为解决“维数灾难”的一种重要方法。博士期间,我在 doubling metrics(具有低 doubling dimension 的度量空间的总称)上的近似算法方面做出了系统性的贡献,给出在 doubling metrics 上针对 TSP with Neighborhoods(发表于SODA 16,TALG 18)、Steiner Forest(FOCS 16, SICOMP 18)和 Prize-collecting TSP (TALG 20)等著名优化问题的多项式时间近似方案(PTAS)。这些结果本质上说明了对于很多难解几何优化问题,其计算复杂性仅需依赖其本征维度(而非欧氏维度)。

  

  问:可否介绍一下你的研究经历?

 

  姜少峰:博士毕业后,我在以色列魏茨曼科学研究学院师从 Robert Krauthgamer 教授进行了为期三年的博士后研究。魏茨曼科学研究学院的理论组实力突出,共产生过 Amir Pnueli,Adi Shamir,Shafi Goldwasser 等3位图灵奖得主。之后,我于2020年作为 tenure-track 助理教授加入芬兰阿尔托大学。在此期间,我的研究拓展到了大数据算法方面,并聚焦于一种叫做 coreset 的、旨在将大数据高效转化成小数据后进行数据分析的技术。该技术可用于设计并行/分布式算法、流算法等通常用于处理大数据的方法,具有广泛应用。我的一系列工作提出并研究了在多种具有特殊结构的数据上、针对聚类问题的 coreset,包括 doubling metrics(FOCS 18)、有限树宽图(ICML 19)和平面图(SODA 21)。除此以外,我的 coreset 研究还在应用领域取得了若干成果,发表于 ICML、NeurIPS 等机器学习顶会上。

  

  问:为什么选择离开芬兰回国加入中心?

 

  姜少峰:做出这个选择确实面临过困难。芬兰的工作短期来看是很有吸引力的:芬兰背靠欧洲学术圈,有着成熟纯粹的学术环境、良好的学术支持、极好的生活条件和文化氛围,而且 Aalto University 有一个非常强大的理论课题组(FOCS 19 Best Paper Award 的作者即在此工作)。但是长远来看,我还是坚定地选择回国加入中心。最重要的原因是北大聚集了世界上最顶尖的学生,是芬兰等小国所不能比拟的,与他们合作是非常有成就感和令人振奋的,并且这些优秀学生也将最终决定我事业发展的高度上限;同样重要的是北大、国家给予我的支持以及整个国家蒸蒸日上的发展前景;另外作为独生子女的家庭责任、中华文化归属感等也都是不可忽视的因素。

  

  问:可否谈谈你对未来工作的展望?

 

  姜少峰:科研上,我认为好的理论计算机科学研究应该立足解决当下最重要的计算挑战,譬如大数据上的有效算法,以及人工智能方面的有关计算理论。我认为在这些方面的研究将大有可为,并且我也一直把自己定位为这样一个广义上的理论计算机科学研究者——作为我科研的一个特色,我不仅研究传统上的理论计算机科学问题,而且还用理论计算机科学领域中基于严格数学推导的方法论来研究脱胎于其他领域的计算挑战。我的研究不止发表在理论领域的顶会、顶刊,还发表在机器学习、网络等领域。

 

 

  除了科研,教学也是很极为重要的方面,尤其是放在北大以及图灵班的大背景下。坦率地说,我在北大见到的很多年轻人都有比我高得多的天资,我感到自己有责任帮助他们最大限度地发掘自己的聪明才智。具体来说,我打算结合我最近在大数据理论方面的研究,开设一门《大数据算法》课程,不仅介绍流算法、coreset、sketch 等现代的处理大数据的技术,还要注重结合编程实践,把我在 Aalto 期间教授的一门大课(650人)有关大数据编程框架的内容结合进来。同时,我也准备好指导本科生科研,担当起科研启蒙导师的角色。

  

  问:你对中心的初印象如何?

 

  姜少峰:印象最深的是中心的同事和同学们:图灵班的同学们都十分优秀,新老师都年轻有为、志同道合,中心里比较资深的老师们则都很关心我们的发展,在需要帮助的时候,会提供非常有益的建议。我为能加入这个优秀的团队感到自豪。另外,我非常喜欢的一点就是北大相对完备的 tenure track 制度,还有中心自由宽松的文化氛围、静园五院安静优雅的工作环境、行政团队专业高效的支持,使我们可以心无旁骛地发展学术事业。