新闻动态
新闻动态

静园5号院科研讲座:圣母大学陈子仪教授谈深度学习与医学图像结合的挑战和发现

  2019年2月27日,圣母大学的陈子仪教授访问北京大学前沿计算研究中心,并在静园五院做了题为“Deep Learning and Medical Imaging Applications: Challenges and New Approaches”的学术报告。报告由中心讲席教授邓小铁老师主持,听众包括来自北京大学信息学院、数学学院,以及北京航空航天大学等院校师生。

  

陈子仪教授访问北京大学前沿计算研究中心

  

  在信息爆炸的当今时代,传统的医学方法已无法适应大量高维的医学数据,而已在许多领域获得突破性进展的深度学习,正可以分析海量数据,抓取关键信息。深度学习与医学图像分析结合已成为趋势。然而,深度学习的训练需要标记好的图像数据,而一张医学图像即有可能包含上亿的细胞,对图像中的细胞进行标记则需要用到医学专家的知识,在标记的过程中,还会遇到错标、漏标以及专家标记标准不统一等诸多问题;随着医学研究的发展,还会需要根据最新的研究结果不断地进行重新标记。光是对图像标记和检验标记的正确与否便要耗费巨大的人力与物力,在数据标记之后,还有如何处理高维图像的问题。

  

  

  在简要介绍深度学习和医学图像分析结合的现状和所遇到的困难之后,陈子仪教授为我们展示了他的团队针对以上问题做出的研究成果与进展。

  

  面对图像标记的困难,利用深度学习进行自动/半自动的标记,有选择地选取标记对象、减少标记量的同时尽可能地最大化信息量,成为一种研究的方向。陈教授团队据此提出“深度学习与主动学习(active learning)结合”的选择性标记方法,通过不断地训练、专家纠错的迭代过程来修正模型。

  

  

  在这个过程中,考虑到需要人为专家标错,模型训练的时间不能过长。基于此,该方法给出了一个新型的FCN模型,使用了更少的参数,减少了训练时间和复杂度。

  

  另一方面,如何定义标记区域的有用程度呢?该方法给出了“困难度”和“代表性”两个标准。

  

  

  在“困难度”方面,通过使用不同训练集训练的模型对相同数据集进行标记,其中不一致(不确定性)的地方则为“标记困难”的地方。

  

  在“代表性”方面,通过定义两块图像区域的相似度,通过最大相似度求和来定义“代表性”,最后找到“代表性”最强的候选标记区域。

  

  

  最后,由于“困难度”是最重要的标准,该方法将在最困难的图像中选取最有代表性的区域进行标记,从而可在减少标记两的同时尽可能地最大化标记带来的信息量。

  

  陈教授通过生动有趣的语言将这一方法讲述得易于理解,他团队提出的这一方法,在减少了50%标记量的情况下达到了现有水平。在这之后,由于时间原因,陈教授只能简要介绍了一下在极少量标记数据的情况下使用GAN解决问题的方法,及在硬件方面的合作等。最后,他提出了一些研究问题,留给同学们思考,期待感兴趣的团队与他合作。报告结束后,同学们就GAN在图像笔记领域的应用、医疗图像分割等问题踊跃提问,陈教授也耐心进行了解答,大家收获良多。

  

陈子仪教授在报告中