本文介绍由亚马逊的研究团队推出的应用于生命科学的图神经网络指南《Graph Neural Networks in Life Sciences: Opportunities and Solutions》,这个工作发表在2022年数据挖掘顶会KDD上。图结构数据在生命科学以及医疗场景无处不在,最近很多研究把原来依赖于描述性数据分析的问题转化成依赖于生物网络的问题,例如图神经网络 (GNNs)。与其它领域相比,生命科学的问题有其自身的独特性和细微的差别。首先,这份指南比较全面地介绍了生命科学中的各种图结构数据,基于这些数据的生物和医学问题,以及相关的基于图机器学习的算法;随后,作者提供了四类基于GNN的解决方案的编程指南,每一种方案都提供了python代码和比较详细的说明,这四类问题包括:1)小分子属性预测;2)大分子属性和功能预测;3)基于双图(bi-graph)的蛋白质-配体对亲和力预测;4)利用知识图谱进行医学预测。所有代码都基于深度学习库DGL-lifesci和DGL-KE。
Wang, Zichen, et al. "Graph Neural Networks in Life Sciences: Opportunities and Solutions." Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. 2022.