多组学技术使我们能够系统地理解不同层次之间的信息传递。大规模和单细胞测序技术以及与之相关的多组学计算方法的进步,极大地支持了系统生物学和精准医学的发展。多组学技术和分析已广泛应用于神经科学研究,涵盖了从分子层面的变化检测到这些变化在不同大脑区域的定位。单细胞测序技术已经彻底改变了我们对大脑基本组成的视角,重塑了我们审视细胞基础的方式。这些技术将复杂的生物系统分解为单个细胞元素,提供了对大脑细胞群体的超高分辨率探索。此方法还有助于描述具有不同功能特性的细胞亚群,推断塑造细胞特性和细胞类型特异性反应的调控机制,并建立与大脑发育和疾病的关联。本课题组通过计算生物学和生物信息学的方法和手段开展基于多组学大数据的系统生物学分析,主要研究方向包括: 

  1. 多组学数据整合新方法开发 

   多组学数据往往具有特征数目远多于样本数目的特点,如何将复杂的多维数据进行有效整合并得到有效信息是生物信息学领域的关键也是热点问题。本实验室从不同数据特点出发,结合深度学习模型,开发对包括单细胞转录组学、染色质可及性、空间转录组学以及蛋白质组学等多组学的整合分析新策略。这些新的方法对我们深入理解疾病的分子机制、鉴定新的分子标志物以及认识分子基础和表型的关系具有重要意义。 

  2. 基于单细胞多组学数据的大脑细胞图谱研究 

   大脑由多种细胞类型组成,它们相互连接以形成支持大脑认知和行为的特定神经回路。单细胞多组学方法的进展使我们能够全面了解大脑的细胞和分子组成,进而理解大脑复杂功能的分子基础。通过整合单细胞多个组学的数据,我们采取不同的分析方法来揭示灵长类大脑的细胞组成,理解进化过程中细胞和分子多样性背后的分子基础,并通过计算分析鉴定灵长类大脑在疾病、发育和衰老过程中的分子标志物。 

  3. 基于深度学习的基因编辑工具开发 

  CRISPR-Cas系统的高效性和简洁性大大促进了其在生命科学研究各个领域中的应用,但是如何选择最优的编辑器和sgRNA仍面临许多挑战。我们通过构建深度学习模型对多种基因编辑工具的sgRNA编辑效率和脱靶效应进行学习和预测,从而实现in silico选择最优的向导RNA用于体内实验。同时,我们通过开发基于组学数据的计算流程,评估、改进并开发新一代的高效、持久并且高安全性的基因编辑工具用于疾病的治疗。 

孙怡迪

研究组长