报 告 题 目:单细胞数据缺失值插补的若干问题研究
主 讲 人:张 本 龚
单 位:武汉纺织大学
时 间:11月30日15:00
腾 讯 ID: 850-342-361
摘 要:
细胞是构成生命的基础单元,生物学表征的研究,离不开对细胞的深入分析。无论是单细胞生物还是多细胞生物,单个细胞之间的差异都可以产生不可估量的影响。迅速发展的单细胞转录组测序(scRNA-seq,single cell RNA sequencing)技术为在高通量、高分辨率的单细胞层面研究细胞功能及其背后的基因调控机制提供了重要技术手段。单细胞测序可以检测不同的组学种类,例如,转录组、染色质开放组、DNA 甲基化组、组蛋白修饰组等。对于不同组学技术产生的数据进行整合分析有助于更全案的刻画细胞内的基因调控状态、解释调控机制。然而,与传统Bulk 数据相比,单细胞数据具有规模大、噪音高、异构性强等特点。虽然单细胞测序技术为深入研究细胞功能提供了机会,然而这项技术也带来新的挑战。由于其不同组学单细胞数据具有上述特点,特别是高噪音中数据缺(dropout)与批次效应(batch effect)严重影响了下游分析的可靠性,以及掩盖了基因与基因间的重要关系。本次报告主要聚焦如何对多组学单细胞数据缺失值进行插补的若干问题进行研究。首先,对现有的细胞缺失值方法进行分类;然后,给出两种插补的策略:第一、基于负二项分布的分治插补;第二、基于图注意力网络的深度学习插补策略。分别用聚类评估和插补评估,在不同的单细胞数据集进行了验证,表现出良好的聚类和插补效果。
简 介:
张本龚,男,湖北十堰人,中共党员。东京大学博士后,教授、硕士生导师、湖北省楚天学者。中国运筹学会计算系统生物学分会理事、湖北工业与应用数学学会常务理事、湖北生物信息学会理事。美国西北大学、美国乔治华盛顿大学访问学者。现任武汉纺织大学科学技术发展院副经理兼基础研究与高新技术处处长。历任武汉纺织大学数学与计算机学院副经理、数理科学学院副经理。研究领域为计算系统生物学、生物信息学、微分方程与动力系统。目前主要研究兴趣:单细胞数据分析。在国内外重要期刊如Plos Computational Biology、PRE、IJBC、JCP、AMC、PLA、BMC Systems Biology 等发表学术论文近40篇。现主持国家自然科学基金面上项目1项,先后主持并完成国家自然科学青年基金1项、湖北省自然科学基金1项。多次应邀到日本、美国等国(境)内外参加国际学术会议并做邀请报告和访问研究。