pic
综合新闻
当前位置: 首页 > 新闻公告 > 综合新闻
浙江大学智能创新药物研究院开发UniMap模型用于提升单细胞数据整合与细胞类型注释效能
2025.03.03

单细胞分析技术已成为理解细胞层面生命活动机制的重要手段,在生物医学、疾病诊断和药物开发等领域应用广泛。其中,细胞类型注释是单细胞转录组数据分析的核心步骤之一,为下游分析和新生物机理发现奠定基础。然而,单细胞数据分析面临着高维度、高稀疏性以及高噪声等技术难题。特别是由测序平台、样本处理方法及操作人员差异引起的批次效应(Batch Effect),严重影响了不同来源数据的整合分析与结果可靠性。虽然近年来基于人工智能的自动注释工具在批次效应矫正方面取得了一定突破,但随着研究规模扩大和复杂度提升,现有方法仍面临两大关键挑战:首先,不同数据集中的细胞类别往往只是部分重叠(Partial Overlapping)。现有方法往往通过消除数据集间整体偏差来解决批次效应,这基于不同来源的数据在特征空间中数据分布一致的假设,使得其难以有效应对细胞类别存在差异的情况。其次,现有方法往往忽略数据集间细胞注释的分辨率差异,导致数据集整合过程中往往丢失精细的细胞亚型信息,从而无法充分利用高分辨率参考图谱进行自动化注释。

针对上述挑战,浙江大学智能创新药物研究院杨波教授、曹戟教授团队联合谢昌谕教授团队开发了一种基于选择性对抗网络的监督深度学习模型—UniMap。该模型创新性地采用逐类别的数据整合策略,能够有效处理部分重叠数据集的整合及自动注释问题,显著提升生物差异保留能力。在与当前十种最先进模型的对比实验中,UniMap在处理部分重叠数据集整合、高精度注释以及构建全面图谱等方面均展现出最为平衡的性能表现。相关研究成果于2025年2月27日以“UniMap: Type-Level Integration Enhances Biological Preservation and Interpretability in Single-Cell Annotation”为题在权威期刊Advanced Science在线发表。

960b16b449aa188687e4fa75a2e72c5e.png

该工作首次将选择性判别网络应用于部分重叠的单细胞数据整合及注释任务。通过实现细胞类型级别的数据整合,UniMap有效避免了批次效应的过度矫正,为解决细胞类别不一致问题提供了新思路。该模型还内置了一套动态权重评估机制,能够量化不同数据集中细胞及细胞类别的重要程度,从而精准识别数据集间的共享和差异的细胞类型,有效降低干扰细胞类型的干扰。此外,UniMap所学习的权重知识可进行直观的可视化呈现,实现了细胞和类别层面的模型可解释性分析,这不仅有助于深入理解模型的决策机制,还为提升下游分析的可靠性提供了有效的质量控制手段。

UniMap模型在部分重叠数据集整合任务中取得SOTA表现

UniMap模型在处理部分重叠的单细胞数据集整合任务中表现出优越性能。以整合不同常见变异性免疫缺陷(Common Variable Immunodeficiency, CVID)患者的外周血单核细胞(Peripheral Blood Mononuclear Cells,PBMC)数据集为例,研究团队通过模拟真实世界的部分重叠情况删除部分类型细胞,结果显示UniMap在生物学信息保存方面表现最佳,批次效应纠正方面排名第三,综合性能领先其他方法。其独特的权重机制成功识别干扰细胞类型,避免了过度校正问题。

UniMap模型具有广泛的应用场景

此外,UniMap还展示了其在多种应用场景中的优越性能。在骨髓来源的单细胞数据整合中,UniMap强大的生物信息保留能力允许其能够精确捕捉和重现造血干细胞的分化路径;面对注释分辨率差异的挑战,UniMap能将粗粒度的查询细胞根据参考图谱自动注释为高精度细胞亚型;这些能力允许UniMap能够通过整合不完整的、注释分辨率不一致的多个小型单细胞数据集,以生成疾病特异性单细胞图谱,研究团队利用UniMap生成了重症肌无力综合征患者的免疫细胞图谱,并发现了单核细胞簇中两个此前未定义的亚型。此外,在跨物种分析方面,UniMap使用人类眼部房水流出途径细胞图谱成功实现了跨物种的有效注释,并且通过权重机制识别出物种间差异较大的细胞类型,排除了预测置信度低的细胞,有效提高了下游分析的可靠性。

该工作为解决单细胞数据整合与注释领域的长期挑战提供了创新解决方案,有望推动大规模单细胞图谱构建和细胞异质性研究的进一步发展,成为精准医疗和疾病机理研究的有力工具。浙江大学工程师学院胡海涛硕士研究生和药学院博士研究生郭越为论文共同第一作者,杨波教授、谢昌谕教授和曹戟教授为共同通讯作者。

浙江大学智能创新药物研究院致力于有组织集成式创新,始终坚持国家战略导向,专注于创新药物的研发,通过AI制药关键技术体系突破引领原创新药研发,为国家新质生产力发展贡献力量。


返回