Nature Methods | 戴琼海/吴嘉敏团队提出对比学习细胞表征架构,引领大规模三维细胞分割与追踪
2025/10/21 10:32:55 《最新论文》 作者:Nature Methods 我有话说(0人评论) | 字体大小:-│+ |
介观活体显微成像等技术的不断进步,使得人们可以在活体中实现大范围、高分辨率的三维成像,获取覆盖整个组织的长时程动态影像。这些影像可覆盖从数百微米到厘米尺度的组织结构,呈现数千甚至上万个细胞在数小时或更长时间内的运动、分裂与相互作用,数据量往往达到TB甚至PB量级。这为我们深入理解免疫应答、组织修复和神经活动等复杂过程提供了前所未有的机会,但同时也带来了巨大的挑战:如何在如此庞大而复杂的三维时空影像中高效提取有价值的生物学信息,实现对大规模细胞形态与运动轨迹的快速、准确和稳定追踪,是制约高通量介观活体成像应用的数据瓶颈。
三维细胞跟踪主要面临三大难点:细胞的稳定检测,帧间轨迹的可靠连接,以及计算速度。在基于“检测+跟踪”的方法中,首先需要在每一帧中准确定位细胞所在的三维区域,随后在帧间完成匹配。要实现长时程的连续追踪,检测与匹配必须在成千上万帧影像中持续保持极高的准确率。然而,三维成像的标注极为困难,常因空间分辨率不均、轴向信噪比低或成像参数差异而产生标注损耗,严重制约了模型的泛化能力。与此同时,三维影像中细胞在相邻帧之间往往经历分裂、碰撞和非刚性形变,使得特征比较难以用统一方式实现,仅依赖固定窗口或单一特征提取难以保证稳定性。如果通过全局优化解决轨迹连接问题,能够在一定程度上减少对局部标注的依赖,但却往往需要处理全程数据,计算量极其庞大,并依赖长时延序列,往往需要数天乃至数周才能完成一个数据集的轨迹归纳。因此,在大规模三维成像的背景下,如何构建一种既能降低标注需求,又能实现高准确性细胞追踪的通用方法,成为该领域亟待解决的核心挑战。
针对上述挑战,清华大学戴琼海/吴嘉敏团队提出了 CELLECT(Contrastive Embedding Learning for Large-scale Efficient Cell Tracking),为三维细胞追踪提供了新的解决路径。该方法首次将对比学习思想引入三维追踪,并直接作用于细胞中心点,以每个细胞中心为单位实现特征学习。在模型结构中,CELLECT 通过多层级的中心点检测模块,同时提取细胞的中心位置、分割区域、尺寸信息以及嵌入特征向量(embedding),使基于图像的检测与基于细胞的对比学习能够在统一框架下优化。由此,细胞在三维空间中大小和形态的差异不再成为限制,模型可一次性获得影像中所有细胞的中心及对应特征,并利用嵌入向量的距离来完成相邻帧间的匹配。在训练过程中,CELLECT 仅需稀疏的中心标注,即可在潜在表征空间中缩小同一细胞在时序中的特征距离,同时扩大不同细胞之间的差异,从而实现高效且稳健的轨迹连接,从而极大地降低了用户使用门槛。这一“中心驱动”的策略显著降低了三维标注的难度,避免了因成像参数差异带来的泛化损耗,对细胞边界模糊与形态变化不敏感,并在跨数据集和跨成像方式的应用中展现出优异的鲁棒性与泛化性能。这一方法不仅比现有最高精度的同类细胞跟踪方法 Linajea[1][2]处理速度快了56倍,同时在国际权威的 Cell Tracking Challenge [3]中的三维活体数据集上(以THU团队名),获得了跟踪与分割双赛道的第一名。
图1. CELLECT流程示意图
在基础性能得到验证的前提下,研究团队进一步检验了 CELLECT 的跨模态和跨组织适用性。考虑到绝大多数实际应用场景中难以获得可用于训练的标注信息,所有后续实验均未进行任何额外标注或再训练,而是直接调用在 mskcc-confocal 数据上训练好的模型完成。实验结果表明,CELLECT 在完全不同的成像模式、组织结构和生物学问题中依然保持了稳定表现。这种“零迁移成本”的特性,使研究人员无需针对每个新实验重复训练,即可将 CELLECT 直接应用于大规模三维影像的自动化追踪,从而显著降低了研究门槛,并为其在生命科学中的广泛应用奠定了坚实基础。
图2. CELLECT方法在未训练SLFM成像上的效果,原始数据(左)CELLECT模型的分割confidence map(中)与中心confidence map(右)(GIF图)
在基础性能和跨模态泛化得到充分验证的基础上,研究团队进一步将 CELLECT 应用于更具挑战性的真实实验数据,以评估其在典型生命科学问题中的适用性。团队选取了三个具有代表性的大规模三维成像场景:小鼠淋巴结B细胞生发中心的形成、小鼠脾脏中免疫细胞与细菌的交互,以及果蝇脑在组织形变下的神经元活动。这三类数据涵盖了细胞免疫学与神经信号研究的典型应用场景,并各自包含独特的实验挑战,为全面验证 CELLECT 在复杂条件下的稳健性和适用性提供了理想平台。
在真实免疫学数据中,研究团队将 CELLECT 应用于小鼠淋巴结的长时程三维成像,重点解析了 B 细胞生发中心的形成过程[4]。生发中心是 B 细胞在免疫应答过程中发生增殖、分化与选择的关键场所,细胞数量庞大且运动活跃,追踪难度极高。研究人员采集了长达 1,352 帧、总量约 260 GB 的双光子合成孔径显微数据,传统方法常因细胞密集和频繁分裂而出现轨迹中断或误判。CELLECT 在无需额外标注的条件下,成功重建了生发中心中细胞的连续轨迹,并能够准确识别分裂事件。不同于传统软件在分裂处容易出现错误切割,CELLECT 的结果保持了轨迹的连贯性和完整性。这一成果不仅降低了免疫学研究中的数据处理门槛,还使得生发中心的动力学特征能够被系统量化,从而为理解适应性免疫应答机制提供了全新工具。
图3. 小鼠腹股沟淋巴结免疫反应后生发中心形成过程的跟踪和分裂事件监测
在小鼠脾脏的多通道三维成像数据[5]中,研究对象包括以膜标记方式成像的中性粒细胞和巨噬细胞,以及细菌信号。膜标注的细胞往往边界模糊、形态复杂,给检测与追踪带来额外挑战。CELLECT 在无需参数调整的条件下,能够同时在该数据中稳定检测并追踪多类对象,并自动识别长时程影像中的关键事件。模型在保持轨迹连续性的同时,还能对不同对象的交互过程进行清晰标注,显示出其在复杂多通道数据中的稳健性和适用性。
图4.单个中性粒细胞对细菌的吞噬事件观测和记录
在果蝇脑的长时程三维成像数据[6]中,由于颅骨手术等外力干预,脑区结构在成像过程中会发生塌陷并伴随持续的非刚性形变,使神经元位置不断偏移,增加了轨迹保持的难度。同时,功能成像中的神经元信号以闪烁形式存在,仅在高信号时刻明显,而在低信号时几乎不可见,这进一步加大了检测和追踪的挑战。在长达 14,800 帧(约 6,400 秒)的影像中,研究团队利用 CELLECT 成功保持了数百个神经元的三维轨迹完整性(仅针对在第一帧中已有信号的神经元),并在全程中准确提取出钙信号。与常用软件相比,即便在加入 2,000 帧长度的断点重连优化策略后,CELLECT 的追踪准确率仍提升了数倍,并能在剧烈的组织形变和信号波动下保持轨迹连续与信号稳定,展现出在复杂神经组织环境中的鲁棒性与实用性。
图5. 果蝇神经元塌陷情景下的跟踪效果。原始图像(左上)塌陷过程的时序投影(左下)典型跟踪样例(右)
通过在免疫学与神经科学三类典型场景中的验证,CELLECT 展现出在复杂条件下的卓越性能与广泛适用性。无论是细胞密集且分裂频繁的生发中心,膜标注条件下多通道对象交织的脾脏数据,还是伴随组织塌陷与信号闪烁的果蝇脑长时程成像,CELLECT 均能够在无需额外标注与参数调整的条件下保持轨迹的完整性与信号的稳定性。这一成果不仅突破了长期存在的三维标注与计算效率瓶颈,也表明对比学习驱动的中心点嵌入策略为大规模生物影像的自动化分析提供了可行的通用框架。
研究团队指出,未来将不断优化完善CELLECT的性能,提升使用便捷度以及功能复杂度,并逐步发展为通用开源的大规模介观数据分析平台。这一方向有望推动细胞动力学研究由单一实验向大规模、多维度和跨场景的数据驱动系统化探索转变,并在不同研究领域建立起统一的分析范式,为揭示生命系统的动态规律和复杂疾病机制提供新的研究手段。
清华大学自动化系博士后周鸿宇、研究科学家金成勋为该论文的共同第一作者,清华大学自动化系、脑与认知科学研究院、清华-IDG/麦戈文脑科学研究院戴琼海教授,吴嘉敏副教授为论文共同通讯作者。该工作得到了国家自然科学基金委的大力支持。
论文原文:https://www.nature.com/articles/s41592-025-02886-x
参考文献:
1.Hirsch, P. et al. Tracking by weakly-supervised learning and graph optimization for whole-embryo C. elegans lineages. Medical Image Computing and Computer Assisted Intervention (MICCAI) 25–35 (2022).
2.Malin-Mayor, C. et al. Automated reconstruction of whole-embryo cell lineages by learning from sparse annotations. Nature Biotechnology 41, 44–49 (2023).
3.Maška, M. et al. The Cell Tracking Challenge: 10 years of objective benchmarking. Nature Methods 20, 1010–1020 (2023).
4.Zhao, Z, et al. Two-photon synthetic aperture microscopy for minimally invasive fast 3D imaging of native subcellular behaviors in deep tissue. Cell (2023).
5.An, H. et al. Splenic red pulp macrophages eliminate the liver-resistant Streptococcus pneumoniae from the blood circulation of mice. Science Advances 11, eadq6399 (2025).
6.Fan, J, et al. Prominent involvement of acetylcholine dynamics in stable olfactory representation across the Drosophila brain. Nature Communications 16, 8638 (2025).