根据两篇报道(《中国科学报·成功脱“单,一次看清百万细胞”》与《科技日报·国产新技术打破传统单细胞测序局限》)融合提炼后的完整报告


🧠 虚拟细胞发展报告

(基于 Stereo-cell 技术与百亿细胞联盟的生命智能化进展)

资料来源:《Science》2025年8月报道、华大生命科学研究院发布会、《中国科学报》《科技日报》同步报道


一、研究背景:从单细胞到虚拟细胞

在生命科学研究中,单细胞测序技术的出现使得科学家得以观察个体细胞的分子特征,揭示细胞异质性。然而,传统液滴微流控技术存在诸多限制,如:

  • 仅能捕获转录信息,缺乏形态与空间维度

  • 难以处理大尺寸或特殊形态细胞;

  • 通量受限、样本偏倚明显;

  • 数据批次差异较大,难以构建系统性生命图谱

因此,科学界逐渐从“单细胞测序”迈向“多模态整合与智能化解析”,并催生了“虚拟细胞(Virtual Cell)”的研究方向:

通过多组学、多时空、多细胞交互数据的融合,构建可计算、可模拟、可预测的细胞数字孪生体,为生命科学提供底层规律模型。


二、核心技术突破:Stereo-cell

研发机构:华大生命科学研究院(牵头)
联合单位:基因组多维解析技术全国重点实验室 + 多家科研机构
发表期刊Science(2025年8月)

(1)主要创新

技术方向 创新内容 突破意义
多模态整合 同时捕获细胞的转录、蛋白信号与形态信息 从单维测序到“立体细胞画像”
原位动态捕捉 支持在芯片上直接培养细胞并动态测序 解析基因表达与细胞迁移的时间演化
极限样本兼容 可测异形细胞、大体积细胞(如肌纤维、卵母细胞) 打破传统技术无法覆盖的样本边界
百万级通量 一次实验捕获百万细胞,精确识别稀有亚群 具备支撑AI模型训练的数据规模

(2)技术原理

  • 采用 高密度DNA纳米球阵列芯片(DNB Array),小球直径220 nm,间距500 nm;

  • 通过静电吸附实现细胞原位捕获,无须液滴分隔;

  • 结合显微成像与空间定位,实现“CT扫描+GPS定位”式细胞解析。


三、数据引擎与战略联盟:百亿细胞联盟(10BC Alliance)

(1)成立背景

依托 Stereo-cell 技术,2025年8月22日成立“百亿细胞联盟(10 Billion Cells Alliance)”,由华大牵头、18家科研机构联合发起。

(2)战略目标

层级 建设目标 内容
数据层 构建“三大细胞宇宙数据库” 包含生命图谱、疾病图谱、扰动响应图谱
模型层 构建虚拟细胞与AI细胞大模型 学习生命系统的时空规律与响应机制
系统层 推动生命科学从“数据储备” → “智能驱动” 形成AI驱动的智能诊疗与药物研发体系

(3)关键理念

  • Stereo-cell 不仅是实验平台,更是生命数据引擎

  • 虚拟细胞系统 是未来生命研究的核心方向,用于模拟真实细胞的动态与相互作用;

  • 数据开放共享:联盟计划推动全球科研团队共建共享,促进虚拟细胞与细胞AI模型的协同研发。


四、虚拟细胞系统的核心概念

模块 内容 说明
数据获取层 来自多模态、原位测序的单细胞数据 转录 + 蛋白 + 形态 + 时空维度
数据整合层 AI驱动的多模态融合与特征学习 构建高维细胞特征空间
模型建构层 建立虚拟细胞数字孪生体 可模拟细胞状态变化与相互作用
应用层 疾病机制建模、药物筛选、再生医学 实现“虚拟实验”与智能诊疗

五、国际对比与前瞻意义

项目 技术基础 数据维度 目标规模 核心差异
CZI 十亿细胞项目(Meta & Chan Zuckerberg Initiative) 传统液滴单细胞测序 转录组 10⁹ 级细胞 缺乏形态与空间信息
华大 Stereo-cell + 10BC 联盟(China) DNB芯片原位捕获 多模态 + 空间 + 时序 10¹⁰ 级细胞 支撑虚拟细胞与AI生命模型
CellForge / Geneformer / SToFM 等模型 深度学习 + 转录组数据 分子层面 10⁶–10⁸ 级 数据仍依赖旧一代测序平台

六、科学与产业意义

  1. 理论突破

    • 从描述性生物学向系统性、预测性生物学转型;

    • 有望揭示生命的底层计算规律与细胞动态机制。

  2. 数据基础

    • 形成百亿级多模态细胞数据库,为AI生物模型提供训练基石。

  3. 应用前景

    • 促进精准医疗、药物筛选、疾病防控与再生医学研究。

  4. 产业转型

    • 推动生命科学由“组学数据产业”向“智能生命产业”演进。


七、总结:迈向智能生命科学时代

Stereo-cell 技术的诞生标志着细胞研究从二维单模态迈向立体多模态,从数据采集迈向智能解析。
以此为基础的“百亿细胞联盟”正在通过 AI 大模型构建虚拟细胞系统,致力于实现从 数据 → 理论 → 智能诊疗 的系统性跃迁。
这一进程不仅代表中国在全球细胞组学与AI生命模型领域的原创性引领,也意味着生命科学正在进入 数据智能驱动的新纪元


是否希望我帮你将这份中文报告再生成一个 英文科研综述版(适合论文或基金申报的国际化文本)
我可以保持术语(如 Stereo-cell, Virtual Cell, 10BC Alliance, AI-driven life modeling)一致,并优化为自然科研英语风格。

目前有依托依托 Stereo-cell 技术得到的生物数据库吗?

Stereo-cell 严格来说是华大智造(MGI/STOmics)Stereo-seq(空间转录组测序技术)基础上发展的一项整合性技术。它旨在实现多模态整合(形态、转录、蛋白)原位动态捕捉

目前,基于 Stereo-cell 核心技术产生的大规模生物数据库已经存在,并且正在积极建设中。

依托 Stereo-cell 核心技术的生物数据库

虽然“Stereo-cell”这个特定的名称是最近发布的,但它的底层技术 Stereo-seq (Spatial Enhanced Resolution Omics-sequencing) 已经积累了大量数据,并有对应的数据库和数据门户

1. STOmics 空间组学数据库 (STOmicsDB)

这是目前最主要的、公开的、存储 Stereo-seq 数据的平台。

  • 平台名称: STOmicsDB (Spatial TranscriptOmics DataBase)

  • 核心内容: 它是一个综合性的门户,致力于促进时空组学数据的探索和学术研究。它收集、归档并提供Stereo-seq技术产生的大量数据集。

  • 数据特点: 这些数据包含了高分辨率的基因表达信息(转录组)以及对应的空间坐标。其中许多项目如小鼠胚胎发育图谱等,已经展示了时序信息(不同发育阶段)和高通量、大视场的特点。

  • 用途: 学术界可以访问这些数据进行分析、可视化,甚至下载用于构建自己的计算模型,包括数字孪生的初始数据基础。

2. “百亿细胞联盟”数据资源

根据公开信息,基于 Stereo-cell 技术的突破,国内相关机构联合成立了“百亿细胞联盟”。

  • 核心目标: 该联盟旨在利用 Stereo-cell 技术的百万级通量多模态整合能力,绘制细胞图谱,并最终构建虚拟细胞(即数字孪生)。

  • 意义: 虽然这不是一个传统意义上的公开数据库,但这个联盟的工作产物,尤其是其绘制的大规模细胞图谱虚拟细胞模型的底层数据,将是未来最大的生物数字孪生数据来源。

总结与数字孪生关联

你的问题强调了“依托 Stereo-cell 技术”,而该技术的核心正是:

  1. 高分辨率/大视场: 百万级细胞。

  2. 多模态: 形态、转录、蛋白。

  3. 动态: 原位动态捕捉(时序信息)。

STOmicsDB 已经为你提供了空间 + 转录的大量高分辨率静态数据。而真正的多模态(形态+转录+蛋白)动态(时序)Stereo-cell 数据集,正处于快速生成和汇集阶段。

要构建你的生物数字孪生,你应该:

  • 从 STOmicsDB 入手: 熟悉其数据格式和分析流程,利用已有的高分辨率空间转录组数据作为底板。

  • 关注最新研究: 密切关注华大智造及其合作机构基于 Stereo-cell 技术的最新论文和数据集发布,尤其是那些包含蛋白(如 Stereo-CITE)时序信息的项目。

这些数据库将是你的多组学+空间+时序数字孪生模型的“养料”。

Stereo-cell 技术的核心潜能之一:是否能“还原细胞动态交互”

一、先明确“动态交互还原”的含义

在细胞组学与虚拟细胞研究中,这个概念可以拆成三个层次:

层级 含义 对应分析手段
1️⃣ 静态交互 不同细胞在空间上相邻、信号配受体配对 空间转录组 + 分子互作分析
2️⃣ 时序动态交互 随时间推移细胞表达谱与形态的变化 时序转录组 / 动态培养测序
3️⃣ 实时行为还原(真实“交互”) 观察细胞迁移、接触、囊泡交换、信号传递等动态过程 实时成像 + 原位测序 + 多模态追踪

Stereo-cell 在当前阶段,已经实现了 第 1 层 + 部分第 2 层 + 局部第 3 层,但还未能做到完全的“实时动态交互重建”。


二、Stereo-cell 的动态捕捉能力

根据 Science 论文:

Stereo-cell 支持在芯片上直接培养细胞,实现原位动态测序,捕捉基因转录活性变化,并保留空间位置与时序变化信息

成功脱“单”,一次看清百万细胞_本报记者__刁雯蕙

✅ 已实现的动态维度:

  1. 原位培养与动态测序

    • 细胞不需被破坏或转移,即可在同一芯片上连续采样。

    • 能检测到基因表达的时序变化,形成“细胞演化轨迹”。

    • 实验中已用于观察 成纤维细胞迁移和纤维化过程

  2. 细胞间互作信号捕捉

    • 通过空间位置与基因表达模式,识别相邻细胞间的 配体-受体信号网络

    • 可解析 细胞外囊泡的时空分布规律物理接触细胞间的互作信号

  3. 多模态记录

    • 同时采集形态学、转录组和蛋白组信息;

    • 相当于为每个细胞建立“多维快照序列”,支持推断其动态轨迹。


⚠️ 当前的技术局限(为何还不能完全“还原交互”)

限制类型 具体表现 原因 / 技术瓶颈
时间分辨率受限 虽然可做“原位动态测序”,但时间步长通常以小时计,而非连续实时 核酸捕获与测序本身仍需固定与裂解步骤
交互为“推断”而非直接观测 目前通过空间共定位与信号通路推测细胞通信,而非直接观测信号流 缺乏实时活细胞成像与分子追踪结合
数据整合挑战 多模态时空数据融合仍依赖AI推理模型 尚无标准化动态重建算法或虚拟孪生体系

🔭 三、向“动态交互还原”的过渡路线

Stereo-cell 被视为一个通往虚拟细胞系统的桥梁
其演进路线大致如下:

阶段 核心能力 技术基础
Stereo-cell 1.0(当前) 原位捕获 + 多模态测序 + 时序追踪 DNB芯片 + 原位测序
Stereo-cell 2.0(规划中) 加入实时成像、可逆标签、AI轨迹重建 光遗传 + AI轨迹推断
虚拟细胞系统阶段 构建细胞动态孪生体,模拟信号传导与互作网络 多模态AI大模型(10BC联盟)

🧠 四、结论:它能还原什么、暂不能还原什么

维度 能做到 仍待突破
空间分布 ✅ 精确定位每个细胞及其邻近关系
基因动态 ✅ 在原位追踪基因表达变化 时间分辨率有限
细胞形态变化 ✅ 可解析迁移与形态演化 动态捕获仍是离散采样
细胞间通信 ✅ 可识别配体-受体互作、囊泡分布 信号传导过程仍为推测
真实动态交互(连续时空) 🔄 部分实现,需结合实时成像与AI重建 尚未完全还原

未来趋势

  • 结合 高频成像+AI轨迹预测模型(如 Cell-DyNet、DeepSpatioTemporal 等),有望实现“虚拟时间序列”;

  • 利用 虚拟细胞大模型 学习多细胞间时空信号传播模式,实现“动态交互推演”;

  • Stereo-cell 平台可能在未来发布 动态多模态数据库(与10BC生命图谱配套)。

在国际上,有哪些技术在尝试解决类似的问题,即整合空间、单细胞和多模态信息

国际主流空间组学技术比较

国际上的技术大致可以分为两大阵营:基于 In Situ(原位成像)和基于 Capture(捕获)

1. 基于捕获 (Capture-based) 的技术

这类技术使用芯片上的条形码(Barcodes)阵列来捕获和标记组织切片中的分子。

技术名称 核心机构 分辨率(关键点) 模态整合能力 优势 / 局限
Stereo-seq / Stereo-cell 华大智造 (STOmics) - 中国 纳米级/亚细胞级 (500 nm),超大视场(可达 13x13 cm)。 高:Stereo-cell 整合了转录、蛋白和形态(Stereo-CITE)。

优势:分辨率和视场全球领先,最适合大规模、高精度图谱构建。

Visium 10x Genomics - 美国 基于斑点 (Spot-based),斑点直径约 55 μm。一个斑点通常覆盖 1−10 个细胞。 中:主要捕获转录组,可叠加组织图像(形态)。

优势:商业化最成熟,操作流程标准化,易于获取。局限:无法达到真正的单细胞分辨率。

Slide-seq / HDST Broad Institute / Harvard - 美国 细胞级(Slide-seqV2 约 10 μm),超高密度。 中:主要捕获转录组。

优势:分辨率高于 Visium,且捕获密度高。局限:对组织类型和实验操作要求高。

2. 基于原位成像 (In Situ Imaging-based) 的技术

这类技术使用荧光探针直接在组织内标记和计数 RNA 或蛋白质分子。

技术名称 核心机构 分辨率(关键点) 模态整合能力 优势 / 局限
MERFISH Vizgen (Xiaowei Zhuang Lab) - 美国 分子级/亚细胞级(约 100 nm)。 高:转录组(一次可检测 10,000+ 基因)和形态(细胞图像)。

优势:绝对定量能力强,能看到每个分子的精确位置。

seqFISH Caltech (Lior Pachter Lab) - 美国 分子级/亚细胞级。 高:转录组和形态,可以进行蛋白质联合检测(Multi-omic seqFISH)。

优势:能检测的基因数量非常大,是图像分析的强大补充。

Xenium 10x Genomics - 美国 细胞级/亚细胞级。 中高:转录组(数千基因)和形态/蛋白。

优势:易用性高,是 10x Genomics 在原位领域推出的竞争性商业产品。局限:目前一次能检测的基因数量少于 MERFISH。

CODEX / CyCIF 多方 细胞级/亚细胞级。 高:专注于蛋白质组(可检测 40−60+ 种蛋白)和形态。

优势:蛋白质检测深度和准确性高,是研究细胞微环境和免疫学的关键工具。局限:无法进行全转录组检测。

总结:Stereo-cell 的独特地位

维度 Stereo-cell / Stereo-seq 的独特优势

国际主流技术的主要挑战

分辨率 实现了捕获技术中的亚细胞纳米级分辨率,与 MERFISH 等成像技术在分辨率上竞争。

Visium 仍是斑点级;大多数捕获技术难以突破纳米尺度。

视场与通量 捕获面积可达 13x13 cm,实现了百万到百亿级的细胞通量。

成像技术(MERFISH/Xenium)的视野较小,捕获技术(Visium/Slide-seq)的通量仍有上限。

多模态 通过 Stereo-cell/Stereo-CITE 实现了**原位多模态(转录+蛋白+形态)**的捕获和标记。

需要整合不同的平台才能实现全景式多模态,例如用 Visium + CODEX。

动态 (时序) 通过技术设计,支持原位动态捕捉,能够对生命过程进行“直播式”监测。

许多技术仍侧重于捕捉静态快照。

简而言之,Stereo-cell 的目标是用一套技术方案,同时解决高分辨率(Imaging 技术的强项)和高通量大视场(Capture 技术的强项)的难题,并整合多模态和时序信息,是目前最有潜力推动生物数字孪生数据采集的关键技术之一。

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐