国内虚拟细胞发展报告(基于 Stereo-cell 技术与百亿细胞联盟的生命智能化进展)
Stereo-cell 技术的诞生标志着细胞研究从二维单模态迈向立体多模态,从数据采集迈向智能解析。以此为基础的“百亿细胞联盟”正在通过 AI 大模型构建虚拟细胞系统,致力于实现从数据 → 理论 → 智能诊疗的系统性跃迁。这一进程不仅代表中国在全球细胞组学与AI生命模型领域的原创性引领,也意味着生命科学正在进入数据智能驱动的新纪元。是否希望我帮你将这份中文报告再生成一个英文科研综述版(适合论文或基
根据两篇报道(《中国科学报·成功脱“单,一次看清百万细胞”》与《科技日报·国产新技术打破传统单细胞测序局限》)融合提炼后的完整报告:
🧠 虚拟细胞发展报告
(基于 Stereo-cell 技术与百亿细胞联盟的生命智能化进展)
资料来源:《Science》2025年8月报道、华大生命科学研究院发布会、《中国科学报》《科技日报》同步报道
一、研究背景:从单细胞到虚拟细胞
在生命科学研究中,单细胞测序技术的出现使得科学家得以观察个体细胞的分子特征,揭示细胞异质性。然而,传统液滴微流控技术存在诸多限制,如:
-
仅能捕获转录信息,缺乏形态与空间维度;
-
难以处理大尺寸或特殊形态细胞;
-
通量受限、样本偏倚明显;
-
数据批次差异较大,难以构建系统性生命图谱。
因此,科学界逐渐从“单细胞测序”迈向“多模态整合与智能化解析”,并催生了“虚拟细胞(Virtual Cell)”的研究方向:
通过多组学、多时空、多细胞交互数据的融合,构建可计算、可模拟、可预测的细胞数字孪生体,为生命科学提供底层规律模型。
二、核心技术突破:Stereo-cell
研发机构:华大生命科学研究院(牵头)
联合单位:基因组多维解析技术全国重点实验室 + 多家科研机构
发表期刊:Science(2025年8月)
(1)主要创新
| 技术方向 | 创新内容 | 突破意义 |
|---|---|---|
| 多模态整合 | 同时捕获细胞的转录、蛋白信号与形态信息 | 从单维测序到“立体细胞画像” |
| 原位动态捕捉 | 支持在芯片上直接培养细胞并动态测序 | 解析基因表达与细胞迁移的时间演化 |
| 极限样本兼容 | 可测异形细胞、大体积细胞(如肌纤维、卵母细胞) | 打破传统技术无法覆盖的样本边界 |
| 百万级通量 | 一次实验捕获百万细胞,精确识别稀有亚群 | 具备支撑AI模型训练的数据规模 |
(2)技术原理
-
采用 高密度DNA纳米球阵列芯片(DNB Array),小球直径220 nm,间距500 nm;
-
通过静电吸附实现细胞原位捕获,无须液滴分隔;
-
结合显微成像与空间定位,实现“CT扫描+GPS定位”式细胞解析。
三、数据引擎与战略联盟:百亿细胞联盟(10BC Alliance)
(1)成立背景
依托 Stereo-cell 技术,2025年8月22日成立“百亿细胞联盟(10 Billion Cells Alliance)”,由华大牵头、18家科研机构联合发起。
(2)战略目标
| 层级 | 建设目标 | 内容 |
|---|---|---|
| 数据层 | 构建“三大细胞宇宙数据库” | 包含生命图谱、疾病图谱、扰动响应图谱 |
| 模型层 | 构建虚拟细胞与AI细胞大模型 | 学习生命系统的时空规律与响应机制 |
| 系统层 | 推动生命科学从“数据储备” → “智能驱动” | 形成AI驱动的智能诊疗与药物研发体系 |
(3)关键理念
-
Stereo-cell 不仅是实验平台,更是生命数据引擎;
-
虚拟细胞系统 是未来生命研究的核心方向,用于模拟真实细胞的动态与相互作用;
-
数据开放共享:联盟计划推动全球科研团队共建共享,促进虚拟细胞与细胞AI模型的协同研发。
四、虚拟细胞系统的核心概念
| 模块 | 内容 | 说明 |
|---|---|---|
| 数据获取层 | 来自多模态、原位测序的单细胞数据 | 转录 + 蛋白 + 形态 + 时空维度 |
| 数据整合层 | AI驱动的多模态融合与特征学习 | 构建高维细胞特征空间 |
| 模型建构层 | 建立虚拟细胞数字孪生体 | 可模拟细胞状态变化与相互作用 |
| 应用层 | 疾病机制建模、药物筛选、再生医学 | 实现“虚拟实验”与智能诊疗 |
五、国际对比与前瞻意义
| 项目 | 技术基础 | 数据维度 | 目标规模 | 核心差异 |
|---|---|---|---|---|
| CZI 十亿细胞项目(Meta & Chan Zuckerberg Initiative) | 传统液滴单细胞测序 | 转录组 | 10⁹ 级细胞 | 缺乏形态与空间信息 |
| 华大 Stereo-cell + 10BC 联盟(China) | DNB芯片原位捕获 | 多模态 + 空间 + 时序 | 10¹⁰ 级细胞 | 支撑虚拟细胞与AI生命模型 |
| CellForge / Geneformer / SToFM 等模型 | 深度学习 + 转录组数据 | 分子层面 | 10⁶–10⁸ 级 | 数据仍依赖旧一代测序平台 |
六、科学与产业意义
-
理论突破:
-
从描述性生物学向系统性、预测性生物学转型;
-
有望揭示生命的底层计算规律与细胞动态机制。
-
-
数据基础:
-
形成百亿级多模态细胞数据库,为AI生物模型提供训练基石。
-
-
应用前景:
-
促进精准医疗、药物筛选、疾病防控与再生医学研究。
-
-
产业转型:
-
推动生命科学由“组学数据产业”向“智能生命产业”演进。
-
七、总结:迈向智能生命科学时代
Stereo-cell 技术的诞生标志着细胞研究从二维单模态迈向立体多模态,从数据采集迈向智能解析。
以此为基础的“百亿细胞联盟”正在通过 AI 大模型构建虚拟细胞系统,致力于实现从 数据 → 理论 → 智能诊疗 的系统性跃迁。
这一进程不仅代表中国在全球细胞组学与AI生命模型领域的原创性引领,也意味着生命科学正在进入 数据智能驱动的新纪元。
是否希望我帮你将这份中文报告再生成一个 英文科研综述版(适合论文或基金申报的国际化文本)?
我可以保持术语(如 Stereo-cell, Virtual Cell, 10BC Alliance, AI-driven life modeling)一致,并优化为自然科研英语风格。
目前有依托依托 Stereo-cell 技术得到的生物数据库吗?
Stereo-cell 严格来说是华大智造(MGI/STOmics)在 Stereo-seq(空间转录组测序技术)基础上发展的一项整合性技术。它旨在实现多模态整合(形态、转录、蛋白)和原位动态捕捉。
目前,基于 Stereo-cell 核心技术产生的大规模生物数据库已经存在,并且正在积极建设中。
依托 Stereo-cell 核心技术的生物数据库
虽然“Stereo-cell”这个特定的名称是最近发布的,但它的底层技术 Stereo-seq (Spatial Enhanced Resolution Omics-sequencing) 已经积累了大量数据,并有对应的数据库和数据门户
1. STOmics 空间组学数据库 (STOmicsDB)
这是目前最主要的、公开的、存储 Stereo-seq 数据的平台。
-
平台名称: STOmicsDB (Spatial TranscriptOmics DataBase)
-
核心内容: 它是一个综合性的门户,致力于促进时空组学数据的探索和学术研究。它收集、归档并提供Stereo-seq技术产生的大量数据集。
-
数据特点: 这些数据包含了高分辨率的基因表达信息(转录组)以及对应的空间坐标。其中许多项目如小鼠胚胎发育图谱等,已经展示了时序信息(不同发育阶段)和高通量、大视场的特点。
-
用途: 学术界可以访问这些数据进行分析、可视化,甚至下载用于构建自己的计算模型,包括数字孪生的初始数据基础。
2. “百亿细胞联盟”数据资源
根据公开信息,基于 Stereo-cell 技术的突破,国内相关机构联合成立了“百亿细胞联盟”。
-
核心目标: 该联盟旨在利用 Stereo-cell 技术的百万级通量和多模态整合能力,绘制细胞图谱,并最终构建虚拟细胞(即数字孪生)。
-
意义: 虽然这不是一个传统意义上的公开数据库,但这个联盟的工作产物,尤其是其绘制的大规模细胞图谱和虚拟细胞模型的底层数据,将是未来最大的生物数字孪生数据来源。
总结与数字孪生关联
你的问题强调了“依托 Stereo-cell 技术”,而该技术的核心正是:
-
高分辨率/大视场: 百万级细胞。
-
多模态: 形态、转录、蛋白。
-
动态: 原位动态捕捉(时序信息)。
STOmicsDB 已经为你提供了空间 + 转录的大量高分辨率静态数据。而真正的多模态(形态+转录+蛋白)和动态(时序)的Stereo-cell 数据集,正处于快速生成和汇集阶段。
要构建你的生物数字孪生,你应该:
-
从 STOmicsDB 入手: 熟悉其数据格式和分析流程,利用已有的高分辨率空间转录组数据作为底板。
-
关注最新研究: 密切关注华大智造及其合作机构基于 Stereo-cell 技术的最新论文和数据集发布,尤其是那些包含蛋白(如 Stereo-CITE)和时序信息的项目。
这些数据库将是你的多组学+空间+时序数字孪生模型的“养料”。
Stereo-cell 技术的核心潜能之一:是否能“还原细胞动态交互”。
一、先明确“动态交互还原”的含义
在细胞组学与虚拟细胞研究中,这个概念可以拆成三个层次:
| 层级 | 含义 | 对应分析手段 |
|---|---|---|
| 1️⃣ 静态交互 | 不同细胞在空间上相邻、信号配受体配对 | 空间转录组 + 分子互作分析 |
| 2️⃣ 时序动态交互 | 随时间推移细胞表达谱与形态的变化 | 时序转录组 / 动态培养测序 |
| 3️⃣ 实时行为还原(真实“交互”) | 观察细胞迁移、接触、囊泡交换、信号传递等动态过程 | 实时成像 + 原位测序 + 多模态追踪 |
Stereo-cell 在当前阶段,已经实现了 第 1 层 + 部分第 2 层 + 局部第 3 层,但还未能做到完全的“实时动态交互重建”。
二、Stereo-cell 的动态捕捉能力
根据 Science 论文:
Stereo-cell 支持在芯片上直接培养细胞,实现原位动态测序,捕捉基因转录活性变化,并保留空间位置与时序变化信息
成功脱“单”,一次看清百万细胞_本报记者__刁雯蕙
。
✅ 已实现的动态维度:
-
原位培养与动态测序
-
细胞不需被破坏或转移,即可在同一芯片上连续采样。
-
能检测到基因表达的时序变化,形成“细胞演化轨迹”。
-
实验中已用于观察 成纤维细胞迁移和纤维化过程。
-
-
细胞间互作信号捕捉
-
通过空间位置与基因表达模式,识别相邻细胞间的 配体-受体信号网络;
-
可解析 细胞外囊泡的时空分布规律 与 物理接触细胞间的互作信号。
-
-
多模态记录
-
同时采集形态学、转录组和蛋白组信息;
-
相当于为每个细胞建立“多维快照序列”,支持推断其动态轨迹。
-
⚠️ 当前的技术局限(为何还不能完全“还原交互”)
| 限制类型 | 具体表现 | 原因 / 技术瓶颈 |
|---|---|---|
| 时间分辨率受限 | 虽然可做“原位动态测序”,但时间步长通常以小时计,而非连续实时 | 核酸捕获与测序本身仍需固定与裂解步骤 |
| 交互为“推断”而非直接观测 | 目前通过空间共定位与信号通路推测细胞通信,而非直接观测信号流 | 缺乏实时活细胞成像与分子追踪结合 |
| 数据整合挑战 | 多模态时空数据融合仍依赖AI推理模型 | 尚无标准化动态重建算法或虚拟孪生体系 |
🔭 三、向“动态交互还原”的过渡路线
Stereo-cell 被视为一个通往虚拟细胞系统的桥梁。
其演进路线大致如下:
| 阶段 | 核心能力 | 技术基础 |
|---|---|---|
| Stereo-cell 1.0(当前) | 原位捕获 + 多模态测序 + 时序追踪 | DNB芯片 + 原位测序 |
| Stereo-cell 2.0(规划中) | 加入实时成像、可逆标签、AI轨迹重建 | 光遗传 + AI轨迹推断 |
| 虚拟细胞系统阶段 | 构建细胞动态孪生体,模拟信号传导与互作网络 | 多模态AI大模型(10BC联盟) |
🧠 四、结论:它能还原什么、暂不能还原什么
| 维度 | 能做到 | 仍待突破 |
|---|---|---|
| 空间分布 | ✅ 精确定位每个细胞及其邻近关系 | — |
| 基因动态 | ✅ 在原位追踪基因表达变化 | 时间分辨率有限 |
| 细胞形态变化 | ✅ 可解析迁移与形态演化 | 动态捕获仍是离散采样 |
| 细胞间通信 | ✅ 可识别配体-受体互作、囊泡分布 | 信号传导过程仍为推测 |
| 真实动态交互(连续时空) | 🔄 部分实现,需结合实时成像与AI重建 | 尚未完全还原 |
未来趋势
-
结合 高频成像+AI轨迹预测模型(如 Cell-DyNet、DeepSpatioTemporal 等),有望实现“虚拟时间序列”;
-
利用 虚拟细胞大模型 学习多细胞间时空信号传播模式,实现“动态交互推演”;
-
Stereo-cell 平台可能在未来发布 动态多模态数据库(与10BC生命图谱配套)。
在国际上,有哪些技术在尝试解决类似的问题,即整合空间、单细胞和多模态信息?
国际主流空间组学技术比较
国际上的技术大致可以分为两大阵营:基于 In Situ(原位成像)和基于 Capture(捕获)。
1. 基于捕获 (Capture-based) 的技术
这类技术使用芯片上的条形码(Barcodes)阵列来捕获和标记组织切片中的分子。
| 技术名称 | 核心机构 | 分辨率(关键点) | 模态整合能力 | 优势 / 局限 |
| Stereo-seq / Stereo-cell | 华大智造 (STOmics) - 中国 | 纳米级/亚细胞级 (500 nm),超大视场(可达 13x13 cm)。 | 高:Stereo-cell 整合了转录、蛋白和形态(Stereo-CITE)。 |
优势:分辨率和视场全球领先,最适合大规模、高精度图谱构建。 |
| Visium | 10x Genomics - 美国 | 基于斑点 (Spot-based),斑点直径约 55 μm。一个斑点通常覆盖 1−10 个细胞。 | 中:主要捕获转录组,可叠加组织图像(形态)。 |
优势:商业化最成熟,操作流程标准化,易于获取。局限:无法达到真正的单细胞分辨率。 |
| Slide-seq / HDST | Broad Institute / Harvard - 美国 | 细胞级(Slide-seqV2 约 10 μm),超高密度。 | 中:主要捕获转录组。 |
优势:分辨率高于 Visium,且捕获密度高。局限:对组织类型和实验操作要求高。 |
2. 基于原位成像 (In Situ Imaging-based) 的技术
这类技术使用荧光探针直接在组织内标记和计数 RNA 或蛋白质分子。
| 技术名称 | 核心机构 | 分辨率(关键点) | 模态整合能力 | 优势 / 局限 |
| MERFISH | Vizgen (Xiaowei Zhuang Lab) - 美国 | 分子级/亚细胞级(约 100 nm)。 | 高:转录组(一次可检测 10,000+ 基因)和形态(细胞图像)。 |
优势:绝对定量能力强,能看到每个分子的精确位置。 |
| seqFISH | Caltech (Lior Pachter Lab) - 美国 | 分子级/亚细胞级。 | 高:转录组和形态,可以进行蛋白质联合检测(Multi-omic seqFISH)。 |
优势:能检测的基因数量非常大,是图像分析的强大补充。 |
| Xenium | 10x Genomics - 美国 | 细胞级/亚细胞级。 | 中高:转录组(数千基因)和形态/蛋白。 |
优势:易用性高,是 10x Genomics 在原位领域推出的竞争性商业产品。局限:目前一次能检测的基因数量少于 MERFISH。 |
| CODEX / CyCIF | 多方 | 细胞级/亚细胞级。 | 高:专注于蛋白质组(可检测 40−60+ 种蛋白)和形态。 |
优势:蛋白质检测深度和准确性高,是研究细胞微环境和免疫学的关键工具。局限:无法进行全转录组检测。 |
总结:Stereo-cell 的独特地位
| 维度 | Stereo-cell / Stereo-seq 的独特优势 |
国际主流技术的主要挑战 |
| 分辨率 | 实现了捕获技术中的亚细胞纳米级分辨率,与 MERFISH 等成像技术在分辨率上竞争。 |
Visium 仍是斑点级;大多数捕获技术难以突破纳米尺度。 |
| 视场与通量 | 捕获面积可达 13x13 cm,实现了百万到百亿级的细胞通量。 |
成像技术(MERFISH/Xenium)的视野较小,捕获技术(Visium/Slide-seq)的通量仍有上限。 |
| 多模态 | 通过 Stereo-cell/Stereo-CITE 实现了**原位多模态(转录+蛋白+形态)**的捕获和标记。 |
需要整合不同的平台才能实现全景式多模态,例如用 Visium + CODEX。 |
| 动态 (时序) | 通过技术设计,支持原位动态捕捉,能够对生命过程进行“直播式”监测。 |
许多技术仍侧重于捕捉静态快照。 |
简而言之,Stereo-cell 的目标是用一套技术方案,同时解决高分辨率(Imaging 技术的强项)和高通量大视场(Capture 技术的强项)的难题,并整合多模态和时序信息,是目前最有潜力推动生物数字孪生数据采集的关键技术之一。
更多推荐
所有评论(0)