这篇文章系统综述了人工智能(AI)在癌症诊疗领域的研究现状与应用进展,聚焦于AI在影像诊断、基因组学、治疗干预及患者管理等核心场景的创新实践。

https://doi.org/10.1186/s12943-025-02369-9

https://doi.org/10.1186/s12943-025-02369-9

在影像诊断层面,深度学习模型如卷积神经网络(CNNs)已深度融入CT、MRI、病理全切片图像(WSIs)等多模态影像分析,显著提升早期癌症检测精度。

来自不同癌组织的全切片图像通过多种人工智能模型进行处理,以实现癌症检测、分型、突变与生物标志物预测、预后评估及生存期预测等关键应用,通过深度学习洞见推动精准肿瘤学发展。

来自不同癌组织的全切片图像通过多种人工智能模型进行处理,以实现癌症检测、分型、突变与生物标志物预测、预后评估及生存期预测等关键应用,通过深度学习洞见推动精准肿瘤学发展。

例如Prov-GigaPath和CHIEF等基础模型通过处理超大规模病理数据,实现了肿瘤分型、突变预测等任务的性能突破,部分模型在特定任务上的准确率超过95%。

人工智能在癌症治疗全过程中的应用场景

人工智能在癌症治疗全过程中的应用场景

基因组学与生物标志物发现方面,AI通过整合多组学数据(如mRNA、DNA甲基化、蛋白质组学),借助自动编码器(AEs)、图神经网络(GNNs)等模型,成功构建了癌症亚型分类与生存预测模型,为精准免疫治疗和药物靶点挖掘提供了数据驱动的新范式。

放疗领域,深度学习模型通过自动轮廓分割和剂量优化,显著提升了靶区覆盖精度与危及器官保护水平,如DRONE模型在稀疏视角CT重建中实现了图像质量的突破性提升。

人工智能在癌症诊疗全流程中的应用涵盖从治疗方案制定、药物推荐到机器人手术及药物研发等环节。AI技术通过增强决策支持、实现个性化放疗、辅助外科手术、预测药物疗效及耐药性,从而提升诊疗精准度、改善治疗效果并加速疗法研发进程。

人工智能在癌症诊疗全流程中的应用涵盖从治疗方案制定、药物推荐到机器人手术及药物研发等环节。AI技术通过增强决策支持、实现个性化放疗、辅助外科手术、预测药物疗效及耐药性,从而提升诊疗精准度、改善治疗效果并加速疗法研发进程。

药物研发方面,AlphaFold2等AI工具通过蛋白质结构预测加速靶点识别,Insilico Medicine的生成对抗网络(GANs)则在数周内完成了新型抗癌分子的从头设计,大幅缩短了传统药物开发周期。


交流群

欢迎大家加入【医学AI】交流群,本群设立的初衷是提供交流平台,方便大家后续课题合作。

目前小罗全平台关注量67,000+,交流群总成员1500+,大部分来自国内外顶尖院校/医院,期待您的加入!!

由于近期入群推销人员较多,已开启入群验证,扫码添加我的联系方式,备注姓名-单位-科室/专业,即可邀您入群


知识星球

对推文中的内容感兴趣,想深入探讨?在处理项目时遇到了问题,无人商量?加入小罗的知识星球,寻找科研道路上的伙伴吧!


一、引言

癌症是一种可影响各阶层人群的复杂全球性健康问题,其不分年龄地给世界各地人群带来痛苦。

世界卫生组织(WHO)数据显示,癌症是全球第二大死亡原因,2020年占全球死亡人数的六分之一[1]。

随着20世纪下半叶分子细胞生物学和遗传学的发展,生物与治疗知识逐步积累,现代医学改变了对癌症的认知视角。

结合最新技术进展,目前已能以从前无法实现的方式理解该疾病。“癌症”一词现涵盖数百种具有相似基本特征的不同疾病。

除明确特定癌症类型的基因指纹和分子组成外,系统和局部肿瘤微环境对疾病进展和表现的重要性也已得到认知。近年来,免疫系统与免疫肿瘤微环境(TME)的相互作用尤其受到关注[2,3]。


1-1:人工智能(AI)在现代肿瘤学中的作用

AI是计算机科学的广泛领域,旨在设计模拟人类智能的算法或机器。

机器学习(ML)作为AI的子领域,通过计算机执行预定任务并利用统计技术发现数据中的隐藏模式以提升模型性能[4]。

与传统ML不同,深度学习(DL)这一ML子领域无需依赖人类定义的启发式方法完成任务,而是利用多层神经网络的能力消除手动特征提取工作,并实现人类未知或未预期特征的自发现[5,6]。

自然语言处理(NLP)作为AI的相邻专业领域,旨在实现人类语言与机器解释的桥梁,其通过将电子健康记录(EHR)临床笔记、诊断和操作报告等非结构化数据转化为离散数据元素[7,8]。

该领域的最新进展显著提升了技术效能,使其能够自动化收集和记录患者预后、无进展生存期(PFS)及其他与癌症相关的肿瘤特征[9]。这种自动化可推动复杂数据库和肿瘤登记处的构建,进而循环增强生成模型的效力。

NLP已被用于临床试验匹配和潜在药物不良反应检测,可单独应用或与ML/DL方法结合[10-12]。此外,AI在临床决策中的应用被认为可通过高分辨率成像和新一代测序(NGS)方法提高疾病早期诊断和预测的可能性

通过创建大规模数据集和使用专业生物信息学工具,AI还推动了癌症诊断新生物标志物的引入、新型定制药物的开发及潜在治疗方案的制定[13]。


1-2:AI在提升癌症诊断与治疗中的重要性

大量研究表明,筛查可提高癌症早期检测率并降低死亡率(图1)。

人工智能在癌症治疗中的多元化角色,包括增强诊断、个性化治疗、临床决策支持、生物标志物发现以及药物研发,每一项都通过数据驱动的创新为肿瘤学领域提升了精准性、速度和治疗效果。

人工智能在癌症治疗中的多元化角色,包括增强诊断、个性化治疗、临床决策支持、生物标志物发现以及药物研发,每一项都通过数据驱动的创新为肿瘤学领域提升了精准性、速度和治疗效果。

然而,即使在乳腺癌等筛查项目成熟的疾病领域,关于患者选择和风险-获益权衡的讨论仍在继续,且人们对与精准医学目标相悖的“一刀切”模式提出了担忧[46-48]。

在不久的将来,AI算法可能在优化这一流程中发挥作用,因其能够分析海量多模态数据以发现原本难以察觉的信号[49-51]。


二、AI在癌症诊断中的应用

AI正以指数级速度发展,临床肿瘤学研究目前更侧重于理解癌细胞增殖的复杂生物架构,以破译癌症的分子起源。

为应对全球癌症死亡率上升的现状,该领域还聚焦于通过大数据和计算生物学处理数百万相关病例[52]。

此外,AI在临床决策中的应用被认为可借助高分辨率成像和新一代测序(NGS)方法提高疾病早期诊断和预测的可能性。

通过创建大规模数据集并使用专业生物信息学工具,AI还有望推动癌症诊断新生物标志物的引入、新型定制药物的开发及潜在治疗方案的制定[13]。


2-1:基于成像的AI诊断

基于计算模型和生物信息学算法的AI为医学影像技术(MIT)带来了显著的发展机遇,其能够识别体内生物改变和异常细胞生长[53]。

AI辅助的MIT除在放射学中至关重要外,对神经放射学和医学共振成像也产生了重大影响。AI的动态应用广泛,包括图像解读与分类、数据组织、信息存储和信息挖掘等。

鉴于其在生物医学成像技术中的广泛应用,AI有望极大辅助病理学家提高诊断特异性[54]。


传统放射成像对肿瘤的评估主要基于定性特征,如肿瘤密度、强化模式、瘤内细胞与非细胞成分(包括血液、坏死和矿化)、肿瘤边缘规则性、与周围组织的解剖关系及其对这些结构的影响。

通过一维(1D)、二维(2D)和三维(3D)分析可量化肿瘤的大小和形状,这些定性表型描述均被称为“语义”特征。

相比之下,快速发展的放射组学领域正使将放射图像数字化解码为大小、形状和纹理模式描述符等定量属性成为可能[55]。


近年来,由于AI方法的进步,医学影像数据中放射模式的自动量化取得了显著进展。

深度学习(DL)作为AI的一个子集尤为值得关注,因其可从样本图像中自动学习特征表示,且在特定任务应用中表现出与人类相当甚至更优的性能[5,56]。

尽管DL需要海量数据集进行训练,但已显示出对真实标签噪声的相对鲁棒性[57]。

在外照射放疗中,断层成像对随访、图像引导和治疗计划至关重要。治疗前通常进行CT模拟以对目标身体部位成像,利用这些图像识别肿瘤和邻近关键结构以制定最佳治疗计划。

对于靠近横膈膜的肿瘤(如肝或下肺叶),可使用4D CT扫描跟踪呼吸运动。由于MRI优异的软组织对比度,其常用于脑、脊柱旁、头颈部、前列腺癌和四肢肉瘤的诊断,MRI扫描可与CT融合用于肿瘤勾勒和危及器官轮廓绘制,或在仅使用MRI的模拟中结合合成CT进行计划和剂量计算。

与CT和MRI不同,PET可揭示肿瘤代谢情况并帮助确定剂量递增体积,尤其在头颈部癌症中[58]。


AI的自动化能力(如随时间精确跟踪肿瘤体积、同步监测多个病灶、将表型细微差异与基因型关联、通过与海量肿瘤数据库对比预测预后)可增强临床医生的定性判断。

DL方法进一步提高了跨疾病和成像类型的泛化能力,降低了噪声敏感性和误差,并可能实现更早的治疗干预和重大临床进展。

尽管大多数研究仍处于临床前阶段,但自动化放射“放射组学”标记物的发展可能通过识别可操作的肿瘤异常最终改变癌症诊断模式[59]。


这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

2-2:数字病理学

随着数字化的扩展和AI能力的演进,当前数字病理学面临三个必须解决的核心挑战:

  • (1)实验室操作中效率、质量控制和图像管理的提升;

  • (2)临床决策支持,即利用算法识别感兴趣区域或做出特定诊断;

  • (3)研究与开发,涉及新生物标志物[60]、转录组学[61]以及图像特征与预后相关性的发现[62]。

AI在数字病理学中的应用早于全切片图像(WSIs)的引入,先前研究表明计算机视觉和AI方法可在病理图像中区分疾病。

然而,这些图像数据集主要由先前选择的感兴趣区域(ROIs)组成,由于病理学家必须首先选择感兴趣区域,这种方法极其耗时且在技术上难以整合到实验室的临床流程中[63]。

医疗系统中的一大障碍是癌症的早期识别,主要因为癌症早期阶段症状轻微且常无症状。早期癌症检测对有效治疗和提高生存率至关重要,但多种因素使这一过程复杂且具挑战性。


多种AI模型正用于癌症检测成像,包括Prov-GigaPath[64]、Owkin’s模型[65]、CHIEF[66]和Google Deepmind AI[67]。

传统AI模型经训练执行特定任务(如检测癌细胞或预测治疗结果),但这些模型需要大量训练数据集,且其结果常因组织类型或成像技术而异(图2)。

来自不同癌组织的全切片图像通过多种人工智能模型进行处理,以实现癌症检测、分型、突变与生物标志物预测、预后评估及生存期预测等关键应用,借助深度学习洞见推动精准肿瘤学发展。

来自不同癌组织的全切片图像通过多种人工智能模型进行处理,以实现癌症检测、分型、突变与生物标志物预测、预后评估及生存期预测等关键应用,借助深度学习洞见推动精准肿瘤学发展。

它们通常由最初用于识别大型物体的计算机视觉模型修改而来。自监督学习作为一种更具适应性的技术,使用未标记数据训练AI模型,并在多种任务中表现更优。

然而,尽管自监督学习模型近期取得进展,AI模型在癌症诊断中的广泛应用仍受限于其有限的泛化能力和狭窄的任务重点。


Y. Ma等人(2025)[68]介绍了HistoPathExplorer,这是一种用于评估组织病理学中AI的基于网络的工具。该工具可标准化数据集和指标,使用户能够探索模型性能和临床相关性。

一项重点研究通过预训练模型从MCO数据集的1,065例结直肠癌(CRC)全切片图像(WSIs)中提取无伪影图块的特征,利用多实例学习(MIL)预测关键生物标志物微卫星不稳定性(MSI),其受试者工作特征曲线下面积(AUROC)为0.91,表明基于MIL的方法具有较高的预测准确性,强调了其作为结直肠癌传统生物标志物检测的非侵入性替代方案的潜力。

然而,该研究指出了局限性,如对WSI质量的依赖和高计算需求,并提出了应对这些挑战的未来研究方向。


在癌症医学影像领域,Prov-GigaPath概念推动了数字病理学的显著进步。

Prov-GigaPath是由普罗维登斯医疗系统、微软和华盛顿大学共同开发的基础模型,旨在分析千兆像素级全切片病理图像以改善癌症诊断和患者护理[69]。

为捕捉局部和全局上下文,该模型采用双层架构:图块编码器处理来自WSIs的256×256像素图块以提取局部特征,而切片编码器将这些嵌入聚合成全面的切片级表示。

这种设计通过解决大型WSIs带来的计算挑战,提高了准确性和效率。依托普罗维登斯医疗网络的大规模数据集Prov-Path(包含超过30,000名患者的切片和31种主要组织类型),Prov-GigaPath在26项病理任务中均表现出顶尖性能,该数据集的患者数量是癌症基因组图谱(TCGA)的两倍以上,图块量更是其五倍多,为模型训练提供了坚实基础[70]。

在对比研究中,Prov-GigaPath优于分层图像金字塔Transformer(HIPT)等现有模型,在包括突变预测和癌症分型在内的26项数字病理任务中实现了最先进的性能。

例如,在突变预测任务中,Prov-GigaPath的AUROC和精确率-召回率曲线下面积(AURPC)得分均优于HIPT,体现了其优势[71]。

将Prov-GigaPath整合到医学影像流程中具有多方面优势:

  • 因其能够解读千兆像素WSIs,可对组织样本进行全面分析,从而实现更精准的癌症诊断和更个性化的治疗计划;

  • 该模型通过识别病理切片中的局部和全局模式来理解肿瘤微环境(TME),为精准免疫治疗提供支持;

此外,作为开放权重模型,Prov-GigaPath促进了科学界的开放性与合作,推动数字病理学的发展。


X. Wang等人(2024)[66]设计了一种通用机器学习框架——临床组织病理学影像评估基础(CHIEF),可从病理图像中提取多种特征用于癌症诊断和评估,旨在解决部分AI模型在分析不同人群和数字化方法生成的图像时泛化能力有限的问题。

该框架采用自监督学习和基于注意力的集成方法,在14个队列的60,000张WSIs上进行训练,在11种癌症中表现优于现有模型。

CHIEF结合了图块级特征提取和全局表示学习,利用CTransPath和CLIP编码器,在24家医院的数据验证中,其在预后预测、肿瘤起源检测和癌细胞分类方面均表现出色。


CHIEF在15个数据集和11种癌症中表现优于ABMIL、CLAM和DSMIL,其受试者工作特征曲线下面积(AUROC)为0.9397,比上述模型高10-14%,其像素级预测与病理学家评估高度吻合,并能识别TP53和BAP1等关键突变。

类似地,DeepMind基于卷积神经网络(CNN)的系统通过大规模乳腺X线摄影数据集提升了乳腺癌筛查效果,将假阳性率降低5.7%,假阴性率降低9.4%。

CHIEF和Prov-GigaPath共同标志着AI从任务特定工具向在预测准确性、分型和生物标志物检测方面表现卓越的可扩展模型转变,彰显了AI在癌症诊断中日益成熟的技术水平[72]。

谷歌AI研究的另一产品淋巴结助理(LYNA)通过分析组织病理切片识别转移性乳腺癌,其诊断转移性癌症的准确率达99%,尤其在发现微小转移灶方面表现优于人类病理学家,这些微小转移灶有时难以通过传统方法发现[73]。

匹兹堡大学的AI计划等替代AI模型协助病理学家诊断前列腺癌,匹兹堡大学医学中心(UPMC)已使用Ibex Medical Analytics的Galen Prostate™等AI技术,用于检测癌症并评估格里森分级、神经周围浸润和肿瘤大小等特征。


Galen Prostate采用经大规模数据集(包括罕见前列腺癌)训练的深度学习(DL)算法。诺斯韦尔健康中心开发了AI诊断工具iNav,以改善胰腺癌的早期诊断和治疗[74]。

iNav通过分析放射学数据检测具有胰腺癌影像学征象的患者,实现及时护理,其使用自然语言处理(NLP)分类器训练识别放射学报告中与胰腺癌相关的短语,扫描与肿块或病变相关的语言模式和关键词,当指标出现时,iNav会标记以便进一步医学审查。

鉴于胰腺癌检测滞后和预后不良的现状,iNav通过主动分析影像改善早期检测,将诊断至治疗时间缩短50%,使生物标本研究参与度提高三倍,并增加多学科诊所转诊,改善了护理和研究机会。


一种名为双域残差优化网络(DRONE)的改进DL模型[75]通过集成图像和数据域(正弦图)减少伪影并提升图像质量,其包含三个模块:

  • 嵌入模块通过编码器-解码器网络扩展稀疏正弦图数据以丰富输入;

  • 细化模块使用深度CNN改善初始图像;

  • 感知模块通过正则化确保正弦图与重建图像的一致性,并集成其他两个模块的输出。

DRONE通过跨模块组合输出解决稀疏视角CT挑战,其使用峰值信噪比(PSNR)、结构相似性指数(SSIM)和均方根误差(RMSE)评估的性能在重建准确性、特征保留和边缘清晰度方面超越传统及其他DL方法。


人工智能(AI)和机器学习(ML)融入癌症诊断显著提升了准确性、速度和治疗个性化水平。

AI擅长分析复杂数据集,促成更准确的诊断和更快的治疗启动,从而改善预后,还通过整合遗传和临床数据支持个性化医疗(表2)。

表2 基于影像学的癌症人工智能(AI)诊断

表2 基于影像学的癌症人工智能(AI)诊断

开发用于癌症检测的AI/ML模型涉及关键步骤:

  • 数据收集需要包括影像、基因组学和患者病史的多样化高质量数据集;

  • 预处理通过标准化、增强和注释确保数据一致性;

  • 模型选择因任务而异,如图像使用CNN,序列数据使用RNN或LSTM,分类使用决策树。

模型在大规模数据集上训练并定期验证以提高准确性。CNN有效分析MRI和乳腺X线摄影等图像;LSTM和RNN处理序列临床数据;决策树和随机森林(RF)支持诊断决策,这些模型在癌症检测中已展现出强劲性能。


三、AI在基因组学和生物标志物发现中的应用

蛋白质组学、基因组学和组合化学的进步催生了大量化学和生物数据库,极大地增进了对癌症分子生物学的理解。

从临床角度看,这些知识可变革癌症评估与治疗,但从海量原始遗传数据中识别具有治疗相关性的见解仍具挑战。研究人员已应用AI通过基因、mRNA和miRNA簇识别癌症亚组(图3)。

图3 整合基因表达、变异分析和人工智能/机器学习建模的集成流程。该流程始于基于RNA测序的差异基因分析,随后进行致病变异筛选、多模态机器学习,最终输出用于精准医疗的预测模型、风险评估和疾病特异性可视化关联结果。

图3 整合基因表达、变异分析和人工智能/机器学习建模的集成流程。该流程始于基于RNA测序的差异基因分析,随后进行致病变异筛选、多模态机器学习,最终输出用于精准医疗的预测模型、风险评估和疾病特异性可视化关联结果。

利用深度灵活神经森林模型和堆叠自动编码器(AEs),整合mRNA、miRNA和DNA甲基化数据,可将卵巢癌、乳腺癌和胶质母细胞瘤分为不同亚型[92,93]。


在肝细胞癌(HCC)中,监督学习和无监督学习均被应用于RNA、miRNA和甲基化数据分析,揭示了与生存相关的共识驱动基因和两个不同的患者亚组。

蛋白质组学和代谢组学数据的多组学整合还将乳腺癌患者分为低风险和高风险组。在亚型分类中,自动编码器和多核框架得到应用[94]。

AI在将患者按预后和生存分层中发挥关键作用,支持癌症早期检测和进展预测。在神经母细胞瘤中,基因表达和拷贝数变异数据辅助亚组分类[95];对于结直肠癌(CRC)复发预测,整合特征包括拷贝数变异、代谢组学、miRNA和基因表达数据[96]。

MRMR技术在卵巢癌中识别出与生存相关的特征[97],深度学习训练的神经网络也被用于预测乳腺癌患者的生存情况[98]。SALMON方法通过共表达网络的特征基因矩阵结合多组学数据和传统生物标志物,以识别关键基因和染色体带[99]。

此外,基于核的机器学习方法被用于评估转录组、表观基因组和基因组数据对不同肿瘤的预测价值[100],该方法在纳入临床标准时表现出显著优势,尽管其有效性因癌症类型而异。


技术进步使软件开发人员与健康研究人员能够紧密合作,通过多因素分析提升预测能力,这些评估据报道比实际数据更具准确性。

构建使用AI算法的癌症检测和预后模型正成为研究人员的优先方向,这些策略目前用于提高多样化和复发性癌症预后的准确性,并改善生存[101]。

为深入了解疾病的分子基础,临床肿瘤学研究主要聚焦于全面解析癌细胞增殖的驱动机制,其目标还包括利用计算生物学处理数百万相关病例的海量数据,以应对全球癌症死亡率上升的趋势。

此外,AI在临床决策中的应用有望通过新一代测序(NGS)和高分辨率成像提升疾病早期识别和预测的效能[100],借助这些前沿技术,AI有潜力大幅提高疾病检测和预后的精准性与及时性[102]。


AI有潜力产生新的癌症诊断生物标志物,其功能旨在构建经过充分训练的系统以正确评估患者是否需要免疫治疗,AI可估计哪些免疫治疗药物对患者康复影响最大,并识别需要额外检测(如全基因组光谱分析)的患者。

借助经过验证的真实世界案例研究,AI在医疗领域的应用日益增多,旨在成功克服准确检测多种癌症类型的障碍,同时文中还纳入了AI按计划运行所需框架的全面描述[103]。

AI驱动的生物标志物发现利用先进的计算机方法分析大型复杂生物数据集,支持向量机(SVMs)和随机森林(RFs)是两种常用的监督学习技术,通过按生物标志物谱对患者进行分类以实现精准分层[104],这些模型因在标记数据集上训练而能够识别与治疗反应或疾病进展相关的重要生物学特征。

另一方面,无监督学习方法(如k-means和层次聚类算法)可揭示基因组数据中的隐藏模式,助力在无预设标签的情况下发现新的生物标志物分组[105]。

众多AI模型被用于基因组学和生物标志物发现,以处理大规模基因组数据集、寻找疾病相关生物标志物并支持个性化医疗(表3),这些模型包括DeepVariant[106](谷歌)、AlphaFold[107]、IBM Watson肿瘤学系统(WFO)[108]、AI驱动的液体活检分析、CancerSEEK AI[109]、PRS-AI[110]以及药物反应预测AI[111]。


谷歌的DeepVariant是一种用于检测下一代测序(NGS)数据中遗传变异的深度卷积神经网络(CNN),其将测序reads转换为堆积图像,并使用Inception架构对其分类以实现准确的基因型预测。

在Genome in a Bottle基准测试中,该模型通过精确率、召回率和F1分数在多种基因组环境中进行性能评估,结果显示其表现优于传统方法,尤其在复杂区域更为显著。

DeepMind的AlphaFold利用深度学习、进化数据和注意力机制从氨基酸序列预测蛋白质结构,其在CASP竞赛中的表现接近实验精度,推动了结构生物学和药物发现的发展。

H. Sun等人(2025)[117]通过细胞因子通路分析,结合AlphaFold预测与单细胞RNA测序(scRNA-Seq)、对接和富集研究,揭示了AlphaFold 3在葡萄膜黑色素瘤生物标志物识别中的作用,有效发现了与治疗相关的生物标志物。

Somashekhar等人(2017)[118,119]对638例乳腺癌病例的IBM Watson肿瘤学系统(WFO)进行评估,将其治疗建议与Manipal多学科肿瘤委员会(MMDT)的建议进行比较。WFO使用机器学习(ML)和自然语言处理(NLP)挖掘医疗数据,将建议分类为REC、FC或NREC,总体一致性为73%,其中非转移性病例为80%,转移性病例为45%;三阴性一致性为67.9%,HER2阴性为35%。WFO在40秒内生成建议,而手动生成需12-20分钟,尽管在不同癌症亚型中存在局限性,但仍辅助了基于生物标志物的决策制定。

Jin等人(2025)[120]探索了早期胰腺癌(PC)检测的计算技术,将随机森林(RFs)、支持向量机(SVMs)和深度学习(DL)等机器学习模型应用于复杂数据集,通过NGS和全基因组关联研究(GWAS)识别关键突变(如TP53、KRAS)。

基于AI的临床决策支持系统(CDSSs)使用贝叶斯网络进行个性化风险评估和治疗推荐,通过CNN的放射组学和环扫内镜超声(CEH-EUS)成像改善诊断,同时液体活检可检测循环肿瘤DNA(ctDNA)、循环肿瘤细胞(CTCs)、miRNA和外泌体,多组学整合增强了早期诊断和个性化护理的精准医学能力。

Sud等人(2021)[121]研究了癌症易感性的多基因风险评分(PRSs),该评分通过整合多个变异来评估风险,但准确性因癌症类型而异。

对于胰腺癌,PRSs的AUC约为0.67,但由于绝对风险增加极小,其在罕见癌症中的临床实用性有限,与非遗传风险因素结合后预测能力仅略有提升,其在指导筛查或预防等干预措施中的有效性仍不确定,需进一步研究。


四、肿瘤学中的AI与患者管理

4-1:AI在预后建模与生存预测中的应用

随着基因组数据标准化程度提升和分析方法的进步,AI在开发可靠的生存预测算法方面展现出巨大潜力。

基因组数据分析的复杂性和成本给临床医生带来沉重负担,导致诊断和治疗计划依赖可能有限的专业知识,进而可能引发决策延迟或不准确。

因此,基于数据驱动的定量方法至关重要。先进的机器学习(ML)和深度学习(DL)方法通过创新学习策略提供了针对性解决方案,使临床医生能够优化治疗计划并改善患者预后[233]。


癌症患者生存时间预测涉及几个连续阶段

  • (1)基因组数据预处理

  • (2)降维

  • (3)特征选择

  • (4)模型训练

  • (5)生存时间预测

在训练阶段,需对多种基因组数据类型(包括mRNA、DNA甲基化、拷贝数变异等)进行预处理(表8)。这些特征单独或组合用于降维后,再通过多种ML方法训练模型[234]。


复杂的DL算法通过分层人工神经网络(ANNs)结合监督或无监督学习方法,将特征选择、降维与预测自动整合为单一流程。

DL模型通常在预测生存时间方面优于传统ML技术,因其旨在揭示隐藏的模式和关系。随着遗传数据可及性的增加和处理能力的提升,DL作为基因组数据分析的强大技术正日益受到青睐[243]。

当前发表的研究常使用临床或影像数据预测癌症患者的生存时间,但这些方法可能并非总能产生精确预测,且未充分利用遗传数据中蕴含的丰富信息。

利用基因组数据进行癌症患者生存预测的综述较少,且不够全面,缺乏对可启发未来研究的各种ML模型的比较[244]。


4-2:机器学习(ML)在癌症生存预测中的技术应用

纳入遗传数据虽能提升生存时间预测精度,但会引入高维度问题,需谨慎处理。

为此,研究人员常采用降维或特征选择技术。生存预测模型通常包含预测模型和降维两部分,方法分为监督学习与无监督学习两类,常见方法包括主成分分析(PCA)、因子分析和非负矩阵分解(NMF)[245]。

通过降维或特征选择技术可实现特征精简。近年来,数字医疗领域的新范式(如多癌症多组学临床数据集实验室(MCMOCL)方案)通过联邦学习、自动编码器(AE)和XGBoost技术提升准确性,减少处理延迟并增强异构癌症诊疗中的数据安全性[246]。

其他研究则探索了混合癌症检测方案,如采用状态-动作-奖励-状态-动作(SARSA)强化学习[247],以及在雾云网络中进行多组学数据处理,旨在分布式临床环境中提高准确性并缩短处理时间[248]。

ML能够利用支持向量机(SVM)、 AdaBoost、随机森林(RF)和决策树等方法,从复杂基因组数据中实现精准生存预测。关键考量包括减少噪声的特征选择、临床相关性的可解释性,以及确保模型鲁棒性的验证(如交叉验证/外部验证)[249]。

然而,基于ML的癌症生存预测面临数据异质性、偏差、过拟合和可解释性差等挑战,小规模不平衡数据集会降低模型泛化能力,解决这些问题需要先进的特征工程和正则化处理以确保临床可靠性[250]。


4-3:人工智能在远程监测与数字健康中的应用

数字健康(通常称为“电子健康”或“健康科技”)是技术与医疗的融合,在肿瘤学中具有重要意义。

在肿瘤领域,数字健康涵盖通过数字手段改善癌症预防、诊断、治疗和管理的一系列技术、策略和创新[251],包括电子健康记录(EHRs)、移动健康应用、可穿戴技术、远程医疗服务和AI驱动的分析等。

其通过提供前沿解决方案改善患者护理、诊断和治疗,有望彻底变革肿瘤学。随着AI、虚拟现实(VR)、增强现实(AR)、预测分析、国际合作和法规变革的发展,肿瘤数字健康的未来前景广阔[252]。

数字健康通过对遗传学、生活方式和影像数据的大规模分析实现癌症早期检测,支持及时的个性化治疗,通过根据个体基因特征定制疗法,改善预后并减少副作用[253]。

可穿戴设备和远程医疗等数字健康工具支持远程监测,改善癌症患者生活质量并减少住院次数,其收集的数据可加速研究、药物开发和治疗优化[254]。作为创新催化剂,数字健康有望变革全球癌症护理并显著改善患者预后。


五、结论

人工智能(AI)已不再是肿瘤学领域的辅助工具,而是推动癌症治疗进步的核心内在组成部分。

通过将异构生物医学数据集无缝整合为具有临床可操作性的见解,AI正在重塑癌症护理的各个阶段,包括检测、诊断、治疗、随访和研究。

本综述强调了将AI嵌入肿瘤学的巨大潜力与复杂性,其应用范围涵盖成像模态(CT、MRI、PET、超声)、组织病理学、基因组学、蛋白质组学等多个领域。

AI将临床决策从主观评估转向高精度的算法诊断,且在速度、可重复性和精准度方面往往优于传统方法。除诊断外,AI还可通过数据密集型药物开发流程实现个性化治疗规划、精准放疗剂量调整、增强机器人辅助手术以及发现新型治疗靶点。

在患者管理方面,AI驱动的可穿戴设备和虚拟助手支持实时远程监测、提高治疗依从性并早期发现并发症。在临床研究中,AI通过实时资格审查优化研究设计、患者分层和招募流程。


尽管取得这些进展,实现AI在临床的普遍应用仍面临挑战。

算法透明度、可重复性和可解释性等问题凸显了在医疗提供者与患者之间建立信任的必要性。医疗AI的监管框架仍在演进中,迫切需要确保安全性、有效性和创新性的综合治理模型。

与数据相关的关键挑战(偏差、不公平性、安全性和互操作性)必须得到解决,尤其是训练数据的偏差可能加剧不同人口群体和地区间已存在的健康 disparities。构建由AI研究人员、肿瘤学家、伦理学家、监管者和患者倡导者组成的多学科生态系统,是制定公平、透明且具有临床价值的AI部署标准的关键。

医学教育也需革新,以培养未来医疗专业人员在临床实践中负责任地应用AI的技能。


展望未来,AI与联邦学习、边缘计算、数字孪生和量子机器学习的融合,为实现高度精细化、可扩展和个性化的癌症护理提供了令人振奋的潜力。

AI、合成生物学与新型免疫治疗设计之间的新兴协同作用,正指向真正意义上的个体化下一代治疗。最终,部署透明、隐私保护和以伦理为核心的AI模型将有助于构建可信赖的医疗系统。

AI的真正潜力不仅在于改进现有实践,更在于将肿瘤学重塑为一个预测性、预防性、参与性和精准驱动的学科。

通过以人为本的方法和协作创新,AI有望开启癌症护理的变革时代,通过更智能的数据利用、结果导向的策略和包容性的临床影响,使所有患者受益。


结束语

本期推文的内容就到这里啦,如果需要获取医学AI领域的最新发展动态,请关注小罗的推送!如需进一步深入研究,获取相关资料,欢迎加入我的知识星球!

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】 

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。


👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。


1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

 

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐