下面再对大家关注的一些问题做一个总结和说明。

一、 为什么有了聪明的大模型还需要RAG?

  • 知识局限性和幻觉问题: 通用大模型的知识完全源于其训练数据,而现有的大模型训练集主要是网络公开数据,无法获取一些实时性、非公开或离线数据,导致模型在某些场景下无法提供准确信息或出现“幻觉”问题。
  • 数据安全性: 企业数据安全至关重要,将私域数据上传第三方平台进行训练存在数据泄露风险。依赖通用大模型可能需要在数据安全和效果之间进行取舍,而本地RAG系统可以更好地保护企业数据。
  • 提高响应速度和准确性: 通过本地RAG系统,企业可以快速响应和解决实际问题。例如,某电商平台接入RAG后,客服响应速度提升300%,培训新员工的时间从3个月缩短到3天。
  • 知识保鲜: 本地RAG系统可以实时更新知识库,只需更新文档,AI就能立即掌握最新政策,确保知识的时效性和准确性。

二、 技术选型和方案落地评估

方案选型:

使用场景 参考推荐
有限开源+完整付费 如果你需要快速搭建和管理本地知识库,并接入大模型,业务方向上想做一个快速的验证,可以推荐使用目前比较主流的成熟的开源产品,支持内网部署,但是免费版有些使用限制,付费版可以获得更多的功能和得到开发团队的技术支持。目前市面上用的比较多的方案有:FastGPT、MaxKB、RAGFlow和Dify。推荐使用本地私域大模型+私域知识库。 优点:成熟稳定,开箱即用,友好的操作界面,几乎0代码,大大的降低了开发门槛; 弊端:产品的定制化程度较高,拿来使用的场景需要充分的验证和评估;
自由开发、高度定制 如果你具备开发团队,且需要高度定制化的需求,可以使用 langchain或llamaindex等框架,框架提供了开箱即用的模块化的工具和接口。开发者可以根据需求灵活组装自己的业务场景。 优点:完整贴合业务需求,高度定制化开发,与现有的系统方便集成和整合,可以不断提高检索和生成答案的准确性; 弊端:需要预留一定的开发周期,并储备开发和运维团队。
云服务 如果你有丰富的云厂商使用经验,与之集成对接的系统也都是云产品。可以使用阿里的百炼或百度的千帆,云厂商基本都会提供一站式的产品和服务,有完善的开发和使用体系,包括底层的计算资源和存储方面。 优点:追求稳定和完善的技术支持; 弊端:数据隐私问题需要被充分评估,长期使用的费用评估,场景的灵活性需要充分评估;

方案部署落地:

轻量级方案:本地知识库 -> Embedding模型 -> 本地FAISS向量库 -> 开源大模型

企业级方案:分布式文档集群 -> 多模态Embedding模型 -> 阿里云全托管向量库Milvus -> 本地大模型引擎(微调行业大模型) -> 多级缓存

三、 准确率提升全攻略

当你的智能客服开始一本正经地胡说八道,当业务文档检索总是错过关键信息,这就是我们要解决RAG的核心问题:怎么提高生成回答的准确性。下面从以下几个方面来提供一些思路和方法:

1、数据预处理(构建高质量知识原料库)

清晰的数据格式: 删除隐藏字符(如^M、\xa0、<0x200c>等);清除文档的页脚页眉无意义的说明;pdf文档需要先测试看看是否有解析错误或丢失的情况;明确文档的段落层次结构;适当的添加一些分段或分节;

文本增强: 明确的单位或是行业内的英文缩写带上中文说明,例如:上涨或下降明确指出是同步还是环比,GDP标准的写法应该是:国内生产总值(GDP)

清晰的分块: 规章制度、技术手册或法律条文按原有的格式章-节、操作步骤-示意图或法规-条款-项的原始格式切割,标注成一个完整的Chunk块,不同的场景用不用的合适的Chunk块的分块粒度;

2、检索优化(打造精准信息雷达)

混合检索策略: 混合检索通过集成多种检索算法,充分利用不同检索方法的优势。例如可以使用:“关键词检索(BM25)”和“语义向量检索”在langchain框架中实现混合检索:

from langchain.retrievers import ParentDocumentRetriever
from langchain.retrievers.merger import EnsembleRetriever
'''配置BM25检索器'''
bm25_retriever = BM25Retriever(
    index=bm25_index,
    k=3
)
'''配置向量检索器'''
vector_retriever = vectorstore.as_retriever(
    search_type="similarity",
    search_kwargs={"k": 3}
)
'''创建混合检索器'''
ensemble_retriever = EnsembleRetriever(
    retrievers=[bm25_retriever, vector_retriever],
    weights=[0.5, 0.5]
)

向量模型选型矩阵: 知识库语言、文本切分长度、模型精度、硬件限制以及检索时间等都是选择Embedding模型时需要考虑的因素。这是下面huggingface上有关Embedding下载的排行榜,按场景可以对号选择

3、重排序(精准度再升级): 混合检索的结果可能仍包含冗余信息,引入重排序模型可对候选文档二次评分,优先展示语义最匹配的文档。目前,Reranker 类型主要有两种——基于统计和基于深度学习模型的Reranker:

基于统计的 Reranker– 会汇总多个来源的候选结果列表,使用多路召回的加权得分或倒数排名融合(RRF)算法来为所有结果重新算分,统一将候选结果重排。这种类型的 Reranker 的优势是计算不复杂,效率高,因此广泛用于对延迟较敏感的传统搜索系统中。

基于深度学习模型的 Reranker– 通常被称为 Cross-encoder Reranker。由于深度学习的特性,一些经过特殊训练的神经网络可以非常好地分析问题和文档之间的相关性。这类 Reranker 可以为问题和文档之间的语义的相似度进行打分。因为打分一般只取决于问题和文档的文本内容,不取决于文档在召回结果中的打分或者相对位置,这种 Reranker 既适用于单路召回也适用于多路召回。例如,使用交叉编码器对查询与文档对进行细粒度相关性评估。

>$ pip install -U sentence-transformers
from sentence_transformers import CrossEncoder
cross_encoder = CrossEncoder("cross-encoder/ms-marco-MiniLM-L-6-v2")
pairs = [[query, doc] for doc in retrieved_documents]
scores = cross_encoder.predict(pairs) # 每对(查询,文档)打分
print("Scores:")
for score in scores:
    print(score)
print("New Ordering:")
for o in np.argsort(scores)[::-1]: # 重新整理文件
    print(o+1)

4、生成控制(给大模型戴上"紧箍咒"):

提示工程万金油模版:

你是一个严谨的[行业]专家,请严格依据以下知识:
<检索到的知识片段>

回答要求:
1、若信息不完整需声明"根据现有资料"
2、数值类回答必须标注数据来源
3、涉及法律条款必须精确到条/款/项
4、针对无法回答的问题,请回答不知道,不要凭空捏造答案

待回答问题:<用户问题>

输出约束: 格式固定:强制JSON或markdown输出;数值限制:限制数值范围(如利率0-100%等);引用溯源:自动添加<知识块ID>来源标记;

5、持续进化:建立精度监控体系:

评估指标矩阵: 形成有效的评估体系

BadCase分析流程: 自动聚类高频错误类型;关键案例溯源(检索路径/生成日志);针对性优化(知识缺失→补充特定文档,检索偏差→调整Embedding模型,生成幻觉→强化提示约束)

四、 小结

RAG的准确性提升是永无止境的旅程,优化关键词:精准回答 = 清洁数据 + 智能检索 + 召回重排 + 精准控制 + 持续进化

AI探索的路上永无止境,实践出真知!

大模型算是目前当之无愧最火的一个方向了,算是新时代的风口!有小伙伴觉得,作为新领域、新方向人才需求必然相当大,与之相应的人才缺乏、人才竞争自然也会更少,那转行去做大模型是不是一个更好的选择呢?是不是更好就业呢?是不是就暂时能抵抗35岁中年危机呢?

答案当然是这样,大模型必然是新风口!

那如何学习大模型 ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。但是具体到个人,只能说是:

最先掌握AI的人,将会比较晚掌握AI的人有竞争优势。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

但现在很多想入行大模型的人苦于现在网上的大模型老课程老教材,学也不是不学也不是,基于此我用做产品的心态来打磨这份大模型教程,深挖痛点并持续修改了近100余次后,终于把整个AI大模型的学习路线完善出来!

在这里插入图片描述

在这个版本当中:

您只需要听我讲,跟着我做即可,为了让学习的道路变得更简单,这份大模型路线+学习教程已经给大家整理并打包分享出来, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型学习资源包》免费分享(安全咨料,放心领取)👈

一、大模型经典书籍(免费分享)

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源

在这里插入图片描述

二、640套大模型报告(免费分享)

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、大模型系列视频教程(免费分享)

在这里插入图片描述

四、2025最新大模型学习路线(免费分享)

我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。

img

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

img

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

img

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

img

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

img

L5阶段:专题集丨特训篇 【录播课】

img

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方二维码免费领取

👉CSDN大礼包🎁:全网最全《LLM大模型学习资源包》免费分享(安全资料,放心领取)👈

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐