RAG大模型怎么通过python调用 (接口)

1.1 大模型目前有的局促行LLM 的知识不是实时的LLM 可能不知道你私有的领域/业务知识1.2 检索增强生成RAG(Retrieval Augmented Generation)顾名思义，通过检索的方式来增强生模型的能力在这张图片可以看到原始文档构建一个知识库我们提过一个文字(首先通过知识库来检索文档也就是说预处理)然后进行排序生成一个Prompt模板然后就是上传我们的大模型(LLM

m0_64827570

825人浏览 · 2025-06-23 20:21:10

m0_64827570 · 2025-06-23 20:21:10 发布

什么是检索增强的生成模型(RAG)知识库

1.1 大模型目前有的局促行

LLM 的知识不是实时的

LLM 可能不知道你私有的领域/业务知识

1.2 检索增强生成

RAG(Retrieval Augmented Generation)顾名思义，通过检索的方式来增强生模型的能力

在这张图片可以看到原始文档构建一个知识库我们提过一个文字(首先通过知识库来检索文档也就是说预处理)然后进行排序生成一个Prompt模板然后就是上传我们的大模型(LLM 推理模型或文本生成模型) 然后大模型给我们进行一个归纳总结

可以理解为这几个阶段所

第一个阶段需要的文档存储到知识库中知识库大部分使用向量数据库

第二个阶段用户提供一个问题(也就是一个文本内容) 预处理可以理解为人类说的大白话编译为文本向量然后就是在向量数据库中做一个相似度匹配知识库中存储的两个东西一个是向量(做索引)向量对应一个原始文本也就是说向量 = 原始文本反复的

RAG系统的基本搭建流程

搭建过程：

1.文档加载，并一定条件切割成片段

2.将切割的文本段灌入检索引擎(凡是有检索的地方都要考虑有性能瓶颈)大白话就是数据多了查找的内容就会变慢

3.封装检索接口

4.构建调用流程: Query ->检索 ->Prompt ->LLM回复

2.1文档的加载与切割

# pip instal.--upgrade openai

#安装 pdf解析库等等 
# pip install pdfminer.six

from pdfminer.high _evel import extract_pages
from pdfminer.layout import LTTextContainer

#函数结构简要说明
def extract_text_from_pdf(filename, page_numbers=None, min_line_length=1):

# filename：PDF 文件路径

# page_numbers：需要提取的页码列表（可选）

# min_line_length：行的最小长度（用于排除太短的行）

#主体流程
paragraphs = []
buffer = ''
full_text = ''


#遍历 PDF 页面：
for i, page_layout in enumerate(extract_pages(filename)):
#若设置了 page_numbers，只处理指定页码：
if page_numbers is not None and i not in page_numbers:
    continue

#提取该页的所有 LTTextContainer 对象中的文本，并拼接
if isinstance(element, LTTextContainer):
    full_text += element.get_text() + '\n'
#按行分割文本并组织成段落：
lines = full_text.split('\n')
#合并多行组成段落，避免短行或断行（如带 - 的）：
if len(text) >= min_line_length:
    buffer += (' ' + text) if not text.endswith('-') else text.strip('-')

#处理缓冲区内容并追加到段落列表
elif buffer:
    paragraphs.append(buffer)
    buffer = ''
#返回所有段落
return paragraphs

下面你是完整代码...
from pdfminer.high_level import extract_pages
from pdfminer.layout import LTTextContainer

def extract_text_from_pdf(filename, page_numbers=None, min_line_length=1):
    paragraphs = []
    buffer = ''
    full_text = ''

    for i, page_layout in enumerate(extract_pages(filename)):
        if page_numbers is not None and i not in page_numbers:
            continue
        for element in page_layout:
            if isinstance(element, LTTextContainer):
                full_text += element.get_text() + '\n'

    lines = full_text.split('\n')
    for text in lines:
        if len(text.strip()) >= min_line_length:
            buffer += (' ' + text.strip()) if not text.strip().endswith('-') else text.strip('-')
        elif buffer:
            paragraphs.append(buffer.strip())
            buffer = ''
    if buffer:
        paragraphs.append(buffer.strip())

    return paragraphs

# 测试代码
if __name__ == '__main__':
    paras = extract_text_from_pdf('../LLMPython/LLMPython/text.pdf', page_numbers=[0], min_line_length=5)
    for i, p in enumerate(paras):
        print(f'段落 {i+1}:\n{p}\n{"-"*40}')

2.2LLM接口封装(大白话调用模型)我这边使用的是DeepSeek

# pip install -U python-dotenv

import os
from dotenv import load_dotenv
from openai import OpenAI

# 加载 .env 文件
load_dotenv('../LLMPython/Load_dotenv.env')

# 获取 DeepSeek API Key
api_key = os.getenv("DEEPSEEK_API_KEY")
if not api_key:
    raise ValueError("请在 .env 文件中设置 DEEPSEEK_API_KEY")

# 初始化客户端：指定 base_url 指向 DeepSeek API
client = OpenAI(api_key=api_key, base_url="https://api.deepseek.com")
print("已初始化 DeepSeek API")

# 嵌入式模型的选中
#     在一个标准中比如要了解医学 需要找需求相关的语料库来惊醒文本向量转换测试，，经行评估
# 这是国内一个https://www.modelscope.cn/home模型库
# 举例来说 我在上面的连接上找到text-embedding-ada-002 这个模型 这个模型就是对跨语言的模型是比较适合的，比如很多文档的法文，英文，中文，等等
# 总结来说不同的模型在不同的领域中是适用于不同的方面
# 比较重要！！
def get_completion(prompt, model="deepseek-chat"):
    """调用 DeepSeek 的聊天模型接口"""
    response = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "system", "content": "你是一个有帮助的助手"},
            {"role": "user", "content": prompt},
        ],
        temperature=0
    )
    return response.choices[0].message.content

# 示例调用
if __name__ == "__main__":
    prompt = "你是谁？"
    result = get_completion(prompt)
    print("模型回复：", result)

# 嵌入式模型的选中
#     在一个标准中比如要了解医学 需要找需求相关的语料库来惊醒文本向量转换测试，，经行评估
# 这是国内一个https://www.modelscope.cn/home模型库
# 举例来说 我在上面的连接上找到text-embedding-ada-002 这个模型 这个模型就是对跨语言的模型是比较适合的，比如很多文档的法文，英文，中文，等等
# 总结来说不同的模型在不同的领域中是适用于不同的方面
# 比较重要！！

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla