使用千问+LangChain+Postgres数据库实现最简单的rag

本文介绍了使用Postgres数据库和pgvector插件构建RAG系统的过程。首先配置环境变量并导入必要库，包括psycopg2、langchain等。通过PyPDFLoader加载PDF文档，使用文本分割器将文档分块处理。利用DashScopeEmbeddings生成文本向量嵌入，并将向量数据存储到Postgres数据库中。最后演示了基于向量相似度的查询方法，通过计算查询文本与存储向量的距离来

计算机器

318人浏览 · 2025-11-22 22:16:44

计算机器 · 2025-11-22 22:16:44 发布

安装Postgres数据库以及安装pgvector向量插件请参考：这里

使用的文档是一部pdf格式的英文小小说，下载链接见文章顶部资源链接。

首先定义.env文件，保存千问模型的key，base url和模型名字，这里使用的是qwen-plus：

DASHSCOPE_API_KEY=你的key
BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1
MODEL=qwen-plus

打开Jupyter notebook，先import。其中psycopg2用于连接数据库，使用的版本如下：

psycopg2: 2.9.11
langchain: 1.0.5

import os
import json
import psycopg2
from langchain_community.document_loaders.pdf import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_core.documents import Document
from langchain_openai import ChatOpenAI
from langchain_community.embeddings import DashScopeEmbeddings
from dotenv import load_dotenv

load_dotenv()

设置文档路径，数据库连接字符串，向量维度

PDF_PATH = "./testrag.pdf"
PG_DSN = "dbname=postgres user=postgres password=admin host=localhost port=5432"
VECTOR_DIM = 1024

加载pdf测试文档，分块：

loader = PyPDFLoader(PDF_PATH)
docs = loader.load()
splitter = RecursiveCharacterTextSplitter(chunk_size=200, chunk_overlap=30)
chunks = splitter.split_documents(docs)

定义一个方法方便对分块的文本做嵌入操作

def get_embedding(text):
    print(text)
    underlying_embeddings = DashScopeEmbeddings(
        model="text-embedding-v4",
        dashscope_api_key=os.getenv("DASHSCOPE_API_KEY")
    )
    embeddings = underlying_embeddings.embed_documents(text)
    print(embeddings)
    return embeddings

连接数据库，创建表用来存储向量

conn = psycopg2.connect(PG_DSN)
cur = conn.cursor()
cur.execute("""
   CREATE TABLE IF NOT EXISTS doc_chunks (
            id SERIAL PRIMARY KEY,
            content TEXT,
            metadata TEXT,
            embedding vector(%s)
        )
""" % VECTOR_DIM)
conn.commit()

将文本向量化然后存入数据库

for chunk in chunks:
    emb = get_embedding([chunk.page_content])
    if hasattr(emb, "tolist"):
        emb = emb.tolist()
    if isinstance(emb, list) and len(emb) == 1 and isinstance(emb[0], (list, tuple)):
        emb = emb[0]
    cur.execute(
        "INSERT INTO doc_chunks(content,metadata, embedding) VALUES (%s, %s,%s)", (chunk.page_content, json.dumps(chunk.metadata), emb)
    )
conn.commit()
print(f"has inserted {len(chunks)} chunk and embeddings")

插入到数据库的结果：

查询：

query_text = "had she drag him down?"
query_emb = get_embedding(query_text)
print(query_emb[0])
cur.execute(
    "SELECT content, metadata, embedding <-> %s::vector AS distance FROM doc_chunks ORDER BY distance ASC LIMIT 3", (query_emb[0],)
)
#cur.execute("SELECT content, metadata from doc_chunks order by embedding <-> %s::vector", (query_emb[0],))
results = cur.fetchall()
print("most relativecontent: ")
print(results)

查询结果：

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

智能体开发者社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

智能体开发者社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla