什么是矢量数据库？

摘要：矢量数据库通过深度学习将非结构化数据（文本、图像等）转化为向量嵌入，实现语义相似性搜索、聚类等复杂操作。相比传统静态嵌入模型，基于Transformer的模型（如BERT）能生成上下文感知的向量。在LLM中，矢量数据库支持检索增强生成（RAG），通过动态检索外部知识减少模型幻觉。随着AI大模型快速发展，掌握相关技术（如RAG、微调）成为新兴行业的重要方向。文中还提供了大模型学习路线和免费资

高级绘画师PP

1040人浏览 · 2025-07-16 19:30:03

高级绘画师PP · 2025-07-16 19:30:03 发布

什么是矢量数据库

首先矢量数据库并不是一个新鲜事物。在最近流行之前，就已经在日常生活中间接地与它进行互动了，例如推荐系统和搜索引擎等。简单来说，向量数据库以向量嵌入的形式存储存储非结构化数据（文本、图像、音频。视频等）。

每个数据，无论是单词、文档、图像还是任何其他实体，都使用深度学习技术转换为数值向量。这个数值向量被称为嵌入，模型经过训练后，这些向量可以捕捉到底层数据的基本特征和特性。

词嵌入后，我们可能发现在嵌入空间中，水果的嵌入彼此靠近，城市则形成另一个集群，等等。

这表明嵌入可以学习他们所代表的实体的语义特征。一旦存储在矢量数据库中，我们就可以检索与我们希望在非结构化数据上运行的查询类似的原始对象。

换句话说，对非结构化数据进行编码使我们能够运行许多复杂的操作，例如相似性搜索、聚类和分类，而这些操作对于传统数据库来说是困难的。

举例来说，当电子商务网站提供类似商品的推荐或根据输入查询搜索产品时，我们（大多数情况下）在后台与矢量数据库进行交互。

查询矢量数据库

提供一个输入查询，该查询经过编码，然后在向量数据库中搜索和输入向量相似的向量，相似度计算方法可以是欧几里得距离、曼哈顿距离、余弦相似度（感兴趣可以自行了解），前两者是结果越低，相似度越高，后者是结果越大，相似度越高。

在实际使用过程中，应尽量避免输入查询必须与存储在向量数据库中的所有向量进行匹配，矢量数据库也采用了类似索引的思想，核心是缩小查询向量的搜索空间，从而提高运行时性能，因此近似最近邻思想用于查找到数据点较近的数据节点，但是这些数据节点可能不总是最近的数据节点。

如何生成词嵌入

在Transformer时代之前，主要是使用预先训练的静态嵌入模型来完成的，本质上是使用深度学习技术对大量的词进行嵌入训练然后开源，当时最受欢迎的模型有Glove、Word2Vec、FastText等等。

但是这些嵌入模型没有考虑到一个词在不同语境下的不同用法，像表格和桌子在静态嵌入模型中的向量是相同的。

在Transformer时代，产生了由Transfomer驱动的情境化嵌入模型：BERT、DistilBERT和SentenceTransformer等等（感兴趣的自行了解），由于这些模型具有自我注意力机制和适当的训练机制，它们能够生成情境感知的表示。

BERT和DistilBERT会为句子中所有单词生成嵌入向量；SentenceTransformer会将整个句子生成一个嵌入向量。

在LLM中使用矢量数据库

大模型是从训练期间输入的静态语料库训练得到的，训练完成后到使用前发生的一切事情他他就完全不知道了。一种解决方法是在提示词中提供该信息，但是这只对少量信息有效。另一种方法是利用矢量数据库动态更新模型对世界的理解，而不是每次出现新数据或发生变化是重新训练但LLM。

将提示词和在矢量数据库中检索到的信息一起提供给LLM，LLM可以在生成文本时轻松地合并此信息，这就是检索增强生成（RAG）的核心思想，RAG的名称就完全表明了用这种技术所做的事情：

检索：从知识源（例如数据库或内存）访问和检索信息。
增强：通过附加信息或上下文来增强或丰富某些内容。
生成：创造或生产某种东西的过程，这里指生成文本或语言。

通过 RAG，语言模型可以使用从矢量数据库中检索到的信息（预计是可靠的）来确保其响应基于现实世界的知识和背景，从而降低出现幻觉的可能性。

最后

选择AI大模型就是选择未来！最近两年，大家都可以看到AI的发展有多快，我国超10亿参数的大模型，在短短一年之内，已经超过了100个，现在还在不断的发掘中，时代在瞬息万变，我们又为何不给自己多一个选择，多一个出路，多一个可能呢？

与其在传统行业里停滞不前，不如尝试一下新兴行业，而AI大模型恰恰是这两年的大风口，整体AI领域2025年预计缺口1000万人，人才需求急为紧迫！

由于文章篇幅有限，在这里我就不一一向大家展示了，学习AI大模型是一项系统工程，需要时间和持续的努力。但随着技术的发展和在线资源的丰富，零基础的小白也有很好的机会逐步学习和掌握。

【2025最新】AI大模型全套学习籽料（可白嫖）：LLM面试题+AI大模型学习路线+大模型PDF书籍+640套AI大模型报告等等，从入门到进阶再到精通，超全面存下吧！

获取方式：有需要的小伙伴，可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
包括：AI大模型学习路线、LLM面试宝典、0基础教学视频、大模型PDF书籍/笔记、大模型实战案例合集、AI产品经理合集等等

在这里插入图片描述
大模型学习之路，道阻且长，但只要你坚持下去，一定会有收获。本学习路线图为你提供了学习大模型的全面指南，从入门到进阶，涵盖理论到应用。
L1阶段：启航篇|大语言模型的基础认知与核心原理

L2阶段：攻坚篇|高频场景:RAG认知与项目实践

L3阶段：跃迀篇|Agent智能体架构设计

L4阶段：精进篇|模型微调与私有化部署

L5阶段：专题篇|特训集：A2A与MCP综合应用追踪行业热点（全新升级板块）

在这里插入图片描述

AI大模型全套学习资料【获取方式】

在这里插入图片描述

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla

火山引擎 ADG 社区

所有评论(0)

查看更多评论

高级绘画师PP

已为社区贡献260条内容