Elasticsearch 向量搜索：余弦相似度匹配

实现向量实时生成，保持数据与向量的一致性。：实际部署时建议结合。

2501_93893588

410人浏览 · 2025-10-31 20:13:43

2501_93893588 · 2025-10-31 20:13:43 发布

Elasticsearch 向量搜索：余弦相似度匹配实现

1. 核心概念

余弦相似度：衡量两个向量方向的相似性，计算公式： $$\cos(\theta) = \frac{\mathbf{A} \cdot \mathbf{B}}{|\mathbf{A}| |\mathbf{B}|}$$ 其中 $\mathbf{A} \cdot \mathbf{B}$ 是点积，$|\mathbf{A}|$ 是向量模长。
在 Elasticsearch 中：需使用 dense_vector 类型字段存储向量，通过脚本计算相似度。

2. 实现步骤

(1) 创建索引映射

PUT /vector_index
{
  "mappings": {
    "properties": {
      "text": { "type": "text" },   // 原始文本
      "embedding": {                // 向量字段
        "type": "dense_vector",
        "dims": 768,                // 向量维度 (如BERT输出)
        "index": true,              // 启用索引
        "similarity": "cosine"       // 指定余弦相似度
      }
    }
  }
}

(2) 插入文档（含向量）

POST /vector_index/_doc/1
{
  "text": "机器学习教程",
  "embedding": [0.12, -0.05, 0.87, ...]  // 768维向量
}

(3) 执行余弦相似度查询

GET /vector_index/_search
{
  "query": {
    "script_score": {
      "query": { "match_all": {} },
      "script": {
        "source": """
          // 计算余弦相似度
          double dot = 0.0;
          double normA = 0.0;
          double normB = 0.0;
          
          for (int i = 0; i < params.query_vector.length; ++i) {
            dot += params.query_vector[i] * doc['embedding'].get(i);
            normA += params.query_vector[i] * params.query_vector[i];
            normB += doc['embedding'].get(i) * doc['embedding'].get(i);
          }
          
          return dot / (Math.sqrt(normA) * Math.sqrt(normB));
        """,
        "params": {
          "query_vector": [0.15, -0.02, 0.91, ...]  // 查询向量
        }
      }
    }
  }
}

3. 关键参数说明

参数	作用	示例值
`dense_vector`	向量字段类型	必填
`dims`	向量维度	768 (BERT) / 512 (其他模型)
`similarity`	相似度算法	`cosine`
`script_score`	自定义评分查询	用于计算相似度

4. 优化建议

归一化预处理：存储前将向量归一化（模长为1），可简化为点积计算： $$\cos(\theta) = \mathbf{A} \cdot \mathbf{B}$$

使用knn查询（Elasticsearch 8.0+）：

{
  "knn": {
    "field": "embedding",
    "query_vector": [0.15, -0.02, 0.91, ...],
    "k": 10,
    "num_candidates": 100
  }
}

性能注意：超过1000维时需调整 index_options 参数

5. 典型应用场景

语义搜索（如：用BERT生成文本向量）
推荐系统（物品/用户向量匹配）
图像/音视频内容检索

提示：实际部署时建议结合Ingest Pipeline实现向量实时生成，保持数据与向量的一致性。

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

智能体开发者社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

智能体开发者社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla