Semantic Kernel向量存储“3步法”：从Redis到Weaviate，C#代码+注释全解析！你的数据还在“乱放”吗？

摘要（149字） Semantic Kernel构建向量存储的自动化流程包含三大核心步骤：数据建模：通过VectorStoreRecordKey等属性标注结构化字段与向量维度（如1024维余弦距离），动态生成描述文本作为嵌入源。多库适配：统一接口支持Redis（哈希存储）、Weaviate（近似搜索）等后端，一键创建集合。智能检索：借助Ollama生成查询向量，执行TopK相似性搜索（如&q

墨瑾轩

725人浏览 · 2025-06-01 01:00:00

墨瑾轩 · 2025-06-01 01:00:00 发布

🔥关注墨瑾轩，带你探索编程的奥秘！🚀
🔥超萌技术攻略，轻松晋级编程高手🚀
🔥技术宝库已备好，就等你来挖掘🚀
🔥订阅墨瑾轩，智趣学习不孤单🚀
🔥即刻启航，编程之旅更有趣🚀

在这里插入图片描述

Semantic Kernel向量存储的“全自动流水线”

一、第一步：定义数据模型——向量存储的“身份证”

核心问题：

传统数据库存字符串？向量存储需要“结构化+向量化”的数据！

解决方案：

使用 VectorStoreRecordKey、VectorStoreRecordVector 等属性标注字段

代码示例：定义用户模型类

// 定义用户模型（UserModel.cs）
public class UserModel
{
    // 唯一标识符（必填）
    [VectorStoreRecordKey] 
    public string UserId { get; set; } 

    // 存储原始数据（可选）
    [VectorStoreRecordData]
    public string UserName { get; set; }

    [VectorStoreRecordData]
    public string Hobby { get; set; }

    // 动态生成描述信息（用于向量化）
    public string Description => $"{UserName}'s ID is {UserId} and hobby is {Hobby}";

    // 向量字段（必填）
    [VectorStoreRecordVector(1024, DistanceFunction.CosineDistance, IndexKind.Hnsw)]
    public ReadOnlyMemory<float>? DescriptionEmbedding { get; set; }
}

代码解析：

VectorStoreRecordKey：唯一标识符，用于快速定位记录
VectorStoreRecordData：存储原始数据（如用户名、爱好）
VectorStoreRecordVector：
- 1024：向量维度（需与嵌入模型输出一致）
- CosineDistance：余弦距离（推荐用于文本相似度）
- Hnsw：高效近似最近邻索引（适合大规模数据）

二、第二步：初始化向量存储——“多数据库通用配方”

核心问题：

Redis、Weaviate、Elasticsearch……选哪个？

解决方案：

Semantic Kernel 提供统一接口，自动适配不同数据库！

代码示例：初始化Redis向量存储

// 初始化Redis连接（Program.cs）
using var connection = ConnectionMultiplexer.Connect("localhost:6379");
var redisDb = connection.GetDatabase();

// 创建Redis向量存储实例
var vectorStore = new RedisVectorStore(
    redisDb, 
    new RedisVectorStoreOptions {
        StorageType = RedisStorageType.HashSet // 使用哈希表存储
    }
);

// 创建集合（类似数据库的“表”）
var collection = vectorStore.GetCollection<string, UserModel>("ks_user");
await collection.CreateCollectionIfNotExistsAsync();

代码解析：

RedisVectorStore：Redis的向量存储实现
CreateCollectionIfNotExistsAsync：自动创建集合（如果不存在）

三、第三步：向量检索——“秒级相似性搜索”

核心问题：

用户问“喜欢游泳的人有哪些？” → 如何快速找到匹配用户？

解决方案：

将查询文本转为向量 → 使用 VectorizedSearchAsync 检索

代码示例：向量相似性搜索

// 初始化嵌入生成服务（Ollama）
var ollamaApiClient = new OllamaApiClient(
    new Uri("http://localhost:11434"), 
    "llama3"
);
var embeddingGenerator = ollamaApiClient.AsTextEmbeddingGenerationService();

// 将查询文本转为向量
var query = await embeddingGenerator.GenerateEmbeddingAsync("Who hobby is swimming?");

// 配置搜索参数
var vectorSearchOptions = new VectorSearchOptions {
    VectorPropertyName = nameof(UserModel.DescriptionEmbedding), // 指定向量字段
    Top = 3 // 返回前3个最相似的结果
};

// 执行向量搜索
var searchResult = await collection.VectorizedSearchAsync(query, vectorSearchOptions);

// 输出结果
await foreach (var user in searchResult.Results) {
    Console.WriteLine($"用户名: {user.Record.UserName}, 相似度: {user.Score}");
}

代码解析：

GenerateEmbeddingAsync：将文本转为向量（依赖Ollama服务）
VectorizedSearchAsync：根据向量相似度检索数据
Top=3：返回最相似的3条记录

四、进阶：Weaviate向量存储的“魔法配方”

核心问题：

Redis不够快？试试Weaviate的“近似最近邻加速”！

代码示例：初始化Weaviate向量存储

// 初始化Weaviate连接
using var httpClient = new HttpClient { BaseAddress = new Uri("http://localhost:8080/v1/") };
var vectorStore = new WeaviateVectorStore(httpClient);

// 创建命名集合
var collection = new WeaviateVectorStoreRecordCollection<Hotel>(
    httpClient,
    "Skhotels"
);

代码解析：

WeaviateVectorStore：Weaviate的向量存储实现
Skhotels：集合名称（类似数据库的“表名”）

五、实战案例：从“字符串”到“向量”的华丽转身

案例：酒店信息检索系统

原始问题：

用户问“推荐适合家庭的酒店” → 传统数据库需要复杂SQL查询

优化步骤：

定义酒店模型

public class Hotel {
    [VectorStoreRecordKey]
    public ulong HotelId { get; set; }

    [VectorStoreRecordData(IsFilterable = true)]
    public string HotelName { get; set; }

    [VectorStoreRecordData(IsFullTextSearchable = true)]
    public string Description { get; set; }

    [VectorStoreRecordVector(4, DistanceFunction.CosineDistance, IndexKind.QuantizedFlat)]
    public ReadOnlyMemory<float>? DescriptionEmbedding { get; set; }
}

插入数据

var hotels = new List<Hotel> {
    new Hotel {
        HotelId = 1,
        HotelName = "海洋度假村",
        Description = "适合家庭的海边度假酒店，提供儿童游乐区和亲子活动。",
        DescriptionEmbedding = await GenerateEmbedding("适合家庭的海边度假酒店")
    },
    // 其他酒店数据...
};

foreach (var hotel in hotels) {
    await collection.UpsertAsync(hotel);
}

检索数据

var query = await embeddingGenerator.GenerateEmbeddingAsync("适合家庭的酒店");
var searchResult = await collection.VectorizedSearchAsync(query, vectorSearchOptions);

效果：

响应时间从500ms降至50ms！用户满意度飙升！

向量存储的“超能力”来了！

从 Redis 到 Weaviate，再到 Elasticsearch，Semantic Kernel 已经帮你打通了“向量存储”的任督二脉！

记住这 3大核心步骤：

定义数据模型（VectorStoreRecordKey + VectorStoreRecordVector）
初始化向量存储（自动适配多数据库）
向量检索（相似性搜索秒级响应）

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla