简介

语析(Yuxi-Know)​​ 是一个功能强大的智能问答平台,融合了RAG知识库与知识图谱技术,基于LangGraph + Vue.js + FastAPI + LightRAG架构构建。该系统支持多模型、多知识库类型,并提供完善的知识图谱功能。

🔗 ​GitHub地址​:

https://github.com/xerrors/Yuxi-Know

🚀 ​核心价值​:

知识图谱 · RAG系统 · 多模型支持 · 智能问答 · 开源免费

项目背景​:

  • 知识管理需求​:应对企业知识管理复杂需求

  • RAG技术​:检索增强生成技术应用

  • 知识图谱​:知识图谱技术集成

  • 多模型生态​:多模型支持需求

  • 开源解决方案​:开源智能问答解决方案

项目特色​:

  • 🤖 ​多模型支持​:支持主流大模型平台

  • 📚 ​灵活知识库​:多类型知识库支持

  • 🕸️ ​知识图谱​:知识图谱构建与查询

  • 👥 ​权限控制​:多级权限管理体系

  • 🆓 ​开源免费​:MIT许可证开源

技术亮点​:

  • LangGraph架构​:基于LangGraph的智能体系统

  • LightRAG集成​:轻量级GraphRAG方法

  • Neo4j图数据库​:知识图谱存储管理

  • 多OCR服务​:多OCR解析服务支持

  • 容器化部署​:完整Docker容器化支持


主要功能

1. ​核心功能体系

语析提供了一套完整的智能问答解决方案,涵盖知识管理、图谱构建、智能问答、模型集成、权限管理、系统监控等多个方面。

知识管理功能​:

知识库类型:
- Chroma: Chroma向量数据库
- Milvus: Milvus向量数据库
- LightRAG: 轻量级GraphRAG
- 自定义: 自定义知识库支持

文档处理:
- 文档上传: 多格式文档上传
- 文档解析: 智能文档解析
- 内容提取: 内容提取处理
- 向量化: 文本向量化处理
- 索引构建: 索引构建优化

知识组织:
- 分类管理: 知识分类管理
- 标签系统: 标签管理系统
- 版本控制: 版本控制管理
- 元数据: 丰富元数据支持
- 搜索功能: 高级搜索功能

知识图谱功能​:

图谱构建:
- 自动构建: 自动图谱构建功能
- 手动导入: 手动图谱数据导入
- 实体识别: 实体识别提取
- 关系抽取: 关系抽取建立
- 图谱更新: 图谱更新维护

图谱查询:
- 语义查询: 语义查询功能
- 关系查询: 关系查询功能
- 路径查询: 路径分析查询
- 模式匹配: 模式匹配查询
- 复杂查询: 复杂组合查询

图谱可视化:
- 图形展示: 图形化展示功能
- 交互操作: 交互式操作支持
- 布局调整: 多种布局方案
- 筛选过滤: 数据筛选过滤
- 导出功能: 图谱导出功能

2. ​高级功能

多模型支持功能​:

模型提供商:
- 硅基流动: 硅基流动模型
- OpenAI: OpenAI系列模型
- DeepSeek: DeepSeek模型
- OpenRouter: OpenRouter平台
- 智谱清言: 智谱AI模型
- 阿里百炼: 阿里云百炼
- 自定义: 自定义模型支持

模型管理:
- 模型配置: 模型配置管理
- 密钥管理: API密钥管理
- 性能监控: 模型性能监控
- 负载均衡: 负载均衡支持
- 故障转移: 故障转移机制

兼容性:
- OpenAI兼容: OpenAI兼容模型
- vLLM支持: vLLM本地推理
- Ollama支持: Ollama本地模型
- 自定义API: 自定义API集成
- 协议支持: 多种协议支持

智能体系统功能​:

智能体类型:
- 基础智能体: 基础问答智能体
- ReAct智能体: ReAct推理智能体
- DeepResearch: 深度研究智能体
- 自定义智能体: 自定义智能体开发

智能体开发:
- LangGraph: 基于LangGraph开发
- 图形定义: 图形化流程定义
- 工具集成: 工具函数集成
- 状态管理: 状态管理机制
- 调试支持: 调试开发支持

智能体管理:
- 注册管理: 智能体注册管理
- 配置管理: 配置参数管理
- 版本管理: 版本控制管理
- 部署管理: 部署发布管理
- 监控管理: 运行监控管理

OCR解析功能​:

OCR服务:
- RapidOCR: RapidOCR onnx版本
- MinerU: MinerU PDF解析
- PP-Structure: PP-Structure-V3
- 自定义: 自定义OCR服务

解析能力:
- 文本识别: 高精度文本识别
- 表格识别: 表格结构识别
- 公式识别: 数学公式识别
- 版式分析: 文档版式分析
- 多语言: 多语言支持能力

性能优化:
- GPU加速: GPU加速支持
- 批量处理: 批量处理优化
- 缓存机制: 结果缓存机制
- 质量评估: 解析质量评估
- 错误处理: 错误处理机制

权限管理系统​:

用户角色:
- 超级管理员: 系统超级管理员
- 管理员: 系统管理员
- 普通用户: 普通使用用户
- 访客: 只读访客用户

权限控制:
- 功能权限: 功能访问权限
- 数据权限: 数据访问权限
- 操作权限: 操作执行权限
- 审计日志: 操作审计日志

安全管理:
- 身份认证: 用户身份认证
- 访问控制: 访问控制管理
- 密码安全: 密码安全管理
- 会话管理: 会话安全管理
- 安全审计: 安全审计功能

安装与配置

1. ​环境准备

系统要求​:

基础要求:
- Docker: Docker运行环境
- Docker Compose: Compose工具
- 内存: 8GB+ RAM (推荐16GB)
- 存储: 50GB+ 可用空间
- 网络: 稳定网络连接

可选要求:
- GPU: NVIDIA GPU (OCR服务)
- CUDA: CUDA工具包 (GPU版)
- 模型存储: 大模型存储空间
- 网络带宽: 高速网络带宽

开发环境:
- Python: 3.11+
- Node.js: 前端开发需要
- UV: Python包管理
- Git: 版本控制系统

2. ​安装步骤

一键安装​:

# 克隆项目
git clone -b 0.2.1 https://github.com/xerrors/Yuxi-Know.git
cd Yuxi-Know

# 配置环境变量
cp src/.env.template src/.env
# 编辑src/.env配置API密钥

# 启动服务
docker compose up --build

# 后台运行
docker compose up -d --build

稳定版本安装​:

# 使用稳定分支
git clone -b stable https://github.com/xerrors/Yuxi-Know.git
cd Yuxi-Know

# 后续步骤相同

开发版本安装​:

# 使用开发分支
git clone -b main https://github.com/xerrors/Yuxi-Know.git
cd Yuxi-Know

# 开发环境配置
uv venv
source .venv/bin/activate
uv pip install -e .

镜像问题处理​:

# 手动拉取镜像
docker/pull_image.sh python:3.11-slim

# 镜像保存和加载
docker/save_docker_images.sh
docker load -i docker_images_xxx.tar

3. ​配置说明

环境变量配置​:

# API密钥配置
SILICONFLOW_API_KEY=sk-your-api-key
OPENAI_API_KEY=sk-your-openai-key
DEEPSEEK_API_KEY=sk-your-deepseek-key

# 服务配置
NEO4J_URI=bolt://graph:7687
MILVUS_HOST=milvus
MINIO_ENDPOINT=minio:9000

# OCR配置
MODEL_DIR=./models
MODEL_DIR_IN_DOCKER=/models

# 网络代理
HTTP_PROXY=http://ip:port
HTTPS_PROXY=http://ip:port

模型配置​:

# 自定义模型配置示例
custom-provider:
  name: "custom-provider"
  default: "custom-model"
  base_url: "https://api.example.com/v1"
  env:
    - CUSTOM_API_KEY
  models:
    - "custom-model-1"
    - "custom-model-2"

知识库配置​:

# 知识库配置示例
knowledge_bases:
  - type: "chroma"
    name: "主要知识库"
    path: "/data/chroma"
    embedding: "BAAI/bge-base-en-v1.5"
  
  - type: "milvus"
    name: "向量知识库"
    host: "milvus"
    port: 19530
    collection: "main_collection"
  
  - type: "lightrag"
    name: "图谱知识库"
    graph: "neo4j"
    auto_build: true

OCR服务配置​:

# OCR服务配置
ocr_services:
  rapid_ocr:
    enabled: true
    model_path: "/models/SWHL/RapidOCR"
    onnx_models:
      det: "PP-OCRv4/ch_PP-OCRv4_det_infer.onnx"
      rec: "PP-OCRv4/ch_PP-OCRv4_rec_infer.onnx"
  
  mineru:
    enabled: false
    gpu: true
    port: 30000
  
  paddlex:
    enabled: false
    gpu: true
    port: 8080

使用指南

1. ​基本工作流

使用语析的基本流程包括:环境准备 → 安装部署 → 服务启动 → 系统配置 → 知识库创建 → 文档上传 → 图谱构建 → 问答使用 → 系统维护。整个过程设计为完整且高效。

2. ​基本使用

系统管理使用​:

1. 系统启动:
   - 环境检查: 检查环境准备
   - 服务启动: 启动所有服务
   - 状态检查: 检查服务状态
   - 日志监控: 监控运行日志
   - 问题排查: 问题排查处理

2. 系统配置:
   - 模型配置: 配置模型参数
   - 知识库配置: 配置知识库
   - OCR配置: 配置OCR服务
   - 权限配置: 配置权限系统
   - 网络配置: 配置网络设置

3. 用户管理:
   - 用户创建: 创建系统用户
   - 角色分配: 分配用户角色
   - 权限设置: 设置用户权限
   - 密码管理: 管理用户密码
   - 审计查看: 查看操作审计

知识管理使用​:

1. 知识库创建:
   - 选择类型: 选择知识库类型
   - 配置参数: 配置知识库参数
   - 创建确认: 确认创建知识库
   - 初始化: 知识库初始化
   - 测试验证: 测试知识库功能

2. 文档上传:
   - 选择文件: 选择上传文件
   - 格式验证: 验证文件格式
   - 上传处理: 上传文件处理
   - 解析状态: 查看解析状态
   - 结果查看: 查看解析结果

3. 知识图谱:
   - 图谱构建: 构建知识图谱
   - 图谱查看: 查看知识图谱
   - 图谱查询: 执行图谱查询
   - 图谱导出: 导出图谱数据
   - 图谱维护: 维护图谱数据

智能问答使用​:

1. 问答界面:
   - 问题输入: 输入问题内容
   - 模型选择: 选择回答模型
   - 知识库选择: 选择知识库
   - 参数设置: 设置回答参数
   - 执行查询: 执行问题查询

2. 结果处理:
   - 答案查看: 查看回答结果
   - 来源查看: 查看答案来源
   - 置信度: 查看置信度
   - 反馈提供: 提供反馈意见
   - 结果导出: 导出回答结果

3. 智能体使用:
   - 智能体选择: 选择智能体类型
   - 任务配置: 配置任务参数
   - 任务执行: 执行智能体任务
   - 进度监控: 监控任务进度
   - 结果分析: 分析任务结果

3. ​高级用法

批量处理使用​:

批量上传:
- 脚本使用: 使用上传脚本
- 目录指定: 指定上传目录
- 模式匹配: 文件模式匹配
- 并发控制: 并发上传控制
- 记录管理: 上传记录管理

文件解析:
- 格式转换: 文件格式转换
- Markdown输出: 输出Markdown格式
- 质量控制: 解析质量控制
- 批量处理: 批量处理文件
- 结果验证: 解析结果验证

数据处理:
- 数据清洗: 数据清洗处理
- 格式标准化: 格式标准化处理
- 质量评估: 数据质量评估
- 批量导入: 批量数据导入
- 导出备份: 数据导出备份

开发扩展使用​:

智能体开发:
- 基类继承: 继承BaseAgent
- 图形定义: 定义LangGraph
- 工具集成: 集成工具函数
- 测试调试: 测试调试智能体
- 部署发布: 部署发布智能体

模型集成:
- 模型添加: 添加新模型支持
- API适配: 适配模型API
- 协议实现: 实现协议支持
- 测试验证: 测试模型功能
- 文档编写: 编写使用文档

功能扩展:
- 新功能开发: 开发新功能
- 界面定制: 定制用户界面
- 集成扩展: 扩展系统集成
- 性能优化: 性能优化改进
- 文档补充: 补充功能文档

企业级部署​:

生产部署:
- 环境准备: 准备生产环境
- 配置优化: 生产配置优化
- 安全加固: 安全加固配置
- 监控设置: 监控系统设置
- 备份策略: 数据备份策略

高可用部署:
- 集群部署: 集群化部署
- 负载均衡: 负载均衡配置
- 故障转移: 故障转移机制
- 数据同步: 数据同步方案
- 性能优化: 性能优化配置

运维管理:
- 系统监控: 系统运行监控
- 日志管理: 日志管理系统
- 告警处理: 告警处理机制
- 性能调优: 性能调优优化
- 升级维护: 系统升级维护

应用场景实例

案例1:企业知识管理系统

场景​:企业知识管理平台

解决方案​:使用语析构建企业知识管理系统。

实施方法​:

  1. 知识整合​:整合企业各类知识文档

  2. 知识库构建​:构建企业知识库系统

  3. 图谱建立​:建立企业知识图谱

  4. 员工培训​:员工使用培训

  5. 持续维护​:系统持续维护更新

企业价值​:

  • 知识集中​:集中知识管理

  • 检索效率​:提高知识检索效率

  • 决策支持​:更好决策支持

  • 员工效率​:提高员工工作效率

  • 知识传承​:企业知识传承保护

案例2:智能客服问答系统

场景​:智能客服知识支持

解决方案​:使用语析构建客服问答系统。

实施方法​:

  1. 知识准备​:准备客服知识文档

  2. 系统集成​:集成到客服系统

  3. 实时问答​:实时客服问答

  4. 答案生成​:智能答案生成

  5. 效果优化​:持续效果优化

客服价值​:

  • 回答准确​:提高回答准确性

  • 响应速度​:快速响应客户问题

  • 知识更新​:容易知识更新维护

  • 成本降低​:降低客服成本

  • 满意度提升​:客户满意度提升

案例3:学术研究知识平台

场景​:学术研究知识管理

解决方案​:使用语析构建学术研究平台。

实施方法​:

  1. 文献收集​:收集研究文献资料

  2. 知识组织​:组织研究知识体系

  3. 图谱构建​:构建研究知识图谱

  4. 研究发现​:支持研究发现问题

  5. 协作研究​:协作研究支持

研究价值​:

  • 文献管理​:高效文献管理

  • 知识发现​:新知识发现支持

  • 研究效率​:提高研究效率

  • 协作支持​:研究协作支持

  • 创新促进​:促进科研创新

案例4:教育知识问答系统

场景​:教育知识问答平台

解决方案​:使用语析构建教育问答系统。

实施方法​:

  1. 教材整合​:整合教育教材内容

  2. 知识结构化​:知识结构组织

  3. 问答系统​:构建问答系统

  4. 学习支持​:学生学习支持

  5. 效果评估​:学习效果评估

教育价值​:

  • 学习效率​:提高学习效率

  • 个性化​:个性化学习支持

  • 资源优化​:教育资源优化

  • 效果提升​:学习效果提升

  • 可及性​:教育可及性提升

案例5:医疗知识管理系统

场景​:医疗知识管理

解决方案​:使用语析构建医疗知识系统。

实施方法​:

  1. 医学文献​:整合医学文献

  2. 临床指南​:整合临床指南

  3. 病例数据​:病例数据管理

  4. 诊断支持​:诊断决策支持

  5. 医生培训​:医生培训支持

医疗价值​:

  • 诊断支持​:诊断决策支持

  • 知识更新​:医学知识更新

  • 培训效率​:医生培训效率

  • 医疗质量​:医疗质量提升

  • 患者安全​:患者安全保障


总结

语析(Yuxi-Know)作为一个功能强大的知识管理与智能问答平台,通过其多模型支持、灵活知识库、知识图谱功能、权限管理和开源特性,为知识管理和智能问答提供了理想的解决方案。

核心优势​:

  • 🤖 ​多模型支持​:支持主流大模型平台

  • 📚 ​知识管理​:专业知识管理功能

  • 🕸️ ​知识图谱​:知识图谱构建查询

  • 👥 ​权限管理​:完善权限管理系统

  • 🆓 ​开源免费​:MIT许可证开源

适用场景​:

  • 企业知识管理系统

  • 智能客服问答系统

  • 学术研究知识平台

  • 教育知识问答系统

  • 医疗知识管理系统

立即开始使用​:

# 克隆和安装
git clone -b 0.2.1 https://github.com/xerrors/Yuxi-Know.git
cd Yuxi-Know
docker compose up --build

# 访问 http://localhost:5173

资源链接​:

  • 📚 ​项目地址​:GitHub仓库

  • 📖 ​文档​:详细使用文档

  • 💬 ​社区​:社区讨论支持

  • 🐛 ​问题​:GitHub Issues

  • 🔧 ​示例​:代码示例参考

通过语析,您可以​:

  • 知识管理​:专业知识管理

  • 智能问答​:智能问答系统

  • 图谱构建​:知识图谱构建

  • 多模型应用​:多模型应用支持

  • 开源贡献​:参与开源贡献

无论您是开发者、企业用户、研究人员、教育工作者还是医疗专业人员,语析都能为您提供强大、可靠且易用的知识管理解决方案!​

特别提示​:

  • 🔑 ​API密钥​:正确配置API密钥

  • 🔧 ​环境配置​:正确环境配置

  • 📊 ​性能监控​:监控系统性能

  • 🐛 ​问题排查​:利用社区支持

  • 📚 ​文档参考​:参考详细文档

通过语析,共同推动知识管理技术的发展!​

未来发展​:

  • 🚀 ​更多功能​:持续添加新功能

  • 🤖 ​更智能​:更智能的知识管理

  • 🌍 ​更广泛​:更广泛的应用场景

  • ⚡ ​更快速​:更快的性能表现

  • 🔧 ​更易用​:更简单的使用体验

加入社区​:

参与方式:
- GitHub: 提交问题和PR
- 讨论区: 参与技术讨论
- 文档: 贡献文档改进
- 示例: 贡献使用示例
- 教程: 贡献使用教程

社区价值:
- 技术交流学习
- 问题解答支持
- 功能建议讨论
- 项目贡献认可
- 职业发展机会

通过语析,共同构建更好的知识管理生态!​

许可证​:

MIT许可证
免费用于学术和商业用途

致谢​:

特别感谢:
- 开发团队: 项目开发和维护
- 贡献者: 代码和功能贡献
- 用户社区: 用户反馈和支持
- 开源项目: 依赖的开源项目
- 合作伙伴: 项目合作伙伴

通过语析,体验知识管理的无限可能!​

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐