前言


随着人工智能技术的快速发展,构建高效、智能的知识问答系统已成为企业提升服务效率的重要手段。本文基于华为云 Flexus X 实例ModelArts Studio,搭建支持 RAG 管道的开源知识库问答助手 MaxKB,探索云端智能化应用的快速部署能力。实践过程中,DeepSeek 提供的强大语言模型能力显著提升了问答系统的准确性和响应速度。通过本次实验,不仅验证了华为云平台在 AI 工程化落地中的稳定性与易用性,也为后续构建企业级智能客服、内部知识管理等场景提供了可行的技术路径。


一、华为云相关服务介绍

1.1 华为云Flexus X实例介绍

华为云Flexus云服务器X实例是新一代面向中小企业和开发者的柔性算力云服务器。它能够智能感知业务负载的变化,自动调整资源配置。这款服务器特别适用于中低负载的应用场景,例如电商直播、企业网站建设、开发测试环境、游戏服务器以及音视频服务等。X实例的设计理念旨在为用户提供更加灵活和高效的计算资源管理方式。通过智能调整,它可以更好地满足不同业务的需求,提高资源利用率。

在这里插入图片描述

1.2 华为云ModelArts Studio介绍

ModelArts Studio是华为云提供的一个大模型即服务平台(MaaS服务),旨在简化模型开发流程,支持定制化大模型的开发,并使这些模型能够无缝集成到业务系统中。通过降低企业AI应用的成本和难度,ModelArts Studio助力企业快速实现AI技术落地。

在这里插入图片描述

二、 MaxKB介绍

2.1 MaxKB 简介

MaxKB(Maximum Knowledge Base)是一款面向企业服务的开源 AI 助手,集成了检索增强生成(RAG)管道,支持强大的工作流编排和MCP工具调用能力,帮助企业快速构建智能问答与知识管理解决方案。它广泛应用于智能客服、企业内部知识库、学术研究、教育培训等多个领域。

2.2 主要特点

  1. 集成 RAG 管道:支持文档上传与在线抓取,自动完成文本分割与向量化,显著提升问答准确性。
  2. Agentic 工作流引擎:提供可视化流程编排能力,满足复杂业务逻辑的AI任务调度需求。
  3. 无缝集成能力:无需编码即可快速对接第三方系统,快速实现智能化升级。
  4. 模型无关架构:兼容主流私有与公有大模型,灵活适配多种部署环境。
  5. 多模态支持:支持文本、图像、音频、视频等多种输入输出形式,拓展应用场景边界。

三、本次实践介绍

3.1 本次实践介绍

  1. 本次实践基于个人测试环境,依托华为云 Flexus X 实例与 ModelArts Studio 平台开展;
  2. 实践内容为在华为云 Flexus X 实例上部署MaxKB平台,并接入 ModelArts Studio 提供的 DeepSeek-R1-32K 商用大模型服务,搭建一个MaxKB知识库问答助手。

3.2 实践环境规划

🌐 云平台与部署概览

云厂商 云服务器实例 使用的云服务 部署项目 备注
华为云 Flexus X 实例 MaaS平台 DeepSeek-R1-32K 商用服务 MaxKB ——

📋 服务器配置详情

操作系统 镜像选择 实例规格 Docker 版本 内网 IP 地址 系统内核版本
Ubuntu 24.04 Ubuntu 24.04 Server 64bit (10GiB) 2vCPUs | 4GiB 28.2.2 192.168.0.130 6.8.0-49-generic

三、购买华为云Flexus X实例

3.1 购买Flexus云服务器X实例配置

我们在华为云官网首页,精选推荐模块中,可以看到Flexus云服务器X实例,点击进入Flexus云服务器X实例主页。

在这里插入图片描述

在这里插入图片描述

点击页面中的“购买”选项,进入Flexus云服务器X实例购买页面。

在这里插入图片描述

购买云服务器配置可参考如下:
计费模式 : 按需计费 ;
区域 : 西南-贵阳一,可用区:随机即可 ;
实例规格 : 2vCPUs | 4GiB ,开启性能模式 ;
镜像 : 公共镜像,Ubuntu,版本:Ubuntu 24.04 server 64bit(10GiB) ;
存储 :系统盘,默认通用型SSD 40G ;
网络 :选择默认即可 ;
安全组 :选择默认即可 ;
弹性公网IP : 选择“现在购买”,全动态BGP,带宽3Mbit/s ;
云服务器名称 :可自定义设置,这里选择默认的名称 ;
登录凭证 :自定义设置密码 ;
云备份 :可根据需要选择是否购买,测试时建议不购买节省费用 ;
确认配置及购买:在确认配置页面仔细检查Flexus云服务器X实例的各项设置,确保无误后点击“立即购买”,完成付款流程即可成功购买。

在这里插入图片描述

在这里插入图片描述

3.2 使用Xshell远程连接

进入华为云Flexus云服务的控制台,选择Flexus云服务器X实例,可以看到已经正在运行的Flexus云服务器X实例。

在这里插入图片描述

复制Flexus云服务器X实例的弹性公网IP地址,作为后面登录xshell终端使用。

在这里插入图片描述

  • 主要填写Flexus云服务器X实例的弹性公网IP地址,输入其登录用户和密码,连接即可。

在这里插入图片描述

在这里插入图片描述

3.3 检查操作系统版本

检查Flexus云服务器X实例的操作系统版本,本次实践选择的版本为Ubuntu 24.04.1 LTS

root@flexusx-7619:~# cat /etc/os-release
PRETTY_NAME="Ubuntu 24.04.1 LTS"
NAME="Ubuntu"
VERSION_ID="24.04"
VERSION="24.04.1 LTS (Noble Numbat)"
VERSION_CODENAME=noble
ID=ubuntu
ID_LIKE=debian
HOME_URL="https://www.ubuntu.com/"
SUPPORT_URL="https://help.ubuntu.com/"
BUG_REPORT_URL="https://bugs.launchpad.net/ubuntu/"
PRIVACY_POLICY_URL="https://www.ubuntu.com/legal/terms-and-policies/privacy-policy"
UBUNTU_CODENAME=noble
LOGO=ubuntu-logo

检查当前操作系统的内核版本,当前内核版本为6.8.0-49-generic

root@flexusx-7619:~# uname -r
6.8.0-49-generic

四、安装MaxKB系统

4.1 安装Docker环境

4.1.1 配置Docker软件源

安装Docker之前,我们先安装 HTTPS传输工具及必要组件。

apt  install -y apt-transport-https ca-certificates curl gnupg lsb-release software-properties-common

在这里插入图片描述

执行以下命令,添加阿里云 GPG 密钥。

mkdir -p /etc/apt/keyrings
curl -fsSL https://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker-archive-keyring.gpg

执行以下命令,开始配置阿里云 Docker 软件源。

echo "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker-archive-keyring.gpg] https://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

使用apt update命令,更新软件源。

apt update

在这里插入图片描述

4.1.2 安装Docker

执行以下命令,安装Docker核心组件。

apt  install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

在这里插入图片描述

4.1.3 配置镜像加速

执行以下命令,快速配置Docker镜像加速。这里我们配置华为云的镜像加速服务,也可以自行添加多个Docker镜像加速源,确保后续可以成功拉取Docker镜像。

mkdir -p /etc/docker
sudo  tee /etc/docker/daemon.json > /dev/null <<EOF
{
    "registry-mirrors": ["https://80c84f5330e14908928ca78944e61dc4.mirror.swr.myhuaweicloud.com"]
}
EOF

执行以下命令,配置Docker开机自启。

systemctl daemon-reload
systemctl restart docker
systemctl enable  docker

4.1.4 检查Docker版本

检查Docker版本,可以看到当前安装的版本为28.2.2

root@flexusx-7619:~# docker -v
Docker version 28.2.2, build e6534b4

检查Docker compose版本,当前安装版本为2.36.2

root@flexusx-7619:~# docker compose version
Docker Compose version v2.36.2

4.1.5 检查Docker状态

检查Docker服务状态,确保Docker服务正常运行。

systemctl status docker

在这里插入图片描述

4.2 下载MaxKB容器镜像

建议使用华为云镜像加速下载 MaxKB 容器镜像:若官方 Docker Hub 镜像(1panel/maxkb)拉取缓慢或失败,可尝试使用华为云 SWR 镜像仓库中的镜像 swr.cn-north-4.myhuaweicloud.com/jeven/maxkb

root@flexusx-7619:~# docker pull swr.cn-north-4.myhuaweicloud.com/jeven/maxkb
Using default tag: latest
latest: Pulling from jeven/maxkb
55ab1b300d4b: Pull complete
516e670f76de: Pull complete
c8202c7054c7: Pull complete
4493463449f8: Pull complete
dcd6bd6b20be: Pull complete
8331472b7254: Pull complete
3dbb847e6011: Pull complete
c5b148653b86: Pull complete
cb92aacfeb80: Pull complete
41c71022e406: Pull complete
98fbd3f077e2: Pull complete
cea15ef59043: Pull complete
9de9cd69634c: Pull complete
9c11f106b56c: Pull complete
3df6554d74e0: Pull complete
3409739a0deb: Pull complete
30a43c62cb9c: Pull complete
5950125e2f93: Pull complete
13c0439ff9e0: Pull complete
4fb78ea51e6f: Pull complete
238828786f6b: Pull complete
Digest: sha256:ac40d39eac0a03516a377ea9c53b26186fd1143c41b985e152f920085a5f85fa
Status: Downloaded newer image for swr.cn-north-4.myhuaweicloud.com/jeven/maxkb:latest
swr.cn-north-4.myhuaweicloud.com/jeven/maxkb:latest

4.3 创建MaxKB容器

可以使用以下命令,快速创建MaxKB容器。

docker run -d --name=maxkb --restart=always -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data -v ~/.python-packages:/opt/maxkb/app/sandbox/python-packages swr.cn-north-4.myhuaweicloud.com/jeven/maxkb:latest

本次实践使用docker compose方式创建容器,建议采用该方式进行创建容器项目。

version: '3.9'
services:
    jeven:
        image: 'swr.cn-north-4.myhuaweicloud.com/jeven/maxkb:latest'
        volumes:
            - '/data/maxkb/.python-packages:/opt/maxkb/app/sandbox/python-packages'
            - '/data/maxkb/.maxkb:/var/lib/postgresql/data'
        ports:
            - '8080:8080'
        restart: always
        container_name: maxkb


执行以下命令,创建MaxKB容器。

docker compose up -d

在这里插入图片描述

4.4 检查容器状态

检查MaxKB容器状态,确保MaxKB容器正常启动。

root@flexusx-7619:/data/maxkb# docker ps
CONTAINER ID   IMAGE                                                 COMMAND                  CREATED          STATUS          PORTS                                    NAMES
f1856fe7c395   swr.cn-north-4.myhuaweicloud.com/jeven/maxkb:latest   "bash -c /usr/bin/ru…"   27 seconds ago   Up 27 seconds   5432/tcp, 0.0.0.0:8080->8080/tcp, [::]:8080->8080/tcp   maxkb

4.5 检查容器日志

检查MaxKB容器日志,可以看到MaxKB服务正常运行。

docker compose logs

在这里插入图片描述

五、访问MaxKB服务

5.1 配置安全组规则

在华为云Flexus X实例绑定的安全组中,我们在入方向上放行8080端口,如下所示:

在这里插入图片描述

在这里插入图片描述

5.2 访问MaxKB首页

浏览器访问http://<云服务器公网IP地址>:8080,将IP替换为云服务器的弹性公网IP地址,访问MaxKB的初始页。如果无法访问到该页面,需要检查操作系统的防火墙是否关闭或放行相关服务端口。

在这里插入图片描述

默认登录的用户名:admin 密码:MaxKB@123..
第一次初始登录后,会提示修改密码,修改密码完成后,确认保存即可。

在这里插入图片描述
在这里插入图片描述

六、MaxKB初始配置工作

6.1 开通DeepSeek-R1-32K商用服务

我们登录华为云官网后,进入ModelArts Studio大模型即服务平台的介绍页。官网地址:https://www.huaweicloud.com/product/modelarts/studio.html。点击“ModelArts Studio控制台”,即可进入maas服务控制台内。

在这里插入图片描述

访问 ModelArts Studio 大模型即服务平台后,ModelArts Studio 控制台,登录后进入 模型推理 页面,选择 在线推理 > 预置服务 > 商用服务,在模型列表中找到 DeepSeek-R1-32K,点击“开通服务”以启用该模型,具体操作如下所示:

ModelArts Studio 大模型即服务平台地址:https://www.huaweicloud.com/product/modelarts/studio.html
在这里插入图片描述

在使用说明中,我们选择OpenAI SDK,,复制模型名称和API地址。

在这里插入图片描述

我们在ModelArts Studio控制台左侧菜单栏中,单击“API Key管理”,开始创建API key。

在这里插入图片描述

填写API key的标签和描述,填写完毕后,确认创建。

在这里插入图片描述

复制我们刚才生成的密钥,如下所示:

在这里插入图片描述

可以在本地建一个临时文本文件,将以上关键信息保存下来。

在这里插入图片描述

6.2 模型设置

在MaxKB首页中,我们选择【系统管理-模型设置】,进入模型设置页面。

在这里插入图片描述

点击“添加模型”,供应商我们选择OpenAI

在这里插入图片描述

AI服务配置,可参考以下:

  • 模型名称:OpenAI Compatible
  • 模型类型:大语言模型
  • 基础模型:DeepSeek-R1
  • API地址:https://api.modelarts-maas.com/v1
  • API Key:将刚才生成的API kEY复制即可
  • 其余配置默认即可,点击保存配置。

在这里插入图片描述

在这里插入图片描述

七、配置知识库

7.1 创建知识库

在MaxKB首页,选择【知识库】模块,点击【创建知识库】,进入创建知识库页面。

在这里插入图片描述

填写知识库基本信息,可参考如下设置:

  • 知识库名称:Linux运维知识库
  • 知识库描述:本知识库系统整理了Linux运维工作中常用的操作命令、系统配置方法及故障排查思路,帮助运维人员快速提升工作效率。内容涵盖用户权限管理、服务部署、日志分析与性能调优等核心主题,是Linux系统管理和维护的实用指南。
  • 向量模型:默认模型;
  • 知识库类型:通用型;
  • 填写完毕后,确认创建即可。

在这里插入图片描述

7.2 上传文件

在刚才创建的知识库中,上传本地相关文件资源。

在这里插入图片描述

📁 上传文档要求说明

类型 支持格式 备注说明
文本文件 Markdown、TXT、PDF、DOCX、HTML、XLS、XLSX、CSV、ZIP 可包含图文内容,打包为 ZIP 格式
表格 XLS、XLSX、CSV、ZIP 支持结构化数据上传
QA 问答对 XLS、XLSX、CSV、ZIP 文件中需按标准格式定义问题与答案
文件数量 每次最多上传 50 个文件 支持单个文件或文件夹上传
单个文件大小限制 每个文件不得超过 100 MB 超过请先拆分处理
文件夹支持 ✅ 支持选择整个文件夹上传 系统会自动识别并上传文件夹下所有符合条件的文件

📦 ZIP 文件说明(两种形式):

ZIP 内容类型 包含内容 使用场景说明
Markdown + 图片 Markdown 文档中引用图片,图片文件与 Markdown 打包在同一 ZIP 中 支持图文混合的知识库内容上传
Excel(XLS/XLSX) + 图片 Excel 文件中引用图片,图片文件与 Excel 打包在同一 ZIP 中 支持表格数据与图像结合的问答对、说明文档等资料上传

建议设置分段规则时,优先选择“智能分段”;如需更精细控制,可切换至“高级分段”进行参数调优。

在这里插入图片描述

文档导入后,等待索引创建完成,如下所示:

在这里插入图片描述

7.3 创建应用

在MaxKB首页,在应用模块点击“创建应用”,输入应用名称,选择简易配置应用,确认创建应用。

在这里插入图片描述

🛠️ 应用配置说明:

  • AI 模型 :可以选择在【系统设置 - 模型管理】中已添加的大语言模型,作为本应用背后的智能推理引擎。
  • 系统角色:你是 LinuxKeeper小助手 ;
  • 提示词(Prompt) :这里默认即可,系统默认提供适用于知识库问答的提示词,用户可根据需求自定义,以引导模型输出更符合预期的内容。
  • 关联知识库:选择关联刚才创建的知识库《Linux运维知识库》;选择一个或多个已上传的知识库,当用户提问时,系统将在所选知识库中进行分段检索,匹配最相关的内容作为回答依据。
  • 其余可自行配置,设置完毕后,点击“保存发布”。

在这里插入图片描述

7.4 对话测试

选择刚才创建的应用,点击演示选项,进入聊天对话界面。

在这里插入图片描述

进行对话测试时,该知识库问答助手能够基于已有知识内容快速理解问题意图,并给出准确、清晰的回答。

在这里插入图片描述

返返回应用概览页面后,可清晰查看各类监控统计数据,信息展示直观、一目了然。

在这里插入图片描述

八、云服务器资源监控

📊 云服务器资源监控

在本次实践中,通过访问华为云 Flexus X 实例的资源监控页面,可以实时查看 CPU、内存、磁盘 I/O 和网络流量等关键性能指标。从监控数据来看,整个实践过程中资源使用率保持在较低水平,系统运行流畅、响应迅速,未出现卡顿或延迟现象,充分体现了云服务在资源调度与性能保障方面的优势。

相较于传统的本地部署方案,华为云 Flexus X 实例不仅提供了可视化的监控能力,还具备弹性伸缩、自动备份、高可用性等特性,极大降低了运维复杂度和硬件投入成本。对于企业用户而言,选择华为云能够实现快速部署、灵活扩展,并保障系统的稳定运行。

🆚 华为云 Flexus X 与本地部署对比简表

对比项 华为云 Flexus X 实例 本地部署
资源监控 提供可视化监控平台,实时掌握资源使用情况 需自行搭建监控工具,维护成本较高
弹性扩展 支持按需扩容,灵活调整资源配置 硬件升级周期长,灵活性差
系统稳定性 高可用架构,故障自动迁移 受限于本地设备,易受硬件故障影响
运维管理难度 运维简单,支持远程集中管理 运维复杂,需专人维护
初始投入成本 按需付费,无需一次性高额投入 需购置服务器等硬件,初期成本高昂

在这里插入图片描述

九、清空资源

在完成所有实践操作后,建议及时清理云服务器上的相关资源,以避免产生不必要的费用和资源浪费。这一步不仅有助于降低成本,也有助于保持云环境的整洁与高效,为后续项目的部署和运行腾出宝贵的资源空间。

为保障数据安全,系统在执行资源删除操作前会要求通过手机验证码进行身份验证,有效防止误删重要数据或非预期操作的发生。

💡 温馨提示:
定期检查并清理不再使用的云资源,是维护良好云上工作环境的重要习惯,也能帮助我们更高效地管理未来的项目与任务。

在这里插入图片描述

十、实践体验与总结


🧪 实践体验与总结

在整个搭建过程中,从环境准备、镜像拉取到知识库配置与应用测试,整个流程高效顺畅,充分体现了华为云 Flexus X 实例在资源调度、网络连接和系统稳定性方面的卓越表现。通过灵活的资源配置与一键式部署能力,极大降低了运维门槛,使得开发者能够将更多精力集中在 AI 应用的开发与调优上。

华为云 Flexus X 实例不仅提供了高性能的计算资源,还具备出色的弹性扩展能力和丰富的监控功能,能够实时掌握服务器运行状态。配合 ModelArts Studio 提供的模型服务(如 DeepSeek-R1-32K),MaxKB 能够快速接入高质量的语言模型,显著提升了问答系统的准确性与响应速度。这种云端一体化的开发体验,在本地部署环境中难以实现。

此外,华为云平台操作界面简洁直观,文档支持详尽,资源管理逻辑清晰,即使是初次使用的用户也能快速上手。特别是在资源清理环节,系统提供的多重确认机制有效防止误删,保障了数据安全。

🌟 总结

本次基于 华为云 Flexus X 实例ModelArts Studio 搭建 MaxKB 知识库问答助手 的实践,不仅验证了华为云在 AI 工程化部署方面的成熟能力,也展示了其在资源调度、模型服务整合与运维管理上的强大优势。无论是企业级项目上线还是个人开发者学习探索,华为云都提供了稳定、高效、低成本的技术支撑平台。

未来,我也将持续关注华为云在人工智能与云计算领域的创新成果,进一步探索更多智能化场景的应用落地。


828 B2B企业节已经开幕,汇聚千余款华为云旗下热门数智产品,更带来满额赠、专属礼包、储值返券等重磅权益玩法,是中小企业和开发者上云的好时机,建议密切关注官方渠道,及时获取最新活动信息,采购最实惠的云产品和最新的大模型服务!

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐