Docker安装es、kibana并配置中文分词器

本文介绍了使用Docker部署Elasticsearch和Kibana 8.17.10的完整流程，包括：1）创建专用网络；2）拉取并运行ES容器；3）安装Kibana并连接ES；4）重点讲解如何安装IK中文分词器插件，详细说明ik_smart和ik_max_word两种分词模式的差异；5）提供优化IK分词器的方法，通过修改配置文件解决网络新词识别问题。部署完成后可通过9200和5601端口访问服务

回忆告诉晚风

302人浏览 · 2025-10-16 03:04:16

回忆告诉晚风 · 2025-10-16 03:04:16 发布

一、创建网络

创建虚拟网络，运行容器需要加入这个网络

docker network create es-net

二、拉取 es安装 ES

docker pull elasticsearch:8.17.10

三、运行 Docker 命令

切记版本号要对应❗❗❗

docker run -d --name es -e "ES_JAVA_OPTS=-Xms512m -Xmx512m" -e "discovery.type=single-node" -e "xpack.security.enabled=false" -v es-data:/usr/share/elasticsearch/data -v es-plugins:/usr/share/elasticsearch/plugins --privileged --network es-net -p 9200:9200 -p 9300:9300 elasticsearch:8.17.10

测试，访问 http://ip:9200

四、安装Kibana

docker pulll kibana:8.17.10

五、运行 Kibana

切记版本号要对应❗❗❗

docker run -d  --name kibana  -e ELASTICSEARCH_HOSTS=http://es:9200  --network=es-net  -p 5601:5601   kibana:8.17.10

测试，http://ip:5601

到这里就可以正常使用了

扩展

下面这个图可以清晰的看到，默认的分词器对于中文并不是很好：

六、引入 IK 分词器

当需要处理中文分词时，一般都会使用 IK分词器。

选择和自己版本对应的 ik 分词器

进入挂载目录将下载好的 zip 文件解压后放到挂在目录下，（我用的是 docker desktop）

docker cp D:\browserDownload\analysis-ik es:/usr/share/elasticsearch/plugins/

IK 分词器有两种分词模式

ik-smark 模式

ik-smark 模式下 IK 分词器会进行最少拆分，保证整体性

POST _analyze
{
  "analyzer": "ik_smart",
  "text": "Elasticsearch 是一个搜索引擎工具。"

分词结果

ik-max-word 模式

ik-max-word模式会将文本以最细粒度进行穷尽切分，分成尽可能多的词语。

POST _analyze
{
  "analyzer": "ik_max_word",
  "text": "Elasticsearch 是一个搜索引擎工具。"
}

分词结果：

优化 IK 分词

其实 IK 分词器到这里还有一点点的小问题，就是目前的 IK 分词器无法正确的划分网络名词，所以这个时候就需要我们手动去设置，在 IK 分词器目录中的config目录中的IkAnalyzer.cfg.xml中

ext.dic 内容如下：

stopwords.dic内容如下：

保存退出，重启 es

验证：

POST _analyze
{
  "analyzer": "ik_smart",
  "text": "小孩哥觉得我city不city呀"
}

结果：

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大