记一次完整的开发需求踩坑填坑记录

最近做了一个客户的excel导数据的需求，客户就一句话，把提供的excel能导入到表里面，说一下我们的表是系统创建的表，然后表有哪些字段，什么格式都定义好了，最终表的数据是存在elasticsearch。也就是mysql的表定义字段与elasticsearch的mapping是对应的。好了交代背景后。我们开始踩坑填坑。客户一句话，工作量可是巨大，所谓无声胜有声说的就是这个吧。秉着工匠精神，自己要对

ping1234e

189人浏览 · 2025-11-27 16:50:55

ping1234e · 2025-11-27 16:50:55 发布

客户一句话，工作量可是巨大，所谓无声胜有声说的就是这个吧。秉着工匠精神，自己要对自己做的产品负责啊。然后巴拉巴拉写了一个story

前端部分：

step1

step2

定义交互的数据结构

大概需要这些

{file,data:[{sheetName,tableName,fieldMapping:[{seqNo,field},{seqNo,field}]}]}

设计比较简单也比较直观,解释下就是到后端的数据结构,至少需要这些元素:

file:excel文件这个好理解,因为涉及安全,存储空间等问题,所以准备将文件存文件服务(典型的OBS/OSS/S3),这里我选择了OBS.

data:前端一顿操作后的数据,包括sheet页对应哪张表以及哪些字段

后端部分:

1 少不了的参数校验

2 文件扔OBS

3 记录一张任务表

4 给前端返回结果(注意是该操作的结果,不是导数据的结果)

5 开启定时任务处理任务表

针对异步设计,前端增加了每5秒定时查询状态的操作,来返回该次导入数据的结果

最后说一下有哪些坑:

1 大数据量

elasticsearch 数据拷贝(reindex),涉及大数据可能就拷不动了,当时有一个索引大概有一亿多数据了,查询都费劲,也没有什么好办法,最后是将该索引拆分,利用索引别名,建立子索引(个人理解)

顺便说一下 reindex支持查询任务状态,5秒轮询用的就是这个能力.

2 有时候数据很少, 前端5秒轮询体验不好,可能实际1秒不到就完成了,白白等了4秒,加了一个逻辑,定时任务内查询一下数据量,增加一个配置项10000,数据量大于10000的5秒,小于的1秒.其实感觉也不好,时间紧迫(其实是偷懒)..个人感觉可以用websocket,前后端保持一个通信,这样结果就会及时反馈,但是也要设计一下超时,过了超时时间就转5秒轮询.

差不多这样 ,后续看心情要不要详细写前端实现或者后端实现

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大