棱光智构(Lighting Vision)项目冲刺博客总结
·
棱光智构(Lighting Vision)项目冲刺博客总结
一、项目概述
- 项目名称:棱光智构(Lighting Vision)
- 核心定位:基于光度立体视觉技术的工业级机器视觉软件原型,聚焦工业检测领域微观缺陷检测场景
- 核心技术栈:C++、Qt、OpenCV、CMake、FFmpeg、TensorRT、PyTorch、CUDA等
- 核心目标:实现图像/视频处理核心功能,提供工业级检测解决方案,支持二次开发与定制化需求
二、冲刺规划与基础规范
- 冲刺周期:2025年12月12日-12月21日(分阶段推进)
- 阶段划分:准备阶段 → 开发阶段1 → 开发阶段2 → 测试阶段 → 部署与复盘阶段
- 代码规范:
- 命名规则:类名采用PascalCase、函数/变量名采用camelCase
- 格式与注释:统一代码缩进,关键逻辑添加详细注释
- 提交规范:按[Feat]/[Fix]/[Docs]/[Refactor]分类提交,附清晰描述
- 任务划分:明确核心功能模块优先级、负责人及量化验收标准
三、核心功能实现与迭代
(一)图像处理模块
- 基础功能:灰度化、二值化、亮度/对比度/饱和度参数调节
- 滤波处理:支持多核尺寸均值滤波、高斯滤波(可配置参数)
- 边缘检测:优化Canny算法,支持自适应阈值调节
- 高级功能:伽马变换、bicubic放大、ESPCN超分辨率、图像拼接融合
- 图像特效:素描、油画、水彩效果(支持强度分级调节)

注:详细模块演示见先前博客
(二)视频处理模块
- 基础功能:视频读取/播放/保存,兼容MP4/AVI/MOV主流格式
- 核心能力:逐帧实时处理、处理效果预览、批量视频处理
- 拓展功能:时间轴精准裁剪(视频剪辑)、多视频合并(自动统一分辨率)

(三)UI交互模块
- 基础布局:响应式设计,支持窗口自由缩放,工具箱与参数面板分离布局
- 核心交互:多图选择与快速切换、拖拽打开文件、处理效果实时预览
- 功能增强:批量处理(单批≤20个文件)、处理历史记录(上限100条)、撤销/重做功能
- 便捷操作:12组核心操作快捷键、中英文界面切换、自定义参数保存

(四)模型训练与部署模块
- 数据集处理:支持VOC/COCO格式互转,自动划分训练/验证/测试集(比例8:1:1)
- 模型支持:提供LSRN/RCAN/LFPN三类模型选择,可视化参数配置界面
- 训练适配:CUDA自动安装与版本匹配,支持模型断点续训
- 推理加速:PyTorch模型转ONNX/TensorRT格式,适配C++推理引擎
四、技术实现亮点
- 格式兼容:实现QImage与cv::Mat无缝转换,兼顾Qt界面交互与OpenCV算法优势
- 性能优化:多线程任务池(配置为CPU核心数×2)、显存复用、模型剪枝压缩
- 架构设计:前后端分离架构,算法封装为动态库,符合工业软件标准化要求
- 稳定性保障:采用智能指针管理内存、完善异常捕获机制、修复资源泄漏问题
五、测试与优化成果
- 功能测试:覆盖28个核心测试用例,整体通过率96.4%(仅超分辨率特定场景待优化)
- 性能提升数据:
- 边缘检测(512×512图像):120ms → 85ms(提升29%)
- 均值滤波(1024×768图像):220ms → 165ms(提升25%)
- 1080P视频处理(30秒时长):45秒 → 32秒(提升29%)
- 关键Bug修复:解决低对比度图像边缘检测效果差、视频处理内存泄漏、界面缩放布局错乱等问题
- 大规模测试:完成千张图片批量处理压力测试,记录资源占用与耗时基准数据
六、团队协作与详细分工(基于博客原文精准梳理)
| 学号 | 姓名 | 核心职责领域 | 具体工作内容 | 贡献度 |
|---|---|---|---|---|
| 832301317 | 高炜翔 | 项目管理+核心算法 | 项目负责人、核心架构设计;图像预处理;拼接融合算法优化;参与核心视觉算法规划与实现;功能测试与性能优化 | 8.3% |
| 832301308 | 郑意捷 | 超分算法+视频特效 | LSRN超分网络前向开发;视频特效(慢动作/倒放)开发;视频帧处理优化 | 8.3% |
| 832301316 | 高杰铭 | 超分算法+图像拼接 | RCAN超分网络前向开发与权重转换;超分辨率算法内存优化;图像拼接融合功能开发;算法性能调优 | 8.3% |
| 832301307 | 郑柠苧 | 检测算法+视频处理+测试 | LFPN检测网络前向开发与NMS后处理;图像特效(素描)开发与参数调优;图像处理算法优化;软件测试设计与Bug验证 | 8.3% |
| 832301319 | 郭益宁 | 推理引擎+图像特效+文档 | C++推理引擎封装;图像特效(油画/水彩)开发;C++推理加速适配;开发者文档编写;模型转换(ONNX/TensorRT) | 8.3% |
| 832301321 | 黄林哿 | 接口开发+模型训练 | Python统一接口层开发;数据集转换与划分;模型选择与参数设置模块开发;前后端接口对齐 | 8.3% |
| 832301322 | 黄羿豪 | 后端接口+部署适配+UI优化 | FastAPI路由(/health /infer)实现;CUDA自动安装适配;模型本地训练流程封装;前端交互优化;性能优化与调试 | 8.3% |
| 832301328 | 熊刘坤 | 视频流处理+性能测试 | WebSocket/stream帧同步与队列开发;视频特效(快进)开发、视频剪辑与合并;大规模性能测试;多线程优化 | 8.3% |
| 832302124 | 杨力豪 | 核心模块+性能监控 | 核心模块开发;模型热加载与并发限流中间件;视频处理多线程调度;性能监控模块开发;图像处理算法优化 | 8.3% |
| 832302204 | 张筱晗 | 前端UI开发+功能增强 | Qt UI主窗口、菜单栏、工具栏、dock布局开发;批量处理界面、快捷键系统、历史记录UI开发;撤销/重做功能UI实现;测试与Bug修复 | 8.3% |
| 832302214 | 林粲然 | 前端交互+本地化+文档 | 图片/视频显示窗口开发与拖拽打开功能实现;批量处理逻辑开发;界面交互优化;软件翻译与本地化;文档编写辅助 | 8.3% |
| 832302222 | 徐逸涵 | 文档编写+测试+部署 | 项目文档编写与维护;用户手册编写;单元测试开发;性能测试报告整理;安装包制作(Windows/Linux) | 8.3% |
七、问题与解决方案
- 算法类问题:边缘检测适应性不足、超分辨率显存溢出。
- 解决方案:实现自适应阈值算法、模型剪枝+FP16精度优化、补充相位相关配准算法
- 功能类问题:视频倒放内存占用过高、批量处理文件类型兼容问题、快捷键冲突
- 解决方案:分块读取帧处理、添加文件类型检测分类、冲突检测与备选快捷键推荐
八、后续计划
- 算法优化:支持8K图片处理,新增2类图像特效
- 功能拓展:视频转GIF、水印添加功能
- 稳定性强化:修复残留Bug,优化内存占用
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)