棱光智构(Lighting Vision)项目冲刺博客总结

一、项目概述

  1. 项目名称:棱光智构(Lighting Vision)
  2. 核心定位:基于光度立体视觉技术的工业级机器视觉软件原型,聚焦工业检测领域微观缺陷检测场景
  3. 核心技术栈:C++、Qt、OpenCV、CMake、FFmpeg、TensorRT、PyTorch、CUDA等
  4. 核心目标:实现图像/视频处理核心功能,提供工业级检测解决方案,支持二次开发与定制化需求

二、冲刺规划与基础规范

  1. 冲刺周期:2025年12月12日-12月21日(分阶段推进)
  2. 阶段划分:准备阶段 → 开发阶段1 → 开发阶段2 → 测试阶段 → 部署与复盘阶段
  3. 代码规范:
    • 命名规则:类名采用PascalCase、函数/变量名采用camelCase
    • 格式与注释:统一代码缩进,关键逻辑添加详细注释
    • 提交规范:按[Feat]/[Fix]/[Docs]/[Refactor]分类提交,附清晰描述
  4. 任务划分:明确核心功能模块优先级、负责人及量化验收标准

三、核心功能实现与迭代

(一)图像处理模块

  1. 基础功能:灰度化、二值化、亮度/对比度/饱和度参数调节
  2. 滤波处理:支持多核尺寸均值滤波、高斯滤波(可配置参数)
  3. 边缘检测:优化Canny算法,支持自适应阈值调节
  4. 高级功能:伽马变换、bicubic放大、ESPCN超分辨率、图像拼接融合
  5. 图像特效:素描、油画、水彩效果(支持强度分级调节)
    在这里插入图片描述
    注:详细模块演示见先前博客

(二)视频处理模块

  1. 基础功能:视频读取/播放/保存,兼容MP4/AVI/MOV主流格式
  2. 核心能力:逐帧实时处理、处理效果预览、批量视频处理
  3. 拓展功能:时间轴精准裁剪(视频剪辑)、多视频合并(自动统一分辨率)
    请添加图片描述

(三)UI交互模块

  1. 基础布局:响应式设计,支持窗口自由缩放,工具箱与参数面板分离布局
  2. 核心交互:多图选择与快速切换、拖拽打开文件、处理效果实时预览
  3. 功能增强:批量处理(单批≤20个文件)、处理历史记录(上限100条)、撤销/重做功能
  4. 便捷操作:12组核心操作快捷键、中英文界面切换、自定义参数保存
    请添加图片描述

(四)模型训练与部署模块

  1. 数据集处理:支持VOC/COCO格式互转,自动划分训练/验证/测试集(比例8:1:1)
  2. 模型支持:提供LSRN/RCAN/LFPN三类模型选择,可视化参数配置界面
  3. 训练适配:CUDA自动安装与版本匹配,支持模型断点续训
  4. 推理加速:PyTorch模型转ONNX/TensorRT格式,适配C++推理引擎

四、技术实现亮点

  1. 格式兼容:实现QImage与cv::Mat无缝转换,兼顾Qt界面交互与OpenCV算法优势
  2. 性能优化:多线程任务池(配置为CPU核心数×2)、显存复用、模型剪枝压缩
  3. 架构设计:前后端分离架构,算法封装为动态库,符合工业软件标准化要求
  4. 稳定性保障:采用智能指针管理内存、完善异常捕获机制、修复资源泄漏问题

五、测试与优化成果

  1. 功能测试:覆盖28个核心测试用例,整体通过率96.4%(仅超分辨率特定场景待优化)
  2. 性能提升数据:
    • 边缘检测(512×512图像):120ms → 85ms(提升29%)
    • 均值滤波(1024×768图像):220ms → 165ms(提升25%)
    • 1080P视频处理(30秒时长):45秒 → 32秒(提升29%)
  3. 关键Bug修复:解决低对比度图像边缘检测效果差、视频处理内存泄漏、界面缩放布局错乱等问题
  4. 大规模测试:完成千张图片批量处理压力测试,记录资源占用与耗时基准数据

六、团队协作与详细分工(基于博客原文精准梳理)

学号 姓名 核心职责领域 具体工作内容 贡献度
832301317 高炜翔 项目管理+核心算法 项目负责人、核心架构设计;图像预处理;拼接融合算法优化;参与核心视觉算法规划与实现;功能测试与性能优化 8.3%
832301308 郑意捷 超分算法+视频特效 LSRN超分网络前向开发;视频特效(慢动作/倒放)开发;视频帧处理优化 8.3%
832301316 高杰铭 超分算法+图像拼接 RCAN超分网络前向开发与权重转换;超分辨率算法内存优化;图像拼接融合功能开发;算法性能调优 8.3%
832301307 郑柠苧 检测算法+视频处理+测试 LFPN检测网络前向开发与NMS后处理;图像特效(素描)开发与参数调优;图像处理算法优化;软件测试设计与Bug验证 8.3%
832301319 郭益宁 推理引擎+图像特效+文档 C++推理引擎封装;图像特效(油画/水彩)开发;C++推理加速适配;开发者文档编写;模型转换(ONNX/TensorRT) 8.3%
832301321 黄林哿 接口开发+模型训练 Python统一接口层开发;数据集转换与划分;模型选择与参数设置模块开发;前后端接口对齐 8.3%
832301322 黄羿豪 后端接口+部署适配+UI优化 FastAPI路由(/health /infer)实现;CUDA自动安装适配;模型本地训练流程封装;前端交互优化;性能优化与调试 8.3%
832301328 熊刘坤 视频流处理+性能测试 WebSocket/stream帧同步与队列开发;视频特效(快进)开发、视频剪辑与合并;大规模性能测试;多线程优化 8.3%
832302124 杨力豪 核心模块+性能监控 核心模块开发;模型热加载与并发限流中间件;视频处理多线程调度;性能监控模块开发;图像处理算法优化 8.3%
832302204 张筱晗 前端UI开发+功能增强 Qt UI主窗口、菜单栏、工具栏、dock布局开发;批量处理界面、快捷键系统、历史记录UI开发;撤销/重做功能UI实现;测试与Bug修复 8.3%
832302214 林粲然 前端交互+本地化+文档 图片/视频显示窗口开发与拖拽打开功能实现;批量处理逻辑开发;界面交互优化;软件翻译与本地化;文档编写辅助 8.3%
832302222 徐逸涵 文档编写+测试+部署 项目文档编写与维护;用户手册编写;单元测试开发;性能测试报告整理;安装包制作(Windows/Linux) 8.3%

七、问题与解决方案

  1. 算法类问题:边缘检测适应性不足、超分辨率显存溢出。
    • 解决方案:实现自适应阈值算法、模型剪枝+FP16精度优化、补充相位相关配准算法
  2. 功能类问题:视频倒放内存占用过高、批量处理文件类型兼容问题、快捷键冲突
    • 解决方案:分块读取帧处理、添加文件类型检测分类、冲突检测与备选快捷键推荐

八、后续计划

  1. 算法优化:支持8K图片处理,新增2类图像特效
  2. 功能拓展:视频转GIF、水印添加功能
  3. 稳定性强化:修复残留Bug,优化内存占用
Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐