Coze工作流概述

Coze工作流是一系列可执行指令的集合,用于实现业务逻辑或完成特定任务。它为应用/智能体的数据流动和任务处理提供了一个结构化框架。工作流的核心在于将大模型的强大能力与特定的业务逻辑相结合,通过系统化、流程化的方法来实现高效、可扩展的 AI 应用开发。 Coze提供了一个可视化画布,你可以通过拖拽节点迅速搭建工作流。同时,支持在画布实时调试工作流。在工作流画布中,你可以清晰地看到数据的流转过程和任务的执行顺序。

这次我们讲解的是一个发票助手工作流教程,用户可上传多张发票,工作流会对其进行核心要素识别,然后写入excel并下载。

发票助手工作流核心解决痛点

在这里插入图片描述

纸质/电子发票混杂管理

  • 自动统一处理PDF、PNG、JPEG等多格式发票
  • 解决手动录入易出错问题(OCR识别准确率>98%)

提升人工识别效率

  • 将发票图片/PDF中的文字转为结构化数据
  • 关键字段提取(金额、税号、日期等)效率提升10倍

通过将OCR、大模型、自动化技术结合,该工作流实现了从发票采集→识别→处理→归档的全链路数字化,主要解决财务部门人力成本问题,同时减少人工识别的错误率。

工作流整体流程

在这里插入图片描述

开始搭建

完整工作流展示:

在这里插入图片描述

开始节点

开始节点主要用来输入一个文件变量:

  • 支持多文件:由于实际场景中,发票不止一张,这里要使用Array[File]类型的变量来定义输入的格式。

在这里插入图片描述

  • File类型选择默认的,这样既可以支持Image,也能支持PDF。

在这里插入图片描述

  • 开始节点会将上传的发票文件转换成对应的链接,供下一个节点使用。

OCR节点

OCR节点使用了Coze官方的OCR插件,主要用来:

  • 接收开始节点的发票文件链接,提交给插件识别。
  • 识别每个链接对应文件的文字信息,这里会识别出图片上所有的文字。
  • 注意:这里要配置成批处理,这样可以执行多次任务。

在这里插入图片描述

识别出的结果示例:

在这里插入图片描述

注意,这里没有直接采用大模型来识别图片的文字,而是OCR插件识别的文字会更加精准,但是OCR会识别出所有的文字,有很多其实是无用的,所以需要后面的大模型节点来对这些文字进行汇总和提取。

大模型节点

由于要多次调用大模型来识别,所以这里将大模型节点配置在了批处理体中。

批处理节点功能

工作流节点默认单次运行,对于输入信息只做一次处理。工作流节点批处理模式通常用于批量执行一系列任务,支持同时处理多个输入,可显著提高海量数据的运行效率。例如子工作流的功能是在文生图,单次执行工作流节点只能生成一张图片,批处理模式下可以批量生成多张图片。 批处理模式下,还可以设置以下参数:

  • 批处理次数上限:批处理运行的次数上限,默认为 100 次。
  • 并行运行数量:批处理的并发限制,即同时处理的任务数量,设置为 1 表示串行执行所有任务。

大模型解析,提取OCR识别的内容

在我们这个工作流中,大模型批处理节点主要用来:

  • 接收OCR节点的输出{output}并导入到批处理主体中。
  • 设置主体为大模型节点,把{output}列表的单个项抽出来{line_texts}。
    在这里插入图片描述

大模型提示词,指定输出格式

设置大模型提示词,让其根据输入,输出指定格式:

在这里插入图片描述

注意,单个大模型输出的格式为JSON,如下格式:

{
  "购买方名称": "[具体名称]",
"购买方纳税人识别号": "[具体识别号]",
"销售方名称": "[具体名称]",
"销售方纳税人识别号": "[具体识别号]",
"税率": "[具体税率]",
"税额": "[具体税额]",
"价税合计(大写)": "[具体大写金额]",
"价税合计(小写)": "[具体小写金额]",
"发票代码": "[具体代码]",
"开票日期": "[具体日期]"
}

如果想要抽取其他字段,增加或者减少,可以直接修改这部分输出示例。大模型批处理输出结果:

在这里插入图片描述

Excel处理节点

Excel处理节点调用的Coze的第三方插件,主要功能:

  • 接收大模型批处理的输出。
  • 设置格式化要求的输入{data}和{title},将数据转化成Excel文件,返回可下载的链接。

Excel节点要求的JSON的格式:

在这里插入图片描述

Excel节点的输入和输出:

在这里插入图片描述

结束节点

最后把输出的Excel文件url地址打开到浏览器或者下载下来就可以直接查看了:
在这里插入图片描述

在这里插入图片描述

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

大模型全套学习资料领取

这里我整理了一份AI大模型入门到进阶全套学习包,包含学习路线+实战案例+视频+书籍PDF+面试题+DeepSeek部署包和技巧,需要的小伙伴文在下方免费领取哦,真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段
在这里插入图片描述
在这里插入图片描述

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,皆可用。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

三、视频和书籍PDF合集

从入门到进阶这里都有,跟着老师学习事半功倍。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

四、LLM面试题

在这里插入图片描述
在这里插入图片描述

五、AI产品经理面试题

在这里插入图片描述

六、deepseek部署包+技巧大全

在这里插入图片描述

😝朋友们如果有需要的话,可以V扫描下方二维码联系领取~
在这里插入图片描述

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐