提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

在差旅报销流程中,员工需手动填写发票信息,财务人员再逐一核对、录入系统,整个过程耗时耗力,且容易出现人为错误。由于发票中的信息具有高度的通用性,通过结合AI和OCR等技术,可以有效地自动识别并提取出关键数据,并一键写入飞书表格,达到以下降本增效的目的:

1.降本增效

假设1000人的企业,每月每个员工报销发票10张,处理填报发票平均需要 30 分钟,按平均时薪 50 元计算,每月人力成本约为 30 ×1000×50÷60 ≈ 25000元;采购外部发票OCR识别服务商,预计每识别1张发票1块钱,采购成本 1000101=10000元。引入AI智能体能节省每月3.5万。

2.合规降风险

发票的真实性影响财务报表、申报合法性,因此必须精准无误。据统计,差旅发票涉及票种多、场景杂、发票格式多样等,人工录入发票信息的错误率通常在 1% - 5% 左右,而 OCR 发票识别技术的错误率可以控制在 0.1% 以内 ,大大提高了数据的准确性,为财务工作的顺利开展提供了可靠的数据基础。


一、差旅发票提报助手的整体概览

1、coze商店搜索关键词:差旅发票提报机器人-批量

在这里插入图片描述

2、工作流程:

在这里插入图片描述

3、对话示例:
在这里插入图片描述

4、结果查看:

在这里插入图片描述

二、搭建步骤

1.搭建工作流思路

  • 步骤1:用户输入需要提取的发票PDF文件,可以一张也可以多张;由于每个人的多维飞书表格不同,因此也需要用户输入自己的飞书表格地址,用户数据隔离;
  • 步骤2:循环每个发票PDF文件
  • 步骤3:在循环体中,先把PDF文件转换成文本,再用大模型识别出所需的信息,引入Python将信息转换成数组格式输出,最后写入到飞书表格中;
  • 步骤4:最后输出执行结果,并告知用户前往查看。

2.开始

在这里插入图片描述
开始节点,需要:
(1)支持用户上传PDF文件,因此input设置成变量类型:Array->File->Default,这样就可以在COZE上传本地文件了;
在这里插入图片描述
(2)支持用户输入飞书表格文档地址,因此增加一个输入变量feishu_url,为string类型
在这里插入图片描述

3.循环体

为了支持用户一次性输入多个PDF文件,且每个文件都能顺利执行完成,引入循环体,

在这里插入图片描述

  • 步骤一:添加“链接读取”插件,用于识别PDF文件的信息并转化成文本,

在这里插入图片描述

  • 步骤二:添加大模型节点,将文本格式识别出关键信息,并将其格式化输出:

输入信息设置:
在这里插入图片描述
输出信息的格式化设置:
在这里插入图片描述

另外:为了降低大模型幻觉,提升识别准确性,写入系统提示词、及适当举例,训练大模型的识别能力,提示词可以设置一下情况:
在这里插入图片描述

  • 步骤三:代码
    插入代码插件,用于将大模型的输出转化飞书多维表格支持的输入格式,

在这里插入图片描述
在【代码】模块点击“在IDE中编辑,选择”Python“语言后输入Python代码块,将所有要输出的字段转换成数组格式,
在这里插入图片描述
输入完成,后点击”测试代码“进行试运行,运行成功后点击”同步输出“即可完成输出数据的配置。
在这里插入图片描述

最后确认下输出的字段格式,保证正确:
在这里插入图片描述

  • 步骤四:写入飞书表格
    增加”飞书多维表格“插件,输入飞书表格地址、要写入的内容(即代码输出部分),此处注意:
    ——飞书表格中的列名称要与大模型输入的字段名称一致,否则会写入失败;
    ——飞书表格需要授权,点击进行账号授权;
    在这里插入图片描述

4.结束

最后,完善一下结束节点,输出结果即可。
在这里插入图片描述


三、效果评估

用定量目标评估agent的效果及持续调优的方向,可以分三点:

  • 发票字段上传成功率:与coze平台、网路稳定性有很大影响,单个上传没有问题,批量上传会导致部分上传失败的情况;
  • 发票识别率: 与使用的识别插件有关,可以不断调试,获取到识别率高的插件;
  • 发票识别准确率:”发票号码“、”开票日期“识别较准确,基本达95%左右;”销方名称“准确率可达90%以上;”价税合计“基本正确,个别会未识别,准确率在85%左右,”每行项目明细“中的提取识别还有问题,50%左右;
Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐