dify的知识库的父子分段和通用分段的对比
通用模式下,检索相同的问题,回答远没有父子模式的精准,很明显是关键字没有命中部分步骤,二父子 模式将整个信息进行了上下文内容的存储,并且形成了关联,因此推断更为精准和合理。--WHERE name = '标题前自动插入特殊符号生产物料供应商开发与管理操作手册(1).docx'--文档分段-父子分段的子分段表,segment_id是父分段id。父子分段,可以将上下文紧密联系在一起,进行推理重构。--
首先文档及其分段的表查询语句是
SELECT * FROM documents
--WHERE name = '标题前自动插入特殊符号生产物料供应商开发与管理操作手册(1).docx'
ORDER BY created_at desc ;
--文档分段-父子分段和通用分段共用表
SELECT * FROM document_segments where document_id='36844daf-a952-4dd3-ae1b-972fad2ca4e9' ;
--文档分段-父子分段的子分段表,segment_id是父分段id
SELECT * FROM child_chunks where document_id='36844daf-a952-4dd3-ae1b-972fad2ca4e9' and segment_id='3ba4799a-adee-42b9-99d3-a4cba9108dea'
更多表解析
深入解读大模型开发工具Dify--底层数据存储_dify 表结构-CSDN博客

效果界面效果

流程编排测试
1、父子分段流程编排


父子分段,可以将上下文紧密联系在一起,进行推理重构
2、通用分段流程编排

3、总结
通用模式下,检索相同的问题,回答远没有父子模式的精准,很明显是关键字没有命中部分步骤,而父子 模式将整个信息进行了上下文内容的存储,并且形成了关联,其上下文内容更丰富,子分段检索命中,父分段作为上下文参考,因此推断更为精准和合理
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)