AAAI 2026 为什么开源 LLM 搞不定数据分析?浙江大学揭秘核心原因
论文标题:作者团队:浙江大学发布时间:2025年11月13日大语言模型(LLMs)在自动化数据分析任务中具有巨大潜力,但现有开源模型在面向高强度推理场景时仍存在明显局限。为此,本工作系统研究了提升开源 LLM 数据分析能力的策略。首先构建了一个涵盖多样且贴近真实场景的种子数据集,从数据理解、代码生成和策略规划三个核心维度对模型表现进行评测。
·
AAAI 2026 为什么开源 LLM 搞不定数据分析?浙江大学揭秘核心原因


论文标题:Why Do Open-Source LLMs Struggle with Data Analysis? A Systematic Empirical Study
作者团队:浙江大学
发布时间:2025年11月13日
大语言模型(LLMs)在自动化数据分析任务中具有巨大潜力,但现有开源模型在面向高强度推理场景时仍存在明显局限。为此,本工作系统研究了提升开源 LLM 数据分析能力的策略。
首先构建了一个涵盖多样且贴近真实场景的种子数据集,从数据理解、代码生成和策略规划三个核心维度对模型表现进行评测。
💕研究结果表明
(1) 策略规划能力是影响整体性能的关键因素;
(2) 交互设计与任务复杂度会影响模型的推理表现;
(3) 数据质量相较于数据多样性更能决定模型的最终效果。
基于上述洞察,我们提出了一套数据合成方法,实验证明该方法能够提升开源 LLM 在数据分析任务中的推理与决策能力。
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)