EMNLP 2024|用于代码审查的自主AgentCodeAgent: Autonomous Communicative Agents for Code Review
② 一致性与格式检测:在提交信息与代码更改一致性检测以及格式一致性任务中,CodeAgent也表现优异,超过了其他现有工具,尤其在格式一致性检测中,CodeAgent的召回率为89.34%。② 代码审查任务:CodeAgent在四个主要任务上进行测试:检测代码更改与提交信息之间的一致性、发现漏洞引入、验证代码风格一致性和提供代码修改建议。③ 代码修改建议:在代码修改任务上,CodeAgent通过提
🎉 背景 随着自动化技术的不断发展,代码审查在确保软件质量和可靠性方面发挥着重要作用。然而,当前的自动化审查方法主要依赖于单一的输入输出生成模型,这些模型难以捕捉到真实代码审查中交互性和协作性的特点。
本文提出了一个新颖的多代理大语言模型系统——CodeAgent,旨在通过模拟协作团队的方式,提升代码审查的自动化水平。
✨ 方法 为了验证CodeAgent在自动化代码审查中的有效性,作者团队设计了以下方法:
① 多代理系统设计:CodeAgent包括多个扮演不同角色的代理,如代码提交者、审查者、决策者(例如CEO、CTO)和监督代理(QA-Checker)。这些代理通过协作完成代码审查过程中的各项任务。
② 代码审查任务:CodeAgent在四个主要任务上进行测试:检测代码更改与提交信息之间的一致性、发现漏洞引入、验证代码风格一致性和提供代码修改建议。
③ QA-Checker的作用:引入一个名为QA-Checker的监督代理,确保整个审查过程中的对话保持聚焦,避免话题偏离。
🏆 实验 作者团队对CodeAgent进行了广泛的实验评估,并与现有的自动化代码审查工具(如GPT-4、CodeBERT等)进行了对比。实验结果包括:
① 漏洞检测:CodeAgent在漏洞检测任务中,显著优于GPT-4和CodeBERT,检测到的漏洞命中率高达92.96%。
② 一致性与格式检测:在提交信息与代码更改一致性检测以及格式一致性任务中,CodeAgent也表现优异,超过了其他现有工具,尤其在格式一致性检测中,CodeAgent的召回率为89.34%。
③ 代码修改建议:在代码修改任务上,CodeAgent通过提高代码编辑进展表现出明显的优势,平均提高了约30%的编辑进展,优于现有的最先进模型。
💡 链接直达 ACL anthology: 2024.emnlp-main.632.pdf Github: Daniel2Coding/codeagent #emnlp2024 #大模型

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐

所有评论(0)