LLMs for Knowledge Graph Construction and Reasoning: Recent Capabilities and Future Opportunities

LLMs for Knowledge Graph Construction and Reasoning: Recent Capabilities and Future Opportunities》系统地评估了大语言模型在知识图谱构建与推理方面的能力，并提出了未来发展的方向。

empti_

504人浏览 · 2025-10-27 01:21:50

empti_ · 2025-10-27 01:21:50 发布

《LLMs for Knowledge Graph Construction and Reasoning: Recent Capabilities and Future Opportunities》系统地评估了大语言模型在知识图谱构建与推理方面的能力，并提出了未来发展的方向。以下是论文的核心内容总结：

研究目标

评估以 GPT-4 为代表的大语言模型在知识图谱构建与推理任务中的表现。
探讨LLMs是否真正具备泛化能力，还是仅依赖预训练中的记忆知识。
提出一种新型的自动化知识图谱构建与推理框架 AutoKG。

评估任务与数据集

KG构建任务：实体与关系抽取、事件抽取
KG推理任务：链接预测、知识问答
数据集：DuIE2.0, SciERC, Re-TACRED, MAVEN, FB15K-237, ATOMIC2020, FreebaseQA, MetaQA

主要发现

1. LLMs 在 KG 任务中的表现

GPT-4 在零样本和少样本设置下表现优于 ChatGPT 和 text-davinci-003。
在推理任务（如问答、链接预测）中表现更佳，甚至接近或超越专门调优的SOTA模型。
在构建任务（如关系抽取）中表现较弱，尚未超越SOTA模型。

2. 领域适应性

在通用领域（如Re-TACRED）表现更好。
在专业领域（如SciERC）表现较差，可能因训练语料偏重通用性。

3. 虚拟知识抽取实验

提出 VINE 数据集，包含虚构的实体与关系，用于测试LLMs的泛化能力。
GPT-4 在虚拟知识抽取任务中准确率达 80%，显著优于 ChatGPT（27%），表明其具备从指令中学习新知识的能力。

未来方向：AutoKG

提出 AutoKG：基于多智能体协作的自动化KG构建与推理框架。
智能体角色包括：
- KG Assistant（咨询者）
- KG User（领域专家）
- Web Searcher（外部知识检索）
优势：
- 减少人工干预
- 结合外部知识源
- 提升专业领域KG构建质量
挑战：
- Token 限制
- 人机交互效率
- LLM 幻觉问题

结论

LLMs（尤其是GPT-4）在KG推理任务中表现优异，具备较强的上下文学习与泛化能力。
在KG构建任务中仍有提升空间，尤其是在专业领域。
AutoKG 展示了多智能体协作在KG构建中的潜力，是未来研究的重要方向。

关键词

Knowledge Graph, Information Extraction, GPT-4, Large Language Model, AutoKG, Virtual Knowledge Extraction, VINE

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

智能体开发者社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

智能体开发者社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla