该论文提出了一个基于大语言模型的统一智能体框架,用于自动构建城市知识图谱。


研究背景与问题

  • 城市知识图谱 是智慧城市中的关键基础设施,用于整合多源城市数据并支持各类城市应用(如交通管理、污染监测等)。
  • 传统UrbanKG构建方法依赖人工规则设计,成本高、扩展性差
  • 现有LLM在UrbanKG构建中存在两大挑战:
    1. 异构关系理解不足(如空间、时间、功能关系);
    2. 地理空间计算与推理能力弱(如距离计算、空间关系判断)。

提出的方法:UrbanKGent框架

UrbanKGent是一个无需重新训练大模型的LLM智能体框架,包含三个核心模块:

1. 知识化指令生成

  • 异构感知指令:针对RTE任务,设计多视角(空间、时间、功能)的指令模板,引导模型理解异构关系。
  • 地理空间注入指令:针对KGC任务,将实体经纬度等地理信息融入指令,增强空间关系推理。

2. 工具增强的迭代轨迹优化

  • 轨迹生成:使用CoT提示GPT-4生成推理轨迹。
  • 工具调用:构建8种地理空间工具(如距离计算、空间关系判断),供LLM调用以增强推理。
  • 自优化机制:通过“验证-更新”循环迭代优化轨迹,提升轨迹质量与可靠性。

3. 混合指令微调

  • 使用优化后的轨迹对开源LLaMA-2/3模型进行指令微调,得到不同规模的UrbanKGent模型(7B/8B/13B),实现低成本、高效的UrbanKG构建。

实验与结果

  • 数据集:纽约市和芝加哥的地理与文本数据。
  • 任务:关系三元组抽取 + 知识图谱补全。
  • 评估方式:人工评估 + GPT-4自评估。
  • 主要结论
    • UrbanKGent在两项任务上显著优于31个基线模型,包括GPT-4。
    • UrbanKGent-13B在NYC和CHI数据集上比GPT-4提升10%~17%,成本降低约20倍
    • 使用仅1/5的数据,构建的UrbanKG关系类型比现有基准丰富数百倍

创新点

  1. 提出首个面向UrbanKG构建的LLM智能体框架
  2. 设计了异构感知与地理空间增强的指令生成方法
  3. 引入工具调用与迭代自优化机制,显著提升地理空间推理能力。
  4. 开源了UrbanKGent模型家族,提供低成本、高效的UrbanKG构建服务。

应用价值

  • 支持自动、低成本、大规模的城市知识图谱构建。
  • 可应用于交通预测、城市规划、环境监测等智慧城市场景。
  • 已开源模型与代码,促进后续研究与实际部署。

总结

UrbanKGent通过结合指令工程、工具增强与模型微调,有效解决了LLM在城市知识图谱构建中的两大挑战,实现了高效、自动、可扩展的UrbanKG构建,为智慧城市研究提供了强有力的工具支持。

如果需要我进一步提炼为PPT、图示或中文简报,也可以继续告诉我。

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐