30,000+高质量样本的P2PInstruct数据集
P2P是基于大语言模型(LLM)的多智能体框架,旨在实现从学术论文到HTML格式学术海报的自动化生成。其核心创新在于通过三个专业化智能体(视觉元素处理、内容生成、海报组装)的分工协作,结合检查器模块的迭代优化机制,生成符合学术规范的高质量海报。项目构建了包含30,000+高质量样本的P2PInstruct数据集,并发布了包含121对论文-海报组合的P2PEval基准测试,通过双评估体系(通用+细粒
一、项目概述与核心目标
P2P是基于大语言模型(LLM)的多智能体框架,旨在实现从学术论文到HTML格式学术海报的自动化生成。其核心创新在于通过三个专业化智能体(视觉元素处理、内容生成、海报组装)的分工协作,结合检查器模块的迭代优化机制,生成符合学术规范的高质量海报。项目构建了包含30,000+高质量样本的P2PInstruct数据集,并发布了包含121对论文-海报组合的P2PEval基准测试,通过双评估体系(通用+细粒度)实现生成质量的量化分析。
二、多智能体框架设计
1. 视觉元素处理智能体
- 职责:从论文中提取图表、公式、示意图等非文本元素,进行分辨率优化、语义标注和布局适配。采用深度学习模块解决复杂场景下的元素识别问题(如叠层图分离)。


- 检查器模块:
- 图像质量验证:通过预处理模块进行颜色校正、形态学处理,尺寸测量模块确保元素符合海报分辨率要求(≥300dpi)
- 语义一致性检测:利用OCR字符识别与符号识别模块,验证图注与正文描述的匹配度
2. 内容生成智能体
- 职责:解析论文结构,生成标题、摘要、方法论等核心内容的精简版,保持技术术语准确性与逻辑连贯性。支持多语言生成与学术风格适配。
- 检查器模块:
- 语法审查:通过语法树分析与依存解析,检测句式复杂度和术语一致性(如避免口语化表达)
- 信息完整性验证:构建研究要素图谱(创新点/实验设计/结论),确保关键信息覆盖率达95%以上
3. 海报组装智能体
- 职责:将处理后的视觉元素与生成内容整合为响应式HTML布局,动态适配不同显示设备。采用栅格系统实现元素对齐与留白控制。
- 检查器模块:
- 视觉平衡检测:通过图像熵计算评估元素分布均衡性,避免局部信息过载

- 交互性验证:测试超链接功能、折叠面板的响应逻辑,确保移动端触控兼容性
- 视觉平衡检测:通过图像熵计算评估元素分布均衡性,避免局部信息过载
三、P2PInstruct数据集构建
1. 数据采集与标注
- 来源:涵盖计算机科学、生物医学等6大学科的顶级会议论文(如CVPR、Nature子刊),通过PDF解析工具提取结构化数据

- 标注标准:
- 视觉元素标注:标注类型(Figure/Table/Equation)、语义重要性分级(1-5级)
- 内容压缩比控制:摘要字数限制在200-300词,方法论部分保留核心公式与实验参数
2. 质量控制机制
- 多阶段验证:人工核对→模型训练→行为检测→反馈迭代的闭环流程,确保数据一致性
- 标准化处理:定义数据模态元数据(如LaTeX公式规范、SVG矢量图标准)
四、P2PEval基准测试体系
1. 评估维度
| 类别 | 指标示例 | 评估方法 |
|---|---|---|
| 通用质量 | 信息完整性、视觉吸引力、可读性 | 10项检查表+人工评分 |
| 细粒度分析 | 创新点突出性、实验对比清晰度 | MLLM模型量化分析 |
| 技术指标 | HTML兼容性、加载速度、响应式设计 | 自动化测试工具 |
2. 混合评估流程
- 机器评估:使用多模态大模型(MLLM-as-a-Judge)对10项通用标准进行初步评分

- 人工验证:4名领域专家对视觉元素跟踪、研究重点识别等维度进行1-5分制评分
- 综合加权:通过XGBoost模型融合机器与人工评分,权重分配为6:4
五、GitHub代码架构与部署
1. 模块化设计
├── visual_agent # 视觉处理智能体
│ ├── element_extractor.py # PDF元素提取
│ ├── quality_inspector/ # 检查器模块(含深度学习模型)
├── content_agent # 内容生成智能体
│ ├── paper_parser.py # 论文结构解析
│ ├── llm_generator/ # 基于LLM的内容生成
├── assembly_agent # 海报组装智能体
│ ├── layout_engine # HTML布局引擎
│ ├── responsive_checker/ # 响应式设计验证
运行
2. 部署要求
- 硬件:推荐使用NVIDIA A10G及以上GPU(显存≥24GB),用于视觉处理中的深度学习推理
- 依赖管理:通过Docker容器封装LLM服务(如GPT-4 Turbo)与计算机视觉库(OpenCV/PyTorch)
- CI/CD流程:GitHub Actions实现自动化测试与部署,包括:
- 单元测试覆盖率≥85%

- 镜像构建与推送到AWS ECR

- ArgoCD驱动的Kubernetes滚动更新
- 单元测试覆盖率≥85%
六、创新价值与局限
优势:
- 端到端自动化:相比传统设计工具(如LaTeX+AI),生成效率提升3倍(平均耗时8分钟/海报)
- 细粒度控制:通过检查器模块实现72项质量参数的动态优化
局限:
- 复杂公式渲染:对非标准LaTeX符号的支持率仅89%
- 领域适应性:生物医学领域的图表识别准确率(92%)低于计算机领域(97%)
1. PDF
2. PDF
[2016]3. PDF
数字资源整合的实现机制及关键技术——对国外数字资源整合系统的实证研究. 李广建等.
[2007-02-09]4. PDF
[2015-10]5. PDF
6. PDF
7. PDF
互联网金融商业模式及组织架构 第 2 章 互联网金融商业模式及组织架构
8. PDF
9.
北京昆仑万维科技股份有限公司非公开发行股票预案. 北京昆仑万维科技股份有限公司.
[2015-08]10.
[2019-04-01]11.
Purpose to Practice: A Framework for Integrating Purpose into Organizational Practices
[2024-10-13]12.
[2024-10-27]13.
[2018-12-03]14.
[2015-05-18]15.
P2P Foundation: Concentrated Knowledge for All. P2P Foundation.
[2016-08-08]16. PDF
Peer-to-Peer Networks. Jussi Kangasharju.
17. PDF
[2020-06]18. PDF
19. PDF
[2016-01]20. PDF
向不特定合格投资者公开发行股票意向书. 北京流金岁月文化传播股份有限公司.
[2020-07-02]21.
[2011-12-03]22.
[2016-07-26]23. PDF
Scooped, Again. Jonathan Ledlie et al.
24.
[2018-06-25]25.
Rust P2P网络应用实战-1 P2P网络核心概念及Ping程序
[2022-07-15]26.
[2014-05-31]27.
[2024-07-04]28.
P2P技术揭秘:P2P网络技术原理与典型系统开发(附光盘). 管磊等.
[2011-01-01]29.
[2025-02-25]30.
[2018-01-18]31.
[2025-05-29]32.
传统RAG的局限被打破!三个轻量级智能体分工协作,如何让问答系统更精准?
[2025-02-24]33. PDF
共筑智能体 生成新未来 2024百度营销通案. 销售运营服务部IMP&百度营销研究院.
[2024-03]34. PDF
Broadening the Horizon – AI-Driven Digital Design Exploration and Implementation. Donnie Chen.
[2024-06]35.
[2024-09-09]36. PDF
[2023-11-28]37. PDF
Sistemas MultiAgentes y sus Aplicaciones en Automatización Industrial. Jose AGUILAR et al.
[2013]38. PDF
万物云2024年业绩发布会 ONEWO 2024 ANNUAL RESULTS
[2025-03-26]39. PDF
Graph+AI: 大模型浪潮下的图计算. 全国智能计算标准化工作组图计算研究组.
[2024-11]40. PDF
[2024-09]41. PDF
[2015]42. PDF
发展新质生产力 开启数字金融新纪元 大模型驱动的数字员工3.0 建设应用白皮书. 中国工商银行金融科技研究院 华为技术有限公司数字金融军团 北京金融科技产业联盟.
[2024-09]43.
[2023-11-13]44. PDF
[2024-10-29]45. PDF
[2020]46.
[2025-05-30]47.
Multi-Agent System and Evolutionary Algorithm
[2023-08-21]48.
[2025-03-15]49. PDF
[2023]50. PDF
[2009-03]51. PDF
[2003-05-14]52. PDF
Werkzeuggestützte Entwicklung kooperativer Agenten im Dienstkontext. Stefan Fricke.
[2000-04-18]53.
一文读懂|大模型智能体互操作协议:MCP/ACP/A2A/ANP. 深蓝AI 编译.
[2025-05-20]54.
[2024-03-20]55.
ShoelessCai - 蚂蚁集团联手上海财经大学:揭开AI大模型在金融领域的神秘面纱
[2022-06-13]56.
[2025-04-11]57.
AI 梦之队:用 15 个 AI 智能体打造你的专属对冲基金 (附回测功能)
[2022-06-14]58.
谷歌发布“智能体”白皮书:具有显著自主性,无需人类持续干预的情况下能够独立运作. 谷歌.
[2025-03-25]59.
[2014-06-23]60.
[2020-08-10]61. PDF
[2018-03]62. PDF
[2022-06-23]63. PDF
基于物品识别的智能体交互方法、装置、设备及存储介质. 陈阳等.
[2022-11-24]64.
[2025-05-27]65. PDF
[2023-11-30]66. PDF
新疆职业大学智能制造数字化创新实训基地项目招标文件. 新疆职业大学.
67. PDF
智能工程学院实训中心简介汇编. 德阳科贸职业学院 智能工程学院.
[2022-02]68. PDF
智能健康检测系统、智能健康检测镜及智能健康检测方法. 宋臣等.
[2018-03-30]69. PDF
[2024-08]70.
工业机器人应用编程创新平台. 北京智控理工伟业科教设备有限公司.
[2020-01-01]71. PDF
[2023-01]72. PDF
73. PDF
Character navigation in dynamic environments based on optical flow. Axel López et al.
[2019]74.
[2025-03-11]75. PDF
DRC-Coder: Automated DRC Checker Code Generation Using LLM Autonomous Agent. Chen-Chia Chang et al.
[2024-12-18]76. PDF
[2009-05-25]77. PDF
[2022-11-02]78. PDF
[2021-10-20]79. PDF
[2023-05-11]80.
[2024-08-18]81. PDF
Hongmei Gao. “Algorithm design for smart vision sensors..”
[2001]82. PDF
[1999-01-13]83.
[2024-10-28]84.
[2025-05-23]85.
[2024-08-25]86. PDF
[2023-02-26]87.
周兴波,陈昌科,李文涛等.智能型高精密机器视觉检测设备.东莞市盟拓光电科技有限公司,2014.
[2014-03-04]88.
[2024-11-27]89.
AgentVerse: 多智能体环境构建框架. 365774300.
[2023-09-22]90.
Collaboration Helps Camera Overtake LiDAR in 3D Detection. CVPR 2023.
[2023-10-20]91.
AI Content Detector - ContentChecker
[2024-03-15]92.
智能体来了:构建用于具有结构化输出的内容审核的智能 AI Agent ( AI 智能体)
[2024-11-20]93. PDF
大模型智能体驱动的航空文档分析与测试用例生成系统. 黄书剑等.
[2024-01-29]94.
EDA-Aware RTL Generation with Large Language Models
[2025-03-15]95.
GitHub - mrnust/MAS_with_LLMs: Code and Content Generation with Llama 3. mrnust.
[2024-08-19]96. PDF
[2022-02-01]97.
[2024-01-01]98.
[2024-08-06]99.
[2025-04-07]100. PDF
SystemVerilog – Unified Hardware Design, Specification, and Verification Language. IEEE.
[2021-07]101. PDF
人工智能现代方法. 斯图尔特·罗素(Stuart et al.
[2025-05-04]102.
智能体来了:构建用于具有结构化输出的内容审核的智能 AI Agent
[2024-08-06]103.
基于大语言模型(LLM)+检索增强生成(RAG)+指令微调(Fine-Tune)技术,构建智能体的方法. 千千寰宇.
[2024-09-13]104.
验证基础之(Stimulator、monitor、checker)
[2022-04-15]105. PDF
[2004-07]106. PDF
[2023-12-06]107. PDF
[2013-11-05]108.
基于AI智能体的媒体大平台建设及服务拓展. 大众新闻·全媒体探索 / 刘爽 宋耀.
[2025-02-26]109. PDF
110.
一种多指标的可拓展多智能体代码生成评估系统及方法. 南京新一代人工智能研究院有限公司等.
[2024-12-06]111.
一种基于大语言模型智能体的长文本生成方法. 南京理工大学紫金学院.
[2024-06-18]112.
[2024-11-21]113.
[2022-06-14]114.
[2025-04-11]115.
AI 与软件测试的融合:单元测试自动生成的未来. Ki Reply GmbH.
[2025-03-27]116.
[2024-01-17]117.
Meta 开源 LlamaFirewall 防护工具,助力构建安全 AI 智能体. IT之家.
[2025-05-09]118.
专利 电力用电安全检查系统及方法. 国网山东省电力公司荣成市供电公司.
[2022-12-23]119.
[2024-04-21]120. PDF
[2020]121. PDF
Review Paper on Vehicle Diagnosis with Electronic Control Unit. Rucha Pupala et al.
[2018-02-03]122. PDF
[2009-02-25]123. PDF
威海市第二届职业技能大赛 工业机器人系统运维(国赛精选)项目 工作任务书 样题
[2025-04]124. PDF
125. PDF
126.
基于RobotStudio的机器人智能装配工作站仿真设计. 赵伟博等.
[2023-07-29]127. PDF
2D/3D智能视觉传感器让测量、识别和检测变得更智能. 萨驰电气(无锡)有限公司.
128. PDF
[2021-03]129.
Automotive Head-Up Display (HUD) Assembly Line. 烽禾升集团.
[2025-01-07]130.
Vision system inspects components on reels. Dave Wilson等.
[2013-01-25]131. PDF
高速模块贴片机 RX-6R RX-6B. JUKI CORPORATION.
132. PDF
点眼剤に使用される容器包装に関する解説書. 公益社団法人 東京医薬品工業協会 点眼剤研究会.
[2024-03]133.
[2017-08-17]134.
LLM:Agent - 瓦尔登湖小酒馆. OAA Algorithm Notes.
[2025-02-20]135. Word
136.
[2025-04-07]137. PDF
138.
Meta 开源 LlamaFirewall 防护工具,助力构建安全 AI 智能体. IT 之家.
[2025-05-09]139.
中国铁路郑州局集团有限公司洛阳车务段2025年智能防溜装置安全监测系统及设备设施维保项目招标公告. 中国铁路郑州局集团有限公司洛阳车务段.
[2025-01-09]140.
开箱即用的企业大模型应用平台. 慕尼黑工业大学计算建模与仿真主席团等.
[2024-09-19]141.
2018年安徽省职业院校技能大赛高职组“制造单元智能化改造与集成技术”项目竞赛技术规范
[1996-02-01]142.
Smart Camera Inspects Gasoline Filters. Andrew Wilson等.
[2006-02-01]143.
[2022-11-14]144.
[2021-02-16]145.
[2017-04-07]146.
[2025-03-05]147. PDF
行业标准《人工智能医疗器械 质量要求和评价 第 2 部分:数据集通用要求》解析. 王浩等.
148. PDF
北京市人工智能医疗器械生产质量管理规范检查指南(2024版)
149. PDF
首届全国大模型与决策智能大会论文集. 中国指挥与控制学会编.
[2024-11]150. PDF
QScored: A Large Dataset of Code Smells and Quality Metrics. Tushar Sharma et al.
[2021-01]151.
Self-Instruct: Aligning Language Model with Self Generated Instructions
[2023-03-17]152. PDF
[2022-12-08]153.
[2024-03-26]154. PDF
中华人民共和国医药行业标准 人工智能医疗器械 质量要求和评价 第2部分:数据集通用要求. 国家药品监督管理局.
[2023-07-01]155. PDF
[2025-01-23]156. PDF
[2021-09]157. PDF
[2025-05]158. PDF
[2024-01]159.
[2022-10-26]160. PDF
161.
深度解读AI数据集可信治理系列标准之一:质量管理. 中国信息通信研究院.
[2023-10-26]162.
163.
[2019-08-26]164.
创建数据质量规则-大数据管理平台 DataWings-用户指南. 天翼云.
[2024-05-28]165.
[2024-06-13]166.
[2024-03-01]167.
Creating rules for data analysis. Data Analytics Core Group.
[2017-11-15]168.
[2025-01-21]169.
参数量仅为1/700,性能超越GPT-3.5!CMU+清华开源Prompt2Model框架. 卡内基梅隆大学和清华大学.
[2024-01-01]170.
Data Quality Configuration & Design. Collibra University.
[2016-11-16]171.
[2024-06-13]172.
数据标准在模型设计和数据质量中的实践. 志明与数据 / 安阳.
[2022-08-31]173.
Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集. 腾讯云开发者社区等.
[2024-06-04]174. PDF
Tao Sun, Enhao Pan et al. “P2P: Automated Paper-to-Poster Generation and Fine-Grained Benchmark.”
[2025-05-21]175. PDF
176. PDF
[2002-07-06]177. PDF
[2019-12]178.
[2025-05-29]179. PDF
[2019-09]180.
[2012-01-01]181. PDF
基于改进GRA法构建P2P网贷平台风险评价体系. 梁寒冰(副教授)等.
182.
[2001-01-01]183.
基于用户偏好的 P2P 网贷评价模型指标评分系统构建研究. 韩菁菁等.
[2025-02-02]184. PDF
[2025-03-03]185. PDF
DevOps Transformation Design. 钟健鑫.
[2017-04-14]186.
[2016-10-14]187. Word
188. PDF
雲端部署平台核心技術大揭秘. Yuanlin Lin et al.
[2024-12-27]189.
B/S开发框架_软件开发平台_web开发框架_敏捷框架_.net开发平台_快速开发平台
[2024-12-01]190.
[2024-01-01]191. PDF
如何使用 ArgoCD 快速打造生产可用的 GitOps 工作流?. 王炜.
[2023-01-27]192.
WriterSide 文档、接口自动编译并部署到GitPage
[2024-10-21]193.
Deploy a static site from GitHub - Angular - AWS Amplify Gen 1 Documentation. AWS Amplify.
[2024-04-29]194. PDF
参考,ABACの実装例-Amazon Web Services編
195. PDF
AWS AI Day MLEWで切り拓いたHULFTの生成AI導入の道のり. 有馬等.
[2024-10-31]196.
[2024-03-25]197.
[2024-03-25]198. PDF
User Manual. Arnar Daði Steinþórsson et al.
[2022-01-17]199.
[2023-06-23]200. PDF
GitHubによるAIを活用したDevOps. GitHub.
201. PDF
AWS CodeDeploy User Guide. Amazon Web Services, Inc..
[2025]202.
添加 GitHub 仓库管理规范. longfangsong.
[2020-08-15]203.
[2024-01-01]204. PDF
205. PDF
206.
GitHub - Energinet-DataHub/opengeh-python-packages
[2024-01-15]207. PDF
[2023-12]208. PDF
Build analytics applications using Apache Spark with Amazon EMR Serverless. Damon Cortesi et al.
[2022-11-28]209.
[2019-01-01]210. PDF
211.
[2024-07-21]212.
发布jar包到远端github仓库使用(将github仓库当作maven仓库). ukyo--君君小时候.
[2019-11-06]213.
GitHub - umairboota/Rest_Assured. umairboota.
[2023-12-16]
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)