飞桨星河社区月度报告（2025年7月）

这些前沿、多样化的评估基准和训练资源，旨在满足模型开发全流程的数据需求，助力开发者打造能力更强大、输出更稳定的大模型。作为一站式AI学习实训平台，星河社区通过整合开放数据、开源算法、云端GPU算力及开发工具，构建体系化课程、人才培养计划、技术专家团队及全球领航团等赋能体系，持续活跃开发者生态，助力降低大模型创新与应用门槛。该功能通过构建公平的模型评估环境，为开发者提供直观、可参与的模型评估路径，有

百度大脑

329人浏览 · 2025-08-13 20:01:57

百度大脑 · 2025-08-13 20:01:57 发布

月度动态总览

产品功能更新：体验优化与效率提升

模型体验场（Playground）支持视频上传：新增视频文件上传功能，适配ERNIE-4.5-VL-424B-A47B等多模态大模型；
大模型匿名对抗竞技场——LM Arena：系统随机向开发者展示“提问”和两个匿名模型的“回答”，开发者可基于自身偏好选择更符合主观感受的回答。

社区内容更新：丰富资源与实战赋能

项目资源：新增58个实训项目，覆盖大模型训练优化、推理部署、应用开发等核心方向，深度融合文心4.5系列开源模型能力，为开发者提供从理论到实践的完整闭环。
数据集资源：新增100+数据集，覆盖大模型微调、人类偏好对齐、强化学习等多个领域。
边学边练赋能体系：通过阶梯式教学课程（学）、文心开源微调实战营（练）联动，覆盖从理论学习到产业实践的完整链路。

社区生态共建：开源协同与产学研联动

社区活动：第十届语言与智能高峰论坛在乌鲁木齐圆满落幕
热门赛事：LIC·2025语言与智能技术竞赛，聚焦医疗、科研、传媒领域等行业场景，涌现了一批高价值AI解决方案
开源贡献：截至7月，飞桨开源社区contributor总数520人。

产品功能更新

1.1 模型体验场（playground）新增视频上传功能

模型体验场（Playground）现已支持视频文件上传功能，全面适配如ERNIE-4.5-VL-424B-A47B等具备视频理解能力的多模态大模型。开发者可通过该功能直接上传视频并进行交互式推理，直观体验模型在内容识别、时序分析、场景理解等方面的原生能力。

访问地址：

https://aistudio.baidu.com/playground

1.2 大模型匿名对抗竞技场——LM Arena

正式上线“大模型匿名对抗竞技场”功能，系统随机向开发者展示“提问”和两个匿名模型的“回答”，开发者可基于自身偏好选择更符合主观感受的回答。该功能通过构建公平的模型评估环境，为开发者提供直观、可参与的模型评估路径，有助于开发者识别模型在实际应用中的表现差异，进一步提升开发者在模型选型与应用中的体验。

访问地址：

https://aistudio.baidu.com/intro/llmarena

社区内容更新

2.1 项目资源

精选新增实训项目58个，覆盖大模型训练优化、推理部署、应用开发等核心方向，深度融合文心4.5系列开源模型能力，为开发者提供从理论到实践的完整闭环。

访问地址：

https://aistudio.baidu.com/projectoverview

热门活动：投稿项目可解锁核心开发者权益、算力资源、官方项目证书、线下活动门票、千元礼品、京东卡等多种激励。

飞桨&文心技能树成长计划：

https://aistudio.baidu.com/activitydetail/1503019397

PaddleOCR最佳实践场景项目征集：

https://aistudio.baidu.com/activitydetail/1503019405

💡 精选项目

-高效微调实战：

【ERNIEKit x FastDeploy】全量微调粤语翻译模型

项目简介：本项目基于百度飞桨ERNIEKit与FastDeploy，完整演示了如何对ERNIE-4.5模型进行全量微调，以构建一个专业的粤语翻译模型。

项目链接：

https://aistudio.baidu.com/projectdetail/9360719

-轻量化部署：

【ERNIE-4.5】基于文心4.5部署GGbond图片故事生成器

项目简介：这是一个可以通过图片内容自助理解生成故事情节的应用，只需要简单上传一段语音，就可以支持自定义语音伴读

项目链接：

https://aistudio.baidu.com/projectdetail/9375433

-文心+MCP：

【ERNIE-4.5】从零构建FastMCP架构下的Agentic RAG

项目简介：本教程将构建一个基于FastMCP框架的Agentic RAG系统，使用星河大模型的ERNIE-4.5-21B-A3B-Paddle和embedding-v1。

项目链接：

https://aistudio.baidu.com/projectdetail/9340636

-多模态应用：

【ERNIE-4.5-VL-28B】基于文心模型、RAG、多智能体的医疗问诊系统

项目简介：本项目基于本地化部署的ERNIE-4.5-VL-28B-A3B-Paddle多模态大模型，构建了一个集成RAG知识库检索与多Agent协同机制的智能医疗问诊系统。

项目链接：

https://aistudio.baidu.com/projectdetail/9359464

2.2 数据集资源

数据集板块新增100+精品数据集，全面覆盖多语言问答、奖励模型评估、模型安全性、图像编辑、和情感分析等多个关键方向。其中不仅包括由卡内基梅隆大学提出、用于模型“遗忘”研究的数据集TOFU，也涵盖了业界首个大规模指令图像编辑数据集MagicBrush和苹果发布的多语言问答基准mkqa。这些前沿、多样化的评估基准和训练资源，旨在满足模型开发全流程的数据需求，助力开发者打造能力更强大、输出更稳定的大模型。

访问地址：

https://aistudio.baidu.com/datasetoverview

💡精选数据集：

-TOFU：卡内基梅隆大学的研究人员提出了TOFU框架，包含遗忘、数据集、评估等多个模块，以帮助开发者提升大模型的安全性；TOFU数据集用于评估大型语言模型在现实任务中反学习性能的基准。该数据集包含基于200位不同作者自传的问答对，这些作者并不存在，完全由模型虚构生成。该任务的目标是在遗忘集的各个部分中反学习一个经过微调的模型。

访问地址：

https://aistudio.baidu.com/datasetdetail/350844

-MagicBrush：首个大规模、手动注释的指令引导式图像编辑数据集，涵盖单转、多转、带掩码编辑和无掩码编辑等多种场景。MagicBrush包含10K（源图像、指令、目标图像）三元组，足以训练大规模图像编辑模型。

访问地址：

https://aistudio.baidu.com/datasetdetail/351354

-mkqa：包含26种语言的1万个对齐问答对的多语言开放域问答评估集，由苹果于2021年在ACL顶会上发布并持续更新，对于每个查询，都会收集与文章无关的新答案，这些查询和答案会被人工翻译成25种非英语语言。

访问地址：

https://aistudio.baidu.com/datasetdetail/350978

-RM-Bench:来自清华大学、复旦大学和香港科技大学的研究团队，联合发布基准测试RM-BENCH,首次系统性地构建了针对奖励模型的评测基准，直击其“形式大于内容”的评估困境。

访问地址：

https://aistudio.baidu.com/datasetdetail/351416

-go_emotions：包含5.8万条精心整理的Reddit评论，标签涵盖27种情绪类别或“中性”用于情感分析任务。

访问地址：

https://aistudio.baidu.com/datasetdetail/351396

-natural_questions：一个大规模问答数据集，问题源自真实的用户搜索查询，要求问答系统阅读并理解整篇维基百科文章。

访问地址：

https://aistudio.baidu.com/datasetdetail/351380

2.3 边学边练赋能体系

为助力开发者将理论知识高效落地，飞桨星河社区于7月启动了为期三周的《玩转文心开源系列模型：微调实战营》活动。活动围绕文心大模型的开发，将“学”与“练”深度融合，体系化赋能开发者。

📑 学什么：掌握核心理论与官方工具

- 系统学习大模型微调理论，掌握针对文心4.5开源系列模型的标准数据处理规范；
- 熟练使用百度官方文心大模型高效部署套件FastDeploy与开发套件ERNIEKit，掌握从模型部署到训练的全套实操方法。

✍️ 练什么：打通从开发到应用的全链路

- 亲手完成从数据准备到模型微调的完整项目，实现让微调后的文心模型“开口说话”，获得即时反馈、从0到1跑通模型微调流程；
- 挑战微调并发布一个高价值的行业或创意模型至星河社区模型库，完整体验从技术开发到成果共享的真实开发者路径。

学：全新课程体系上线，阶梯式引导快速上手

学习大厅链接：

https://aistudio.baidu.com/learn/center

练：文心开源微调实战营，深度赋能项目开发

活动以“打卡通关”模式展开，设置了四大核心任务，开发者系统学习大模型应用基础、微调数据处理、ERNIEKit实战以及高价值模型微调挑战。

通过理论与实践结合，赋能开发者贯通模型微调全流程。完成指定任务的开发者可获得官方认证结业证书、课程专属算力包，以及价值80-200元不等的精美实物礼品。

社区生态共建

3.1 社区活动

2025开放原子开源生态大会-大模型创新与生态分论坛

7月24日，2025开放原子开源生态大会“开源AI框架：驱动大模型技术创新与生态共建”分论坛在北京国家会议中心二期成功举办，线上吸引超1000人实时观看。作为汇聚顶尖技术专家的深度交流平台，论坛聚焦开源训推框架核心议题，围绕架构设计、性能优化、跨硬件协同及生态建设展开深入探讨。来自百度、中科院、清华大学、启元实验室、北航的专家代表，现场分享了最新技术进展与实战经验。旨在推动开源 AI 框架的技术突破与生态繁荣，助力开发者更高效完成大模型的构建、训练与部署工作。

第十届语言与智能高峰论坛在乌鲁木齐圆满落幕

8月10日，由中国计算机学会（CCF）和中国中文信息学会（CIPS）主办的NLPCC及第十届语言与智能高峰论坛在美丽的新疆乌鲁木齐圆满落幕。

首先，百度杰出架构师胡晓光分享了“飞桨+文心”双开源生态新进展。

随后LIC·2025语言与智能技术竞赛成果汇报及颁奖典礼在高峰论坛成功举行，来自产业一线的深度解析与冠军团队的精彩分享交相辉映。

技术盛会，高光时刻！LIC·2025圆满收官，文心大模型实力铸就产学硕果！

（点击可跳转活动详情～）

AIIA开源开放委员会2025年第二次研讨会顺利召开

7月15日，AIIA开源开放委员会2025年第二次研讨会在北京经开区召开，聚焦人工智能开源发展与生态建设，行业专家及企业代表现场建言献策。

会上，百度飞桨星河社区以 “解锁文心4.5开源能力” 为主题分享核心内容：系统介绍了社区项目开发、模型库与应用中心等功能，并全面展示文心4.5系列模型的生产力潜力。作为一站式AI学习实训平台，星河社区通过整合开放数据、开源算法、云端GPU算力及开发工具，构建体系化课程、人才培养计划、技术专家团队及全球领航团等赋能体系，持续活跃开发者生态，助力降低大模型创新与应用门槛。

Wisemodel开源talk-百度文心大模型专题

7月24日，始智AI wisemodel.cn社区联合百度飞桨&文心产研团队开展文心大模型专题直播，聚焦开源技术创新与demo演示，共吸引超300人次观看。直播重点介绍了百度开源文心大模型ERNIE4.5系列（含10款模型，涵盖混合专家（MoE）与稠密参数模型），并通过Spaces形式展示了对话、联网搜索、RAG知识库等典型场景的应用Demo，助力开发者快速上手。

了解更多活动详情可访问星河社区【活动中心】板块，快来参与吧！

访问地址：

https://aistudio.baidu.com/activityoverview

3.2 热门赛事

LIC·2025语言与智能技术竞赛

LIC·2025由中国计算机学会、中国中文信息学会联合主办，百度公司承办，大赛围绕文心4.5系列开源模型，联合人民日报健康客户端、智源研究院、TVB三个行业引领者，开放高价值真实场景数据集，共同探索大模型的无限可能，推动AI技术在关键领域的深度应用。

智慧医疗：基于人民日报健康客户端权威数据，参赛者构建7万+高质量医疗QA数据集，开发智能导诊、用药咨询等Agent应用。冠军团队来自澳门理工大学，训练出医疗大模型MedERNIE，性能超越多个开源模型。
前沿科研：利用智源OpenSeek数据集，通过思维链（CoT）增强文心模型逻辑推理能力，微调后模型在数学、代码任务中性能显著提升。冠军团队来自北京大学和北京航空航天大学，仅用14%精选数据微调模型，实现23项Math Benchmark提升。
传媒创新：基于TVB粤语影视资源，开发AI短视频生成工具，实现长视频自动化剪辑、粤语配音及竖屏转化。冠军团队为PFCC成员，开发端到端生成带AI解说的短视频，探索“长剧转短剧”新范式。

2025IKCEST第七届“一带一路”国际大数据竞赛暨第十一届百度&西安交大大数据竞赛

本届竞赛在教育部高等学校大学计算机课程教学指导委员会及丝绸之路大学联盟的指导下由联合国教科文组织国际工程科技知识中心（IKCEST）、百度公司及西安交通大学共同主办。竞赛聚焦"一带一路"沿线国家大数据与AI人才培养，通过赛事推动政产学研协同发展。本月举办初赛培训直播，出题人深度解析赛题并分享解题思路，Top选手传授高分技术方案，助力选手快速掌握赛事核心能力。

飞桨开源夏季个人挑战赛

为加速飞桨框架新版本功能迭代，并进一步提升社区在国内开源领域的影响力，飞桨开源夏季个人挑战赛共推出740道开源任务，分为三个赛道，由飞桨顶尖研发工程师全程在线答疑指导。赛事历时3个月，最终由社区开发者完成420+开源任务（含400+PR合入），新增10名开发者留存至PFCC等社区，并完善社区开发机制，加速飞桨新版本迭代，提升国内开源影响力。

2025“直通乌镇”全球互联网大赛开源竞赛-飞桨赛

本次开源竞技挑战赛由“直通乌镇”全球互联网大赛组委会主办，浙江大学软件学院、浙江大学宁波国际科创中心、浙江省图灵互联网研究院、桐乡市科创人才集团承办，并获百度、腾讯、阿里巴巴、openKylin、抖音等企业支持。

百度飞桨已在赛事承办平台“太乙”开源生态服务平台正式发布开源赛题，目前已有43位开源贡献者参与。作为面向全球开发者的深度学习领域编程活动，赛事旨在鼓励开发者参与飞桨深度学习开源项目开发实践，提升代码实践能力，实现与社区共同成长。

MICCAI2025 Challenge: GAVE

GAVE挑战赛由华南理工大学医疗大数据与医学智能实验室联合深圳市眼科医院于MICCAI 2025期间举办，是国际眼科领域赛事。MICCAI为跨医学影像计算与计算机辅助介入的顶级学术会议（CCF-B类），同期将举办第十二届眼科医学影像分析研讨会（OMIA12）。赛事面向国内外开发者，目前已有226人报名，报名即将截止，欢迎感兴趣者参与。

第十九届中国成都国际软件设计与应用大赛行业软件竞技赛——卫星互联网芯片设计与应用赛

第十九届中国成都国际软件设计与应用大赛行业赛，由成都市人民政府等主办，聚焦卫星互联网等领域的微波射频芯片设计与应用创新。全国高校师生、企业团队可组队参赛。目前正在报名期间，欢迎关注。

获取更多赛事详情可访问星河社区【热门比赛】板块，赢取丰厚奖品！

访问地址：

https://aistudio.baidu.com/competition

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大