图片

2025年8月19日,由开放原子开源基金会与百度联合主办的系列开源技术赛事——文心开源创新大赛正式启幕,聚焦“多模态应用”与“AI+硬件”两大前沿方向,依托文心大模型4.5的核心能力,面向全球开发者发出创新集结令,累计吸引900余位来自海内外的开发者踊跃参与,收到170余份高质量作品,覆盖多模态与硬件两大热门赛道,经过激烈角逐,23支优秀团队成功晋级决赛路演。

12月12日,文心开源创新大赛-硬件赛道(ERNIE Hackathon - Hardware Track)圆满落下帷幕,本次赛事联合此芯科技等硬件生态伙伴,依托星河社区平台,汇聚全球开发者,共同上演了一场属于边缘AI的“硬核”技术狂欢。在历时数月的竞技中,来自不同领域的参赛者基于文心4.5系列开源模型,真正打破了软件与硬件的传统边界。从智能终端到嵌入式设备,开发者们在资源受限的边缘侧(Edge AI)大胆创新,将AI能力深度融入无障碍交互、家庭看护、科研检测、教育陪伴、健康监测、农业分析、商业营销等真实场景,涌现出一批极具巧思与实用性的硬件原型与解决方案。

这既是大模型技术从“云端”走向“指尖”的Show Time,也是AI与物理世界深度融合的一次扎实探索。

01

端云协同|文心4.5赋能硬件创新

文心4.5系列开源模型(尤其是ERNIE-4.5-0.3B等端侧小模型)展现了强大的适配能力。选手们通过微调、量化、蒸馏等技术,将大智慧装进“小身体”,实现了从智能家居、医疗健康到工业质检的全面覆盖。

无论是自然语言控制机械臂,还是具备情感的桌面宠物,开发者们正在用代码和电路,重新定义“智能硬件”。

上下滑动查看更多

02

荣耀时刻:获奖作品巡礼

一等奖

HearthScribe: 基于文心大模型的个性化家庭记忆助手

团队/作者:独立开发者李志军

(https://github.com/ZhijunLStudio)

核心硬件平台:Jetson AGX Xavier

项目简介:

在居家养老与机构看护场景中,传统监控往往沦为“只录不看”的被动设备HearthScribe旨在打破这一僵局,它利用Jetson AGX Xavier的边缘算力,打造了一位既懂逻辑又会分析的智能看护Agent。系统不再是冷冰冰的摄像头,而是能主动理解长者行为、生成健康画像并预警风险的“家庭成员”,实现了从被动监控到主动关怀的质变。

技术赋能:

项目构建了极具创新性的Thinking-RAG架构。利用PaddleX进行高效边缘感知,并在本地运行量化版ERNIE-4.5-Thinking (21B) 负责隐私数据的逻辑推理,同时调用云端ERNIE-4.5-Turbo-VL精准捕捉画面细节。该架构结合了LanceDB+SQLite构建的家庭知识图谱,让AI能够像专业护工一样进行“思维链推理”,不仅能看懂发生了什么,更能深度分析潜在的健康隐患。边缘感知推理延迟低于50ms,且将月度运行成本压缩至约26元,真正实现了低成本、高响应的适老化AI落地。系统将21B大模型量化至14GB显存,边缘端FP16推理延迟低于50ms,在有限算力下实现了毫秒级的实时感知与决策。

上下滑动查看更多

二等奖

微视睿鉴:基于文心AI与边缘计算的菌落智能检测系统

团队/作者:深圳尔岳科技团队

核心硬件平台:搭载此芯科技CIX P1芯片的星睿O6开发套件

项目简介:

微生物检测长期面临人工计数耗时、误差大、经验依赖强等痛点。微视睿鉴团队打造了一套软硬件深度融合的全自动智能系统,将繁琐的实验室工作彻底自动化。从样本图像采集到生成专业检测报告,全流程一站式解决,大幅降低了专业门槛。

技术赋能:

核心突破在于边缘侧的“大智慧”。团队创新性地在国产边缘计算平台CIX CD 8180上部署了经LoRA微调的ERNIE-4.5-21B-A3B模型,并结合专业知识库,使设备具备了专家级的菌落形态鉴别与结果解读能力。配合PaddleX优化的检测算法,单皿检测时间从5分钟压缩至5秒,菌落识别准确率高达99.76%。

左右滑动查看更多

三等奖

Red Panda:儿童语言学习陪伴硬件

团队/作者:清华⼤学李亦萱等人

核心硬件平台:搭载此芯科技CIX P1芯片的星睿O6开发套件

项目简介:

这不仅仅是一个玩具,而是一位随孩子共同成长的AI伙伴。针对传统教育硬件“买来吃灰”的难题,Red Panda结合行为心理学,首创了“每日三次饥饿”的游戏化机制。孩子需要通过完成语言学习任务来“喂养”它,这种真实的互动感极大激发了孩子的主动性,让学习变得像照顾宠物一样自然有趣。

技术赋能:

项目基于ERNIE-4.5-0.3B/21B进行了深度风格微调(自构建数据集ERNIE-child-chat),构建了独特的“拟动物”人格——它会撒娇、会委屈,拥有极强的情感粘性。技术上实现了从端侧小模型(快速响应)到云端大模型(复杂逻辑)的无缝切换,配合动作、表情、声音的多模态反馈,打造了沉浸式的陪伴体验。

开源贡献奖

1. ERNIE Desktop:开源可复现的AI工作站方案

团队/作者:美国独立开发者Jerry Howell

(https://github.com/openconstruct)

核心硬件平台:搭载此芯科技CIX P1芯片的星睿O6开发套件

项目简介:

致力于AI技术的民主化,ERNIE Desktop将低成本的单板计算机(SBC)变身为强大的AI工作站。它为学生和开发者提供了一个免费、离线且保护隐私的本地AI助手,证明了即便没有昂贵的GPU服务器,每个人也能拥有属于自己的高性能AI。

技术赋能:

通过极致的工程优化,项目在资源受限的ARM架构上成功运行ERNIE-4.5-21B-A3B (2-bit量化) 模型。实现了开箱即用、秒级启动以及15+TPS的流畅推理速度,充分挖掘了国产开源模型在低功耗硬件上的巨大潜力。

左右滑动查看更多

2. EmoBird:基于共情理论的具身智能陪伴宠物鸟

团队/作者: 清华大学桂子轩等人

核心硬件平台:搭载此芯科技CIX P1芯片的星睿O6开发套件

项目简介:

打破传统AI硬件“工具人”的刻板印象,EmoBird是一款基于共情理论设计的“桌宠+穿戴”双形态机器人。它模拟了宠物鸟的物理形态与细腻动作,能够敏锐捕捉用户的情绪变化,成为用户工作与生活中的“情绪缓冲器”。

技术赋能:

利用ERNIE-4.5强大的语义理解能力精准分析用户情绪,并将结果实时映射为EmoBird的肢体动作(如摇尾巴、歪头)和声音反馈。这种从“语义理解”到“物理共情”的交互闭环,探索了人机情感交互的新边界。

优胜奖:创意百花齐放,AI落地万千场景

除了上述大奖,本次大赛还涌现出一批极具落地潜力的优秀作品。参赛团队将文心4.5带入农业生产、无声世界与商业营销一线,展现了AI硬件在垂直领域的广阔想象力。

  • 心聆视界-基于AR与文心4.5模型的情感化聋哑交互系统(河南郑开鸿数字科技团队利用AR眼镜结合文心大模型,不仅将手语实时转化为文字,更能通过AI补全缺失的情感语义,让无声世界的沟通不再冰冷,充满温度。

  • 文心稻检-稻米品质速检与气候风险关联硬件平台(陈森淼、谢鹏、李姚团队基于端侧部署的ERNIE-4.5-0.3B模型,快速分析稻米表型数据并关联产地气候风险,为农户提供精准的种植建议。

  • 文心守护-基于国产毫米波雷达与百度云AI的独居老人无感守护设备(天天开组会团队采用“毫米波雷达+AI”的非视觉方案,在完全保护隐私的前提下,利用文心大模型对独居老人的健康状态进行长周期分析与跌倒预警。

  • 坐姿检测盒子(张一乔、宋宁团队将健康关怀融入桌面硬件。通过视觉识别与本地大模型统计分析,实时纠正不良坐姿并生成个性化健康报告,做面向大众的“脊柱守护者”。

  • 蒜鸟智能互动获客系统(龙俊团队)利用文心多模态能力与独特的“毒舌”人设微调,打造出极具吸睛能力的互动机器人,大幅提升线下门店的获客效率。

上下滑动查看更多

比赛虽已落幕,但创新的火种才刚刚点燃。

文心4.5系列开源模型凭借其在端侧部署的灵活性和强大的多模态能力,正逐步成为智能设备中不可或缺的“大脑”。

期待在未来,看到更多开发者基于飞桨与文心大模型,创造出改变生活的硬件产品!

图片

告别“纸上谈兵”,这场大赛让AI“跑”在每一块开发板上

ERNIE Hackathon海外三城圆满收官,下一站东京启航!

第三届开放原子大赛-文心开源创新大赛正式启动!

保姆级参赛攻略!文心开源创新大赛教程直播+多城线下DevDay来啦

文心开源Dev Day|基于此芯P1的文心和飞桨模型部署实战

开发者集结!文心开源创新大赛·DevDay 厦门专场来啦!

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐