2025.11.25 AI快讯

AI领域迎来多项突破：ClaudeOpus4.5以80.9%高分登顶智能体榜单，同时成本大幅降低；OpenAI推出基于GPT-5mini的电商功能，准确率达64%；腾讯开源1B参数HunyuanOCR模型，支持14种小语种；字节跳动开源EinoADK框架，确立智能体标准范式。研究显示，AI正向低成本、垂直化方向发展，人机协同和业务整合成为关键趋势，同时模型可解释性和安全控制取得进展。专家指出，未来

聚梦小课堂

454人浏览 · 2025-11-25 23:07:47

聚梦小课堂 · 2025-11-25 23:07:47 发布

Anthropic发布Claude Opus 4.5，在SWE-bench Verified获80.9%高分夺得智能体榜首，输入价格大幅降至$5/M tokens。模型专精后端开发与调试，揭示高智力模型向低成本、垂类化演进，建议采用与Gemini 3混合架构以平衡前端生成短板。
OpenAI推出基于GPT-5 mini的ChatGPT购物功能，利用聊天记录生成可视化购买指南，准确率达64%。该功能不收广告费仅用公开信息，标志着AI搜索从通用问答向高决策成本垂直电商场景渗透，挑战传统SEO与流量分发模式。
OpenAI发表论文提出稀疏Transformer训练法，成功提取AI内部可解释电路并预测模型失效。研究验证了利用小型稀疏模型翻译大型密集模型行为的可行性，为黑盒模型提供数学级解释路径，确立超级智能安全控制的新技术基座。
牛津大学与微软联合发布AUI研究，利用智能体(CUA)构建面向机器的极简GUI，摒弃人类视觉复杂性。研究证实功能导向界面显著提升协作效率，揭示未来互联网将分化为"人机交互"与"机机交互"两套平行视觉标准，重塑前端开发逻辑。
腾讯混元开源1B参数HunyuanOCR模型，采用端到端多模态架构，在OmniDocBench测评中超越Google Gemini3-pro。模型支持14种小语种并在ICDAR2025夺冠，证明小参数专用模型在复杂文档解析领域不仅可控且具备SOTA级能效比。
MobiAgent等开源项目验证基于视觉大模型的手机自动化路径，通过截屏理解与ADB指令替代传统UI元素ID查找。这种不依赖底层API的"视觉操作"方案，突破了应用封闭性限制，为跨App智能体交互建立了通用的视觉感知接口。
Base44创始人Maor Shlomo指出Vibe Coding将吞噬传统SaaS，未来软件呈"液态化"趋势。他强调单纯Agent缺乏壁垒，真正的护城河在于构建垂直整合平台处理复杂业务，警示创业者应聚焦数据私有化与传统行业整合而非通用工具。
字节跳动开源Eino ADK框架，确立ChatModelAgent的规划-执行-反思标准范式。该方案通过History/Session机制解决多智能体数据流转难题，为企业级复杂工作流编排提供了可落地的工程化参考，显著降低Agent系统构建门槛。
前智谱COO张帆提出AI ToB应定义为"数字员工"而非工具，主张"50%模型含量+50%业务壁垒"的结构。他强调通过商业强化学习将通用模型训练为特定工种，揭示企业级AI的价值锚点在于替代劳动力成本而非单纯的技术售卖。
Stack Overflow调查显示开发者对AI信任度因"似是而非"的错误下降，企业需转向RAG与人工验证循环。这一趋势表明单纯依赖模型能力的红利期结束，构建高质量知识库与人机协同的纠错机制成为AI工程落地的核心决胜点。

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla