有点新鲜

「有点新鲜」收录本周 AI / 开发者圈里那些不算大新闻,但挺值得看一眼的新鲜事。

墨水屏也开始加入 AI Coding 大军了?

图1

最近,一台运行 Claude Code 的电子墨水屏设备在 X 上火了,不少开发者看完后的第一反应都是:「不知道是谁做的,但我想要一台。」

有意思的是,Hackaday 报道称,开发者通过重新设计驱动方案,让电子墨水屏实现了接近 60Hz 的刷新体验,试图摆脱传统阅读器刷新慢、只能看书的刻板印象。

随着 AI Coding 成为日常,也许未来的开发设备不一定是 RGB 灯效拉满的机械键盘,而是一块更护眼的墨水屏,陪你和 AI 安静地干一天活。

IBM 在线求庆生

图2

IBM 本周迎来了 115 岁生日,官方直接在 X 上发帖「在线求庆生」:「我们今天 115 岁了,快来说句生日快乐 😠。」马斯克现身评论区送上祝福「HBD!」,IBM 则用一张柴犬 GIF 开心道谢。

从大型机时代一路走到 AI 时代,这家百年科技公司最近几年似乎越来越有“网感”了。

Docker 容器跑树莓派

图3

有同款 Docker 容器的小伙伴可以试试这个操作,让你的容器跑个树莓派。

VR 把球赛搬上桌

图4

NathieVR 分享了一个挺有未来感的观赛体验:戴上 Meta Quest 后,可以通过 DAZN 在 AR / XR 里看足球比赛。

它不只是把直播画面放大到眼前,还会把球场、球员位置和比赛信息做成空间里的虚拟视图,有点像把一场球赛搬到了桌面上。

JSON 是谁

图5

Vibe Coding 的第一天,有人发出了灵魂一问:JSON 是谁?

Windows 2001 现已开放入住

图6

不知道你想不想住进这么一个 Windows XP 的房间呢?“噔—— 噔—— 嗡——”(Windows XP 已开机

周五发版

「周五发版」是一个程序梗:一旦版本上线,我们就要开始祈祷一切如期运行。这个模块寓意,所有模型、产品版本更新,都能大吉大利。

GLM-5.2 发布:1M 上下文 + 开源权重,继续加码 AI Coding 和 Agent

智谱正式发布 GLM-5.2,重点强化 Coding、Agent 和长程任务能力,同时开放模型权重,并采用 MIT License。

图7

这次最大的亮点之一是支持 1M 上下文窗口,更适合处理复杂项目、长代码库和多步骤任务。此外,GLM-5.2 提供了两档推理模式:GLM-5.2 (max) 主打性能上限,GLM-5.2 (high) 则在性能和 Token 消耗之间取得平衡。

值得一提的是,官方并没有提高 API 价格,而是选择在保持原有 GLM-5.1 定价的基础上升级能力。最近几个月可以明显感觉到,国内模型厂商已经不再单纯卷 Benchmark,而是越来越围绕 AI Coding 和 Agent 工作流展开竞争。

Android 17 发布:聊天浮窗、双画面录制都来了

Google 正式发布 Android 17,并带来一系列围绕多任务处理和创作场景的新功能。

图8

其中比较有意思的是 Bubbles 功能,未来几乎所有 App 都可以变成悬浮小窗口,方便用户一边处理当前任务,一边快速查看其他应用内容。此外,Android 17 还新增 Screen Reactions,支持同时录制手机屏幕和前置镜头,游戏主播、教程创作者和开发者录制演示视频都会方便不少。

针对折叠屏设备,Google 也推出了新的游戏模式,进一步利用大屏空间,同时继续升级系统安全能力。

相比单纯增加新功能,现在的 Android 似乎越来越像一个随身工作台:AI、创作、多任务处理正在慢慢成为手机系统的新底层能力。

VibeThinker-3B 发布:小模型不只是「便宜平替」了

WeiboAI 发布 VibeThinker-3B,一个仅有 30 亿参数(3B)的小模型,专注数学、编程和可验证推理任务。

图9

官方数据显示,它已经进入一线推理模型的性能区间。更有意思的是,团队提出了一个新观点:小模型不应该只被视作降低部署成本的替代方案。在数学、代码这类反馈明确的任务中,小模型或许也能走出一条属于自己的能力增长路径。

Cartesia 发布 Sonic-3.5 和 Ink-2,想同时拿下 AI 的「听」和「说」

语音 AI 公司 Cartesia 正式发布 Sonic-3.5(文本转语音)和 Ink-2(语音转文本),并表示自己成为首家同时拥有行业领先「说」和「听」模型的厂商。

图10

官方称,新架构进一步提升了语音生成速度和质量,这两款模型也已经可以直接用于 Voice Agent 场景。

随着 Voice Agent 越来越成熟,竞争也开始从单一模型能力,转向整套语音交互链路:不仅要会说,还得会听,更要做到实时响应。

Cursor 正在从 AI 编辑器,进化成 AI 工程平台

Cursor 本周一口气更新了云端智能体、自动化能力以及代码托管服务 Origin。

开发者现在可以通过 /in-cloud 把修复 CI、排查问题等长任务交给运行在独立 VM 中的云端智能体处理;也可以通过 /automate 用自然语言创建自动化工作流,并接入 GitHub、Slack 等触发器。

图11

与此同时,Cursor 还宣布推出 Git 托管服务 Origin,希望把代码存储、代码审查和 AI 协作全部整合进来。

图12

越来越明显的一件事是,Cursor 已经不满足于做一个 AI 编辑器,而是在朝着「AI 工程平台」演进。AI Coding 的竞争,也正在从「谁写代码更快」,变成「谁能承载整个研发流程」。

字节跳动推出 Seedance 2.0 Mini:AI 视频也开始卷成本和速度了

字节跳动发布视频生成模型 Seedance 2.0 Mini,在保持接近 Seedance 2.0 Fast 效果的同时,成本降低约 30%,生成速度提升 2 倍。

图13

官方也同步将其接入 CapCut 的 AI 视频能力中,让更多用户直接上手体验。

如果说过去 AI 视频模型还在卷生成效果,那现在竞争重点似乎正在发生变化:谁能在保证质量的前提下,把速度做得更快、成本压得更低,谁就更容易走向大规模应用。

阿里发布 Qwen-Robot Suite:开始搭建具身智能的「全栈工具箱」

阿里通义千问发布 Qwen-Robot Suite,包含导航(RobotNav)、操作(RobotManip)和世界模型(RobotWorld)三大基础模型,进一步补齐具身智能底层能力。

图14

简单理解,它们分别负责机器人怎么移动、怎么与物理世界交互,以及怎么理解和预测现实世界。

相比单个机器人 Demo,这次更值得关注的是,通义千问正在尝试构建一套可复用的底层能力,让未来的 Agent 不只是“看懂世界”,还能真正进入物理世界并完成行动。

GitHub Copilot App 正式上线:把 AI 带进整个开发流程

GitHub 宣布 GitHub Copilot App 正式可用,开发者现在可以在统一界面中查看待办事项、并行调度 AI 智能体,并直接推进 PR 合并。

图15

相比过去作为 IDE 里的一个编程助手,Copilot 正在变成开发工作的统一入口。从写代码、管理任务到代码审查,AI 正逐渐参与整个研发流程。

开源雷达

周榜速递

周榜主要根据新增 star 数进行排名,下面的单项目讲解则偏向新晋项目、实用老项目,标星并非单项目讲解的唯一指标:

图16

NotchPrompt:把 MacBook 刘海屏变成提词器

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐