在这里插入图片描述

引言

一次关于AI交互美学的惊艳突破

就在阿里巴巴高调推出千问App不久,11月18日,蚂蚁集团悄然上线了全模态通用AI助手“灵光”。这款应用以其独特的设计美学和创新的“闪应用”功能,在众多AI助手中脱颖而出。

作为一个每天都在接触各类AI产品的用户,这次体验让我感到惊喜——不是因为它的技术参数有多强大,而是它终于让AI交互变得精致而优雅


正文

01 设计革命,从堆砌文字到策展式对话

打开灵光,最先感受到的是它简洁的页面。

2d6e6ff6f37e955ae41b32f55a91207d

当你询问“小鸟是怎么起飞”时,它不会扔出一段冗长的文字,而是提供结构清晰、排版精美的回答,配有自动生成的头图和精美图标。

这种设计不是表面的美化,而是对信息传递效率的深度思考。灵光通过结构化思维,让AI的回答逻辑清晰、表达简练,同时生成可视化内容,让复杂信息一目了然。

02 多模态交互,从静态文字到动态体验

灵光的突破远不止于文字排版。它实现了基于全代码生成的多模态输出能力

询问“国清寺因何出名”,灵光会直接生成一个可交互的3D模型——不仅仅是图片,而是可以多角度观察、缩放的三维模型。

这种体验的巨大飞跃,源于灵光构建的多智能体协作Agentic架构。它能动态调度图像、3D、动画等专用Agent与工具,实时协作为用户提供更完整的视图体验。

4db98d74f253cf43b85f4d49c2b6b31f

03 闪应用,重新定义AI生产力边界

灵光最具革命性的功能,是面向普通用户推出的“灵光闪应用”——用户在对话中输入一句话,灵光最快30秒就能生成一款AI应用

f46d5a0724b23240f2301dbe6451beef

1b0c45c593f70691d2529cea20323c85

04 技术架构,支撑全模态体验

灵光背后的技术支撑值得关注。它实现了基于全代码生成的多模态输出能力,所有呈现结果——图表、动画、小应用等组件,都是由模型根据对话情境即时生成。

“灵光开眼”功能搭载了AGI相机技术,通过实时视频流解析实现对物理世界的观察和理解。在旅游场景下,用户用灵光对准建筑,应用即可实时“看见”并讲解。

灵光生成的闪应用不只是静态前端页面,而是可以直接调用大模型等后端能力,让应用不仅能展示结果,更能实时与外部进行交互。

aea570ae54bdd8ba2c540592959a60f5

05 生态想象,连接支付宝的无限可能

目前灵光的闪应用功能已经令人印象深刻,但真正的想象空间在于其与支付宝生态的潜在连接。

虽然现在灵光还没有打通支付宝API,但一旦实现,想象空间巨大:你可以用一句话生成个人记账应用,自动导入支付宝账单;创建订阅管理工具,自动识别并管理各类付费服务。

蚂蚁集团2025年以来加速AGI布局,已发布AI医疗管家AQ、布局具身智能灵波科技,蚂蚁百灵大模型也跻身万亿参数模型阵营。灵光的推出,展现了蚂蚁在通用人工智能领域从技术突破到场景落地的全链路能力。


信息一旦被好好排版,人就会立刻原谅这个世界

当AI助手不再是生硬地给出答案,而是提供一场视觉与交互的盛宴,我们提问的意愿自然会更强烈。

灵光的精致与优雅,不仅是对用户体验的尊重,更是对人们好奇心的温柔呵护。它让我们期待每一个答案,期待与AI交互的每一刻。

在AI竞争日益激烈的今天,灵光证明了一件事:技术不仅要强大,更要优雅动人

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐