用四张卡实现跨越式增长,在算力竞赛外弯道超车,这位浙大博士做了什么


这是一名技术人在冷门赛道中坚守、突围、思考与求索的全过程。

@数科星球DigitalPlanet原创
作者丨苑晶
编辑丨大兔
言当下的人工智能行业,正被大语言模型、通用智能体的喧嚣裹挟着向前狂奔。
资本追逐着亮眼的概念,媒体聚焦着参数突破、对话能力迭代,无数从业者涌入这片人声鼎沸的赛道。
但在这片热闹之外,有一条看似小众、却支撑着互联网商业基本盘的赛道——搜索与推荐系统。
它没有动辄千万级用户的话题热度,少有刷屏全网的技术噱头,却是电商、内容平台实现商业闭环的核心骨架。
傅聪,便是扎根在这条冷门赛道上的深耕者。作为前阿里和现Shopee(虾皮)资深算法专家、独立研究员,傅聪常年游走在学术研究与工业落地的交界处。
他一手打造的OnePiece系列框架,成为业内首个将大模型隐式推理、上下文工程深度融入工业级生成式搜推系统的标杆方案,在东南亚、拉美等多个海外市场实现全流量落地,实实在在撬动了平台营收增长。
不同于多数追逐热点的技术从业者,傅聪始终保持着一份清醒:看透大模型热潮下的技术泡沫,厘清学术理想与商业落地的边界,在“技术理想”和“公司营收”之间寻找精准的平衡。
在这场深度对话中,我们抛开行业浮躁的表象,走进傅聪的技术世界。
从传统判别式推荐到生成式推荐的范式更迭,从算力成本的桎梏到隐式推理的破局,从向量数据库的兴衰预判到下一代电商的终极形态构想,再到智能体、多模态技术的长远布局。
本次数科星球DigitalPlanet找到了傅聪,他将以十余年一线实战经验,拆解AI产业底层逻辑,讲述一名技术人在冷门赛道中坚守、突围、思考与求索的全过程。一名技术人在冷门赛道中坚守、突围、思考与求索的全过程。

01
推荐系统正在沦为“边缘角色”
打开机器学习领域三大顶会,每年收录的论文总量接近两万篇。
在海量的研究成果里,聚焦大语言模型、通用智能体的内容占据九成以上,而深耕推荐系统方向的论文,不足两百篇。
这组冰冷的数据,直观勾勒出当下行业的现状:推荐系统,已经成为AI领域不折不扣的“冷门赛道”。
当被问及身处冷门赛道是否会感到落寞时,傅聪坦然接受了这个标签,却并不认同外界对这条赛道价值的低估。
在学生群体、入行不久的技术人员以及普通行业观察者眼中,大模型拥有天然的传播优势。
流畅的对话、多样的交互、不断突破的参数规模,这些可视化的成果更容易被感知、被传播、被追捧。

推荐系统则截然不同,它藏在APP界面的背后,用户打开电商软件,搜索关键词后呈现的商品列表、首页个性化推荐、信息流排序,都是推荐系统在发挥作用。
它潜移默化地影响用户体验,却极少被用户直观感知。
就像空气一样,平日里无人留意,一旦缺失,整个产品体系便会陷入瘫痪。
作为被称作“东南亚版淘宝”的头部电商平台,Shopee覆盖东南亚、拉美等多个国家和地区,海量的用户行为、繁杂的商品品类、差异化的区域消费习惯,对搜推算法提出了极高的要求。
从用户点击搜索框的那一刻起,商品排序、个性化匹配、广告展示、流量分发,每一个环节都由算法主导。
在电商体系中,点击率、转化率、商品销售总收入、广告营收,这些核心商业指标,全都与推荐算法深度绑定。
在AI行业追逐大模型“声量”的当下,推荐系统之所以被贴上“冷门”标签,本质是场景属性与价值呈现方式的差异。
他觉得,大模型的价值偏向“体验创新”,主打交互升级、能力拓展,天然适合打造话题与概念;而推荐系统的价值偏向“商业落地”,聚焦效率提升、成本控制、营收增长,所有技术迭代都必须直面工业场景的严苛考验。
在前AI时代,传统推荐系统走的是“判别式”技术路线。

这套模式依赖大量人力开展数据挖掘、特征工程,技术人员需要从用户海量的历史行为痕迹中,梳理行为逻辑、总结用户偏好,依托人工堆砌的规则和中等规模模型,预判用户的潜在需求。
傅聪用“笨重”来形容这套传统体系:大量人力投入到重复的特征梳理工作中,模型规模达到几千万参数后便陷入瓶颈,继续扩大参数,效果也无法实现正向增长。
在过去很长一段时间里,行业已经习惯了这套运作模式,每次模型迭代上线,能带来零点几个百分点的指标提升,就已经算得上不错的成果。
但大语言模型的崛起,为推荐系统带来了全新的想象空间。
大模型“参数越大、能力越强”的缩放定律,让行业开始思考:推荐系统能否复刻这条路径,用生成式技术重构整个体系?
但理想与现实之间,横亘着无数工业落地的鸿沟。

国内头部大厂如阿里、快手,手握充足的算力与资金,选择“大力出奇迹”,不计成本地探索大参数生成式推荐模型。
快手上线的生成式推荐模型,动用了720张A100显卡进行训练,这种重投入模式,对于绝大多数商业化平台而言,完全不具备复制性。
电商平台本质是盈利性商业主体,而非纯学术研究机构。
它无法像OpenAI那样依靠资本输血,容忍长期亏损去追逐技术理想。
如果为了做大推荐模型参数,导致算力成本飙升、推理延迟增加,最终侵蚀平台利润,这样的技术路线从商业逻辑上就走不通。
这也是傅聪判断传统大参数路线难以普及的核心原因:生成式推荐的探索,不能脱离“成本可控、收益明确”这一工业基本准则。

02
OnePiece的务实破局之路
当行业陷入“要么堆算力做大参数,要么固守传统判别式模型”的二元困境时,傅聪团队联合人大高瓴学院,推出了OnePiece系列生成式推荐框架,走出了一条兼顾效果、成本与落地性的全新路线。
从OnePiece初代版本到2.0、3.0迭代,这套框架逐渐成为业内工业级生成式推荐的标杆,其核心逻辑,是跳出“盲目扩大参数”的误区,聚焦“推理能力优化”,用隐式推理、上下文工程等技术,在有限算力下实现模型效果跃升。
想要读懂OnePiece的价值,首先要理清传统推荐与生成式推荐的核心差异。
传统判别式推荐,核心是“总结过往”,依靠人工提取的用户行为特征,匹配历史偏好;而生成式推荐,核心是“推演未来”,借鉴大模型的推理能力,理解用户行为背后的潜在意图。
但二者之间存在一道天然的“语言壁垒”:大模型以文本为载体,能够构建清晰的思维链(CoT),一步步完成逻辑推演;而推荐系统的“语言”,是商品ID、用户行为序列——点击、收藏、下单、分享、退款,这些碎片化的行为构成了推荐模型的输入,不存在标准的文本语义,直接照搬大模型的显式思维链,完全行不通。
除此之外,电商场景对推理延迟有着近乎苛刻的要求。
用户打开电商APP进行搜索,行业通用标准是两秒内必须输出商品列表。

大模型常用的显式思维链,需要逐字输出推理过程,动辄数千步推演,不仅会产生巨大的算力消耗,还会带来数百毫秒甚至数秒的延迟,这在电商场景中是绝对无法接受的。
用户不会为了等待算法“思考”而停留,延迟每增加一毫秒,都意味着潜在的订单流失。这两大痛点,成为生成式推荐落地的最大阻碍,也是傅聪团队攻坚的核心方向。
在团队重组之初,傅聪面临着双重挑战:一方面,团队长期深耕传统判别式推荐,全员需要从零补全大模型相关知识,完成技术认知的整体转型;另一方面,现有架构无法支撑多层Transformer结构,模型参数规模受到严格限制,必须在有限条件下寻找突破口。
转机来自大模型领域的隐式推理技术。
借鉴相关研究成果,傅聪团队提出了适配推荐场景的“隐式思维链”方案。
简单来说,大模型的显式思维链,是把每一步思考过程完整输出,步骤繁琐、成本高昂;而隐式推理,则是将数千步的复杂推演,压缩为四到五个核心解码步骤,不在前端展示推理过程,仅输出最终结果。
这套思路落地到推荐系统中,完美解决了延迟与算力两大难题。

在实际落地测试中,原有模型单卡推理耗时达到两百多毫秒,占据了整体响应时长的十分之一,严重影响用户体验。
引入隐式推理后,团队将用户行为的复杂推演压缩为三步核心逻辑,把整体推理耗时控制在一百毫秒以内。更难得的是,在模型参数量更大的前提下,推理速度反而实现了优化,算力成本几乎没有增加。
这一突破,让生成式推荐从“学术实验”真正走向“工业可用”。
OnePiece框架的另一大核心创新,是“上下文工程”的场景化改造。
大模型的上下文工程,是通过组织文本内容引导模型输出结果;而推荐系统的上下文工程,是基于用户行为序列构建专属场景逻辑。傅聪解释道,推荐系统没有文本词汇,用户的每一次点击、每一笔订单、每一次浏览,都是独有的“语义单元”。
团队没有生硬照搬外部技术,而是基于电商场景原生设计逻辑,构建适配商品ID与行为序列的上下文体系,让模型能够读懂行为背后的用户意图。
不同于大厂“720张显卡堆模型”的重资产路线,OnePiece系列模型的训练,仅需四张A100显卡即可完成,轻量化的架构让它具备极强的普及性。
这套“小模型+推理优化”的路线,被傅聪定义为行业更理性的选择:不盲目追逐参数竞赛,而是立足商业本质,在效果、成本、延迟三者之间找到最优解。
技术的价值,最终要靠商业数据来验证。

OnePiece框架在Shopee部署后,交出了一份十分亮眼的成绩单。平台商品销售总收入提升1.8个百分点,广告营收提升3.3个百分点。
对于成熟的大型电商平台而言,单次模型迭代能实现这样的涨幅,已经属于跨越式突破。
要知道,传统判别式模型迭代,单次往往只能带来零点几个百分点的提升。
更重要的是,所有指标提升,都建立在“算力成本零增长”的基础之上,完美契合了电商平台的商业诉求。除了营收数据优化,算法也实实在在改善了用户体验。
团队将搜索结果划分为高度相关、似是而非、完全不相关三个档位,通过生成式模型强化意图理解,大幅降低了低质量内容的占比,减少用户无效浏览、退换货等行为,间接降低了平台的运营成本。
时至今日,OnePiece已经迭代至3.0版本,能够支撑十亿级参数大模型实现效果持续增长。但傅聪明确表示,这并非生成式推荐的终极形态。
放眼长远,多模态将是下一个核心方向。
用户浏览商品时,看到的是图片、视频、文字等多维度信息,未来的大一统模型,将以文本逻辑为核心,兼容图片、视频、用户行为等多种模态数据,全方位理解商品属性与用户需求。
而商品的材质、版型、外观等物理属性,也能通过多模态技术自动提取,丰富模型的判断依据,进一步拉近算法与真实消费场景的距离。

03
拆解AI行业泡沫
深耕搜推领域多年,同时游走在学术与产业之间,傅聪对当下AI行业的各类概念、技术路线有着极为清醒的判断。
他没有被大模型、软件3.0、向量数据库、智能体等热门概念裹挟,而是从成本、技术原理、产业需求三个维度,逐一拆解行业泡沫,指出诸多热门技术的局限性与发展边界。
在他看来,当下很多被热炒的概念,要么存在底层技术缺陷,要么只是阶段性的过渡产品,距离真正的大规模产业落地,还有很长的路要走。
软件3.0:理想丰满,成本桎梏难以突破如今,“软件3.0”的概念被频繁提及,其核心愿景是“告别固定软件形态,模型可根据用户需求实时生成应用”。
相比于以SaaS、传统APP为代表的软件2.0(边际成本递减,一次开发、反复复用,后期边际成本趋近于零),软件3.0依托大模型而生,被行业赋予了颠覆现有软件生态的期待。

但在傅聪看来,软件3.0存在与生俱来的硬伤——推理成本的线性增长,这一缺陷直接决定了它很难在ToC领域大规模普及。
软件2.0的核心优势是固定成本为主,边际成本无限压低。
一款电商APP、办公软件,完成研发后,服务一万用户和一千万用户,新增的成本微乎其微。而大模型的推理逻辑截然不同:每增加一个用户、每多一次请求,都会产生对应的算力消耗。
即便通过缓存、算法优化等手段,将成本增长压低为次线性,也无法实现“边际成本趋近于零”。
这种成本结构,决定了大模型相关服务的商业化路径差异。
当下市场中,能够实现盈利的AI服务,几乎全部集中在ToB赛道。
企业客户客单价高,AI技术能够显著提升工作效率,企业愿意为算力与服务付费;而面向普通用户的ToC产品,客单价低、用户体量庞大,线性增长的推理成本会不断吞噬利润。
这也是为什么目前很难看到盈利的ToC类AI原生产品。

落地到电商领域,这一逻辑同样适用。
有观点认为,下一代电商会完全由通用智能体驱动,传统搜推模型、APP界面都会被彻底颠覆。
但傅聪判断,短期内这一愿景无法实现。
从技术与商业双重角度来看,直接从现有电商形态跨越到纯智能体驱动的“AI原生电商”,既不具备技术合理性,也不具备商业合理性。
现有电商平台不会贸然推翻成熟的体系,去尝试一款盈利模式不明、成本高昂的全新产品。
软件3.0描绘的“按需生成软件”的终极图景,更多是一种长期理想。
在算力成本出现颠覆性变革之前,它只能停留在概念与小范围试点阶段。行业需要认清现实,摒弃浮躁的幻想,立足现有条件,稳步推进技术迭代。

04
向量数据库:阶段性工具,终将被技术迭代淘汰
前两年,随着RAG(检索增强生成)技术走红,向量数据库成为AI赛道的热门风口,被视作大模型落地的“基础设施”。
无数资本入局,创业公司扎堆,行业普遍认为向量数据库会成为长期刚需。
但傅聪对此持悲观态度,他直言:向量数据库只是AI发展过程中的“阶段性铲子”,随着大模型推理能力、吞吐能力的提升,它的生存空间会快速萎缩,甚至逐渐退出主流赛道。
向量数据库的核心作用,是为大模型检索外部知识库,补充模型本身不具备的信息,缓解幻觉问题。
这套逻辑成立的前提是:大模型上下文窗口有限、吞吐能力不足,无法直接承载海量信息。
但大模型的迭代速度远超预期,如今主流大模型的上下文窗口不断扩大,单次能够处理的文件、文本量大幅提升。
现在的高阶大模型,可以一次性加载二三十份文档,精准提取核心信息,出错率被控制在极低水平。
按照这个发展趋势,五年之内,大模型的推理速度、信息承载能力还会迎来新一轮跃升。
到那时,模型可以直接加载所需的全部外部信息,不再需要单独的向量检索环节。

谷歌传统的文本倒排检索,尚且能够支撑搜索引擎运转多年,当大模型自身能力足够强大时,专门的向量数据库,自然会失去不可替代性。
与此同时,多模态技术的发展,也在冲击传统向量数据库的架构。
早期的向量检索,采用“单向量对应整张图片、整篇文档”的模式;而当下主流的多模态模型,会将一张图片拆分为数百个像素区块,每个区块生成独立向量,以多向量模式完成理解。
这种技术变革,直接推翻了传统向量数据库的评估框架与运作逻辑。
目前,向量数据库仅在搜索、推荐、广告等传统互联网场景还有一定使用价值,这类场景以单向量多模态检索为主,暂时无法被完全替代。
但放眼长远,它的赛道空间正在不断收缩。
傅聪提醒行业从业者,不要高估风口概念的生命周期,工具类技术的价值,始终依附于核心主赛道,当主赛道技术完成迭代,过渡性工具便会慢慢淡出舞台。

05
大模型的底层缺陷
抛开应用层的概念纷争,傅聪从机器学习底层理论出发,点出了大模型与生俱来的两大缺陷,这也是制约通用人工智能实现的核心障碍。
作为传统机器学习科班出身的研究者,他的判断跳出了应用层表象,直击模型架构的本质。
第一大缺陷,是经验风险最小化的底层逻辑。
当下所有大模型的训练优化,都遵循这一经典机器学习理论。
简单来说,模型在海量训练样本中追求“平均表现最优”,能对绝大多数常规任务交出八十分的答卷,但无法针对单个复杂任务做到满分。这就像一名学生,全面发展、各科均衡,却难以在某一道高难度题目上做到极致。
模型为了适配全体用户、全部场景,必然会牺牲个性化与极致精度。
这一缺陷直接导致了知识库应用的“信噪比过低”问题。
如今各类代码助手、文档解析AI层出不穷,AI可以在五分钟内生成一千行代码,也能针对一份文档列出数十条修改建议。
但这些输出内容中,夹杂着大量无效信息。
使用者想要提炼核心风险、关键结论,往往需要花费比人工处理更长的时间。
大模型无法区分信息的轻重主次,根源就在于经验风险最小化——它学习的是通用规则,而非特定行业、特定场景的深层逻辑。
想要改善这一问题,唯一的出路是深耕高信噪比行业知识库,沉淀垂直领域的场景逻辑、SOP与上下文,而这也是当下多数AI团队缺失的核心能力。

第二大缺陷,是风险厌恶特性。
大模型基于概率推演生成内容,每一步输出都会选择“出错概率最低”的选项,本质是极致的保守主义。
人类的创新、突破、创造性思考,往往伴随着“试错”,敢于选择不确定的方向,才有可能诞生新成果。
但大模型的运行逻辑决定了它天生“不敢冒险”,输出内容会收敛在安全区间内,难以产生真正的创造性突破。
这一特性,也解释了为什么当下多数AI创新停留在“整合现有信息”,而非“创造全新价值”。
模型可以归纳、总结、推演已有内容,却无法像人类科学家一样,从异常现象中提出新假设、构建新理论。
傅聪认为,这是Transformer架构与概率生成逻辑带来的固有局限,短期内很难彻底突破。
基于以上判断,傅聪指出了当下大模型行业的“技术空转”现象:行业热衷于发布新版本、新论文,在微小的技术点上内卷,但真正核心的竞争力——数据配比、行业知识库、多模态底层架构,却很少对外公开。
头部厂商默默深耕数据、扩大模型参数、攻坚多模态技术,而对外宣传的大多是边际优化的小功能。
对于从业者而言,需要穿透PR包装,看清行业真正的竞争核心,不要在无效内卷中消耗精力。

06
下一代电商的终局与智能体的产业演进
结合搜推技术、大模型、智能体的发展趋势,傅聪对下一代电商形态做出了清晰的预判。
在他的构想中,电商行业的进化会分为多个阶段,不会一步迈入纯AI智能体时代。
短期、中期、长期的产品形态、技术角色各有不同,而所有技术迭代,最终都会围绕“满足用户主动信息获取与被动娱乐消费”两大核心需求展开。
在未来三到五年内,工具化、管道化是电商APP与搜推模型的主要演进方向。
随着通用大模型与智能体能力增强,传统电商APP会褪去“独立产品”的属性,逐步沦为智能体的调用工具。
就像如今的千问、豆包等大模型,可以直接唤起外卖、购物服务,未来用户无需单独打开电商APP,在AI对话框中说出需求,智能体便会调用电商接口,完成搜索、比价、下单全流程。
届时,现在核心的搜索模型、推荐模型、排序算法,都会被封装为标准化接口,成为智能体生态中的底层工具。
曾经被视作核心竞争力的生成式推荐模型,也不再是独立的产品主体,而是整个AI服务链条中的一个环节。

这一趋势,是软件3.0理念下的必然结果,也是行业资源整合的必经之路。
但这并不意味着搜推技术会失去价值。恰恰相反,接口化、工具化之后,对算法的精度、速度、稳定性要求会进一步提升。
当海量智能体同时调用电商接口,模型的推理延迟、匹配精度、并发处理能力,会直接影响终端用户体验。
冷门赛道依旧冷门,但技术门槛会持续抬高,深耕底层能力的团队,会持续掌握行业话语权。
对于用户而言,这种形态变革会彻底改变使用习惯。
传统电商APP由产品经理定义界面、流程、交互逻辑,用户只能被动遵循预设路径操作;而在工具化时代,用户可以根据自身需求,自定义服务流程。
比如有人只需要直播购物功能,有人专注于比价下单,智能体可以为不同用户组合出个性化的服务形态,实现“千人千面”的产品体验。
傅聪将用户需求划分为两大类别:一是主动信息获取,带着明确目标购物、查资料;二是被动娱乐消费,无目的地浏览、消遣。
传统电商与内容平台,分别侧重其中一类需求,而通用智能体可以同时承接两类需求,挖掘用户潜在意图。

用户的消费决策,是一个复杂的链式过程。
从模糊的购物想法,到明确商品需求,再到比价、查看评价、凑单、下单,中间夹杂着大量碎片化思考。传统推荐算法只能基于已有的行为数据做匹配,无法追踪用户意图的动态变化。
而智能体具备“快速追打能力”:当用户浏览某款商品,流露出对配置、款式、价格的倾向时,智能体可以瞬间捕捉意图变化,实时调整推荐内容,一步步把模糊需求转化为明确订单。
除此之外,电商消费中的比价、凑单、售后等衍生需求,也是传统算法难以全面覆盖的。
全网比价是当下用户选购商品的核心诉求,凑单满减、团购优惠券等玩法,涉及复杂的组合逻辑,单一的推荐模型无法独立完成。
智能体可以整合搜索、推荐、比价、营销工具等多个模块,一站式解决全链路问题,真正降低用户的决策成本。
在终极形态下,产品的定义权会从产品经理手中交还给用户。
软件不再是固定不变的形态,而是根据用户的习惯、偏好、需求动态生成。
喜欢简洁界面的用户,得到轻量化服务;喜欢浏览消遣的用户,得到丰富的内容推荐;追求效率的用户,直接对接比价与下单通道。
这也是软件3.0真正的价值所在:以人为本,让技术适配人,而非让人适配软件。
但傅聪反复强调,这一终极形态的落地,需要跨越多重障碍:算力成本的大幅下降、行业知识库的全面沉淀、多模态技术的成熟、用户消费习惯的逐步培养。
这是一个漫长的过渡过程,现阶段所有技术探索,都是在为终局形态铺路。

他认为,智能体的落地会率先在ToB产业场景、科研领域迎来突破,而非大众消费市场。
如今各行各业都在试水智能体,但多数产品停留在“将工作流转化为SOP,让模型按流程执行”的初级阶段。
智能体真正的壁垒,是行业上下文与高信噪比知识库,这也是短期内难以快速复制的核心资产。
在众多智能体应用方向中,傅聪格外看好AI for Science(人工智能赋能科研)。他正在探索“Ultra Research”项目,尝试用多智能体模拟高校科研团队,从提出论文创意、梳理研究思路,到完成实验、撰写成果,实现全流程辅助。
这套体系并非追求完全替代科研人员,而是打造“人机协作”的副驾驶模式:AI负责文献梳理、逻辑推导、实验落地,人类科研人员聚焦核心判断、创新突破,如同自动驾驶L4级别,机器完成大部分流程,人类在关键节点把控方向。

想要实现科研级智能体,需要融合归纳推理与演绎推理两大逻辑模式。
当下多数AI擅长归纳总结,从现有数据中提炼规律;而科研创新需要演绎推理,从假设出发推导结论、验证猜想,从异常现象中挖掘新方向。
傅聪团队正在结合认知论、神经科学等跨学科知识,搭建适配科研场景的智能体框架。
在实际测试中,AI已经能够贡献半数以上的论文创意,辅助梳理研究框架,展现出巨大的潜力。
长远来看,多智能体、持续学习、多模态,会是AI技术三大核心攻坚方向。
大模型“无法持续学习”的缺陷,是制约其迭代的关键;多模态是打通物理世界与数字世界的桥梁;而多智能体协作,是实现复杂场景落地的核心形态。
这些方向没有短期流量红利,却是决定行业未来高度的根基。
未来,当电商全面迈入智能体时代,当AI技术深度融入各行各业,我们回望当下便会发现:那些坚守冷门赛道、专注落地解决问题的技术人,正是搭建起AI产业大厦的基石。
而对于傅聪而言,当下的深耕与探索,只是新旅程的起点。跳出技术惯性,奔赴智能体与科研AI的新赛道,他的故事,仍在继续。
更多推荐


所有评论(0)