用四张卡实现跨越式增长，在算力竞赛外弯道超车，这位浙大博士做了什么

数科星球

318人浏览 · 2026-06-10 16:57:39

数科星球 · 2026-06-10 16:57:39 发布

这是一名技术人在冷门赛道中坚守、突围、思考与求索的全过程。

@数科星球DigitalPlanet原创

作者丨苑晶

编辑丨大兔

言当下的人工智能行业，正被大语言模型、通用智能体的喧嚣裹挟着向前狂奔。

资本追逐着亮眼的概念，媒体聚焦着参数突破、对话能力迭代，无数从业者涌入这片人声鼎沸的赛道。

但在这片热闹之外，有一条看似小众、却支撑着互联网商业基本盘的赛道——搜索与推荐系统。

它没有动辄千万级用户的话题热度，少有刷屏全网的技术噱头，却是电商、内容平台实现商业闭环的核心骨架。

傅聪，便是扎根在这条冷门赛道上的深耕者。作为前阿里和现Shopee（虾皮）资深算法专家、独立研究员，傅聪常年游走在学术研究与工业落地的交界处。

他一手打造的OnePiece系列框架，成为业内首个将大模型隐式推理、上下文工程深度融入工业级生成式搜推系统的标杆方案，在东南亚、拉美等多个海外市场实现全流量落地，实实在在撬动了平台营收增长。

不同于多数追逐热点的技术从业者，傅聪始终保持着一份清醒：看透大模型热潮下的技术泡沫，厘清学术理想与商业落地的边界，在“技术理想”和“公司营收”之间寻找精准的平衡。

在这场深度对话中，我们抛开行业浮躁的表象，走进傅聪的技术世界。

从传统判别式推荐到生成式推荐的范式更迭，从算力成本的桎梏到隐式推理的破局，从向量数据库的兴衰预判到下一代电商的终极形态构想，再到智能体、多模态技术的长远布局。

本次数科星球DigitalPlanet找到了傅聪，他将以十余年一线实战经验，拆解AI产业底层逻辑，讲述一名技术人在冷门赛道中坚守、突围、思考与求索的全过程。一名技术人在冷门赛道中坚守、突围、思考与求索的全过程。

01

02 OnePiece的务实破局之路

当行业陷入“要么堆算力做大参数，要么固守传统判别式模型”的二元困境时，傅聪团队联合人大高瓴学院，推出了OnePiece系列生成式推荐框架，走出了一条兼顾效果、成本与落地性的全新路线。

从OnePiece初代版本到2.0、3.0迭代，这套框架逐渐成为业内工业级生成式推荐的标杆，其核心逻辑，是跳出“盲目扩大参数”的误区，聚焦“推理能力优化”，用隐式推理、上下文工程等技术，在有限算力下实现模型效果跃升。

想要读懂OnePiece的价值，首先要理清传统推荐与生成式推荐的核心差异。

传统判别式推荐，核心是“总结过往”，依靠人工提取的用户行为特征，匹配历史偏好；而生成式推荐，核心是“推演未来”，借鉴大模型的推理能力，理解用户行为背后的潜在意图。

但二者之间存在一道天然的“语言壁垒”：大模型以文本为载体，能够构建清晰的思维链（CoT），一步步完成逻辑推演；而推荐系统的“语言”，是商品ID、用户行为序列——点击、收藏、下单、分享、退款，这些碎片化的行为构成了推荐模型的输入，不存在标准的文本语义，直接照搬大模型的显式思维链，完全行不通。

除此之外，电商场景对推理延迟有着近乎苛刻的要求。

用户打开电商APP进行搜索，行业通用标准是两秒内必须输出商品列表。

大模型常用的显式思维链，需要逐字输出推理过程，动辄数千步推演，不仅会产生巨大的算力消耗，还会带来数百毫秒甚至数秒的延迟，这在电商场景中是绝对无法接受的。

用户不会为了等待算法“思考”而停留，延迟每增加一毫秒，都意味着潜在的订单流失。这两大痛点，成为生成式推荐落地的最大阻碍，也是傅聪团队攻坚的核心方向。

在团队重组之初，傅聪面临着双重挑战：一方面，团队长期深耕传统判别式推荐，全员需要从零补全大模型相关知识，完成技术认知的整体转型；另一方面，现有架构无法支撑多层Transformer结构，模型参数规模受到严格限制，必须在有限条件下寻找突破口。

转机来自大模型领域的隐式推理技术。

借鉴相关研究成果，傅聪团队提出了适配推荐场景的“隐式思维链”方案。

简单来说，大模型的显式思维链，是把每一步思考过程完整输出，步骤繁琐、成本高昂；而隐式推理，则是将数千步的复杂推演，压缩为四到五个核心解码步骤，不在前端展示推理过程，仅输出最终结果。

这套思路落地到推荐系统中，完美解决了延迟与算力两大难题。

在实际落地测试中，原有模型单卡推理耗时达到两百多毫秒，占据了整体响应时长的十分之一，严重影响用户体验。

引入隐式推理后，团队将用户行为的复杂推演压缩为三步核心逻辑，把整体推理耗时控制在一百毫秒以内。更难得的是，在模型参数量更大的前提下，推理速度反而实现了优化，算力成本几乎没有增加。

这一突破，让生成式推荐从“学术实验”真正走向“工业可用”。

OnePiece框架的另一大核心创新，是“上下文工程”的场景化改造。

大模型的上下文工程，是通过组织文本内容引导模型输出结果；而推荐系统的上下文工程，是基于用户行为序列构建专属场景逻辑。傅聪解释道，推荐系统没有文本词汇，用户的每一次点击、每一笔订单、每一次浏览，都是独有的“语义单元”。

团队没有生硬照搬外部技术，而是基于电商场景原生设计逻辑，构建适配商品ID与行为序列的上下文体系，让模型能够读懂行为背后的用户意图。

不同于大厂“720张显卡堆模型”的重资产路线，OnePiece系列模型的训练，仅需四张A100显卡即可完成，轻量化的架构让它具备极强的普及性。

这套“小模型+推理优化”的路线，被傅聪定义为行业更理性的选择：不盲目追逐参数竞赛，而是立足商业本质，在效果、成本、延迟三者之间找到最优解。

技术的价值，最终要靠商业数据来验证。

OnePiece框架在Shopee部署后，交出了一份十分亮眼的成绩单。平台商品销售总收入提升1.8个百分点，广告营收提升3.3个百分点。

对于成熟的大型电商平台而言，单次模型迭代能实现这样的涨幅，已经属于跨越式突破。

要知道，传统判别式模型迭代，单次往往只能带来零点几个百分点的提升。

更重要的是，所有指标提升，都建立在“算力成本零增长”的基础之上，完美契合了电商平台的商业诉求。除了营收数据优化，算法也实实在在改善了用户体验。

团队将搜索结果划分为高度相关、似是而非、完全不相关三个档位，通过生成式模型强化意图理解，大幅降低了低质量内容的占比，减少用户无效浏览、退换货等行为，间接降低了平台的运营成本。

时至今日，OnePiece已经迭代至3.0版本，能够支撑十亿级参数大模型实现效果持续增长。但傅聪明确表示，这并非生成式推荐的终极形态。

放眼长远，多模态将是下一个核心方向。

用户浏览商品时，看到的是图片、视频、文字等多维度信息，未来的大一统模型，将以文本逻辑为核心，兼容图片、视频、用户行为等多种模态数据，全方位理解商品属性与用户需求。

而商品的材质、版型、外观等物理属性，也能通过多模态技术自动提取，丰富模型的判断依据，进一步拉近算法与真实消费场景的距离。

03 拆解AI行业泡沫

深耕搜推领域多年，同时游走在学术与产业之间，傅聪对当下AI行业的各类概念、技术路线有着极为清醒的判断。

他没有被大模型、软件3.0、向量数据库、智能体等热门概念裹挟，而是从成本、技术原理、产业需求三个维度，逐一拆解行业泡沫，指出诸多热门技术的局限性与发展边界。

在他看来，当下很多被热炒的概念，要么存在底层技术缺陷，要么只是阶段性的过渡产品，距离真正的大规模产业落地，还有很长的路要走。

软件3.0：理想丰满，成本桎梏难以突破如今，“软件3.0”的概念被频繁提及，其核心愿景是“告别固定软件形态，模型可根据用户需求实时生成应用”。

相比于以SaaS、传统APP为代表的软件2.0（边际成本递减，一次开发、反复复用，后期边际成本趋近于零），软件3.0依托大模型而生，被行业赋予了颠覆现有软件生态的期待。

但在傅聪看来，软件3.0存在与生俱来的硬伤——推理成本的线性增长，这一缺陷直接决定了它很难在ToC领域大规模普及。

软件2.0的核心优势是固定成本为主，边际成本无限压低。

一款电商APP、办公软件，完成研发后，服务一万用户和一千万用户，新增的成本微乎其微。而大模型的推理逻辑截然不同：每增加一个用户、每多一次请求，都会产生对应的算力消耗。

即便通过缓存、算法优化等手段，将成本增长压低为次线性，也无法实现“边际成本趋近于零”。

这种成本结构，决定了大模型相关服务的商业化路径差异。

当下市场中，能够实现盈利的AI服务，几乎全部集中在ToB赛道。

企业客户客单价高，AI技术能够显著提升工作效率，企业愿意为算力与服务付费；而面向普通用户的ToC产品，客单价低、用户体量庞大，线性增长的推理成本会不断吞噬利润。

这也是为什么目前很难看到盈利的ToC类AI原生产品。

落地到电商领域，这一逻辑同样适用。

有观点认为，下一代电商会完全由通用智能体驱动，传统搜推模型、APP界面都会被彻底颠覆。

但傅聪判断，短期内这一愿景无法实现。

从技术与商业双重角度来看，直接从现有电商形态跨越到纯智能体驱动的“AI原生电商”，既不具备技术合理性，也不具备商业合理性。

现有电商平台不会贸然推翻成熟的体系，去尝试一款盈利模式不明、成本高昂的全新产品。

软件3.0描绘的“按需生成软件”的终极图景，更多是一种长期理想。

在算力成本出现颠覆性变革之前，它只能停留在概念与小范围试点阶段。行业需要认清现实，摒弃浮躁的幻想，立足现有条件，稳步推进技术迭代。

04 向量数据库：阶段性工具，终将被技术迭代淘汰

前两年，随着RAG（检索增强生成）技术走红，向量数据库成为AI赛道的热门风口，被视作大模型落地的“基础设施”。

无数资本入局，创业公司扎堆，行业普遍认为向量数据库会成为长期刚需。

但傅聪对此持悲观态度，他直言：向量数据库只是AI发展过程中的“阶段性铲子”，随着大模型推理能力、吞吐能力的提升，它的生存空间会快速萎缩，甚至逐渐退出主流赛道。

向量数据库的核心作用，是为大模型检索外部知识库，补充模型本身不具备的信息，缓解幻觉问题。

这套逻辑成立的前提是：大模型上下文窗口有限、吞吐能力不足，无法直接承载海量信息。

但大模型的迭代速度远超预期，如今主流大模型的上下文窗口不断扩大，单次能够处理的文件、文本量大幅提升。

现在的高阶大模型，可以一次性加载二三十份文档，精准提取核心信息，出错率被控制在极低水平。

按照这个发展趋势，五年之内，大模型的推理速度、信息承载能力还会迎来新一轮跃升。

到那时，模型可以直接加载所需的全部外部信息，不再需要单独的向量检索环节。

谷歌传统的文本倒排检索，尚且能够支撑搜索引擎运转多年，当大模型自身能力足够强大时，专门的向量数据库，自然会失去不可替代性。

与此同时，多模态技术的发展，也在冲击传统向量数据库的架构。

早期的向量检索，采用“单向量对应整张图片、整篇文档”的模式；而当下主流的多模态模型，会将一张图片拆分为数百个像素区块，每个区块生成独立向量，以多向量模式完成理解。

这种技术变革，直接推翻了传统向量数据库的评估框架与运作逻辑。

目前，向量数据库仅在搜索、推荐、广告等传统互联网场景还有一定使用价值，这类场景以单向量多模态检索为主，暂时无法被完全替代。

但放眼长远，它的赛道空间正在不断收缩。

傅聪提醒行业从业者，不要高估风口概念的生命周期，工具类技术的价值，始终依附于核心主赛道，当主赛道技术完成迭代，过渡性工具便会慢慢淡出舞台。

05 大模型的底层缺陷

抛开应用层的概念纷争，傅聪从机器学习底层理论出发，点出了大模型与生俱来的两大缺陷，这也是制约通用人工智能实现的核心障碍。

作为传统机器学习科班出身的研究者，他的判断跳出了应用层表象，直击模型架构的本质。

第一大缺陷，是经验风险最小化的底层逻辑。

当下所有大模型的训练优化，都遵循这一经典机器学习理论。

简单来说，模型在海量训练样本中追求“平均表现最优”，能对绝大多数常规任务交出八十分的答卷，但无法针对单个复杂任务做到满分。这就像一名学生，全面发展、各科均衡，却难以在某一道高难度题目上做到极致。

模型为了适配全体用户、全部场景，必然会牺牲个性化与极致精度。

这一缺陷直接导致了知识库应用的“信噪比过低”问题。

如今各类代码助手、文档解析AI层出不穷，AI可以在五分钟内生成一千行代码，也能针对一份文档列出数十条修改建议。

但这些输出内容中，夹杂着大量无效信息。

使用者想要提炼核心风险、关键结论，往往需要花费比人工处理更长的时间。

大模型无法区分信息的轻重主次，根源就在于经验风险最小化——它学习的是通用规则，而非特定行业、特定场景的深层逻辑。

想要改善这一问题，唯一的出路是深耕高信噪比行业知识库，沉淀垂直领域的场景逻辑、SOP与上下文，而这也是当下多数AI团队缺失的核心能力。

第二大缺陷，是风险厌恶特性。

大模型基于概率推演生成内容，每一步输出都会选择“出错概率最低”的选项，本质是极致的保守主义。

人类的创新、突破、创造性思考，往往伴随着“试错”，敢于选择不确定的方向，才有可能诞生新成果。

但大模型的运行逻辑决定了它天生“不敢冒险”，输出内容会收敛在安全区间内，难以产生真正的创造性突破。

这一特性，也解释了为什么当下多数AI创新停留在“整合现有信息”，而非“创造全新价值”。

模型可以归纳、总结、推演已有内容，却无法像人类科学家一样，从异常现象中提出新假设、构建新理论。

傅聪认为，这是Transformer架构与概率生成逻辑带来的固有局限，短期内很难彻底突破。

基于以上判断，傅聪指出了当下大模型行业的“技术空转”现象：行业热衷于发布新版本、新论文，在微小的技术点上内卷，但真正核心的竞争力——数据配比、行业知识库、多模态底层架构，却很少对外公开。

头部厂商默默深耕数据、扩大模型参数、攻坚多模态技术，而对外宣传的大多是边际优化的小功能。

对于从业者而言，需要穿透PR包装，看清行业真正的竞争核心，不要在无效内卷中消耗精力。

06 下一代电商的终局与智能体的产业演进

结合搜推技术、大模型、智能体的发展趋势，傅聪对下一代电商形态做出了清晰的预判。

在他的构想中，电商行业的进化会分为多个阶段，不会一步迈入纯AI智能体时代。

短期、中期、长期的产品形态、技术角色各有不同，而所有技术迭代，最终都会围绕“满足用户主动信息获取与被动娱乐消费”两大核心需求展开。

在未来三到五年内，工具化、管道化是电商APP与搜推模型的主要演进方向。

随着通用大模型与智能体能力增强，传统电商APP会褪去“独立产品”的属性，逐步沦为智能体的调用工具。

就像如今的千问、豆包等大模型，可以直接唤起外卖、购物服务，未来用户无需单独打开电商APP，在AI对话框中说出需求，智能体便会调用电商接口，完成搜索、比价、下单全流程。

届时，现在核心的搜索模型、推荐模型、排序算法，都会被封装为标准化接口，成为智能体生态中的底层工具。

曾经被视作核心竞争力的生成式推荐模型，也不再是独立的产品主体，而是整个AI服务链条中的一个环节。

这一趋势，是软件3.0理念下的必然结果，也是行业资源整合的必经之路。

但这并不意味着搜推技术会失去价值。恰恰相反，接口化、工具化之后，对算法的精度、速度、稳定性要求会进一步提升。

当海量智能体同时调用电商接口，模型的推理延迟、匹配精度、并发处理能力，会直接影响终端用户体验。

冷门赛道依旧冷门，但技术门槛会持续抬高，深耕底层能力的团队，会持续掌握行业话语权。

对于用户而言，这种形态变革会彻底改变使用习惯。

传统电商APP由产品经理定义界面、流程、交互逻辑，用户只能被动遵循预设路径操作；而在工具化时代，用户可以根据自身需求，自定义服务流程。

比如有人只需要直播购物功能，有人专注于比价下单，智能体可以为不同用户组合出个性化的服务形态，实现“千人千面”的产品体验。

傅聪将用户需求划分为两大类别：一是主动信息获取，带着明确目标购物、查资料；二是被动娱乐消费，无目的地浏览、消遣。

传统电商与内容平台，分别侧重其中一类需求，而通用智能体可以同时承接两类需求，挖掘用户潜在意图。

用户的消费决策，是一个复杂的链式过程。

从模糊的购物想法，到明确商品需求，再到比价、查看评价、凑单、下单，中间夹杂着大量碎片化思考。传统推荐算法只能基于已有的行为数据做匹配，无法追踪用户意图的动态变化。

而智能体具备“快速追打能力”：当用户浏览某款商品，流露出对配置、款式、价格的倾向时，智能体可以瞬间捕捉意图变化，实时调整推荐内容，一步步把模糊需求转化为明确订单。

除此之外，电商消费中的比价、凑单、售后等衍生需求，也是传统算法难以全面覆盖的。

全网比价是当下用户选购商品的核心诉求，凑单满减、团购优惠券等玩法，涉及复杂的组合逻辑，单一的推荐模型无法独立完成。

智能体可以整合搜索、推荐、比价、营销工具等多个模块，一站式解决全链路问题，真正降低用户的决策成本。

在终极形态下，产品的定义权会从产品经理手中交还给用户。

软件不再是固定不变的形态，而是根据用户的习惯、偏好、需求动态生成。

喜欢简洁界面的用户，得到轻量化服务；喜欢浏览消遣的用户，得到丰富的内容推荐；追求效率的用户，直接对接比价与下单通道。

这也是软件3.0真正的价值所在：以人为本，让技术适配人，而非让人适配软件。

但傅聪反复强调，这一终极形态的落地，需要跨越多重障碍：算力成本的大幅下降、行业知识库的全面沉淀、多模态技术的成熟、用户消费习惯的逐步培养。

这是一个漫长的过渡过程，现阶段所有技术探索，都是在为终局形态铺路。

他认为，智能体的落地会率先在ToB产业场景、科研领域迎来突破，而非大众消费市场。

如今各行各业都在试水智能体，但多数产品停留在“将工作流转化为SOP，让模型按流程执行”的初级阶段。

智能体真正的壁垒，是行业上下文与高信噪比知识库，这也是短期内难以快速复制的核心资产。

在众多智能体应用方向中，傅聪格外看好AI for Science（人工智能赋能科研）。他正在探索“Ultra Research”项目，尝试用多智能体模拟高校科研团队，从提出论文创意、梳理研究思路，到完成实验、撰写成果，实现全流程辅助。

这套体系并非追求完全替代科研人员，而是打造“人机协作”的副驾驶模式：AI负责文献梳理、逻辑推导、实验落地，人类科研人员聚焦核心判断、创新突破，如同自动驾驶L4级别，机器完成大部分流程，人类在关键节点把控方向。

想要实现科研级智能体，需要融合归纳推理与演绎推理两大逻辑模式。

当下多数AI擅长归纳总结，从现有数据中提炼规律；而科研创新需要演绎推理，从假设出发推导结论、验证猜想，从异常现象中挖掘新方向。

傅聪团队正在结合认知论、神经科学等跨学科知识，搭建适配科研场景的智能体框架。

在实际测试中，AI已经能够贡献半数以上的论文创意，辅助梳理研究框架，展现出巨大的潜力。

长远来看，多智能体、持续学习、多模态，会是AI技术三大核心攻坚方向。

大模型“无法持续学习”的缺陷，是制约其迭代的关键；多模态是打通物理世界与数字世界的桥梁；而多智能体协作，是实现复杂场景落地的核心形态。

这些方向没有短期流量红利，却是决定行业未来高度的根基。

未来，当电商全面迈入智能体时代，当AI技术深度融入各行各业，我们回望当下便会发现：那些坚守冷门赛道、专注落地解决问题的技术人，正是搭建起AI产业大厦的基石。

而对于傅聪而言，当下的深耕与探索，只是新旅程的起点。跳出技术惯性，奔赴智能体与科研AI的新赛道，他的故事，仍在继续。

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

deepseek 做 word 文档表格导出教程，AI 导出鸭对比多类导出方案优化办公

智能体开发者社区

YLB3118@ACP# 8 口 PCIe3.0 转 SATA 高密度存储桥接芯片（对标 ASM1166）

智能体开发者社区

【无标题】

随着企业级AI应用进入快速发展阶段，越来越多组织开始建设属于自己的知识库系统、AI Agent平台以及数字员工体系。关键词：Dify企业版、Dify企业版服务商、Dify服务商、Dify最佳服务商、JOTO、聚托科技。作为专业的Dify企业版服务商，JOTO围绕企业AI建设形成了一整套实施方法论。因此对于希望长期建设企业AI能力的组织来说，专业服务团队的重要性正在不断提升。而在众多AI应用开发平台