DeepSeek创始人梁文锋60条思考,句句珠玑,值得反复阅读!
最近DeepSeek的热度持续攀升,超预期的产品体验带来了口碑裂变。它背后的创始人梁文锋,更是个神秘又厉害的人物!虽然公开报道不多,但扒到他两次接受《暗涌》专访的宝藏内容,整理出他60条超燃的思考,带你一起窥探DeepSeek成功的底层逻辑!这60条思考,不仅揭示了DeepSeek的技术方向,更展现了AGI(通用人工智能)的未来图景,带你一探究竟。梁文锋的思考不仅展现了DeepSeek的技术野心,
·
最近DeepSeek的热度持续攀升,超预期的产品体验带来了口碑裂变。
它背后的创始人梁文锋,更是个神秘又厉害的人物!
虽然公开报道不多,但扒到他两次接受《暗涌》专访的宝藏内容,整理出他60条超燃的思考,带你一起窥探DeepSeek成功的底层逻辑!
这60条思考,不仅揭示了DeepSeek的技术方向,更展现了AGI(通用人工智能)的未来图景,带你一探究竟。

DeepSeek创始人梁文锋的60条思考精华整理
关于AGI与技术方向
- 我们做大模型,跟量化和金融都没有直接关系。我们要做的是通用人工智能,也就是AGI。
- 语言大模型是通往AGI的必经之路,并且初步具备了AGI的特征,所以我们从这里开始。
- 我们不会过早设计基于模型的一些应用,会专注在大模型上。从长期看,大模型应用门槛会越来越低,初创公司在未来20年任何时候下场,也都有机会。
- 我们理解人类智能的本质就是语言,人的思维就是一个语言的过程。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)。
- 只做复刻的话,可以在公开论文或开源代码基础上,只需训练很少次数,甚至只需finetune(微调)一下,成本很低。而做研究,要做各种实验和对比,需要更多算力,对人员要求也更高,所以成本更高。
- 我们希望更多人,哪怕一个小App都可以低成本去用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断。大厂的模型,可能会和他们的平台或生态捆绑,而我们是完全自由的。
- 从商业角度来讲,基础研究是投入回报比很低的。我们比较确定的是,既然我们想做这个事,又有这个能力,这个时间点上,我们就是最合适人选之一。
关于算力与好奇心
- 从最早的1张卡,到2015年的100张卡、2019年的1000张卡,再到10000张,这个过程是逐步发生的。很多人会以为这里边有一个不为人知的商业逻辑,但其实,主要是好奇心驱动,对AI能力边界的好奇。
- 对很多行外人来说,ChatGPT这波浪潮冲击特别大;但对行内人来说,2012年AlexNet带来的冲击已经引领一个新的时代。虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的。
- 一件激动人心的事,不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。
- 人工成本是对未来的投资,是公司最大的资产。我们选的人相对朴实一点,有好奇心,来我们这里有机会去做研究。
- 我们招人有条原则是,看能力,而不是看经验。如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性与热爱等更重要。
- 我们的核心技术岗位,基本以应届和毕业一两年的人为主。没有经验的人,会反复摸索、很认真去想应该怎么做,然后找到一个符合当前实际情况的解决办法。
- 我们招人的条件是热爱,这些人的热情通常会表现出来,因为他真的很想做这件事,所以这些人往往同时也在找你。
- 我们的考核标准和一般公司不太一样。我们没有KPI,也没有所谓的任务。
- 创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。
- 招人时确保价值观一致,然后通过企业文化来确保步调一致。我们并没有一个成文的企业文化,因为所有成文的东西,又会阻碍创新。
- 按照教科书的方法论来推导创业公司,在当下,他们做的事,都是活不下来的。真正的决定力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。
- 最让我们兴奋的是去搞清我们的猜想是不是事实,如果是对的,就会很兴奋了。
- 信仰者会之前就在这里,之后也在这里。他们更会去批量买卡,或者跟云厂商签长协议,而不是短期去租。
- 创新是昂贵且低效的,有时候伴随着浪费。所以经济发展到一定程度之后,才能够出现创新。
- 这个世界存在很多无法用逻辑解释的事,就像很多程序员,也力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。
关于未来与创新
- 我们不会闭源,我们认为先有一个强大的技术生态更重要。
- 我们短期内没有融资计划,我们面临的问题从来不是钱,而是高端芯片被禁运。
- 更多的投入并不一定产生更多的创新,否则大厂可以把所有的创新包揽了。
- 我们认为当前阶段是技术创新的爆发期,而不是应用的爆发期。长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出。
- 如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。
- 技术没有秘密,但重置需要时间和成本。英伟达的显卡,理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间。
- 提供云服务不是我们的主要目标,我们的目标是去实现AGI。
- 大厂有现成的用户,但它的现金流业务也是它的包袱,也会让它成为随时被颠覆的对象。
- 大模型创业公司可能活下来2到3家。现在都还处在烧钱阶段,那些自我定位清晰、更能精细化运营的,更有机会活下来。
- 我经常思考的是,一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高,就是成立的。
- 我们发布的V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但我们能自己打造这样的人。
- DeepSeek也全是自下而上的。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。
- 我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。
- 我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。
- 创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。
- 我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。
- OpenAI不是神,不可能一直冲在前面。
- AGI可能是2年、5年或者10年,总之会在我们有生之年实现。我们对一切可能性都保持开放。
- 未来会有专门公司提供基础模型和基础服务,会有很长链条的专业分工。
- 我主要的精力在研究下一代的大模型,还有很多未解决的问题。
- 所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式,很可能是一种刻舟求剑。
- 我们经历了一个漫长的积累过程,外部看到的是幻方2015年后的部分,但其实我们做了16年。
- 未来中国产业结构的调整,会更依赖硬核技术的创新。
- 未来硬核创新会越来越多,现在还不容易被理解。当这个社会让硬核创新的人功成名就,群体性想法就会改变。
梁文锋的思考不仅展现了DeepSeek的技术野心,更揭示了AGI的未来图景。期待DeepSeek在AGI领域的更多突破!🚀
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)