浙江大学朱强:DeepSeek技术溯源及前沿探索
如今,DeepSeek引领了一波新热潮,通过大规模强化学习模拟类人推理和决策过程,极大地推动了从生成大模型【系统1】到推理大模型【系统2】的转变,为新一代智能体提供了技术支撑。浙江大学计算机科学与技术学院教授,博导,国家百千万人才工程入选者,浙江省特聘专家,浙江大学“求是工程岗”获得者,中国人工智能学会人机融合智能专委会副主任委员,人工智能省部共建协同创新中心(浙江大学)科研与校企合作主管。以下为
DeepSeek技术溯源及前沿探索
报告嘉宾:朱强
浙江大学计算机科学与技术学院教授,博导,国家百千万人才工程入选者,浙江省特聘专家,浙江大学“求是工程岗”获得者,中国人工智能学会人机融合智能专委会副主任委员,人工智能省部共建协同创新中心(浙江大学)科研与校企合作主管。
报告摘要
本报告将从技术脉络出发,探讨DeepSeek的起源和演化。语言模型以理解和生成语言为核心,经历了从传统统计方法到以Transformer为基础的演变,后者通过自注意力机制革新了语言建模。而ChatGPT通过大规模预训练与人类反馈对齐,推动生成式AI走向实用。如今,DeepSeek引领了一波新热潮,通过大规模强化学习模拟类人推理和决策过程,极大地推动了从生成大模型【系统1】到推理大模型【系统2】的转变,为新一代智能体提供了技术支撑。这些技术演变不仅推动了未来产业的智能化升级,也将深刻影响人机交互、创新应用和社会结构。
来源:浙江大学DeepSeek系列专题线上公开课
以下为朱老师分享PPT全文,Edge AGI微信公众号后台回复:20250417,即可下载朱老师分享PPT。

















































Edge AGI微信公众号后台回复:20250417,下载完整版PPT。
港科大和伦敦大学团队联合发布软硬协同设计的边缘语言模型PLM,把MLA和稀疏激活带到端侧!
感谢阅读!
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐

所有评论(0)