DeepSeek相关论文合集(评论补充)
关于DeepSeek公司发布的核心论文及其创新点的梳理
·
目录
相关链接:
解读视频:逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”_腾讯新闻
论文解读文章:
一文搞懂DeepSeek的技术演进之路:大语言模型、视觉语言理解、多模态统一模型
【技术报告解读】Deepseek-R1的初代藕身——Deepseek-LLM展示长期主义的硬核浪漫
【技术名词解读】Deepseek-LLM技术报告配套名词解读
论文链接:
| 时间 | 论文 | 类型 | |
|---|---|---|---|
| 2024年1月5日 | 基座模型与架构创新:《DeepSeek LLM: Scaling Open-Source Language Models with Longtermism》 https://arxiv.org/pdf/2401.02954DeepSeek | 语言优化 | |
| 2024年1月6日 | 《DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models》 https://arxiv.org/pdf/2401.06066 | ||
| 2024年1月26日 | 代码与推理能力突破:《DeepSeek-Coder: When the Large Language Model Meets Programming - The Rise of Code Intelligence》 https://arxiv.org/pdf/2401.14196 | 编程领域 | |
| 《DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models》 https://arxiv.org/pdf/2402.03300 | |||
| 2024年3月11日 | 《DeepSeek-VL: Towards Real-World Vision-Language Understanding》 https://arxiv.org/pdf/2403.05525 | 视觉语言 | |
| 2024年6月19日 | 基座模型与架构创新:《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》 https://arxiv.org/pdf/2405.04434 | ||
| 2024年6月17日 | 代码与推理能力突破:《DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence》 https://arxiv.org/pdf/2406.11931v1 | 编码壁垒 | |
| 2024年5月114日 | 定理证明与逻辑推理:《DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data》 https://arxiv.org/pdf/2405.14333 | ||
| 2024年8月15日 | 定理证明与逻辑推理:《DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search》 https://arxiv.org/pdf/2408.08152 | ||
| 2024年12月27日 | 基座模型与架构创新:《DeepSeek-V3 Technical Report》 https://arxiv.org/pdf/2412.19437 | ||
| 2025年1月22日 | 代码与推理能力突破:《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》 GitHub - deepseek-ai/DeepSeek-R1 |
更多推荐
所有评论(0)