先大概说一下AI Infra的岗位类型,再根据岗位类型,讲一些不同岗位的侧重点。目前所有大厂的AI Infra岗位大概有这些。

算子开发(CUDA算子)

这类岗位在阿里、腾讯、字节这些大厂都有,有些厂商是一个大组就是纯做算子开发的,有些厂商的算子开发则分布于不同部门的训练\推理团队,这种团队的人一般除了算子开发,也会做一些训练或者推理的开发,算子开发是由于训练和推理优化过程中需要的。除了大厂,就是芯片公司,比如NV、AMD、或者国内的芯片公司。大厂的这些算子开发目前来说无外乎attention、moe、量化这几类,但其实水都比较深,入门壁垒还是比较高的。

算子优化这个岗位,面试的时候更侧重高性能计算之类的,手撕代码的时候也可能会手撕一些类似softmax类算子、gemm类算子,再逐个深入问这些优化点。另外面试里的问题会结合你所做过的项目,深入问细节,比如你做的attention优化,会往深里问你不同架构的优化细节、优化方式等。

这个方向,社招没做过的话,不大可能转,也无需准备,做过这个方向的,一般水平不会差;校招一般很少做过这些(这里指的是一般情况,目前也看到一些高校的论文如SageAttention等),那么校招的打好基础即可。推荐大概有如下方式打打基础:

  1. 熟悉一些cuda element算子的高效编写,需要注意的是,triton或者tilelang如何实现这些,以及底层的编译器是怎么做的,可以好好学习学习;
  2. 尝试自己用cuda和cutlass写一个flash attention算子或者pageattention算子等,从中学习里面的一些优化、不同架构的不同指令集特点(安培、hopper),内存的搬运、数据的layout、bank冲突和解决方法等;
  3. 尝试用cuda和cutlass写一个反量化算子,去领略如何用cutlass实现一个高效的反量化算子。

通信优化

如NV的NCCL、月之暗面的TransferEngine、Deepseek的DeepEP等,云厂商比较特殊一点,会结合机器的拓扑和路由的硬件设计去做通信优化,俗称xCCL,比如阿里的ACCL、腾讯的TCCL等。

这块几年前主要是云厂商做xCCL的优化,属于集合通信内的范畴,其实方向比较”窄“。今年由于大EP以及PD分离的普及,使得通信优化可以在框架层用的更多。另外今年的一些通信计算重叠的工作,也开始多起来,主要是通过算子融合的方式实现通信计算融合。

其实这一块也算比较硬核的,比如通信计算重叠这种属于结合了算子和通信这两块。

类似的结论,社招的如果没有经验的话,大概率无法面试获得这个岗位,有经验的话大概率也不会差;对于校招来说,其实可以好好学一下好好准备。

关于算子优化和通信优化,笔者的看法如下:

  1. 只要从事AI Infra方向,这两个方向肯定也是要深入去学习了解,即便不开发这些内容,去查相关问题、以及性能调优,基本逃不开;
  2. 对于校招且想从事AI Infra,建议好好学习,一方面确实是基础,另一方面,这两个方向确实需要耐下心来好好研究,在校园里,有一定的自由时间,不像上班,时间被需求挤满;
  3. 个人觉得从事这两个方向,确实属于比较深入的方向,一件事一旦深入变不一定广,所以励志从事这两个方向的,需要的是耐得住寂寞,在一个”窄“的领域深耕。

img

推理框架优化

从事这类工作的有大厂的推理团队(一个大厂往往有多个推理团队),以及芯片厂商的生态开发者。另外还有一类特殊的开源框架(vLLM、SGLang等)的贡献者,由于这部分人通常也是在大厂或者芯片厂商,这里不再过多分析。

大厂的推理团队主要还是推理框架的优化,无论vLLM和SGLang现在生态多么成熟,这些大厂总能找到适合自己场景的优化手段,最终性能比开源框架好一些,然后去和主子报祥瑞。

img

芯片厂商的生态开发者,主要是结合自己的芯片特点,适配vLLM或者SGLang等。

关于推理的面试,说实话,就是看硬实力了,抛出开源框架的一些功能,每一家都有自己框架的一些主攻特色,然而,随着推理生态的日益成熟,信息差越来越少,面试拼的就是硬实力了。应届生的话,找一个框架,对着文档去一个个读它的特性,看看release的功能列表,尝试从使用场景、实现手段以及优缺点,结合代码去看即可,这里举个简单的例子。

vLLM最近出了一个序列并且,社区关于这个有一个设计文档很详细、也参考了一些论文,结合文档、论文和代码,自己跑一跑,去尝试着分析分析。

打字太累,还有几个方向,等有人催更再补充吧,先把坑留下。感觉字写多了,也没什么用,只是个数字而已,不一定真能帮上读者。

img

DIT推理方向

训练框架优化

RL Infra优化

MaaS平台服务

DIT推理方向

训练框架优化

RL Infra优化

MaaS平台服务

大模型平台

如果你也想系统学习AI大模型技术,想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习*_,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。
为了帮助大家打破壁垒,快速了解大模型核心技术原理,学习相关大模型技术。从原理出发真正入局大模型。在这里我和MoPaaS魔泊云联合梳理打造了系统大模型学习脉络,这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码免费领取🆓**⬇️⬇️⬇️

在这里插入图片描述

【大模型全套视频教程】

教程从当下的市场现状和趋势出发,分析各个岗位人才需求,带你充分了解自身情况,get 到适合自己的 AI 大模型入门学习路线。

从基础的 prompt 工程入手,逐步深入到 Agents,其中更是详细介绍了 LLM 最重要的编程框架 LangChain。最后把微调与预训练进行了对比介绍与分析。

同时课程详细介绍了AI大模型技能图谱知识树,规划属于你自己的大模型学习路线,并且专门提前收集了大家对大模型常见的疑问,集中解答所有疑惑!

在这里插入图片描述

深耕 AI 领域技术专家带你快速入门大模型

跟着行业技术专家免费学习的机会非常难得,相信跟着学习下来能够对大模型有更加深刻的认知和理解,也能真正利用起大模型,从而“弯道超车”,实现职业跃迁!

在这里插入图片描述

【精选AI大模型权威PDF书籍/教程】

精心筛选的经典与前沿并重的电子书和教程合集,包含《深度学习》等一百多本书籍和讲义精要等材料。绝对是深入理解理论、夯实基础的不二之选。

在这里插入图片描述

【AI 大模型面试题 】

除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。

【大厂 AI 岗位面经分享(92份)】

图片

【AI 大模型面试真题(102 道)】

图片

【LLMs 面试真题(97 道)】

图片

【640套 AI 大模型行业研究报告】

在这里插入图片描述

【AI大模型完整版学习路线图(2025版)】

明确学习方向,2025年 AI 要学什么,这一张图就够了!

img

👇👇点击下方卡片链接免费领取全部内容👇👇

在这里插入图片描述

抓住AI浪潮,重塑职业未来!

科技行业正处于深刻变革之中。英特尔等巨头近期进行结构性调整,缩减部分传统岗位,同时AI相关技术岗位(尤其是大模型方向)需求激增,已成为不争的事实。具备相关技能的人才在就业市场上正变得炙手可热。

行业趋势洞察:

  • 转型加速: 传统IT岗位面临转型压力,拥抱AI技术成为关键。
  • 人才争夺战: 拥有3-5年经验、扎实AI技术功底真实项目经验的工程师,在头部大厂及明星AI企业中的薪资竞争力显著提升(部分核心岗位可达较高水平)。
  • 门槛提高: “具备AI项目实操经验”正迅速成为简历筛选的重要标准,预计未来1-2年将成为普遍门槛。

与其观望,不如行动!

面对变革,主动学习、提升技能才是应对之道。掌握AI大模型核心原理、主流应用技术与项目实战经验,是抓住时代机遇、实现职业跃迁的关键一步。

在这里插入图片描述

01 为什么分享这份学习资料?

当前,我国在AI大模型领域的高质量人才供给仍显不足,行业亟需更多有志于此的专业力量加入。

因此,我们决定将这份精心整理的AI大模型学习资料,无偿分享给每一位真心渴望进入这个领域、愿意投入学习的伙伴!

我们希望能为你的学习之路提供一份助力。如果在学习过程中遇到技术问题,也欢迎交流探讨,我们乐于分享所知。

*02 这份资料的价值在哪里?*

专业背书,系统构建:

  • 本资料由我与MoPaaS魔泊云的鲁为民博士共同整理。鲁博士拥有清华大学学士美国加州理工学院博士学位,在人工智能领域造诣深厚:

    • 在IEEE Transactions等顶级学术期刊及国际会议发表论文超过50篇
    • 拥有多项中美发明专利。
    • 荣获吴文俊人工智能科学技术奖(中国人工智能领域重要奖项)。
  • 目前,我有幸与鲁博士共同进行人工智能相关研究。

在这里插入图片描述

内容实用,循序渐进:

  • 资料体系化覆盖了从基础概念入门核心技术进阶的知识点。

  • 包含丰富的视频教程实战项目案例,强调动手实践能力。

  • 无论你是初探AI领域的新手,还是已有一定技术基础希望深入大模型的学习者,这份资料都能为你提供系统性的学习路径和宝贵的实践参考助力你提升技术能力,向大模型相关岗位转型发展

    在这里插入图片描述在这里插入图片描述在这里插入图片描述

抓住机遇,开启你的AI学习之旅!

在这里插入图片描述

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐