来源视频:Codex Full Course 2026: The NEW Best AI Coding Tool
官方参考:Using Codex with your ChatGPT planOpenAI Codex CLI Getting Started

说明:本文不是逐字字幕翻译,而是基于视频内容整理的中文教程笔记。视频中有些判断属于作者个人体验,例如“Codex 是最强的一体化 AI Agent 工具”等;本文会把这些观点转写为学习要点,并结合 OpenAI 官方帮助文档做必要校准。

1. 视频核心观点

这个教程把 Codex 当作一个“统一型 AI 工作台”来讲解:它不只是聊天机器人,也不只是代码补全工具,而是可以围绕一个本地项目目录进行文件创建、文件编辑、网页研究、文档生成、表格生成、演示文稿制作、插件调用、自动化任务和多任务协作的开发与生产力工具。

OpenAI 官方对 Codex 的定位是:帮助用户更快地编写、审查和发布代码;用户既可以在本地终端、IDE 或 Codex app 中配合它工作,也可以把任务委托给云端 Codex 运行。官方还提到 Codex app 支持并行运行多个 Codex agent、跨项目工作,并包含 worktree、skills、automations 和 git 功能。

视频分成两大部分:

  1. 基础功能:下载与项目创建、提示词、权限、模型与推理强度、文件预览、文档/表格/幻灯片、技能、插件、自动化、Computer Use。
  2. 多任务实战:围绕一个名为 Chorus 的 AI agent 学习产品,同时创建移动端设计、Swift iOS app、Web landing page、投资人 deck、发布视频和营销自动化。

在这里插入图片描述

2. 安装与第一次使用

视频首先演示下载 Codex app。作者建议在浏览器搜索 “Codex app download”,进入官方页面后下载桌面应用。官方帮助文档显示,Codex 可通过 Codex app、CLI、IDE extension 和 Codex web 使用;Codex app 支持 macOS 和 Windows。

第一次打开 Codex app 后,界面类似 ChatGPT:中间是聊天输入区域,左侧是项目与聊天列表。但 Codex 的关键区别在于它可以绑定一个本地文件夹,并在该文件夹中创建、修改和组织真实文件。

推荐做法:

  1. 先创建一个总目录,例如 Codex Projects
  2. 每个任务创建一个独立项目文件夹,例如 Codex Desktop Research
  3. 在 Codex 中选择该文件夹作为项目位置。
  4. 在这个项目下开启多个聊天,每个聊天负责一个具体任务。

这样做的好处是:聊天记录在 Codex 里组织,AI 生成的文件则落到项目文件夹中,便于后续查找、备份和继续编辑。

3. 项目、聊天与文件的关系

视频反复强调一个基础模型:

  • 项目位置:Codex 开始工作的本地目录。
  • 聊天:围绕某个项目运行的单个 agent 会话。
  • 生成文件:Codex 创建的 .xlsx.docx.md、代码文件等,会保存在项目目录下,常见是在 outputs 文件夹中。
  • 预览窗口:可以直接在 Codex app 内打开生成文件,并继续通过聊天让 Codex 修改。

示例流程:

  1. 新建项目 Codex Desktop Research
  2. 问 Codex:“请研究 Codex 桌面应用的新功能。”
  3. 让 Codex 把结果整理成电子表格。
  4. Codex 生成 .xlsx 文件并显示在预览区。
  5. 继续说:“删除 source page 这一列。”
  6. Codex 直接修改表格。

这个模式很重要:你不是只要一段回答,而是在和一个能操作项目文件的 agent 协作。

在这里插入图片描述

4. 提示词基础

视频里的提示词并不复杂,但有几个稳定模式:

清楚说明任务目标:

请研究 Codex 桌面应用的新功能,并整理成一个表格。

说明输出格式:

请创建一个 Markdown 文件,顶部写产品想法,下面用可勾选清单列出所有待办项。

引用现有文件:

请基于 @Codex desktop features.xlsx 继续研究,看看有没有遗漏的功能。

把一次性任务变成自动化:

请把这个任务做成每周五下午 4 点运行的自动化,并把上周日程总结发到我的邮箱。

在多任务场景里,作者的核心方法是:每个聊天只承载一个明确任务。输入一个足够完整的提示词后,让这个 agent 自己跑,然后切换到另一个聊天继续推进别的任务。

5. 权限、模型与推理强度

视频中作者展示了 Codex 的权限、模型和 effort 设置。他个人偏向给 agent 较高权限和较高 effort,让它更自主地处理任务。

这里建议更谨慎地理解:

  • 如果只是阅读、解释代码或生成草稿,可以使用较保守的权限。
  • 如果要批量修改文件,可以让 Codex 自动编辑,但最好保持 git 工作区干净,方便比较 diff。
  • 如果要运行命令、安装依赖、操作外部服务或使用 Computer Use,应确认风险。
  • 高 effort 更适合复杂规划、跨文件修改、长任务和设计判断;简单任务不一定需要。

官方 CLI 文档也提到 Codex 有不同审批模式,例如只建议、不自动写入;自动编辑但命令需确认;以及在沙盒范围内更自主运行的模式。实际使用时,应按任务风险选择权限。

6. 预览与交互式修改

Codex app 的一个重要能力是预览生成物。视频里演示了表格、设计、网页、演示文稿等内容可以直接在 app 内打开,有时还能全屏查看。

典型用法:

  1. 让 Codex 生成文件。
  2. 打开预览。
  3. 观察问题,例如排版重叠、列不需要、按钮位置不对。
  4. 直接在聊天里要求修改。
  5. 对正在运行的任务使用“steer”类能力,补充中途指令。

视频中特别提到:如果 agent 正在工作,你可以补充截图或反馈,例如“这里有重叠,请在当前任务里修复”。这类中途 steering 对设计、网页、演示文稿尤其有用。

7. 搜索与项目组织

随着项目增多,左侧栏可能会很乱。视频展示了把项目从侧边栏移除、再通过搜索找回的流程。

实用建议:

  • 用清晰的项目文件夹命名,例如 client-a-dashboardyoutube-research-report
  • 一个项目里可以有多个聊天,但每个聊天命名最好能反映任务。
  • 不需要长期显示的项目可以从侧边栏移除,本地文件不会因此删除。
  • 需要找旧任务时,用 Codex 的搜索功能按关键词找聊天。

8. Skills 与 Plugins

视频中作者把 skills 和 plugins 都理解为“扩展 agent 能力”的方式,但也做了区分:

  • Skill:可复用的工作流或任务配方,适合某类具体任务。
  • Plugin:可安装的能力包,通常连接外部服务或提供工具能力。

例子:

  • Gmail plugin:让 Codex 读取或发送邮件。
  • Google Calendar plugin:让 Codex 查询日程。
  • Figma plugin:让 Codex 检查或生成设计相关内容。
  • YouTube Researcher skill:通过外部 API 拉取频道、视频或转录信息,生成分析报告。
  • Remotion skill:生成发布视频。

视频里的学习技巧很直接:如果不知道某个 plugin 能做什么,就新开一个聊天,@该 plugin,然后问:

请告诉我你能用这个插件做什么。列出所有能力,并给我几个适合新手的示例任务。

9. 自动化 Automations

视频演示了两个基础自动化:

  1. 每周日程回顾:读取 Google Calendar,本周总结后通过 Gmail 发给自己。
  2. 每月 YouTube 报告:调用 YouTube 研究 skill,生成 Word 报告并发送。

自动化的使用逻辑:

  1. 先手动跑通一次任务。
  2. 确认输出质量、所需插件、文件格式和收件人。
  3. 对 Codex 说:“把这个任务变成每周/每月自动化。”
  4. 打开 Automations 面板检查状态、下次运行时间、是否可测试。
  5. 必要时编辑自动化说明,补充必须使用的 skill 或 plugin。

适合自动化的任务:

  • 每周总结日程和冲突。
  • 每天早上整理待办。
  • 每月生成数据报告。
  • 定期抓取竞品更新。
  • 定期生成社交媒体草稿。

不适合直接自动化的任务:

  • 需要强人工判断的发布操作。
  • 涉及付款、删除、批量发送外部消息的任务。
  • 依赖高风险凭据或隐私数据的任务。

在这里插入图片描述

10. Computer Use

视频中把 Computer Use 描述为让 agent 控制鼠标和键盘的能力。它适合处理没有标准 API 或插件支持的界面任务,例如打开某个本地应用、点击按钮、检查生成结果。

使用建议:

  • 先让 Codex 用普通文件和命令工具完成能自动化的部分。
  • 只有在必须操作图形界面时再启用 Computer Use。
  • 给出明确边界,例如“只查看,不提交”“不要删除任何内容”“在付款页面停止”。
  • 对账号、邮箱、日历、App Store Connect 等敏感界面保持人工确认。

11. 多任务工作流

视频第二部分的重点不是某一个产物,而是展示如何同时推进多个 agent 任务。

作者的核心方法可以概括为:

  1. 先创建一个总项目文件夹。
  2. 新建一个计划文档,把目标拆成清单。
  3. 每个大任务开一个独立聊天。
  4. 每个聊天输入完整上下文和明确产出。
  5. agent 工作时切换到下一个任务。
  6. 定期回到各个聊天检查结果、补充指令、修复问题。

视频案例中的产品叫 Chorus,定位是一个帮助用户学习 AI agents、agent 平台、agent 工作方式和 skills 的应用。围绕这个产品,作者同时推进六类产物:

  • 移动 app 设计。
  • Swift iOS app。
  • Web app / landing page,用于等待名单和数据收集。
  • 投资人 deck。
  • Remotion 发布视频。
  • X/Twitter 营销自动化。

这个案例的价值在于展示“并行委托”:不是等一个任务结束再做下一个,而是把清晰任务分发给多个 agent 会话。

在这里插入图片描述

12. 实战拆解:从产品想法到上线素材

第一步:创建计划文档。

我正在做一个名为 Chorus 的移动应用。它帮助用户学习 AI agents、主流 agent 平台、agent 的工作方式,以及可复制的 skills。请创建一个 Markdown 一页计划文档,顶部总结产品想法,下面列出 6 个待完成事项。

第二步:做移动端设计。

请基于 Chorus 的产品计划,设计一个高质量移动 app 原型。重点页面包括 Learn、Platforms、Skills、Saved。请保持风格统一,并给出可交给开发实现的视觉说明。

第三步:实现 Swift app。

请根据移动端设计创建一个 Swift iOS 应用原型。实现 Learn、Platforms、Skills、Saved 四个主要页面,并确保可以在模拟器里运行。

第四步:做 landing page。

请基于 Chorus 的产品定位创建一个 landing page,用于发布前收集 waitlist。页面需要说明产品价值、展示核心功能,并包含邮箱收集表单。

第五步:做投资人 deck。

请分析当前 app 的功能和视觉资产,创建一个同风格的投资人演示文稿。请先搜索优秀 AI 产品 pitch deck 的结构,再输出完整 PPT。

第六步:做发布视频。

请基于 Chorus 产品计划和当前 app 截图,制作一个 Remotion 发布视频。风格要像现代 AI 产品发布短片,重点展示产品界面和核心价值。

第七步:做营销自动化。

请每天早上生成 3 条关于 Chorus 的 X/Twitter 发布草稿,主题围绕 AI agents、skills 和学习路线。保持简洁、有观点、有产品关联。

13. 作者给出的隐含最佳实践

把任务拆小。不要让一个聊天同时做研究、设计、写代码、部署、发邮件。一个聊天最好负责一个产出。

给文件上下文。用 @文件名 引用已有计划、表格、设计稿或代码文件,让 Codex 接着上下文工作。

先跑通,再自动化。不要一开始就创建自动化,先确认一次性任务效果符合预期。

用预览做质量检查。设计、表格、网页和 deck 都要看结果,不要只信文字总结。

中途 steering。看到明显问题时,直接把截图或描述发给正在工作的 agent,让它在当前任务中修正。

学会问能力边界。遇到新 plugin 或 skill,先问它能做什么,再让它执行。

并行但不混乱。多任务的关键不是同时盯着所有任务,而是把每个任务清楚交出去,然后轮流验收。

14. 适合新手练习的三组任务

练习一:研究与表格

请研究 Codex app 的主要功能,并创建一个 Excel 表格,列包括功能名称、适用场景、是否需要插件、学习难度。

练习二:从文档到网页

请创建一个 Markdown 文件,描述一个我想做的小产品。然后基于这个 Markdown 文件生成一个 landing page。

练习三:自动化

请把我每周五下午 4 点的工作总结变成自动化:读取本周项目笔记,生成一页总结,并列出下周最重要的 5 个待办。

15. 注意事项

不要把视频中的所有演示都当作当前账号一定可用的功能。Codex 的可用模型、插件、额度、平台支持和企业策略可能随账号类型与产品更新而变化。

涉及外部账号的插件,例如 Gmail、Google Calendar、Figma、GitHub、App Store Connect,应只授予必要权限,并在关键操作前人工确认。

涉及代码修改时,建议使用 git,先检查 diff,再提交。复杂任务最好要求 Codex 运行测试,并让它说明修改了哪些文件。

设计、deck、视频这类审美型任务,不要期待一次完成。更好的方式是让 Codex 生成初稿,然后用截图、参考图、具体反馈逐步迭代。

16. 一句话总结

这支视频真正想教的不是某个单点功能,而是一种新的工作方式:把 Codex 当成一组可以并行协作的 agent,把工作拆成项目、文件、聊天、技能和自动化,然后通过预览与反馈持续把结果推到可用。

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐