大模型新名词

图灵的达芬奇

491人浏览 · 2025-04-13 11:50:09

图灵的达芬奇 · 2025-04-13 11:50:09 发布

指标	含义
token	token是文本的最小单位。在英文中，token 往往代表一个单词或一个标点符号；在中文中，token 往往代表一个字或词。
samples per second	每秒样本数，是指模型在训练或推理过程中每秒处理的样本数量，即训练时实际吞吐量。计算公式为：*samples/s = BS N / step time**其中，BS为batch size，N为GPU/NPU的数量，step time是在分布式集群中执行完一个BS的时间（秒）。
tokens per second	NLP中常用的吞吐量指标，表示在单位时间内模型能够处理的token数量。用于评估模型的推理或训练性能。计算公式为：tokens/s = token len / cost time其中，token len为处理的文本中token的数量，cost time 为处理时间。
TFLOPs	FLOPs是Floating-point Operations Per Second的缩写，代表每秒所执行的浮点运算次数。往往用TFLOPs衡量计算能力，即每秒执行万亿次浮点运算。
TP	大模型训练时的并行策略，张量并行。可以将大模型的张量拆分为多个小块，分散到多个设备上，从而加快训练和推理的速度。详细可参考：https://zhuanlan.zhihu.com/p/581677880
PP	大模型训练时的并行策略，流水线并行。可以将模型的层或模块划分为多个阶段，并在不同的设备上并行执行这些阶段，从而提高计算效率和吞吐量。详细可参考：https://zhuanlan.zhihu.com/p/581677880
prompt	Prompt是一种由模型使用方提供的文本片段，用于在推理时引导大模型生成特定的输出。
cost time (或Inference time)	推理时间，指完成一次推理过程所需的总时间。包括加载模型、预处理输入、模型推理计算和后处理等步骤。耗时越短，意味着模型推理速度越快。

https://bbs.huaweicloud.com/blogs/416186

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla