通用AI大模型几乎能“看懂”当今世界主流的信息传播媒介:照片、文字、视频、语音。。。但是一旦换成 CAD 3D 模型,AI 几乎瞬间“傻”掉,搞不懂了。

不是因为它不够聪明,而是——
CAD 模型不是给 AI 准备的。

它不是像图片一样是连续像素,也不是像语言一样是离散符号。CAD模型是一种纯工程语言。

它包含几何形状、拓扑关系、特征语义、参数依赖、装配关系……
所有这些彼此交织在一起,没有统一的形式,也没有统一的接口,更没有统一的抽象。

要让 AI 理解 CAD 3D 模型,必须先把它转成“图结构(Graph)”

1. 为什么 AI 不能直接理解 CAD?

我们先看 AI 擅长什么学习:

  • 图像:二维像素矩阵;

  • 视频:像素序列;

  • 文本:Token 序列;

  • 音频:时间序列。

它们都有共同点:

  • 格式统一;

  • 信息结构连续;

  • 可以被排列、分块、建索引;

  • 深度学习能直接做卷积/注意力。

但 CAD 完全不同,一个最简单的 CAD 模型,内部可能包含:

  • 数十种几何类型:圆弧、NURBS、扫掠、放样。。。;

  • 上千条拓扑结构:edge、face、loop、shell;

  • 特征树:凸台、倒角、筋、扫掠、切除;

  • 参数依赖:尺寸 → 草图 → 特征 → 体;

  • 制造意图:加强、过渡、配合、定位;

  • 装配关系:配合、约束、接口面。

这些信息不是线性的,也不是连续的,而是“网状互相关联的”。

AI 若直接吃 CAD 模型,会遇到两个致命问题:

1)信息太复杂,无法统一成张量

深度学习所有输入都必须是 Tensor,但 CAD 是:

  • 几何是浮点数集;

  • 拓扑是邻接关系;

  • 特征是树结构;

  • 参数是约束系统;

  • 装配是图结构。

这根本没办法直接塞进神经网络。

2)信息之间充满“语义依赖”

比如一个简单倒角:

  • 倒角依赖边;

  • 边依赖面;

  • 面依赖相邻面;

  • 相邻面决定模型特征;

  • 特征决定制造方法。

这些都不是孤立的,而是联动的。

AI 必须同时看到结构与关系,这就是图结构的意义。

2. 为什么是“图结构”?

因为图结构是唯一能同时表达几何 + 拓扑 + 特征的方式。

图结构不是指绘图,而是指:

  • 节点(Node):代表模型的基本元素;

  • 边(Edge):代表元素之间的关系;

  • 属性(Attributes):描述节点和边的各种信息。

把 CAD 转成 Graph,本质是把工程师眼里“复杂的 3D 模型”拆成:

由很多节点组成、节点之间有明确关系、结构清晰、可遍历、可学习的网络。

可以把图结构简单理解为把 CAD 模型拆成能“越看越懂”的工程地图。

1)节点 = 工程对象

  • 点、边、面;

  • 特征(孔、筋、倒角、腔体);

  • 子装配、接口面;

  • 甚至“功能语义”(加强、定位、导向)。

AI 可以像阅读“零件字典”一样理解节点。

2)边 = 工程关系

  • 面与面相邻;

  • 边属于哪个面;

  • 特征依赖哪条边;

  • 倒角影响哪些面;

  • 扫掠轨迹关联哪些几何;

  • 装配面配合关系。

AI 通过边能理解结构逻辑,而不是死记形状。

3)属性 = 几何与参数

  • 面的类型(平面/曲面/NURBS);

  • 半径、角度、曲率;

  • 特征的尺寸参数;

  • 材料、容差、制造语义;

  • 装配方向、基准约束。

这让 AI 不只看结构,还能理解“细节与目的”。

3. 图结构的价值

AI 能通过“关系”理解模型,而不是靠表面形状猜。

工程师看 CAD 部件,不是先看形状,而是看关系和意图

  • 这两个面为什么平行?

  • 这个孔为什么放在这里?

  • 这个筋为什么这么布置?

  • 为什么这个倒角是 R2而不是R5?

  • 为什么用加强?为什么留工艺槽?

AI 想学会“工程师的眼光”,必须能看到这些关系,而这些“关系”天然就是图结构。

所以图结构之于 CAD AI,就像骨骼之于人体:

几何是皮肤,拓扑是骨架,特征是肌肉,参数是神经,而图结构是整个系统的连接方式。

没有图结构,AI 就永远只是在“看形状”,永远无法理解工程逻辑,更不可能做“工程设计智能化”。

4. 为什么只有图结构才行?

有人会问:
“既然 3D 机器视觉那么强,为什么不用 mesh 或点云让 AI 学?”

原因很简单:

数据类型 AI 能不能看懂 能不能表达工程语义
点云 没有拓扑
三角网格 没有特征、没有制造意图
体素 粗糙、丢失几何细节
三角网格细分 丢失参数、约束、特征语义
图结构 唯一能表达几何+拓扑+特征+参数

mesh 和点云只有“长得像”,但没有“为什么这样设计”。

AI 想自动做以下任务:

  • 自动识别孔/槽/筋/倒角;

  • 自动分类零件类型;

  • 自动提取标准件;

  • 自动找结构相似度;

  • 自动推断设计意图;

  • 自动生成替代设计方案;

  • 。。。

没有图结构都是做不到的。

因为这些都不是形状识别问题,而是结构与语义问题

5. 图结构让 AI 的推理方式变得“像工程师”

当 AI 输入的是 Graph,它能做的推理就变成:

  • “这个面与那个面相邻,因此这个倒角可能是工艺过渡。”

  • “这两个孔在同一基准上,因此可能是对称排布。”

  • “这个筋连接两个薄壁,因此用于加强。”

  • “这是一组典型加强肋图案,属于冲压件特征。”

  • “这个圆柱体连接方式类似标准件,可以复用。”

这不是“看几何”,而是“看逻辑”,也就是工程师真正关心的东西。

6. Graph 让 AI 能学习的东西远超出几何本身

一旦 CAD 被转成图结构,AI 就能学习:

1)几何模式

        圆角为什么放这里?
        筋为什么这样布置?
        孔为什么这样对齐?

2)拓扑规律

        哪些面永远成对出现?
        哪些结构是成套的?
        哪些关系意味着“设计意图”?

3)特征语义

        这是加强?
        是对齐?
        是导向?
        是过渡?

4) 参数依赖

        修改尺寸时哪些会跟着变?
        哪些维度绝对不能动?

5)功能语义

        这是支撑?
        承力?
        定位?
        隔热?
        密封?

这些是所有真正想做 CAD AI 的工程师最想解决的问题,而所有这些能力,都建立在图结构之上。

CAD ≠ 形状。CAD = 结构 + 关系 + 特征 + 意图。

图结构,是唯一能把这些全部抽象出来的数学形式。

你让 AI 看几何,它只能“猜”。
你让 AI 看拓扑,它只能“分析”。
你让 AI 看图结构,它才能“理解”。

未来所有对 CAD 进行 AI 推理的系统,不管是否愿意,都必须走向图结构,这是工程数据本身的规律决定的。

当 CAD 被转换成图结构之后,AI 才真正具备了理解 3D 工程世界的基础——
不是记住形状,而是理解逻辑;
不是识别几何,而是抓住意图;
不是看见零件,而是看懂设计。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐