【值得收藏】图神经网络完全指南:从图拉普拉斯到图卷积的核心原理
摘要:本文系统阐述了图神经网络(GNN)的理论基础,重点介绍了图拉普拉斯矩阵的特征分解及其物理意义,包括特征向量反映节点相关性、特征值表示图频率。详细解释了图傅里叶变换的概念及其与经典傅里叶变换的异同。在卷积操作部分,阐明了谱域卷积的原理和实现方法,提出通过多项式逼近(特别是切比雪夫多项式)来降低计算复杂度,并分析了其优势。最后总结了图神经网络通过聚合邻居信息和组合自身特征来更新节点表征的基本框架
文章系统介绍了图神经网络(GNN)的理论基础,包括图拉普拉斯矩阵的特征值与特征向量的物理意义,图傅里叶变换的概念,以及图卷积操作的原理。详细解释了如何在图结构上实现卷积操作,包括谱域卷积和多项式近似方法,最后介绍了图神经网络的一般框架,即通过聚合邻居信息和组合自身信息来更新节点表征。
一、准备知识
1.图拉普拉斯矩阵
图拉普拉斯矩阵是实对称半正定阵,其特征向量构成了一组完备的正交基。在该基的作用下,拉普拉斯矩阵L能被对角化:

其中,
为特征向量构成的正交矩阵,满足;特征值则构成对角矩阵
。
-
特征向量:对应于变量之间多个协同变化模式。每个特征向量仅在其代表的模式下揭示节点间的相关性或社区结构。在这些模式下,分量相近的节点表示高度相关,而在其他模式下,这种关系未必成立。实际信号在各个特征向量上的具体投影(即傅里叶系数)才决定了这些模式在信号中的具体表现。特征向量和投影系数的结合,全面反映了信号在图结构下的变量相关性。
-
特征值:反映了特征向量所代表模式的“频率”或变化强度(相邻节点分量数值差异)。特征值越小,对应的特征向量在图上越平滑[2],常用于揭示社区等全局结构;特征值越大,对应的特征向量变化剧烈,常用于描述边界、局部异常等细粒度特征。因此,特征值不仅刻画了模式的平滑度,也为信号的多尺度分析和滤波等操作提供了理论基础。
-
图频率:定义为单位能量信号沿着图模型各边产生的加权数值波动强度,其公式为:

**因此,****特征值被称之为图频率[3]。图频率越大,相连节点的数值起伏越剧烈。**图频率是图结构下相邻节点信号变化“剧烈程度”的度量,可用于理解和处理图信号与特征。
- 物理意义:第一个特征向量(
对应常数向量
)反映图的连通性(0特征值数与图连通块数相等,如只有1个0特征值,整个图是连通的);低特征值对应的特征向量描述社区、局部高度相关的分区;中高特征值对应的特征向量描述信号在细粒度、边界、局部异常等空间结构。**** - 实际应用:社区划分、聚类、降维中,经常用小特征值对应的特征向量捕捉主要的结构分组。例如:谱聚类就是用前
个小特征值对应的特征向量,把节点投影到
维谱空间,再在这个空间里用传统聚类方法(如k-means)划分社区或组别。另外,要注意特征值的大小与信号能量的大小无关(特征值小≠能量小)。特征值大小仅与对应模式(特征向量)下相邻节点数值变化强度相关,能量大小表征为信号在特征向量上的投影系数(傅里叶系数)。****
2. 图傅里叶变换
图傅里叶变换本质上是将图信号(定义在节点上的观测值)在图拉普拉斯正交特征向量基[4]下展开,实现对信号不同频率成分的分解。其定义为:

其中,𝐱为原始信号,𝐱̂为其谱域表示。图傅里叶变换不仅具备正交性,更重要的是拉普拉斯特征向量能从不同尺度和角度反映图结构特征,如节点相关性、社区结构等。基于特征向量正交基,图傅里叶变换能够揭示信号在低频(全局平滑)、高频(局部剧烈变化)下的能量分布,支持对信号的局部变化、传播特性、滤波和去噪等操作。尽管与经典傅里叶变换中的频率(经典频率:时间或空间轴上的振荡快慢)概念不同,两者本质上都用于刻画信号的多尺度变化特征[3],并在低频/高频分量上分析信号的结构与能量分布。
二、图卷积
1. 时域卷积回顾
给定两个时域信号(函数),两者卷积公式如下:

(3)式对应的操作是:①滤波器函数𝑔(𝑥)先执行翻转和平移变成
;②
与𝑓(𝑥)逐点相乘再累计求和(连续函数则对应积分);③前一步在平移位置**处对应的累计求和得到的值记为𝑦(𝑡),不断地执行类似的操作,最终形成了两个时域信号(函数)的卷积函数。下图展示了在𝑡=1处的卷积操作。**********

图1. 𝑓(𝑥)与𝑔(𝑥)在𝑡=1的卷积示意图
图1显示滤波器函数𝑔(𝑥)对原始信号进行了过滤。如𝑡=1时刻𝑓(𝑥)仅能保留少量数据,因为𝑔(𝑥)在大部分位置处输出为0,两者相乘使大部分值被丢弃。因此,基于滤波器,卷积操作能得到:
- 滤波效果:如果𝑔(𝑥)是一个低通滤波器,卷积信号则过滤掉了高频成分;反之亦然;
- 平滑增强:常见的移动平均卷积可以抑制数据噪声,零均值白噪声经过相加可以相互抵消;
- 系统响应::𝑔(0)表示系统对当前时刻𝑡输入的瞬时冲击响应;𝑔(𝑡−𝑥)表示在过去时刻𝑥的输入,经过(𝑡−𝑥)时间延迟后,到当前时刻𝑡=𝑥+(𝑡−𝑥)的系统的残留响应。因此,对时刻𝑡输入的响应包括:当前的瞬时响应与所有历史输入的残留响应之和,即𝑦(𝑡)=𝑓(𝑡)𝑔(0)+𝑓(𝑡−1)𝑔(1)+⋯𝑓(0)𝑔(𝑡)。这就是卷积在信号系统中的物理意义;
因此,时域卷积就是让一个信号当滤波器去“加工”另一个信号。结果要么平滑、要么强化某些特征,具体取决于所选择的滤波器。
2.图卷积操作
由于图信号具有不规则结构特征,节点之间没有固定顺序,邻居关系完全取决于拓扑连接,因此图数据本质上不具备平移对称性。在时域或空间数据中,卷积核可以通过“滑动窗口”方式提取局部特征,但在图结构下,由于缺乏有序的轴和统一的邻域定义,经典的滑窗卷积无法直接应用。
幸运的是,图拉普拉斯特征向量构成的正交基为我们提供了通用的变换域工具。通过域的转换(图傅里叶变换),原时域的卷积被转换为频域的乘积(卷积定理)。在由基张成的频域空间中,每个频率成分对应的基向量(特征向量)都代表了信号在某种结构模式(如社区、边界、局部团块等)下的变化特征。使用这些基向量,任意节点信号都可以被分解为一系列反映不同变化尺度(即特征值/“频率”)的模式成分。而参数化乘积可以方便地调整不同频率的分量,从而灵活实现滤波与特征提取。与此同时,傅里叶逆变换也为解析 图信号的时域卷积(如:邻居特征聚合+自身特征组合)提供了方便之门。因此,尽管图结构无法定义传统的时域卷积,但基于傅里叶变换的谱域卷积,让我们可以很方便地在频域中实现时对信号类似的处理。
具体而言,谱域卷积操作流程如下:
1)傅里叶变换: 将节点信号映射到谱频域(即按照特征向量基展开);
2)构建滤波器函数:对各频率分量乘以相应的“滤波器函数”𝑔(𝜆)(滤波
器直接在特征值/频率上定义);
3)傅里叶逆变换:将调整后的频域信号还原回时域,得到滤波与特征提
取后的结果。
上述步骤用公式表达为:

其中,根据(2)式可知,UT 是傅里叶变换矩阵,U 是相应的逆变换矩阵,𝑔𝜃 (𝚲)是作用在各个图频率(特征值)上的滤波函数(𝜃为函数参数)。之所以将滤波器设置为特征值(图频率)的函数,是为了基于特征值的相对大小,对信号的各频率成分进行灵活且精确的调整。而直接参数化滤波器会丧失物理可解释性和频率可控性。通过设计不同的滤波函数,可以突出全局结构(低通滤波)或提取局部异常(高通滤波)等,实现多尺度的结构化图信号处理。因此,图卷积本质上是基于谱域滤波的特征提取方式,巧妙地将结构信息融入深度学习中,使得神经网络能够有效应对复杂图结构数据。
- 图卷积计算的近似
⑴ 近似计算的必要性
首先,图卷积的谱方法需要对拉普拉斯矩阵进行特征分解,其计算复杂度为𝒪(𝑛3)(n 为节点数)。即便仅提取前k 个特征向量,复杂度仍为𝒪(𝑘𝑛2),这对大规模图几乎不可行;其次,特征向量基通常是稠密的,每个节点在所有基上都有非零分量,这导致节点特征的更新涉及全局信息,难以捕捉图结构的局部性和节点之间的邻域关系,从而限制了模型的局部泛化能力。
⑵ 滤波器的多项式逼近
连续函数都可以用多项式在有限区间上逼近(Stone-Weierstrass 定理),滤波器函数𝑔𝜃(𝚲)因此可以被近似为:

这意味着:对图信号的谱卷积完全等价于用“拉普拉斯多项式”对节点域信号进行线性变换。究其本质原因是𝐋与𝚲同构,任何特征值的多项式(滤波器近似)都能通过图拉普拉斯实现。
由于图拉普拉斯矩阵通常稀疏,𝐋𝑘𝐱𝑡只需要k次稀疏矩阵乘法,效率远高于特征分解。而且拉普拉斯矩阵的稀疏性有助于模型对图局部结构的表达和泛化能力。此外,多项式阶数K 控制了滤波器的局部感受野[5],即节点间最大传播距离不超过K跳。
⑶ 切比雪夫多项式逼近
多项式逼近(泰勒展开、幂级数展开)会随着阶数升高出现“龙格现象”,即端点附近振荡较大,整体最大误差变大,且幂级数容易出现数值不稳定等现象。为了缓解该问题,标准多项式被替换成切比雪夫多项。切比雪夫多Tk(x)是一组正交多项式,定义在区间[-1,1]****,满足递推关系:

相较于标准多项式而言,切比雪夫多项的优势在于:1)逼近误差均匀分布,不会局部异常放大,特别适合数值稳定性要求高的工程应用;2)振荡误差最小化,没有端点振荡放大问题,即没有“龙格现象”;3)计算与存储效率高,只需递推地计算相关项即可,适合深度学习反向传播。
为在滤波器上使用切比雪夫多项式逼近,需要将图拉普拉斯的特征值归一化到对应的定义区间[-1,1],即****





三、图神经网络的一般框架


1)聚合(函数):收集邻居节点的信息,并进行加权平均,权重取决于被图的度归一化的邻接矩阵;
**2) 组合(函数):**综合来自邻居节点的聚合信息和节点自身信息(被度归一化)。
注意到上述两个步骤(函数)都被度归一化,如果度太小,也就是图结构过于稀疏,可能会在节点更新中过于倚重节点自身信息,从而造成过拟合问题或上述近似重归一化误差明显。因此,图结构属性是制约GCN性能的关键。
综合上述分析,图神经网络的一般框架和基本思路是:通过结合邻居节点的表征和节点自身的表征,迭代激活更新节点的表征。一旦有了节点表征,它们就可以用于下游任务,如节点分类等。



读者福利大放送:如果你对大模型感兴趣,想更加深入的学习大模型**,那么这份精心整理的大模型学习资料,绝对能帮你少走弯路、快速入门**
如果你是零基础小白,别担心——大模型入门真的没那么难,你完全可以学得会!
👉 不用你懂任何算法和数学知识,公式推导、复杂原理这些都不用操心;
👉 也不挑电脑配置,普通家用电脑完全能 hold 住,不用额外花钱升级设备;
👉 更不用你提前学 Python 之类的编程语言,零基础照样能上手。
你要做的特别简单:跟着我的讲解走,照着教程里的步骤一步步操作就行。
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
现在这份资料免费分享给大家,有需要的小伙伴,直接VX扫描下方二维码就能领取啦😝↓↓↓
为什么要学习大模型?
数据显示,2023 年我国大模型相关人才缺口已突破百万,这一数字直接暴露了人才培养体系的严重滞后与供给不足。而随着人工智能技术的飞速迭代,产业对专业人才的需求将呈爆发式增长,据预测,到 2025 年这一缺口将急剧扩大至 400 万!!
大模型学习路线汇总
整体的学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战,跟着学习路线一步步打卡,小白也能轻松学会!
大模型实战项目&配套源码
光学理论可不够,这套学习资料还包含了丰富的实战案例,让你在实战中检验成果巩固所学知识
大模型学习必看书籍PDF
我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。
大模型超全面试题汇总
在面试过程中可能遇到的问题,我都给大家汇总好了,能让你们在面试中游刃有余
这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
👉获取方式:
😝有需要的小伙伴,可以保存图片到VX扫描下方二维码免费领取【保证100%免费】
相信我,这套大模型系统教程将会是全网最齐全 最适合零基础的!!
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)