python机器学习GCN图卷积神经网络原理解析
作者:Mr.琛 发布时间:2022-09-29 06:36:14
1. 图信号处理知识
图卷积神经网络涉及到图信号处理的相关知识,也是由图信号处理领域的知识推导发展而来,了解图信号处理的知识是理解图卷积神经网络的基础。
1.1 图的拉普拉斯矩阵
拉普拉斯矩阵是体现图结构关联的一种重要矩阵,是图卷积神经网络的一个重要部分。
1.1.1 拉普拉斯矩阵的定义及示例
实例:
按照上述计算式子,可以得到拉普拉斯矩阵为:
1.1.2 正则化拉普拉斯矩阵
1.1.3 拉普拉斯矩阵的性质
1.2 图上的傅里叶变换
傅里叶变换是一种分析信号的方法,它可分析信号的成分,也可用这些成分合成信号。它将信号从时域转换到频域,从频域视角给出了信号处理的另一种解法。(1)对于图结构,可以定义图上的傅里叶变换(GFT),对于任意一个在图G上的信号x,其傅里叶变换表示为:
从线代角度,可以清晰的看出:v1,…, vn构成了N维特征空间中的一组完备基向量,G中任意一个图信号都可表示为这些基向量的线性加权求和,系数为图信号对应傅里叶基上的傅里叶系数。
回到之前提到的拉普拉斯矩阵刻画平滑度的总变差:
可以看成:刻画图平滑度的总变差是图中所有节点特征值的线性组合,权值为傅里叶系数的平方。总变差取最小值的条件是图信号与最小的特征值所对应的特征向量完全重合,结合其描述图信号整体平滑度的意义,可将特征值等价成频率:特征值越低,频率越低,对应的傅里叶基变化缓慢,即相近节点的信号值趋于一致。
把图信号所有的傅里叶系数结合称为频谱(spectrum),频域的视角从全局视角既考虑信号本身,也考虑到图的结构性质。
1.3 图信号滤波器
图滤波器(Graph Filter)为对图中的频率分量进行增强或衰减,图滤波算子核心为其频率响应矩阵,为滤波器带来不同的滤波效果。
故图滤波器根据滤波效果可分为低通,高通和带通。
低通滤波器:保留低频部分,关注信号的平滑部分;
高通滤波器:保留高频部分,关注信号的剧烈变化部分;
带通滤波器:保留特定频段部分;
而拉普拉斯矩阵多项式扩展可形成图滤波器H:
2. 图卷积神经网络
2.1 数学定义
图卷积运算的数学定义为:
上述公式存在一个较大问题:学习参数为N,这涉及到整个图的所有节点,对于大规模数据极易发生过拟合。
进一步的化简推导:将之前说到的拉普拉斯矩阵的多项式展开代替上述可训练参数矩阵。
此结构内容即定义为图卷积层(GCN layer),有图卷积层堆叠得到的网络模型即为图卷积网络GCN。
2.2 GCN的理解及时间复杂度
图卷积层是对频率响应矩阵的极大化简,将本要训练的图滤波器直接退化为重归一化拉普拉斯矩阵
2.3 GCN的优缺点
优点:GCN作为近年图神经网络的基础之作,对处理图数据非常有效,其对图结构的结构信息和节点的属性信息同时学习,共同得到最终的节点特征表示,考虑到了节点之间的结构关联性,这在图操作中是非常重要的。
缺点:过平滑问题(多层叠加之后,节点的表示向量趋向一致,节点难以区分),由于GCN具有一个低通滤波器的作用(j聚合特征时使得节点特征不断融合),多次迭代后特征会趋于相同。
3. Pytorch代码解析
GCN层的pytorch实现:
class GraphConvolutionLayer(nn.Module):
'''
图卷积层:Lsym*X*W
其中 Lsym表示正则化图拉普拉斯矩阵, X为输入特征, W为权重矩阵, X'表示输出特征;
*表示矩阵乘法
'''
def __init__(self, input_dim, output_dim, use_bias=True):
#初始化, parameters: input_dim-->输入维度, output_dim-->输出维度, use_bias-->是否使用偏置项, boolean
super(GraphConvolutionLayer,self).__init__()
self.input_dim=input_dim
self.output_dim=output_dim
self.use_bias=use_bias #是否加入偏置, 默认为True
self.weight=nn.Parameter(torch.Tensor(input_dim, output_dim))#权重矩阵为可训练参数
if self.use_bias==True: #加入偏置
self.bias=nn.Parameter(torch.Tensor(output_dim))
else: #设置偏置为空
self.register_parameter('bias', None)
self.reset_parameters()
def reset_parameters(self):
#初始化参数
stdv = 1. / math.sqrt(self.weight.size(1))
self.weight.data.uniform_(-stdv, stdv)#使用均匀分布U(-stdv,stdv)初始化权重Tensor
if self.bias is not None:
self.bias.data.uniform_(-stdv, stdv)
def forward(self, adj, input_feature):
#前向传播, parameters: adj-->邻接矩阵(输入为正则化拉普拉斯矩阵), input_future-->输入特征矩阵
temp=torch.mm(input_feature, self.weight)#矩阵乘法, 得到X*W
output_feature=torch.sparse.mm(adj, temp)#由于邻接矩阵adj为稀疏矩阵, 采用稀疏矩阵乘法提高计算效率, 得到Lsym*temp=Lsym*X*W
if self.use_bias==True: #若设置了偏置, 加入偏置项
output_feature+=self.bias
return output_feature
定义两层的GCN网络模型:
class GCN(nn.Module):
'''
定义两层GCN网络模型
'''
def __init__(self, input_dim, hidden_dim, output_dim):
#初始化, parameters: input_dim-->输入维度, hidden_dim-->隐藏层维度, output_dim-->输出维度
super.__init__(GCN, self).__init__()
#定义两层图卷积层
self.gcn1=GraphConvolutionLayer(input_dim, hidden_dim)
self.gcn2=GraphConvolutionLayer(hidden_dim, output_dim)
def forward(self, adj, feature):
#前向传播, parameters: adj-->邻接矩阵, feature-->输入特征
x=F.relu(self.gcn1(adj, feature))
x=self.gcn2(adj, x)
return F.log_softmax(x, dim=1)
来源:https://blog.csdn.net/weixin_44756457/article/details/107855072


猜你喜欢
- 前言拖了这么久,最终还是战胜了懒惰,打开电脑写了这篇博客,内容也很简单,python实现字符串转整型的int方法python已经实现了int
- 1、解决方案mysql是不支持跨库连接的,如果我们实在要连接的话可以用dblink方式。解释:dblink就是我们在创建表的时候连接到我们的
- 一、关系数据库1.数据模型实体间的关系分为以下有三种:1*)一对一模型一对一(one-to-one)关系模型用二维表格表示数据及数据联系,是
- 一、问题描述如题,在使用pip install xxx的方法安装python库,或者是基于python的软件时,报错“E
- 阅读上一章:Css布局Chapter 13 为文字指定样式我想以一章的篇幅来讨论用CSS设定文字样式的做法是个好点子.一般处理文字内容大概是
- Numpy是Python强大的数据计算和处理模块,其操作数据非常迅速且简单易行。首先读取CSV文件>>> import n
- 发现问题在一次捞取Top SQL中,发现DB大量执行 select @@session.tx_read_only ,几乎每一条DML语句前,
- 题目:有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少?程序分析:可填在百位、十位、个位的数字都是1、2、3、
- 语句格式:numpy.zeros(shape, dtype=float, order='C')参数说明:shape:整型或元
- 环境:python3.6 pyqt5只是简单的一个思路,请忽略脆弱的异常防护:# -*- coding: utf-8 -*-import s
- 如果我们在标识列中插入值,例如:insert member(id,username) values(10,'admin')
- '================================================ '
- 前言本博客重点内容:reportlab生成流文件格式、reportlab分页和图片流文件写入reportlab等。我讲一下我这个需求的来源,
- 桥接模式(Bridge Pattern)是什么桥接模式是一种结构型模式,它将抽象部分与实现部分分离开来,使它们可以独立地变化。在桥接模式中,
- 我们的目标是秒杀淘宝或京东等的订单,这里面有几个关键点,首先需要登录淘宝或京东,其次你需要准备好订单,最后要在指定时间快速提交订单。这里就要
- python的hashlib库中提供的hexdigest返回长度32的字符串。直接通过digest返回的16字节,有不可打印字符。问题来了,
- Pycharm工具前言好的学习是离不开一个好的工具,今天分享一下一款用于python脚本编写以及调试的工具——PyCharm Communi
- 目录前言全局参数持久化写在最后总结参考文档:前言自从 2018 年发布第一版 MySQL 8.0.11 正式版至今,MySQL 版本已经更新
- 当你使用Lumigent log Explorer连接服务器后,选择具体的数据库实例时报错,提示 &nbs
- 题目:转换RBG颜色值我们知道在网页中的颜色值设置都是用16进制的RGB来表示的,比如#FFFFFF,表示R:255,G:255,B:255