论文解读（AGC）《Attributed Graph Clustering via Adaptive Graph Convolution》

论文解读（AGC）《Attributed Graph Clustering via Adaptive Graph Convolution》
论文信息

论文标题：Attributed Graph Clustering via Adaptive Graph Convolution
论文作者：Xiaotong Zhang, Han Liu, Qimai Li, Xiao-Ming Wu
论文来源：2019, IJCAI
论文地址：download
论文代码：download

1 Introduction

　　关于GNN 是低通滤波器的好文。

2 Method

2.1 Graph Convolution

2.1.1 Basic idea

　　为正式定义图卷积，首先引入图信号和图滤波器的概念。

　　图信号可以表示为一个向量，其中是一个实值函数。
- - 邻接矩阵
  - 度矩阵
  - 对称标准化图拉普拉斯矩阵
　　可特征分解：，其中是按特征值升序的对角矩阵，是对应的正交特征向量。

　　图滤波器 可表示为，其中被称为 频率响应函数。

　　图卷积 被定义为 图信号 与 图滤波器 的乘法：

　　　　

　　其中，为滤波后的图信号。

　　特征矩阵 的 每一列 可看作是一个图信号。在图信号处理中，特征值可以作为频率，相关的特征向量可以作为图的傅里叶基。一个图信号可以被分解为一个特征向量的线性组合，即，

　　　　

　　式中，和为的系数。系数的大小表示中表示的基信号的强度。

　　如果图上附近的节点具有相似的特征表示，则图信号是平滑的。基信号的平滑度可以用拉普拉斯-贝尔特拉米算子来测量，即，

　　　　

　　其中，表示向量的第个元素。

　　表示与较低频（较小特征值）相关的基信号更平滑，即平滑的图信号应该比高频图信号包含更多的低频基信号。这可通过与低通图滤波器进行图卷积来实现，如下所示。

　　通过，图卷积可以写成

　　　　

　　在滤波后的信号中，基信号的系数按进行缩放。为保持低频基信号和去除中的高频信号，图滤波器应该是低通的，即频率响应函数应该是减小的和非负的。

　　低通图滤波器可以有多种形式。在这里，本文设计了一个具有频率响应函数的低通图滤波器

　　　　

　　如 Figure 1(a) 中的红线所示，可以看到中的在上呈递减趋势，且为非负值。

　　

　　注意，对称归一化图拉普拉斯l的所有特征值都属于区间 ，这表明中的是低通的。在中以为频率响应函数的图滤波器可以写成

　　　　

　　通过对特征矩阵进行图卷积，得到滤波后的特征矩阵：

　　　　

　　其中，是图卷积后过滤后的节点特征。在特征矩阵上应用这样种低通图滤波器，使相邻节点在每个维上具有相似的特征值，即图信号是平滑的。

　　请注意，在中提出的图滤波器不同于在 GCN 中使用的图滤波器。GCN 中的图滤波器是，频率响应函数，这显然不是低通，因为它在为负。

GCN 的滤波器

　　　　

　　由于可以被正交对角化，设，是的特征值，可以证明。
　　因此上式变为:

　　　　

　　显然，其频率响应函数为。

2.1.2 k-Order Graph Convolution

　　为了便于聚类，希望同一类的节点在经过图过滤后应该具有相似的特征表示。然而，中的一阶图卷积可能不足以实现这一点，特别是对于大型稀疏图，因为它只通过一个节点的聚合来更新每个节点，而不考虑长距离邻域关系。为了捕获全局图的结构并便于聚类，建议使用阶图的卷积。

　　　　

　　其中为正整数，对应的图滤波器为

　　　　

　　在中，的频率响应函数为

　　　　

　　如 Figure 1(a) 所示，随着的增加，中的变得更低通，说明滤波后的节点特征将更平滑。

　　阶图卷积的迭代计算公式为

　　　　

　　最终的是。

Note

　　因为：

　　　　

　　所以：

　　　　

Theoretical Analysis

　　随着增加，阶图卷积将使节点特征在每个维度上更平滑。下面，我们使用中定义的拉普拉斯-贝尔特拉米算子来证明这一点。用表示特征矩阵的一列，可以分解为。请注意，，其中是一个标量。因此，为了比较不同的图信号的平滑性，我们需要把它们放在一个共同的尺度上。接下来，我们考虑一个归一化信号的平滑性，即，

　　　　

证明：

　　

　　我们现在可以用这个引理来证明 Theorem 1。为方便起见，我们将的特征值按递增顺序排列为。由于是非增加的和非负的，所以。可以用上述引理来证明Theorem 1 ，通过设置：

　　　　

　　假设和分别由阶和阶图卷积得到，我们可以立即从 Theorem 1 中推断出比更平滑。换句话说，阶图卷积会随着的增加而产生更平滑的特征。由于同一集群中的节点倾向于紧密连接，它们可能具有更多具有大的相似特征表示，这有利于聚类。

2.2 Clustering via Adaptive Graph Convolution

　　算法如下：

　　

　　为了自适应地选择阶，我们使用聚类性能度量-仅基于数据的内在信息的内部标准。在这里，我们考虑 intra-cluster distance(对于给定的簇 )，它表示的紧致性：

　　　　

　　需要注意的是，在具有固定数据特征的情况下，簇间距离也可以用来度量聚类性能，良好的簇类划分应该具有较大的簇间距离和较小的簇内距离。然而，根据 Theorem 1，随着的增加，节点特征变得更平滑，这可以显著减少簇内和簇间的距离。因此，簇间的距离可能不是衡量集群性能的可靠度量指标因此，我们建议观察选择的簇内距离的变化。

　　所以，最后的选择簇分配为。这种选择策略的好处是有两方面的。首先，它确保为找到一个局部最小值，这可能表明一个良好的簇分配，并避免过度平滑。其次，停止在内的第一个局部最小值是时间有效的。

3 Experiments

Datasets

　　

节点聚类

　　

4 Conclusion

　　本文提出了一种简单而有效的属性图聚类方法。为了更好地利用可用数据和捕获全局集群结构，我们设计了一个k阶图卷积来聚合远程数据信息。为了优化不同图上的聚类性能，我们设计了一种自适应选择合适的k的策略。这使得我们的方法能够达到与经典的和最先进的方法相比的竞争性能。在未来的工作中，我们计划改进自适应选择策略，使我们的方法更加鲁棒和高效。

修改历史

2022-06-30 创建文章

论文解读目录
论文信息
1 Introduction
2 Method
    2.1 Graph Convolution
        2.1.1 Basic idea
        2.1.2 k-Order Graph Convolution
    2.2 Clustering via Adaptive Graph Convolution
3 Experiments
4 Conclusion
修改历史
__EOF__
本文作者： Blair
本文链接： https://www.cnblogs.com/BlairGrowing/p/16422325.html
关于博主： 评论和私信会在第一时间回复。或者直接私信我。
版权声明： 本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！
声援博主： 如果您觉得文章对您有帮助，可以点击文章右下角【推荐】一下。

论文信息

1 Introduction

2 Method

2.1 Graph Convolution

2.1.1 Basic idea

2.1.2 k-Order Graph Convolution

2.2 Clustering via Adaptive Graph Convolution

3 Experiments

4 Conclusion

修改历史