论文信息
论文标题:MaskGAE: Masked Graph Modeling Meets Graph Autoencoders
论文作者:Jintang Li, Ruofan Wu, Wangbin Sun, Liang Chen, Sheng Tian......
论文来源:2022,arXiv
论文地址:download
论文代码:download
1 Introduction
MAE 在图上的应用——2022 最潮的方法。
2 Related work and Motivation
2.1 GAE
GAEs采用了经典的编码器-解码器框架,旨在通过优化以下二进制交叉熵损失,从编码图的低维表示中进行解码:
LGAEs=−(1|E+|∑(u,v)∈E+loghω(zu,zv)+1|E−|∑(u′,v′)∈E−log(1−hω(zu′,zv′)))
其中,z
2.2 Motivation
按照互信息的思想:希望最大化 k-hop 节点对子图之间的一致性,但是伴随着 K
3 Method:MaskGAE
出发点:MGM
Gmask ∪Gvis =G
Gmask =(Emask ,V)
3.1 Masking strategy
Edge-wise random masking (Tedge
Emask ∼Bernoulli(p)
Path-wise random masking (Tpath
Emask ∼RandomWalk(R,nwalk ,lwalk )
其中,R⊆V 是从图中采样的一组根节点,nwalk 为每个节点的行走次数,lwalk 为行走长度。
在这里,我们遵循度分布,抽样了一个节点的子集(例如,50%),没有替换作为根节点 R。这样的采样也可以防止图中存在的潜在的长尾偏差(即,更多的屏蔽边是那些属于高度节点的边)。
3.2 Encoder
- GCN Encoder
- SAGE Encoder
- GAT Encoder
3.2 Decoder
hω(zi,zj)=Sigmoid(zTizj)
hω(zi,zj)=Sigmoid(MLP(zi∘zj))
gϕ(zv)=MLP(zv)
3.3 Learning objective
损失函数包括:
-
- Reconstruction loss:计算的是掩码边 E+=Emask 的重构损失;
- Regression loss:衡量的是节点度的预测与掩蔽图中原始节点度的匹配程度:
Ldeg=1|V|∑v∈V‖gϕ(zv)−degmask (v)‖2F
因此,总体损失为:
L=LGAEs+αLdeg
4 Experiments
5 Conclusion
__EOF__



