Bipartite Graph Based Multi-View Clustering

Bipartite Graph Based Multi-View Clustering

基于二部图的多视图聚类

abstract

对于基于图的多视图聚类，一个关键问题是通过两阶段学习方案捕获共识聚类结构。具体来说，首先学习多个视图的相似性图矩阵，然后将它们融合为统一的高级图矩阵。大多数当前的方法独立地学习每个视图的数据点之间的成对相似性，这在单个视图中被广泛使用。然而，包含在多个视图中的共识信息被忽略，并且所涉及的偏差导致不期望的统一图矩阵。为此，我们提出了一种基于二分图的多视图聚类（BIGMC）方法。共识信息可以由不同视图的少量代表性统一锚点表示。在数据点和锚点之间构建二分图。BIGMC构建所有视图的二分图矩阵，并将其融合以生成统一的二分矩阵。统一的二分图矩阵进而改进每个视图的二分图形相似性矩阵并更新锚点。最终的统一图矩阵直接形成最终的簇。在BIGMC中，为每个视图添加自适应权重以避免异常视图。对统一矩阵的拉普拉斯矩阵施加低秩约束，以构造多分量统一二分图。

introduction

基于图的多视图聚类方法旨在通过组合所有视图的图矩阵，以统一的图矩阵的形式对数据对象之间的相似关系进行编码。通过在统一图矩阵上使用附加的聚类方法来形成最终聚类。聚类性能取决于每个视图图的质量和融合策略。

在学习每个视图图矩阵时，不考虑不同视图的共识信息。大多数现有方法独立地学习每个视图的对象之间的成对相似性。这通常导致所涉及的偏差影响每个视图图矩阵的质量。我们的方法通过学习不同视图的少量代表性统一锚点来获取共识信息。每个视图都有一个锚点集，不同视图中的这些锚点将信息保存在相同的子集群中
第二，他们在融合过程中保持预先给定的锚点集和学习的视图图矩阵固定不变，在这种情况下，它们对初始化很敏感，很容易陷入局部最优。我们的方法以相互增强的方式共同学习每个视图二分图矩阵、统一图矩阵和统一锚点。他们可以相互学习。
第三，如果没有附加的超参数，大多数方法无法自适应地学习每个视图的权重。额外超参数的最佳值需要在大范围内搜索。我们的方法可以基于相应的学习视图二分图和统一的图矩阵自适应地确定每个视图的最优权重。

为了解决这些问题，提出了BIGMC,总体架构图：

在这里插入图片描述

从多视图数据矩阵的输入中，为不同视图创建t个初始统一锚点，记为A。
然后根据数据点与锚点的相似度生成各个视图的图，称为“数据到锚点”的相似度图，记为S。
然后利用来自多个视图的所有Ss，在融合过程中学习一个统一的图矩阵U。同时，每个视图（ $\delta$ ） i s 的权重基于 Ss 和 U 自适应地添加，表明其重要性。添加秩约束。
接下来，得到的统一矩阵U将返回，改进每个视图的Ss和 $\delta$ ，直到收敛。
根据收敛的统一图矩阵U，我们可以得到每个视图的统一锚点A。如果它们与初始锚点不同，我们将改进所有As，以依次更新Ss、统一图矩阵U和权重d，直到它们相同。最终的簇是基于U直接形成的。

本文贡献：

我们提出了一种新的基于二部图的多视图聚类方法。BIGMC可以学习和利用由少量统一锚点所代表的共识信息，减轻了多个视图中包含的偏见的影响。
BIGMC共同学习每个视图的相似二部图、统一二部图、共识锚，相互强化。它还可以自动确定每个二部图的权重，而不引入附加超参数。当不同视图中的锚点相同时，直接根据统一的二部图生成最终的聚类。
BIGMC采用高效的交替迭代优化策略，逐级求解变量优化问题，每个子问题都有一个最优解。
在合成数据集和真实数据集上的实验结果证明了所提出的BIGMC的有效性和比现有基线的优越性。