论文解读（Debiased）《Debiased Contrastive Learning》

论文解读（Debiased）《Debiased Contrastive Learning》
论文信息

论文标题：Debiased Contrastive Learning
论文作者：Ching-Yao Chuang, Joshua Robinson, Lin Yen-Chen, Antonio Torralba, Stefanie Jegelka
论文来源：2020, NeurIPS
论文地址：download
论文代码：download

1 Introduction

　　观察的结果：将拥有不同标签的样本作为负样本能显著提高性能。

　　对比学习思想：鼓励相似对 (x,x+) 的表示更接近，而不同对 (x,x−) 的表示更远：

　　　　

　　图解如下：

　　

　　抽样偏差（sampling bias）：由于真正的标签或真正的语义相似性通常是不可用的，负对通常从训练数据中抽取，这意味着实际上可能和相似。

　　对比了不存在抽样偏差和存在抽样偏差的性能对比：

　　

　　设上的数据分布，代表语义意义的标签离散潜在类，即相似的对具有相同的潜在类。用表示类分布，得到联合分布。

　　设是潜在类标签分配函数，然后中观察到的是的正对的概率，中观察到的是的负对的概率。

　　假设类概率，不是的概率为。

　　综上，对比损失函数可以优化为：

　　　　

　　其中，代表着权重参数。当时，即标准的对比损失函数。

　　对有偏对比损失函数和无偏对比损失函数的分析：

　　Lemma 1. For any embedding and finite , we have

　　　　

　　where denotes the minimum of two real numbers and .

　　Lemma 1 所带来的问题：
- - 无偏损失越小，第二项就越大，差距就越大；
  - 最小化的上界和最小化理想情况的所产生的潜在表示是不同的；
2 Method

　　我们首先将数据分布（data distribution）分解为【当从中提取样本时，样本将来自与相同的类，概率为。】

　　　　

　　相应的

　　　　

　　的一种替代形式：

　　　　

　　为了得到一个更实际的形式，我们考虑了负例数趋于无穷时的渐近形式。

　　Lemma 2. For fixed and , it holds that

　　　　

　　　　

　　仍然从中取样例子，但用额外的正样本来修正。这本质上是重新加权分母中的正项和负项。

　　经验估计比直接的更容易计算。在数据分布中采样个样本，在分布中采样个样本，将分母中的第二项重新估计为：

　　　　

　　我们约束估计量大于它的理论最小值以防止计算一个负数的对数。当数据和固定后，由此产生的损失为

　　　　

　　其中，为简单起见，我们将设置为有限的。类先验可以从数据中估计或作为一个超参数处理。Theorem 3 将有限和引起的误差限定为随速率递减。

　　Theorem 3. For any embedding and finite and , we have

　　　　

　　实验表明，较大的和始终会导致更好的性能。在实现中，我们对使用一个完整的经验估计，以平均在个点上，有限和的损失。

3 Experiments

实验结果
- 新的损失在视觉、语言和强化学习基准上优于先进的对比学习；
- 学习到的嵌入更接近理想的无偏目标；
- 大大提高性能；甚至一个比标准更积极的例子可以明显帮助；
论文信息
1 Introduction
2 Method
3 Experiments
__EOF__
本文作者： Blair
本文链接： https://www.cnblogs.com/BlairGrowing/p/16203012.html
关于博主： 评论和私信会在第一时间回复。或者直接私信我。
版权声明： 本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！
声援博主： 如果您觉得文章对您有帮助，可以点击文章右下角【推荐】一下。

论文信息

1 Introduction

2 Method

3 Experiments