OOD论文：Revisit Overconfidence for OOD Detection

论文全名：Revisit Overconfidence for OOD Detection: Reassigned Contrastive Learning with Adaptive Class-dependent Threshold

论文地址：https://aclanthology.org/2022.naacl-main.307.pdf

代码链接：https://github.com/pris-nlp/NAACL2022-Reassigned_Contrastive_Learning_OOD

论文被NAACL2022接收。

中文名：重新审视OOD检测的过度自信：基于自适应类相关阈值的重分配对比学习

挑战

OOD检测的主要挑战是神经网络模型的过度自信：
1.ood过度自信：ind数据被识别成ood数据，原因是域内的不同类别的样本相似性太高，分散了最置信的类别的分数。
本文方法：重分配的对比学习。
2.ind过度自信：ood数据被识别成ind数据，与域内的样本伪相似
本文方法：自适应的类相关的阈值

现状

ood的大部分工作基于非监督的ood检测，只是基于标注的样本内数据，没有样本外的数据；这样的话缺少了ood的先验知识。

OOD检测
无监督模型只使用ind数据，基于阈值的策略；然后使用验证集中有标签的ood数据微调一个固定的全局阈值参数。
另外的方法使用一部分ood数据和ind数据训练一个N+1的分类器。（熵正则化，对抗增强）

对比学习
无监督对比学习：域内有标签数据的交叉熵损失和无标签数据间的对比损失，需要很多标签的数据并且无法显示区分不同意图类型。
有监督对比学习：只使用有标签ind数据学习区分意图表示。但是类似意图类别之间还是很难区分

方法

对于odd过度自信，构建困难对比对（域内易错分样本），通过有监督对比学习区分域内相似意图表示；重分配对比学习：给易混淆的ind类别更多的惩罚，用来学习区分意图表示，
对比学习样本构建：
普通的对比学习，一个样本的两个不同的view是正对，和其他样本是负对；
监督对比学习，同一个意图的样本作为正例，不同意图样本为负例；
这些方法忽略了类似意图的易混淆关系。
所以提出了重分配的对比学习框架：
1. 训练域内分类器，使用域内数据交叉熵损失训练一个分类模型；
2. 混淆类别对数据的对比学习，普通对比学习使用表示的相似性（有偏差）生成对比对，RCL使用分类模型预测结果构建；
3.全局数据的对比学习，避免知识的遗忘。

        对于ind过度自信，自适应类相关阈值机制来区分相似的域内意图和域外意图；
        调整类相关的局部阈值，相关的ood和ind类有更高的阈值。
        自适应类相关局部阈值
        之前的方法使用全局的阈值进行ood的检测，但是如果某个ood样本和ind类别很相近，高的置信分会造成错认为是域内数据。
        对于每个域内类别我们都生成一个置信分数；

使用存在的检测器，得到所有数据（ood、ind）的域内类别，得到每个意图的局部阈值，没有ood数据的意图类别使用全局阈值。

------------------------------------------------------------------------------
另外再记录一篇ood相关论文：ViM: Out-Of-Distribution with Virtual-logit Matching

该论文认为：

特征是空间是d维的，类别数是k，在最后softmax层会进行降维至k个logits；
降维过程会保留分类相关的特征，ood相关的特征则会损失，所以不能进行准确的ood分类。

最后保留下来的logit维度上的就是特征空间的主成分维度，在这些维度上的score高说明是ind数据，相反在损失的那些维度上score高的则是odd的数据，所以通过特征转换得到主成分空间的正交补空间，通过缩放与logit向量一起进行最后的计算。

论文详细介绍：CVPR 2022 | ViM：使用虚拟分对数匹配的分布外检测 - 知乎

相关阅读:
SQL审核 | PawSQL审核引擎的设计目标
动态内存管理（C语言）
腾讯云短信服务实现 Java 发送手机验证码（SpringBoot+Redis 实现）
epoll使用实例：TCP服务端处理多个客户端请求
华润燃气牵手腾讯云数字技术助力燃气行业高质量发展
SpringBoot项目的搭建
蓝桥杯1043
MySQL数据库————流程控制
快速弄懂C++中的智能指针
自动化测试也可以不写代码？今天就教你

原文地址：https://blog.csdn.net/choose_c/article/details/126255644