• OOD论文:Revisit Overconfidence for OOD Detection


    论文全名:Revisit Overconfidence for OOD Detection: Reassigned Contrastive Learning with Adaptive Class-dependent Threshold

    论文地址:https://aclanthology.org/2022.naacl-main.307.pdf

    代码链接:https://github.com/pris-nlp/NAACL2022-Reassigned_Contrastive_Learning_OOD

    论文被NAACL2022接收。

    中文名:重新审视OOD检测的过度自信:基于自适应类相关阈值的重分配对比学习

    挑战

            OOD检测的主要挑战是神经网络模型的过度自信:
        1.ood过度自信:ind数据被识别成ood数据,原因是域内的不同类别的样本相似性太高,分散了最置信的类别的分数。
            本文方法:重分配的对比学习。
        2.ind过度自信:ood数据被识别成ind数据,与域内的样本伪相似
            本文方法:自适应的类相关的阈值

    现状

            ood的大部分工作基于非监督的ood检测,只是基于标注的样本内数据,没有样本外的数据;这样的话缺少了ood的先验知识。

    OOD检测
        无监督模型只使用ind数据,基于阈值的策略;然后使用验证集中有标签的ood数据微调一个固定的全局阈值参数。
        另外的方法使用一部分ood数据和ind数据训练一个N+1的分类器。(熵正则化,对抗增强)

    对比学习
        无监督对比学习:域内有标签数据的交叉熵损失和无标签数据间的对比损失,需要很多标签的数据并且无法显示区分不同意图类型。
        有监督对比学习:只使用有标签ind数据学习区分意图表示。但是类似意图类别之间还是很难区分

    方法     

            对于odd过度自信,构建困难对比对(域内易错分样本),通过有监督对比学习区分域内相似意图表示;重分配对比学习:给易混淆的ind类别更多的惩罚,用来学习区分意图表示,
            对比学习样本构建:
            普通的对比学习,一个样本的两个不同的view是正对,和其他样本是负对;
            监督对比学习,同一个意图的样本作为正例,不同意图样本为负例;
            这些方法忽略了类似意图的易混淆关系。
            所以提出了重分配的对比学习框架:
                1. 训练域内分类器,使用域内数据 交叉熵损失 训练一个分类模型;
                2. 混淆类别对数据的对比学习,普通对比学习使用表示的相似性(有偏差)生成对比对,RCL使用分类模型预测结果构建;
                3.全局数据的对比学习,避免知识的遗忘。

            对于ind过度自信,自适应类相关阈值机制来区分相似的域内意图和域外意图;
                调整类相关的局部阈值,相关的ood和ind类有更高的阈值。 
            自适应类相关局部阈值
                之前的方法使用全局的阈值进行ood的检测,但是如果某个ood样本和ind类别很相近,高的置信分会造成错认为是域内数据。
                对于每个域内类别我们都生成一个置信分数; 

                使用存在的检测器,得到所有数据(ood、ind)的域内类别,得到每个意图的局部阈值,没有ood数据的意图类别使用全局阈值。

    ------------------------------------------------------------------------------
       另外再记录一篇ood相关论文:ViM: Out-Of-Distribution with Virtual-logit Matching

    该论文认为:

    特征是空间是d维的,类别数是k,在最后softmax层会进行降维至k个logits;
    降维过程会保留分类相关的特征,ood相关的特征则会损失,所以不能进行准确的ood分类。

    最后保留下来的logit维度上的就是特征空间的主成分维度,在这些维度上的score高说明是ind数据,相反在损失的那些维度上score高的则是odd的数据,所以通过特征转换得到主成分空间的正交补空间,通过缩放与logit向量一起进行最后的计算。

    论文详细介绍:CVPR 2022 | ViM:使用虚拟分对数匹配的分布外检测 - 知乎

  • 相关阅读:
    SQL审核 | PawSQL审核引擎的设计目标
    动态内存管理(C语言)
    腾讯云短信服务实现 Java 发送手机验证码(SpringBoot+Redis 实现)
    epoll使用实例:TCP服务端处理多个客户端请求
    华润燃气牵手腾讯云 数字技术助力燃气行业高质量发展
    SpringBoot项目的搭建
    蓝桥杯1043
    MySQL数据库————流程控制
    快速弄懂C++中的智能指针
    自动化测试也可以不写代码?今天就教你
  • 原文地址:https://blog.csdn.net/choose_c/article/details/126255644