码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • EVA: Visual Representation Fantasies from BAAI


    本文做个简单总结,博主不是做自监督领域的,如果错误,欢迎指正。

    链接

    Code:

            Official:baaivision/EVA

            MMpretrain:open-mmlab/mmpretrain/tree/main/configs/eva02

    Paper:

            EVA01:EVA: Exploring the Limits of Masked Visual Representation Learning at Scale

            EVA02:EVA-02: A Visual Representation for Neon Genesis

    EVA01

    成就:

    EVA 是第一个开源的十亿级视觉基础模型,在广泛的下游任务上实现了最先进的性能。

    改进: 
        
    1. EVA是基于CLIP的预训练,而不是MIM预训练。

      1. MIM(Masked Image Modeling)预训练,即MAE做的事情,随机mask掉图片中一部分,生成原图。

        1. 缺点:MIM预训练只包含底层细节信息,没有高层语义信息。

      2. CLIP预训练,用“图像-文本”进行对比学习训练,

        1. 使用场景:根据文本搜索相关图片,根据图片生成相关描述。

        2. 优点:文本补充了MIM缺乏的高层语义信息,CLIP预训练细节和语义信息都有。CLIP预训练中的高层语义信息能够给下游任务提供更大的帮助。

    2. EVA 不需要昂贵的监督训练阶段,仅利用来自开源数据集的图像就可以。

    3. EVA 的迁移学习性能强。

    4. EVA 可以充当以视觉为中心的多模态支点

    EVA02

    成就:

            

    1. 使用可公开访问的训练数据,仅具有 304M 参数的 EVA-02 在 ImageNet-1K 验证集上实现了惊人的 90.0 微调 top-1 精度。

    2. EVA-02-CLIP 在 ImageNet-1K 上可以达到高达 80.4 的零样本 top-1,优于之前最大、最好的开源 CLIP,仅需要约 1/6 的参数和约 1/6 的图像文本训练数据。

    改进:

            

    1. EVA02对原始ViT改进了结构(借鉴NLP上的一些改进Tricks)

    2. EVA V1使用CLIP模型的视觉Encoder作为Teacher,EVA V2使用EVA-CLIP作为Teacher。EVA-CLIP 与之前的 CLIP 模型相比性能更强大,参数数量相同,但训练成本显著降低

    3. EVA V2使用了更多的数据,多个开源公开的数据集合并到一起组成 Merged-38M,累计3800万张图片。

    4. 训练分为多阶段,

      1. 在Merged-38M上进行MIM预训练,

      2. 在ImageNet21K上进行finetuning,

      3. 在ImageNet1K上做最后的finetuning。

      4. EVA V2还支持微调多项下游任务,如目标检测,语义分割、实例分割等。

  • 相关阅读:
    java进阶1——JVM
    应广单片机跑马灯实现--阻塞式编程模式
    防火墙基础之H3C防火墙分支与分支之间双向地址转换
    家庭理财管理系统设计与实现
    Ceres学习笔记003--使用Ceres进行曲线拟合
    蓝桥杯练习题二 - 合并检测(c++)
    PlantUML语法
    VUE element-ui之table表格横向展示(表尾汇总)_elementui横向表格
    Istio数据面新模式:Ambient Mesh技术解析
    现在学RPA,还有前途吗,会不会太卷?
  • 原文地址:https://blog.csdn.net/qq_39435411/article/details/132745592
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号