码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 计算机视觉中的细节问题(二)


    参考   计算机视觉中的细节问题(二) - 云+社区 - 腾讯云

    目录

    (1)photometric distortions的含义

    (2)MSE、MAE的含义

    (3)图像金字塔与特征金字塔

    (4)RGBA的含义

    (5)目标检测中样本的难度是如何区分的

    (6)什么是机器学习模型的容量

    (7)张量秩的含义

    (8)目标检测中样本的难度是如何区分的

    (9)全连接层的原理

    (10)softmax的原理


    (1)photometric distortions的含义

    指的是在输入卷积神经网络之前对数据进行预处理的操作,比如改变亮度、饱和度等。

    (2)MSE、MAE的含义

    MSE(Mean Square Error)均方误差,MSE是真实值与预测值的差值的平方然后求和平均。通过平方的形式便于求导,所以常被用作线性回归的损失函数。MAE(Mean Absolute Error)平均绝对误差。是绝对误差的平均值。可以更好地反映预测值误差的实际情况。

    (3)图像金字塔与特征金字塔

    在目标检测或语义分割中图像金字塔指的是直接对图像进行上采样而形成的层级结构,由于计算量大的原因这种方法现在已经被抛弃了。特征金字塔主要是通过CNN的层来形成的特征,广泛的使用在目标检测中。

    (4)RGBA的含义

    • R:红色值。正整数 | 百分数
    • G:绿色值。正整数 | 百分数
    • B:蓝色值。正整数 | 百分数
    • A:Alpha透明度。取值0~1之间。(颜色的透明度)

    (5)目标检测中样本的难度是如何区分的

    数量大的样本一般是简单样本,数量小的样本一般是难样本。

    (6)什么是机器学习模型的容量

    通俗地讲,模型的容量是指它拟合各种函数的能力。

    (7)张量秩的含义

    标量:秩为零的张量(只有大小,没有方向,由1(3^0)部分组成);
    向量:秩为一的张量(有大小和一个方向,由3(3^1)部分组成);
    Dyad:秩为2的张量(有大小和两个方向,由9(3^2)部分组成);
    Triad:秩为3的张量(有大小和三个方向,由27(3^3)部分组成);
    这样,张量和标量、向量……之间似乎有一一对应关系。但是,标量不是张量,虽然秩为0的张量是标量;同样的,向量不是张量,虽然秩为1的张量是向量;dyad不是张量,但秩为2的张量是dyad(矩阵)。

    (8)目标检测中样本的难度是如何区分的

    根据IoU来区分,一般小于0.3为负样本,0.3到0.5为难样本,大于0.5为正样本。

    (9)全连接层的原理

    如果输入的feature map是2X2,那么就需要把这个feature map 拉成4X1的列向量,如果你的feature map 的channels是3,也就是你的输入是3X2X2,也就是相当于有了12个像素点,你就需要把feature map 拉成12X1的列向量,这时候,再乘一个权重,这个权重要把12个像素点都包含进去,所以这个权重的矩阵形式应该是1X12,所以经过一个全连接层后的输出就是1X12X12X1=1X1,这时候需要看你的需要多少个1X1的神经元了,如果是3个的话,那么输出就是3X(1X12X12X1)=3X(1X1)。

    (10)softmax的原理

    softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内。假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的softmax值:

                                                 \large S_i=\frac{e^i}{\sum_j e^j}

     

  • 相关阅读:
    Golang爬虫如何触发JavaScript代码
    20220727使用汇承科技的蓝牙模块HC-05配对手机进行蓝牙串口的演示
    使用vue-cl搭建SPA项目
    C++学习——友元函数和友元类(friend关键字)
    1108 String复读机分数 20
    阿里云无影发布生态共荣计划,携手伙伴推动终端算力上云
    面试官猛的一问:Spring的Bean注入如何解决循环依赖的?
    pem文件类解析
    网络会议室解决方案可以根据项目需求量身定制
    JavaScript的位操作符你知道吗?
  • 原文地址:https://blog.csdn.net/weixin_36670529/article/details/99829560
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号