图像检索常规算法---学习笔记

图像检索常规算法：
1. BoW方法：核心思想是提取出关键点描述子后利用聚类的方法训练一个码本，随后每幅图片中各描述子向量在码本中各中心向量出现的次数来表示该图片，该方法的缺点是需要码本较大；
2. FV方法：核心思想是利用高斯混合模型(GMM)，通过计算高斯混合模型中的均值、协方差等参数来表示每张图像。该方法的优点是准确度高，但缺点是计算量较大。
3. VLAD算法：
  1. 可以看做是一种简化的FV，其主要方法是通过聚类方法训练一个小的码本，对于每幅图像中的特征找到最近的码本聚类中心，随后所有特征与聚类中心的差值做累加，得到一个k*d的vlad矩阵，其中k是聚类中心个数，d是特征维数(如sift是128维),随后将该矩阵扩展为一个(k*d)维的向量，并对其L2归一化，所得到的向量即为VLAD
  2. 算法流程：
    1. 读取图片文件路径及特征提取
    2. 使用聚类方法训练码本
    3. 将每张图片的特征与最近的聚类中心进行累加
    4. 对累加后的VLAD进行PCA降维并对其归一化
    5. 得到VLAD后，使用ADC方法继续降低储存空间和提高搜索速度
ADC：
1. 找到离x最近的a个邻居
2. 对图片库中，除query vector x之外的所有图的vector Y=y1,y2...yn，做kmeans产生k个聚类中心，用log2kbit编码这k个center的ID
3. 存在的问题：k必须是一个较小的值，这样会导致信息损失较严重，因为上百万个图，最后只对应到了16种编码，搜索精度会很低。如果想用64bit编码， k=264，聚类中心的个数太多，kmeans计算代价很大。
4. 优化：把vector y划分成m个子向量，如果y长度为D，那么每个子向量长度：D/m,对每个子向量做上述的ADC编码，聚类时把多个y的第j个子向量进行k-mean聚类，将所有子向量与x之间的差距求和。

相关阅读:
EL表达式
React antd Table点击下一页后selectedRows丢失之前页选择内容的问题
网络编程04-UDP的广播、组播
【C语言】哈夫曼树，再来一次解剖
C高级day2
挂耳耳机十大品牌排行榜哪个好，目前排行靠前的五款耳机推荐
基于手持技术的中学化学实验教学研究
一种便携式GNSS仿真策略
split和join方法用于字符串和数组的转换
【Java基础】23种设计模式介绍

原文地址：https://blog.csdn.net/weixin_45647721/article/details/126430652