-
图像检索常规算法---学习笔记
- 图像检索常规算法:
- BoW方法:核心思想是提取出关键点描述子后利用聚类的方法训练一个码本,随后每幅图片中各描述子向量在码本中各中心向量出现的次数来表示该图片,该方法的缺点是需要码本较大;
- FV方法:核心思想是利用高斯混合模型(GMM),通过计算高斯混合模型中的均值、协方差等参数来表示每张图像。该方法的优点是准确度高,但缺点是计算量较大。
- VLAD算法:
- 可以看做是一种简化的FV,其主要方法是通过聚类方法训练一个小的码本,对于每幅图像中的特征找到最近的码本聚类中心,随后所有特征与聚类中心的差值做累加,得到一个k*d的vlad矩阵,其中k是聚类中心个数,d是特征维数(如sift是128维),随后将该矩阵扩展为一个(k*d)维的向量,并对其L2归一化,所得到的向量即为VLAD
- 算法流程:
- 读取图片文件路径及特征提取
- 使用聚类方法训练码本
- 将每张图片的特征与最近的聚类中心进行累加
- 对累加后的VLAD进行PCA降维并对其归一化
- 得到VLAD后,使用ADC方法继续降低储存空间和提高搜索速度
- ADC:
- 找到离x最近的a个邻居
- 对图片库中,除query vector x之外的所有图的vector Y=y1,y2...yn,做kmeans产生k个聚类中心,用log2kbit编码这k个center的ID
- 存在的问题:k必须是一个较小的值,这样会导致信息损失较严重,因为上百万个图,最后只对应到了16种编码,搜索精度会很低。如果想用64bit编码, k=264,聚类中心的个数太多,kmeans计算代价很大。
- 优化:把vector y划分成m个子向量,如果y长度为D,那么每个子向量长度:D/m,对每个子向量做上述的ADC编码,聚类时把多个y的第j个子向量进行k-mean聚类,将所有子向量与x之间的差距求和。
-
相关阅读:
ArrayList 可以完全替代数组吗?
[附源码]计算机毕业设计springboot校园商铺
数据结构——时间复杂度
第二十九篇 动态组件 - component
日期问题总结
Vue2.0开发之——babel-loader处理高级JS语法(09)
C/C++进程线程超详细详解
【JUC】9.对象内存布局
JavaWeb---HTML
Css Sprite是什么 有什么优缺点?
-
原文地址:https://blog.csdn.net/weixin_45647721/article/details/126430652