• [哈希算法]----判断图片正反


    又是时隔多日了,日子过的有点荒废了,必须在这里找点存在感了,最近为了优化项目中的流程和算法,接触到了哈希算法,这个跟深度学习没什么关系,我用这个仅仅是来判断图片的正反,最后把图片归一化到同一个方向,可能还有更简单的方法,不过,无所谓了,能解决项目上的事情就先分享出来。

    所以我们先来看看哈希算法是个什么东西

    对我来说哈希算法分为三个:1.均值哈希算法  2.差值哈希算法  3感知哈希算法。我们分别来研究研究。

    1.均值哈希算法

    算法步骤:

    1.读取图像后转换为灰度图

    2.resize成8*8大小的图像

    3.求这个64个点的均值,也就是说累加起来再除以64

    4.再拿这个8*8的举证和这个均值做比较,大于均值的地方为1,小于均值的地方为0

    5.得到一个8*8或者说是64个值的0和1的数据,这个数据也就是我们这个图片的哈希编码

    2.差值哈希算法

    1.读取图像后转换为灰度图

    2.resize成9*8大小的图像,需要注意的是这里是9*8

    3.每行前一个像素大于后一个像素为1,相反为0,生成哈希,这里也可以看出,为什么要resize成9*8

    4.得到一个8*8或者说是64个值的0和1的数据,这个数据也就是我们这个图片的哈希编码

    3.感知哈希算法

    1.读取图像后转换为灰度图

    2.resize成32*32,其实这里也可以resize成32*32,我也是试过128*128,256*256,结果上的差异并不大

    3.对这个32*32的图像做一个离散余弦变化,别吃惊,离散余弦变换你要是不知道是什么的话,就当成一个变换函数好了,因为我也暂时还没搞清楚,等我搞清楚了,我再回来更新,哈哈哈

    4.离散余弦变换后,我们去这个举证的前8行8列

    5.这样我们又得到一个8*8或者说是64个值的0和1的数据,这个数据也就是我们这个图片的哈希编码

    然后,我们就可以根据两张图片的哈希编码来判断两张图片的相似度了。判断方法是就是拿哈希编码对应位置比对,不相同就+1,所以如果最后的值越大,就表示两个图片越不相似。

    4.实战

    我们根据这个,原来进行一个判断图片正反的实例,我们采用感知哈希算法来做。

    先说一下这个的逻辑,然后再上代码

    逻辑:1.选取文件夹中的一张图作为模板图1,然后将这张图旋转180°,作为模板图2。

               2.计算这两张模板图的哈希编码。

               3.遍历这个文件夹下其他图片,然后计算哈希编码,那计算出来的哈希编码和两张模板图的哈希编码求相似度

               4.这样,我们这个文件夹里的图片就可以分为两个反方向了,上效果图看看

    和模板1相似的图片

     和模板2相似的图片

    可以看到明显是分出来的。

    我们上代代码吧

    1. # -*- coding: utf-8 -*-
    2. # @Time : 2022/7/21 17:01
    3. # @Author : guligedong
    4. # coding: utf-8
    5. import operator
    6. import time
    7. from PIL import Image
    8. import numpy as np
    9. import cv2
    10. import os
    11. import shutil
    12. """图片处理: 图片截取、图片相似度比对、哈希算法比对"""
    13. def cmp_pic(pic1, pic2):
    14. """
    15. 比对图片相似度
    16. @param pic1:
    17. @param pic2:
    18. @return:
    19. """
    20. a = Image.open(pic1)
    21. b = Image.open(pic2)
    22. return operator.eq(a, b)
    23. def image_interception(image):
    24. """
    25. 图片截取
    26. @param image: 目标图片
    27. @return:
    28. """
    29. img = cv2.imread(image)
    30. print('图片{}高度、宽度、通道数为:{}'.format(image, img.shape)) # (1792, 828, 3) 高度、宽度、通道数
    31. cropped = img[170:650, 0:900] # 裁剪坐标为[y0:y1, x0:x1]
    32. cv2.imwrite(image, cropped)
    33. return image
    34. def aHash(img):
    35. """
    36. 均值哈希算法
    37. @param img:
    38. @return:
    39. """
    40. # 缩放为8*8
    41. img = cv2.resize(cv2.imread(img), (8, 8))
    42. # 转换为灰度图
    43. gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    44. # s为像素和初值为0,hash_str为hash值初值为''
    45. s = 0
    46. hash_str = ''
    47. # 遍历累加求像素和
    48. for i in range(8):
    49. for j in range(8):
    50. s = s + gray[i, j]
    51. # 求平均灰度
    52. avg = s / 64
    53. # 灰度大于平均值为1相反为0生成图片的hash值
    54. for i in range(8):
    55. for j in range(8):
    56. if gray[i, j] > avg:
    57. hash_str = hash_str + '1'
    58. else:
    59. hash_str = hash_str + '0'
    60. return hash_str
    61. def dHash(img):
    62. """
    63. 差值感知算法
    64. @param img:
    65. @return:
    66. """
    67. # 缩放8*8
    68. img = cv2.resize(cv2.imread(img), (9, 8))
    69. # 转换灰度图
    70. gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    71. hash_str = ''
    72. # 每行前一个像素大于后一个像素为1,相反为0,生成哈希
    73. for i in range(8):
    74. for j in range(8):
    75. if gray[i, j] > gray[i, j + 1]:
    76. hash_str = hash_str + '1'
    77. else:
    78. hash_str = hash_str + '0'
    79. return hash_str
    80. def pHash(img,rotate_flag=False):
    81. """
    82. 感知哈希算法(pHash)
    83. @param img:
    84. @return:
    85. """
    86. # 缩放32*32
    87. img = cv2.resize(cv2.imread(img), (265, 256)) # , interpolation=cv2.INTER_CUBIC
    88. if rotate_flag:
    89. img = cv2.rotate(img,cv2.ROTATE_180)
    90. # 转换为灰度图
    91. gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    92. # 将灰度图转为浮点型,再进行dct变换
    93. dct = cv2.dct(np.float32(gray))
    94. # opencv实现的掩码操作
    95. dct_roi = dct[0:8, 0:8]
    96. hash = []
    97. avreage = np.mean(dct_roi)
    98. for i in range(dct_roi.shape[0]):
    99. for j in range(dct_roi.shape[1]):
    100. if dct_roi[i, j] > avreage:
    101. hash.append(1)
    102. else:
    103. hash.append(0)
    104. return hash
    105. def classify_hist_with_split(image1, image2, size=(256, 256)):
    106. """
    107. 通过得到RGB每个通道的直方图来计算相似度
    108. @param image1:
    109. @param image2:
    110. @param size:
    111. @return:
    112. """
    113. # 将图像resize后,分离为RGB三个通道,再计算每个通道的相似值
    114. image1 = cv2.resize(cv2.imread(image1), size)
    115. image2 = cv2.resize(cv2.imread(image2), size)
    116. sub_image1 = cv2.split(image1)
    117. sub_image2 = cv2.split(image2)
    118. sub_data = 0
    119. for im1, im2 in zip(sub_image1, sub_image2):
    120. sub_data += calculate(im1, im2)
    121. sub_data = sub_data / 3
    122. # print(sub_data)
    123. return sub_data
    124. def calculate(image1, image2):
    125. """
    126. 计算单通道的直方图的相似值
    127. @param image1:
    128. @param image2:
    129. @return:
    130. """
    131. hist1 = cv2.calcHist([image1], [0], None, [256], [0.0, 255.0])
    132. hist2 = cv2.calcHist([image2], [0], None, [256], [0.0, 255.0])
    133. # 计算直方图的重合度
    134. degree = 0
    135. for i in range(len(hist1)):
    136. if hist1[i] != hist2[i]:
    137. degree = degree + (1 - abs(hist1[i] - hist2[i]) / max(hist1[i], hist2[i]))
    138. else:
    139. degree = degree + 1
    140. degree = degree / len(hist1)
    141. return degree
    142. def cmpHash(hash1, hash2):
    143. """
    144. Hash值对比
    145. @param hash1:
    146. @param hash2:
    147. @return:
    148. """
    149. n = 0
    150. # hash长度不同则返回-1代表传参出错
    151. if len(hash1) != len(hash2):
    152. return -1
    153. # 遍历判断
    154. for i in range(len(hash1)):
    155. # 不相等则n计数+1,n最终为相似度
    156. if hash1[i] != hash2[i]:
    157. n = n + 1
    158. return n
    159. if __name__ == '__main__':
    160. base_folder = r'C:\Users\59436\Desktop\0720output\DB30723CAS_Q1_SolderLight\TRAIN'
    161. img1 = base_folder + '/' + '2022-7-19-14-27-7-284797-DB30723CAS_Q1-SolderLight.jpg'
    162. output_folder = r'D:\demo'
    163. if not os.path.exists(output_folder):
    164. os.makedirs(output_folder)
    165. hash_value = pHash(img1)
    166. hash_value_rotate = pHash(img1,True)
    167. print(hash_value)
    168. print(hash_value_rotate)
    169. for i in os.listdir(base_folder):
    170. t1 = time.thread_time()
    171. image2_path = os.path.join(base_folder,i)
    172. result1 = cmpHash(hash_value,pHash(image2_path))
    173. result2 = cmpHash(hash_value_rotate, pHash(image2_path))
    174. t2 = time.thread_time()
    175. if result1 > result2:
    176. save_folder = os.path.join(output_folder,'temp2')
    177. if not os.path.exists(save_folder):
    178. os.makedirs(save_folder)
    179. shutil.copy(image2_path,os.path.join(save_folder,i))
    180. else:
    181. save_folder = os.path.join(output_folder, 'temp1')
    182. if not os.path.exists(save_folder):
    183. os.makedirs(save_folder)
    184. shutil.copy(image2_path,os.path.join(save_folder,i))

    好了不多说了

    salute!!!!老规矩上咩咩

     

  • 相关阅读:
    Linux操作系统的基础知识
    FIR和IIR对比以及群延时和相位延时 网站
    LeetCode - 611.有效三角形个数
    csrf防护机制
    反正切熵(Arctangent entropy):2022.7月最新SCI论文
    Redis学习笔记15:基于spring data redis及lua脚本发送到redis服务器多久过期
    2024年天津农学院专升本增加水文与水资源专业更名报考范围的通知
    美食杰项目 -- 个人主页(四)
    对抗微信如何要把网页都变成快应用
    【Elasticsearch教程8】Mapping字段类型之keyword
  • 原文地址:https://blog.csdn.net/guligedong/article/details/126017788