图像相似算法最全总结

2023年6月18日上午12:05 • 人工智能 • 阅读 65

图像相似算法

比如有图像A和图像B，分别计算两幅图像的直方图，HistA，HistB，然后计算两个直方图的归一化相关系数（巴氏距离，直方图相交距离）等等。

这种思想是基于简单的数学上的向量之间的差异来进行图像相似程度的度量，这种方法是目前用的比较多的一种方法，第一，直方图能够很好的归一化，比如通常的256个bin条的。那么两幅分辨率不同的图像可以直接通过计算直方图来计算相似度很方便。而且计算量比较小。

这种方法的缺点:

（1）直方图反映的是图像像素灰度值的概率分布，比如灰度值为200的像素有多少个，但是对于这些像素原来的位置在直方图中并没有体现，所以图像的骨架，也就是图像内部到底存在什么样的物体，形状是什么，每一块的灰度分布式什么样的这些在直方图信息中是被省略掉得。那么造成的一个问题就是，比如一个上黑下白的图像和上白下黑的图像其直方图分布是一模一样的，其相似度为100%。

（2）两幅图像之间的距离度量，采用的是巴氏距离或者归一化相关系数，这种用分析数学向量的方法去分析图像本身就是一个很不好的办法。

（3）就信息量的道理来说，采用一个数值来判断两幅图像的相似程度本身就是一个信息压缩的过程，那么两个256个元素的向量（假定直方图有256个bin条）的距离用一个数值表示那么肯定就会存在不准确性。

1）单通道直方图（灰度直方图）

def calculate(image1, image2):

&#xA0;&#xA0;&#xA0;&#xA0;# &#x7070;&#x5EA6;&#x76F4;&#x65B9;&#x56FE;&#x7B97;&#x6CD5;

&#xA0;&#xA0;&#xA0;&#xA0;# &#x8BA1;&#x7B97;&#x5355;&#x901A;&#x9053;&#x7684;&#x76F4;&#x65B9;&#x56FE;&#x7684;&#x76F8;&#x4F3C;&#x503C;

&#xA0;&#xA0;&#xA0;&#xA0;hist1 = cv2.calcHist([image1], [0], None, [256], [0.0, 255.0])

&#xA0;&#xA0;&#xA0;&#xA0;hist2 = cv2.calcHist([image2], [0], None, [256], [0.0, 255.0])

&#xA0;&#xA0;&#xA0;&#xA0;# &#x8BA1;&#x7B97;&#x76F4;&#x65B9;&#x56FE;&#x7684;&#x91CD;&#x5408;&#x5EA6;

&#xA0;&#xA0;&#xA0;&#xA0;degree = 0

&#xA0;&#xA0;&#xA0;&#xA0;for i in range(len(hist1)):

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;if hist1[i] != hist2[i]:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;degree = degree + \

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;(1 - abs(hist1[i] - hist2[i]) / max(hist1[i], hist2[i]))

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;else:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;degree = degree + 1

&#xA0;&#xA0;&#xA0;&#xA0;degree = degree / len(hist1)

&#xA0;&#xA0;&#xA0;&#xA0;return degree

2）三通道直方图

def classify_hist_with_split(image1, image2, size=(256, 256)):

&#xA0;&#xA0;&#xA0;&#xA0;# RGB&#x6BCF;&#x4E2A;&#x901A;&#x9053;&#x7684;&#x76F4;&#x65B9;&#x56FE;&#x76F8;&#x4F3C;&#x5EA6;

&#xA0;&#xA0;&#xA0;&#xA0;# &#x5C06;&#x56FE;&#x50CF;resize&#x540E;&#xFF0C;&#x5206;&#x79BB;&#x4E3A;RGB&#x4E09;&#x4E2A;&#x901A;&#x9053;&#xFF0C;&#x518D;&#x8BA1;&#x7B97;&#x6BCF;&#x4E2A;&#x901A;&#x9053;&#x7684;&#x76F8;&#x4F3C;&#x503C;

&#xA0;&#xA0;&#xA0;&#xA0;image1 = cv2.resize(image1, size)

&#xA0;&#xA0;&#xA0;&#xA0;image2 = cv2.resize(image2, size)

&#xA0;&#xA0;&#xA0;&#xA0;sub_image1 = cv2.split(image1)

&#xA0;&#xA0;&#xA0;&#xA0;sub_image2 = cv2.split(image2)

&#xA0;&#xA0;&#xA0;&#xA0;sub_data = 0

&#xA0;&#xA0;&#xA0;&#xA0;for im1, im2 in zip(sub_image1, sub_image2):

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;sub_data += calculate(im1, im2)

&#xA0;&#xA0;&#xA0;&#xA0;sub_data = sub_data / 3

&#xA0;&#xA0;&#xA0;&#xA0;return sub_data

2.哈希算法

图像指纹：图像指纹和人的指纹一样，是身份的象征，而图像指纹简单点来讲，就是将图像按照一定的哈希算法，经过运算后得出的一组二进制数字。

汉明距离：假如一组二进制数据为101，另外一组为111，那么显然把第一组的第二位数据0改成1就可以变成第二组数据111，所以两组数据的汉明距离就为1；简单点说，汉明距离就是一组二进制数据变成另一组数据所需的步骤数，显然，这个数值可以衡量两张图片的差异，汉明距离越小，则代表相似度越高。汉明距离为0，即代表两张图片完全一样。

如何计算得到汉明距离，请看下面三种哈希算法：

1）平均哈希法(aHash)

此算法是基于比较灰度图每个像素与平均值来实现的

一般步骤：

1.缩放图片，一般大小为8*8，64个像素值。

2.转化为灰度图

3.计算平均值：计算进行灰度处理后图片的所有像素点的平均值，直接用numpy中的mean()计算即可。

4.比较像素灰度值：遍历灰度图片每一个像素，如果大于平均值记录为1，否则为0.

5.得到信息指纹：组合64个bit位，顺序随意保持一致性。

6.最后比对两张图片的指纹，获得汉明距离即可。

代码实现：

#&#x5747;&#x503C;&#x54C8;&#x5E0C;&#x7B97;&#x6CD5;

def aHash(img):

&#xA0;&#xA0;&#xA0;&#xA0;#&#x7F29;&#x653E;&#x4E3A;8*8

&#xA0;&#xA0;&#xA0;&#xA0;img=cv2.resize(img,(8,8),interpolation=cv2.INTER_CUBIC)

&#xA0;&#xA0;&#xA0;&#xA0;#&#x8F6C;&#x6362;&#x4E3A;&#x7070;&#x5EA6;&#x56FE;

&#xA0;&#xA0;&#xA0;&#xA0;gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

&#xA0;&#xA0;&#xA0;&#xA0;#s&#x4E3A;&#x50CF;&#x7D20;&#x548C;&#x521D;&#x503C;&#x4E3A;0&#xFF0C;hash_str&#x4E3A;hash&#x503C;&#x521D;&#x503C;&#x4E3A;''

&#xA0;&#xA0;&#xA0;&#xA0;s=0

&#xA0;&#xA0;&#xA0;&#xA0;hash_str=''

&#xA0;&#xA0;&#xA0;&#xA0;#&#x904D;&#x5386;&#x7D2F;&#x52A0;&#x6C42;&#x50CF;&#x7D20;&#x548C;

&#xA0;&#xA0;&#xA0;&#xA0;for i in range(8):

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;for j in range(8):

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;s=s+gray[i,j]

&#xA0;&#xA0;&#xA0;&#xA0;#&#x6C42;&#x5E73;&#x5747;&#x7070;&#x5EA6;

&#xA0;&#xA0;&#xA0;&#xA0;avg=s/64

&#xA0;&#xA0;&#xA0;&#xA0;#&#x7070;&#x5EA6;&#x5927;&#x4E8E;&#x5E73;&#x5747;&#x503C;&#x4E3A;1&#x76F8;&#x53CD;&#x4E3A;0&#x751F;&#x6210;&#x56FE;&#x7247;&#x7684;hash&#x503C;

&#xA0;&#xA0;&#xA0;&#xA0;for i in range(8):

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;for j in range(8):

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;if &#xA0;gray[i,j]>avg:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;hash_str=hash_str+'1'

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;else:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;hash_str=hash_str+'0' &#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;

return hash_str

2）感知哈希算法(pHash)

平均哈希算法过于严格，不够精确，更适合搜索缩略图，为了获得更精确的结果可以选择感知哈希算法，它采用的是DCT（离散余弦变换）来降低频率的方法

一般步骤：

1.缩小图片：32 * 32是一个较好的大小，这样方便DCT计算

2.转化为灰度图

3.计算DCT：利用Opencv中提供的dct()方法，注意输入的图像必须是32位浮点型，所以先利用numpy中的float32进行转换

4.缩小DCT：DCT计算后的矩阵是32 * 32，保留左上角的8 * 8，这些代表的图片的最低频率

5.计算平均值：计算缩小DCT后的所有像素点的平均值。

6.进一步减小DCT：大于平均值记录为1，反之记录为0.

7.得到信息指纹：组合64个信息位，顺序随意保持一致性。

8.最后比对两张图片的指纹，获得汉明距离即可。

代码实现：

import cv2

import numpy as np

from compiler.ast import flatten

import sys

def pHash(imgfile):

&#xA0;&#xA0;&#xA0;&#xA0;"""get image pHash value"""

&#xA0;&#xA0;&#xA0;&#xA0;#&#x52A0;&#x8F7D;&#x5E76;&#x8C03;&#x6574;&#x56FE;&#x7247;&#x4E3A;32x32&#x7070;&#x5EA6;&#x56FE;&#x7247;

&#xA0;&#xA0;&#xA0;&#xA0;img=cv2.imread(imgfile, 0)

&#xA0;&#xA0;&#xA0;&#xA0;img=cv2.resize(img,(64,64),interpolation=cv2.INTER_CUBIC)

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;#&#x521B;&#x5EFA;&#x4E8C;&#x7EF4;&#x5217;&#x8868;

&#xA0;&#xA0;&#xA0;&#xA0;h, w = img.shape[:2]

&#xA0;&#xA0;&#xA0;&#xA0;vis0 = np.zeros((h,w), np.float32)

&#xA0;&#xA0;&#xA0;&#xA0;vis0[:h,:w] = img &#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;#&#x586B;&#x5145;&#x6570;&#x636E;

&#xA0;&#xA0;&#xA0;&#xA0;#&#x4E8C;&#x7EF4;Dct&#x53D8;&#x6362;

&#xA0;&#xA0;&#xA0;&#xA0;vis1 = cv2.dct(cv2.dct(vis0))

&#xA0;&#xA0;&#xA0;&#xA0;#cv.SaveImage('a.jpg',cv.fromarray(vis0)) #&#x4FDD;&#x5B58;&#x56FE;&#x7247;

&#xA0;&#xA0;&#xA0;&#xA0;vis1.resize(32,32)

&#xA0;&#xA0;&#xA0;&#xA0;#&#x628A;&#x4E8C;&#x7EF4;list&#x53D8;&#x6210;&#x4E00;&#x7EF4;list

&#xA0;&#xA0;&#xA0;&#xA0;img_list=flatten(vis1.tolist())

&#xA0;&#xA0;&#xA0;&#xA0;#&#x8BA1;&#x7B97;&#x5747;&#x503C;

&#xA0;&#xA0;&#xA0;&#xA0;avg = sum(img_list)*1./len(img_list)

&#xA0;&#xA0;&#xA0;&#xA0;avg_list = ['0' if i<avg else '1' for i in img_list]     #得到哈希值     return ''.join(['%x' % int(''.join(avg_list[x:x+4]),2) x range(0,32*32,4)]) ''' cv2.imread flags>0&#x65F6;&#x8868;&#x793A;&#x4EE5;&#x5F69;&#x8272;&#x65B9;&#x5F0F;&#x8BFB;&#x5165;&#x56FE;&#x7247;

flags=0&#x65F6;&#x8868;&#x793A;&#x4EE5;&#x7070;&#x5EA6;&#x56FE;&#x65B9;&#x5F0F;&#x8BFB;&#x5165;&#x56FE;&#x7247;

flags<0时表示以图片的本来的格式读入图片 interpolation - 插值方法。共有5种： １）inter_nearest 最近邻插值法 ２）inter_linear 双线性插值法（默认） ３）inter_area 基于局部像素的重采样（resampling using pixel area relation）。对于图像抽取（image decimation）来说，这可能是一个更好的方法。但如果是放大图像时，它和最近邻法的效果类似。 ４）inter_cubic 基于4x4像素邻域的3次插值法 ５）inter_lanczos4 基于8x8像素邻域的lanczos插值< code></0时表示以图片的本来的格式读入图片></avg>

3）差值哈希算法（dHash）

相比pHash，dHash的速度要快的多，相比aHash，dHash在效率几乎相同的情况下的效果要更好，它是基于渐变实现的。

步骤：

1.缩小图片：收缩到9*8的大小，以便它有72的像素点

2.转化为灰度图

3.计算差异值：dHash算法工作在相邻像素之间，这样每行9个像素之间产生了8个不同的差异，一共8行，则产生了64个差异值

4.获得指纹：如果左边的像素比右边的更亮，则记录为1，否则为0.

5.最后比对两张图片的指纹，获得汉明距离即可。

代码实现：

def dHash(img):

&#xA0;&#xA0;&#xA0;&#xA0;#&#x7F29;&#x653E;8*8

&#xA0;&#xA0;&#xA0;&#xA0;img=cv2.resize(img,(9,8),interpolation=cv2.INTER_CUBIC)

&#xA0;&#xA0;&#xA0;&#xA0;#&#x8F6C;&#x6362;&#x7070;&#x5EA6;&#x56FE;

&#xA0;&#xA0;&#xA0;&#xA0;gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

&#xA0;&#xA0;&#xA0;&#xA0;hash_str=''

&#xA0;&#xA0;&#xA0;&#xA0;#&#x6BCF;&#x884C;&#x524D;&#x4E00;&#x4E2A;&#x50CF;&#x7D20;&#x5927;&#x4E8E;&#x540E;&#x4E00;&#x4E2A;&#x50CF;&#x7D20;&#x4E3A;1&#xFF0C;&#x76F8;&#x53CD;&#x4E3A;0&#xFF0C;&#x751F;&#x6210;&#x54C8;&#x5E0C;

&#xA0;&#xA0;&#xA0;&#xA0;for i in range(8):

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;for j in range(8):

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;if &#xA0;&#xA0;gray[i,j]>gray[i,j+1]:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;hash_str=hash_str+'1'

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;else:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;hash_str=hash_str+'0'

&#xA0;&#xA0;&#xA0;&#xA0;return hash_str

3.数学上的矩阵分解

图像本身就是一个矩阵，可以依靠数学上矩阵分解的一些知识来获取矩阵中一些代表这个矩阵元素值和分布的一些鲁棒性特征来对图像的相似度进行计算。

最常用的一般是SVD分解和NMF分解。

下面简单介绍下SVD分解的一些性质

（1）奇异值的稳定性；

（2）奇异值的比例不变性；

（3）奇异值的旋转不变性；

（4）奇异值的压缩性。

综上所述，可以看出奇异值分解是基于整体的表示。图像奇异值特征向量不但具有正交变换、旋转、位移、镜像映射等代数和几何上的不变性,而且具有良好的稳定性和抗噪性，广泛应用于模式识别与图像分析中。对图像进行奇异值分解的目的是：得到唯一、稳定的特征描述；降低特征空间的维数；提高抵抗干扰和噪声的能力。但是由于奇异值分解得到的奇异矢量中有负数存在所以不能很好的解释其物理意义。

非负矩阵分解(NMF):

NMF的主要思想是将非负矩阵分解为可以体现图像主要信息的基矩阵与系数矩阵，并且可以对基矩阵赋予很好的解释，比如对人脸的分割，得到的基向量正是人的”眼睛”，”鼻子”等主要概念特征，源图像表示为这些特征的加权组合。所以NMF算法也在人脸识别等场合中发挥着巨大的作用。

4.基于特征点的图像相似度计算

每一幅图像都有自己的特征点，这些特征点表征图像中比较重要的一些位置，比较类似函数的拐点那种，通常比较常用的有Harris角点和Sift特征点。那么将得到的图像角点进行比较，如果相似的角点数目较多，那么可以认为这两幅图像的相似程度较高。这里主要介绍基于Sift算子。

那么我们就可以通过找到匹配点的个数来判断两幅图像是否一致，这个算法的好处是对于一个物体，两个不同角度下得到的照片依然可以找到很多的匹配点，我也一直认为是一个综合来说结果相对较为准确的方法，但是由于每个特征点需要计算一个长度不小的特征值，也造成了该算法的时间消耗比较大。所以不常用于实时的视频处理。这个算法还有一个好处就是可以通过找到的匹配特征点进行图像校正。

SSIM（结构相似性度量）

这是一种全参考的图像质量评价指标，分别从亮度、对比度、结构三个方面度量图像相似性。

SSIM取值范围[0, 1]，值越大，表示图像失真越小。

在实际应用中，可以利用滑动窗将图像分块，令分块总数为N，考虑到窗口形状对分块的影响，采用高斯加权计算每一窗口的均值、方差以及协方差，然后计算对应块的结构相似度SSIM，最后将平均值作为两图像的结构相似性度量，即平均结构相似性SSIM。

代码实现：

from skimage.measure import compare_ssim

from scipy.misc import imread

import numpy as np

img1 = imread('1.jpg')

img2 = imread('2.jpg')

img2 = np.resize(img2, (img1.shape[0], img1.shape[1], img1.shape[2]))

print(img2.shape)

print(img1.shape)

ssim = compare_ssim(img1, img2, multichannel=True)

print(ssim)

6.cosin相似度（余弦相似度）

把图片表示成一个向量，通过计算向量之间的余弦距离来表征两张图片的相似度。

代码实现：

from PIL import Image

from numpy import average, linalg, dot

&#xA0;

&#xA0;

def get_thumbnail(image, size=(1200, 750), greyscale=False):

&#xA0;&#xA0;&#xA0;&#xA0;image = image.resize(size, Image.ANTIALIAS)

&#xA0;&#xA0;&#xA0;&#xA0;if greyscale:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;image = image.convert('L')

&#xA0;&#xA0;&#xA0;&#xA0;return image

&#xA0;

&#xA0;

def image_similarity_vectors_via_numpy(image1, image2):

&#xA0;

&#xA0;&#xA0;&#xA0;&#xA0;image1 = get_thumbnail(image1)

&#xA0;&#xA0;&#xA0;&#xA0;image2 = get_thumbnail(image2)

&#xA0;&#xA0;&#xA0;&#xA0;images = [image1, image2]

&#xA0;&#xA0;&#xA0;&#xA0;vectors = []

&#xA0;&#xA0;&#xA0;&#xA0;norms = []

&#xA0;&#xA0;&#xA0;&#xA0;for image in images:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;vector = []

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;for pixel_tuple in image.getdata():

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;vector.append(average(pixel_tuple))

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;vectors.append(vector)

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;norms.append(linalg.norm(vector, 2))

&#xA0;&#xA0;&#xA0;&#xA0;a, b = vectors

&#xA0;&#xA0;&#xA0;&#xA0;a_norm, b_norm = norms

&#xA0;&#xA0;&#xA0;&#xA0;res = dot(a / a_norm, b / b_norm)

&#xA0;&#xA0;&#xA0;&#xA0;return res

&#xA0;

&#xA0;

image1 = Image.open('1.jpg')

image2 = Image.open('2.jpg')

cosin = image_similarity_vectors_via_numpy(image1, image2)

&#xA0;

print(cosin)

7.基于互信息（Mutual Information）

通过计算两个图片的互信息来表征他们之间的相似度。

代码实现：

from sklearn import metrics as mr

from scipy.misc import imread

import numpy as np

&#xA0;

img1 = imread('1.jpg')

img2 = imread('2.jpg')

&#xA0;

img2 = np.resize(img2, (img1.shape[0], img1.shape[1], img1.shape[2]))

&#xA0;

img1 = np.reshape(img1, -1)

img2 = np.reshape(img2, -1)

print(img2.shape)

print(img1.shape)

mutual_infor = mr.mutual_info_score(img1, img2)

&#xA0;

print(mutual_infor)

8.计算图像的”指纹信息”

将图像归一化成一定大小，计算一个序列作为他的指纹信息，然后比较两张图片指纹信息序列相同的位数。如果不相同的数据位不超过5，就说明两张图片很相似；如果大于10，就说明这是两张不同的图片。

9.MD5

粗暴的md5比较返回是否完全相同

代码实现：


def md5_similarity(img1_path, img2_path):
    file1 = open(img1_path, "rb")
    file2 = open(img2_path, "rb")
    md = hashlib.md5()
    md.update(file1.read())
    res1 = md.hexdigest()
    md = hashlib.md5()
    md.update(file2.read())
    res2 = md.hexdigest()
    return res1 == res2

10.PSNR

代码实现：

def PSNR(img1, img2):

&#xA0;&#xA0;&#xA0;&#xA0;mse = np.mean((img1/255. - img2/255.) ** 2)

&#xA0;&#xA0;&#xA0;&#xA0;if mse == 0:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;return 100

&#xA0;&#xA0;&#xA0;&#xA0;PIXEL_MAX = 1

&#xA0;&#xA0;&#xA0;&#xA0;return 20 * math.log10(PIXEL_MAX / math.sqrt(mse))

11.图片相似度算法（对像素求方差并比对）的学习

步骤：

1)缩放图片

将需要处理的图片所放到指定尺寸，缩放后图片大小由图片的信息量和复杂度决定。譬如，一些简单的图标之类图像包含的信息量少，复杂度低，可以缩放小一点。风景等复杂场景信息量大，复杂度高就不能缩放太小，容易丢失重要信息。根据自己需求，弹性的缩放。在效率和准确度之间维持平衡。

2)灰度处理

通常对比图像相似度和颜色关系不是很大，所以处理为灰度图，减少后期计算的复杂度。如果有特殊需求则保留图像色彩。

3)计算平均值

此处开始，与传统的哈希算法不同：分别依次计算图像每行像素点的平均值，记录每行像素点的平均值。每一个平均值对应着一行的特征。

4)计算方差

对得到的所有平均值进行计算方差，得到的方差就是图像的特征值。方差可以很好的反应每行像素特征的波动，既记录了图片的主要信息。

5)比较方差

经过上面的计算之后，每张图都会生成一个特征值（方差）。到此，比较图像相似度就是比较图像生成方差的接近成程度。
一组数据方差的大小可以判断稳定性，多组数据方差的接近程度可以反应数据波动的接近程度。我们不关注方差的大小，只关注两个方差的差值的大小。方差差值越小图像越相似！

代码实现：

import cv2

import matplotlib.pyplot as plt

&#xA0;

#&#x8BA1;&#x7B97;&#x65B9;&#x5DEE;

def getss(list):

&#xA0;&#xA0;&#xA0;&#xA0;#&#x8BA1;&#x7B97;&#x5E73;&#x5747;&#x503C;

&#xA0;&#xA0;&#xA0;&#xA0;avg=sum(list)/len(list)

&#xA0;&#xA0;&#xA0;&#xA0;#&#x5B9A;&#x4E49;&#x65B9;&#x5DEE;&#x53D8;&#x91CF;ss&#xFF0C;&#x521D;&#x503C;&#x4E3A;0

&#xA0;&#xA0;&#xA0;&#xA0;ss=0

&#xA0;&#xA0;&#xA0;&#xA0;#&#x8BA1;&#x7B97;&#x65B9;&#x5DEE;

&#xA0;&#xA0;&#xA0;&#xA0;for l in list:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;ss+=(l-avg)*(l-avg)/len(list)

&#xA0;&#xA0;&#xA0;&#xA0;#&#x8FD4;&#x56DE;&#x65B9;&#x5DEE;

&#xA0;&#xA0;&#xA0;&#xA0;return ss

&#xA0;

#&#x83B7;&#x53D6;&#x6BCF;&#x884C;&#x50CF;&#x7D20;&#x5E73;&#x5747;&#x503C;

def getdiff(img):

&#xA0;&#xA0;&#xA0;&#xA0;#&#x5B9A;&#x4E49;&#x8FB9;&#x957F;

&#xA0;&#xA0;&#xA0;&#xA0;Sidelength=30

&#xA0;&#xA0;&#xA0;&#xA0;#&#x7F29;&#x653E;&#x56FE;&#x50CF;

&#xA0;&#xA0;&#xA0;&#xA0;img=cv2.resize(img,(Sidelength,Sidelength),interpolation=cv2.INTER_CUBIC)

&#xA0;&#xA0;&#xA0;&#xA0;#&#x7070;&#x5EA6;&#x5904;&#x7406;

&#xA0;&#xA0;&#xA0;&#xA0;gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

&#xA0;&#xA0;&#xA0;&#xA0;#avglist&#x5217;&#x8868;&#x4FDD;&#x5B58;&#x6BCF;&#x884C;&#x50CF;&#x7D20;&#x5E73;&#x5747;&#x503C;

&#xA0;&#xA0;&#xA0;&#xA0;avglist=[]

&#xA0;&#xA0;&#xA0;&#xA0;#&#x8BA1;&#x7B97;&#x6BCF;&#x884C;&#x5747;&#x503C;&#xFF0C;&#x4FDD;&#x5B58;&#x5230;avglist&#x5217;&#x8868;

&#xA0;&#xA0;&#xA0;&#xA0;for i in range(Sidelength):

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;avg=sum(gray[i])/len(gray[i])

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;avglist.append(avg)

&#xA0;&#xA0;&#xA0;&#xA0;#&#x8FD4;&#x56DE;avglist&#x5E73;&#x5747;&#x503C;

&#xA0;&#xA0;&#xA0;&#xA0;return avglist

&#xA0;

#&#x8BFB;&#x53D6;&#x6D4B;&#x8BD5;&#x56FE;&#x7247;

img1=cv2.imread("james.jpg")

diff1=getdiff(img1)

print('img1:',getss(diff1))

&#xA0;

#&#x8BFB;&#x53D6;&#x6D4B;&#x8BD5;&#x56FE;&#x7247;

img11=cv2.imread("durant.jpg")

diff11=getdiff(img11)

print('img11:',getss(diff11))

&#xA0;

ss1=getss(diff1)

ss2=getss(diff11)

print("&#x4E24;&#x5F20;&#x7167;&#x7247;&#x7684;&#x65B9;&#x5DEE;&#x4E3A;&#xFF1A;%s"%(abs(ss1-ss2)))

&#xA0;

x=range(30)

&#xA0;

plt.figure("avg")

plt.plot(x,diff1,marker="*",label="$jiames$")

plt.plot(x,diff11,marker="*",label="$durant$")

plt.title("avg")

plt.legend()

plt.show()

&#xA0;

&#xA0;

cv2.waitKey(0)

cv2.destroyAllWindows()

Original: https://blog.csdn.net/weixin_52950958/article/details/125737406
Author: xukobe97
Title: 图像相似算法最全总结

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/632722/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

雷达图-高效数据解读

雷达图又被叫做蜘蛛网图，适用于显示三个或更多的维度的变量。大家最熟悉的莫过于游戏中的数据分析（如下图）。雷达图是以在同一点开始的轴上显示三个或更多个变量的二维图表形式来显示多元…

人工智能 2023年7月16日
0076
人工智能/虚拟现实技术的工程伦理分析：以电影《头号玩家》为例

*人工智能已经迎来第三次浪潮，一方面，人工智能已经应用于社会的方方面面，并日益发挥着无可替代的作用；另一方面，人工智能存在着局限性以及争议。本文聚焦于人工智能的一个争议点：人工智…

人工智能 2023年7月30日
0094
Jetson Xavier NX系统烧录(使用NVIDIA SDK Manager)

目录一、在host主机下安装NVIDIA SDK Manager 二、安装系统镜像三、设置SSD为系统启动项四、安装CUDA等环境的包注意：本文使用的是国产开发套件，不支持…

人工智能 2023年7月27日
0080
如何解决深度学习中的梯度爆炸问题

深度学习中的梯度爆炸问题及其解决方案在深度学习的训练过程中，经常会遇到梯度爆炸的问题，即模型参数的梯度值变得特别大，导致训练过程变得不稳定。这种情况下，模型的权重更新过大，往往会…

人工智能 2024年1月1日
0037
图解机器学习之回归模型性能评估指标

一个房价预测的任务，老板说你看看这个模型咋样？我们先绘制一个坐标轴： Y 轴为房价，X 轴为年份。将过去房价数据绘制为绿色，回归模型绘制为蓝色。关键问题是，怎么知道这个模型的好坏呢…

人工智能 2023年6月17日
0073
什么是数据标注？数据标注公司主要做什么？

一、什么是数据标注？ 1.数据标注定义数据标注是对未经处理的语音、图片、文本、视频等数据进行加工处理, 并转换为机器可识别信息的过程。原始数据一般通过数据采集获得, 随后的数据…

人工智能 2023年6月15日
0084
【pytorch】关于OpenCV和PIL.Image读取图片的区别

首先从pytorch出发，torchvision.transforms()要求传入的图像是PIL.Image格式（通道要求是RGB格式的），另外模型处理输入要转换为[1,chann…

人工智能 2023年7月19日
0044
RNA-seq Review：RNA-seq数据分析

文献：RNA-seq数据分析最佳实践调查 Genome Biology 2016 ReviewA survey of best practices for RNA-seq data…

人工智能 2023年7月16日
0068
用户分析与RFM模型实战｜一个可以写在简历上的项目（下）

大家好，我是芒果。接上文：用户分析与RFM模型实战｜一个可以写在简历上的项目（上）本篇会继续对此数据对产品维度和用户分层维度进行分析。依然结论先行：重要结论🏅 3、产品维度…

人工智能 2023年6月11日
0084
ZED2跑ORB-SLAM3+双目相机、IMU联合标定+显卡驱动与cuda/cudnn安装

一、引言同样是项目需求，需要利用视觉惯性导航做一些开发，所以第一步先做些算法的测试–仿真与实物测验，通过仿真的测试结果，最终是决定使用ORB-SLAM3来完成任务，当然了，Vin…

人工智能 2023年6月24日
0087
图像生成——总结

评价指标 Inception Score（IS）计算这个 score 需要用到 Inception Net-V3，评价一个生成模型，需要考虑两个方面的性能：是否清晰。是否多样…

人工智能 2023年6月15日
0088
深度学习中图像格式选用jpg还是png？答：png

目录 1. 参考链接 2. 结论 3. 将jpg转为png的代码（使用PIL库）参考链接 jpeg 与 png 图片格式的区别 png、jpg图片格式的区别及一个有趣逐步尝试的…

人工智能 2023年7月19日
0057
【神经网络】MLP 编码器-解码器注意力机制残差连接

[1] 多层感知机(MLP) 最典型的MLP包括包括三层：输入层、隐层和输出层，MLP神经网络不同层之间是全连接的（全连接的意思就是：上一层的任何一个神经元与下一层的所有神经元都有…

人工智能 2023年7月12日
0055
“OSError: [WinError 1455]页面文件太小，无法完成操作。”解决方案

“OSError: [WinError 1455]页面文件太小，无法完成操作”解决方案引言 1 问题原因 2 解决方案引言某次在Windows系统上跑…

人工智能 2023年6月26日
0086
基于CNN卷积神经网络实现mnist手写数据集识别

目录 * – 一、CNN理论 – + 1. CNN结构 + 2. 卷积层 + * 2.1 卷积运算 * 2.2 填充 * 2.3 步幅 * 2.4 三维数据…

人工智能 2023年6月25日
0068
度秘语音引擎app_三款语音写作App的选择

最近，我想尝试拼音写作的方式。如此一来，对于一些题材(尤其是小说)的写作，不仅节省了大量的码字时间，还促使我利用其他时间写作。 [En] Recently, I want to t…

人工智能 2023年5月27日
00115

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

图像相似算法最全总结

大家都在看