网络编程
位置:首页>> 网络编程>> Python编程>> python OpenCV计算图片相似度的5种算法

python OpenCV计算图片相似度的5种算法

作者:Waldenz  发布时间:2023-12-31 15:59:14 

标签:OpenCV,图片相似度

原始两张图片:

python OpenCV计算图片相似度的5种算法

代码运行结果如下。

python OpenCV计算图片相似度的5种算法

5种算法

值哈希算法差值哈希算法感知哈希算法都是值越小,相似度越高,取值为0-64,即汉明距离中,64位的hash值有多少不同。 三直方图单通道直方图的值为0-1,值越大,相似度越高。

源代码如下:

import cv2
import numpy as np
from PIL import Image
import requests
from io import BytesIO
import matplotlib
matplotlib.use('TkAgg')
import matplotlib.pyplot as plt

def aHash(img):
   # 均值哈希算法
   # 缩放为8*8
   img = cv2.resize(img, (8, 8))
   # 转换为灰度图
   gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
   # s为像素和初值为0,hash_str为hash值初值为''
   s = 0
   hash_str = ''
   # 遍历累加求像素和
   for i in range(8):
       for j in range(8):
           s = s+gray[i, j]
   # 求平均灰度
   avg = s/64
   # 灰度大于平均值为1相反为0生成图片的hash值
   for i in range(8):
       for j in range(8):
           if gray[i, j] > avg:
               hash_str = hash_str+'1'
           else:
               hash_str = hash_str+'0'
   return hash_str

def dHash(img):
   # 差值哈希算法
   # 缩放8*8
   img = cv2.resize(img, (9, 8))
   # 转换灰度图
   gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
   hash_str = ''
   # 每行前一个像素大于后一个像素为1,相反为0,生成哈希
   for i in range(8):
       for j in range(8):
           if gray[i, j] > gray[i, j+1]:
               hash_str = hash_str+'1'
           else:
               hash_str = hash_str+'0'
   return hash_str

def pHash(img):
   # 感知哈希算法
   # 缩放32*32
   img = cv2.resize(img, (32, 32))   # , interpolation=cv2.INTER_CUBIC

# 转换为灰度图
   gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
   # 将灰度图转为浮点型,再进行dct变换
   dct = cv2.dct(np.float32(gray))
   # opencv实现的掩码操作
   dct_roi = dct[0:8, 0:8]

hash = []
   avreage = np.mean(dct_roi)
   for i in range(dct_roi.shape[0]):
       for j in range(dct_roi.shape[1]):
           if dct_roi[i, j] > avreage:
               hash.append(1)
           else:
               hash.append(0)
   return hash

def calculate(image1, image2):
   # 灰度直方图算法
   # 计算单通道的直方图的相似值
   hist1 = cv2.calcHist([image1], [0], None, [256], [0.0, 255.0])
   hist2 = cv2.calcHist([image2], [0], None, [256], [0.0, 255.0])
   # 计算直方图的重合度
   degree = 0
   for i in range(len(hist1)):
       if hist1[i] != hist2[i]:
           degree = degree + \
               (1 - abs(hist1[i] - hist2[i]) / max(hist1[i], hist2[i]))
       else:
           degree = degree + 1
   degree = degree / len(hist1)
   return degree

def classify_hist_with_split(image1, image2, size=(256, 256)):
   # RGB每个通道的直方图相似度
   # 将图像resize后,分离为RGB三个通道,再计算每个通道的相似值
   image1 = cv2.resize(image1, size)
   image2 = cv2.resize(image2, size)
   sub_image1 = cv2.split(image1)
   sub_image2 = cv2.split(image2)
   sub_data = 0
   for im1, im2 in zip(sub_image1, sub_image2):
       sub_data += calculate(im1, im2)
   sub_data = sub_data / 3
   return sub_data

def cmpHash(hash1, hash2):
   # Hash值对比
   # 算法中1和0顺序组合起来的即是图片的指纹hash。顺序不固定,但是比较的时候必须是相同的顺序。
   # 对比两幅图的指纹,计算汉明距离,即两个64位的hash值有多少是不一样的,不同的位数越小,图片越相似
   # 汉明距离:一组二进制数据变成另一组数据所需要的步骤,可以衡量两图的差异,汉明距离越小,则相似度越高。汉明距离为0,即两张图片完全一样
   n = 0
   # hash长度不同则返回-1代表传参出错
   if len(hash1) != len(hash2):
       return -1
   # 遍历判断
   for i in range(len(hash1)):
       # 不相等则n计数+1,n最终为相似度
       if hash1[i] != hash2[i]:
           n = n + 1
   return n

def getImageByUrl(url):
   # 根据图片url 获取图片对象
   html = requests.get(url, verify=False)
   image = Image.open(BytesIO(html.content))
   return image

def PILImageToCV():
   # PIL Image转换成OpenCV格式
   path = "/Users/waldenz/Documents/Work/doc/TestImages/t3.png"
   img = Image.open(path)
   plt.subplot(121)
   plt.imshow(img)
   print(isinstance(img, np.ndarray))
   img = cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)
   print(isinstance(img, np.ndarray))
   plt.subplot(122)
   plt.imshow(img)
   plt.show()

def CVImageToPIL():
   # OpenCV图片转换为PIL image
   path = "/Users/waldenz/Documents/Work/doc/TestImages/t3.png"
   img = cv2.imread(path)
   # cv2.imshow("OpenCV",img)
   plt.subplot(121)
   plt.imshow(img)

img2 = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
   plt.subplot(122)
   plt.imshow(img2)
   plt.show()

def bytes_to_cvimage(filebytes):
   # 图片字节流转换为cv image
   image = Image.open(filebytes)
   img = cv2.cvtColor(np.asarray(image), cv2.COLOR_RGB2BGR)
   return img

def runAllImageSimilaryFun(para1, para2):
   # 均值、差值、感知哈希算法三种算法值越小,则越相似,相同图片值为0
   # 三直方图算法和单通道的直方图 0-1之间,值越大,越相似。 相同图片为1

# t1,t2   14;19;10;  0.70;0.75
   # t1,t3   39 33 18   0.58 0.49
   # s1,s2  7 23 11     0.83 0.86  挺相似的图片
   # c1,c2  11 29 17    0.30 0.31

if para1.startswith("http"):
        # 根据链接下载图片,并转换为opencv格式
       img1 = getImageByUrl(para1)
       img1 = cv2.cvtColor(np.asarray(img1), cv2.COLOR_RGB2BGR)

img2 = getImageByUrl(para2)
       img2 = cv2.cvtColor(np.asarray(img2), cv2.COLOR_RGB2BGR)
   else:
       # 通过imread方法直接读取物理路径
       img1 = cv2.imread(para1)
       img2 = cv2.imread(para2)

hash1 = aHash(img1)
   hash2 = aHash(img2)
   n1 = cmpHash(hash1, hash2)
   print('均值哈希算法相似度aHash:', n1)

hash1 = dHash(img1)
   hash2 = dHash(img2)
   n2 = cmpHash(hash1, hash2)
   print('差值哈希算法相似度dHash:', n2)

hash1 = pHash(img1)
   hash2 = pHash(img2)
   n3 = cmpHash(hash1, hash2)
   print('感知哈希算法相似度pHash:', n3)

n4 = classify_hist_with_split(img1, img2)
   print('三直方图算法相似度:', n4)

n5 = calculate(img1, img2)
   print("单通道的直方图", n5)
   print("%d %d %d %.2f %.2f " % (n1, n2, n3, round(n4[0], 2), n5[0]))
   print("%.2f %.2f %.2f %.2f %.2f " % (1-float(n1/64), 1 -
                                        float(n2/64), 1-float(n3/64), round(n4[0], 2), n5[0]))

plt.subplot(121)
   plt.imshow(Image.fromarray(cv2.cvtColor(img1, cv2.COLOR_BGR2RGB)))
   plt.subplot(122)
   plt.imshow(Image.fromarray(cv2.cvtColor(img2, cv2.COLOR_BGR2RGB)))
   plt.show()

if __name__ == "__main__":
   p1="https://ww3.sinaimg.cn/bmiddle/007INInDly1g336j2zziwj30su0g848w.jpg"
   p2="https://ww2.sinaimg.cn/bmiddle/007INInDly1g336j10d32j30vd0hnam6.jpg"
   runAllImageSimilaryFun(p1,p2)

以下为测试了一些图片的相似度值。

五个值分别代表 均值哈希算法相似度、差值哈希算法相似度、感知哈希算法相似度、三直方算法相似度、单通道直方图相似度 

python OpenCV计算图片相似度的5种算法

python OpenCV计算图片相似度的5种算法

参考文章:

https://www.cnblogs.com/dcb3688/p/4610660.html

https://blog.csdn.net/haofan_/article/details/77097473

https://blog.csdn.net/feimengjuan/article/details/51279629

来源:https://blog.csdn.net/enter89/article/details/90293971

0
投稿

猜你喜欢

  •  我的机器不知为何,安装MySQL的时候,一到配置那一步就无休止的等待,只好结束任务,然而启动MySQL的时候出现1067错误提示
  • 最好也是最简单的办法就是利用Cookie,而不必用到数据库。当然,你愿意用数据库也可以。下面就是利用Cookie来实现的:< 
  • 阅读目录什么是设计模式单体模式:工厂模式:单例模式观察者模式(发布订阅模式)策略模式模板模式代理模式外观模式设计模式太多了,貌似有23种,其
  • 我们可以用动态产生变量的方法,从表格里捕捉数据,动态地创造“剥离”变量引号并且“清理”它,见下列代码,我们只需键入变量名称,选择 query
  • 主要原理:调整dicom的窗宽,使之各个像素点上的灰度值缩放至[0,255]范围内。使用到的python库:SimpleITK下面是一个将d
  • 什么是模板匹配模板匹配是指在当前图像A内寻找与图像B最相似的部分,可以理解找茬,但是这里是找出一样的信息。一般我们将图像A称为输入图像,将图
  • 本文实例讲述了Python实现基于C/S架构的聊天室功能。分享给大家供大家参考,具体如下:一、课程介绍1.简介本次项目课是实现简单聊天室程序
  • 我们平常用 IE 打开一个普通的本地 xml 文件,其形式通常都是如下图: 默认样式看得多了就不觉得有什么特别。但对于少接触 xml 的人来
  • 这些包可以独立使用,也可以与其他包一起使用以满足复杂的业务需求。Integration Services 可以提取和转换来自多种源(如 XM
  • uniapp页面跳转的几种方式一、uni.navigateTo定义:保留当前页面,跳转到应用内的某个页面,使用uni.navigateBac
  • 对于大多数web应用来说,数据库都是一个十分基础性的部分。如果你在使用PHP,那么你很可能也在使用MySQL—LAMP系列中举足轻重的一份子
  • Python是编译型语言还是解释型语言?回答这个问题前,应该先弄清楚什么是编译型语言,什么是解释型语言。所谓编译执行就是源代码经过编译器编译
  • 测试题defer有一些规则,如果不了解,代码实现的最终结果会与预期不一致。对于这些规则,你了解吗?这是关于defer使用的代码,可以先考虑一
  • 本文实例为大家分享了Django实现文件上传下载的具体代码,供大家参考,具体内容如下一、django实现文件下载(1)、后台接口如果从服务器
  • 图片的宽度和高度是未知的,没有一个固定的尺寸,在这个前提下要使图片在一个固定了宽度和高度的容器中垂直居中,想想感觉还是挺麻烦的,由于最近的项
  • 嵌套SELECT语句也叫子查询,形如:SELECT name FROM bbc WHERE region = (SELECT region
  • WTForms 是用于web开发的灵活的表单验证和呈现库,它可以与您选择的任何web框架和模板引擎一起工作,并支持数据验证、CSRF保护、国
  • HTML是万维网上发布超文本的通用语言[1]。从1982年Tim Berners-Lee简化SGML建立HTML的原始定义到2001年发布X
  • 1.什么是property简单地说就是一个类里面的方法一旦被@property装饰,就可以像调用属性一样地去调用这个方法,它能够简化调用者获
  •  JAN-1(January) FEB-2(February) MAR-3(March)APR-4(April) MAY-5(Ma
手机版 网络编程 asp之家 www.aspxhome.com