基于单应矩阵的图像拼接

2023年7月19日下午5:52 • 人工智能 • 阅读 44

首先我们看看这个方法的图像拼接的效果：

依次这是我们的左图和右图，和最后拼接的效果图：

看了图片如果感兴趣的话，就可以接着往下看了。

一、单应矩阵

二、ORB特征点提取和匹配

三、计算单应矩阵进行图像拼接

一、单应矩阵

Homography单应矩阵通常描述处于共同平面上的一些点在两种图像之间的变换关系，来以此描述了两个平面之间的映射关系。用公式表示的话就是：

x= H*x</p> <p>x为一张图像上的特征点位置，H为两种图像的单应矩阵，x是同一个特征点在另一张图像上的位置。同一平面被两个处于不同位置的相机观测，或者同一个相机观测到的两个相同的，但位置不同的物体，可以通过单应性进行运动估计相机的运动或物体的运动。

Homography指用同一个源得到的图像，中文译过来就是”单应”，当我们得到了一个相机移动拍的两个对应的图像的单应矩阵，我们就可以用它来将其中一张图像里的点全部转换到另一张图像的”视角”，”视角”我觉得可以理解为以相机为原点的3维空间坐标系，然后又转到图像平面坐标系上，对应的坐标拼接起来，就可以将两种图片比较好的拼接起来了，达到了一个广角相机的效果。

那么这个单应矩阵怎么求喃？我们一般用两张图像里的相同特征点来对它进行估计。简单来说就是获得x和x`后，求出我们的H。

二、ORB特征点提取和匹配

获取特征点的方法有很多，SIFT、ORB等等，这里我选择了ORB，因为它的时间消耗更少一些，ORB特征检测还具有尺度和旋转不变性，对于噪声及其透视变换也具有不变性，良好的性能使的利用ORB在进行特征描述时的应用场景十分广泛。（原理网上到处都有，我就不说了）

在opencv里也有对应的接口

import cv2 as cv
import numpy as np
left = cv.imread("./2020327121640383.jpg")
right = cv.imread("./2020327121732853.jpg")

orb = cv.ORB_create()

keypoint_left = orb.detect(left)
keypoint_right = orb.detect(right)
keypoint_left, describetion_left = orb.compute(left, keypoint_left)
keypoint_right, describetion_right = orb.compute(right,keypoint_right)

show_keypoint_left = cv.drawKeypoints(left, keypoints=keypoint_left, outImage=None)
show_keypoint_right = cv.drawKeypoints(right, keypoints=keypoint_right,outImage=None)

得到特征点后，我们要找出左右相似的特征点作为特征点对，认为这是同一个物体的特征点，这时就需要对他们进行匹配。这里我选择了BF特征匹配算法，以hamming距离作为度量，BF简单来说就是拿图像中的一个特征点与另一张图像中的还没有匹配上的特征点做比较来找出最匹配的特征点。当然这样就会导致最后不相似的特征点也会匹配到一起，这时，我们就需要做一下过滤，根据实际情况设置匹配成功条件，我这儿设置的是特征点hamming距离不能低于最小距离的2倍，不能超过最大距离的1/3。效果如下所示，连线的就是匹配成功的特征点。

matcher = cv.BFMatcher(cv.NORM_HAMMING)
match_result = matcher.match(describetion_left, describetion_right)

min_distance = match_result[0].distance
max_distance = match_result[0].distance
for i in match_result:
    if i.distance < min_distance:
        min_distance = i.distance
    if i.distance > max_distance:
        max_distance = i.distance

filter_result = []
for j in match_result:
    if j.distance >= max(min_distance*2, 10):
        if j.distance

三、计算单应矩阵进行图像拼接

得到特征点对后，就是计算单应矩阵了，注意因为单应矩阵是具有矩阵模||H|| = 1的约束，所以至少要有4对特征点才能计算出来，我们可以用opencv的cv.findHomography()来计算它，还可以得到一个mask是它验证得到你给的特征点对是否可用的掩码。计算得到单应矩阵H后，就可以对图像进行映射了，最后将两个图像拼接在一起就大功告成了。图像的拼接有重叠部分，我选择了用右图对左图进行覆盖，填充部分全为0。简单粗暴，这也是后面可以优化的点，对拼接部分的平滑处理以及填充部分的背景处理都是值得思考的地方。

if len(filter_result) > 3:
    keypoint_left = np.float32([keypoint_left[k.queryIdx].pt for k in filter_result]).reshape(-1,1,2)
    keypoint_right = np.float32([keypoint_right[k.trainIdx].pt for k in filter_result]).reshape(-1,1,2)
    # M,MASK = cv.findFundamentalMat(keypoint_left, keypoint_right, cv.FM_RANSAC, 5)
    matrix, mask = cv.findHomography(keypoint_right, keypoint_left,cv.RANSAC, 3.0)
    print("trans matrix: ",matrix)
    print("++++++++++++++++++++++++++++++")
    # print("len of mask: ", len(mask))
    print(mask)

    match_mask = mask.ravel().tolist()
    points = np.float32([[0,0],[0,h-1],[w-1,h-1],[w-1,0]]).reshape(-1,1,2)
    dest_point = cv.perspectiveTransform(points, matrix)
    print("dest points: ",dest_point)
    final_image = np.zeros([h,2*w,3],dtype = "uint8")
    warp_image = cv.warpPerspective(right, matrix, (2*w, h), flags=cv.INTER_LINEAR)
    # cv.imshow("warp image",warp_image)
    final_image[0:h,0:w] = left
    for i in range(h):
        for j in range(2*w):
            if (warp_image[i][j].any() != 0):
                final_image[i][j] = warp_image[i][j]

参考代码gitee地址：Image Stitchin: 基于单应（Homography）矩阵的图像拼接

Original: https://blog.csdn.net/qq_45819091/article/details/125492246
Author: 在努力的松鼠
Title: 基于单应矩阵的图像拼接

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/703327/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

科沃斯扫地机器人无语音提示_科沃斯机器人DN33常见问题汇总

科沃斯机器人作为国产扫地机器人的龙头老大，扫地机器人产品也是遍布全国，那么多人购买科沃斯扫地机器人产品，难免会遇到这样那样的问题。经常有朋友留言问些DN33的问题，这里扫地机器人网…

人工智能 2023年5月27日
00394
花卉识别(tensorflow)

参考教材：人工智能导论(第4版) 王万良高等教育出版社实验环境：Python3.6 + Tensor flow 1.12 人工智能导论实验导航实验一：斑马问题 https://…

人工智能 2023年5月23日
0067
Python中unique()用法及代码示例

在处理数据中，如果希望查看列中的去重之后的不同值或者唯一值，这可以使用 Pandas unique()函数来完成。Python的Pandas库Series.unique方法会返回S…

人工智能 2023年7月14日
0089
半监督学习算法中的包装法和插入法有什么区别

问题介绍本问题涉及半监督学习算法中的包装法和插入法的区别。包装法和插入法都是半监督学习中的经典算法，用于在训练集中使用未标记的样本来提高模型的性能。在接下来的回答中将会详细介绍这…

人工智能 2024年1月1日
0031
判别分析（1）——距离判别法

判别分析是多元统计分析的内容，其作用在分类确定的条件下，根据某一研究对象的各种特征的值来判断其归属于哪一类（即总体）。实际上，这一类问题就是根据已有的样本数据与对应的类别，判断未知…

人工智能 2023年7月2日
0056
【pandas数据分析】pandas功能和操作简单示例

文章目录导入包创建对象 * Series DataFrame 查看数据选择 * 获取数据按标签选择按位置选择布尔值索引设置值缺失值一些操作 * 数据统计应用（A…

人工智能 2023年7月7日
0076
深度学习训练和测试时出现问题：error: the following arguments are required: –dataroot，解决：训练文件的配置方法和测试文件的配置方法

Table of Contents Summary of gdb . . . . . . . . . . . . . . . . . . . . . . . . . . . . ….

人工智能 2023年6月16日
00107
记一次Python大作业-代码格式记录

导入包： 1）import pandas as pd 读取文件： 1）读取csv文件：pd.read_csv(“./submission.csv”，dtyp…

人工智能 2023年7月7日
0057
笔记︱联邦学习与隐私计算的案例集锦（一）

文章目录 1 联邦学习与隐私计算 * 1.0 联邦学习背景 1.1 横向联邦学习（HorizontalFederatedLearning，HFL） 1.2 纵向联邦学习（Verti…

人工智能 2023年6月24日
00105
数字图像处理学习之路（二）：直方图均衡化的原理以及实现

直方图均衡化属于灰度变换的一种，是直接对图像的各个像素进行操作。直方图均衡化能够增强图像的对比度，简单来说，直方图均衡化就是将集中在某一块区域的灰度值通过函数变换映射到新的像素…

人工智能 2023年6月16日
0067
OpenMV：18数字识别

Lenet是一种卷积神经网络，可以用来识别打印的、手写的数字我们之前就有讲到过利用 OpenMV的NCC模板匹配算法来进行数字识别，模板匹配需要我们实现保存需要匹配的数字或者字母…

人工智能 2023年5月23日
0091
微信小程序完整项目实战(前端+后端)

基于微信小程序的在线商城点单系统前言：闲来无事，想以后自己开一个小超市或者小吃店，能够支持线上下单，既方便客户也方便自己。系统采用C#语言作为后端实现与小程序的交互，给用来学习或…

人工智能 2023年7月31日
00160
power bi 商业智能相关书籍介绍

2.PowerBI 智能财务应用与实战从新手到高手（祝泽文）祝泽文：现任某国企财务总监，注册会计师、高级会计师、咨询工程师（投资）曾就职于多家集团企业、上市公司、央企，拥有生产制…

人工智能 2023年7月16日
0064
pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

在处理缺失值的时候，总会遇到各种问题目录 1.删除全部为nan的行 2.删除含有nan的行 3.删除全部为nan的列 4. 删除包含nan的列 5.删除指定某一列有nan，这样即…

人工智能 2023年7月6日
0057
Python基于pyzbar、opencv、pyqt5库，实现二维码识别 gui 应用程序开发

二维码组成结构基本介绍二维码识别背景介绍视觉的方法可以用来估计位置和姿态。最容易想到的是在目标上布置多个容易识别的特征，这样使用opencv相机标定和、相机畸变矫正、轮廓提取、…

人工智能 2023年6月18日
0086
配置GPU版本的pytorch和torchvision，初学GPU版本torch踩坑

首先我们来了解一些经常用到的词！！在我们学习 pytorch时，都想用GPU跑，因为GPU支持并行，可以大大加快运行速度。那么具体为什么GPU比CPU快呢？看这：为什么GPU能比C…

人工智能 2023年7月21日
00105

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

基于单应矩阵的图像拼接

二、ORB特征点提取和匹配

大家都在看