Opencv-图像操作与处理入门基本知识（一）

2023年6月22日上午2:37 • 人工智能 • 阅读 79

文章目录

前言
一、图像基础知识
*
像素坐标系
图像坐标系
二、opencv处理图像基本操作
*
2.1 基础知识与应用
–
2.2 色彩空间的改变
2.3 颜色通道的提取
2.4 图像的算术运算
2.5 图像的几何变换
–
2.6 形态学操作 ⭐⭐
–
总结

前言

基于python脚本语言开发的数字图片处理包，比如PIL(Python Image Library),Pillow, opencv, scikit-image等。

PIL和Pillow只提供最基础的数字图像处理，功能有限；

PIL历史悠久，原来是只支持python2.x的版本的，后来出现移植到python3的库pillow,pillow号称是friendly fork for PIL,其功能和PIL差不多，但是支持python3。

opencv实际上是一个c++库，只是提供了python接口，更新速度非常慢。
scikit-image是基于scipy的一款图像处理包，它将图片作为numpy数组进行处理正好与matlab一样。

一、图像基础知识

模拟图像

连续图像通过某种物理量（如光、电等）的强弱变化来记录图像亮度信息，是连续变化的。

数字图像

分级存储的图像

位数：图像的表示每个像素点是如何表示的
分类：二值图像、灰度图像、彩色图像

计算机采用0/1编码的系统，数字图像也是利用0/1来记录信息，我们 平常接触的图像都是8位数图像包含0-255灰度，其中 0：黑 1：白

黑色：（0,0,0）
白色：（256,256,256）/（1,1,1）

二值图像

每个像素取值0/1

*灰度图

每个像素8位 0-255 (没有三个通道， 只有一个通道，表示亮度就可以)

*彩色图

每个像素由R G B 三个分量表示，每个分量0-255，因此 单独拿出一个分量就是一个灰度图，每一像素的颜色需由R，G、B三个分量来表示，M，N分别表示图像的行列数， 三个MxN的二维矩阵分别表示各个像素的R，G、B三个颜色分量

索引图像

一种把像素值直接作为RGB调色板下标的图像。索引图像可把像素值”直接映射”为调色板数值。

RGB图像和索引图像的区别

; 像素坐标系

像素坐标系u-v的原点为 O0
在视觉处理库OpenCV中，u对应x，v对应y；

图像坐标系

图像坐标系x-y的原点是O1，为像素坐标系的中点，

; 二、opencv处理图像基本操作

2.1 基础知识与应用

opencv: BGR格式
一般图像是RGB格式，且图像显示时用的也是RGB格式

2.1.1 读取图像

; 2.1.2 显示图像

opencv中彩色图像显示 BGR格式
matplotlib中彩色图像显示 RGB格式

2.1.3 显示图像

; 2.1.4 基础操作示例

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt

img = np.zero((256,256,3),np.unit8)

plt.imshow(img[:,:,::-1])

修改像素值

img[100,100]
img[100,100,100]

img[100,100] = (0,0,255)

b,g,r = cv.split(img)
img = cv.merge((b,g,r))

案例引入

import numpy as np
import cv2 as cv
img = cv.imread（'messi5.jpg'）

px = img[100，100]

blue = img[100，100，0]

img[100，100]=[255,255,255]

img.shape
[ h,w,c ]

2.2 色彩空间的改变

opencv中由150多种颜色空间转化方法，最广泛的转换方法有两种

BGR->Gray(灰度图)
BGR->HSV(有些算法会使用)


cv.cvtColor(input_image,flag)
gray = cv.cvtColor(dili,cv.COLOR_BGR2GRAY)
plt.imshow(gray,cmap=plt.cm.gray)

hsv = cv.cvtColor(dili,cv.COLOR_BGR2HSV)
plt.imshow(hsv)
'''

2.3 颜色通道的提取

; 2.4 图像的算术运算

图像的加法

可以使用OpenCV的cv.add0函数把两幅图像相加，或者可以简单地通过numpy操作添加两个图像，如res=img1 +img2，两个图像应该具有相同的大小和类型，或者第二个图像可以是标量值

x=np.uint8((250)
y=np.uint8(10)
print(cv.add(x,y))
[255]
print(x+y)
[4]

图像的混合(融合)

这其实也是加法，但不同的是两幅图像的权重不同，这就会给人一种混合或者透明的感觉。图像混合的计算公式如下：

*g(x) = (1- α)f0(x) + αf1(x) [α:0->1]

现在我们把两幅图混合在一起，第一幅图的权重是0.7，第二幅图的权重是0.3.函数cv2.addWeighted()可以按下面的公式对图片进行混合操作

img3 = cv.addWeight(img1,0.7,img2,0.3,0)

注意：这里要求图像的大小都是相同的

2.5 图像的几何变换

2.5.1 图像缩放

图像放大或者缩小
方式：1.绝对尺寸 2. 相对尺寸

API
示例

import cv2 as cv

path = 图片路径
img1 = cv.imread(path)

rows,cols = img1.shape[:2]
res = cv.resize(img1,(2*cols,2*rows),interpolation=cv.INTER_CUBIC)

res1 = cv.resize(img1,None,fx=0.5,fy=0.5)

cv.imshow('original',img1)
cv.imshow('enlarge',res)
cv.imshow('shrink',res1)

cv.waitKey(0)
cv.destroyAllWindows()

2.5.2 图像平移

按照指定方向和距离，移动到相应的位置

API
示例

import numpy as np
import cv2 as cv

path = 图像路径
img1 = cv.imread(path)

rows,,cols = img1.shape[:2]
M = np.float32([[1,0,100],[0,1,50]])
dst = cv.warpAffine(img1,M,(cols,rows))

2.5.3 图像旋转 ⭐

图像按照 某个位置转动一定的角度的过程，旋转中图像仍保持这原始尺寸。图像旋转后图像的水平对称轴、垂直对称轴及中心坐标原点都可能会发生变换，因此 需要对图像旋转中的坐标进行相应转换。

旋转原理

如上图，旋转后新的坐标系中的坐标：

上图中的x,y是以旋转中心为原点的一个结果，现在旋转完毕之后，原点转换为图像左上角，

行列式计算：
API
示例

import numpy as np
import cv2 as cv

path = 图片路径
img1 = cv.imread(path)

rows,cols = img.shape[:2]

M = cv.getRotationMatrix2D((cols/2,rows/2),90,1)

dst = cv.warpAffine(img,M,(cols,rows))

2.5.4 仿射变换 ⭐

仿射变换涉及到图像形状位置角度的变化，是深度学习预处理中常用到的功能， 主要是对图像的缩放、旋转，翻转和平移等操作的组合。

名词解释
原理解释
示例

import numpy as np
import cv2 as cv

path = 图像路径
img = cv.imread(path)

rows,cols = img.shape[:2]

pts1 = np.float32([[50,50],[200,50],[50,200]])
pts2 = np.float32([[100,100],[200,50],[100,250]])
M = cv.getAffineTransform(pts1,pts2)

dst = cv.warpAffine(img,M,(cols,rows))

2.5.5 透射变换⭐

原理解释
示例

import numpy
import cv2 as cv

path = 图片路径
img = cv.imread(path)

rows,cols = img.shape[:2]

pts1 = np.float32([[56,65],[368,52],[28,387],[389,390]])
pts2 = np.float32([[100,145],[300,100],[80,290],[310,300]])

T = cv.getPerspectiveTransform(pts1,pts2)

2.5.6 图像金字塔⭐⭐

用于特征提取，可能不仅对原始输入进行特征提取，还对每一层金字塔进行特征提取，每一层的特征提取可能是不一样的，最后再将每一层的结果总结在一起

入门认识

图像金字塔是图像多尺度表达的一种，最主要用于图像的分割，是一种以多分辨率来解释图像的有效但概念简单的结构
图像金字塔用于机器视觉和图像压缩，一幅图像的金字塔是一系列以金字塔形状排列的 分辨率逐步降低，且 来源于同一张原始图的图像集合。其通过 梯次向下采样获得，直到达到某个终止条件才停止采样。

金字塔的底部是待处理图像的高分辨率表示，而顶部是低分辨率的近似，层级越高，图像越小，分辨率越低。

cv2.pyrUp(img) #上采样
cv2.pyDown(img) # 下采样

示例

import numpy as np
import cv2 as cv

path = 图片路径
img = cv.imread(path)

up_img = cv.pyrUp(img)
img_1 = cv.pyrDown(img)

cv.imshow('enlarge',up_img )
cv.imshow('original',img)
cv.imshow('shrink',img_1 )

cv.waitKey(0)
cv.destroyAllWindows()

高斯金字塔

向下采样法（缩小）

只要是往金字塔顶方向进行的就是向下采样

步骤

将Gi与高斯内核进行卷积
将所有偶数行和列去除
向上采样法（放大）
步骤

先进行上采样，再进行下采样的结果和原始结果不会是一模一样的，会变得相对模糊

; 拉普拉斯金字塔

几何变换总结

; 2.6 形态学操作 ⭐⭐

形态学视频讲解

连通性

在图像中，最小的单位是像素。每个像素周围有8个邻接像素，常见的邻接关系有3种： 4邻接、 8邻接和 D邻接。

连通性是描述区域和边界的重要概念，两个像素连通的 必要条件：

两个像素的位置是否相邻
两个像素的灰度值是否满足特定的相似性准则（或者是否相等/或者差值在多少之内）
连通分类

; 2.6.1 腐蚀操作

腐蚀操作与 kernal以及 迭代次数都有关

讲解

只要框到的含有黑色，则就变黑（即为腐蚀）

注意：线条变细了

实例

2.6.2膨胀操作

讲解

只要框到的含有白色就会变白（膨胀），这也就是为什么 字体迪哥又变胖了

实例

; 2.6.3 开运算与闭运算

腐蚀会变小，膨胀会变大

开运算
闭运算

线条不仅没有处理掉，而且线条还比原来粗了

2.6.4 梯度运算

膨胀结果：胖一圈
腐蚀结果：瘦一圈

梯度运算：

原始图像先进行膨胀
原始图像先进行腐蚀
膨胀图像-腐蚀图像（例如上图白色-白色=0变成黑色，只剩下轮廓）
实例

; 2.6.5 礼帽与黑帽

礼帽：原始输入-开运算结果（先腐蚀后膨胀）
黑帽：闭运算结果-原始输入（先膨胀后腐蚀）

礼帽
黑帽

总结

笔记可能存在错误，还望大家能够指出，谢谢！

2021/5/26

新增图像金字塔章节内容

Original: https://blog.csdn.net/HG0724/article/details/116290698
Author: 胜天半月子
Title: Opencv-图像操作与处理入门基本知识（一）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/644761/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

KBQA 常用的问答数据集之 GrailQA

目录 1. 论文相关 2. 数据集概述 2.1 内容介绍 2.2 数据统计 3. 模型性能比较论文相关 GrailQA [Gu et al., 2021] 源自论文：Beyond…

人工智能 2023年6月1日
00103
使用百度飞桨EasyDL实现电商UGC图片自动分类

项目说明业务背景运动潮牌鞋类越来越受年轻人欢迎，近几年运动鞋类销量也持续增高，也出现不少用户自主交易的电商平台。用户每天上传几万张鞋子照片，包括：鞋子外观、外盒或者鞋标，后台需…

人工智能 2023年7月1日
0076
GPU选型调研！3090依旧是性价比之王

最近算力不够，一些加Transfomer的3D图像分割，现有的显卡显存都带不动，或者是一个实验要跑一周以上时间。所以近期又专门花时间调研了下GPU选型。现有两张3090显卡，因为…

人工智能 2023年5月23日
00119
DataFrame

官方教程：https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html如果想阅读…

人工智能 2023年6月2日
0064
Python数据框DataFrame的数据筛选

【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】 ● 标题与摘要 Python数据框DataFrame的数据筛选 …

人工智能 2023年7月7日
0089
目标检测，使用最新的yolov7训练自己的数据集，从零开始的手把手教程

目录一、获取大佬的yolov7源码二、配置深度学习环境三、准备数据集四、用yolo v7训练自己的数据集五、用训练好的模型测试六、用训练好的模型预测一、获取大佬的yo…

人工智能 2023年7月25日
0078
【Pandas库】(3) DataFrame的创建方法及基本操作

各位同学好，今天给大家介绍一下Pandas库中DataFrame类型数据的创建方法和基本操作。文章内容如下：（1）使用字典类创建。字典类有： ①数组、列表、元组构成的字典；②S…

人工智能 2023年6月19日
0062
逻辑回归—简介、API简介、案例：癌症分类预测、分类评估法以及ROC曲线和AUC指标

文章目录一、介绍 * 1. 大白话~ 2.损失和优化二、API介绍三、案例：癌症分类预测四、分类评估方法 * 1. API 2. 例子五、ROC曲线与AUC指标 * 1….

人工智能 2023年7月1日
00103
【环境搭建】instant-ngp的环境搭建和demo

NeRF近年火遍大江南北，但是训练时间长（五六小时起步）的问题一直是美中不足的地方。于是，各种魔改版本你方唱罢我登场，层出不穷。但是，instant-ngp一出，把大家给整破防了，…

人工智能 2023年5月26日
0088
李沐论文精读系列二：Vision Transformer、MAE、Swin-Transformer

文章目录 * – 一、Vision Transformer论文精读 – + 1.1 引言 + * 1.1.1 前言 * 1.1.2 摘要 * 1.1.3 引…

人工智能 2023年7月26日
0082
深度学习案例1：验证码识别

运行配置：tensorflow: 2.1.0keras:2.2.4-tfcpu训练 1 验证码数据集数据集来自于 Kaggle，可以点击captcha_images_v2进行下载…

人工智能 2023年5月25日
00108
模型的“参数”与“超参数”

一、”参数”与”超参数” 二、模型训练与最终模型三、参考文献起初由于团队项目临时需要，花了个一两、天的时间直接仓促上手了机器学习…

人工智能 2023年5月31日
0076
**手把手教你安装 Anaconda + Tensor flow+Pycharm**

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

人工智能 2023年6月4日
0062
【人工智能全栈学习-知识图谱】零基础理论——动手学关系抽取：TextCNN&LSTM

【人工智能全栈学习-知识图谱】零基础理论——动手学关系抽取：TextCNN&LSTM 一、问题二、人工智能全栈学习系列课程三、代码文件释义四、知识图谱 * 实体、属性…

人工智能 2023年6月1日
0080
什么是竞争风险模型（Competing Risk Model）、为什么选用竞争风险模型?为什么会高估风险？cmprsk包进行竞争风险分析、regplot包的regplot函数可视化回归模型的列线图

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月18日
0084
深度学习方法——NLLloss简单概括

网上很多文章介绍很详细啊，但是还顺带介绍了各种参数等等，如果只是想要了解他的作用，看着未免太费劲，所以我就一个公式简单总结一下：不难看出NLLloss+log+softmax就是…

人工智能 2023年7月5日
00104

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31