NNDL 作业5：卷积与几种常见的卷积核

2023年8月23日下午6:46 • Python • 阅读 56

作业1

编程实现

图1使用卷积核( 1 − 1 ) \begin{pmatrix} 1 & -1 \end{pmatrix}(1 −1 )，输出特征图
图1使用卷积核( 1 − 1 ) \begin{pmatrix} 1\ -1\ \end{pmatrix}(1 −1 )，输出特征图
图2使用卷积核( 1 − 1 ) \begin{pmatrix} 1 & -1 \end{pmatrix}(1 −1 )，输出特征图
图2使用卷积核( 1 − 1 ) \begin{pmatrix} 1\ -1\ \end{pmatrix}(1 −1 )，输出特征图
图3使用卷积核( 1 − 1 ) \begin{pmatrix} 1 & -1 \end{pmatrix}(1 −1 )，( 1 − 1 ) \begin{pmatrix} 1\ -1\ \end{pmatrix}(1 −1 )，( 1 − 1 − 1 1 ) \begin{pmatrix} 1 &-1 \ -1&1 \end{pmatrix}(1 −1 −1 1 )输出特征图

绘制三个图片的源代码：


import numpy as np
from matplotlib import pyplot as plt

img1=np.array([[0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255]
                               ])
img2=np.array([[255,255,255,255,255,0,0,0,0,0],
                [255,255,255,255,255,0,0,0,0,0],
                [255,255,255,255,255,0,0,0,0,0],
                [255,255,255,255,255,0,0,0,0,0],
                [255,255,255,255,255,0,0,0,0,0],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255]
                               ])
img3=np.array([[0,0,0,0,0,0,0,0,0],
                [0,225,0,0,0,0,0,225,0],
                [0,0,225,0,0,0,225,0,0],
                [0,0,0,225,0,225,0,0,0],
                [0,0,0,0,225,0,0,0,0],
                [0,0,0,225,0,225,0,0,0],
                [0,0,225,0,0,0,225,0,0],
                [0,225,0,0,0,0,0,225,0],
                [0,0,0,0,0,0,0,0,0]
                               ])
if __name__=='__main__':
    plt.figure()
    plt.subplot(1,3,1)
    plt.imshow(img1,cmap='gray')
    plt.title('img1')
    plt.subplot(1,3,2)
    plt.imshow(img2,cmap='gray')
    plt.title('img2')
    plt.subplot(1,3,3)
    plt.imshow(img3,cmap='gray')
    plt.title('img3')
    plt.show()

卷积过程：


import numpy as np
import torch
from matplotlib import pyplot as plt

img1=np.array([[0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255]
                               ])
img2=np.array([[255,255,255,255,255,0,0,0,0,0],
                [255,255,255,255,255,0,0,0,0,0],
                [255,255,255,255,255,0,0,0,0,0],
                [255,255,255,255,255,0,0,0,0,0],
                [255,255,255,255,255,0,0,0,0,0],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255],
                [0,0,0,0,0,255,255,255,255,255]
                               ])
img3=np.array([[0,0,0,0,0,0,0,0,0],
                [0,225,0,0,0,0,0,225,0],
                [0,0,225,0,0,0,225,0,0],
                [0,0,0,225,0,225,0,0,0],
                [0,0,0,0,225,0,0,0,0],
                [0,0,0,225,0,225,0,0,0],
                [0,0,225,0,0,0,225,0,0],
                [0,225,0,0,0,0,0,225,0],
                [0,0,0,0,0,0,0,0,0]
                               ])
kernel1=np.array([[1,-1]])
kernel2=np.array([[1],
                  [-1]])
kernel3=np.array([[1,-1],
                 [-1,1]])
if __name__=='__main__':
    plt.figure()
    i=1
    for img in [img1,img2,img3]:
        '''绘制原图'''
        plt.subplot(3, 4, i)
        plt.imshow(img,cmap='gray')
        plt.title('Original')
        i += 1
        img = torch.from_numpy(img.astype(np.float32)).reshape((1,1,img.shape[0],img.shape[1]))
        for j,kernel in enumerate([kernel1,kernel2,kernel3]):
            conv2d=torch.nn.Conv2d(in_channels=1,out_channels=1,kernel_size=kernel.shape)
            kernel = torch.from_numpy(kernel.astype(np.float32)).reshape((1, 1, kernel.shape[0], kernel.shape[1]))
            conv2d.weight.data=kernel
            out_img=conv2d(img)
            '''绘制卷积后的图像'''
            out_img = np.squeeze(out_img.detach().numpy())
            plt.subplot(3, 4, i)
            plt.imshow(out_img,cmap='gray')
            plt.title('kernel{}'.format(j))
            i+=1
    plt.show()

作业2

一、概念

用自己的语言描述”卷积、卷积核、特征图、特征选择、步长、填充、感受野”。
自己的理解，如有错误请海涵：
卷积（Convolution）：
在二维层面，卷积就是将两个函数（通常是一长一短）先逆向对齐，然后先不管多余的部分，计算两函数的乘积在短的函数的定义域的积分，然后再将短的那个函数逐步向后平移，每次再次进行点积运算。而对于离散函数，每次积分就相当于对两个函数的重合部分做点积运算。
在图像卷积中，那两个函数分别是原图和卷积核，我们先将卷积核和原始图像对齐，然后计算重叠部分的点积结果，计算完一个后，将卷积核按一定步长向后移动，这样一直重复直到卷积核移动到图像的末尾。
卷积核：
在图像卷积中，卷积核就是那个短的函数。
特征图：
就是所有卷积运算完成后的结果。
特征选择：
就是对卷积结果的选择。
步长：
就是那个短函数每次的后移长度。
在图像卷积中，就是卷积核向后移动的长度。
填充：
在图像卷积中，我们对边界的像素点的卷积次数比在中间调像素点要少，为了利用上这些卷积次数比较少的像素点，我们在图像的四周加上一层或多层数值确定的像素点（通常是0），从而把原始图像的边缘给”包裹起来”，这样原本的边缘信息就会被多卷积几次，在一定程度上减少了图片的特征丢失。
感受野：
就是那个短的函数的定义域。在图像卷积中就是卷积核的尺寸。

二、探究不同卷积核的作用

参考：Image Kernels explained visually (setosa.io)
不同的卷积核:
1.blur_kernel（模糊）
( 0.0625 0.125 0.0625 0.125 0.25 0.125 0.0625 0.125 0.0625 ) \begin{pmatrix} 0.0625&0.125&0.0625\ 0.125& 0.25&0.125\ 0.0625&0.125&0.0625 \end{pmatrix}⎝⎛0 .0 6 2 5 0 .1 2 5 0 .0 6 2 5 0 .1 2 5 0 .2 5 0 .1 2 5 0 .0 6 2 5 0 .1 2 5 0 .0 6 2 5 ⎠⎞

1）权重代数和为一，保证了亮度和输入保持一致。
2）中心的权重为最大值，四周的权重比中心略低，大致处于同一数量级。这表明感受野内中心像素点倾向于与周围点相”融合”，但是也保留大部分的中心点特征。每个像素点的权重值都很小，这主要是防止卷积结果过大。
2.bottom_sobel_kernel（底部索贝尔）
( − 1 − 2 − 1 0 0 0 1 2 1 ) \begin{pmatrix} -1&-2&-1\ 0& 0&0\ 1&2&1 \end{pmatrix}⎝⎛−1 0 1 −2 0 2 −1 0 1 ⎠⎞
对顶部像素点的特征赋负值，对中间像素点赋零，对底部像素点赋正值。
1）权重代数和为0，标志着卷积核输出亮度为暗。
2）上部和下部的权重代数和为零，意味着上下对应像素点的值都一样时，卷积的结果为零。表现为暗。
3）下正上负，说明只有当感受野底部的像素值比顶部像素值大时，卷积结果才会得到较大值。也就是当感受野的下部比上部亮时，卷积结果才会是正值，卷积结果表现为发亮。

顶部索贝尔、左索贝尔和右索贝尔和这个原理一样。
3.emboss_kernel（浮雕）
( − 2 − 1 0 − 1 1 1 0 1 2 ) \begin{pmatrix} -2&-1&0\ -1&1&1\ 0&1&2 \end{pmatrix}⎝⎛−2 −1 0 −1 1 1 0 1 2 ⎠⎞
对右下角像素点的特征赋正值，对左上像素点赋负值，对中心像素点赋1。
1）权重代数和为一，保证了亮度和输入保持一致。
2）左上角和右下角权重代数和为零，中心为1，标志着感受野左上角和右下角像素点的值都一样时，卷积的输出为中心点像素值。
3）右下为正，左上为负，说明只有当感受野右下角的像素值比左上角像素值大时，卷积结果才会输出更大值。表现为对感受野中心点的提亮。
4.identify_kernel（识别）
( 0 0 0 0 1 0 0 0 0 ) \begin{pmatrix} 0&0&0\ 0& 1&0\ 0&0&0 \end{pmatrix}⎝⎛0 0 0 0 1 0 0 0 0 ⎠⎞
四周为0，中心为1，意味着只采取感受野中心点的图像信息。
5.left_sobel_kernel（左索贝尔）
( 1 0 − 1 2 0 − 2 1 0 − 1 ) \begin{pmatrix} 1&0&-1\ 2& 0&-2\ 1&0&-1 \end{pmatrix}⎝⎛1 2 1 0 0 0 −1 −2 −1 ⎠⎞
和底部索贝尔原理一样。
6.outline_kernel（边缘检测）
( − 1 − 1 − 1 − 1 8 − 1 − 1 − 1 − 1 ) \begin{pmatrix} -1&-1&-1\ -1&8&-1\ -1&-1&-1 \end{pmatrix}⎝⎛−1 −1 −1 −1 8 −1 −1 −1 −1 ⎠⎞
为感受野中心点赋极大的一个权重，为四周的点赋负值。
1）权重代数和为0，标志着卷积核输出亮度为暗。
2）中心点为极大正值，四周为负值，说明当中心点值大于四周值的平均值时，卷积结果才会是正数，表现为发亮。
7.right_sobel_kernel（右索贝尔）
( − 1 0 1 − 2 0 2 − 1 0 1 ) \begin{pmatrix} -1&0&1\ -2& 0&2\ -1&0&1 \end{pmatrix}⎝⎛−1 −2 −1 0 0 0 1 2 1 ⎠⎞
和底部索贝尔原理一样。
8.sharpen_kernel（锐化）
( 0 − 1 0 − 1 5 − 1 0 − 1 0 ) \begin{pmatrix} 0&-1&0\ -1& 5&-1\ 0&-1&0 \end{pmatrix}⎝⎛0 −1 0 −1 5 −1 0 −1 0 ⎠⎞
1）权重代数和为一，保证了亮度和输入保持一致。
2）中心点为正值，四周为负值，说明当中心点值大于四周值的平均值的5/4时，卷积结果才会是大于原本的中心像素值，表现为对中心点的提亮。和边缘检测的原理有些类似。
9.top_sobel_kernel（顶部索贝尔）
( 1 2 1 0 0 0 − 1 − 2 − 1 ) \begin{pmatrix} 1&2&1\ 0& 0&0\ -1&-2&-1 \end{pmatrix}⎝⎛1 0 −1 2 0 −2 1 0 −1 ⎠⎞
和底部索贝尔原理一样。

三、编程实现

实现灰度图的边缘检测、锐化、模糊。（必做）
源代码：


import numpy as np
import torch
from matplotlib import pyplot as plt

blur_kernel=np.array([[0.0625,0.125,0.0625],
                      [0.125,0.25,0.125],
                      [0.0625,0.125,0.0625]])
bottom_sobel_kernel=np.array([[-1,-2,-1],
                              [0,0,0],
                              [1,2,1]])
emboss_kernel=np.array([[-2,-1,0],
                        [-1,1,1],
                        [0,1,2]])
identify_kernel=np.array([[0,0,0],
                          [0,1,0],
                          [0,0,0]])
left_sobel_kernel=np.array([[1,0,-1],
                            [2,0,-2],
                            [1,0,-1]])
outline_kernel=np.array([[-1,-1,-1],
                         [-1,8,-1],
                         [-1,-1,-1]])
right_sobel_kernel=np.array([[-1,0,1],
                             [-2,0,2],
                             [-1,0,1]])
sharpen_kernel=np.array([[0,-1,0],
                         [-1,5,-1],
                         [0,-1,0]])
top_sobel_kernel=np.array([[1,2,1],
                          [0,0,0],
                          [-1,-2,-1]])

def rgb_to_gray(rgb):
    r, g, b = rgb[:, :, 0], rgb[:, :,1], rgb[:, :, 2]
    gray = 0.2989 * r + 0.5870 * g + 0.1140 * b
    return gray

def adjust(img):
    '''将像素值大于255的记为255，小于0的记为0'''
    for i in range(img.shape[0]):
        for j in range(img.shape[1]):
            if img[i][j] > 255:
                img[i][j] = 255
            elif img[i][j] < 0:
                img[i][j] = 0
            else:
                continue
    return img

if __name__=='__main__':
    img_path='cat.jpg'
    img=plt.imread(img_path)
    img=np.array(img)
    img=rgb_to_gray(img)
    plt.figure()
    labels=['outline_kernel','sharpen_kernel','blur_kernel']
    for j,kernel in enumerate([outline_kernel,sharpen_kernel,blur_kernel]):
        i = 1
        '''绘制原图'''
        plt.subplot(1, 2, i)
        plt.imshow(img, cmap='gray')
        plt.title('Original')
        i += 1
        in_img = torch.from_numpy(img.astype(np.float32)).reshape((1, 1, img.shape[0], img.shape[1]))
        conv2d=torch.nn.Conv2d(in_channels=1,out_channels=1,kernel_size=kernel.shape)
        kernel = torch.from_numpy(kernel.astype(np.float32)).reshape((1, 1, kernel.shape[0], kernel.shape[1]))
        conv2d.weight.data=kernel
        out_img=conv2d(in_img)
        '''绘制卷积后的图像'''
        out_img = np.squeeze(out_img.detach().numpy())
        out_img=adjust(out_img)
        plt.subplot(1,2, i)
        plt.imshow(out_img,cmap='gray')
        plt.title('{}'.format(labels[j]))
        plt.show()

从上到下分别是边缘检测、锐化和模糊。效果很好。
调整卷积核参数，测试并总结。（必做）
将边缘检测、锐化和模糊卷积核的中心点权重增加了1，再次运行上述程序。

可见图像明显变亮了，这很符合预期。因为改变了图像的代数和。
1）为中心点加1后，边缘检测的效果和锐化效果一样了，因为他的代数和为一，具体参考上面对锐化卷积核的分析。
2）为锐化和模糊中心点加1后，代数和变为了2，这导致中心点信息被多叠加了一次，图像明显变亮。
使用不同尺寸图片，测试并总结。（必做）
400×400:

1904×1072:

实验发现图像越小，卷积的效果越明显，图像越大，卷积完成需要的时间越多，效果也更不明显。
探索更多类型卷积核。（选做）
1.均值滤波
( 1 / 9 1 / 9 1 / 9 1 / 9 1 / 9 1 / 9 1 / 9 1 / 9 1 / 9 ) \begin{pmatrix} 1/9&1/9&1/9\ 1/9&1/9&1/9\ 1/9&1/9&1/9 \end{pmatrix}⎝⎛1 /9 1 /9 1 /9 1 /9 1 /9 1 /9 1 /9 1 /9 1 /9 ⎠⎞

1）权重代数和为一，保证了亮度和输入保持一致。
2）每个元素值都一样，效果和模糊类似。比高斯模糊更’模糊’一些。
尝试彩色图片边缘检测。（选做）
应注意rgb图像的信息存储是在最后一维增加了两个维度而不是在第一维并排了三个维度。
源代码：


import numpy as np
import torch
from matplotlib import pyplot as plt

outline_kernel=np.array([[-1,-1,-1],
                         [-1,8,-1],
                         [-1,-1,-1]]
                        )

def rgb_to_gray(rgb):
    r, g, b = rgb[:, :, 0], rgb[:, :,1], rgb[:, :, 2]
    gray = 0.2989 * r + 0.5870 * g + 0.1140 * b
    return gray

def adjust(img):
    '''将像素值大于255的记为255，小于0的记为0'''
    for i in range(img.shape[0]):
        for j in range(img.shape[1]):
            if img[i][j] > 255:
                img[i][j] = 255
            elif img[i][j] < 0:
                img[i][j] = 0
            else:
                continue
    return img

if __name__=='__main__':
    img_path='cat.jpg'
    img=plt.imread(img_path)
    img=np.array(img)
    '''print(img.shape)'''
    plt.figure()
    labels=['outline_kernel']
    '''绘制原图'''
    plt.subplot(1, 2, 1)
    plt.imshow(img)
    plt.title('Original')
    rgb=[]
    for j,kernel in enumerate([outline_kernel]):
        for img_ in [img[:,:,i] for i in range(3)]:
            '''print(img_)'''
            in_img = torch.from_numpy(img_.astype(np.float32)).reshape((1, 1, img_.shape[0], img_.shape[1]))
            conv2d = torch.nn.Conv2d(in_channels=1, out_channels=1, kernel_size=kernel.shape)
            kernel_ = torch.from_numpy(kernel.astype(np.float32)).reshape((1, 1, kernel.shape[0], kernel.shape[1]))
            conv2d.weight.data = kernel_
            out_img = conv2d(in_img)
            '''绘制卷积后的图像'''
            out_img = np.squeeze(out_img.detach().numpy())
            out_img = adjust(out_img)
            rgb.append(out_img)

    o_img=np.stack((rgb[0],rgb[1],rgb[2]),axis=2)
    plt.subplot(1, 2, 2)
    plt.imshow(o_img)
    plt.title('{}'.format(labels[0]))
    plt.show()

运行结果

总结：
1）深入分析并理解了各种常见卷积核的特征和原理，并实现了实例化。
2）尝试了修改卷积核的权重、修改输入图片尺寸，了解了其对卷积过程和结果的影响。
3）用pytorch实现了rbg图像的卷积。

对于其他尚未测试的卷积核的测试结果会在以后补充。
ref：
come from：
https://blog.csdn.net/qq_38975453/article/details/127174881?spm=1001.2014.3001.5502
RGB 转灰度图：
https://blog.csdn.net/qq_38635841/article/details/105153690
https://blog.csdn.net/weixin_33693070/article/details/93750473
其他卷积核：
https://blog.csdn.net/qq_62932195/article/details/126337971
实验所用图片来自互联网，供学术交流使用，侵删。

Original: https://blog.csdn.net/qq_58153224/article/details/127338502
Author: 真不想再学了
Title: NNDL 作业5：卷积与几种常见的卷积核

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/757821/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【决策树】使用决策树进行乳腺癌的诊断

【决策树】使用决策树进行乳腺癌的诊断 1. 数据集威斯康星乳腺癌数据集 2. 数据集组成：健康组织(良性)和癌变组织(恶性)的数字图像 3. 任务：二分类 → 将组织样本分类为…

Python 2023年9月27日
0045
字的研究（2）fontTools-字体文件的解析

前言本文主要介绍如果使用Python第三方库fontTools对OpenType字体文件（包括TrueType轮廓和Postscript轮廓）的解析操作。 fontTools简介…

Python 2023年11月10日
0063
发布 .NET 7 MAUI / MAUI Blazor 应用到 Windows 应用商店

.NET MAUI 目前仅允许发布 MSIX 包。原文地址 https://www.cnblogs.com/densen2014/p/16885318.html创建签名证书发布到…

Python 2023年10月15日
0041
Python测试框架pytest（05）fixture – error和failed、fixture实例化、多个fixture

目录 1、error和failed区别 2、fixture的实例化顺序 3、使用多个fixture 1、error和failed区别 1、在测试用例里面断言失败，结果为failed…

Python 2023年9月14日
0031
Tomcat安装与配置（详细教程）

一、安装Tomcat服务器 1.下载地址（Tomcat官网）http://tomcat.apache.org/ 2.将下载的zip文件解压到指定的目录（例如：D盘，目录不要有中文）…

Python 2023年11月7日
0035
pandas数据变形之关联

1.数据关联的几种方式-inner_join内连接、outer_join外连接、left_join左连接、righr_join右连接。 import pandas as pd df…

Python 2023年8月22日
0050
pip指定包的安装路径

pip install指定安装目录 pip install一般会有默认的安装目录，可以通过 python -m site进行查看，当然也可以对默认目录进行修改通过 pip inst…

Python 2023年8月27日
0045
python点击按钮切换图片_Python matplotlib如何在一个窗口画多张图，使用forward to next view按钮切换…

–– coding: utf-8 –– from matplotlib.figure import Figure from matp…

Python 2023年9月5日
0031
jupyter以conda虚拟环境运行

首先进入你的虚拟环境中安装需要软件 conda install jupyter notebook 如果在 base 主环境中已经安装了 jupyter，那么可以只需要安装 ipy…

Python 2023年9月9日
0078
数据库系统课程设计（高校成绩管理数据库系统的设计与实现）

目录 1、需求分析 1 1.1 数据需求描述 1 1.2 系统功能需求 3 1.3 其他性能需求 4 2、概念结构设计 4 2.1 局部E-R图 4 2.2 全局E-R图 5 2….

Python 2023年11月5日
0045
APP自动化测试框架-UiAutomator2基础入门

前言很早以前，我用uiautomator+java实践过Android APP自动化测试，不过今天要提的不是uiautomator，而是uiautomator2。听起来uiaut…

Python 2023年6月12日
0065
设计模式—桥接模式

类型：结构型目的：通过抽离出多个维度相互组合(聚合)来代替继承，简化系统。话不多说，看个优化案例。优化案例现有系统中，对于画面窗口的边框有一套样式来控制是否有圆角。因为新的…

Python 2023年10月21日
0043
Python 一网打尽＜排序算法＞之从希尔排序算法的分治哲学开始

1. 前言本文将介绍 希尔排序、 归并&amp…

Python 2023年11月3日
0045
Flask(五)——HTTP方法

Http协议是万维网数据通信的基础。它协议定义了从指定URL中检索不同数据的方法。下表概括了不同的 http 方法方法描述GET将数据以未加密的形式发送到服务器，这最常用的方…

Python 2023年8月11日
0047
数据挖掘-模型怎么解决业务需求（五）

🤵‍♂️ 个人主页：@Lingxw_w的个人主页✍🏻作者简介：计算机科学与技术研究生在读🐋 希望大家多多支持，我们一起进步！😄如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂…

Python 2023年10月10日
0060
python进阶(1)–常用语法糖

文章目录 python常用函数 * – axis filter Map all和any Sorted Zip Reduce random.sample print Ty…

Python 2023年8月29日
0056

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

NNDL 作业5：卷积与几种常见的卷积核

作业1

作业2

一、概念

二、探究不同卷积核的作用

三、编程实现

大家都在看