多通道并行卷积神经网络实现

2023年6月16日下午7:08 • 人工智能 • 阅读 63

一、网络结构

多通道并行卷积神经网络主要由多个卷积池化层和全连接层组合而成，其网络结构图如下所示：

; 二、基于pytorch的实现如下（双通道）：

1.网络模型

class C_lenet(nn.Module):
    def __init__(self):
        super(C_lenet, self).__init__()
        self.conv1 = nn.Sequential(
            nn.Conv2d(3, 16, 5),
            nn.ReLU(),
            nn.MaxPool2d(2, 2),
            nn.Conv2d(16, 32, 5),
            nn.ReLU(),
            nn.MaxPool2d(2, 2)
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(3, 16, 5),
            nn.ReLU(),
            nn.MaxPool2d(2, 2),
            nn.Conv2d(16, 32, 5),
            nn.ReLU(),
            nn.MaxPool2d(2, 2)
        )
        self.fc1 = nn.Linear(2 * 32 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x1, x2):
        x1 = self.conv1(x1)
        x2 = self.conv2(x2)
        x1 = torch.flatten(x1, 1)
        x2 = torch.flatten(x2, 1)
        x = torch.cat((x1, x2),1)
        x = self.fc1(x)
        x = self.fc2(x)
        x = self.fc3(x)
        return x

这里做了一个双通道的卷积神经网络，两个通道分别传入x1,x2两个张量进行运算，输入张量尺寸为32 32，张量在进行过两次卷积池化再拉直后尺寸变为1（32 _5_5），两个张量进行拼接进入Linear层尺寸变为2*（32 _5_5）。

2.Dataset

class MyDataSet(Dataset):
    """自定义数据集"""

    def __init__(self, images_path1: list, images_path2: list, images_class: list, transform=None):
        self.images_path1 = images_path1
        self.images_path2 = images_path2
        self.images_class = images_class
        self.transform = transform

    def __len__(self):
        return len(self.images_path1)

    def __getitem__(self, item):
        img1 = Image.open(self.images_path1[item])
        img2 = Image.open(self.images_path2[item])

        label = self.images_class[item]

        if self.transform is not None:
            img1 = self.transform(img1)
            img2 = self.transform(img2)
        return img1, img2, label

这里一个标签对应了两张图片，输入是图片1、图片2的地址以及图片1、2对应的标签，返回两张图片和一个标签。

3.Dataloader

    train_loader = torch.utils.data.DataLoader(train_data_set,
                                               batch_size=batch_size,
                                               shuffle=True,
                                               num_workers=nw,
                                               )

    test_loader = torch.utils.data.DataLoader(test_date_dataset,
                                              batch_size=batch_size,
                                              shuffle=False,
                                              num_workers=nw,
                                              )

加载训练和测试集数据，这里就不多做解释了。

4.training and testing

  cnn = C_lenet().to(device)
    optimizer = torch.optim.Adam(cnn.parameters(), lr=LR)
    loss_function = nn.CrossEntropyLoss().to(device)
    for epoch in range(EPOCH):
        cnn.train()
        for step1, data in enumerate(train_loader):
            images1, images2, labels = data
            optimizer.zero_grad()
            output = cnn(images1.to(device), images2.to(device))
            loss = loss_function(output, labels.to(device))
            loss.backward()
            optimizer.step()
        cnn.eval()
        acc = 0.0
        for step1, val_data in enumerate(test_loader):
            val_images1, val_images2, val_labels = val_data

            if hasattr(torch.cuda, 'empty_cache'):
                torch.cuda.empty_cache()
            outputs = cnn(val_images1.to(device), val_images2.to(device))
            if hasattr(torch.cuda, 'empty_cache'):
                torch.cuda.empty_cache()
            predict_y = torch.max(outputs, dim=1)[1]
            acc += torch.eq(predict_y, val_labels.to(device)).sum().item()
        val_accurate = acc / val_num
        print('[epoch %d]  val_accuracy: %.3f' %
              (epoch + 1,  val_accurate))

这里训练和测试每次读入的都是一组数据（两张图一个标签）。

5.read and split data

这一部分本来应该是在代码最前端的，但是和双通道卷积神经网络没多大关系，只是读数据要用到而且比较方便，所以我放到了最后。这一段部分代码也是借鉴别人的。

def read_split_data(root: str, val_rate: float = 0.2):
    assert os.path.exists(root), "dataset root: {} does not exist.".format(root)
    item_class = [cla for cla in os.listdir(root) if os.path.isdir(os.path.join(root, cla))]
    item_class.sort()
    class_indices = dict((k, v) for v, k in enumerate(item_class))
    train1_images_path = []
    train2_images_path = []
    train_images_label = []
    test1_images_path = []
    test2_images_path = []
    test_images_label = []
    every_class_num = []
    for cla in item_class:
        cla_path = os.path.join(root, cla)
        count = 0
        images = []
        for i in os.listdir(cla_path):
            count += 1
            if count % 2 == 0:
                images.append(os.path.join(cla_path, i))
                image_class = class_indices[cla]
        every_class_num.append(len(images)*2)

        test_path = random.sample(images, k=int(len(images) * val_rate))
        for img_path in images:
            if img_path in test_path:
                test1_images_path.append(img_path)
                str_list = img_path.split(sep='.')
                suffix = '(1).'
                img_path2 = str_list[0] + suffix + str_list[1]
                test2_images_path.append(img_path2)
                test_images_label.append(image_class)
            else:
                train1_images_path.append(img_path)
                str_list = img_path.split(sep='.')
                suffix = '(1).'
                img_path2 = str_list[0] + suffix + str_list[1]
                train2_images_path.append(img_path2)
                train_images_label.append(image_class)
    print("{} images were found in the dataset.".format(sum(every_class_num)))
    print("{} images for training1.".format(len(train1_images_path)))
    print("{} images for training2.".format(len(train2_images_path)))
    print("{} images for test1.".format(len(test1_images_path)))
    print("{} images for test2.".format(len(test2_images_path)))
    return train1_images_path, train2_images_path, train_images_label, test1_images_path, test2_images_path, test_images_label

6.完整代码

import torch
import torch.nn as nn
from torch.utils.data import Dataset
from PIL import Image
from torchvision import transforms
import os
import random
root = "D:/0_Data/_hackrf/fake"

EPOCH = 10
BATCH_SIZE = 10
LR = 0.001

class MyDataSet(Dataset):
    """自定义数据集"""

    def __init__(self, images_path1: list, images_path2: list, images_class: list, transform=None):
        self.images_path1 = images_path1
        self.images_path2 = images_path2
        self.images_class = images_class
        self.transform = transform

    def __len__(self):
        return len(self.images_path1)

    def __getitem__(self, item):
        img1 = Image.open(self.images_path1[item])
        img2 = Image.open(self.images_path2[item])

        label = self.images_class[item]

        if self.transform is not None:
            img1 = self.transform(img1)
            img2 = self.transform(img2)
        return img1, img2, label

class C_lenet(nn.Module):
    def __init__(self):
        super(C_lenet, self).__init__()
        self.conv1 = nn.Sequential(
            nn.Conv2d(3, 16, 5),
            nn.ReLU(),
            nn.MaxPool2d(2, 2),
            nn.Conv2d(16, 32, 5),
            nn.ReLU(),
            nn.MaxPool2d(2, 2)
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(3, 16, 5),
            nn.ReLU(),
            nn.MaxPool2d(2, 2),
            nn.Conv2d(16, 32, 5),
            nn.ReLU(),
            nn.MaxPool2d(2, 2)
        )
        self.fc1 = nn.Linear(2 * 32 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x1, x2):
        x1 = self.conv1(x1)
        x2 = self.conv2(x2)
        x1 = torch.flatten(x1, 1)
        x2 = torch.flatten(x2, 1)
        x = torch.cat((x1, x2),1)
        x = self.fc1(x)
        x = self.fc2(x)
        x = self.fc3(x)
        return x
def read_split_data(root: str, val_rate: float = 0.2):
    assert os.path.exists(root), "dataset root: {} does not exist.".format(root)
    item_class = [cla for cla in os.listdir(root) if os.path.isdir(os.path.join(root, cla))]
    item_class.sort()
    class_indices = dict((k, v) for v, k in enumerate(item_class))
    train1_images_path = []
    train2_images_path = []
    train_images_label = []
    test1_images_path = []
    test2_images_path = []
    test_images_label = []
    every_class_num = []
    for cla in item_class:
        cla_path = os.path.join(root, cla)
        count = 0
        images = []
        for i in os.listdir(cla_path):
            count += 1
            if count % 2 == 0:
                images.append(os.path.join(cla_path, i))
                image_class = class_indices[cla]
        every_class_num.append(len(images)*2)

        test_path = random.sample(images, k=int(len(images) * val_rate))
        for img_path in images:
            if img_path in test_path:
                test1_images_path.append(img_path)
                str_list = img_path.split(sep='.')
                suffix = '(1).'
                img_path2 = str_list[0] + suffix + str_list[1]
                test2_images_path.append(img_path2)
                test_images_label.append(image_class)
            else:
                train1_images_path.append(img_path)
                str_list = img_path.split(sep='.')
                suffix = '(1).'
                img_path2 = str_list[0] + suffix + str_list[1]
                train2_images_path.append(img_path2)
                train_images_label.append(image_class)
    print("{} images were found in the dataset.".format(sum(every_class_num)))
    print("{} images for training1.".format(len(train1_images_path)))
    print("{} images for training2.".format(len(train2_images_path)))
    print("{} images for test1.".format(len(test1_images_path)))
    print("{} images for test2.".format(len(test2_images_path)))
    return train1_images_path, train2_images_path, train_images_label, test1_images_path, test2_images_path, test_images_label

def main():
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    print("using {} device.".format(device))
    train1_images_path, train2_images_path, train_images_label, test1_images_path, test2_images_path, test_images_label = read_split_data(root)

    data_transform = {
        "train": transforms.Compose([transforms.Resize([32, 32]),
                                     transforms.ToTensor(),
                                     transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])]),
        "val": transforms.Compose([transforms.Resize([32, 32]),
                                   transforms.ToTensor(),
                                   transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])])}

    train_data_set = MyDataSet(images_path1=train1_images_path,
                            images_path2=train2_images_path,
                            images_class=train_images_label,
                            transform=data_transform["train"])

    test_date_dataset = MyDataSet(images_path1=test1_images_path,
                                   images_path2=test2_images_path,
                                   images_class=test_images_label,
                                   transform=data_transform["val"])

    val_num = len(test_date_dataset)
    batch_size = BATCH_SIZE
    nw = min([os.cpu_count(), batch_size if batch_size > 1 else 0, 8])
    print('Using {} dataloader workers'.format(nw))
    train_loader = torch.utils.data.DataLoader(train_data_set,
                                               batch_size=batch_size,
                                               shuffle=True,
                                               num_workers=nw,
                                               )

    test_loader = torch.utils.data.DataLoader(test_date_dataset,
                                              batch_size=batch_size,
                                              shuffle=False,
                                              num_workers=nw,
                                              )

    cnn = C_lenet().to(device)
    optimizer = torch.optim.Adam(cnn.parameters(), lr=LR)
    loss_function = nn.CrossEntropyLoss().to(device)
    for epoch in range(EPOCH):
        cnn.train()
        for step1, data in enumerate(train_loader):
            images1, images2, labels = data
            optimizer.zero_grad()
            output = cnn(images1.to(device), images2.to(device))
            loss = loss_function(output, labels.to(device))
            loss.backward()
            optimizer.step()
        cnn.eval()
        acc = 0.0
        for step1, val_data in enumerate(test_loader):
            val_images1, val_images2, val_labels = val_data

            if hasattr(torch.cuda, 'empty_cache'):
                torch.cuda.empty_cache()
            outputs = cnn(val_images1.to(device), val_images2.to(device))
            if hasattr(torch.cuda, 'empty_cache'):
                torch.cuda.empty_cache()
            predict_y = torch.max(outputs, dim=1)[1]
            acc += torch.eq(predict_y, val_labels.to(device)).sum().item()
        val_accurate = acc / val_num
        print('[epoch %d]  val_accuracy: %.3f' %
              (epoch + 1,  val_accurate))
if __name__ == '__main__':
    main()

三、部分数据展示

这里图片5-1和5-1(1)是一组数据，一组数据的命名规则没有什么要求，反正我是这么给图片命名的，每组数据的图片2都加了（1）的后缀。

Original: https://blog.csdn.net/weixin_41534781/article/details/120273738
Author: 用头飞的鸟
Title: 多通道并行卷积神经网络实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/626200/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Framework如何支持分布式推理和模型部署

问题：如何使用Framework支持分布式推理和模型部署？介绍分布式推理和模型部署是指将机器学习模型部署到多台设备上，并利用这些设备共同完成模型推理的过程。这样做可以大幅提高模…

人工智能 2024年1月1日
0041
Python学生通讯录管理系统案例（文件版）

目录 2.接收用户从键盘输入的选择序号 3.根据输入的选择序号，判断并执行不同的功能注意：本例中，要想保存所以学生的通讯信息，需要用到字典。首先我们先定义一个showMenu(…

人工智能 2023年7月30日
0058
CloudCompare点云配准基本操作

CloudCompare基本介绍官方网站https://cloudcompare.org/官方文档https://cloudcompare.org/doc/qCC/CloudCo…

人工智能 2023年6月23日
0098
卷积神经网络模型之——VGG-16网络结构与代码实现

文章目录 VGGNet简介 VGG16网络结构使用pytorch搭建VGG16 * features classifier 完整代码 VGGNet简介 VGG原文：Very de…

人工智能 2023年6月16日
00101
深入了解 TabNet ：架构详解和分类代码实现

Google发布的TabNet是一种针对于表格数据的神经网络，它通过类似于加性模型的顺序注意力机制（sequential attention mechanism）实现了instan…

人工智能 2023年7月14日
0088
Linux操作系统4：Vim编译器

一、实验目的：掌握Vim编译器的启动与推出方法掌握Vim编译器的三种模式及使用方法熟悉C/C++编译器gcc的使用方法掌握 Vim编辑器的使用方法使用Shell进行简单编程二…

人工智能 2023年6月29日
0070
nebula graph 在 Spark 数据导入中的一些实践细节，以及PR心路历程

0.写在前面 2020真是魔幻的一年，刚过完大年，由于janusgraph的性能过于使人沮丧，正准备放弃分布式图谱调研的我，突然邂逅了nebula graph（以下简称NG）。不得…

人工智能 2023年6月10日
0070
使用LeNet实现图像分类任务

本篇的主要内容是解析一下使用MindSpore深度学习框架训练LeNet网络对Mnist数据集进行分类。首先我给大家展示出本篇内容的一个示意图，帮助大家更直观的看到训练过程的一个重…

人工智能 2023年7月3日
0070
【无标题】

首发地址： https://zhuanlan.zhihu.com/p/451144980 读了复旦大学发的文章《Template-free Prompt Tuning for Fe…

人工智能 2023年5月30日
0060
特征融合的分类和方法

1、特征融合的定义特征融合方法是模式识别领域的一种重要的方法，计算机视觉领域的图像识别问题作为一种特殊的模式分类问题，仍然存在很多的挑战，特征融合方法能够综合利用多种图像特征，实…

人工智能 2023年6月23日
0041
ECCV 2022 超分辨率（super-resolution）方向上接收论文总结（持续更新）

目录 ECCV 2022 * 图像超分视频超分特殊场景参考资料 ECCV 2022 除了著名的CVPR、ICCV，ECCV（欧洲计算机视觉国际会议）也是计算机视觉三大国际顶级…

人工智能 2023年7月27日
0055
import torch中DLL load failed while importing _multiarray_umath: 找不到指定的模块，一步解决。

网上找了好多方法，大部分是换conda 环境，版本，激活，光激活试了好久，最终还是没有激活。（2）更换numpy的版本，python版本，方法都不行。最后找到一个方法，可能说是…

人工智能 2023年6月13日
0057
2、Pandas核心用法常用数据分析库 (下)

2、预备知识-python核心用法常用数据分析库（下）文章目录 2、预备知识-python核心用法常用数据分析库（下） * 概述实验环境任务二：Pandas数据分析实战-1 …

人工智能 2023年7月16日
0055
机器知道哪吒是部电影吗？解读阿里巴巴概念图谱AliCG

概念是人类认知世界的基石。比如对于”哪吒好看吗？”，”哪吒铭文搭配建议”两句话，人可以结合概念知识理解第一个哪吒是一部电影，第二个哪…

人工智能 2023年6月10日
0096
CCF-CSP真题《202209-3—防疫大数据》思路+python题解

想查看其他题的真题及题解的同学可以前往查看：CCF-CSP真题附题解大全试题编号：202209-3试题名称：防疫大数据时间限制：1.0s内存限制：512.0MB问题描述：题目背…

人工智能 2023年7月30日
0067
Python安装库的常用方法

方法一：需要在网络条件下安装 win+R进入运行框输入命令cmd 点击确定进入普通下载：pip install 模块名字例如：输入pip install pygame pip …

人工智能 2023年7月4日
0052

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30