模型压缩（2）——模型剪枝

2023年7月23日下午7:24 • 人工智能 • 阅读 111

1. 使用pytorch的prune工具进行剪枝

使用pytorch自带的prune函数进行剪枝，剪枝后被剪掉的参数为0，应将为0的参数剔除运算，否则为虚假的剪枝，速度甚至更慢

参考代码如下，model为训练后的模型，经循环得到剪枝模型，需微调回复精度，感觉没太大作用，不做具体演示。

from torch.nn.utils import prune
使用named_modules可以得到每一个最小层，使用named_children仅能得到较大的块
for n,module in model.named_modules():
    # 对线性层剪枝
    if isinstance(module,torch.nn.Linear):
        # 可以选择多种裁剪方式，此处选择了随机裁剪；
        # 其中name代表是对哪个参数进行裁剪，如果对偏置进行裁剪则该参数值为'bias'；
        # amount是指裁剪比例
        prune.random_unstructured(module,name = 'weight', amount = 0.3)
        # 此时model.weight被替换为model.weight_orig和model.weight_mask 
        # 使用list(module.named_buffers())可以查看
        prune.remove(module,'weight')

2. 使用微软的nni工具进行剪枝

需要安装nni库，从nni.algorithms.compression.pytorch.pruning中选择想要的剪枝方法

教程链接：Pruning — An open source AutoML toolkit for neural architecture search, model compression and hyper-parameter tuning (NNI v2.6.1) 模型压缩（2）——模型剪枝 https://nni.readthedocs.io/en/stable/Compression/pruning.html ;

演示demo：https://github.com/microsoft/nni/blob/70706eba4e6723b5647cbd20f02c218568bbbcf8/examples/model_compress/pruning/basic_pruners_torch.py 模型压缩（2）——模型剪枝 https://github.com/microsoft/nni/blob/70706eba4e6723b5647cbd20f02c218568bbbcf8/examples/model_compress/pruning/basic_pruners_torch.py ;

这里给一个简单的实现过程，有些打印可能冗余了，不要介意

import torch
from torch import nn
from torchvision import models
from torchvision import datasets
from torch import optim
import torchvision.transforms as transforms
from torchsummary import summary
import numpy as np
import random
import nni
from nni.algorithms.compression.pytorch.pruning import LevelPruner
from nni.algorithms.compression.pytorch.pruning import L2FilterPruner
from nni.compression.pytorch import ModelSpeedup

epochs = 10
device = torch.device("cpu")
batch_size = 64
train_loader = torch.utils.data.DataLoader(
    datasets.CIFAR10('./data', train=True, download=True,
                     transform=transforms.Compose([
                         transforms.ToTensor()
                     ])),
    batch_size=batch_size, shuffle=True)

test_loader = torch.utils.data.DataLoader(
    datasets.CIFAR10('./data', train=False,
                     transform=transforms.Compose([
                         transforms.ToTensor()
                     ])),
    batch_size=batch_size, shuffle=True)

class simple_model(nn.Module):
    def __init__(self):
        super(simple_model, self).__init__()
        self.feature = nn.Sequential(
            nn.Conv2d(3, 16, 3),
            nn.ReLU(inplace=True),
            nn.Conv2d(16, 32, 3),
            nn.ReLU(inplace=True),
            nn.Conv2d(32, 64, 3),
            nn.ReLU(inplace=True),
            nn.AdaptiveAvgPool2d((5, 5))
        )
        self.classifer = nn.Sequential(
            nn.Linear(64*5*5, 10),
        )

    def forward(self, x):
        x = self.feature(x)
        x = torch.flatten(x, 1)
        x = self.classifer(x)
        return x

def train(model, mode="train"):
    model = model.to(device)
    optimizer = optim.Adam(model.parameters(), lr=0.001)
    criteon = nn.CrossEntropyLoss()
    for epoch in range(epochs):
        for batch_idx, (data, target) in enumerate(train_loader):
            if mode == "train":
                logits = model(data.to(device))
                loss = criteon(logits, target.to(device))
                optimizer.zero_grad()
                loss.backward()
                optimizer.step()
                if batch_idx % 1000 == 0:
                    print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                        epoch, batch_idx * len(data), len(train_loader.dataset),
                               100. * batch_idx / len(train_loader), loss.item()))

        test_loss = 0
        correct = 0
        with torch.no_grad():
            for data, target in test_loader:
                logits = model(data.to(device))
                test_loss += criteon(logits, target.to(device)).item()
                pred = logits.data.max(1)[1]
                target = target.cpu()
                pred = pred.cpu()
                correct += pred.eq(target.data).sum()
        test_loss /= len(test_loader.dataset)
        print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
            test_loss, correct, len(test_loader.dataset),
            100. * correct / len(test_loader.dataset)))
    if mode == "train":
        torch.save(model.state_dict(), "./model/origin_model.pth")

if __name__ == '__main__':
    model = simple_model()
    # 先训练一个模型
    train(model, mode="train")
    model.load_state_dict(torch.load("./model/origin_model.pth"))
    # 打印一下看看
    summary(model, (3, 64, 64), device="cpu")
    # 输出一下精度
    print("----------------原模型精度-----------------")
    train(model, mode="val")
    # 定义剪枝配置
    config_list = [{'sparsity': 0.8, 'op_types': ['Conv2d']}]
    # 生成剪枝后的模型以及掩膜
    # 有很多种剪枝方法，可以自己选
    pruner = L2FilterPruner(model, config_list)
    model = pruner.compress()
    pruner.export_model(model_path="./model/prune.pth", mask_path="./model/mask.pth")
    # 压缩模型
    pruner._unwrap_model()
    m_Speedup = ModelSpeedup(model, torch.randn([64, 3, 64, 64]), "./model/prune_mask.pth", "cpu")
    m_Speedup.speedup_model()
    # 打印一下模型
    summary(model, (3, 64, 64), device="cpu")
    # 打印一下模型精度
    print("---------------剪枝模型精度------------------")
    train(model, mode="val")
    # 再次训练微调模型
    train(model, mode="train")
    # 打印一下精度
    print("---------------剪枝微调精度------------------")
    train(model, mode="val")
    # 保存模型
    torch.save(model.state_dict(), "./model/prune_model.pth")

精度对比如下

Test set: Average loss: 0.0422, Accuracy: 1114/10000 (11%)

Original: https://blog.csdn.net/m0_58772523/article/details/123452574
Author: 不变强不改名
Title: 模型压缩（2）——模型剪枝

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/711181/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

在CNN中，卷积核的大小和数量如何选择？这个选择会对图像特征提取有什么影响

问题背景在卷积神经网络 (Convolutional Neural Networks, CNNs) 中，卷积核是深度学习中的一个重要概念。卷积神经网络通过使用卷积核从原始图像中提…

人工智能 2024年1月5日
0048
sklearn综合示例5：多分类分类器

二元分类器在两个类中区分，而多类分类器（也称为多项分类器）可以区分两个以上的类。有一些算法（如随机森林分类器或朴素贝叶斯分类器）可以直接处理多个类。也有一些严格的二元分类器（如支持…

人工智能 2023年7月1日
0064
EfficientNET_V1

EffcientNet_v1:高效的拓宽卷积网络来达到更好的效率和精度。目录 1.引言 2.增加模型规模 3.NAS搜索 4.网络详细结构 5.MBConv架构论文地址： 1….

人工智能 2023年7月1日
0093
单组率的meta分析——R与Stata

单组率的meta分析——R与Stata 一、Stata 进行单组率的meta分析，需要的数据为：每个原始研究的率及其标准误。因此，首先需要根据现有数据计算出每个原始研究的率及其标准…

人工智能 2023年6月24日
0058
Redis使用的21条军规（规范）

Redis使用的21条军规（规范）文章目录 Redis使用的21条军规（规范）前言一、基础规范【5条】二、键值设计【4条】三、操作命令【4条】四、内存优化【4条】五、…

人工智能 2023年6月29日
0078
绘制西北太平洋台风频数分布填色图

研究台风路径和影响，除了直接绘制台风路径，我们还往往想知道研究的台风在海上各个经纬度的频数分布，并直观展示在地图上。之前和大家交流过如何从台风路径数据集里提取指定条件的台风（用p…

人工智能 2023年7月16日
0075
protege和neo4j联系_Neo4j | 实体和关系的合并

实体消歧图数据存储的过程中有时会遇到这样一类问题，对于实体和关系数据而言，在数据预处理或者数据清洗时可以做到实体间是不会重复的(去除重复的数据)；虽然实体不重复，但可能两个实体所…

人工智能 2023年6月1日
00130
FLIR数据集详细解释

文章目录适用于算法训练的免费FLIR热数据集 * 前言为何ADAS要使用FLIR热传感技术？数据集详解数据集下载目标检测网络 Faster RCNN训练FLIR数据集 Y…

人工智能 2023年6月15日
0091
将csv每一行变成每一个独立csv

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月8日
0071
《大数据之路：阿里巴巴大数据实践》-第4篇数据应用篇 -第16章数据应用

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月17日
0045
synchronized的优化机制和一些多线程的常见类

1.1.我们现在知道常用的锁策略那synchronized基于这些策略有哪些特性呢? 1.2.synchronized 的一些锁优化机制(jdk 1.8) JVM 将 synch…

人工智能 2023年6月26日
0083
opencv-黑马程序员—Chapter1 opecv简介

Introduction 课程内容 1.opencv简介主要内容 1.1 图像处理简介 1.2 OpenCV简介 1.3 OpenCV的模块 Introduction 本课程是从…

人工智能 2023年7月19日
0043
T5模型简介

引言本文我们先学习一个T5(Text- To- Text Transfer Transformer)模型的基本概念，最后应用到文本摘要任务上作为实战。 T5模型文本到文本Tra…

人工智能 2023年6月16日
0095
解决：RuntimeError: CUDA out of memory. Tried to allocate 64.00 MiB (GPU 0； 4.00 GiB total capacity； 2

引发pytorch：CUDA out of memory错误的原因有两个： 1.当前要使用的GPU正在被占用，导致显存不足以运行你要运行的模型训练命令不能正常运行解决方法：1.换…

人工智能 2023年7月26日
00112
pytorch神经网络训练及测试流程&代码

当你已经设计好了一个神经网络模型MyModel，它可以在 model_my.py中封装成MyNet： class MyModel(nn.Module): def __init__(…

人工智能 2023年5月26日
0087
【15】opencv卷积运算

参考：【OpenCV学习笔记】之卷积及卷积算子（convolution）_点滴成海~的博客-CSDN博客_卷积算子（关于卷积运算） opencv RNG函数 – 0M…

人工智能 2023年7月20日
0060

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

模型压缩（2）——模型剪枝

1. 使用pytorch的prune工具进行剪枝

2. 使用微软的nni工具进行剪枝

精度对比如下

大家都在看