小样本故障诊断 – 注意力机制代码 – BiGRU代码解析实现

2023年6月15日上午9:10 • 人工智能 • 阅读 77

文章目录

1 参考论文
2 开源代码
3.摘要
4.故障诊断流程图
5.网络模型
6.网络结构简介
7.网络模型代码
*
7.1MetaAconC
–
- 模块代码
- 代码测试
7.2注意力机制
–
7.3 BiGRU测试
–
- BiGRU结构图
7.4 全局平均池化GAP测试
7.5 整体网络测试
–
- 整体网络代码
- 代码测试
8 实验设置
–
- 8.1 模型参数设置
- 8.2 实验数据设置
9 实验验证
–
（后续继续完善）

1 参考论文

Fault diagnosis for small samples based on attention mechanism

2 开源代码

https://github.com/liguge/Fault-diagnosis-for-small-samples-based-on-attention-mechanism

3.摘要

针对深度学习在故障诊断中的应用，机械旋转设备部件在复杂的工作环境下容易发生故障，工业大数据存在标记样本有限、工作条件不同、噪声等问题。针对上述问题，提出了一种基于双路径卷积与注意机制(DCA)和双向门控循环单元(DCA- bigru)的小样本故障诊断方法，该方法的性能可以通过最新的正则化训练策略进行有效挖掘。利用BiGRU实现时空特征融合，利用DCA提取融合了注意权的振动信号特征。此外，还将全局平均池化(GAP)应用于降维和故障诊断。实验表明，DCA-BiGRU具有出色的泛化能力和鲁棒性，能够有效地进行各种复杂情况下的诊断。

4.故障诊断流程图

; 5.网络模型

6.网络结构简介

输入1维数据：[batch_size, 1, 1024]–>双通道卷积–>特征融合（cat）–>注意力机制–>Bidirection GRU–>全局平均池化（Global average pool）–>全连接层–>softmax求分类概率

7.网络模型代码

建议使用pytorch，jupyter notebook

7.1MetaAconC

模块代码

import torch
from torch import nn
class AconC(nn.Module):
    r""" ACON activation (activate or not).

    # AconC: (p1*x-p2*x) * sigmoid(beta*(p1*x-p2*x)) + p2*x, beta is a learnable parameter
    # according to "Activate or Not: Learning Customized Activation" .
"""

    def __init__(self, width):
        super().__init__()
        self.p1 = nn.Parameter(torch.randn(1, width, 1))
        self.p2 = nn.Parameter(torch.randn(1, width, 1))
        self.beta = nn.Parameter(torch.ones(1, width, 1))
    def forward(self, x):
        return (self.p1 * x - self.p2 * x) * torch.sigmoid(self.beta * (self.p1 * x - self.p2 * x)) + self.p2 * x

class MetaAconC(nn.Module):
    r""" ACON activation (activate or not).

    # MetaAconC: (p1*x-p2*x) * sigmoid(beta*(p1*x-p2*x)) + p2*x, beta is generated by a small network
    # according to "Activate or Not: Learning Customized Activation" .
"""

    def __init__(self, width, r=16):
        super().__init__()
        self.fc1 = nn.Conv1d(width, max(r, width // r), kernel_size=1, stride=1, bias=True)
        self.bn1 = nn.BatchNorm1d(max(r, width // r), track_running_stats=True)
        self.fc2 = nn.Conv1d(max(r, width // r), width, kernel_size=1, stride=1, bias=True)
        self.bn2 = nn.BatchNorm1d(width, track_running_stats=True)
        self.p1 = nn.Parameter(torch.randn(1, width, 1))
        self.p2 = nn.Parameter(torch.randn(1, width, 1))

    def forward(self, x):
        beta = torch.sigmoid(self.bn2(self.fc2(self.bn1(self.fc1(x.mean(dim=2, keepdims=True))))))
        return (self.p1 * x - self.p2 * x) * torch.sigmoid(beta * (self.p1 * x - self.p2 * x)) + self.p2 * x

代码测试

x = torch.randn(16, 64, 1024)
Meta = MetaAconC(64)
y = Meta(x)
print(y.shape)

>>>output
x.shape: torch.Size([16, 64, 1024])
y.shape: torch.Size([16, 64, 1024])

由结果可见，输入x的shape与输出y的shape是相同的

7.2注意力机制

注意力机制结构图

; 模块代码

class CoordAtt(nn.Module):
    def __init__(self, inp, oup, reduction=32):
        super(CoordAtt, self).__init__()

        self.pool_w = nn.AdaptiveMaxPool1d(1)
        mip = max(6, inp // reduction)
        self.conv1 = nn.Conv1d(inp, mip, kernel_size=1, stride=1, padding=0)
        self.bn1 = nn.BatchNorm1d(mip, track_running_stats=False)
        self.act = MetaAconC(mip)
        self.conv_w = nn.Conv1d(mip, oup, kernel_size=1, stride=1, padding=0)

    def forward(self, x):
        identity = x
        n, c, w = x.size()
        x_w = self.pool_w(x)
        y = torch.cat([identity, x_w], dim=2)
        y = self.conv1(y)
        y = self.bn1(y)
        y = self.act(y)
        x_ww, x_c = torch.split(y, [w, 1], dim=2)
        a_w = self.conv_w(x_ww)
        a_w = a_w.sigmoid()
        out = identity * a_w
        return out

模块代码测试

x = torch.randn(16, 64, 1024)
Att = CoordAtt(inp=64, oup=64)
y = Att(x)
print('y.shape:',y.shape)

>>>output
y.shape: torch.Size([16, 64, 1024])

由结果可见，输入x的shape与输出y的shape是相同的

7.3 BiGRU测试

BiGRU结构图

x = torch.randn(16, 64, 128)
gru = nn.GRU(128, 64, bidirectional=True)

y = gru(x)
print('y的值：\n',y)
print('y[0]的shape',y[0].shape)

>>>output
y的值：
 (tensor([[[-0.7509, -0.0468,  0.2881,  ..., -0.6559,  0.5780,  0.3481],
         [ 0.4099,  0.1912, -0.2534,  ..., -0.2067, -0.1099, -0.3594],
         [ 0.0275,  0.0937, -0.4309,  ..., -0.6266,  0.5375,  0.2510],
         ...,
         [-0.1896, -0.0118, -0.4895,  ...,  0.2022,  0.3144,  0.1806],
         [-0.5026,  0.4926, -0.2578,  ..., -0.3386, -0.3908, -0.1203],
         [-0.0431, -0.1084,  0.4494,  ...,  0.4320, -0.2916,  0.4126]]],
       grad_fn=<StackBackward0>))
y[0]的shape torch.Size([16, 64, 128])

由结果可以看出，y的输出为一个tuple元组类型，因此使用了y[0]获取里面的tensor数据。

7.4 全局平均池化GAP测试


x = torch.randn(16, 64, 32)
print('x的值:\n',x)
print('x[0][0]的值:',x[0][0])
print('x[0][0]的平均值:',torch.mean(x[0][0]))

adavp = nn.AdaptiveAvgPool1d(1)
y = adavp(x)
print('y的值:',y)
print('y的shape:',y.shape)

z = y.squeeze()
print('z的shape:',z.shape)

x的值:
 tensor([[[ 7.8979e-01,  1.3657e-01, -9.9066e-01,  ...,  9.5261e-01,
           9.8295e-02,  6.5511e-01],
         [-3.5707e-01, -2.3277e+00, -3.2558e-01,  ..., -2.2010e-01,
          -1.6210e+00, -1.2564e+00],
         [ 1.0400e+00, -1.8403e-01,  1.1634e+00,  ...,  5.7404e-02,
          -7.0334e-01, -1.5286e-01],
         ...,
         [-1.7541e+00,  5.9410e-01, -1.3539e-01,  ...,  8.6600e-02,
           1.2851e+00, -2.1541e+00],
         [ 1.6649e+00, -3.0008e+00, -6.5557e-01,  ...,  3.8984e-01,
          -2.4122e+00,  1.3892e+00],
         [ 3.2660e-01,  1.4245e+00,  8.2627e-01,  ..., -1.1504e+00,
           8.5084e-01, -2.3794e-02]]])
x[0][0]的值: tensor([ 0.7898,  0.1366, -0.9907, -0.9970,  1.6666, -1.5021,  0.9952,  0.5044,
         0.0828,  1.1746, -1.1589, -1.2519, -1.6039, -0.9943,  0.4700, -0.5370,
         0.5983, -0.6333, -1.3765, -0.9212, -0.3939, -0.7217,  0.4318,  0.4706,
         0.6322, -0.4217, -1.0003,  1.6015,  0.5162,  0.9526,  0.0983,  0.6551])
x[0][0]的平均值: tensor(-0.0852)
y的值: tensor([[[-0.0852],
         [-0.6024],
         [-0.0316],
         ...,
         [ 0.0157],
         [-0.2135],
         [ 0.1926]]])
y的shape: torch.Size([16, 64, 1])
z的shape: torch.Size([16, 64])

由结果可以看出，输入数据x1.shape=[16, 64, 32]全局平均池化是将输入数据的最后一维，及32个数据点取平均值。得到[16, 64]

7.5 整体网络测试

整体网络代码

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.p1_1 = nn.Sequential(nn.Conv1d(in_channels=1, out_channels=50, kernel_size=18, stride=2),
                                  nn.BatchNorm1d(50, track_running_stats=False),
                                  MetaAconC(50))
        self.p1_2 = nn.Sequential(nn.Conv1d(50, 30, kernel_size=10, stride=2),
                                  nn.BatchNorm1d(30, track_running_stats=False),
                                  MetaAconC(30))
        self.p1_3 = nn.MaxPool1d(2, 2)
        self.p2_1 = nn.Sequential(nn.Conv1d(1, 50, kernel_size=6, stride=1),
                                  nn.BatchNorm1d(50, track_running_stats=False),
                                  MetaAconC(50))
        self.p2_2 = nn.Sequential(nn.Conv1d(50, 40, kernel_size=6, stride=1),
                                  nn.BatchNorm1d(40, track_running_stats=False),
                                  MetaAconC(40))
        self.p2_3 = nn.MaxPool1d(2, 2)
        self.p2_4 = nn.Sequential(nn.Conv1d(40, 30, kernel_size=6, stride=1), nn.BatchNorm1d(30, track_running_stats=False),MetaAconC(30))
        self.p3_0 = CoordAtt(30, 30)
        self.p2_5 = nn.Sequential(nn.Conv1d(30, 30, kernel_size=6, stride=2),
                                  nn.BatchNorm1d(30, track_running_stats=False),
                                  MetaAconC(30))
        self.p2_6 = nn.MaxPool1d(2, 2)

        self.p3_1 = nn.Sequential(nn.GRU(124, 64, bidirectional=True))

        self.p3_3 = nn.Sequential(nn.AdaptiveAvgPool1d(1))
        self.p4 = nn.Sequential(nn.Linear(30, 10))

    def forward(self, x):
        p1 = self.p1_3(self.p1_2(self.p1_1(x)))
        print('p1.shape:',p1.shape)

        p2 = self.p2_6(self.p2_5(self.p2_4(self.p2_3(self.p2_2(self.p2_1(x))))))
        print('p2.shape:',p2.shape)

        encode = torch.mul(p1, p2)
        print('encode.shape:',encode.shape)

        p3_0 = self.p3_0(encode).permute(1, 0, 2)
        print('p3_0.shape:',p3_0.shape)

        p3_2, _ = self.p3_1(p3_0)
        print('p3_2.shape:',p3_2.shape)

        p3_11 = p3_2.permute(1, 0, 2)
        print('p3_11.shape:',p3_11.shape)

        p3_12 = self.p3_3(p3_11).squeeze()
        print('p3_12.shape:',p3_12.shape)

        p4 = self.p4(p3_12)
        print('p4.shape:',p4.shape)
        return p4

代码测试

model = Net()
x = torch.randn(16, 1, 1024)
y = model(x)

>>>output
p1.shape: torch.Size([16, 30, 124])
p2.shape: torch.Size([16, 30, 124])
encode.shape: torch.Size([16, 30, 124])
p3_0.shape: torch.Size([30, 16, 124])
p3_2.shape: torch.Size([30, 16, 128])
p3_11.shape: torch.Size([16, 30, 128])
p3_12.shape: torch.Size([16, 30])
p4.shape: torch.Size([16, 10])

8 实验设置

8.1 模型参数设置

; 8.2 实验数据设置

9 实验验证

案例1：CWRU

不同batch_size下的结果

; 不同负载下的结果

（后续继续完善）

注：
① 若本论文对你有帮助启发，建议引用本论文~
② 欢迎关注公众号《故障诊断与Python学习》
③ 若有好的开源代码，欢迎后台联系推荐~

Original: https://blog.csdn.net/m0_47410750/article/details/125420901
Author: 故障诊断与python学习
Title: 小样本故障诊断 – 注意力机制代码 – BiGRU代码解析实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/614292/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习——朴素贝叶斯

目录一、什么朴素贝叶斯（基于概率进行预测的算法，用于分类）二、计算方法 2.1 基本方法 2.2 后验概率最大化的含义三、朴素贝叶斯法的参数估计 3.1 极大似然估计 3.2…

人工智能 2023年7月3日
0083
力扣刷题day46|1143最长公共子序列、1035不相交的线、53最大子序和

文章目录 * – 1143. 最长公共子序列 – + 思路 + * 动态规划五部曲 – 1035. 不相交的线 – + 思路 + *…

人工智能 2023年6月29日
00101
基于Python实现的口罩佩戴检测

口罩佩戴检测设计报告和源码下载地址：https://download.csdn.net/download/sheziqiong/85594224 一题目背景 1.1 实验介绍 …

人工智能 2023年7月4日
0088
lidar_align联合标定激光雷达和IMU外参

lidar_align联合标定激光雷达和IMU外参运行LIO-SAM之前需要联合标定激光雷达和IMU的外参，官方推荐的方案是浙大的开源联合标定方案：lidar_IMU_calib…

人工智能 2023年6月2日
00135
【OpenCV 例程200篇】25. 图像的平移（cv2.warpAffine）

『youcans 的 OpenCV 例程200篇 – 总目录』【youcans 的 OpenCV 例程200篇】25. 图像的平移平移是物体位置在水平和垂直方向的移…

人工智能 2023年7月19日
0093
时间序列的数据分析(六):指数平滑预测法

之前已经完成了五篇关于时间序列的博客，还没有阅读过的读者请先阅读：时间序列的数据分析(一):主要成分时间序列的数据分析(二):数据趋势的计算时间序列的数据分析(三):经典时间…

人工智能 2023年7月7日
00113
Hive实战—时间滑动窗口计算

关注公众号： 大数据技术派，回复 &#x…

人工智能 2023年6月11日
00103
SPL工业智能：原料与产品的拟合

问题提出工业生产活动的目标是利用原料生产产品，从而产生利润。原料经过一系列加工过程，包括物理反应和化学反应，最终形成产品，生产的理想状态是原料到产品的转换率是确定的，工厂想生产多…

人工智能 2023年7月25日
0092
python 总结

1.1 列表包括列表的排序、 zip函数、交集、并集等。 1.2 元组包括元组的创建和常用方法（ count方法） 1.3 字典包括字典的创建和操作（访问、插入、替换、检查、…

人工智能 2023年7月17日
0055
激活函数和最常用的10个激活函数

1. 什么是激活函数 activation function 激活函数是一种添加到ANN中的函数，它决定了最终要发射给下一个神经元的内容。在人工神经网络中，一个节点的激活函数 …

人工智能 2023年7月27日
0098
人工智能 —– 深度学习篇之tensorflow(1)

切记：下边的过程记得先将自己创建的虚拟环境进行激活才能在新的虚拟环境下进行操作。基于的tensorflow版本是1.6版本的，如果代码…

人工智能 2023年6月16日
0079
Matlab语句：rmoutliers（检测并删除数据中的离群值）

B = rmoutliers(A) B = rmoutliers(A,method) B = rmoutliers(A,’percentiles’,threshold) B = r…

人工智能 2023年6月15日
00101
【canny边缘检测】canny边缘检测原理及代码详解

文章目录前言 canny边缘检测算法主要流程一、高斯模糊二、图像梯度计算三、非极大值抑制四、双阈值边界跟踪前言本文通过介绍canny边缘检测原理与代码解析，希望能让大…

人工智能 2023年5月28日
0071
一文读懂反向传播算法原理

1.前言写这个文章主要是因为学习了吴恩达老师的机器学习视频，在神经网络的反向传播算法（Back Propagation）的公式推导有些模糊，所以自己也查阅了很多资料，才基本搞…

人工智能 2023年6月15日
0099
OpenCV：图像锐化

目录 1.简介 2.滤波 2.1 Sobel算子 1.Sobel输出类型为CV_8U 2.Sobel输出类型为CV_16S 2.2 Laplacian算子 1.没有高斯平滑的拉普拉…

人工智能 2023年5月28日
00133
基于pytorch平台实现对MNIST数据集的分类分析（前馈神经网络、softmax）基础版

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月1日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

小样本故障诊断 – 注意力机制代码 – BiGRU代码解析实现

文章目录

7.1MetaAconC

模块代码

代码测试

7.2注意力机制

注意力机制结构图

; 模块代码

模块代码测试

7.3 BiGRU测试

BiGRU结构图

7.4 全局平均池化GAP测试

7.5 整体网络测试

整体网络代码

代码测试

8 实验设置

8.1 模型参数设置

; 8.2 实验数据设置

9 实验验证

案例1：CWRU

不同batch_size下的结果

; 不同负载下的结果

（后续继续完善）

大家都在看