【动手教你学故障诊断:Python实现Tensorflow+CNN深度学习的轴承故障诊断（西储大学数据集）（含完整代码）】

2023年5月26日下午9:17 • 人工智能 • 阅读 68

项目名称

动手教你学故障诊断:Python实现基于Tensorflow+CNN深度学习的轴承故障诊断（西储大学数据集）（含完整代码）

项目介绍

该项目使用tensorflow和keras搭建深度学习CNN网络，并使用西储大学数据集作为训练集和测试集，对西储大学mat格式数据进行处理，将数据放入搭建好的网络中进行训练，最终得到相关故障诊断模型。

背景

最近在上故障诊断的课程，老师发给我们西储大学的轴承故障数据集，让我们自己去折腾。正巧前段时间学习了深度学习的课程，因此想着自己搭建一个深度学习的网络来进行相关故障的诊断。查阅相关文献，使用深度学习的故障诊断方法目前主要有两种形式，一种是直接将相关加速度一维数据放入深度学习网络中学习，另一种方式是使用相关变化将加速度数据转为二维图像，将二维图像放入深度学习网络进行学习。本文采用的是第一种方法，接下来对代码相关部分进行介绍，想要学习实践的也可以直接跳到最后有完整代码。

项目相关展示

基本环境介绍

电脑环境：

Windows10

Python环境：

Conda + python3.7
Tensorflow：1.7.1
keras
h5py==2.10.0

数据预处理

下面的代码可以实现数据的预处理，深度学习使用的数据需要我们进行随机划分训练集和测试集，并对相关的数据集打标签。一般我们使用的是0-1编码作为标签，这样做更有利于网络的计算。

from scipy.io import loadmat
import numpy as np
import os
from sklearn import preprocessing
from sklearn.model_selection import StratifiedShuffleSplit

def prepro(d_path, length=864, number=1000, normal=True, rate=[0.5, 0.25, 0.25], enc=True, enc_step=28):
    """对数据进行预处理,返回train_X, train_Y, valid_X, valid_Y, test_X, test_Y样本.

    :param d_path: 源数据地址
    :param length: 信号长度，默认2个信号周期，864
    :param number: 每种信号个数,总共10类,默认每个类别1000个数据
    :param normal: 是否标准化.True,False.默认True
    :param rate: 训练集/验证集/测试集比例.默认[0.5,0.25,0.25],相加要等于1
    :param enc: 训练集、验证集是否采用数据增强.Bool,默认True
    :param enc_step: 增强数据集采样顺延间隔
    :return: Train_X, Train_Y, Valid_X, Valid_Y, Test_X, Test_Y

    
    import preprocess.preprocess_nonoise as pre

    train_X, train_Y, valid_X, valid_Y, test_X, test_Y = pre.prepro(d_path=path,
                                                                    length=864,
                                                                    number=1000,
                                                                    normal=False,
                                                                    rate=[0.5, 0.25, 0.25],
                                                                    enc=True,
                                                                    enc_step=28)
    
"""

    filenames = os.listdir(d_path)

    def capture(original_path):
        """读取mat文件，返回字典

        :param original_path: 读取路径
        :return: 数据字典
"""
        files = {}
        for i in filenames:

            file_path = os.path.join(d_path, i)
            file = loadmat(file_path)
            file_keys = file.keys()
            for key in file_keys:
                if 'DE' in key:
                    files[i] = file[key].ravel()
        return files

    def slice_enc(data, slice_rate=rate[1] + rate[2]):
        """将数据切分为前面多少比例，后面多少比例.

        :param data: 单挑数据
        :param slice_rate: 验证集以及测试集所占的比例
        :return: 切分好的数据
"""
        keys = data.keys()
        Train_Samples = {}
        Test_Samples = {}
        for i in keys:
            slice_data = data[i]
            all_lenght = len(slice_data)
            end_index = int(all_lenght * (1 - slice_rate))
            samp_train = int(number * (1 - slice_rate))
            Train_sample = []
            Test_Sample = []
            if enc:
                enc_time = length // enc_step
                samp_step = 0
                for j in range(samp_train):
                    random_start = np.random.randint(low=0, high=(end_index - 2 * length))
                    label = 0
                    for h in range(enc_time):
                        samp_step += 1
                        random_start += enc_step
                        sample = slice_data[random_start: random_start + length]
                        Train_sample.append(sample)
                        if samp_step == samp_train:
                            label = 1
                            break
                    if label:
                        break
            else:
                for j in range(samp_train):
                    random_start = np.random.randint(low=0, high=(end_index - length))
                    sample = slice_data[random_start:random_start + length]
                    Train_sample.append(sample)

            for h in range(number - samp_train):
                random_start = np.random.randint(low=end_index, high=(all_lenght - length))
                sample = slice_data[random_start:random_start + length]
                Test_Sample.append(sample)
            Train_Samples[i] = Train_sample
            Test_Samples[i] = Test_Sample
        return Train_Samples, Test_Samples

    def add_labels(train_test):
        X = []
        Y = []
        label = 0
        for i in filenames:
            x = train_test[i]
            X += x
            lenx = len(x)
            Y += [label] * lenx
            label += 1
        return X, Y

    def one_hot(Train_Y, Test_Y):
        Train_Y = np.array(Train_Y).reshape([-1, 1])
        Test_Y = np.array(Test_Y).reshape([-1, 1])
        Encoder = preprocessing.OneHotEncoder()
        Encoder.fit(Train_Y)
        Train_Y = Encoder.transform(Train_Y).toarray()
        Test_Y = Encoder.transform(Test_Y).toarray()
        Train_Y = np.asarray(Train_Y, dtype=np.int32)
        Test_Y = np.asarray(Test_Y, dtype=np.int32)
        return Train_Y, Test_Y

    def scalar_stand(Train_X, Test_X):

        scalar = preprocessing.StandardScaler().fit(Train_X)
        Train_X = scalar.transform(Train_X)
        Test_X = scalar.transform(Test_X)
        return Train_X, Test_X

    def valid_test_slice(Test_X, Test_Y):
        test_size = rate[2] / (rate[1] + rate[2])
        ss = StratifiedShuffleSplit(n_splits=1, test_size=test_size)
        for train_index, test_index in ss.split(Test_X, Test_Y):
            X_valid, X_test = Test_X[train_index], Test_X[test_index]
            Y_valid, Y_test = Test_Y[train_index], Test_Y[test_index]
            return X_valid, Y_valid, X_test, Y_test

    data = capture(original_path=d_path)

    train, test = slice_enc(data)

    Train_X, Train_Y = add_labels(train)

    Test_X, Test_Y = add_labels(test)

    Train_Y, Test_Y = one_hot(Train_Y, Test_Y)

    if normal:
        Train_X, Test_X = scalar_stand(Train_X, Test_X)
    else:

        Train_X = np.asarray(Train_X)
        Test_X = np.asarray(Test_X)

    Valid_X, Valid_Y, Test_X, Test_Y = valid_test_slice(Test_X, Test_Y)
    return Train_X, Train_Y, Valid_X, Valid_Y, Test_X, Test_Y

if __name__ == "__main__":
    path = r'data\0HP'
    train_X, train_Y, valid_X, valid_Y, test_X, test_Y = prepro(d_path=path,
                                                                length=864,
                                                                number=1000,
                                                                normal=False,
                                                                rate=[0.5, 0.25, 0.25],
                                                                enc=False,
                                                                enc_step=28)

训练部分

数据处理完之后，就是我们的训练部分了，我们首先看一下我的CNN网络架构。

data_input=Input(shape=(4000,1))

conv1=convolutional.Conv1D(128,3,strides=3,padding="same")(data_input)
conv1=BatchNormalization(momentum=0.8)(conv1)
conv1=MaxPool1D(pool_size=4)(conv1)

conv2=convolutional.Conv1D(128,3,strides=3,padding="same")(conv1)
conv2=BatchNormalization(momentum=0.8)(conv2)
conv2=MaxPool1D(pool_size=4)(conv2)

conv3=convolutional.Conv1D(128,3,strides=3,padding="same")(conv2)
conv3=BatchNormalization(momentum=0.8)(conv3)
conv3=MaxPool1D(pool_size=4)(conv3)

flatten=Flatten()(conv3)
dense_1=Dense(128)(flatten)
dense_1=Dropout(0.3)(dense_1)

output = Dense(3, activation='softmax')(dense_1)

cnn_model= Model(input=data_input, output=output)
cnn_model.summary()

上面的部分就是我们的网络架构，就是比较传统的CNN网络架构，如果有不太了解的小伙伴可以留言或者自行查阅相关资料，如果有想了解的朋友比较多，我也可以单独出一篇博客进行详细讲解。

有了网络模型和数据之后我们就可以进行训练了，训练部分代码如下：

def train(cnn_model):

    epoch = 50
    filepath = "model\cnn-"+str(step)+"_weights"+str(epoch)+"-improvement-{epoch:02d}-{val_acc:.2f}.hdf5"

    checkpoint = ModelCheckpoint(filepath, monitor='val_acc', verbose=1, save_best_only=True, mode='max')
    callbacks_list = [checkpoint]

    cnn_model.compile(optimizer=Adam(lr=adam_lr),
                      loss='categorical_crossentropy',metrics=['accuracy'])

    history = cnn_model.fit( X_train, y_train, batch_size=128, epochs=epoch, verbose=1, validation_data=[X_test,y_test],callbacks=callbacks_list)

    epochs = range(epoch)
    plt.figure()
    plt.plot(epochs, history.history['acc'], 'b', label='Training acc')
    plt.plot(epochs, history.history['val_acc'], 'r', label='Validation acc')
    plt.title('Traing and Validation accuracy')
    plt.legend()
    plt.savefig('model_'+str(step)+'_'+str(epoch)+'V0.1_acc.jpg')

    plt.figure()
    plt.plot(epochs, history.history['loss'], 'b', label='Training loss')
    plt.plot(epochs, history.history['val_loss'], 'r', label='Validation val_loss')
    plt.title('Traing and Validation loss')
    plt.legend()
    plt.savefig('model_'+str(step)+'V1'+str(epoch)+'_loss.jpg')

在上面的代码中，我使用了回调函数call_back_list，将该段函数加入后，模型训练中会帮我们保存所有有提升的模型。plot函数可以进行画图，我们可以画出我们训练过程中所有的准确率，损失函数值，得到我们的准确率图像和损失函数。准确率函数图像如下。因为电脑配置有限，因此我只选取了50次作为案例，如果希望图像更好可以尝试更多的次数。

【动手教你学故障诊断:Python实现Tensorflow+CNN深度学习的轴承故障诊断（西储大学数据集）（含完整代码）】

损失函数

完整源码下载地址

基于Python+CNN深度学习的轴承故障诊断完整代码下载

Original: https://blog.csdn.net/qq_34211771/article/details/125212385
Author: 爱编程的研究生小王
Title: 【动手教你学故障诊断:Python实现Tensorflow+CNN深度学习的轴承故障诊断（西储大学数据集）（含完整代码）】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/522072/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

CVPR 2022: 图像分割论文大盘点

1 前言本文盘点了CVPR 2022 目前为止的2D图像分割相关论文，包含语义分割和实例分割，总计22篇论文，值得学习。 2 语义分割 2.1 强监督 (1) ReSTR: Co…

人工智能 2023年6月16日
0063
当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍

目录模型生成效果展示（prompt 全公开）如何注册 Stable Diffusion 使用 SD（dreamstudio.ai ）的收费标注如何 SD 提供哪些参数可以设置 …

人工智能 2023年7月29日
0045
共轭梯度法（Conjugate Gradients）（1）

最近在看ATOM，作者在线训练了一个分类器，用的方法是高斯牛顿法和共轭梯度法。看不懂，于是恶补了一波。学习这些东西并不难，只是难找到学习资料。简单地搜索了一下，许多文章都是一堆…

人工智能 2023年6月22日
0082
MLP算法详解与实现

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月16日
0051
【信息融合】基于matlab BP神经网络和DS证据理论不确定性信息融合问题【含Matlab源码 2204期】

⛄一、 D-S证据理论及解释证据理论由Dempster在1967年最初提出,并由他的学生Shafer改进推广使之成为符合有限离散领域中推理的形式,因此称为D-S理论。证据理论讨论…

人工智能 2023年6月26日
0060
同时安装 Tensorflow&Pytorch

Pytorch 与 Tensorflow 可一同安装，但需要注意版本对应问题，找到一个两者都能用的CUDA号，如：CUAD 11.0; Pytorch v1.7.1; tensor…

人工智能 2023年7月22日
0059
Android语音播报、后台播报、语音识别，android程序开发

《Android学习笔记总结+最新移动架构视频+大厂安卓面试真题+项目实战源码讲义》 > > 【docs.qq.com/doc/DSkNLaERkbnFoS0ZF】完…

人工智能 2023年5月23日
0074
【读书笔记】极简西方哲学史（一）

古希腊早期的哲学在探讨世界的本原，有自然哲学、形而上学两种主流 Original: https://www.cnblogs.com/mhlan/p/16113779.htmlAut…

人工智能 2023年6月4日
0063
u， v风和风速风向的相互转换

风向的定义风向是指风的来向，气象上一般定义正北方向为0，顺时针移动。风向Dir=0°（或360°）, u=0, v Original: https://blog.csdn.n…

人工智能 2023年6月15日
00274
deeplab v3+ 源码详解

训练模型：下载好voc数据集，并传入所需的参数即可进行训练。参数配置： """ 训练&#xFF…

人工智能 2023年7月28日
00140
基于Python的网络爬虫开发与实现

目录1 绪论 11.1选题背景 11.1.1课题的国内外的研究现状 11.1.2课题研究的必要性 21.2课题研究的内容 22 开发软件平台介绍 42.1 软件开发平台 42.2 …

人工智能 2023年7月17日
0066
Python+Neo4j知识图谱环境搭建

知识图谱构建的工具主要包含两个部分 Neo4j 用于存储实体和关系 Django python的Web框架 Django安装和使用 pip install django impor…

人工智能 2023年6月1日
0079
模型纠偏之保序回归

模型纠偏背景广告系统和推荐系统有个显著的不同，广告模型要求预估值绝对的准确，而推荐模型大部分只要求序一致就行，主要是因为广告的模型设计到计费逻辑，所以需要保证预估绝对值的准确性，…

人工智能 2023年6月17日
0074
ITK07 掩膜处理

掩膜处理获取目标图像尺寸利用尺寸创建新图像两个图像原点、间距等指标保持一致对新图像赋值（保留区域赋1，遮掩区域赋0）两个图像做乘法，提取感兴趣区域 ITK 中关于图像的一…

人工智能 2023年6月22日
0074
【part1】Tensorflow Object detection API Win10使用教程(Anaconda、tensorflow object detection API安装)

本教程分为3 Part Part1：Anaconda&Tensorflow安装Part2：tensorflow数据集生成Part3：换一个模型训练 Part1分为3大块 A…

人工智能 2023年7月12日
0064
Java 日历的小程序

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月27日
0083

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31