基于CNN（LeNet）的垃圾分类（C语言实现）

2023年7月2日上午1:11 • 人工智能 • 阅读 91

基于CNN（LeNet）的垃圾分类（C语言实现CNN算子）

一、先使用python训练模型
二、提取参数
*
提取模型参数
提取图片
三、编写CNN算子
*
在windows中实现
在FPGA中实现，使用avalon接口

一、先使用python训练模型

具体步骤参考基于pytorch的MNIST数据集的四层CNN，测试准确率99.77%这篇文章，各种步骤我写的很详细，只需要将MNIST数据集换成垃圾分类的数据集，再调整一下参数就好了。

二、提取参数

提取模型参数

权重和偏置
我们需要提取每一个具有学习的参数的训练层的权重和偏置，我使用了两层卷积和两层全连接，就要提取两个卷积层的权重和偏置，两个全连接层的权重和偏置。


import torch
import numpy as np
import torch.nn as nn
import torch.nn.functional as F
import numpy as np

class CNNModel(nn.Module):
    def __init__(self):
        super(CNNModel, self).__init__()

        self.conv1 = nn.Conv2d(in_channels = 3 , out_channels = 8, kernel_size = 3, stride = 1, padding = 0 )
        self.relu1 = nn.ReLU()
        self.maxpool1 = nn.MaxPool2d(kernel_size = 2, stride = 2)

        self.conv2 = nn.Conv2d(in_channels =8 , out_channels = 16, kernel_size = 3, stride = 1, padding = 0 )
        self.relu2 = nn.ReLU()
        self.maxpool2 = nn.MaxPool2d(kernel_size = 2, stride = 2)

        self.fc1 = nn.Linear(400,40)

        self.fc2 = nn.Linear(40,4)

    def forward(self, x):

        out = self.conv1(x)

        out = self.relu1(out)
        out = self.maxpool1(out)

        out = self.conv2(out)

        out = self.relu2(out)
        out = self.maxpool2(out)

        out = out.view(out.size(0),-1)

        out = self.fc1(out)
        out = self.fc2(out)

        return F.log_softmax(out,dim = 1)

network = CNNModel()

model_path = "model1.pth"
network.load_state_dict(torch.load(model_path, map_location = torch.device('cpu')))

parm = {}
for name,parameters in network.state_dict().items():

    parm[name] = parameters.detach().numpy()
    print(name, parameters)

w1 = parm['conv1.weight']
b1 = parm['conv1.bias']
w2 = parm['conv2.weight']
b2 = parm['conv2.bias']

fc1_w = parm['fc1.weight']
fc1_b = parm['fc1.bias']
fc2_w = parm['fc2.weight']
fc2_b = parm['fc2.bias']

with open("parameters1_wb.h","a") as f:
    print(type(w1))

    new_str1 = str(w1.tolist())
    new_str2 = new_str1.replace('[','')
    new_str3 = new_str2.replace(']','')
    f.write("float conv1_weight[8][3][9] = {" + new_str3 + "};\n\n")
    print("第一层卷积的权重保存成功")
    f.close()

with open("parameters1_wb.h","a") as f:
    print(type(b1))

    new_str1 = str(b1.tolist())
    new_str2 = new_str1.replace('[','')
    new_str3 = new_str2.replace(']','')
    f.write("float conv1_bias[8] = {" + new_str3 + "};\n\n")
    print("第一层卷积的偏置保存成功")
    f.close()

with open("parameters1_wb.h","a") as f:
    print(type(w2))

    new_str1 = str(w2.tolist())
    new_str2 = new_str1.replace('[','')
    new_str3 = new_str2.replace(']','')
    f.write("float conv2_weight[16][8][9] = {" + new_str3 + "};\n\n")
    print("第二层卷积的权重保存成功")
    f.close()

with open("parameters1_wb.h","a") as f:
    print(type(b2))

    new_str1 = str(b2.tolist())
    new_str2 = new_str1.replace('[','')
    new_str3 = new_str2.replace(']','')
    f.write("float conv2_bias[16] = {" + new_str3 + "};\n\n")
    print("第二层卷积的偏置保存成功")
    f.close()

with open("parameters1_wb.h","a") as f:
    print(type(fc1_w))
    new_str1 = str(np.transpose(fc1_w).tolist())

    new_str2 = new_str1.replace('[','')
    new_str3 = new_str2.replace(']','')
    f.write("float fc1_weight[" + str(400*40) + "] = {" + new_str3 + "};\n\n")
    print("第一层全连接的权重保存成功")
    f.close()

with open("parameters1_wb.h","a") as f:
    print(type(fc1_b))

    new_str1 = str(fc1_b.tolist())
    new_str2 = new_str1.replace('[','')
    new_str3 = new_str2.replace(']','')
    f.write("float fc1_bias[40] = {" + new_str3 + "};\n\n")
    print("第一层全连接的偏置保存成功")
    f.close()

with open("parameters1_wb.h","a") as f:
    print(type(fc2_w))
    new_str1 = str(np.transpose(fc2_w).tolist())

    new_str2 = new_str1.replace('[','')
    new_str3 = new_str2.replace(']','')
    f.write("float fc2_weight[" + str(40*4) + "] = {" + new_str3 + "};\n\n")
    print("第二层全连接的权重保存成功")
    f.close()

with open("parameters1_wb.h","a") as f:
    print(type(fc2_b))

    new_str1 = str(fc2_b.tolist())
    new_str2 = new_str1.replace('[','')
    new_str3 = new_str2.replace(']','')
    f.write("float fc2_bias[4] = {" + new_str3 + "};\n\n")
    print("第二层全连接的偏置保存成功")
    f.close()

提取成功后会得到一个parameters1_wb.h文件，如图所示

提取图片

将测试的图片同样提取为.h文件


from torchvision import transforms
import torch
import numpy as np
from PIL import Image
from itertools import chain

data_transform = transforms.Compose(
    [transforms.ToTensor()

     ])

img = Image.open("./test/Others1.jpg")
img = data_transform(img)
img = torch.unsqueeze(img, dim=0)
img = img.numpy()

print(img)

with open("pic1.h","a") as f:

    new_str1 = str(img.tolist())
    new_str2 = new_str1.replace('[','')
    new_str3 = new_str2.replace(']','')
    f.write("float Others2" + "[3][28][28] = {" + new_str3 + "};\n\n")
    print("图片Others1参数读取完成")
    f.close()

三、编写CNN算子

在windows中实现

#include
#include "parameters1_wb.h"
#include "pic1.h"

#define CONV_KERNEL_SIZE 3
#define POLL_KERNEL_SIZE 2
#define POLL_STRIDE 2

#define IMG_SIZE 28
#define CONV1_IN_KERNEL 3
#define CONV1_OUT_SIZZE 26
#define CONV1_OUT_KERNEL 8
#define POLL1_OUT_SIZE 13

#define CONV2_OUT_KERNEL 16
#define CONV2_OUT_SIZE 11
#define POLL2_OUT_SIZE 5

#define FC_X 400
#define FC1_OUT 40
#define FC1_B 40

#define FC2_OUT 4
#define FC2_B 4

int cnn_predict(float img[CONV1_IN_KERNEL][IMG_SIZE][IMG_SIZE],
                float conv1_w[CONV1_OUT_KERNEL][CONV1_IN_KERNEL][CONV_KERNEL_SIZE * CONV_KERNEL_SIZE],
                float conv1_b[CONV1_OUT_KERNEL],
                float conv2_w[CONV2_OUT_KERNEL][CONV1_OUT_KERNEL][CONV_KERNEL_SIZE * CONV_KERNEL_SIZE],
                float conv2_b[CONV2_OUT_KERNEL],
                float fc1_w[FC_X * FC1_OUT],
                float fc1_b[FC1_B],
                float fc2_w[FC1_OUT * FC2_OUT],
                float fc2_b[FC2_B])
{

    printf("\n------------------------------------Conv1_out------------------------------------\n");
    int conv1_row, conv1_col, conv1_out_kernel, conv1_in_kernel, conv1_i, conv1_j;
    float temp;
    float conv1_out[CONV1_OUT_KERNEL][CONV1_OUT_SIZZE][CONV1_OUT_SIZZE] = {0.0};
    for(conv1_out_kernel = 0; conv1_out_kernel < CONV1_OUT_KERNEL; conv1_out_kernel++)
    {

        for(conv1_row = 0; conv1_row < IMG_SIZE - CONV_KERNEL_SIZE + 1; conv1_row++)
        {

            for(conv1_col = 0; conv1_col < IMG_SIZE - CONV_KERNEL_SIZE + 1; conv1_col++)
            {
                temp = 0.0;

                for(conv1_in_kernel = 0; conv1_in_kernel < CONV1_IN_KERNEL; conv1_in_kernel++)
                {

                    for(conv1_i = 0; conv1_i < CONV_KERNEL_SIZE; conv1_i++)
                    {
                        for(conv1_j = 0; conv1_j < CONV_KERNEL_SIZE; conv1_j++)
                        {
                            float a = img[conv1_in_kernel][conv1_i + conv1_row][conv1_j + conv1_col];
                            float b = conv1_w[conv1_out_kernel][conv1_in_kernel][conv1_i * CONV_KERNEL_SIZE + conv1_j];
                            temp +=  a * b;
                        }
                    }
                }
                temp += conv1_b[conv1_out_kernel];
                conv1_out[conv1_out_kernel][conv1_row][conv1_col] = temp > 0 ? temp : 0;
                printf("%f ",conv1_out[conv1_out_kernel][conv1_row][conv1_col]);
                if(conv1_col % 6 == 0)
                {
                    printf("\n");
                }
            }
        }
    }

    printf("\n------------------------------------Poll1_out------------------------------------\n");
    int poll1_kernel, poll1_row, poll1_col, poll1_i, poll1_j;
    float poll1_out[CONV1_OUT_KERNEL][POLL1_OUT_SIZE][POLL1_OUT_SIZE] = {0};
    for(poll1_kernel = 0; poll1_kernel < CONV1_OUT_KERNEL; poll1_kernel++)
    {

        for(poll1_row = 0; poll1_row < (CONV1_OUT_SIZZE - POLL_KERNEL_SIZE)/POLL_STRIDE + 1; poll1_row++)
        {

            for(poll1_col = 0; poll1_col < (CONV1_OUT_SIZZE - POLL_KERNEL_SIZE)/POLL_STRIDE + 1; poll1_col++)
            {
                temp = 0.0;

                for(poll1_i = 0; poll1_i < POLL_KERNEL_SIZE; poll1_i++)
                {
                    for(poll1_j = 0; poll1_j < POLL_KERNEL_SIZE; poll1_j++)
                    {
                        temp = (conv1_out[poll1_kernel][poll1_i + poll1_row * POLL_STRIDE][poll1_j + poll1_col * POLL_STRIDE] > temp) ?
                        conv1_out[poll1_kernel][poll1_i + poll1_row * POLL_STRIDE][poll1_j + poll1_col * POLL_STRIDE] : temp;
                    }
                }
                poll1_out[poll1_kernel][poll1_row][poll1_col] = temp;
                printf("%f ",poll1_out[poll1_kernel][poll1_row][poll1_col]);
                if(poll1_col % 6 == 0)
                {
                    printf("\n");
                }
            }
        }
    }

    printf("\n------------------------------------Conv2_out------------------------------------\n");
    int conv2_row, conv2_col, conv2_out_kernel, conv2_in_kernel, conv2_i, conv2_j;
    float conv2_out[CONV2_OUT_KERNEL][CONV2_OUT_SIZE][CONV2_OUT_SIZE] = {0.0};
    for(conv2_out_kernel = 0; conv2_out_kernel < CONV2_OUT_KERNEL; conv2_out_kernel++)
    {

        for(conv2_row = 0; conv2_row < POLL1_OUT_SIZE - CONV_KERNEL_SIZE + 1; conv2_row++)
        {

            for(conv2_col = 0; conv2_col < POLL1_OUT_SIZE - CONV_KERNEL_SIZE + 1; conv2_col++)
            {
                temp = 0.0;

                for(conv2_in_kernel = 0; conv2_in_kernel < CONV1_OUT_KERNEL; conv2_in_kernel++)
                {

                    for(conv2_i = 0; conv2_i < CONV_KERNEL_SIZE; conv2_i++)
                    {
                        for(conv2_j = 0; conv2_j < CONV_KERNEL_SIZE; conv2_j++)
                        {
                            float a = poll1_out[conv2_in_kernel][conv2_i + conv2_row][conv2_j + conv2_col];
                            float b = conv2_w[conv2_out_kernel][conv2_in_kernel][conv2_i * CONV_KERNEL_SIZE + conv2_j];
                            temp +=  a * b;
                        }
                    }
                }
                temp += conv2_b[conv2_out_kernel];
                conv2_out[conv2_out_kernel][conv2_row][conv2_col] = temp > 0 ? temp : 0;
                printf("%f ",conv2_out[conv2_out_kernel][conv2_row][conv2_col]);
                if(conv2_col % 6 == 0)
                {
                    printf("\n");
                }
            }
        }
    }

    printf("\n------------------------------------Poll2_out------------------------------------\n");
    int poll2_kernel, poll2_row, poll2_col, poll2_i, poll2_j;
    float poll2_out[CONV2_OUT_KERNEL][POLL2_OUT_SIZE][POLL2_OUT_SIZE] = {0};
    for(poll2_kernel = 0; poll2_kernel < CONV2_OUT_KERNEL; poll2_kernel++)
    {

        for(poll2_row = 0; poll2_row < (CONV2_OUT_SIZE - POLL_KERNEL_SIZE)/POLL_STRIDE + 1; poll2_row++)
        {

            for(poll2_col = 0; poll2_col < (CONV2_OUT_SIZE - POLL_KERNEL_SIZE)/POLL_STRIDE + 1; poll2_col++)
            {
                temp = 0.0;

                for(poll2_i = 0; poll2_i < POLL_KERNEL_SIZE; poll2_i++)
                {
                    for(poll2_j = 0; poll2_j < POLL_KERNEL_SIZE; poll2_j++)
                    {
                        temp = (conv2_out[poll2_kernel][poll2_i + poll2_row * POLL_STRIDE][poll2_j + poll2_col * POLL_STRIDE] > temp) ?
                        conv2_out[poll2_kernel][poll2_i + poll2_row * POLL_STRIDE][poll2_j + poll2_col * POLL_STRIDE] : temp;
                    }
                }
                poll2_out[poll2_kernel][poll2_row][poll2_col] = temp;
                printf("%f ",poll2_out[poll2_kernel][poll2_row][poll2_col]);
                if(poll2_col % 6 == 0)
                {
                    printf("\n");
                }
            }
        }
    }

    printf("\n------------------------------------N to one------------------------------------\n");
    float out[FC_X] = {0.0};
    int i, j, k;
    for(k = 0; k < CONV2_OUT_KERNEL; k++)
    {
        for(i = 0; i < POLL2_OUT_SIZE; i++)
        {
            for(j = 0; j < POLL2_OUT_SIZE; j++)
            {

                out[k * POLL2_OUT_SIZE * POLL2_OUT_SIZE + i * POLL2_OUT_SIZE + j] = poll2_out[k][i][j];
                printf("%f ",out[k * POLL2_OUT_SIZE * POLL2_OUT_SIZE + i * POLL2_OUT_SIZE + j]);
            }
        }
    }

    printf("\n------------------------------------ FC1_OUT ------------------------------------\n");
    int fc1_i, fc1_j;
    float fc1_out[FC1_OUT] = {0.0};
    for(fc1_i = 0; fc1_i < FC1_OUT; fc1_i++)
    {
        temp = 0.0;
        for(fc1_j = 0; fc1_j < FC_X; fc1_j++)
        {
            temp += fc1_w[fc1_j * FC1_OUT + fc1_i] * out[fc1_j];
        }

        temp +=  fc1_b[fc1_i];
        fc1_out[fc1_i] = temp;
        printf("  %f  ",fc1_out[fc1_i]);
        if(fc1_i % 8 == 0)
        {
            printf("\n");
        }
    }

    printf("\n------------------------------------ FC2_OUT ------------------------------------\n");
    int fc2_i, fc2_j;
    float fc2_out[FC2_OUT] = {0.0};
    for(fc2_i = 0; fc2_i < FC2_OUT; fc2_i++)
    {
        temp = 0.0;
        for(fc2_j = 0; fc2_j < FC1_OUT; fc2_j++)
        {
            temp += fc2_w[fc2_j * FC2_OUT + fc2_i] * fc1_out[fc2_j];
        }

        temp +=  fc2_b[fc2_i];
        fc2_out[fc2_i] = temp;
        printf("  %f  ",fc2_out[fc2_i]);
        if(fc2_i % 8 == 0)
        {
            printf("\n");
        }
    }

    temp = 0.0;
    int ret;
    for(i = 0; i < FC2_OUT; i++ )
    {
        if(fc2_out[i] > temp)
        {
            temp = fc2_out[i];
            ret = i;
        }
    }

    return ret;
}

int cnn_test()
{
    int ret= 0;
    ret = cnn_predict(Others1,conv1_weight,conv1_bias,conv2_weight,conv2_bias,
                     fc1_weight,fc1_bias,fc2_weight,fc2_bias);

    char class[][10] = {"Hazardous","Kitchen","Others","Recycled"};
    printf("\n input Others predict is: %s\n",class[ret]);
    return 0;
}

int main()
{
    cnn_test();
    return 0;
}

在FPGA中实现，使用avalon接口

由于FPGA内存限制，全部使用一维数据进行运算。

#include "HLS/hls.h"
#include "HLS/stdio.h"
#include "parameters_wb.h"
#include "pic.h"

#define CONV_KERNEL_SIZE 3
#define POLL_KERNEL_SIZE 2
#define POLL_STRIDE 2

#define IMG_SIZE 28
#define CONV1_IN_KERNEL 3
#define CONV1_OUT_SIZE 26
#define CONV1_OUT_KERNEL 8
#define POLL1_OUT_SIZE 13

#define CONV2_OUT_KERNEL 16
#define CONV2_OUT_SIZE 11
#define POLL2_OUT_SIZE 5

#define FC_X 400
#define FC1_OUT 40
#define FC1_B 40

#define FC2_OUT 4
#define FC2_B 4

hls_avalon_slave_component
component int one_dim_rubbish(
    hls_avalon_slave_memory_argument(3*28*28*sizeof(float)) float *in_img,
    hls_avalon_slave_memory_argument(8*3*3*3*sizeof(float)) float *conv1_w,
    hls_avalon_slave_memory_argument(8*sizeof(float)) float *conv1_b,
    hls_avalon_slave_memory_argument(16*8*3*3*sizeof(float)) float *conv2_w,
    hls_avalon_slave_memory_argument(16*sizeof(float)) float *conv2_b,
    hls_avalon_slave_memory_argument(16*5*5*40*sizeof(float)) float *fc1_w,
    hls_avalon_slave_memory_argument(40*sizeof(float)) float *fc1_b,
    hls_avalon_slave_memory_argument(40*4*sizeof(float)) float *fc2_w,
    hls_avalon_slave_memory_argument(4*sizeof(float)) float *fc2_b
)
{
    float out1[CONV1_IN_KERNEL * IMG_SIZE * IMG_SIZE];
    float out2[CONV1_OUT_KERNEL * CONV1_OUT_SIZE * CONV1_OUT_SIZE];

    int conv1_row, conv1_col, conv1_out_kernel, conv1_in_kernel, conv1_i, conv1_j;
    float temp;
    for(conv1_out_kernel = 0; conv1_out_kernel < CONV1_OUT_KERNEL; conv1_out_kernel++)
    {

        for(conv1_row = 0; conv1_row < IMG_SIZE - CONV_KERNEL_SIZE + 1; conv1_row++)
        {

            for(conv1_col = 0; conv1_col < IMG_SIZE - CONV_KERNEL_SIZE + 1; conv1_col++)
            {
                temp = 0.0;

                for(conv1_in_kernel = 0; conv1_in_kernel < CONV1_IN_KERNEL; conv1_in_kernel++)
                {

                    for(conv1_i = 0; conv1_i < CONV_KERNEL_SIZE; conv1_i++)
                    {
                        for(conv1_j = 0; conv1_j < CONV_KERNEL_SIZE; conv1_j++)
                        {

                            float a = in_img[conv1_in_kernel * IMG_SIZE * IMG_SIZE +
                                             (conv1_i + conv1_row) * IMG_SIZE +
                                             conv1_j + conv1_col];
                            float b = conv1_w[conv1_out_kernel * CONV1_IN_KERNEL * CONV_KERNEL_SIZE * CONV_KERNEL_SIZE +
                                              conv1_in_kernel * CONV_KERNEL_SIZE * CONV_KERNEL_SIZE +
                                              conv1_i * CONV_KERNEL_SIZE +
                                              conv1_j];
                            temp +=  a * b;
                        }
                    }
                }
                temp += conv1_b[conv1_out_kernel];
                out2[conv1_out_kernel * CONV1_OUT_SIZE * CONV1_OUT_SIZE +
                     conv1_row * CONV1_OUT_SIZE +
                     conv1_col] = temp > 0 ? temp : 0;
            }
        }
    }

    int poll1_kernel, poll1_row, poll1_col, poll1_i, poll1_j;
    for(poll1_kernel = 0; poll1_kernel < CONV1_OUT_KERNEL; poll1_kernel++)
    {

        for(poll1_row = 0; poll1_row < (CONV1_OUT_SIZE - POLL_KERNEL_SIZE)/POLL_STRIDE + 1; poll1_row++)
        {

            for(poll1_col = 0; poll1_col < (CONV1_OUT_SIZE - POLL_KERNEL_SIZE)/POLL_STRIDE + 1; poll1_col++)
            {
                temp = 0.0;

                for(poll1_i = 0; poll1_i < POLL_KERNEL_SIZE; poll1_i++)
                {
                    for(poll1_j = 0; poll1_j < POLL_KERNEL_SIZE; poll1_j++)
                    {
                        temp = (out2[poll1_kernel * CONV1_OUT_SIZE * CONV1_OUT_SIZE +
                                     (poll1_i + poll1_row * POLL_STRIDE) * CONV1_OUT_SIZE +
                                     poll1_j + poll1_col * POLL_STRIDE] > temp) ?
                                out2[poll1_kernel * CONV1_OUT_SIZE * CONV1_OUT_SIZE +
                                     (poll1_i + poll1_row * POLL_STRIDE) * CONV1_OUT_SIZE +
                                     poll1_j + poll1_col * POLL_STRIDE] : temp;
                    }
                }
                out1[poll1_kernel * POLL1_OUT_SIZE * POLL1_OUT_SIZE +
                     poll1_row * POLL1_OUT_SIZE +
                     poll1_col] = temp;
            }
        }
    }

    int i;
    for(i = 0; i < CONV1_OUT_KERNEL * CONV1_OUT_SIZE * CONV1_OUT_SIZE; i++)
    {
        out2[i] = 0;
    }

    int conv2_row, conv2_col, conv2_out_kernel, conv2_in_kernel, conv2_i, conv2_j;
    for(conv2_out_kernel = 0; conv2_out_kernel < CONV2_OUT_KERNEL; conv2_out_kernel++)
    {

        for(conv2_row = 0; conv2_row < POLL1_OUT_SIZE - CONV_KERNEL_SIZE + 1; conv2_row++)
        {

            for(conv2_col = 0; conv2_col < POLL1_OUT_SIZE - CONV_KERNEL_SIZE + 1; conv2_col++)
            {
                temp = 0.0;

                for(conv2_in_kernel = 0; conv2_in_kernel < CONV1_OUT_KERNEL; conv2_in_kernel++)
                {

                    for(conv2_i = 0; conv2_i < CONV_KERNEL_SIZE; conv2_i++)
                    {
                        for(conv2_j = 0; conv2_j < CONV_KERNEL_SIZE; conv2_j++)
                        {
                            float a = out1[conv2_in_kernel * POLL1_OUT_SIZE * POLL1_OUT_SIZE +
                                           (conv2_i + conv2_row) * POLL1_OUT_SIZE +
                                           conv2_j + conv2_col];
                            float b = conv2_w[conv2_out_kernel * CONV1_OUT_KERNEL * CONV_KERNEL_SIZE * CONV_KERNEL_SIZE +
                                              conv2_in_kernel * CONV_KERNEL_SIZE * CONV_KERNEL_SIZE +
                                              conv2_i * CONV_KERNEL_SIZE +
                                              conv2_j];
                            temp += a * b;
                        }
                    }
                }
                temp += conv2_b[conv2_out_kernel];
                out2[conv2_out_kernel * CONV2_OUT_SIZE * CONV2_OUT_SIZE +
                     conv2_row * CONV2_OUT_SIZE +
                     conv2_col] = temp > 0 ? temp : 0;
            }
        }
    }

    for(i = 0; i < CONV1_IN_KERNEL * IMG_SIZE * IMG_SIZE; i++)
    {
        out1[i] = 0;
    }

    int poll2_kernel, poll2_row, poll2_col, poll2_i, poll2_j;
    for(poll2_kernel = 0; poll2_kernel < CONV2_OUT_KERNEL; poll2_kernel++)
    {

        for(poll2_row = 0; poll2_row < (CONV2_OUT_SIZE - POLL_KERNEL_SIZE)/POLL_STRIDE + 1; poll2_row++)
        {

            for(poll2_col = 0; poll2_col < (CONV2_OUT_SIZE - POLL_KERNEL_SIZE)/POLL_STRIDE + 1; poll2_col++)
            {
                temp = 0.0;

                for(poll2_i = 0; poll2_i < POLL_KERNEL_SIZE; poll2_i++)
                {
                    for(poll2_j = 0; poll2_j < POLL_KERNEL_SIZE; poll2_j++)
                    {
                        temp = (out2[poll2_kernel * CONV2_OUT_SIZE * CONV2_OUT_SIZE +
                                     (poll2_i + poll2_row * POLL_STRIDE) * CONV2_OUT_SIZE +
                                     poll2_j + poll2_col * POLL_STRIDE] > temp) ?
                                out2[poll2_kernel * CONV2_OUT_SIZE * CONV2_OUT_SIZE +
                                     (poll2_i + poll2_row * POLL_STRIDE) * CONV2_OUT_SIZE +
                                     poll2_j + poll2_col * POLL_STRIDE] : temp;
                    }
                }
                out1[poll2_kernel * POLL2_OUT_SIZE * POLL2_OUT_SIZE +
                     poll2_row * POLL2_OUT_SIZE +
                     poll2_col] = temp;
            }
        }
    }

    for(i = 0; i < CONV1_OUT_KERNEL * CONV1_OUT_SIZE * CONV1_OUT_SIZE; i++)
    {
        out2[i] = 0;
    }

    int fc1_i, fc1_j;
    for(fc1_i = 0; fc1_i < FC1_OUT; fc1_i++)
    {
        temp = 0.0;
        for(fc1_j = 0; fc1_j < FC_X; fc1_j++)
        {
            temp += fc1_w[fc1_j * FC1_OUT + fc1_i] * out1[fc1_j];
        }

        temp +=  fc1_b[fc1_i];
        out2[fc1_i] = temp;
    }

    for(i = 0; i < CONV1_IN_KERNEL * IMG_SIZE * IMG_SIZE; i++)
    {
        out1[i] = 0;
    }

    int fc2_i, fc2_j;
    for(fc2_i = 0; fc2_i < FC2_OUT; fc2_i++)
    {
        temp = 0.0;
        for(fc2_j = 0; fc2_j < FC1_OUT; fc2_j++)
        {
            temp += fc2_w[fc2_j * FC2_OUT + fc2_i] * out2[fc2_j];
        }

        temp +=  fc2_b[fc2_i];
        out1[fc2_i] = temp;
    }

    temp = 0.0;
    int ret;
    for(i = 0; i < FC2_OUT; i++ )
    {
        if(out1[i] > temp)
        {
            temp = out1[i];
            ret = i;
        }
    }

    return ret;
}

int main()
{
    int ret;
    #if 1
    ret = one_dim_rubbish(Others1,conv1_weight,conv1_bias,conv2_weight,conv2_bias,fc1_weight,fc1_bias,fc2_weight,fc2_bias);
    char const *input_img[] = {"Hazardous1","Hazardous2","Kitchen1","Kitchen2","Others1","Others2","Recycled1","Recycled2"};
    char const *classes[] = {"Hazardous","Kitchen","Others","Recycled"};
    printf("\n input %s \t predict is: %s\n",input_img[4],classes[ret]);
    #else
    float *imgx[] = {Hazardous1, Hazardous2, Kitchen1, Kitchen2,
                      Others1, Others2, Recycled1, Recycled2};
    char const *input_img[] = {"Hazardous1","Hazardous2","Kitchen1","Kitchen2","Others1","Others2","Recycled1","Recycled2"};
    for(int i = 0; i < 8; i++)
    {
        ret = conv_connect(imgx[i],conv1_weight,conv1_bias,conv2_weight,conv2_bias,fc1_weight,fc1_bias,fc2_weight,fc2_bias);
        char const *classes[] = {"Hazardous","Kitchen","Others","Recycled"};
        printf("\n input %s \t predict is: %s\n",input_img[i],classes[ret]);
    }
    #endif
    return 0;
}

FPGA编译代码main.c


#include
#include
#include
#include
#include
#include
#include

#define soc_cv_av

#include "hwlib.h"
#include "socal/socal.h"
#include "socal/hps.h"

#include "hps_0.h"
#include "conv.h"

#define HW_REGS_BASE (ALT_STM_OFST)
#define HW_REGS_SPAN (0x04000000)
#define HW_REGS_MASK (HW_REGS_SPAN - 1)

typedef struct{
    volatile float *img;
    volatile float *c1_w;
    volatile float *c1_b;
    volatile float *c2_w;
    volatile float *c2_b;
    volatile float *f1_w;
    volatile float *f1_b;
    volatile float *f2_w;
    volatile float *f2_b;
}fc_port_def;

fc_port_def my_fc_port;

typedef struct{
    volatile long long busy;
    volatile long long start;
    volatile long long irq_en;
    volatile long long done;
    volatile long long result;
}fc_ctrl_def;

fc_ctrl_def *my_fc_ctrl;

const float *imgx[8] = {Hazardous1, Hazardous2, Kitchen1, Kitchen2,
                        Others1, Others2, Recycled1, Recycled2};
const char *input_img[] = {"Hazardous1","Hazardous2","Kitchen1","Kitchen2","Others1","Others2","Recycled1","Recycled2"};
const char *classes[] = {"Hazardous","Kitchen","Others","Recycled"};

int fc_init(void *virtual_base)
{
    void *fc_ctrl_addr;
    fc_ctrl_addr = virtual_base + ((unsigned long)(ALT_LWFPGASLVS_OFST + RUBBISH_0_ONE_DIM_RUBBISH_INTERNAL_INST_AVS_CRA_BASE) & (unsigned long)(HW_REGS_MASK));

    my_fc_ctrl = (fc_port_def *)fc_ctrl_addr;
    my_fc_ctrl->start = 0x0;

    my_fc_port.img = virtual_base + ((unsigned long)(ALT_LWFPGASLVS_OFST + RUBBISH_0_ONE_DIM_RUBBISH_INTERNAL_INST_AVS_IN_IMG_BASE) & (unsigned long)(HW_REGS_MASK));
    my_fc_port.c1_w = virtual_base + ((unsigned long)(ALT_LWFPGASLVS_OFST + RUBBISH_0_ONE_DIM_RUBBISH_INTERNAL_INST_AVS_CONV1_W_BASE) & (unsigned long)(HW_REGS_MASK));
    my_fc_port.c1_b = virtual_base + ((unsigned long)(ALT_LWFPGASLVS_OFST + RUBBISH_0_ONE_DIM_RUBBISH_INTERNAL_INST_AVS_CONV1_B_BASE) & (unsigned long)(HW_REGS_MASK));
    my_fc_port.c2_w = virtual_base + ((unsigned long)(ALT_LWFPGASLVS_OFST + RUBBISH_0_ONE_DIM_RUBBISH_INTERNAL_INST_AVS_CONV2_W_BASE) & (unsigned long)(HW_REGS_MASK));
    my_fc_port.c2_b = virtual_base + ((unsigned long)(ALT_LWFPGASLVS_OFST + RUBBISH_0_ONE_DIM_RUBBISH_INTERNAL_INST_AVS_CONV2_B_BASE) & (unsigned long)(HW_REGS_MASK));
    my_fc_port.f1_w = virtual_base + ((unsigned long)(ALT_LWFPGASLVS_OFST + RUBBISH_0_ONE_DIM_RUBBISH_INTERNAL_INST_AVS_FC1_W_BASE) & (unsigned long)(HW_REGS_MASK));
    my_fc_port.f1_b = virtual_base + ((unsigned long)(ALT_LWFPGASLVS_OFST + RUBBISH_0_ONE_DIM_RUBBISH_INTERNAL_INST_AVS_FC1_B_BASE) & (unsigned long)(HW_REGS_MASK));
    my_fc_port.f2_w = virtual_base + ((unsigned long)(ALT_LWFPGASLVS_OFST + RUBBISH_0_ONE_DIM_RUBBISH_INTERNAL_INST_AVS_FC2_W_BASE) & (unsigned long)(HW_REGS_MASK));
    my_fc_port.f2_b = virtual_base + ((unsigned long)(ALT_LWFPGASLVS_OFST + RUBBISH_0_ONE_DIM_RUBBISH_INTERNAL_INST_AVS_FC2_B_BASE) & (unsigned long)(HW_REGS_MASK));

    memcpy(my_fc_port.c1_w,conv1_weight,8*3*3*3*sizeof(float));
    memcpy(my_fc_port.c1_b,conv1_bias,8*sizeof(float));
    memcpy(my_fc_port.c2_w,conv2_weight,16*8*3*3*sizeof(float));
    memcpy(my_fc_port.c2_b,conv2_bias,16*sizeof(float));
    memcpy(my_fc_port.f1_w,fc1_weight,400*40*sizeof(float));
    memcpy(my_fc_port.f1_b,fc1_bias,40*sizeof(float));
    memcpy(my_fc_port.f2_w,fc2_weight,40*4*sizeof(float));
    memcpy(my_fc_port.f2_b,fc2_bias,4*sizeof(float));

    return 0;
}

int main()
{
    int fd,ret;
    int i;
    void *virtual_base;
    float time_s,time_ns,time_ms;
    struct timespec ts1,ts2;
    clock_t start,finish;
    float win_runtime;

    fd = open("/dev/mem",(O_RDWR | O_SYNC));
    if(fd == (-1))
    {
        printf("Error:could not open\"/dev/mem\"...\n");
        return 1;
    }

    virtual_base = mmap(NULL,HW_REGS_SPAN,(PROT_READ | PROT_WRITE),MAP_SHARED,fd,HW_REGS_BASE);

    fc_init(virtual_base);

    while(1)
    {
        for(i = 0; i < 8; i++)
        {
            start = clock();
            ret = conv(imgx[i],conv1_weight,conv1_bias,conv2_weight,conv2_bias,fc1_weight,fc1_bias,fc2_weight,fc2_bias);
            finish = clock();

            win_runtime = (float)(finish - start)*1000/CLOCKS_PER_SEC;

            memcpy(my_fc_port.img,imgx[i],3*28*28*sizeof(float));
            clock_gettime(CLOCK_MONOTONIC,&ts1);
            my_fc_ctrl->start = 0x01;

            while((my_fc_ctrl->done & 0x02) == 0 );
            my_fc_ctrl->start = 0x0;

            clock_gettime(CLOCK_MONOTONIC,&ts2);
            time_ns = ts2.tv_nsec - ts1.tv_nsec;
            time_s = ts2.tv_sec - ts1.tv_sec;
            time_ms = time_ns / 1000000 + time_s*1000;

            printf("\n windows: running time:%.6f \t FPGA: running time:%.6f \n ",win_runtime, time_ms);
            printf("\n input is: %s \n",input_img[i]);
            printf("\n Windows predict is: %s \t FPGA predict is: %s \n\n",classes[ret], classes[my_fc_ctrl->result]);
        }
        break;
    }

    if(munmap(virtual_base, HW_REGS_SPAN) != 0)
    {
        printf("Error:munmap is failed...\n");
        close(fd);
        return 1;
    }

    close(fd);
    return 0;
}

Original: https://blog.csdn.net/eye_s1/article/details/122343038
Author: eye_s1
Title: 基于CNN（LeNet）的垃圾分类（C语言实现）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/664421/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习高斯混合模型

高斯混合模型前言高斯混合模型 * 高斯分布混合模型高斯模型 – 单高斯模型高斯混合模型高斯混合模型训练 + EM算法应用 * 图像背景的高斯混合模型智能…

人工智能 2023年5月31日
0075
lightGBM中的lightgbm.train

文章目录 1. lightgbm.train 2.返回 lightgbm.Booster * methods 代码 lightgbm.train lightgbm.train(pa…

人工智能 2023年6月16日
0077
深度学习——VGG16模型详解

1、网络结构 VGG16模型很好的适用于分类和定位任务，其名称来自牛津大学几何组（Visual Geometry Group）的缩写。根据卷积核的大小核卷积层数，VGG共有6种配…

人工智能 2023年6月26日
0085
协同过滤算法如何权衡个性化和广泛性的需求

问题背景协同过滤算法是一种常用的推荐系统算法，它通过分析用户历史行为以及用户之间的相似性，来预测用户可能感兴趣的物品。然而，在实际应用中，我们往往需要权衡个性化和广泛性需求之间的…

人工智能 2024年1月2日
0030
图像处理（十一）：轮廓检测

1 图像的轮廓轮廓可以简单认为成将连续的点（连着边界）连在一起的曲线，具有相同的颜色或者灰度。轮廓是图像目标的外部特征，这种特征对于我们进行图像分析，目标识别和理解等更深层次的处…

人工智能 2023年6月18日
0094
第05章 Pandas 入门

序言 1. 内容介绍本章详细介绍了Pandas 安装及基本数据结构、Pandas 文件读写、Pandas 数据处理与可视化操作等内容。 2. 理论目标了解Pandas 安装及基…

人工智能 2023年7月8日
0076
pytorch的安装（非常详细）

文章目录 1.pytorch的安装 * 1.1环境配置 1.2创建pytorch文件夹（环境） 1.3查看pytorch历史版本 1.4接下来有一个小技巧 – 1.4….

人工智能 2023年7月4日
0086
Bert预训练相关参数梳理

Bert预训练相关参数梳理作者：白鹿第一阶段：CreatePretrainData阶段参数名称参数说明do_lower_case是否忽略大小写max_seq_length每条训…

人工智能 2023年5月28日
0056
机器学习_深度学习毕设题目汇总——目标检测B

下面是该类的一些题目：题目典型恶劣天气条件下高铁周界入侵目标检测图模型融合时空特征的视觉显著性目标检测算法研究基于SAR图像的舰船目标检测方法研究基于三维点云分析的智能汽车目标检…

人工智能 2023年7月9日
0074
动手学深度学习–多层感知机篇（MLP）

多层感知机前言：本章分为8小章 1.多层感知机 *线性模型的缺陷：具有单调性：即 W增大 output增大， W减小 output减小，而现实中存在许多违反单调性的例子： ①体…

人工智能 2023年7月21日
0050
Python数据分析与可视化案例解析

题目需求描述已知两个Excel表格：学生基本信息表、期末考试成绩表分别用于存放学生的基本信息（包括姓名、性别、班级）和学生的期末成绩（包括姓名、语文、数学、英语…

人工智能 2023年6月11日
00134
Comparison of Graph Database: Neo4j, JanusGrraph and HugeGraph

Main Features Neo4j JanusGraph HugeGraphOpen Source EcologyThe community version is open s…

人工智能 2023年6月1日
0069
人工智能语音实训平台实验指导书

（一）语音采集类… 21.1语音采集实验… 21.2语音波形显示实验… 71.3语音编码实验… 131.4语音采样频率转换实验&#8…

人工智能 2023年6月10日
0083
ARIMA模型的定阶原理与建模分析

ARIMA模型的定阶原理与建模分析 * – 前言 – 一：AR ( p ) (p)(p )模型的定阶原理 – 二：MA ( q ) (q)(q …

人工智能 2023年6月19日
00109
【星光01】pandas 中 merge 函数的参数 how 超详细解释

在pandas中如果我们想将两个表格按照某一主键合并，我们需要用到merge函数。 pd.merge(dataframe_1,dataframe_2,how="inner…

人工智能 2023年7月15日
0065
Pandas库read_excel()使用说明及 excel转换为tsv python实现方法一:

pandas.read_excel（io，sheet_name = 0，header = 0&#xFF0C…

人工智能 2023年7月6日
00104

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31