模式识别导论（实验三）基于感知器算法的数字识别

2023年5月31日上午10:29 • 人工智能 • 阅读 95

实验要求：

1、数据集：

a) 训练数据集：”实验图像”—”训练集”目录下，包含”0″，”1″，…, “9”共10个子目录，每一个子目录下包含对应的数字图像。对于每一个数字，有20张64×64的训练图像。

b)测试数据集：”实验图像”—”测试集”目录下，包含”0″，”1″，…, “9”共10个子目录，每一个子目录下包含对应的数字图像。对于每一个数字，有5张64×64的测试图像。

2、基本要求：两个数字（6’，’9’）的识别，即给定一幅包含单个数字（’6’或者’9’）的64×64图像，程序自动识别出其中的数字。

3、附加要求：十个数字（’0’，’1’，…, ‘9’）的识别，即给定一幅包含单个数字（’0’，’1’， …, 或者’9’）的64×64图像，程序自动识别出其中的数字。

实验分析：

对于两个数字（6’，’9’）的识别：

首先读入图片，将其01二值化，原理为，计算像素点RGB的和，如果和大于300，判定为空白区域，置为0，否则置为1。

感知器算法：

ρ自行取值，在本次实验中我取0.14效果最好。

接下来进行测试集测试，测试函数代码实现如下

在p为0.14的情况下得到的结果如下：

即对6、9二分类，在p为0.14的情况下得到的增光权向量，对测试集分类正确率为100%。在二分类实验中，因为正确率可达到100%，故没有对图片进行预处理。

附加要求：十个数字（’0’，’1’，…, ‘9’）的识别，即给定一幅包含单个数字（’0’，’1’， …, 或者’9’）的64×64图像，程序自动识别出其中的数字。

实现如下：

首先，对读入的图片进行预处理，进行图像分割。

整个过程分两部，左右分割和上下分割。基本思想是，找到四个点，即连接成四条直线，使四条直线最小包含数字。下列代码为找到最左和最右的列号，以及最上最下的列号。

由于学识浅薄，所以预处理比较粗糙。

之后利用OpenCV的resize将选出的包围的像素点，重构成32*32的图片，完成预处理。

多分类的三种方法，我采用的方法为:

原因是，该方法将M个分类仅仅分为M个分类，没有不确定区等其他情况。

训练主要代码如下，基本过程类似于二分类。：

test测试代码如下：

用每个增光权向量×测试集，找到结果最大的w的下标，判断是否分类正确。

多分类结果：

在p选择为0.01的情况下：

在手动选择的若干p值中，最优正确率即为96%。

如果不进行图片的预处理，正确率在60%左右，正确率很低，所以想到了图片分割重构。

实验代码：

二分类：


import numpy as np
from matplotlib import pyplot as plt
import cv2

def test(oumiga, list_test, w):

    fail_count = 0
    temp = w * list_test
    temp = np.sum(temp, axis=1)
    for i in range(0, len(list_test)):
        if ((oumiga[i] == 1 and temp[i] <= 0) or (oumiga[i]="=" -1 and temp[i]>= 0)):
            fail_count += 1

    print('&#x9519;&#x8BEF;&#x7684;&#x6570;&#x91CF;&#x4E3A;:' + str(fail_count) + '    &#x6B63;&#x786E;&#x7387;&#x4E3A;&#xFF1A;' + str(int((1 - (fail_count / len(list_test))) * 100)) + '%')

def train(oumiga, list_train):
    p = 0.14  #&#x635F;&#x5931;&#x4EE3;&#x4EF7;&#x6BD4;&#x4F8B;
    w = np.asarray([1] * 4097) #&#x589E;&#x5E7F;&#x6743;&#x77E2;&#x91CF;

    fail_count = 1
    while (fail_count != 0):
        fail_count = 0
        temp = w * list_train
        temp = np.sum(temp, axis=1)
        for i in range(0, 40):
            if (temp[i] <= 0 and oumiga[i]="=" 1): #如果是6并且小于0 w="w" + p * list_train[i] fail_count elif (temp[i]>= 0 and oumiga[i] == -1): #&#x5982;&#x679C;&#x662F;9&#x5E76;&#x4E14;&#x5927;&#x4E8E;0
                w = w - p * list_train[i]
                fail_count += 1
        print(fail_count)
        print('&#x589E;&#x5E7F;&#x6743;&#x77E2;&#x91CF;w&#x4E3A;&#xFF1A;')
        print(w)
    return w #&#x589E;&#x5E7F;&#x6743;&#x77E2;&#x91CF;

if __name__ == "__main__":
    PATH = 'C:/Users/lishu/Desktop/code/PatternRecognition/experience3/'

    list_img = []
    for j in [6,9]:
        for i in range(1,21):
            img = cv2.imread(PATH + 'train/' + str(j) + '/' + str(j) + '-' + str(i) + '.png')
            #&#x628A;&#x56FE;&#x7247;01&#x4E24;&#x503C;&#x5316;
            temp = np.asarray(img)
            temp = temp.reshape(-1, 3)
            temp = np.sum(temp, axis=1)
            temp = np.where(temp > 300, 0, 1) #RGB&#x548C;&#x5927;&#x4E8E;300&#xFF0C;&#x5224;&#x5B9A;&#x4E3A;&#x7A7A;&#x767D;&#x533A;&#x57DF;&#xFF0C;&#x7F6E;&#x4E3A;0&#xFF0C;&#x5426;&#x5219;&#x4E3A;1
            temp = np.append(temp,1)

            list_img.append(temp.tolist())

    #&#x7B2C;&#x4E8C;&#x7C7B;&#x4E58;-1&#x5904;&#x7406;
    # temp_list1 = [[1] * 4096] * 20
    # temp_list2 = [[-1] * 4096] * 20
    # temp_list1 = [[1]] * 20
    # temp_list2 = [[-1]] * 20
    # temp_fen = temp_list1 + temp_list2
    # temp_fen = np.asarray(temp_fen).reshape(40,-1)
    #
    #
    list_img = np.asarray(list_img)

    # temp = temp_fen * list_img

    oumiga = [1] * 20 + [-1] * 20 #&#x5B58;&#x50A8;&#x5BF9;&#x5E94;&#x8BAD;&#x7EC3;&#x96C6;&#x6240;&#x5C5E;&#x7684;&#x7C7B;

    w = train(oumiga,list_img) #&#x5F97;&#x5230;&#x589E;&#x5E7F;&#x6743;&#x77E2;&#x91CF;

    #&#x6D4B;&#x8BD5;&#x96C6;&#x6D4B;&#x8BD5;
    list_test = []
    for j in [6,9]:
        for i in range(1,6):
            img = cv2.imread(PATH + 'test/' + str(j) + '/' + str(j) + '-' + str(i) + '.png')
            temp = np.asarray(img)
            temp = temp.reshape(-1, 3)
            temp = np.sum(temp, axis=1)
            temp = np.where(temp > 300, 0, 1)
            temp = np.append(temp,1)
            list_test.append(temp.tolist())

    list_test = np.asarray(list_test)

    oumiga_test = [1]*5 + [-1]*5
    test(oumiga_test,list_test,w)
    list_img = np.asarray(list_img)</=></=>

多分类：


import numpy as np
from matplotlib import pyplot as plt
import cv2

def test(oumiga, list_test, w):
    fail_count = 0

    for i in range(0, len(list_test)):
        temp = w * list_test[i]
        temp = np.sum(temp, axis=1)
        max_index = temp.argmax()
        if max_index != oumiga[i]:
            fail_count += 1
    print('&#x9519;&#x8BEF;&#x7684;&#x6570;&#x91CF;&#x4E3A;:' + str(fail_count)  + '    &#x6B63;&#x786E;&#x7387;&#x4E3A;&#xFF1A;' +  str(int((1 - (fail_count / len(list_test))) * 100)) + '%')

def train(oumiga, list_train):

    p = 0.01 #&#x635F;&#x5931;&#x4EE3;&#x4EF7;&#x6BD4;&#x4F8B;
    w = np.asarray([[1] * 1025] * 10) #&#x589E;&#x5E7F;&#x6743;&#x77E2;&#x91CF;
    w = w.astype(float)
    fail_count = 1
    count = 0
    while (fail_count != 0):
        count += 1
        fail_count = 0
        for j in range(0,10):
            temp = w[j]* list_train
            temp = np.sum(temp, axis=1)

            for i in range(0, 20*10):
                if (oumiga[i] == j and temp[i] <= 0): #如果正确分类的结果<0 w[j]="w[j]" + p * list_train[i] fail_count elif(oumiga[i] !="j" and temp[i]>= 0): #&#x5982;&#x679C;&#x9519;&#x8BEF;&#x5206;&#x7C7B;&#x7684;&#x7ED3;&#x679C;>0
                    w[j] = w[j] - p * list_train[i]
                    fail_count += 1
        print(fail_count)
        print(w)
    print('&#x8FED;&#x4EE3;&#x7684;&#x6B21;&#x6570;&#x4E3A;&#xFF1A;' + str(count))
    return w

def preprocess(img):
    img = img.reshape(64,64)
    #&#x5206;&#x522B;&#x5B58;&#x50A8;&#x56FE;&#x7247;&#x4E0A;&#x4E0B;&#x5DE6;&#x53F3;&#x5BF9;&#x5E94;&#x7684;&#x6709;&#x53EF;&#x7528;&#x70B9;&#x7684;&#x884C;&#x548C;&#x5217;
    up = 63
    down = 0
    right = 0
    left = 63
    for i in range(64):
        for j in range(64):
            if (img[i][j] == 1):
                up = min(up, i)
                down = max(down, i)
                left = min(left, j)
                right = max(right, j)

    #&#x91CD;&#x6784;&#x9884;&#x5904;&#x7406;
    new_img = []
    for i in range(up, down+1):
        temp = []
        for j in range(left, right+1):
            if (img[i][j] == 0):
                temp.append([255,255,255])
            else:
                temp.append([0,0,0])
        new_img.append(temp)

    #&#x628A;&#x56FE;&#x7247;&#x4E24;&#x503C;&#x5316;
    new_img = np.asarray(new_img).astype("uint8")

    #&#x56FE;&#x7247;resize&#x91CD;&#x6784;
    new_img = cv2.resize(new_img, (32,32))
    new_img = new_img.reshape(-1, 3)
    new_img = np.sum(new_img, axis=1)
    new_img = np.where(new_img > 300, 0, 1)
    new_img = np.append(new_img, 1)

    return new_img
    # cv2.imwrite('C:/Users/lishu/Desktop/code/PatternRecognition/experience3/img.png', new_img, [int(cv2.IMWRITE_JPEG_QUALITY), 100])

if __name__ == "__main__":
    PATH = 'C:/Users/lishu/Desktop/code/PatternRecognition/experience3/'

    list_img = []
    for j in [x for x in range(0,10)]:
        for i in range(1,21):
            img = cv2.imread(PATH + 'train/' + str(j) + '/' + str(j) + '-' + str(i) + '.png')
            # &#x628A;&#x56FE;&#x7247;01&#x4E24;&#x503C;&#x5316;
            temp = np.asarray(img)
            temp = temp.reshape(-1, 3)
            temp = np.sum(temp, axis=1)
            temp = np.where(temp > 300, 0, 1)
            # &#x9884;&#x5904;&#x7406; &#x53BB;&#x9664;&#x591A;&#x4F59;&#x7A7A;&#x767D;&#xFF0C;&#x91CD;&#x6784;&#x56FE;&#x7247;
            temp = preprocess(temp)

            list_img.append(temp.tolist())
    list_img = np.asarray(list_img)
    oumiga = []  #&#x5B58;&#x50A8;&#x5BF9;&#x5E94;&#x8BAD;&#x7EC3;&#x96C6;&#x6240;&#x5C5E;&#x7684;&#x7C7B;
    for x in range(0,10):
        oumiga = oumiga + [x] * 20

    w = train(oumiga,list_img) #&#x5F97;&#x5230;&#x589E;&#x5E7F;&#x6743;&#x77E2;&#x91CF;

    #&#x6D4B;&#x8BD5;&#x96C6;&#x6D4B;&#x8BD5;
    list_test = []
    for j in [x for x in range(0,10)]:
        for i in range(1,6):
            img = cv2.imread(PATH + 'test/' + str(j) + '/' + str(j) + '-' + str(i) + '.png')
            temp = np.asarray(img)
            temp = temp.reshape(-1, 3)
            temp = np.sum(temp, axis=1)
            temp = np.where(temp > 300, 0, 1)
            temp = preprocess(temp)  # &#x9884;&#x5904;&#x7406;

            list_test.append(temp.tolist())

    list_test = np.asarray(list_test)
    oumiga_test = []
    for x in range(0,10):
        oumiga_test = oumiga_test + [x] * 5

    test(oumiga_test,list_test,w)
</=>

需要实验图片或者有疑问的的小伙伴可以联系我。

Original: https://blog.csdn.net/weixin_46087822/article/details/122285224
Author: 斑马还没睡着
Title: 模式识别导论（实验三）基于感知器算法的数字识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/550550/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Android开发之语音识别，Android开发知识体系

switch (requestCode) { case RESULT_SPEECH: { if (resultCode == RESULT_OK && data !…

人工智能 2023年5月23日
0091
YoloV1——总结

1.概述 YoloV1是一个快速、准确的目标检测网络，优缺点如下：优点： 1.具备实时性，网络运行速度超过45fps 3.网络结构简单，端到端 4.可用于多种对象的检测缺点： …

人工智能 2023年7月14日
0068
Mac M1 在PyCharm中安装（支持GPU）TensorFlow 方法

参考文章： Macbook M1安装tensorflow-gpu教程_Joemt的博客-CSDN博客_m1安装tensorflowMac M1 在PyCharm中安装（支持GPU）…

人工智能 2023年5月23日
00109
python与腾讯语音识别

语音识别是一项比较复杂的技术，在单机上很难实现高效的识别功能，但借助云平台，就容易多了。 [En] Speech recognition is a relatively compl…

人工智能 2023年5月27日
00105
软件工程基础实验二

【软工基础】实验二作业 1 实验内容及要求题目1：我们在刚开始上课的时候介绍过一个小学四则运算自动生成程序的例子，请实现它，要求：① 能够自动生成四则运算练习题② 可以定制题目数…

人工智能 2023年6月28日
00102
为什么大家都喜欢使用宝塔面板？

1、宝塔是什么？宝塔面板系统是一款非常好用的网站服务器管理控制面板，官方对用户永久免费，Linux操作系统一定要是纯净系统安装，并且要支持CentOS、Ubuntu、Debian…

人工智能 2023年6月29日
0099
『机器学习』了解分类，回归，聚类算法，实现小规模预测

文章目录 1、SkLearn 数据库 * 鸢尾花数据集数据集划分 2、特征提取 * 字典提取文本提取 3、特征预处理 * 归一化标准化 4、特征降维 * 特征选择 &#821…

人工智能 2023年6月17日
0083
学习panda df.loc[] 选取行列区域

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月7日
0079
Neo4j中使用Cypher语言批量创建中文语句遇到的问题

1、前提我是采用 py2neo工具包，在pycharm中拼接Cypher查询语言，使用 graph.run(cypher)往Neo4j Browser中批量创建节点。其中，字符串…

人工智能 2023年6月1日
0093
目标检测Part2+Leetcode(733)

目标检测Part2 目标检测Part2(R-FCN,Yolo) * 1.R-FCN – 1.1 检测网络的变换敏感性和分类网络的变换不变性 1.2 设计动机（模型优…

人工智能 2023年7月10日
00109
Java远程通信技术——Axis实战

前言在 Internet 网络覆盖全球的今天，网络通信已经是当今软件开发过程中离不开的话题。在常用的Windows、Linux、Unix 系统当中，大部分的网络数据传输都是使用 …

人工智能 2023年6月4日
00109
DenseNet

paper: Densely Connected Convolutional Networks Memory-Efficient Implementation of DenseNe…

人工智能 2023年7月1日
00108
Pandas系列(三)：数据清洗

Pandas系列目录文章目录一、简介二、思维导图三、 Pandas数据清洗 * 1. 空值、缺失值处理 – 1.1 空值、缺失值判断 1.2 空值处理 2….

人工智能 2023年7月15日
0078
【通信】基于matlab语音信号仿真【含Matlab源码 957期】

⛄一、获取代码方式获取代码方式1：完整代码已上传我的资源：【通信】基于matlab语音信号仿真【含Matlab源码 957期】点击上面的蓝色字体，付费直接下载，就可以了。 [En…

人工智能 2023年5月25日
0096
将彩色图像转换为灰度文件、HSV、HSI 格式

目录彩色图像转换为灰度文件 * .1 使用opencv .2 不使用opencv 彩色图像转换为HSV、HSI文件 * .1 HSV和HSI简介 .2 实现车牌字符分割总结 …

人工智能 2023年7月20日
0077
深度学习第3章线性分类实验四 pytorch实现 Softmax回归鸢尾花分类任务下篇

目录：第3章线性分类 * 3.3 实践：基于Softmax回归完成鸢尾花分类任务 – 3.3.1 数据处理 + 3.3.1.1 数据集介绍 3.3.1.2 数据清洗…

人工智能 2023年6月16日
00113

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

模式识别导论（实验三） 基于感知器算法的数字识别

实验要求：

大家都在看

模式识别导论（实验三）基于感知器算法的数字识别