基于机器学习的车牌识别系统（Python实现基于SVM支持向量机的车牌分类）

2023年6月30日下午4:39 • 人工智能 • 阅读 94

一、数据集说明
训练样本来自于github上的EasyPR的c++版本，包含一万三千多张数字及大写字母的图片以及三千多张中文字符图片。图片为已经处理好的二值化图像，已贴好标签（见每个子文件夹名），像素均为20×20。数字和大写字母图片保存在train\chars2目录下，中文字符图片保存在train\ charsChinese目录下。
测试样本来源于较为广泛，从各种网站搜集得到的各类车辆图片，保存在test目录下。

二、模型概述
本模型主要由四部分构成：训练字符分类器、车牌定位、字符分割、字符识别。其中训练字符分类器部分，将训练样本图片进行进一步抗扭曲处理后提取特征向量——方向梯度直方图，然后利用OpenCV自带的SVM模型训练模型，模型分为两个分类器，其中一个存放中文字符另外一个存放数字及大写字母。车牌定位部分是将测试集图片进行灰度化处理、高斯去躁、开运算和闭运算、Canny算子边缘检测、根据矩形框位置及颜色检测等处理，将车牌位置找到。字符分割部分从图片的波形直方图中找到波峰的位置，每个波峰范围内是一个字符，将字符分割开。字符识别部分就是将分割开的字符分别放入对应的分类器中进行识别，给出测试结果。下面我将结合具体代码及结果就以上四个部分给出详细的说明。

三、训练字符分类器
本字符分类器的训练是运用SVM的思想，利用OpenCV自带的SVM模型进行训练。
（一）SVM介绍
支持向量机（support vector machines, SVM）是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；SVM还包括核技巧，这使它成为实质上的非线性分类器。SVM的的学习策略就是间隔最大化，可形式化为一个求解凸二次规划的问题，也等价于正则化的合页损失函数的最小化问题。SVM的的学习算法就是求解凸二次规划的最优化算法。
（二）具体实现过程
1、定义一个SVM类，用到OpenCV自带的方法
（1）参数说明
SVM模型有两个非常重要的参数C与gamma。其中C是惩罚系数，即对误差的宽容度。C越高，说明越不能容忍出现误差,容易过拟合。C越小，容易欠拟合。C过大或过小，泛化能力变差。
gamma是选择RBF函数作为kernel后（本模型即选用RBF为核函数），该函数自带的一个参数。隐含地决定了数据映射到新的特征空间后的分布，gamma越大，支持向量越少，gamma值越小，支持向量越多。支持向量的个数影响训练与预测的速度。
（2）相关代码

class SVM(StatModel):
    def __init__(self, C = 1, gamma = 0.5):
        self.model = cv2.ml.SVM_create()
        self.model.setGamma(gamma)
        self.model.setC(C)
        self.model.setKernel(cv2.ml.SVM_RBF)
        self.model.setType(cv2.ml.SVM_C_SVC)

    def train(self, samples, responses):
        self.model.train(samples, cv2.ml.ROW_SAMPLE, responses)

    def predict(self, samples):
        r = self.model.predict(samples)
        return r[1].ravel()

2、训练集特征向量抗扭曲处理
相关代码：


def deskew(img):
    m = cv2.moments(img)
    if abs(m['mu02']) < 1e-2:
        return img.copy()
    skew = m['mu11']/m['mu02']
    M = np.float32([[1, skew, -0.5*SZ*skew], [0, 1, 0]])
    img = cv2.warpAffine(img, M, (SZ, SZ), flags=cv2.WARP_INVERSE_MAP | cv2.INTER_LINEAR)
    return img

3.获取训练集图片特征：方向梯度
（1）方向梯度直方图
对于本分类器研究的问题，图片的边缘十分重要，因此提取特征时应重点关注图像边缘。沿着一张图片X和Y轴的方向上的梯度是很有用的，因为在边缘和角点的梯度值是很大的，边缘和角点包含了很多物体的形状信息。因此本模型采用方向梯度直方图(HOG)中梯度的方向作为特征。
（2）具体步骤：
a.计算梯度图像：直接用OpenCV里面的kernel大小为1的Sobel算子来计算。
b.计算梯度的幅值g和方向theta。
c.将梯度量化为16×16个整数值。把每个图像分成四个子图方块。对于每个子正方形，计算加权其幅度的方向（16×16bins）的直方图。因此，每个子图有一个包含16×16个值的向量。四个这样的向量（分别代表四个子图的16×16向量）一起给我们一个特征向量包含1024个值。这就是我们用来训练数据的特征向量。
（3）HOG方法优缺点分析
优点：HOG表示的是边缘（梯度）的结构特征，因此可以描述局部的形状信息；位置和方向空间的量化一定程度上可以抑制平移和旋转带来的影响；采取在局部区域归一化直方图，可以部分抵消光照变化带来的影响。由于一定程度忽略了光照颜色对图像造成的影响，使得图像所需要的表征数据的维度降低了。
缺点：描述子生成过程冗长，导致速度慢，实时性差；很难处理遮挡问题；由于梯度的性质，该描述子对噪点相当敏感。
（4）相关代码：


def preprocess_hog(digits):
    samples = []
    for img in digits:
        gx = cv2.Sobel(img, cv2.CV_32F, 1, 0)
        gy = cv2.Sobel(img, cv2.CV_32F, 0, 1)
        mag, ang = cv2.cartToPolar(gx, gy)
        bin_n = 16
        bin = np.int32(bin_n*ang/(2*np.pi))
        bin_cells = bin[:10,:10], bin[10:,:10], bin[:10,10:], bin[10:,10:]
        mag_cells = mag[:10,:10], mag[10:,:10], mag[:10,10:], mag[10:,10:]

        hists = [np.bincount(b.ravel(), m.ravel(), bin_n) for b, m in zip(bin_cells, mag_cells)]
        hist = np.hstack(hists)

        eps = 1e-7
        hist /= hist.sum() + eps
        hist = np.sqrt(hist)
        hist /= norm(hist) + eps
        samples.append(hist)
    return np.float32(samples)

4.将数据导入分类器进行训练
相关代码：

def train_svm(self):
        self.model = SVM(C=1, gamma=0.5)
        self.modelchinese = SVM(C=1, gamma=0.5)
        if os.path.exists("svm.dat"):
            self.model.load("svm.dat")
        else:
            chars_train = []
            chars_label = []
            for root, dirs, files in os.walk("train\\chars2"):

                if len(os.path.basename(root))> 1:

                    continue
                root_int = ord(os.path.basename(root))

                for filename in files:
                    filepath = os.path.join(root,filename)
                    digit_img = cv2.imread(filepath)
                    digit_img = cv2.cvtColor(digit_img, cv2.COLOR_BGR2GRAY)

                    chars_train.append(digit_img)
                    chars_label.append(root_int)
            chars_train = list(map(deskew, chars_train))
            chars_train = preprocess_hog(chars_train)
            chars_label = np.array(chars_label)
            self.model.train(chars_train, chars_label)

        if os.path.exists("svmchinese.dat"):
            self.modelchinese.load("svmchinese.dat")
        else:
            chars_train = []
            chars_label = []
            for root, dirs, files in os.walk("train\\charsChinese"):
                if not os.path.basename(root).startswith("zh_"):
                    continue
                pinyin = os.path.basename(root)
                index = provinces.index(pinyin) + PROVINCE_START + 1

                for filename in files:
                    filepath = os.path.join(root,filename)
                    digit_img = cv2.imread(filepath)
                    digit_img = cv2.cvtColor(digit_img, cv2.COLOR_BGR2GRAY)
                    chars_train.append(digit_img)
                    chars_label.append(index)
            chars_train = list(map(deskew, chars_train))
            chars_train = preprocess_hog(chars_train)
            chars_label = np.array(chars_label)
            print(chars_train.shape)
            self.modelchinese.train(chars_train, chars_label)

数据集及所有代码资源链接：https://download.csdn.net/download/creampang/85766802

Original: https://blog.csdn.net/creampang/article/details/125454317
Author: creampang
Title: 基于机器学习的车牌识别系统（Python实现基于SVM支持向量机的车牌分类）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/661656/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python微信公众号自动推送（十分简单的教程）

目录一、注册微信公众号 1.注册链接 2.登录成功 3.关注该公众号 4.创建模板二、代码实现 1.爬取天气信息 2.计算生日天数 3.获取access token 4.获取关…

人工智能 2023年7月4日
0062
Python实战|「甜点消消」游戏数据分析过程

一、背景现在人们的生活节奏逐渐加快，大部分人都只能利用琐碎的时间来进行适当的放松，这也符合人们的生活需求。然而，一个游戏为了生存下去，必须得注重用户的游戏体验来增加游戏的粘性，…

人工智能 2023年6月19日
0074
SPSS多选题数据如何录入与分析？——SPSS多重响应分析的详细讲解

SPSS学习记录day5 写在前面：今天我们讲解多重响应分析的有关内容分析>多重响应关于多重响应（Multiple Response），多重可以理解为多选，即对通过多选…

人工智能 2023年6月19日
00275
Unity用代码写行走移动（第一人称）

利用代码写物体移动,首先我们要知道按键检测一般按键检测if (Input.GetKey(KeyCode.按键值)) 比如说我按W触发就是 if (Input.GetKey(Key…

人工智能 2023年7月29日
0056
李宏毅机器学习（六）自监督学习（一）

BERT与芝麻街这些都是BERT的组件 BERT与进击的巨人 BERT（340 M 参数）ELMO（94M）GPT-2（1542M）Megatron（8B）T5（11B）Turi…

人工智能 2023年6月1日
0072
【超越Swin、ConvNeXt】最新注意力Neighborhood Attention Transformer (NAT)全文翻译

paper：https://arxiv.org/abs/2204.07143 code：https://github.com/SHI-Labs/Neighborhood-Atten…

人工智能 2023年6月25日
00105
neo4j新手教程

neo4j新手教程本文通过一个实际的案例来一步一步使用Cypher来操作Neo4j。这个案例的节点主要包括专业和课程两类，课程和课程之间有前置、并列等关系，专业和课程之间有包含…

人工智能 2023年6月10日
0094
Yolov5 安装详细教程及目标检测和识别

文章内容：1.在 Anaconda 环境下，进行目标检测程序（Yolov5）的下载及安装，实…

人工智能 2023年5月26日
0086
python api调用百度ai平台_百度ai开放平台使用方法（附带详细案例步骤）

百度ai开放平台 1.百度ai开放平台内有众多功能，如文字识别，语音技术等等内容，本文章以身份证识别为例子，教大家怎么使用它啦链接走起：https://cloud.baidu.c…

人工智能 2023年5月27日
0085
pandas dataframe删除空行或者空列dropna，一般删除指定行或者列drop

dropna参见https://blog.csdn.net/roamer314/article/details/84816171 df[~(df[‘col’…

人工智能 2023年7月6日
0094
python对csv文件的处理，pandas 数据预处理csv，案例详细

文章目录 * – csv文件的导入 – CSV文件的导出 – 不导出行号和标签，可分别将index或header设置为False –…

人工智能 2023年6月19日
0047
Shiro笔记02-基本使用

Shiro不依赖容器，直接创建一个Maven工程即可，添加Shiro相关依赖。 <dependency> <groupId>org.apache.shiro…

人工智能 2023年6月26日
0084
解决CUDA error: no kernel image is available for execution on the device

1. 电脑配置 GPU 3080 算力8.6CUDA 11.1CUDNN 8.2.0conda 4.9.2python 3.8.5 2. 问题描述首先在pytroch官网根据电脑…

人工智能 2023年7月21日
0071
波束和BSS问题中的gevd

– 波束部分 1. MaxSNR Beamforming根据MaxSNR Beamforming的公式有:w = a r g _ m a x w h R s w w h…

人工智能 2023年5月27日
0068
python基础：Python MySQL

Python MySQL mysql入门 * MySQL 数据库安装 MySQL 驱动程序测试 MySQL Connector 创建连接创建数据库 * 创建数据库检查数据库…

人工智能 2023年7月4日
0066
对抗生成网络（GAN）详解

目录前言目标函数原理训练给定生成器，训练判别器给定判别器，训练生成器总结前言之前的生成模型侧重于将分布函数构造出来，然后使用最大似然函数去更新这个分布函数的参数，…

人工智能 2023年6月17日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于机器学习的车牌识别系统（Python实现基于SVM支持向量机的车牌分类）

大家都在看