OpenCV-Python身份证信息识别

2023年5月26日上午10:10 • 人工智能 • 阅读 72

本篇文章使用OpenCV-Python和CnOcr来实现身份证信息识别的案例。想要识别身份证中的文本信息，总共分为三大步骤：一、通过预处理身份证区域检测查找；二、身份证文本信息提取；三、身份证文本信息识别。下面来看一下识别的具体过程CnOcr官网。识别过程视频

前置环境

这里的环境需要安装OpenCV-Python，Numpy和CnOcr。本篇文章使用的Python版本为3.6，OpenCV-Python版本为3.4.1.15，如果是4.x版本的同学，可能会有一些Api操作不同。这些依赖的安装和介绍，我就不在这里赘述了，均是使用Pip进行安装。

识别过程

首先，导入所需要的依赖cv2，numpy，cnocr并创建一个show图像的函数，方便后面使用：

import cv2
import numpy as np
from cnocr import CnOcr

def show(image, window_name):
    cv2.namedWindow(window_name, 0)
    cv2.imshow(window_name, image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

ocr = CnOcr(model_name='densenet_lite_136-gru')

身份证区域查找

通过对加载图像的灰度处理–>滤波处理–>二值处理–>边缘检测–>膨胀处理–>轮廓查找–>透视变换（校正）–>图像旋转–>固定图像大小一系列处理之后，我们便可以清晰的裁剪出身份证的具体区域。

原始图像

使用OpenCV的imread方法读取本地图片。

image = cv2.imread('card.png')
show(image, "image")

灰度处理

将三通道BGR图像转化为灰度图像，因为一下OpenCV操作都是需要基于灰度图像进行的。

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
show(gray, "gray")

中值滤波

使用滤波处理，也就是模糊处理，这样可以减少一些不需要的噪点。

blur = cv2.medianBlur(gray, 7)
show(blur, "blur")

二值处理

二值处理，非黑即白。这里通过cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU，使用OpenCV的大津法二值化，对图像进行处理，经过处理后的图像，更加清晰的分辨出了背景和身份证的区域。

threshold = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
show(threshold, "threshold")

边缘检测

使用OpenCV中最常用的边缘检测方法，Canny，检测出图像中的边缘。

canny = cv2.Canny(threshold, 100, 150)
show(canny, "canny")

边缘膨胀

为了使上一步边缘检测的边缘更加连贯，使用膨胀处理，对白色的边缘膨胀，即边缘线条变得更加粗一些。

kernel = np.ones((3, 3), np.uint8)
dilate = cv2.dilate(canny, kernel, iterations=5)
show(dilate, "dilate")

轮廓检测

使用findContours对边缘膨胀过的图片进行轮廓检测，可以清晰的看到背景部分还是有很多噪点的，所需要识别的身份证部分也被轮廓圈了起来。

binary, contours, hierarchy = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
image_copy = image.copy()
res = cv2.drawContours(image_copy, contours, -1, (255, 0, 0), 20)
show(res, "res")

轮廓排序

经过对轮廓的面积排序，我们可以准确的提取出身份证的轮廓。

contours = sorted(contours, key=cv2.contourArea, reverse=True)[0]
image_copy = image.copy()
res = cv2.drawContours(image_copy, contours, -1, (255, 0, 0), 20)
show(res, "contours")

透视变换

通过对轮廓近似提取出轮廓的四个顶点，并按顺序进行排序，之后通过warpPerspective对所选图像区域进行透视变换，也就是对所选的图像进行校正处理。

epsilon = 0.02 * cv2.arcLength(contours, True)
approx = cv2.approxPolyDP(contours, epsilon, True)
n = []
for x, y in zip(approx[:, 0, 0], approx[:, 0, 1]):
    n.append((x, y))
n = sorted(n)
sort_point = []
n_point1 = n[:2]
n_point1.sort(key=lambda x: x[1])
sort_point.extend(n_point1)
n_point2 = n[2:4]
n_point2.sort(key=lambda x: x[1])
n_point2.reverse()
sort_point.extend(n_point2)
p1 = np.array(sort_point, dtype=np.float32)
h = sort_point[1][1] - sort_point[0][1]
w = sort_point[2][0] - sort_point[1][0]
pts2 = np.array([[0, 0], [0, h], [w, h], [w, 0]], dtype=np.float32)

M = cv2.getPerspectiveTransform(p1, pts2)

dst = cv2.warpPerspective(image, M, (w, h))

show(dst, "dst")

固定图像大小

将图像变正，通过对图像的宽高进行判断，如果宽

Original: https://blog.csdn.net/wFitting/article/details/124039827
Author: wFitting
Title: OpenCV-Python身份证信息识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/519128/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

还是搞不懂Anaconda是什么?读这一篇文章就够了

文章目录 1 Anaconda介绍 2 conda介绍 3 安装Anaconda 4 Anaconda的使用 * 配置Anaconda源 5 创建虚拟环境并使用 * 5.1 创建虚…

人工智能 2023年7月3日
0068
（机器学习-深度学习快速入门）第二章数据分析基本工具Numpy-第一节：Numpy之基本了解

部分参考文章目录一：Numpy了解二：Numpy之Ndarray对象三：Numpy之数据类型 – （1）数据类型（2）类型转换四：Numpy之数据类型对象(…

人工智能 2023年7月16日
0057
图像处理8-CNN图像分类

图像处理系列图像处理1-经典空间域增强——灰度映射图像处理2-经典空间域增强——直方图均衡化图像处理3-经典空间域增强——空域滤波图像处理4-图像的傅里叶变换图像处理5-…

人工智能 2023年6月20日
0079
人工智能-深度学习-yolov3口罩佩戴识别

一.基础环境 windows 10 cuda 10.0 python3.7.4 tensorflow-gpu 1.14.0 keras2.2.4 numpy==1.16.5 二.下…

人工智能 2023年6月16日
0062
web前端设计与开发期末作品旅游咨询网站 HTML5期末大作业 HTML+CSS旅游社网站5个页面关于制作网页主题论述

👨‍🎓静态网站的编写主要是用 HTML DⅣV+ CSSJS等来完成页面的排版设计👩‍🎓，一般的网页作业需要融入以下知识点：div布局、浮动定位、高级css、表格、表单及验证、js…

人工智能 2023年6月30日
0040
李沐动手学深度学习V2-ResNet残差网络模型和代码实现

1.ResNet 1.1 神经网络嵌套函数和非嵌套函数(前提知识)：首先，假设有一类特定的神经网络架构F \mathcal{F}F，它包括学习速率和其他超参数设置。对于所有f ∈…

人工智能 2023年5月26日
0094
使用OpenCV进行特征（颜色、形状）提取

图像处理图像处理所做的只是从图像中提取有用的信息，从而减少数据量，但保留描述图像特征的像素。下面从图像中提取颜色、形状和纹理特征的方法开始 1. 颜色每次处理图像项目时，图像…

人工智能 2023年6月19日
0090
什么是模型的泛化能力

什么是模型的泛化能力？模型的泛化能力是指训练好的机器学习模型在未见过的数据上表现良好的能力。换句话说，模型的泛化能力是指模型对新样本的泛化程度。一个具有良好泛化能力的模型可以在…

人工智能 2024年1月3日
0036
R语言网络图可视化——igraph, forceatlas2的使用

根据连接矩阵，绘制网络图，如下所示：该图中对每个子网络赋予相同的颜色，并且利用forceatlas2来布局。好了，下面直接给出详细的步骤： ; Step1：安装必要的包 rm(…

人工智能 2023年7月17日
0071
利用Python实现自动识别图片文字 — OCR

文章目录 * – 什么是OCR？ – 安装Tesseract-OCR和pytesseract – + 验证安装 – 实现自动识别文字…

人工智能 2023年6月23日
0086
匈牙利算法指派问题的python实现 & 使用python计算聚类精度

简单描述匈牙利算法具体描述见匈牙利算法与对偶观点一个原始的指派问题：有n个工人，和n个需要作业的地点。需要为每个工人安排一个工作的地点，记变量x i j = 0 o r 1 x_…

人工智能 2023年5月31日
0058
基于stm32的自平衡小车

文章目录引言 1、系统概述 * 1.1、设计任务 1.2、设计要求 2、方案设计与论证 * 2.1、芯片选择方案 2.2 、系统概述 2.3、设计要求 2.4、系统总体设计 2….

人工智能 2023年6月2日
0080
Pandas中 iloc 和 loc的区别

参考kaggle中的Pandas课程这里先创建一个DataFrame结构的数据： import pandas as pd data = pd.DataFrame({‘a’:[0,…

人工智能 2023年7月7日
0039
[Linux]-常用命令

路径与文件查看 wget xxx 下载xxx ls 查看目前路径下文件 cd xxx 跳转到xxx路径 du -csh ./* 查看文件夹所占存储容量 ln -s xxxa xxx…

人工智能 2023年6月4日
0045
怎么样用Python 读取oni 格式文件？

oni 文件是openni 的存储&#x…

人工智能 2023年7月20日
0057
win10 + neo4j + jdk 完美安装教程欲哭无泪贴！！教你彻底卸载老的jdk！

本安装必须按照版本来，否则后果自理！！！！各种安装包见评论区一、安装Java环境 1.0 jdk-13.0.2 一定是要这个版本1.1 在系统变量里新建”JAVA_…

人工智能 2023年6月1日
00152

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

OpenCV-Python身份证信息识别

前置环境

识别过程

身份证区域查找

原始图像

灰度处理

中值滤波

二值处理

边缘检测

边缘膨胀

轮廓检测

轮廓排序

透视变换

固定图像大小

大家都在看