【AI实战】超赞的几个OCR开源项目

2023年7月28日上午4:42 • 人工智能 • 阅读 54

OCR（optical character recognition）文字识别是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，然后用字符识别方法将形状翻译成计算机文字的过程。
点击查看百科：OCR文字识别介绍

光学文字识别的概念是在1929年由德国科学家Tausheck最先提出来的，后来美国科学家Handel也提出了利用技术对文字进行识别的想法。而最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy，1966年他们发表了第一篇关于汉字识别的文章，采用了模板匹配法识别了1000个印刷体汉字。

20世纪70年代初，日本的学者开始研究汉字识别，并做了大量的工作。

1986年以后我国的OCR研究有了很大进展，在汉字建模和识别方法上都有所创新，在系统研制和开发应用中都取得了丰硕的成果，不少单位相继推出了中文OCR产品。

1、图像输入、预处理

2、二值化

3、噪声去除

4、倾斜较正

5、版面分析

6、字符切割

7、字符识别

8、版面恢复

9、后处理、校对

第三名：chineseocr
本项目基于yolo3 与crnn 实现中文自然场景文字检测及识别
该项目提供了数据集
ocr ctc训练数据集(压缩包解码:chineseocr)
百度网盘地址:链接: https://pan.baidu.com/s/1UcUKUUELLwdM29zfbztzdw 提取码: atwn
实现功能
文字方向检测 0、90、180、270度检测（支持dnn/tensorflow）
支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练
不定长OCR训练(英文、中英文) crnn\dense ocr 识别及训练 ,新增pytorch转keras模型代码(tools/pytorch_to_keras.py)
其他说明：
https://github.com/chineseocr/chineseocr#readme
第四名：YCG09/chinese_ocr
基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别文本检测：CTPN
文本识别：DenseNet + CTC
该项目提供了数据集：
https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw (密码：lu7m) 共约364万张图片，按照99:1划分成训练集和验证集
数据利用中文语料库（新闻 + 文言文），通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成
包含汉字、英文字母、数字和标点共5990个字符
每个样本固定10个字符，字符随机截取自语料库中的句子
图片分辨率统一为280×32

https://github.com/eragonruan/text-detection-ctpn

https://github.com/senlinuc/caffe_ocr

https://github.com/chineseocr/chinese-ocr

https://github.com/xiaomaxiao/keras_ocr

https://github.com/alisen39/TrWebOCR

https://github.com/da03/Attention-OCR

https://github.com/JinpengLI/deep_ocr

Original: https://blog.csdn.net/zengNLP/article/details/126785075
Author: szZack
Title: 【AI实战】超赞的几个OCR开源项目

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/719799/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

MATLAB安装随机森林分类安装包

MATLAB安装随机森林分类安装包安装步骤此文章部分参考https://blog.csdn.net/weixin_42929622/article/details/115336…

人工智能 2023年7月1日
0059
基于麻雀搜索算法优化的支持向量机回归预测-附代码

基于麻雀搜索算法优化的支持向量机预测及其MATLAB代码实现文章目录基于麻雀搜索算法优化的支持向量机预测及其MATLAB代码实现 1. 基于麻雀搜索算法优化的支持向量机预测简介…

人工智能 2023年7月1日
0091
【OpenCV】Pyqt界面+摄像头实现人脸检测+安全帽识别，最终导出为exe文件

文章目录前言一、界面设计二、相关代码三、导出exe文件总结前言接上节的内容。设计好的界面如下：实现的功能：1.通过摄像头进行截图，把截图上传到OneNetAI服务器…

人工智能 2023年7月19日
0073
机器学习–高维数据降维方法并使用Iris数据集进行降维演示

文章目录 * – 前言 – 一、主成分分析（PCA） – + 1.说明 + 2.【例1】基于主成分分析对 Iris 数据集降维： –…

人工智能 2023年6月16日
0091
多元线性回归算法预测房价

一、多元线性回归 * 1.概念 2.估计方法 3.公式二、用Excel预估房价三、在jupyter中使用sklearn库实现房价预测 * 1、线性回归 2.数据处理四、在ju…

人工智能 2023年6月17日
0087
超分辨率分割SLIC算法实现过程遇到的问题，shape mismatch: value array of shape (3,) could not be broadcast to indexing

超分辨率分割SLIC算法实现过程遇到的问题 shape mismatch: value array of shape (3,) could not be broadcast to …

人工智能 2023年7月20日
0029
【skLearn 回归模型】Lasso —- 选择最佳正则化参数＜带交叉验证的Lasso LassoCV()＞

文章目录一、linear_model.LassoCV() * ♦ 正则化路径 regularization path ♦ linear_model.LassoCV类 &#8211…

人工智能 2023年6月17日
00183
python创建一个空列表a_python 创建一个空dataframe 然后添加行数据

import pandas as pd import re import math dframe1 = pd.read_excel(“window regulator分…

人工智能 2023年7月8日
0063
模型修改之替换骨干网络（backbone）

前言说实话这篇文章是没有在计划之内的，但是有读者说让我出一个使用transformer替换其他骨干网络的示例，想了想，最近好像没啥状态的，论文有点看不下去，正好整理一下自己的经验…

人工智能 2023年6月16日
0080
[云服务器与docker]在mmdetection3d上跑PointPillars

因为实验室贫穷，只有一台2080ti的机子，所以一开始打算用云服务器，后面发现云服务器实在是折磨人，所以又回到实验室的2080ti机子。本文分为两部分：云服务器(失败)和实验室机子…

人工智能 2023年7月11日
0067
学习OpenCV3——图像旋转算法实现

图像旋转是非常常见的图像变换，通常应用于图像矫正，在OpenCV可以使用密集仿射变换函数cv::warpAffine()实现图像旋转。为了理解图像旋转的原理，本文实现了一个图像旋转…

人工智能 2023年6月19日
0099
Python | 英雄联盟游戏数据分析

一、项目背景 EDG夺得2021英雄联盟全球总决赛冠军，这场比赛让所有观赛者热血沸腾，也唤起了我这个沉睡多年老玩家对MOBA游戏的兴趣，兴冲冲地下载了英雄联盟，却发现这并不是一个可…

人工智能 2023年7月16日
0068
在AI算法中，什么是Layer

什么是Layer？在AI算法中，Layer（层）指的是神经网络中的一个组件，用于处理和转换输入数据。一个神经网络通常由多个层组成，每个层负责对输入数据进行不同的处理操作。每个层将…

人工智能 2024年1月5日
0047
Python beautifulsoup4解析数据提取基本使用

Beautiful Soup是Python的一个网&#x987…

人工智能 2023年7月5日
0072
Anaconda + cuda10.2 + pytorch1.6.0 环境配置加踩坑

背景： Linux x86_64的系统，win或者mac应该大同小异因为是在学校服务器上部署的环境，cuda已经安装好了，这里cuda安装的是10.2版本的安装cuda教程网上有很…

人工智能 2023年7月23日
0080
Lagrange插值公式推导及python实现计算

一、引言 1.插值函数的定义：设函数y=f(x)在区间[a,b]上有定义，且已知在点a≤x0≤x1≤…≤xn≤b上的值y0,y1,…,yn，若存在一简单函数…

人工智能 2023年6月15日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【AI实战】超赞的几个OCR开源项目

大家都在看