基于Python批量去水印优化批量OCR的质量

2023年6月20日下午6:18 • 人工智能 • 阅读 77

中国传媒大学2022硕士研究生录取名单终于出来了，根据我写的上一篇文章：基于批量OCR分析中传研究生录取名单
分析了一下，没想到我居然初试材料复试三个第一，然而感觉自己还是有很多不足之处和可以改进的地方。今天在中传研究生群里受到了一位国重大佬的启发，想到了可以用python批量去水印的方法去除中传研究生录取名单里的大logo，这样可以使OCR识别效果更准确。

首先了解logo水印类型

logo几乎是一个颜色，整体RGB值在一定范围内，可以将该水印区域的RGB值变成白色，能够增强OCR识别的精确度。
获取logo的RGB值

这里的RGB是波动的，但我们只需要看R+G+B的值大致范围，比如说这里大致都在300以上，可以令RGB值之和大于300的都变成白色（如这里[202,172,36]变成[255,255,255]）
用Python批量去水印


from itertools import product
from PIL import Image
from io import BytesIO

    filePath1 = filePath + "\\yan (" + str(i) +").png"

    img = Image.open(filePath1)
    width, height = img.size
    for pos in product(range(width), range(height)):
            if sum(img.getpixel(pos)[:3]) > 300:
                    img.putpixel(pos, (255, 255, 255))

    img_bytes = BytesIO()
    img.save(img_bytes, format='png')
    img_bytes = img_bytes.getvalue()
    table = aipOcr.tableRecognitionAsync(img_bytes)

这里只给出了 新加的代码，需要用到PIL库的Image进行图像处理，io的BytesIO将PIL图形转换成二进制进行网络传输（百度api仅支持二进制传输），使RGB值之和大于300的变成白色，方便OCR识别。（这里实时二进制传输可能会出现问题，重试一遍即可）

R语言部分代码优化
在上一篇文章中R语言合并的部分可能会出现有的表格第一行为空的情况，我对之前的R语言代码进行了如下改进：

library(readxl)

setwd('D:/360极速浏览器下载/2022拟录取名单/')

filenames  dir()

filenames2  grep('.xls', filenames, value = TRUE)

data3  data.frame()

for (i in filenames2){

  path  paste0('D:/360极速浏览器下载/2022拟录取名单/',i)

  data2  read_xls(path = path,sheet='body',skip=1,col_names = TRUE)
  data2$index  i
  fittry(data3  rbind(data3,data2),silent=TRUE)
  if('try-error' %in% class(fit)){
    data2  read_xls(path = path,sheet='body',col_names = TRUE)
    data2$index  i
    data3  rbind(data3,data2)
  }
}
write.csv(data3, file="D:/2022拟录取名单.csv",row.names = FALSE)

使用了try函数，如果合并失败，说明第一行没有识别出来，需要重新读取skip=0（默认）

最终的总录取名单

可以看到识别非常精准，说明批量去水印能显著改善批量OCR的质量，但是程序运行时间也相应的变长了。所以如果只是做正则匹配的话没必要那么精确，使用我上一篇文章的方法近似处理也许是更高效的选择。最终得到的总录取名单见我发的：中国传媒大学2022硕士研究生录取名单电子版（一志愿）。

写在最后，特别感谢自己这么长时间来的努力，感谢那个积极治疗、乐观生活的自我。虽然考研期间总是在生病，也遇到了很多坎坷，但依然能够在卷王之卷的2022考研中实现自己的梦想。

选择这个专业是因为热爱， 热爱可抵岁月漫长。众所周知统计学在计算机、金融领域十分受欢迎，但是我学了这么多发现我并不感兴趣，以后还是想做多媒体数据挖掘方向，将专业知识运用在传媒或信息传播领域。

希望大家都能考上理想的学校，我们都有美好的未来。

Original: https://blog.csdn.net/qq_45702601/article/details/124183150
Author: 清洄KAKA
Title: 基于Python批量去水印优化批量OCR的质量

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/641767/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Android 讯飞语音识别功能开发

以下代码主要参考博客：Android 科大讯飞语音识别 Android蓝牙串口开发部分请参照博客：Android蓝牙串口开发讯飞语音官方开发文档：语音听写 Android SDK…

人工智能 2023年5月27日
0085
BiLSTM+Attention代码实现（pytorch）

import torchimport torch.nn as nn class BiLSTM_Attention(nn.Module):def init(self):super(B…

人工智能 2023年7月22日
00139
智能计算：人工神经网络（ANN）

2022/5/25 文章目录神经网络 * 一、神经网络基本简介二、神将网络的典型结构三、神经网络的学习算法四、BP神经网络神经网络人类的大脑是如何工作的呢？在计算机上…

人工智能 2023年6月16日
00146
pandas对多列同时使用apply_pandas库的简单介绍（3）

4 pandas基本功能 4.1 重建索引(见上一篇文章) 4.2 数据选择 pandas的数据选择是十分重要的一个操作，它的操作与数组类似，但是pandas的数据选择与数组不同 …

人工智能 2023年7月7日
0052
关于聚类如何确定K值的问题

文章目录 * – + * 聚类性能的度量 * – 1. 内部指标和外部指标 – 2.轮廓系数和平方误差 – + 平方误差 + 轮廓系…

人工智能 2023年5月31日
0081
保姆级聚类热图绘制！（不用R语言！不用写代码！）

保姆级聚类热图绘制！（不用R语言！不用写代码！）现阶段主流热图用R进行绘制，然而部分专业例如环境专业的同学们基本不怎么会使用代码去得到自己想要的图形（当然也不排除有厉害的同学也是…

人工智能 2023年6月2日
00101
VScode搭建C/C++编译环境

VScode搭建C/C++编译环境文章目录 VScode搭建C/C++编译环境 * – 官网下载vscode 下载编译器设置环境变量安装插件 vscode基础设置…

人工智能 2023年6月29日
0064
C#Winform中打印预览时设置横向打印

PrintDocument的打印相关的方法被调用的顺序是这样的：QueryPageSettingsStartPagePrintPageEndPage目前只处理了StartPage和…

人工智能 2023年7月24日
0060
TensorFlow2深度学习实战（十八）：目标检测算法YOLOv4-Tiny实战

前言：本栏目以理论与实践相结合的方式，左手阅卷，右手敲码，一步步带您领略深度学习和源代码的原理，一一攻克计算机视觉领域的三大基本任务：图像分类、目标检测、语义分割。 [En] I…

人工智能 2023年5月23日
0071
UE4 UE5 opencv插件获取摄像头画面

本插件在UE4.26、UE4.27、UE5.0.3等版本亲测有效，谢谢各位前辈朋友，这里就不一一鸣谢了。插件地址：UE5OpenCV插件-C++文档类资源-CSDN下载 1.项目…

人工智能 2023年5月26日
0079
【商业分析 03】疫情之下（20年初IT桔子投融资数据分析）

突如其来的疫情夹杂着鞭炮的响声使得今年的春节格外不同寻常，从吹哨人的哨声到钟南山院士的紧急呼吁，我们一代人注定成为了这次”卫生战役”的亲历者。疫情之下，各行…

人工智能 2023年6月11日
0069
关于运行DynaSLAM源码这档子事(OpenCV3.x版)

好了，这是另一个源代码运行记录，←←。 [En] Okay, here comes another source code running record, ← ←. 一. 基础环境…

人工智能 2023年5月24日
0068
Flutter耳返和双声道功能的实现

1 耳返功能简介 ZEGO Express SDK 提供了Flutter耳返和双声道的功能，在视频直播、K歌、音频录制等场景下广泛应用，开发者可根据实际业务场景需要设置，一套代码可…

人工智能 2023年6月3日
0065
opencv系列之基于NVIDIA显卡的opencv-python硬解方案

ffmpeg编译使用cuvid硬解方案试过了，不过解码出来的像素格式为YUV420， opencv中使用需要转成BGR，转色彩空间这部占用的CPU过高。因此需要将转色彩空间这步也…

人工智能 2023年7月18日
00200
相机标定-机器视觉基础（理论推导、Halcon和OpenCV相机标定）

相机标定是获得目标工件精准坐标信息的基础。首先，必须进行相机内参标定，构建一个模型消除图像畸变；其次，需要对相机和机器人的映射关系进行手眼标定，构建一个模型将图像坐标系上的点映射到…

人工智能 2023年7月19日
0052
python删除excel第一行_如何用 Python 清洗数据？

### 回答1：要用 Python_导入 _Excel 数据_并画出柱状图，可以使用pandas和matplotlib库。首先，使用pandas读取 _Excel_文件中的 _数…

人工智能 2023年7月8日
0052

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

基于Python批量去水印优化批量OCR的质量

大家都在看