用Python实现简单的验证码识别

当我们收集数据时,我们会访问得太快或太频繁,或者一访问就弹出验证码,然后翻滚珠子。

[En]

When we collect data, we visit it too fast or frequently, or pop up the verification code as soon as we visit, and then clam beads.

用Python实现简单的验证码识别

今天,我将给你一个简单的方法来处理验证码。

[En]

Today, I will give you a simple way to deal with the CAPTCHA.

; 环境模块

本文使用的是 Python和pycharm

这里需要用到一个 ddddocr 模块 ,这是别人开源写好的一个东西,简单又好用,但是精确度差一点点,但是还是非常好用的。

如果你追求精确度的话,可以调用别人写好的一些API 。

咱们直接 win+r 弹出搜索框后输入 cmd ,点击确定弹出命令提示符窗口, 输入pip install ddddocr 即可安装。

代码展示

代码不多,非常简单。

模块安装完成后,我们先将其导入。

[En]

After the module is installed, let’s import it first.

import ddddocr

然后实例化一下,用一个 cor 接收一下这个数据。

ocr = ddddocr.DdddOcr()

我这里准备了四个验证码

分别实现一下验证码

首先我们用 with open 来读取一下这文件,读取方式使用 rb ,因为是图片的话就读取它的二进制数据

with open('img_3.png', 'rb') as f:

使用 f.read() 将数据读取出来,再自定义一个变量接收一下。

img_bytes = f.read()

然后我们通过 classification 将它传进去,把结果打印出来就可以了。

result = ocr.classification(img_bytes)
print(result)
很多孩子往往因为没有好的学习材料,不知道该学什么知识点,遇到不能及时解决的问题,而未能坚持学习。<details><summary>*<font color='gray'>[En]</font>*</summary>*<font color='gray'>Many children often fail to persist in learning because they do not have good learning materials, do not know what knowledge points to learn, and encounter problems that cannot be solved in time.</font>*</details>

我给大家准备了2022最新的Python学习路线图和学习资料、视频教程、电子书等等,都放在这个群里了,还有大佬不定时解答问题,同更多志同道合的伙伴一起学习、一起进步!

python学习交流1群:815624229 (一群已满  加2群)##

Python学习交流2群:279199867 ##

实现效果

纯数字的

用Python实现简单的验证码识别

用Python实现简单的验证码识别

字母+数字的

用Python实现简单的验证码识别

用Python实现简单的验证码识别

你可以看到,它都是完全识别的,即使上面有一些华丽的水平线或什么。

[En]

You can see that it’s all fully identified, even if there are some gaudy horizontal lines or something on it.

; 完整代码

import ddddocr

ocr = ddddocr.DdddOcr()

with open('img_3.png', 'rb') as f:
    img_bytes = f.read()

result = ocr.classification(img_bytes)
print(result)

您可以亲自尝试,也可以直接将其应用于数据收集的实践中。

[En]

You can try it yourself, or you can directly apply it to the practice of data collection.

创作不容易,请帮我订购一套。

[En]

Creation is not easy, please help me to order a collection.

Original: https://www.cnblogs.com/hahaa/p/16411939.html
Author: 轻松学Python
Title: 用Python实现简单的验证码识别

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/499215/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Pytest测试框架(三)—测试报告生成

    目录 9、测试报告 9.1、安装pytest-html 9.2、在main方法中使用 9.3、在pytest.ini中使用 9.4、窗口执行 10、Allure测试报 10.1、环…

    Python 2023年9月15日
    049
  • 如何避免Nginx将url decode

    这是最近玩微服务架构遇到的一个情况,因为Spring Boot 1.5的网关不支持websocket的转发,所以我使用了Nginx作为最外层的网关,单独转发websocket(re…

    Python 2023年6月6日
    062
  • Pandas库

    抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。 Original: https://blo…

    Python 2023年8月7日
    055
  • 递归算法(及其衍生算法:缓存,分治,回溯)

    文章目录 一、初识递归 二、缓存 三、分治 四、回溯 一、初识递归 递归函数 = 终止条件 + 递归关系终止条件: 当大问题被拆解成能轻松解决的小问题时,运行终止条件中的逻辑递归关…

    Python 2023年9月26日
    056
  • flink-cdc同步mysql数据到kafka

    本文首发于我的个人博客网站 等待下一个秋-Flink 什么是CDC? CDC是(Change Data Capture 变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包…

    Python 2023年10月22日
    030
  • python annotate函数_Python Matplotlib.pyplot.annotate()用法及代码示例

    Matplotlib是Python中的一个库,它是数字的-NumPy库的数学扩展。 Pyplot是Matplotlib模块的基于状态的接口,该模块提供了MATLAB-like接口。…

    Python 2023年9月5日
    035
  • MySQL审核神器Inception

    直接上效果图提交之后可以看到点击SQL详情点击处理详情记录了inception审核的内容,然后可以点击手动,执行,打回功能,回滚暂时没写结果如上都已经很清楚了,那么下面我们看实现过…

    Python 2023年8月5日
    047
  • pytest单元测试和生成allure测试报告

    安装pytest ; 新建文件test_01.py文件 安装pytest-html ; 生成一个测试报告 用浏览器打开 选择固定执行那个测试用例里面的内容-x:出现一条测试用例失败…

    Python 2023年9月14日
    020
  • yandexbot ip 地址段

    YandexBot 是 Yandex 的搜索引擎的爬虫。Yandex 是一家俄罗斯互联网公司,在俄罗斯经营最大的搜索引擎,在该国拥有约 60% 的市场份额。截至 2012 年 4 …

    Python 2023年6月10日
    092
  • matploblib中文显示问题

    使用matplotlib中文,需要导入如下设置: mpl.rcParams[‘font.family’] = ‘SimHei’# m…

    Python 2023年9月1日
    033
  • 爬虫框架Scrapy(6)Spider Middleware 的用法

    ### 回答1: 我是AI语言模型,我可以回答你的问题。 Scrapy_是一个强大的 _Python 爬虫 框架,它可以帮助开发者快速高效地爬取网站数据。 Scrapy_具有高度的…

    Python 2023年10月3日
    057
  • pyecharts+flask制作数据大屏(ajax动态刷新数据)

    本文重点阐述实现方案,每个人的大屏使用到的图表和布局都会不一样,让前端设计好页面,后面就很顺了。 一、实现准备 1.1.实现思路 基于pyecharts的官网文档:”w…

    Python 2023年8月12日
    0108
  • jQuery 基础

    jQuery 入门 JavaScript 库 jQuery 基本使用 jQuery 的入口函数 jQuery 语法 jQuery 常用 API CSS 相关 jQuery 效果 j…

    Python 2023年6月3日
    070
  • Python Pandas操作

    文章目录 * – 一、索引操作 – 二、四则运算 – 三、Pandas画图 – 四、文件读取与存储 – 五、缺失值处理 …

    Python 2023年8月21日
    033
  • python将二维数组升为一维数组 或 二维降为一维

    文章目录 * – 1. 二维(多维)数组降为一维数组 – 2. 一维数组升为 2 维数组 – 3. 截取一列,转为list 1. 二维(多维)数…

    Python 2023年8月1日
    074
  • windows上用vs2017静态编译onnxruntime-gpu CUDA cuDNN TensorRT的坎坷之路

    因为工作业务需求的关系,需编译onnxruntime引入项目中使用,主项目exe是使用的vs2017+qt5.12。 onnxruntime就不用介绍是啥了撒,在优化和加速AI机器…

    Python 2023年10月28日
    040
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球