Web自动化—解决登录页面随机验证码问题

2023年10月16日下午9:51 • Python • 阅读 54

一、抛出问题

在日常的测试工作中，遇到了这样一个登录页面，如下图：

像我们之前做过UI自动化的同学就知道，自动输入账号和密码，这个简单，但是怎么样来识别验证码呢？验证码的形式有多种，有纯数字的，纯字母的，有字母和数字的，有计算的等等；而且每次都是随机出现的，这种情况我们怎么来识别呢？如何解决这个难题？

二、分析问题

在测试环境中，遇到这种情况，分析了一下，大概有以下几种思路：

1、让开发在测试环境中，去掉验证码；

2、测试环境中，设置一个万能的验证码；

3、通过cookie绕过登录；

4、通过自动识别技术，来识别验证码；

对于以上方法，前三种都不太好方便，需要依赖上游，所以，我们尽可能的自己单枪匹马去解决。现在主要来讲第4种方法。

自动识别技术，其实就是通过第三方网站的力量来实现快速识别，花1块钱，就能用500次，有现成的东西，直接借助打码平台的自动识别技术使用就行，少喝一瓶矿泉水的钱，就能帮我们解决大问题。我们这里以某一个打码平台为示例来讲解：

百度搜索：图鉴打码平台，找到结果，并点击进入。

点击开发文档，可以看到导航条可以用多种编程语言将其写好了，这些都是可以直接拿来使用的；我们这里以python语言为例，借助使用一下。但是，需要花钱，也就充值1块钱，就可以用500次。为了，第一步就是要在这个打码平台上进行注册，登录，再充值1元即可。有以下重要信息需要用到：你的账号和密码。

接下来，我们对这段python代码来简单分析一下：

比如，你的验证码是纯数字，你就传1；你的验证码是纯英文，你就传2；如果你的验证码是数字字母混合的，那就传3；像我遇到的，是计算题验证码，我就传了11。

=================================================================

那么，我们先来写一下思路：

第一步：打开浏览器，访问登录页面

1.1启动浏览器

1.2 打开后台监控平台的登录页面

第二步：输入账号、密码

输入账号

输入密码

第三步：识别验证码图片中的内容

3.1截取网站中的验证码图片

3.1.1、对当前网页进行截图,并保存为图片

3.1.2 定位页面的图片元素，

3.1.3 获取图片在页面中的坐标位置(此处计数位置要考虑屏幕的缩放比例)

验证码左边界位置

验证码上边界位置

验证码右边界位置

验证码下边界位置

3.1.4 通过验证码的位置进行截图

3.1.5 保存截取下来的验证码为code.png的图片

3.2 调用验证码识别的方法去识别

第四步：输入识别之后的结果，点击登录

4.1 输入计算结果之后的验证码

4.2点击登录按钮

第五步：关闭浏览器

======================================================================

所以，重点就在第三步，尤其要注意一个细节，就是屏幕缩放比。

如果你忘记这里，有可能对验证码截图截不到。

接下来上代码

from selenium import webdriver
import base64
import json
import requests
from PIL import Image

64位编码流
def base64_api(uname, pwd, img, typeid):
    with open(img, 'rb') as f:
        base64_data = base64.b64encode(f.read())
        b64 = base64_data.decode()
    data = {"username": uname, "password": pwd, "typeid": typeid, "image": b64}
    result = json.loads(requests.post("http://api.ttshitu.com/predict", json=data).text)
    if result['success']:
        return result["data"]["result"]
    else:
        return result["message"]

第一步：打开浏览器，访问登录页面
1.1启动浏览器
driver = webdriver.Chrome()
1.2 打开后台监控平台的登录页面
driver.get('')

第二步：输入账号、密码
输入账号
driver.find_element_by_xpath('//input[@placeholder="账号"]').send_keys('')
输入密码
driver.find_element_by_xpath('//input[@placeholder="密码"]').send_keys('')

第三步：识别验证码图片中的内容
3.1截取网站中的验证码图片
3.1.1、对当前网页进行截图,并保存为page.png的图片
driver.save_screenshot('page.png')
3.1.2  定位页面的图片元素，
pic_ele = driver.find_element_by_xpath('//div//img')
3.1.3 获取图片在页面中的坐标位置(此处计数位置要考虑屏幕的缩放比例)
rec = pic_ele.rect
验证码左边界位置
left = rec['x'] * 1.50
验证码上边界位置
top = rec['y'] * 1.50
验证码右边界位置
right = (rec['x'] + rec['width']) * 1.50
验证码下边界位置
button = (rec['y'] + rec['height']) * 1.50
location = (left, top, right, button)

3.1.4通过验证码的位置进行截图
page = Image.open('page.png')
code_pic = page.crop(location)
3.1.5 保存截取下来的验证码为code.png的图片
code_pic.save('code.png')

3.2 调用验证码识别的方法去识别
result = base64_api(uname='', pwd='', img='code.png', typeid=11)
print("识别的结果是：", result)

第四步：输入识别之后的结果，点击登录
4.1 输入计算结果之后的验证码
driver.find_element_by_xpath('//input[@placeholder="验证码"]').send_keys(result)

4.2点击登录按钮
driver.find_element_by_xpath('//button[@type="button"]').click()

对代码进行讲解和注意的细节。这个脚本是可以直接复制粘贴拿过去用的

三、总结思路

结尾要简单聊两句：首先，这个打码平台不止一个，还有其他的打码平台的也可以借助使用，也会有类似的开发文档代码，他山之石，可以攻玉，只需花1块钱就可以，任何一个打码平台都行。至于开发文档的语言，也是可以任选的，有的web自动化是python写的，有的是java写的，甚至有的是javascript写的，都行，自由选择即可。

因为，我们基本可以总结出如下思路：

1、任选一个打码平台，注册登录并充值1元

2、进入该平台的开发文档，选择你所用到的编程语言一类，复制粘贴代码

3、把你刚才所充值的平台的账号、密码；传参传进去，对应的typeid也改一下

4、检查你的电脑屏幕缩放比例，在所对应的坐标位置代码块中乘以比例

最后，在pycharm，run一下，会给你期望的惊喜那般，哇塞，贼6

好了，以上就是很简单很实用并且性价比极高的解决方法，不需要跟开发吵架，让他特意为了方便你测试，故意改代码块；也不需要跟着学习其他深度的OCR识别技术，太耗时了，还不一定学的会；我们就选择这种单枪匹马的思路，干就完事了。

亲自有效，有任何问题，可留言，笔者可通过向日葵远程连接你电脑，帮你操作好。

Original: https://www.cnblogs.com/xj-excellent/p/16842398.html
Author: excellent_1
Title: Web自动化—解决登录页面随机验证码问题

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/799781/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

火爆出圈的OpenAI模型ChatGPT体验

1、ChatGPT简要介绍 ChatGPT是一种高效的语言模型，全称为”聊天式自动回复生成技术”（Chat-based Automatic Reply Ge…

Python 2023年9月16日
0088
基于yolov5框架实现人流统计（目标检测算法、目标追踪算法以及越界识别功能）+手机获取统计人数

主要实现的AI算法有：目标检测、目标追踪主要实现AI算法功能：越界识别功能（主要是获取统计人流量）平台：基于Aidlux平台基础库安装：（1）lap安装：先sudo ap…

Python 2023年9月26日
0054
Python实现电影订票系统

Original: https://www.cnblogs.com/123456feng/p/16122194.htmlAuthor: 蚂蚁ailingTitle: Python实…

Python 2023年11月3日
0033
深度残差网络（ResNet）之ResNet34的实现和个人浅见

深度残差网络（ResNet）之ResNet34的实现和个人浅见一、残差网络简介残差网络是由来自Microsoft Research的4位学者提出的卷积神经网络，在2015年的I…

Python 2023年9月7日
0062
字典(dict)

4.7 字典(dict) 字典是Python中一种非常重要的数据类型。字典和之前的列表、元组不同，里面的元素使用 键-值对进行存储。通常…

Python 2023年11月1日
0048
双十一福利！爬取电商平台商品详情！买东西我们只买优质产品！

嗨，兄弟们晚上好啊！下午上完京东，晚上再试试淘宝。剁手之路永不停歇！ [En] After climbing JD.com in the afternoon, we will t…

Python 2023年5月25日
0076
数据分析之matplotlib—折线图学习笔记

Conda环境安装： conda create –name python3 python=3 windows :activate python3 linux/macos : so…

Python 2023年9月2日
0063
python开发工具pycharm使用简介

pycharm是一款常用的python开发工具，功能十分强大，并且多平台支持（Windows/MacOS/Linux），官方提供社区开源版本：pycharm Community免费…

Python 2023年8月13日
0066
kaggle房价预测-回归模型

目录 1 项目背景 2 初始数据分析目标值分析特征与目标值相关性变量特征相关性 3 数据预处理目标变量正态分布化异常值处理缺失值处理转换特征保存训练集和测试集 4 …

Python 2023年8月30日
0044
【机器学习】李宏毅——Transformer

Transformer具体就是属于Sequence-to-Sequence的模型，而且输出的向量的长度并不能够确定，应用场景如语音辨识、机器翻译，甚至是语音翻译等等，在文字上的话…

Python 2023年10月28日
0032
git的学习

在这里可以推荐一个git的练习网址：https://learngitbranching.js.org/。里面有git的命令学习和git在团队中使用的模拟实战，个人感觉还行，不过要是…

Python 2023年6月11日
0070
python中循环值的处理

以python 3为例关于循环中经常出现赋值问题的几个形式(要赋值的变量a，循环变量b)就比如for i in range(n): 相对于b来说1：a += b —&#…

Python 2023年10月30日
0026
由系统函数求零极点图、频率响应(幅频特性、相频特性)的 Matlab 和 Python 方法

由系统函数求零极点、频率响应(幅频特性、相频特性)的 Matlab 和 Python 方法 Author: Sijin Yu 文章目录由系统函数求零极点、频率响应(幅频特性、相频…

Python 2023年8月2日
0041
Flask 文章模块

获取文章详情接口设计 “猜你喜欢”数据由推荐系统提供 “广告”数据由广告系统提供 /app/articles/<arti…

Python 2023年8月12日
0047
Pytest—-caplog的应用场景以及使用方法

如何在测试用例中设置日志级别通过caplog可以对特定的测试函数内设置日志级别，而不影响全局的日志级别，比如如下，首先在pytest.ini中开启实时日志。 [pytest] l…

Python 2023年9月13日
0024
python实现井字棋

参考学习：Python实现井字棋游戏闲扯井字棋(Tic-Tac-Toe)，初高中进行打发时间的一种画x画o的游戏，3*3的格子组成，一方把行列斜行连成相同的就算获胜。那么怎么…

Python 2023年8月1日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Web自动化—解决登录页面随机验证码问题

一、抛出问题

二、分析问题

三、总结思路

大家都在看