神经网络回归结果评价_浅谈如何利用神经网络原理处理回归结果的抽样问题

2023年6月18日上午11:29 • 人工智能 • 阅读 99

本文可能跟大家普遍认知的机器学习的应用思路有些差异，公认的机器学习的步骤是：数据的探索分析 -> 数据转换和清洗 -> 特征工程选择 -> 特征工程提取 -> 模型训练 -> 调参 -> 应用。本文的思路则是在ML能力没那么强，但对业务比较熟悉的情况下，怎么快速利用机器学习的原理实现回归测试结果的抽样问题，比较适合新手。

本文主要介绍一个利用神经网络原理在导航系统中进行回归测试的具体用例，读者将get到的是：一，机器学习没有那么难，可以从很简单的思路入手；二，换个文本处理的思路。

一问题的提出

如果你是一个需要做回归测试的QA，当面对需要测试的case有好几千条，并且每条case的检查点都有上百个，你会如何将回归测试的结果进行比对？比如下面的例子：

注：左右两面分别是这次和上次的测试结果，红色部分是两次的不同

二模型产生的原因

如果是你，你从哪方面着手呢？我相信大多数人会想到NLP，先将文本信息用NLP特征化，然后提取特征，再选择模型进行训练，等等。

我的实现思路是利用神经网络原理（不是已有的库）+ 业务知识对得到的不同按照特征进行分类，然后从分类结果中根据测试的时间，选择需要检查的case进行手动检验（对于导航来说，自动验证结果是很困难的一件事）。

三具体实现思路

抽取不同

利用工具将两次回归测试的不同找出来，我们当时用的是diff.exe（类似BeyondCompare的功能），结果如下：

利用神经网络原理实现模型

针对这个结果，估计好多人就一头雾水了。下面我介绍下我的思路：

我们的产品是导航产品，其核心算法是静态路网中求解最优路径的启发式算法，最优的含义是路径最优和性能的一种平衡，所以我们当时的测试思想是对核心算法模型的不断优化过程，而不是遵循传统测试的对与错。

对于我们的业务来说，可以将测试结果按照业务来分类，将其作为最后模型的分类结果，每个特征会有很多不同的逻辑，这部分可以根据最后的cost实现。如果是分类，那就会想到用监督学习中的分类方法实现，由于本人当时机器学习的知识有限，只是因为大学时学了神经网络和遗传算法等几个算法，预感用神经网络可行性比较高（有时知识少也许是个优势，因为没有其他选择的时候，就会顺着一条路深入走下去），于是就用神经网络实现了回归测试的case的抽样问题。

模型的代码实现

人工神经网络ANN (Artificial Neural Network) 主要类型有：前向神经网络、反馈神经网络、自组织网络和相互结合型网络等。为了实现的简单易调优，我们采用了采用三层前向神经网络（即含一个隐含层）。因为前馈神经网络简单，不需要误差函数，而且调整误差函数比调整权重要慢得多。

那么怎么用代码来实现神经网络的模型呢？

首先确定四个因素：输入、输出、输入层到隐含层的权重和隐含层到输出层的权重。

输入：回归测试比对的不同

输出：分类结果和每个case的cost

输入层到隐含层的权重：每类的权重

隐含层到输出层的权重：每类中的影响因子（神经元）的权重

其次代码设计思路：

根据业务反推，比如从A变成B，或者从ABC变成CDF，可能是哪种情况出现的，是哪个特征变化影响的，应该分到哪类里，这部分我们将用代码实现，所以需要对业务知识很熟悉，这部分对用户来说不透明，也就是神经网络的代码实现。

权重的设计

输入层到隐含层的权重Wih：当时思考了几天，最后用二分法将特征按重要程度分类，Fx代表特征的种类，即最后的分类。

隐含层到输出层的权重Who：就是每个特征的变化不止一处，而且每处都关联多个因素，根据开发代码把影响每个因素变化的因素找出来，然后把这些因素根据观察回归测试结果和业务知识设置权重并进行归一化。

计算从输入层到输出层的cost，并根据结果进行分类。
用聚类分析方法根据最终的cost大小抽取指定数量的case。因为我们当时有sprint的压力，所以指定的数量是根据Sprint的时间适量抽取case检查。
对回归测试结果进行人工标注，然后根据标注的期望结果和实际结果调整模型，这里需要注意的地方是，我们是同时调整神经网络模型和隐含层到输出层的权重来实现模型调优的。

注：因为分类明确切，且为了使模型简单，输入层到隐含层的权重没进行调整。

四总结

如果没有足够的机器学习知识的情况下，可以换个角度考虑用机器学习+业务知识（或者跟领域专家配合）的方式去实现，所以对于业务知识比较强，而对机器学习新入门的人来说，可能是个不错的开始
以目标为导向，明确利用机器学习解决什么问题，尽量使用简单易用的模型，而不要考虑复杂的，因为机器学习的应用和学术是两个方向。
数学对于机器学习来说重要，但不同的应用场景下，对数学的要求不同，比如对于测试来说，机器学习对数学的要求没那么高，如本文采用的是简单的统计知识、二分法和归一化算法等，所以不要谈数学色变。

参考文章：

更详细的实现请参考：https://mp.weixin.qq.com/s/xJgqK3-NVOANVi5b0M6l9g

通过在ARGO中学到的ML的知识，后面还会思考怎么用机器学习的常规套路去设计回归测试结果的抽样问题。

请关注我们的公众号，ARGO团队后续将带来更多的优秀文章。

Original: https://blog.csdn.net/weixin_35613582/article/details/113453433
Author: 周看看
Title: 神经网络回归结果评价_浅谈如何利用神经网络原理处理回归结果的抽样问题

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/634774/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一篇就够了，各种快捷键

电脑快捷键 window+上下左右箭头，几个窗口同时存在【窗口】+R打开”运行”cmd 【窗口】+E打开”我的电脑” 【窗口】+D…

人工智能 2023年6月28日
0082
CVPR2021论文列表（中英对照）

Scale-Localized Abstract Reasoning 尺度本地化抽象推理How Does Topology Influence Gradient Propagati…

人工智能 2023年6月23日
0078
猿创征文｜openGauss数据库从3.0.0升级到3.1.0操作实践

国产数据库openGauss 9.30日新出了3.1.0版本，想必有些小伙伴已经迫不及待想尝试了吧。之前基于3.0.0版本进行了一些实践，本篇就详细介绍如何将openGauss数据…

人工智能 2023年7月18日
0094
图像ROI区域如何映射到feature map—Mask R-CNN

问题描述某些情况下需要将卷积/池化层后的features map的某些patch映射回原图像，就需要features map怎么变过来的怎么回去。 self.object_det…

人工智能 2023年7月10日
0091
CUDA安装教程

浅谈CUDA和CUDNN windows系统下安装CUDA 和 CUDNN 我真的会谢，之前电脑上有cuda11.0，一直正常使用，无奈有个课程教学使用的10.2，不知为何他的代码…

人工智能 2023年5月23日
00124
什么是标签传播算法？为什么要使用标签传播算法？如何使用？

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月3日
00117
GNN的理解与研究

文章目录一：初识GNN * 1.什么是GNN 2.GNN与CNN、RNN的区别 3.GNN的应用领域二：GNN原理 * – 1.邻接矩阵 2.聚合操作 3.多层迭代…

人工智能 2023年6月17日
0088
5. 使用PyTorch预先训练的模型执行目标检测

使用PyTorch预先训练的网络执行目标检测 PyTorch是什么？使用PyTorch训练第一个神经网络使用PyTorch训练第一个卷积神经网络使用预训练网络进行PyTorc…

人工智能 2023年7月22日
0096
windows下CUDA的卸载以及安装

一、缘由对于CUDA新手来说，安装问题里面有很多需要注意的细节，很多自定义的选项，如果漏选就会出现一些莫名奇妙的问题。为此，会经常出现卸载CUDA，再安装CUDA的问题，下面总结…

人工智能 2023年7月26日
00171
OpenCV4-图像二值化

OpenCV4-图像二值化图像二值化 1.环境配置 OpenCV版本：OpenCV4.1 2.图像二值化二值图像：图像中的像素灰度值无论在什么数据类型中都只有最大值和最小值两种…

人工智能 2023年6月22日
00134
【机器学习】9种回归算法及实例总结，建议学习收藏

我相信很多人跟我一样，学习机器学习和数据科学的第一个算法是线性回归，它简单易懂。由于其功能有限，它不太可能成为工作中的最佳选择。大多数情况下，线性回归被用作基线模型来评估和比较研究…

人工智能 2023年7月26日
0071
Python cv2 (二) 图像的灰度化二值化直方图 mask|均衡

1 灰度化和二值化按照颜色对图像进行分类 – 二值图像：0&amp…

人工智能 2023年7月19日
0088
【python】pandas库入门

1.Series 1.1 Series 类型的创建 import pandas as pd import numpy as np a=pd.Series(4,index=[&quo…

人工智能 2023年7月7日
0092
论文笔记《PYRAFORMER: 用于长期时间序列建模和预测的低复杂度金字塔注意力》

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月17日
0067
【linux环境下安装opencv3.4.5】

在opencv安装前，要先…

人工智能 2023年7月20日
0068
TensorRT教程17：使用混合精度–fp32、fp16、int8（重点）

五种精度类型 kFLOAT kHALF kINT8 kINT32 kTF32 TF32精度 TF32 Tensor Cores 可以使用 FP32 加速网络，通常不会损失准确性。 …

人工智能 2023年7月9日
00102

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

神经网络回归结果评价_浅谈如何利用神经网络原理处理回归结果的抽样问题

大家都在看