深度学习中的超参数调整技术有哪些

2024年1月1日上午6:33 • 人工智能 • 阅读 43

问题：关于深度学习中的超参数调整技术有哪些？

介绍：

在深度学习中，超参数（hyperparameters）是在模型训练过程中需要手动设置的参数，而不是通过模型的学习算法进行自动调整。超参数调整技术旨在找到最佳的超参数组合，以优化模型的性能和泛化能力。本文将介绍几种常见的超参数调整技术，并使用虚拟数据集展示代码实例。

超参数调整技术：

网格搜索（Grid Search）：

网格搜索是最简单且常用的超参数调整技术之一。它通过对预定义的超参数组合进行穷举搜索，并评估模型在每个组合上的性能来确定最佳组合。下面是网格搜索的算法原理：

定义超参数的候选值。例如，对于神经网络的学习率超参数，我们可以定义一组候选值，如[0.001, 0.01, 0.1]。
对所有超参数的组合进行穷举搜索。例如，学习率和批大小的所有组合可能是(0.001, 16), (0.001, 32), (0.01, 16), (0.01, 32)等。
对每个组合训练模型并评估性能。通常使用交叉验证方法来准确评估模型。
根据性能结果选择最佳超参数组合。

随机搜索（Random Search）：

与网格搜索不同，随机搜索在超参数空间中进行随机采样，而不是穷举所有组合。这种方法可以在给定的超参数范围内进行更宽泛的搜索，并且通常在有限的时间内获得更好的结果。下面是随机搜索的算法原理：

定义超参数的候选值和采样次数。例如，学习率的候选值范围为[0.001, 0.1]，采样次数为10。
随机采样超参数组合。例如，学习率的10个随机采样值可能是[0.064, 0.032, 0.075, 0.042, 0.098, 0.012, 0.005, 0.019, 0.083, 0.02]。
对每个组合训练模型并评估性能。
根据性能结果选择最佳超参数组合。

贝叶斯优化（Bayesian Optimization）：

贝叶斯优化是一种通过在超参数空间中使用概率模型来建模和优化目标函数的方法。与网格搜索和随机搜索不同，贝叶斯优化可以在有限的迭代次数内找到最佳超参数组合。下面是贝叶斯优化的算法原理：

定义超参数的先验分布。例如，学习率可以被建模为在[0.001, 0.1]区间上的均匀分布。
建立一个代理模型（surrogate model）来近似目标函数的性能。常用的代理模型包括高斯过程（Gaussian Process）、随机森林（Random Forest）等。
使用代理模型选择下一个超参数组合进行评估。选择的策略可以是最大化期望提升（Expected Improvement）或最小化置信区间（Confidence Bound）等。
对每个组合训练模型并评估性能。
根据性能结果更新代理模型，并选择下一个超参数组合。
迭代执行步骤3-5，直到达到预定的迭代次数或找到最佳超参数组合。

公式推导：

网格搜索无需公式推导。

随机搜索无需公式推导。

贝叶斯优化也无需公式推导。

计算步骤：

使用虚拟数据集生成训练集和测试集。
定义模型结构和目标函数。
选择所需的超参数调整技术（网格搜索、随机搜索或贝叶斯优化）。
定义超参数的候选值或范围。
使用选择的超参数调整技术执行参数搜索。
根据性能指标选择最佳超参数组合。
使用最佳超参数训练模型并评估性能。

复杂Python代码示例：

下面是一个使用贝叶斯优化技术进行超参数调整的Python代码示例：

import numpy as np
from sklearn.datasets import make_classification
from sklearn.model_selection import cross_val_score
from bayes_opt import BayesianOptimization

# 生成虚拟数据集
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)

# 定义目标函数
def target_function(learning_rate, batch_size):
 # 创建模型并训练
 model = create_model(learning_rate=learning_rate, batch_size=int(batch_size))
 scores = cross_val_score(model, X, y, cv=5, scoring='accuracy')
 return scores.mean()

# 定义超参数搜索空间
pbounds = {'learning_rate': (0.001, 0.1), 'batch_size': (16, 64)}

# 使用贝叶斯优化进行超参数调整
optimizer = BayesianOptimization(f=target_function, pbounds=pbounds)
optimizer.maximize(init_points=5, n_iter=10)

# 输出最佳超参数组合和性能
print(optimizer.max)

代码细节解释：

make_classification函数用于生成虚拟数据集。
target_function是目标函数，它根据给定的超参数训练模型并返回交叉验证得分的均值。
pbounds是超参数搜索空间的定义，它指定了每个超参数的最小和最大值。
BayesianOptimization类实例化了贝叶斯优化器，并传入目标函数和超参数搜索空间。
maximize方法执行贝叶斯优化的迭代过程，并选择每次迭代中的下一个超参数组合进行评估。
最后打印输出得到的最佳超参数组合和对应的性能评分。

通过以上步骤和代码示例，我们可以使用贝叶斯优化进行深度学习中超参数调整的实践。尽管示例中使用贝叶斯优化作为演示，但网格搜索和随机搜索的实现思路类似。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/822429/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

跑yolov5又出啥问题了（1）p，r，map全部为0

1.今天在跑的时候遇到了一个比较尴尬的问题在训练时，p，r，map全部为0包括最终结果也是没有precision，recall和map。查询了一圈没有结果考虑的原因很多（以下原因…

人工智能 2023年7月21日
00127
Python 基于卷积神经网络（textCnn）对药品或疾病分类（适用于疾病归一化和药品归一化）

一、卷积神经网络（CNN）复习知识：卷积神经网络（Convolutional Neural Network，CNN）针对全连接网络的局限做出了修正，加入了卷积层（Convolut…

人工智能 2023年7月1日
0094
麻瓜回归！零代码，零基础，全网最傻瓜式的滑块验证码识别训练框架

最新更新 07/31/22 修复了系统用户名和路径名包含中文时授权失败的情况新增了pytorch环境完整性检查（不少用户首次启动安装环境过慢就以为卡死关掉了导致torch运行时不…

人工智能 2023年7月9日
0092
海康威视工业相机SDK二次开发（VS+Opencv+QT+海康SDK+C++）（二）

本文接上次的博客海康威视工业相机SDK二次开发（VS+Opencv+QT+海康SDK+C++）（一），上个博客中并未用到QT，本文介绍项目内容及源码，供大家参考。由于我的项目中是…

人工智能 2023年6月18日
00823
BERT中的Tokenizer说明

预训练BERT的Tokenizer有着强大的embedding的表征能力，基于BERT的Tokenizer的特征矩阵可以进行下游任务，包括文本分类，命名实体识别，关系抽取，阅读理解…

人工智能 2023年5月27日
0078
sklearn使用总结

1.1加载数据 1.2特征工程 1.3训练集与验证集分类 1.4模型训练 1.5验证集预测 1.6模型评估 1.7模型参数调整 1.8模型保存与调用 sklearn 的实现使用了n…

人工智能 2023年7月17日
0083
Python爬虫之Web自动化测试工具Selenium&&Chrome handless

@作者 : SYFStrive @博客首页 : HomePage; 🥧 上一篇续文传送门 📌：个人社区（欢迎大佬们加入） 👉：社区链接🔗 📌：如果觉得文章对你有帮助可以点…

人工智能 2023年7月4日
0066
sklearn逻辑回归:参数详解

一.入参说明 (一)入参分类与使用 (二)入参详细列表二.模型训练三.模型训练后的方法与属性 (一) 方法 (二) 属性本文讲述sklearn逻辑回归参数详解一.入参说明 …

人工智能 2023年6月15日
00142
FPGA用途

FPGA 的用途在介绍 FPGA 的用途之前，先给大家讲一个笑话：话说一个资深工程师出国的时候带了一块 FPGA 开发板。海关问道：”这是什么东西？”…

人工智能 2023年6月20日
0090
知识图谱学习笔记五（知识图谱融合）

知识图谱融合它是解决知识图谱异构问题的有效途径，通过建立异构本体或异构实例之间的联系，使得异构的知识图谱相互沟通，实现它们之间的互操作。知识图谱包含描述抽象知识的本体层和描述具…

人工智能 2023年6月5日
0080
火爆全网的ChatGPT上手体验，文尾免费送账号！

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0060
Ubuntu双显卡切换指示器安装和使用指南

在Ubuntu操作系统下，有时候不知道我们使用了何种显卡，而且某些必要时候我们还需要对工作的显卡进行切换。为了解决这个问题，下面介绍一款双显卡切换指示器。作用就在于，一来它会在桌…

人工智能 2023年6月4日
00112
元数据管理平台

元数据管理平台可分为数据源层、元数据采集层、元数据管理层、元数据应用层四层架构，数据源层企业的元数据来自多个方面： ● 业务系统中的元数据，例如ERP、CRM、SCM、OA等；…

人工智能 2023年7月17日
0051
huggingface.transformers安装教程

由于作者使用PyTorch作为深度学习库，因此本文仅介绍以PyTorch为后端神经网络包情况下transformers包的安装内容。此外，本部分还有 🤗 Datasets 包相关缓…

人工智能 2023年7月5日
0080
pytorch双线性插值

1、单线性插值化简得：重要公式将y视为像素值的函数； ; 2、双线性插值问题：求P点的像素值？ ; 根据单线性插值公式： 1、得到R1和R2点的像素值： ; 2、然后通过R1和…

人工智能 2023年7月21日
0063
树莓派远程连接工具VNC使用教程

树莓派远程连接工具VNC使用教程背景故事树莓派作为一款迷你小主机，大部分的使用场景都会用到远程调试，远程调试用到最多的方式一般就是VNC和SSH，VNC是远程桌面型的远程方式，…

人工智能 2023年6月12日
00111

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31