是否可以同时调优多个超参数？如果可以，是否有推荐的顺序或策略

2024年1月6日上午7:55 • 人工智能 • 阅读 61

问题概述

在机器学习任务中，模型的超参数的调优对于模型的性能至关重要。超参数是在模型训练之前设置的参数，不会通过训练过程自动学习得到。常见的超参数包括学习率、正则化系数、层数、宽度等。本次解答的问题是关于是否可以同时调优多个超参数以及是否有推荐的顺序或策略。

介绍

在实践中，同时调优多个超参数是可以的，并且选择合适的顺序或策略对于提高调优过程的效率和结果具有重要作用。本解答将通过网格搜索(Grid Search)和随机搜索(Random Search)两种常用的超参数调优方法，来说明如何同时调优多个超参数。

网格搜索

算法原理

网格搜索是一种通过遍历指定的超参数空间中的所有组合来寻找最佳超参数的方法。它的基本思想是将所有待搜索的超参数组合成一个网格，然后遍历这个网格进行模型训练和评估，最后选择效果最好的一组超参数。

公式推导

假设我们有多个超参数需要调优，超参数的个数为m，每个超参数的候选值的个数分别为$n_1, n_2, …, n_m$，则网格搜索的算法原理如下：

遍历所有超参数的组合：$\forall i_1 \in {1, 2, …, n_1}, i_2 \in {1, 2, …, n_2}, …, i_m \in {1, 2, …, n_m}$
设置当前超参数组合的取值：$h = (h_1^{(i_1)}, h_2^{(i_2)}, …, h_m^{(i_m)})$
使用当前超参数组合进行模型训练和评估，得到性能指标：$J(h_1^{(i_1)}, h_2^{(i_2)}, …, h_m^{(i_m)})$
记录当前组合的性能指标和超参数取值：$score_{(i_1, i_2, …, i_m)} = J(h_1^{(i_1)}, h_2^{(i_2)}, …, h_m^{(i_m)})$
重复步骤2-4，直到遍历完所有超参数组合
选择性能指标最好的超参数组合：$h^ = (h_1^{(i_1^)}, h_2^{(i_2^)}, …, h_m^{(i_m^)})$，其中$(i_1^, i_2^, …, i_m^*) = \arg\max_{(i_1, i_2, …, i_m)} score_{(i_1, i_2, …, i_m)}$

计算步骤

定义超参数空间中每个超参数的候选值
初始化最佳性能指标为一个较小的值，例如负无穷
遍历每个超参数组合，并进行模型训练和评估，记录每个组合的性能指标
选择最佳超参数组合，根据性能指标的大小判断

Python代码示例

from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC
from sklearn.datasets import load_iris

# 加载示例数据集
iris = load_iris()
X = iris.data
y = iris.target

# 定义超参数空间
param_grid = {
 'C': [0.1, 1, 10, 100],
 'gamma': [0.001, 0.01, 0.1, 1]
}

# 定义模型
model = SVC()

# 网格搜索
grid_search = GridSearchCV(model, param_grid=param_grid, cv=5)
grid_search.fit(X, y)

# 输出最佳超参数组合和性能指标
print("Best Parameters: ", grid_search.best_params_)
print("Best Score: ", grid_search.best_score_)

代码细节解释

首先，我们导入了使用的库和示例数据集。然后，我们定义了超参数空间param_grid，其中包含C和gamma两个超参数的候选值。接着，我们定义了一个SVC模型，并使用GridSearchCV进行网格搜索。在调用fit方法进行训练后，我们可以通过best_params_得到最佳超参数组合，通过best_score_得到最佳性能指标。

随机搜索

算法原理

随机搜索与网格搜索类似，它也是在指定的超参数空间中进行搜索。但与网格搜索不同，随机搜索不会遍历所有可能的组合，而是随机采样一定数量的组合进行模型训练和评估。这种随机采样的策略能够在更快的时间内找到较好的超参数组合。

公式推导

随机搜索的算法原理如下：

定义超参数空间以及采样数量：超参数的个数为m，每个超参数的候选值个数分别为$n_1, n_2, …, n_m$，采样数量为N
随机采样N个超参数组合：$\forall i \in {1, 2, …, N}$

2.1 随机选择第一个超参数的候选值：$h_1^{(i)}$

2.2 随机选择第二个超参数的候选值：$h_2^{(i)}$

…

2.m 随机选择第m个超参数的候选值：$h_m^{(i)}$

得到当前超参数组合：$h = (h_1^{(i)}, h_2^{(i)}, …, h_m^{(i)})$

使用当前超参数组合进行模型训练和评估，得到性能指标：$J(h_1^{(i)}, h_2^{(i)}, …, h_m^{(i)})$
记录当前组合的性能指标和超参数取值：$score_{i} = J(h_1^{(i)}, h_2^{(i)}, …, h_m^{(i)})$
重复步骤2-4，直到采样N个超参数组合
选择性能指标最好的超参数组合：$h^ = (h_1^{(i^)}, h_2^{(i^)}, …, h_m^{(i^)})$，其中$i^* = \arg\max_{i} score_{i}$

计算步骤

定义超参数空间中每个超参数的候选值
定义随机采样的次数（采样数量）
初始化最佳性能指标为一个较小的值，例如负无穷
随机采样每个超参数组合，并进行模型训练和评估，记录每个组合的性能指标
选择最佳超参数组合，根据性能指标的大小判断

Python代码示例

from sklearn.model_selection import RandomizedSearchCV
from sklearn.svm import SVC
from sklearn.datasets import load_iris
import numpy as np

# 加载示例数据集
iris = load_iris()
X = iris.data
y = iris.target

# 定义超参数空间
param_dist = {
 'C': np.logspace(-3, 2, 100),
 'gamma': np.logspace(-3, 2, 100)
}

# 定义模型
model = SVC()

# 随机搜索
random_search = RandomizedSearchCV(model, param_distributions=param_dist, cv=5, n_iter=10)
random_search.fit(X, y)

# 输出最佳超参数组合和性能指标
print("Best Parameters: ", random_search.best_params_)
print("Best Score: ", random_search.best_score_)

代码细节解释

和之前的示例类似，我们导入了需要的库和示例数据集。接着，我们定义了超参数空间param_dist，并使用RandomizedSearchCV进行随机搜索。在调用fit方法进行训练后，我们可以通过best_params_得到最佳超参数组合，通过best_score_得到最佳性能指标。

结论

在机器学习任务中，可以同时调优多个超参数。网格搜索对于超参数空间较小的情况比较适用，它可以遍历所有可能的组合来寻找最佳超参数组合。随机搜索则适用于超参数空间较大的情况，它可以通过随机采样的方式在较短的时间内找到较好的超参数组合。根据具体任务和超参数空间的大小，选择适合的超参数调优方法可以提高调优效率和结果的准确性。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824223/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

手把手教你使用LabVIEW OpenCV DNN实现手写数字识别（含源码）

@ 前言一、OpenCV DNN模块 1.OpenCV DNN简介 2.LabVIEW中DNN模块函数二、TensorFlow pb文件的生成和调用 1.TensorFlow2…

人工智能 2023年6月3日
0097
神经网络参数的学习-损失函数与梯度下降

神经网络参数的学习-损失函数与梯度下降 * – 一、训练数据和测试数据 – 二、损失函数 – + 2.1 均方误差 + 2.2 交叉熵损失 + …

人工智能 2023年7月13日
0048
L0、L1、L2、group lasso、trace LASSO范数

范数机器学习模型中，常加入惩罚项（结构风险），防止过拟合。 L0范数 L0范数指向量中非零元素的个数，直观上来说使用L0范数即想让模型参数为零的元素尽可能的多，或者说是为了参数稀…

人工智能 2023年6月17日
0084
chromium的下载和编译，必须要梯子

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月30日
0046
IOS OpenGL ES GPUImage 图像显示亮度最高的像素,其他为黑 GPUImageNonMaximumSuppressionFilte

目录一.简介二.效果演示三.源码下载四.猜你喜欢零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录>>OpenGL ES 基础…

人工智能 2023年6月20日
00162
Opencv的基本使用和示例图片、视频

文章目录一、认识Opencv 二、安装Opencv 三、使用示例（图片）四、使用示例（视频） * 1、虚拟机获取摄像头权限 2、播放视频 3、录制视频。五、参考资料一、认识…

人工智能 2023年7月19日
0076
MATLAB函数

im2gray im2bw 和 imbinarize 将图片转换为二值图在 matlab2018 中建议用 imbinarize 来将图片转换为二值图，其参数必须为灰度图。 img…

人工智能 2023年6月22日
0070
NNDL 实验四线性分类基于Logistic回归的二分类任务、基于Softmax回归的多分类任务和基于Softmax回归完成鸢尾花分类任务

pytorch实现第3章线性分类 3.1 基于Logistic回归的二分类任务使用到的第三方库 import matplotlib.pyplot as plt from …

人工智能 2023年6月16日
0065
深度学习小记 – 正则化，优化器，线性回归，逻辑斯蒂回归

线性回归推导过程我们假设 θ \theta θ 与 b b b 为模型参数，X X X 为输入数据的特征，y y y 为输入数据的目标值（标签），η \eta η 为学习率 ∂ L…

人工智能 2023年6月18日
0076
TRANSFORMER TRANSDUCER: A STREAMABLE SPEECH RECOGNITION MODELWITH TRANSFORMER ENCODERS AND RNN-T

题目： TRANSFORMER TRANSDUCER: A STREAMABLE SPEECH RECOGNITION MODEL WITH TRANSFORMER ENCODER…

人工智能 2023年7月13日
0055
PyTorch 轻松节省显存的小技巧

如今的深度学习发展的如火如荼，相信各行各业的大家都或多或少接触过深度学习的知识。相信很多人在跑模型时都见过以下语句： RuntimeError: CUDA out of memor…

人工智能 2023年7月22日
0044
思维图形化：探索如何重塑知识？

我们学习到的某一个领域的知识，很少会孤立存在的。当我们有意识地去发掘的时候，便会惊讶地发现：它们之间存在联系。这也就是我写这一篇文章的目的，尝试去建立对于思维图形化的推理过程。显然…

人工智能 2023年6月1日
0074
用opencvSharp实现在任意多边形内寻找最大的内接正交矩形

用opencvSharp实现在任意多边形内寻找最大的内接正交矩形之前写过一篇在任意多边形内寻找近似最大的内接正交矩形，但不怎么符合工作要求，于是再认真看了看之前那篇文章，最后总算…

人工智能 2023年6月20日
0085
【数字图像处理】灰度图像中添加高斯噪声、椒盐噪声、斑点噪声以及利用不同方法（中值、排序、维纳滤波）去除各种噪声的matlab程序

图像处理问题描述： 1、图像中分别加入不同方差的高斯噪声、不同噪声密度椒盐噪声和不同方差的斑点噪声（Gaussian noise, salt & pepper noise …

人工智能 2023年6月18日
0092
py文件生成exe步骤（包含应对闪退现象）

步骤： 1-安装pyinstaller pip install pyinstaller 2-安装之后，找到自己要生成的py文件所在的文件夹目录下，输入cmd， pyinstalle…

人工智能 2023年7月19日
0046
TransE模型-数据预处理

数据集采用FB15K，下面代码中的文件分别为： file1：训练集，格式为（head，relation，tail） /m/027rn /location/country/form_…

人工智能 2023年6月1日
0052

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

是否可以同时调优多个超参数？如果可以，是否有推荐的顺序或策略

问题概述

介绍

网格搜索

算法原理

公式推导

计算步骤

Python代码示例

代码细节解释

随机搜索

算法原理

公式推导

计算步骤

Python代码示例

代码细节解释

结论

大家都在看