超参数调优框架optuna（可配合pytorch）

2023年7月26日下午5:20 • 人工智能 • 阅读 67

在深度学习快速发展的今天，对于不同深度学习模型的超参数优化（hyperparameter optimization），始终是一个比较头痛的问题。在超参较少的情况下，grid search是比较常见的方式，但是随着超参数量的不断增多，特别是对于神经网络而言，训练过程的超参和NN本身的超参组成的参数空间是巨大的，grid search方法会消耗巨大的资源，而且效果很差，因此寻找一个”机器炼丹”的框架十分必要。

optuna 是一个十分常用的超参数调优框架，具有操作简单，嵌入式强和动态调整参数空间等优点。另外还有其他框架也可以进行超参优化，如李沐老师提到的automl等。

一、optuna的使用流程

首先需要在命令行 pip install optuna 载入这个第三方库，载入之后import即可。

optuna中需要注意几个关键的名词：
trail:：一次实验
study:：一次学习过程（包括多次实验）

import optuna
def obj(trail):
    x = trail.suggest_float('x',1,5)
    return (x-3)*(x-3)
stu = optuna.creat_study(study_name = 'test', direction = 'minimize')
stu.optimize(obj, n_trials = 50)
print(study.best_params)
print(study.best_trial)
print(study.best_trial.value)

该段实例代码中，函数obj定义一个含参数的需要优化的模块，带调整的超参数为 ‘x’ ，返回值为该模块的 objective value。超参x的类型为float，可调整空间为 [1,5] 左右都闭区间，常用的还有suggest_int表示整型，suggest_categorical表示字符串集合。

trail.suggest_int('name', 10, 50)
trail.suggest_categorical('active', ['relu', 'sigmoid', 'tanh'])

study表示一个学习过程，direction参数为”minimize”表示对函数obj 的返回值（同时也是每次trial的objective value）向最小的方向优化。

二、结果可视化

optuna.visualization中包含了丰富的可视化工具。比较推荐使用的是以下三个：

optuna.visualization.plot_param_importances(stu).show()
optuna.visualization.plot_optimization_history(stu).show()
optuna.visualization.plot_slice(stu).show()

plot_param_importances 展示各个超参数对结果影响的重要性

plot_optimization_history 展示在n_trail 个trail中每次的objective value和当前的最优解

plot_slice 展示每个超参数在所有trail中取值的分布，以散点图的形式

三、pytorch代码使用optuna

在pytorch构建的MLP中进行使用，可以看到该调参框架是十分灵活的，可以设置训练参数，如batchsize，learning rate，也可也设置NN的参数，如隐藏层数目，激活函数类型等。

import torch
from torch import nn, optim
from torch.utils.data import DataLoader
from torch.autograd import Variable

import optuna

def train(batch_size, learning_rate, lossfunc, opt, hidden_layer, activefunc, weightdk,momentum):
    trainset_num = 800
    testset_num = 50

    train_dataset = myDataset(trainset_num)
    test_dataset = myDataset(testset_num)
    train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
    test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=True)

    model = MLP(hidden_layer, activefunc).cuda()

    if lossfunc == 'MSE':
        criterion = nn.MSELoss().cuda()
    elif lossfunc == 'MAE':
        criterion = nn.L1Loss()

    optimizer =optim.RMSprop(model.parameters(),lr=learning_rate,weight_decay=weightdk, momentum=momentum)

    for epoch in range(num_epoches):

        model.train()
        for i, data in enumerate(train_loader):
            inputs, labels, _ = data
            inputs = Variable(inputs).float().cuda()
            labels = Variable(labels).float().cuda()

            out = model(inputs)

            train_loss = criterion(out, labels)
            optimizer.zero_grad()
            train_loss.backward()
            optimizer.step()

    model.eval()

    testloss = test()
    print('Test MAE = ', resloss)
    return resloss

def objective(trail):
    batchsize = trail.suggest_int('batchsize', 1, 16)
    lr = trail.suggest_float('lr', 1e-4, 1e-2,step=0.0001)
    lossfunc = trail.suggest_categorical('loss', ['MSE', 'MAE'])
    opt = trail.suggest_categorical('opt', ['Adam', 'SGD'])
    hidden_layer = trail.suggest_int('hiddenlayer', 20, 1200)
    activefunc = trail.suggest_categorical('active', ['relu', 'sigmoid', 'tanh'])
    weightdekey = trail.suggest_float('weight_dekay', 0, 1,step=0.01)
    momentum= trail.suggest_float('momentum',0,1,step=0.01)
    loss = train(batchsize, lr, lossfunc, opt, hidden_layer, activefunc, weightdekey,momentum)
    return loss

if __name__ == '__main__':
    st=time.time()
    study = optuna.create_study(study_name='test', direction='minimize')
    study.optimize(objective, n_trials=500)
    print(study.best_params)
    print(study.best_trial)
    print(study.best_trial.value)
    print(time.time()-st)
    optuna.visualization.plot_param_importances(study).show()
    optuna.visualization.plot_optimization_history(study).show()
    optuna.visualization.plot_slice(study).show()

Original: https://blog.csdn.net/weixin_45667108/article/details/126879782
Author: Comet*
Title: 超参数调优框架optuna（可配合pytorch）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/717179/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【论文分享】☆☆☆ 异质图神经网络模型 HAN：Heterogeneous Graph Attention Network

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月14日
0091
用LU_ASR语音控制板和Arduinonano做一个桌面老婆(1)

学习一样东西，最好的方式是实践，学Arduino最好的方式就是打造一个自己的作品，这个”桌面老婆”是我边学边做的小玩具，在此记录下，请各位大佬指点。前段时…

人工智能 2023年5月23日
0095
（一）基于知识图谱的医疗问答系统(实例+代码理解)保姆级教程

本篇文章内容来源于刘焕勇老师在Github上的开源项目。https://github.com/liuhuanyong/QASystemOnMedicalKG 如果打不开或者是想要数…

人工智能 2023年7月25日
0062
【youcans 的 OpenCV 例程200篇】147. 图像分割之孤立点检测

欢迎关注『youcans 的 OpenCV 例程 200 篇』系列，持续更新中欢迎关注『youcans 的 OpenCV学习课』系列，持续更新中【youcans 的 Open…

人工智能 2023年6月22日
0094
数据分析实战 – 超市销售数据分析，csv输入输出（附带样本集）

导语：给你这样一份数据，来自收银台记账数据，你能提取什么信息？有多大价值？找出这样的信息需要多久时间？如果使用自动化工具，几十行python代码，能做什么？首先，导入数据集： …

人工智能 2023年6月19日
0089
GCN理解

目录 1.GCN 为何而生 2.GCN 如何发挥作用 * 2.1 GCN概述 2.2 模型定义关于GCN的原文介绍，可以参照github上面GRAPH CONVOLUTIONAL…

人工智能 2023年6月22日
00110
OCR文字识别技术总结（一）

👨‍💻 作者简介： CSDN、阿里云人工智能领域博客专家，新星计划计算机视觉导师，百度飞桨PPDE，专注大数据与AI知识分享。✨ 公众号：GoAI的学习小屋，免费分享书籍、简历、…

人工智能 2023年6月16日
0099
活体检测论文 Face Anti-Spoofing with Human Material Perception 阅读笔记

论文链接：Face Anti-Spoofing with Human Material Perception | SpringerLink 动机现有的 CNN 提取的特征和手工特…

人工智能 2023年7月1日
00101
【深度学习笔记1】-pytorch的dataloader参数shuffle设置true或false

作为一名深度学习的小白，最近在做LSTM预测股票问题，发现训练集的shuffle必须为true而测试集的shuffle必须为false。如果训练集的shuffle不设置为true的…

人工智能 2023年7月21日
0063
huggingface.transformers安装教程

由于作者使用PyTorch作为深度学习库，因此本文仅介绍以PyTorch为后端神经网络包情况下transformers包的安装内容。此外，本部分还有 🤗 Datasets 包相关缓…

人工智能 2023年7月5日
0083
python程序打包

一、windows系统下打包成.exe文件安装打包工具 pip install pyinstaller 执行命令图标path：C:\desktop\icon 文件path：C:…

人工智能 2023年7月6日
0055
成功解决raise AssertionError(“Torch not compiled with CUDA enabled“)AssertionError: Torch not compiled

成功解决raise AssertionError(“Torch not compiled with CUDA enabled”)AssertionError…

人工智能 2023年7月22日
00112
昇腾AI异构计算架构CANN 6.0全新开放升级，全面释放AI生产力

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月28日
0073
总结 | ACL2022主会论文分类整理

大家好，我是对白。 ACL 2022是CCF A类会议，人工智能领域自然语言处理（Natural Language Processing，NLP）方向最权威的国际会议之一。第60届…

人工智能 2023年6月1日
0095
AI绘画生成器推荐AI绘画自动生成器有哪些？

1、DALL-E2 DALL-E2 是由 OpenAI 开发的 AI 图像生成器。只需几分钟，你就可以使用 AI 创建高度逼真的图像。 2、Deep Dream Generator…

人工智能 2023年7月25日
0062
Jupyter 介绍、安装及使用

Jupyter 介绍、安装及使用一.Jupyter介绍 Jupyter Notebook是一个开源的web应用程序，可以使用它来创建和共享包含实时代码、方程、可视化和文本的文档。…

人工智能 2023年7月3日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

超参数调优框架optuna（可配合pytorch）

目录

大家都在看