HourNAS: Extremely Fast Neural Architecture Search Through an Hourglass Lens论文笔记

2023年7月14日下午4:31 • 人工智能 • 阅读 47

这是一篇CVPR2021年关于网络架构搜索的论文，比较创新的点是按照块的重要程度来进行架构搜索，实现了效率的提升并且硬件友好。

作者通过观察残差网络，发现一个神经网络之中只有少部分块结构是非常重要的，如下图，如果把神经网络的输入到输出的所有路径都统计出来，发现只有少数块是出现在所有路径中的（例如第一层、最后的全连接层、下采样块和通道扩张块，其他块总会找到替代路径，所以相对来说并没有那么重要。

HourNAS: Extremely Fast Neural Architecture Search Through an Hourglass Lens论文笔记

更具体的，作者在MnasNet和MobileNetV2上分别固定所有层而对一层的通道使用掩码以（0.3，0.6,1.0）的概率进行屏蔽，发现对于不关键的块即使不输出通道也对精度没有太大影响，而对于关键块，即使以0.3的概率屏蔽通道也会是精度下降很多，实验结果如下图：

基于以上结果，作者提出了一个分阶段搜索块结构的算法，第一阶段通过堆叠所有重要层并搜索重要块来构建最小的 SuperNet，使用梯度下降优化架构参数和权重参数。第二阶段固定关键块结构并在计算资源限制下搜索不关键的块。

具体的，作者将架构参数连续化：

其中θ是LxO大小的矩阵，L为层数，O为操作数，

代表采样的架构参数，ζ代表采样函数，可以使用softmax, Gumbel-softmax, Gumbel-Max等，

表示第l层的第o个操作。

使用如下函数衡量采样架构

的FLOPs ：

其中F代表每层每个操作的运算量，是一个LxO的矩阵。

对θ的优化公式：

其中

是FLOPs ，

是一个常数标量，被定义为采样架构的最大FLOPs 。

针对多目标的优化：

构造空间方案：

引入了正交约束，进一步增加了不同空间方案的多样性。

对各个空间方案采样：

其中Ρ可以使用softmax, Gumbel-softmax, Gumbel-Max等。

结合之前的

定义：

最后将NAS的双层优化问题表示为：

其中Τ是对Π和Θ正则化，α 是多目标损失率。

作者通过上式来实现参数的优化，进而搜索到最终架构。

实验结果

作者后面还做了消融实验，发现：

没有资源限制精度会更高，NAS变成了给定资源约束的计算资源分配问题；

关键块优先策略找到更优架构；

Gumbel-Max 采样不减少精度同时减少搜索时间。

以上。

Original: https://blog.csdn.net/weixin_44373865/article/details/123960315
Author: 莫问余年
Title: HourNAS: Extremely Fast Neural Architecture Search Through an Hourglass Lens论文笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692431/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

理解透C语言一维数组，二维数组这一篇就够啦！

前言💖 作者：龟龟不断向前✨ 简介：宁愿做一只不停跑的慢乌龟，也不想当一只三分钟热度的兔子。👻 专栏：C++初阶知识点👻 工具分享：刷题：牛客网 leetcode 笔记软件：有…

人工智能 2023年6月27日
0090
Python爬虫之Scrapy框架（案例练习）

@作者 : SYFStrive @博客首页 : HomePage; 🥧 上一篇续文传送门 📌：个人社区（欢迎大佬们加入） 👉：社区链接🔗 📌：如果觉得文章对你有帮助可以点点关注…

人工智能 2023年6月19日
0089
深度学习环境安装配置中各个软件的关系及作用（Anaconda，Pycharm，Python，库，PyTorch, conda）

对应视频教程：https://www.bilibili.com/video/BV1S5411X7FY/ 文章目录 * – 1. 说说 Python – 2….

人工智能 2023年7月5日
0059
面试官：断网了，还能 ping 通 127.0.0.1 吗？

你女神爱不爱你，你问她，她可能不会告诉你。 ‍ 但网通不通，你 ping 一下就知道了。可能看到标题，你就知道答案了，但是你了解背后的原因吗？那如果把 127.0.0.1 …

人工智能 2023年7月31日
0065
昇腾Ascend 随记 —— 昇腾 AI 的基本架构

文章目录 * – 1. 昇腾AI全栈架构 – + 1.1 昇腾AI全栈的四个大部分 – 2. 异构计算架构 CANN – + 2.1…

人工智能 2023年7月28日
0076
Python实现vlookup的效果

1、需求描述根据姓名匹配出对应的价格，类似vlookup的功能 2、思路使用merge函数，data1和data2相连接，data3即为结果。 3、演示代码 import pa…

人工智能 2023年7月8日
0061
一文通俗讲解元学习（Meta-Learning）

©PaperWeekly 原创 · 作者 |孙裕道学校 |北京邮电大学博士生研究方向 |GAN图像生成、情绪对抗样本生成元学习（meta-learning）是过去几年最火爆的…

人工智能 2023年6月23日
0055
Python数据分析之股票分析

股票分析使用tushare包获取某股票的历史行情数据输出该股票所有收盘比开盘上涨3%以上的日期输出该股票所有开盘比前日收盘跌幅超过2%的日期假如从2010年1月1日开始，每…

人工智能 2023年6月11日
00108
Python 微信自动化工具开发系列01_自动获取微信聊天信息（2022年10月可用）

前言 一个需求 需要利&a…

人工智能 2023年7月5日
0074
PIM—SM理论讲解

PIM SM基本概念 PIM工作步骤 DR竞选 RP基本概念（Bootstrap自举报文） RP的作用 RP的两种类型 RP的缺点 PIM SM建树过程成员接收者到RP建树过程（…

人工智能 2023年6月26日
0099
Pytorch中stack()方法的总结及理解

Torch.stack() 1. 概念在一个新的维度上连接一个张量序列 2. 参数 tensors （sequence）需要连接的张量序列 dim （int）在第dim个维度上连…

人工智能 2023年6月6日
0062
拉格朗日乘子法

周志华《机器学习》如何理解拉格朗日乘子法？介绍 拉格朗日乘&amp…

人工智能 2023年6月15日
00102
【Pandas 基础知识数据修改总结】

目录前言一、数据修改 loc与iloc 1.单值修改修改红方英雄刺客荆轲为李白 2.单行修改修改辅助行为墨子 3.单列修改修改红方伤害为10 4.按条件修改修改蓝方伤…

人工智能 2023年7月7日
0089
[ 数据集 ] MINIST 数据集介绍

🤵 Author ：Horizon Max ✨ 编程技巧篇：各种操作小结 🎇 机器视觉篇：会变魔术 OpenCV 💥 深度学习篇：简单入门 PyTorch 🏆 神经网络篇：经典网络…

人工智能 2023年7月30日
00100
Python实战案例：航班票价预测这样做，效果真好啊

在本文中，我将和大家一起学习将使用机器学习数据集使用基本的探索性数据分析技术分析航班票价预测，然后根据某些特征（例如航空公司的类型、到达时间）得出一些关于航班价格的预测时间，出发时…

人工智能 2023年6月16日
0053
ICLR2022 | GREASE LM: 图推理增强QA上的LM

本文是Christopher D. Manning和Jure Leskovec合作的一篇文章，NLPer和GNNer应该对这两个名字不陌生，一个讲了CS224N，一个讲了CS224…

人工智能 2023年5月28日
0077

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

HourNAS: Extremely Fast Neural Architecture Search Through an Hourglass Lens论文笔记

大家都在看