强化学习与自动驾驶-Deep Reinforcement Learning for Autonomous Driving: A Survey

2023年6月10日下午9:06 • 人工智能 • 阅读 70

最近一直在看用cv的方法进行轨迹预测，大老板说也许可以用强化学习来做，于是读了21年的 “Deep Reinforcement Learning for Autonomous Driving: A Survey” 这篇文章。这里对文章进行了简单的概括分享，作为我之后工作的一个基础，也希望能帮助到同样做自动驾驶的同学。

&#x539F;&#x6587;&#x94FE;&#x63A5;&#xFF1A;https://ieeexplore.ieee.org/document/9351818

监督学习不适合自动驾驶任务

机器学习分为监督学习、非监督学习以及强化学习（RL）。自动驾驶研究是一个解决序列决策的问题，得到的最优行动就等于强化学习中的策略。而监督学习不适用于这类研究，原因如下：

自动驾驶的感知模块（perception module）

以上的这些从感知模块中获得，为中级抽象表示，经过 _Scene Understanding_生成高级动作或决策模块。这个过程包括场景理解、决策以及规划，而且这个过程往往综合了激光雷达、相机以及雷达所获得的信息。

自动驾驶的控制器

控制器基于经典最优控制理论。其从预先确定的地图或专家驾驶记录获得路径上每个点所需的速度，转向角度，制动动作。

强化学习的一些基础概念

应用强化学习可以应用在控制器优化、路径优化、高级驾驶策略开发、交叉口合并与分割策略学习等任务。深度强化学习（DRL）包括状态空间、行动空间和奖励功能。在自动驾驶这个课题下，状态空间就是自己车辆的位置、方向和速度，以及其它障碍物。

已有的自动驾驶（AD）任务

设计自动驾驶的奖励函数仍然是一个非常开放的问题，因为会受速度、人行道等因素的影响。

自动驾驶安全政策

已有系统对失去控制、看不见的障碍物作出反应。此时的外在奖励是专家，内在奖励是预测的误差。用多智能体强化学习（MARL）制定自动驾驶安全策略，可以应用于平衡高速公路上的超车行为，通过没有信号控制的十字路口等。

未来挑战

作者认为多智能体在自动驾驶领域会有更大的发展空间。

Original: https://blog.csdn.net/weixin_44230823/article/details/124338038
Author: 海棠想容
Title: 强化学习与自动驾驶-Deep Reinforcement Learning for Autonomous Driving: A Survey

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/597682/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【计量经济学导论】14. 定性响应回归模型

线性概率模型当我们在用多元线性回归模型去解释一个二值结果时，该模型就成为线性概率模型。为什么是线性概率，我们在后面的分析中便可以看到。对于线性概率模型，其模型设定为：Y = β…

人工智能 2023年6月18日
0070
CCKS2020笔记

李航 – 字节跳动 past: n-gram 马尔可夫 present：预训练模型： RNN Transformer GPT：链式法则 Bert：bidirectio…

人工智能 2023年6月5日
0085
python数据分析入门项目–分析全球五百强的数据

python数据分析入门项目–分析全球五百强的数据这里我用一个简单的简单数据分析入门项目，这里我就先不讲数据数据下载、抓取的问题，我直接给出CSV文件的链接，点击就可以下载。链接…

人工智能 2023年7月7日
0075
android实现语音播报textToSpeech

private void startAuto(String data) { // 设置音调&…

人工智能 2023年5月27日
0068
OpenCV配置教程

文章目录前言一、下载和安装OpenCV SDK 二、配置包含路径三、配置库目录&配置链接器四、配置环境变量五、dll文件复制到system32中六、验证配置结果…

人工智能 2023年5月26日
0088
C++函数知识点（增强版）

目录一、函数的默认参数 1.函数无默认参数情况 2.函数有默认参数的情况 2.1函数参数全是默认参数的情况 2.2函数部分有默认参数的情况 3.注意事项 3.1从左至右，起始位置…

人工智能 2023年6月28日
0067
【建模算法】基于遗传算法求解TSP问题（Python实现）

【建模算法】基于遗传算法求解TSP问题（Python实现） TSP (traveling salesman problem，旅行商问题)是典型的NP完全问题，即其最坏情况下的时间复…

人工智能 2023年7月4日
0071
R语言与临床模型预测——LASSO回归，单因素多因素cox，差异表达分析，Venn图，森林图，列线图，矫正曲线，ROC全套代码及解析——第九部分 lasso回归排除具有共线性的基因本专栏可免费答疑

1.下载数据匹配基因基因去重复 4.匹配临床数据 5.批量cox回归分析 6.差异表达基因筛选 7.取交集，选出预后相关的差异表达基因 8.森林图绘制 9.lasso回归进一步…

人工智能 2023年6月17日
00122
第四章：Unix时间

Unix的时间起点是从1970年1月1日0：0：0开始计算。 (1).time_t 这是一个时间类型，长度一般是64位，记录的是时间的秒数。(2).time函数，返回开始到现在的时…

人工智能 2023年6月26日
0068
OpenStack网络原理和实现

本文详细介绍了Openstack的网络原理和实现，主要内容包括：Neutron的网络架构及网络模型还有neutron虚拟化的实现和对二三层网桥的理解。一、Neutron概述 Ne…

人工智能 2023年6月26日
0074
【mmdetection】绘制训练结果中验证集测试的mAP曲线图

【mmdetection】绘制训练结果中验证集测试的mAP曲线图 mAP可视化工具 * 绘制工具：analyze_logs.py 结果展示 mAP可视化工具在训练模型的时候，我们…

人工智能 2023年7月10日
00159
工厂方法演进

工厂方法演进最近review代码，感觉工厂方法使用的不准确，正好以此为例聊一下工厂方法的演进。实例初始需求假设我们有一个需求，需要根据不同的信号做不同的事情，如做饭、吃饭。…

人工智能 2023年6月27日
0066
李沐《动手学深度学习》d2l——安装和使用

今天想要跟着沐神学习一下循环神经网络，在跑代码的时候，d2l出现了问题，这里记录一下解决的过程，方便以后查阅。李沐《动手学深度学习》d2l——安装和使用安装d2l 解决 Imp…

人工智能 2023年6月23日
0076
Pytorch-工业应用中如何选取合适的损失函数（MAE、MSE、Huber）

正文：无论在机器学习还是深度学习领域中,损失函数都是一个非常重要的知识点。损失函数有许多不同的类型，根据具体模型和应用场景需要选择不同的损失函数，如何选择模型的损失函数，是作为算…

人工智能 2023年7月24日
0097
深度学习中的GPU与CUDA

对应视频教程：https://www.bilibili.com/video/BV1S5411X7FY/ 文章目录 * – 1. 显卡（GPU）与驱动 – 2…

人工智能 2023年7月21日
0081
【知识图谱推理】必读论文推荐

通俗的理解，所谓推理，就是从现有的知识出发，运用逻辑思维能力，得出一些隐性的结论。具体到知识图谱中，所谓的知识推理，就是利用图谱中现有的知识（三元组），得到一些新的实体间的关系或者…

人工智能 2023年6月1日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31