tensorflow2 tf2 DDPG算法玩立棍小游戏

2023年5月24日下午8:17 • 人工智能 • 阅读 85

DDPG算法就不做过多解读了,就是用来进行连续值预测,本文是使用DDPG进行立棍小游戏,详细过程解读注释在代码中,算法和模型都非常简单,考验的是基础,使用两个全连接模型,相互配合更新,共同让整个模型进步,所以本篇文章不再对算法做过多解释

训练日志 :

观察加权分数,可以看到分数波动是非常剧烈的,但通过多次探索后,会以极快的速度达到游戏设定的满分3000分

加权得分 : 0.995累计奖励 + 0.005 最新奖励

….

…

版本:

python 3.9

tensorflow-gpu 2.6.0

除上述代码意外,其他环境准备

&#x89E3;&#x51B3; tensorflow2 &#x52A0;&#x8F7D;&#x6A21;&#x578B;&#x65F6;&#x62A5;&#x9519;&#x7684;&#x95EE;&#x9898;
pip install keras==2.6.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
&#xA0;
&#x6E38;&#x620F;&#x73AF;&#x5883;&#x5B8C;&#x5584;
pip install gym -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install ale-py &#xA0;-i https://pypi.tuna.tsinghua.edu.cn/simple
pip install gym[accept-rom-license] -i https://pypi.tuna.tsinghua.edu.cn/simple
&#xA0;
&#x5B89;&#x88C5;&#x540E;&#x4F1A;&#x62A5;&#x4E00;&#x4E9B;&#x9519;,&#x4F46;&#x6D4B;&#x8BD5;&#x5DF2;&#x7ECF;&#x53EF;&#x4EE5;&#x8FD0;&#x884C;
pip install gym[all] -i https://pypi.tuna.tsinghua.edu.cn/simple

完整代码:

GitHub – cjs199/ddpg

ddpg // 目录,存储了详细的日志文件
all_model.py // 模型文件
begin.py // 代码执行入口
cjs_util.py // 工具类,主要是处理游戏运行数据,写入日志
env.py // 游戏环境文件
replay_memory.py // 游戏运行数据缓存文件

Original: https://blog.csdn.net/qq_32740973/article/details/123546528
Author: qq_32740973
Title: tensorflow2 tf2 DDPG算法玩立棍小游戏

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/509276/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connec

WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) af…

人工智能 2023年7月22日
00204
python数据表元素不为空值_python 填充空值失败_怎么用 Python 做数据分析实例

01 生成数据表第一部分是生成数据表，常见的生成方法有两种，第一种是导入外部数据，第二种是直接写入数据。 Excel 中的文件菜单中提供了获取外部数据的功能，支持数据库和文本文件…

人工智能 2023年7月9日
0070
图像处理学习笔记-07-小波和多分辨率处理01

背景图像金字塔金字塔底部是图像的高分辨率表示，顶部是低分辨率表示，假设最底部基础级J J J的大小为2 J × 2 J 2^J \times 2^J 2 J ×2 J或N × …

人工智能 2023年6月21日
0051
五、线性回归建模及检验★

线性回归 * – + 1 多元回归假设★★★ + 2 模型检验之残差检验 + * 2.1 查看残差图 * 2.2 解决方案★★ * 2.3 案例：线性回归诊断——模型检…

人工智能 2023年6月17日
0070
机器学习-科学数据库day4

1.pandas常用数据类型（1）Series 一维，带标签数组（2）DataFrame 二维，Series 容器 2.pandas 之Series 切片和索引 t 的输出： …

人工智能 2023年7月8日
0066
【语音隐写】基于matlab GUI DCT音频数字水印嵌入提取【含Matlab源码 837期】

⛄一、离散小波变换的音频信号数字水印技术简介 0 引言近年来, 数字水印技术的作用越来越重要。数字水印技术是将一些标识信息直接嵌入数字载体当中, 或间接表示在信号载体中, 且不影响…

人工智能 2023年5月25日
0060
如何在GPU上运行pytorch程序（正确方法）

用GPU跑pytorch程序就3点： 1.申明用GPU 2.把你的model放到GPU上 3.把数据和标签放到GPU上详细步骤： 1.申明： device=torch.devic…

人工智能 2023年7月13日
0081
修改github上yolo源码实现自建数据集的目标检测任务

本项目自建猫狗数据集，搭建Yolov5，实现猫狗检测一、环境搭建 1.在Anaconda中创建pytorch环境 conda create -n pytorch python=3…

人工智能 2023年6月16日
0073
布隆过滤器

布隆过滤器什么是布隆过滤器布隆过滤器能够实现使用较少的空间来判断一个指定的元素是否包含在一个集合中，布隆过滤器并不保存这些数据，所以只能判断是否存在，而并不能取出该元素。使用…

人工智能 2023年6月29日
00102
OpenCV内部函数cvFindExtrinsicCameraParams2解析（一）

背景介绍在opencv相机标定函数calibrateCamera中，根据标定板上特征点的3D坐标，以及对应的图像2D坐标，计算每个拍摄位置的初始位姿，以便后续的优化求解最终的内、…

人工智能 2023年7月27日
0094
ImportError: cannot import name ‘Literal‘ from ‘typing‘ (D:Anacondaenvstensorflowlibtyping.py)

报错背景：因为安装tensorflow-gpu版本需要，我把原来的新建的anaconda环境（我的名为tensorflow）中的python3.8降为了3.7。在导入seabo…

人工智能 2023年6月17日
0069
【深度学习】AI一键换天

目录 1.实验目标 2.案例内容介绍 3.实验步骤 3.1安装和导入依赖包 3.2设定算法参数 3.3预览一下原视频预览一下要替换的天空图片 3.4定义SkyFilter类 3….

人工智能 2023年6月16日
00100
湖南大学python头歌实训-列表

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月6日
0092
【Image Registration】图像配准综述

文章目录一、图像配准定义二、图像配准应用场景 * 2.1 医学图像领域 2.2 其他领域三、图像配准分类四、图像配准过程 * 4.1 特征检测（Feature detect…

人工智能 2023年5月26日
00104
day01 R语言笔记之向量、数组、因子、列表、数据框

一、向量(vector) 1、向量类型 2、向量元素的命名 3、提取向量子集 4、向量数值类型的转换二、数组（matrix） 1、创建数组 2、数组命名 3、提取数组的子集三、…

人工智能 2023年6月1日
00101
NeRF 源码分析解读（二）

光线的生成由上一章节我们得到了加载到的数据，包括读取图像的数组、图像的高宽焦距、相机的 pose 、以及用于分割测试集、训练集的分割数组。得到这些数据后，我们开始进行生成光线的步…

人工智能 2023年7月27日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

tensorflow2 tf2 DDPG算法玩立棍小游戏

大家都在看