强化学习入门——1 基于《深入浅出强化学习——编程实践》

2023年9月24日上午10:34 • Python • 阅读 44

鸳鸯环境类的搭建代码

1.YuanYang_Env.py

import pygame
import random
import numpy as np
from 深入浅出强化学习_编程实践.图片库.Colour_Tipriest import *

class YuanYangEnv:
    def __init__(self):
        self.states = []
        for i in range(100):
            self.states.append(i)
        self.actions = ['e', 's', 'w', 'n']
        self.gamma = 0.8
        self.value = np.zeros((10, 10))
        self.viewer = None
        self.FPSCLOCK = pygame.time.Clock()
        # 屏幕大小
        self.screen_size = (1200, 900)
        self.bird_position = (0, 0)
        self.limit_distance_x = 120
        self.limit_distance_y = 90
        self.obstacle_size = [120, 90]
        self.obstacle1_x = []
        self.obstacle1_y = []
        self.obstacle2_x = []
        self.obstacle2_y = []
        self.bird_male_init_position = [0, 0]
        self.bird_male_position = [0, 0]
        self.bird_female_init_position = [1080, 0]

        for i in range(8):
            self.obstacle1_x.append(360)
            # 第一个障碍
            if i = self.limit_distance_x or min_dy >= self.limit_distance_y:
                flag1 = 0
        # 判断第二个障碍物
        second_dx = []
        second_dy = []
        for i in range(8):
            dx2 = abs(self.obstacle2_x[i] - state_position[0])
            second_dx.append(dx2)
            dy2 = abs(self.obstacle2_y[i] - state_position[1])
            second_dy.append(dy2)
            min_dx = min(second_dx)
            min_dy = min(second_dy)
            if min_dx >= self.limit_distance_x or min_dy >= self.limit_distance_y:
                flag2 = 0

            if flag1 == 0 and flag2 == 0:
                flag = 0
            # 判断是否与边界碰撞
            if state_position[0] > 1080 or state_position[0] < 0 or \
                    state_position[1] > 810 or state_position[1] < 0:
                flag = 1
            return flag

    def find(self, state_position):
        flag = 0
        if abs(state_position[0] - self.bird_female_init_position[0]) < self.limit_distance_x and \
                abs(state_position[1] - self.bird_female_init_position[1]) < self.limit_distance_y:
            flag = 1
        return flag

    def state_to_position(self, state):
        i = int(state / 10)
        j = state % 10
        position = [0, 0]
        position[0] = 120 * j
        position[1] = 90 * i
        return position

    def position_to_state(self, position):
        i = position[0] / 120
        j = position[1] / 90
        return int(i + 10 * j)

    def reset(self):
        # 随机产生初始状态
        #global state
        flag1 = 1
        flag2 = 1
        state = self.states[int(random.random() * len(self.states))]
        while flag1 == 1 or flag2 == 1:
            # 产生一个不违法的随机位置
            state = self.states[int(random.random() * len(self.states))]
            state_position = self.state_to_position(state)
            flag1 = self.collide(state_position)
            flag2 = self.find(state_position)
        return state

    def transform(self, state, action):
        #将当前状态转化为坐标
        current_position = self.state_to_position(state)
        next_position = [0,0]
        flag_collide = 0
        flag_find = 0
        #判断当前坐标是否与障碍物碰撞
        flag_collide = self.collide(current_position)
        #判断是否到达终点
        flag_find = self.find(current_position)
        if flag_find==1 or flag_collide==1:
            return state, 0, True
        #状态转移
        if action =='e':
            next_position[0] = current_position[0] +120
            next_position[1] = current_position[1]
        if action =='s':
            next_position[0] = current_position[0]
            next_position[1] = current_position[1] + 90
        if action =='w':
            next_position[0] = current_position[0] -120
            next_position[1] = current_position[1]
        if action =='n':
            next_position[0] = current_position[0]
            next_position[1] = current_position[1] - 90
        #判断 next_state 是否障碍物相碰撞
        flag_collide = self.collide(next_position)
        if flag_collide==1:
            return self.position_to_state(current_position), -1 , True
        #判断 next_state 是否是终点
        flag_find = self.find(next_position)
        if flag_find ==1:
            return self.position_to_state(current_position),  1 , True

        return self.position_to_state(current_position),  0 , True

    def gameover(self):
        for event in pygame.event.get():
            if event.type == pygame.QUIT:
                exit()

    def render(self):
        if self.viewer is None:
            pygame.init()
            #画一个窗口
        self.viewer = pygame.display.set_mode(self.screen_size, 0, 32)
        pygame.display.set_caption("鸳鸯")
        #Download picture
        self.bird_male = pygame.image.load("图片库/yuanyang.png")
        self.bird_female = pygame.image.load("图片库/yuanyang.png")
        self.background = pygame.image.load("图片库/背景.jpg")
        self.obstacle = pygame.image.load("图片库/箱子.jpg")
        #在幕布上画图片
        self.viewer.blit(self.bird_male, self.bird_male_init_position)
        self.viewer.blit(self.bird_female, self.bird_female_init_position)
        self.viewer.blit(self.background, (0, 0))
        self.font = pygame.font.SysFont('times', 20)
        #self.viewer.blit(self.background,(0,0))

        #画直线
        for i in range(11):
            pygame.draw.lines(self.viewer, BLACK,  True, ((120*i,0), (120*i,900)) , 1  )
            pygame.draw.lines(self.viewer, BLACK, True, ((0, 90 * i), (1200, 90 * i)) , 1)
            self.viewer.blit(self.bird_female, self.bird_female_init_position)
        #画障碍物
        for i in range(8):
            self.viewer.blit(self.obstacle, (self.obstacle1_x[i], self.obstacle1_y[i]))
            self.viewer.blit(self.obstacle, (self.obstacle2_x[i], self.obstacle2_y[i]))

        #画小鸟
        self.viewer.blit(self.bird_male, self.bird_male_position)
        #画值函数
        for i in range(10):
            for j in range(10):
                surface = self.font.render(str(round(float(self.value[i,j]), 3)), True, BLACK, WHITE)
                self.viewer.blit(surface, (120*i+5, 90*j+70))
        pygame.display.update()
        self.gameover()
        self.FPSCLOCK.tick(30)

if __name__=="__main__":
    yy = YuanYangEnv()
    yy.render()
    while True:
        for event in pygame.event.get():
            if event.type == pygame.QUIT:
                exit()

2.Colour_Tipriest.py

Colors (R, G, B)
BLACK = (0, 0, 0)
WHITE = (255, 255, 255)
RED = (255, 0, 0)
GREEN = (0, 255, 0)
BLUE = (0, 0, 255)
YELLOW = (255, 255, 0)
DarkViolet = (148, 0, 211)
SlateBlue = (106, 90, 205)

Original: https://blog.csdn.net/titan__/article/details/119709931
Author: Tipriest_
Title: 强化学习入门——1 基于《深入浅出强化学习——编程实践》

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/783589/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

idea 配置使用python虚拟环境及Django启动配置

前提：当我们打开一个已经开发好的项目进行开发时，往往需要配置虚拟环境及idea Django的启动配置详细步骤如下：用idea 打开已经创建好的项目，如图所示项目结构如下这时…

Python 2023年8月6日
0046
Pygame(十)作业

Pygame(十)作业随心圆:以鼠标左键点击为圆心,画一个半径50 ,颜色随机的圆需求分析: if event.type == pygame.MOUSEBUTTONDOWN: …

Python 2023年9月25日
0029
Python实现常用的假设检验

Original: https://www.cnblogs.com/123456feng/p/16132444.htmlAuthor: 蚂蚁ailingTitle: Python实…

Python 2023年5月24日
0063
GeoPandas安装保姆级教程

目录一、简介二、geopandas库安装 2.1 相关依赖包下载 2.2 依赖包安装 2.3 geoplot库安装 2.4 geopandas库测试一、简介 geopanda…

Python 2023年8月2日
00109
超硬核！分享9个功能强大却鲜为人知的 Python 工具包!

欢迎关注，专注Python、数据分析、数据挖掘、好玩工具！我们知道 Python 编程简单明了，并且有很多很酷的库和函数，它可以使我们的工作变得更简单。在本文中，我将分享9个…

Python 2023年9月23日
0040
装饰器的多种实现方式

代码实现：上面这种嵌套函数看着着实费劲，所以下面介绍另外两种方式，相对比较快捷易懂代码实现代码实现构造器传入被装饰函数代码实现构造器传入参数代码实现 Original…

Python 2023年10月31日
0044
python消消乐美轮美奂的界面效果【完整源码+详细流程】

效果是这样的 ↓ ↓ ↓ 一、环境要求 windows系统，python3.6+ pip21+ 开发环境搭建地址安装游戏依赖模块 pip install pygame 二、游戏简…

Python 2023年9月17日
0079
Pandas数据类型-DataFrame之创建和访问

DataFrame是一个表格型（类似Excel）的数据结构，它既有行，也有列，每一行的索引为index，每一列的索引为column。同样也可以把DataFrame类型看作是一维的…

Python 2023年8月22日
0049
Pyhton GUI之tkinter组件学习.md

§ Label 描述：标签控件，可以显示文本和位图。语法： w = Label ( master, option, … ) master：框架的父容器 option：可选项，…

Python 2023年11月3日
0028
【Linux】权限管理

👑作者主页：@安度因🏠学习社区：安度因的学习社区📖专栏链接：Linux 文章目录一、shell 命令以及运行原理二、Linux的用户权限 * 1、权限概念引入 2、用户分类…

Python 2023年9月30日
0054
__slots__

在类的层次上定义时，python给实例采用一种更加紧凑的内部表示来管理属性，而非字典，这样，我们只被允许访问__slots__内部的属性这样定义会带来两点好处，然后具体的实践我在…

Python 2023年10月31日
0023
【Python】京东自动下单抢购脚本——双十一购物小技巧

最近种草一款富士📷已久，但限于富士产能，一直都没有等到开放购买，在尝试几次定闹钟到点准时抢购后，果断放弃，于是花了一个周末时间写了一个简易脚本，终于成为一名合格的”富家…

Python 2023年7月31日
00156
python pandas 读取excel 去重某一列_使用Python Pandas读取excel并将列/行隔离到p

下面是我如何绘制大型数据帧的第31行中的数据，将第0行设置为x轴。(更新答案)import pandas as pd import numpy as np import matpl…

Python 2023年8月8日
0048
【PyCharm中文教程 04】运行 Python 的四种方式

1. 设置 Python 解释器 PyCharm 只是提供一个集成开发环境，你在执行 Python 程序时，还是得依赖 Python 解释器。在一台电脑上，可以存在多个版本的 P…

Python 2023年6月6日
0059
numpy和torch函数使用

2、 np.reshape()和torch.view()_dspeia的博客-CSDN博客 3、 torch.max()与numpy.max()函数_xulei_zhai@163….

Python 2023年8月26日
0041
Pygame实战：预防老年痴呆，写个Python小游戏来锻炼大脑！！！

前文有没得跟我同款的小伙伴儿！！！最近感觉我这记忆力有点儿差啊！出门忘记带钥匙、把自己锁门外了，要打电话叫开锁公司……..花了100多心痛！上班之前看…

Python 2023年9月22日
0042

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

强化学习入门——1 基于《深入浅出强化学习——编程实践》

大家都在看