【强化学习】手把手教你实现游戏通关AI(1)——游戏界面实现

2023年9月21日上午12:47 • Python • 阅读 40

系列文章目录

在本系列文章中笔者将手把手带领大家实现基于强化学习的通关类小游戏，笔者将考虑多种方案，让角色顺利通关。

完整代码已上传至github：https://github.com/TommyGong08/RL_shoot_game

【强化学习】手把手教你实现游戏通关AI(1)——游戏界面实现

【强化学习】手把手教你实现游戏通关AI(2)——Q-Learning

文章目录

系列文章目录
游戏界面展示
*
界面代码
界面代码解析
–
- step函数
- draw_map函数
总结

游戏界面展示

在本游戏中，笔者将游戏界面抽象成带有颜色的方格，游戏的目标就是让AI学习一条从起点到终点的最优路径。

红色——主角
绿色——终点
紫色——障碍物（怪兽）
灰色——墙

; 界面代码

game.py

import pygame
import sys
import time
monster = [33, 37]
start_position = 97
step = 50
target = 4

wall = [107, 0, 1, 2, 3, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 19, 29, 39, 49, 59, 69, 79, 89, 99, 91, 92, 93, 94, 95, 96, 98]
kill_wait_time = 2
is_killed = False

class Mygame():
    def __init__(self):
        super(Mygame, self).__init__()
        self.action_space = ['u', 'd', 'l', 'r']
        self.n_actions = len(self.action_space)

        self.size = width, height = 500, 500
        self.screen = pygame.display.set_mode(self.size)

        self.background_color = (255, 255, 255)
        self.person = start_position
        self.monster = [33, 37]
        self.draw_map()

    def draw_map(self):
"""
        :param person:当前人的位置
        :param monster: 当前怪兽的位置
        :return:
"""

        rect = [0] * 110
        self.screen.fill(self.background_color)
        for i in range(10):
            for j in range(10):
                curr_rect = 10 * i + j
                if target == curr_rect:

                    rect[curr_rect] = pygame.draw.rect(self.screen, (0, 228, 0), ((j * step, i * step), (step, step)), width=0)
                elif curr_rect in wall:

                    rect[curr_rect] = pygame.draw.rect(self.screen, (192, 192, 192), ((j * step, i * step), (step, step)), width=0)
                elif curr_rect == self.person:

                    rect[curr_rect] = pygame.draw.rect(self.screen, (192, 0, 0), ((j * step, i * step), (step, step)), width=0)
                elif curr_rect in monster:

                    rect[curr_rect] = pygame.draw.rect(self.screen, (138, 43, 226), ((j * step, i * step), (step, step)), width=0)
                else:

                    rect[curr_rect] = pygame.draw.rect(self.screen, (255, 228, 181), ((j * step, i * step), (step, step)), width=1)
        pygame.display.update()

    def judge_win(self):
"""
        如果人到达终点， 则胜利
        :return: True or False
"""
        if self.person == target and is_killed == True:
            return True
        else:
            return False

    def reset(self):
        self.person = 97
        self.monster = [33, 37]
        print(self.person)
        return self.person, self.monster

    def judge_collision(self, temp_person):
        """判断人是否碰撞到墙或怪物"""
        if temp_person in wall or temp_person in monster or temp_person < 0:
            return True
        else:
            return False

    def kill_monster(person, monster, time):
"""
        人静止两秒且怪物在攻击范围内才能杀死怪物
        人的攻击范围是：
        :param person:人当前的位置
        :param monster: 怪兽当前的位置
        :return: 返回怪兽坐标， 如果杀死怪兽了返回[-1, -1]
"""
        if time < kill_wait_time:

            return monster
        attack_area = [person-1, person-2, person-3, person, person + 1, person+2, person + 3,\
                   person-13, person-12, person - 11, person - 10, person - 9, person - 8, person -7,\
                   person-23, person-22, person - 21, person - 20, person - 19, person - 18, person -17,\
                   person+13, person+12, person + 11, person + 10, person + 9, person + 8, person + 7]
        if monster[0] in attack_area and monster[1] in attack_area:
            print("kill monster!")
            return [-1, -1]
        else:
            return monster

    def step(self, action):

        s = self.person

        if action == 0:
            s_ = s - 10
            is_collision = self.judge_collision(s_)
            if is_collision:
                s_ = s
        elif action == 1:
            s_ = s + 10
            is_collision = self.judge_collision(s_)
            if is_collision:
                s_ = s

        elif action == 2:
            s_ = s + 1
            is_collision = self.judge_collision(s_)
            if is_collision:
                s_ = s

        elif action == 3:
            s_ = s - 1
            is_collision = self.judge_collision(s_)
            if is_collision:
                s_ = s

        if s_ == target:

            reward = 1
            done = True

            s_ = 'terminal'
            print("通关，好棒!")
        elif s_ in monster:

            reward = -1
            done = True

            s_ = 'terminal'
            print("Fight with monster!")
        else:

            reward = 0

            done = False
        return s_, reward, done

界面代码解析

定义一个游戏类，类中包含游戏行为action，游戏窗口大小，游戏方格颜色等参数。

step函数

step函数——负责更新状态以及获得奖励。执行action后先判断是否能碰撞，不会碰撞玩家才能进行移动。如果下一个状态s_是目标（绿色格子），获得奖励reward=1。如果下一个状态s_是障碍物reward = -1，其余状态下reward = 0。

draw_map函数

根据当前人的位置、障碍物、怪兽、目标的位置画出界面。
界面上的每个方格对应了一个数字如图所示，初始化110个格子，当然，由于界面的大小设计的是10*10，因此，没有让100以后的格子显示出来。107设为墙的意思是防止玩家在初始位置就向下移动。

上述代码中我们定义了一个list用于记录墙的位置，一个list用于记录怪兽的位置：

wall = [107, 0, 1, 2, 3, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 19, 29, 39, 49, 59, 69, 79, 89, 99, 91, 92, 93, 94, 95, 96, 98]
monster = [33, 37]

总结

本文先讲述了基于pygame的通关游戏界面实现。下文中，我们将介绍采用强化学习Q-learning算法实现AI的自动通关。

Original: https://blog.csdn.net/weixin_43794327/article/details/119493554
Author: TommyGong08
Title: 【强化学习】手把手教你实现游戏通关AI(1)——游戏界面实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/781331/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

手把手教你玩转 Gitea｜在 Windows 系统上安装 Gitea

Gitea 支持在 Windows 系统上安装和使用。Gitea 本身作为一个单体应用程序，即点即用，如需长期驻留作为后台服务并开机运行就要依靠 Windows 服务工具 sc.e…

Python 2023年10月19日
0035
文件太乱了？不要慌，教你用Python全自动整理

文件太乱了？不要慌，教你用Python全自动整理到对应分类中~ 主要知识点文件读写基础语法字符串处理循环遍历素材先来看看我这乱七八糟的文件这就看起来乱七八糟了，这要…

Python 2023年11月2日
0030
30个Python小游戏，上班摸鱼我能玩一天【内附源码】

大家好，我是辣条。今天给大家带来30个py小游戏，一定要收藏！目录有手就行 1、吃金币 2、打乒乓 3、滑雪 4、并夕夕版飞机大战 5、打地鼠简简单单 6、小恐龙 7、消消…

Python 2023年10月10日
0034
Scrapy入门到放弃01：开启爬虫2.0时代

前言 Scrapy is coming！！在写了七篇爬虫基础文章之后，终于写到心心念念的Scrapy了。Scrapy开启了爬虫2.0的时代，让爬虫以一种崭新的形式呈现在开发者面前…

Python 2023年10月6日
0027
Python 设计模式：适配器模式

适配器模式是一种结构型设计模式，它能使接口不兼容的对象能够相互合作。通过组合对象的方式来创建新功能。什么是适配器适配器帮助我们使两个不兼容的接口兼容。这到底是什么意思呢？…

Python 2023年5月25日
0088
WinUI（WASDK）项目实践——优雅的开发上位机应用（新）

摘要这就是一个记录自己进行WinUI项目实践的博客，项目开源地址如下，觉得有帮助的可以去看看，因为项目都开源了，所以保姆级的讲解肯定不如直接看代码来的实在了。电子脑壳项目地址 …

Python 2023年10月23日
0041
深度学习炼丹-数据预处理和增强

一，数据增强概述二，opencv 图像增强-几何变换三，pytorch 图像增强四，imgaug 图像增强参考资料一，数据增强概述数据增强（也叫数据扩增）的目的是为了扩…

Python 2023年10月29日
0047
Python Pytest 自动化测试框架搭建

文件目录如下所示然后分别介绍每个文件夹下的文件内容 assertion.py 封装的断言casefiletemplate.py 用于根据 params 文件夹下的测试数据文件自动…

Python 2023年9月9日
0042
Python（数据分析篇）— Pandas框架【一】DataFrame数据创建以及元素的增删改查

pandas主要分为如下几个阶段：首先，导入相应模块 import pandas as pd import numpy as np dataframe是一种表格型数据结构，拥有a…

Python 2023年8月7日
0053
Numpy库中einsum函数用法

【导读】 einsum全称Einstein summation convention（爱因斯坦求和约定），又称为爱因斯坦标记法。能够计算任何维度的张量收缩。einsum的写法省去…

Python 2023年8月29日
0027
pygame2 画点线

一、复习：首先将上次画的矩形做复杂一些的小程序： import pygame,sys, random pygame.init() screen = pygame.display….

Python 2023年9月18日
0034
【数据库课程设计】SQLServer数据库课程设计（学生宿舍管理），课设报告+源码+数据库关系图

数据库课程设计——学生宿舍管理，需要全部源码可以关注私信我，把邮箱发在评论区前言一、课题背景和开发环境 * 1、课题背景 2、开发环境二、系统功能及示意图 * 1、系统实现功…

Python 2023年9月16日
0043
npz、npy数据集文件转换图片

1、下载下来的数据集是用npz、npy后缀存储的数组：（以npz结尾的数据集是压缩文件） 2、因为使用编辑器打不开文件，进行查阅资料使用npy、npz的原因：在经常性读取大量的数…

Python 2023年8月23日
0044
Python：对程序做性能分析及计时统计

1.对整个程序的性能分析如果只是想简单地对整个程序做计算统计，通常使用UNIX下的 time命令就足够了。 (base) ➜ Learn-Python ti…

Python 2023年10月30日
0029
基于Python pygame简易版斗兽棋小游戏源代码

基于Python pygame简易版斗兽棋小游戏源代码游戏规则如下: 胜利条件: 1.吃掉对方全部棋子 2.走入对方兽穴(不可进入自己洞穴)吃法: 1.象>狮>虎&gt…

Python 2023年9月17日
0045
MySQL经典案例50题

建表、插入数据 CREATE TABLE Student( s_id VARCHAR(20), s_name VARCHAR(20) NOT NULL DEFAULT”, s_b…

Python 2023年10月24日
0040

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【强化学习】手把手教你实现游戏通关AI(1)——游戏界面实现

系列文章目录

文章目录

游戏界面展示

; 界面代码

界面代码解析

step函数

draw_map函数

总结

大家都在看