图像数据预处理

2023年9月28日上午10:28 • Python • 阅读 69

文章

1.下载数据集

首先我们需要先到网上下载猫狗数据集：

&#x732B;&#x72D7;&#x5206;&#x7C7B;&#x6570;&#x636E;&#x96C6;&#x4E0B;&#x8F7D;&#x5730;&#x5740;&#xFF1A;https://pan.baidu.com/s/1i4SKqWH
&#x5BC6;&#x7801;&#xFF1A;d8mt

2.数据集划分

刚开始下载的数据train和test都是猫和狗混合的图片，需要修改一下重新划分一下train和test中的猫和狗分别划分出来。文件结构如下：

|_image
    |_train
        |_dog
        |_cat
    |_test
        |_dog
        |_cat

由于训练时长的问题，这里只用到了2000张图片进行训练，1000图片进行验证。可以自行决定训练和测试数据集的大小。

3.数据预处理代码

代码运行平台为jupyter-notebook，文章中的代码块，也是按照jupyter-notebook中的划分顺序进行书写的，运行文章代码，直接分单元粘入到jupyter-notebook即可。

from keras.preprocessing.image import ImageDataGenerator,array_to_img,img_to_array,load_img

rotation_range是一个0~180的度数，用来指定随机选择图片的角度
width_shift和height_shift用来指定水平和竖直方向随机移动的程度，这是两个0~1之间的比
rescale值将在执行其他处理前乘到整个图像上，我们的图像在RGB通道都是0~255的整数，这样的操作可能使图像的值过高或过低，所以我们将这个值定为0~1之间的数
shear_range是用来进行剪切变换的程度，参考剪切变换
zoom_range用来进行随机的放大
horizontal_flip随机的对图片进行水平翻转，这个参数适用于水平翻转不影响图片语义的时候
fill_mode用来指定当需要进行像素填充，比如旋转、水平和竖直位移时，如何填充新出现的像素

datagen = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    rescale=1./255,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode="nearest"
)

这里我们以一张图片先来演示数据处理的效果：


img = load_img("./image/train/cat/cat.1.jpg")

x = img_to_array(img)

print(x.shape)

x = x.reshape((1,)+x.shape)

print(x.shape)

i = 0

for batch in datagen.flow(x,batch_size=1,save_to_dir='temp',save_prefix="cat",save_format="jpeg"):

    i += 1
    if i>20:
        break

测试的图片：

代码运行结果：

可以看到这个数据增强的效果还是不错的哈！

Original: https://blog.csdn.net/booze_/article/details/125661216
Author: booze-J
Title: 图像数据预处理

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/786442/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Flask # 部署与生产环境

Flask自带的开发服务器不适合用作生产环境。不论哪种托管方案，应用安装到生产服务器上之后都要执行一系列的任务，其中包括创建和更新数据库表。如果每次都手动操作会很麻烦，因此编写p…

Python 2023年8月11日
0072
UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb1 in position 36: invalid start byte

解决Python中pandas读取.csv文件出现编码问题Error in sitecustomize; set PYTHONVERBOSE for traceback:NameE…

Python 2023年8月9日
0039
关于日志流量监控预警小小项目 | flask

前半部分架构已经实现了后半部分 Filebeat装在nginx存在的机器里面 Nginx网站只是为了模拟环境产生日志 flask：是python里面比较出名的web框架主要是…

Python 2023年8月10日
0070
一键自动化数据分析！快来看看 2022 年最受欢迎的 Python 宝藏工具库！ ⛵

💡 作者：韩信子@ShowMeAI📘 数据分析◉技能提升系列：https://www.showmeai.tech/tutorials/33📘 数据分析实战系列：https://ww…

Python 2023年10月29日
0047
Java agent 使用详解

一、前言于一个即将上线的应用来说，系统监控是必不可少的，为什么需要监控呢？应用是跑在服务器上的，应用在运行过程中会发生各自意想不到的问题，像大家熟知的OOM，mysql故障，服务…

Python 2023年10月9日
0071
目前报错汇总-持续更新

报错： raise AttributeError(‘Unknown property %s’ % k) AttributeError: Unknown pr…

Python 2023年9月3日
0051
进程

1 什么是进程进程是系统进行资源分配和调度的基本单位，进程表示程序正在执行的过程，是’活的’，而程序就是一推躺在硬盘上的代码，是’死的&#82…

Python 2023年11月1日
0061
Python之流程控制

Python 2023年5月24日
0054
Python pandas 替换指定数据

目录 * – 一、构造dataframe – 二、替换指定数据（fillna、isin、replace) – 三、替换函数replace()详解…

Python 2023年8月7日
0061
python 图像平滑去噪（噪声+滤波器）

记录自己用python加opencv实现的图像处理的入门操作，各种平滑去噪滤波器的实现。包括有：产生的椒盐噪声、高斯噪声等等，以及使用的中值滤波、平均滤波、高斯滤波等等。分成了两部…

Python 2023年8月25日
0071
FastAPI（六十七）实战开发《在线课程学习系统》接口开发–用户登陆接口开发

接上一篇文章FastAPI（六十六）实战开发《在线课程学习系统》接口开发–用户注册接口开发。这次我们分享实际开发–用户登陆接口开发。我们先来梳理下逻辑 &…

Python 2023年5月24日
00106
生成随机数的若干种方法

背景：创建账户时我们需要配置初始随机密码，使用手机号注册时需要随机验证码，抽奖活动需要随机点名，俄罗斯方块游戏需要随机出形状。这些案例都在说明一个问题，随机数据很重要！而在 Sh…

Python 2023年10月23日
0028
第四节、Numpy基础知识

一、Numpy读取TXT文本 import numpy as np genfromtxt读取Txt文本，分隔符逗号，读取数据为str类型 world_alcohol = np.ge…

Python 2023年8月25日
0044
Flask–session

文章目录 * – + 3. flask中的session工作机制 + 4. 操作session + 5. Code 3. flask中的session工作机制 flas…

Python 2023年8月12日
0035
【自动化测试】Pytest+Appium+Allure 做 UI 自动化的那些事

文本主要介绍下 Pytest+Allure+Appium 记录一些过程和经历。法主要用了啥: Python3AppiumAllure-pytestPytest Appium 不常…

Python 2023年9月12日
0060
Python编程 pip的安装与使用

作者简介：一名在校计算机学生、每天分享Python的学习经验、和学习笔记。 *座右铭：低头赶路，敬事如仪目录前言一.pip的安装与使用 1.pypi仓库 2.pip的介绍 …

Python 2023年9月20日
0043

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

图像数据预处理

文章

1.下载数据集

2.数据集划分

3.数据预处理代码

大家都在看