细粒度分类——数据集制作

2023年7月19日上午11:54 • 人工智能 • 阅读 49

本文为打印机数据集的处理方法，以拍摄条件为25cm、顶光、0°的一组数据集为例。

1.裁剪边框

该方法使用了OCR识别，即对文本资料进行扫描后对图像文件进行分析处理，获取文字及版面信息。

具体流程为：读取图像->预处理(转化为灰度图)->边缘检测->轮廓检测->轮廓近似->透视变换->OCR识别->保存图像

具体代码如下（文件读取为嵌套读取）：

import numpy as np
import cv2
import os

def cv_show(name, img):
    cv2.imshow(name, img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

def resize(image, width=None, height=None, inter=cv2.INTER_AREA):
    dim = None
    (h, w) = image.shape[:2]
    if width is None and height is None:
        return image
    if width is None:
        r = height / float(h)
        dim = (int(w * r), height)
    else:
        r = width / float(w)
        dim = (width, int(h * r))
    resized = cv2.resize(image, dim, interpolation=inter)
    return resized

def order_points(pts):
    # 一共4个坐标点
    rect = np.zeros((4, 2), dtype = "float32")

    # 按顺序找到对应坐标0123分别是 左上，右上，右下，左下
    # 计算左上，右下
    s = pts.sum(axis = 1)
    rect[0] = pts[np.argmin(s)]
    rect[2] = pts[np.argmax(s)]

    # 计算右上和左下
    diff = np.diff(pts, axis = 1)
    rect[1] = pts[np.argmin(diff)]
    rect[3] = pts[np.argmax(diff)]
    return rect

def four_point_transform(image, pts):
    # 获取输入坐标点
    rect = order_points(pts)
    (tl, tr, br, bl) = rect

    # 计算输入的w值，
    widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))
    widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))
    maxWidth = max(int(widthA), int(widthB))

    # 计算输入的h值
    heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))
    heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))
    maxHeight = max(int(heightA), int(heightB))

    # 变换后对应坐标位置
    dst = np.array([
        [0, 0],
        [maxWidth - 1, 0],
        [maxWidth - 1, maxHeight - 1],
        [0, maxHeight - 1]], dtype = "float32")

    # 计算变换矩阵，rect原始近视轮廓和目标轮廓的计算值
    M = cv2.getPerspectiveTransform(rect, dst)
    warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))

    # 返回变换后结果
    return warped

path="E://p"#数据集的地址
rootList = os.listdir(path)

for child in rootList:
    savePath = "E://q"#数据集的保存地址
    childpath=os.path.join(path,child)
    childList=os.listdir(childpath)
    saveDir=os.path.join(savePath,child)

    try:
        # 判断是否已经存在该目录
        if not os.path.exists(saveDir):
            # 目录不存在，进行创建操作
            os.makedirs(saveDir)  # 使用os.makedirs()方法创建多层目录
            print("目录新建成功：" +saveDir)
        else:
            print("目录已存在！！！")
    except BaseException as msg:
        print("新建目录失败：" + msg)

    for item in childList:
        itemPath=os.path.join(childpath,item)
        savePath=os.path.join(saveDir,item)

        image = cv2.imread(itemPath)
        if (itemPath.endswith(".jpg") == True):
            # 得到比例供透视变换使用
            ratio = image.shape[0] / 500
            orig = image.copy()
            # 将原图进行resize处理
            image = resize(orig, height=500)
            # 将图片进行预处理,转为灰度图
            gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
            # 高斯滤波去除噪声
            gray = cv2.GaussianBlur(gray, (5, 5), 0)
            # 进行边缘检测
            edged = cv2.Canny(gray, 75, 100)
            # 轮廓检测
            cnts = cv2.findContours(edged.copy(), cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)[0]
            # 对检测的轮廓进行按照面积排序,并取出前五个
            cnts = sorted(cnts, key=cv2.contourArea, reverse=True)[:5]
            # 遍历轮廓
            for c in cnts:
                # 计算轮廓近似长度
                # C表示输入的点集
                # epsilon表示从原始轮廓到近似轮廓的最大距离，它是一个准确度参数
                # True表示封闭的
                peri = cv2.arcLength(c, True)
                # 算出近似轮廓
                approx = cv2.approxPolyDP(c, 0.02 * peri, True)
                # 4个点的时候就拿出来(即是遍历的第一次)
                if len(approx) == 4:
                    screenCnt = approx
            # 画出轮廓
            cv2.drawContours(image, [screenCnt], -1, (0, 255, 0), 2)
            # 透视变换，转为方正的图像；输入原图，近似图，
            warped = four_point_transform(orig, screenCnt.reshape(4, 2) * ratio)
            # 转为灰度图
            warped = cv2.cvtColor(warped, cv2.COLOR_BGR2GRAY)
            # 阈值处理
            # ref = cv2.threshold(warped, 100, 255, cv2.THRESH_BINARY)[1]
            cv2.imwrite(savePath, warped)
            cv2.waitKey(0)

运行之后，可得到以下效果图

（左图为处理前，右图为处理后）

ps：该处理方法可能会出现部分图片裁剪错误

2.分割数据集

将数据集按训练集和测试集6：1的比例分割，代码如下（文件读取为嵌套读取）：

import os, random, shutil

def copyFile(fileDir,saveDir):
    pathDir = os.listdir(fileDir)
    print(pathDir)# 取图片的原始路径
    filenumber = len(pathDir)
    #rate = 0.01  # 自定义抽取图片的比例，比方说100张抽10张，那就是0.1
    #picknumber = 1  # 按照rate比例从文件夹中取一定数量图片
    sample = random.sample(pathDir, 1)  # 随机选取picknumber数量的样本图片
    #print(sample)
    for name in sample:
        shutil.move(os.path.join(fileDir, name), os.path.join(saveDir, name))
    return

if __name__ == '__main__':
    path = "E://dataset//train//25cm"#数据集路径
    rootList = os.listdir(path)

    for child in rootList:
        savePath = "E://dataset//test//25cm"#测试集保存路径
        childpath = os.path.join(path, child)
       # childList = os.listdir(childpath)
        saveDir = os.path.join(savePath, child)
        try:
            # 判断是否已经存在该目录
            if not os.path.exists(saveDir):
                # 目录不存在，进行创建操作
                os.makedirs(saveDir)  # 使用os.makedirs()方法创建多层目录
                print("目录新建成功：" + saveDir)
            else:
                print("目录已存在！！！")
        except BaseException as msg:
            print("新建目录失败：" + msg)
        copyFile(childpath,saveDir)

3.切割（256×256）

将图片切割成256×256的多张小图片，具体代码如下（文件读取为嵌套读取）：

import cv2
import numpy as np
import random
import os

path="E://p"#数据集地址
rootList = os.listdir(path)
要分割后的尺寸
cut_width = 256
cut_length = 256

for child in rootList:
    savePath = "E://q"#数据集保存的地址
    childpath=os.path.join(path,child)
    childList=os.listdir(childpath)
    saveDir=os.path.join(savePath,child)

    try:
        # 判断是否已经存在该目录
        if not os.path.exists(saveDir):
            # 目录不存在，进行创建操作
            os.makedirs(saveDir)  # 使用os.makedirs()方法创建多层目录
            print("目录新建成功：" +saveDir)
        else:
            print("目录已存在！！！")
    except BaseException as msg:
        print("新建目录失败：" + msg)

    for item in childList:
        itemPath=os.path.join(childpath,item)

        if (itemPath.endswith(".jpg") == True):
            # 读取要分割的图片，以及其尺寸等数据
            picture = cv2.imread(itemPath)
            (width, length, depth) = picture.shape
            # 预处理生成0矩阵
            pic = np.zeros((cut_width, cut_length, depth))
            # 计算可以划分的横纵的个数
            num_width = int(width / cut_width)
            num_length = int(length / cut_length)
            # for循环迭代生成
            for i in range(0, num_width):
                for j in range(0, num_length):
                    name_ID = random.randint(1, 10000000)
                    pic = picture[i * cut_width: (i + 1) * cut_width, j * cut_length: (j + 1) * cut_length, :]
                    result_path = str(name_ID) + '.jpg'
                    savePath=os.path.join(saveDir,result_path)
                   # savePath = os.path.join(saveDir,'{}_{}.jpg'.format(i + 1, j + 1))
                    cv2.imwrite(savePath, pic)
print("done!!!")

4.筛除

由于切割后的数据集中存在白色空白占比过大的图像，对训练产生影响，故将其筛除。

流程为：读取图像->预处理(转化为灰度图)->二值化->计算黑色像素点的占比->移除白色像素点占比大的图像

ps：阈值的选择十分重要，决定了效果的好坏！！！！！

具体代码如下（文件读取为嵌套读取）：

import cv2
import numpy as np
import random
import os
from PIL import Image,ImageFile
from PIL import Image
import numpy as np, pandas as pd
from collections import Counter
import shutil

path="E://dataset//train_256x2561//25cm"#数据集的地址
rootList = os.listdir(path)
for child in rootList:
    childpath=os.path.join(path,child)
    print(childpath)
    childList=os.listdir(childpath)
    os.makedirs(childpath + "_garbage", 0o777, True)
    for item in childList:
        itemPath=os.path.join(childpath,item)

        garbagePath=os.path.join(childpath + "_garbage", item)
        if (itemPath.endswith(".jpg") == True):
            img = cv2.imread(itemPath,cv2.IMREAD_GRAYSCALE)
            x, y = img.shape[:2]
            print(img.shape)

            # 遍历灰度图，阈值大于150变黑
            for i in range(x):
                for j in range(y):
                    #color = random.randint(150, 200)
                    if img[i, j] > 160:
                        img[i, j] = 255
                    else:
                        img[i, j] = 0
            black = 0
            white = 0
            # 遍历二值图，为0则black+1，否则white+1
            for i in range(x):
                for j in range(y):
                    if img[i, j] == 0:
                        black += 1
                    else:
                        white += 1
            rate1 = white / (x * y)
            rate2 = black / (x * y)
            # round()第二个值为保留几位有效小数。
            if rate2

运行之后，可得到以下效果图：

（左图为筛除后的数据集，右图为被筛除的图像）

5.图片重命名

具体代码如下（文件读取为嵌套读取）：

import os

outer_path = 'E://dataset//datasets//25cm//train__256x256'
folderlist = os.listdir(outer_path)  # 列举文件夹

for folder in folderlist:
    inner_path = os.path.join(outer_path, folder)
    total_num_folder = len(folderlist)  # 文件夹的总数
      # 打印文件夹的总数

    filelist = os.listdir(inner_path)  # 列举图片
    i = 1
    for item in filelist:
        total_num_file = len(filelist)  # 单个文件夹内图片的总数
        if item.endswith('.jpg'):
            src = os.path.join(os.path.abspath(inner_path), item)  # 原图的地址
            dst = os.path.join(os.path.abspath(inner_path),  str(i) + '.jpg')  # 新图的地址（这里可以把str(folder) + '_' + str(i) + '.jpg'改成你想改的名称）
            try:
                os.rename(src, dst)
                print
                'converting %s to %s ...' % (src, dst)
                i += 1
            except:
                continue

Original: https://blog.csdn.net/qq_54979098/article/details/126275978
Author: リヴァイ·アクマン
Title: 细粒度分类——数据集制作

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/702785/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Halcon形态学处理-腐蚀、膨胀、开运算、闭运算、顶帽运算和底帽运算

提示：文章参考了网络上其他作者的文章，以及相关书籍，如有侵权，请联系作者。文章目录前言一、腐蚀和膨胀 * 1.腐蚀 2.膨胀二、开运算和闭运算 * 1.开运算 2.闭运算 …

人工智能 2023年6月17日
0087
autoware.auto规划框架介绍

autoware.auto规划框架介绍总框图： ; 分模块简介： behavior_planner是核心节点，将全局路径转化为局部轨迹。相当于管理者，针对不同的场景产生采用不同的…

人工智能 2023年5月26日
0076
矩阵的高斯消去法（Gauss-Jordan方法）的Python实现

高斯消去法的改进形式为Gauss-Jordan Elimination Method，要求每一行的主元素所在列元素全部消去为0，除了主元素本身。区别如图：目录：1 算法讲解 2 …

人工智能 2023年6月4日
0099
基于TensorFlow卷积神经网络与MNIST数据集设计手写数字识别算法

随着数字化的普及和信息技术的发展，在编号处理、数量读取、价格统计等场合，手写数字识别系统的应用需求越来越强烈，如何将数字方便、快速地输入到计算机中已成为关系到计算机技术普及的关键问…

人工智能 2023年5月25日
0078
蚁群聚类算法

%– Unknown date –% else p(:,j)=0; end; if maxp(1)蚁群算法.mat’) matlab7 Ori…

人工智能 2023年6月2日
0077
语音识别入门第一节：语音识别概述

目录语音识别的定义语音识别的重要性语音交互语音识别的挑战性语音识别的发展历史语音识别的深度学习时代现代语音识别框架语料库与工具包语音识别的定义语音识别：Auto…

人工智能 2023年5月23日
0076
Python疫情数据爬取与可视化

使用Python爬取腾讯新闻疫情数据，并使用pyecharts可视化，绘制增长人数地图、柱状图、折线图。文章目录 * – 1.分析网页 – 2.导入模块 …

人工智能 2023年7月7日
0055
在Ubuntu18.04中安装ROS教程

1.创建虚拟机自定义安装，手动选择镜像文件，处理器选择1个处理器，8个核心，其他选择默认的即可。 2.换源新装的虚拟机会提示更新（不是更新系统），建议换完源之后再更新。左下角…

人工智能 2023年6月11日
0090
TensorRT 概述、原理、Linux下安装

聊聊TensorRT 随着传统的高性能计算和新兴的深度学习在百度、京东等大型的互联网企业的普及发展，作为训练和推理载体的GPU也被越来越多的使用。 NVDIA本着让大家能更好地利用…

人工智能 2023年6月28日
00116
头歌平台-人工智能技术应用-实践学习与答案2（补充实训部分）

第1关 LDA算法 import jieba import jieba.analyse as analyse import gensim from gensim import co…

人工智能 2023年6月25日
00119
Python每日一练（牛客网新题库）——第10天：从入门到实践四十招

文章目录 1. 算法描述 2. 算法分析 3. 算法思路 4. 代码实现《100天精通Python》专栏推荐白嫖80g Python全栈视频算法描述猴子第一天摘下若干个桃子，…

人工智能 2023年7月6日
0073
（机器学习-深度学习快速入门）第二章数据分析基本工具Numpy-第四节：Numpy之数组操作

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月11日
0080
python时域波形特征分析

（一）python实现信号时域统计特征提取 https://blog.csdn.net/qq_34705900/article/details/88389319 1.实验数据需求为…

人工智能 2023年7月8日
0085
Python中pandas合并DataFramepd.merge()方法

选择题以下关于pd.merge()方法说法错误的是? A 若缺省how参数：用内连接的方式合并B 若缺省how参数：用外连接的方式合并C how=left：用左连接的方式合并D h…

人工智能 2023年6月11日
00120
图像分类方法总结

图像分类问题描述图像分类问题是计算机视觉领域的基础问题，它的目的是根据图像的语义信息将不同类别图像区分开来，实现最小的分类误差。具体任务要求是从给定的分类集合中给图像分配一个标签…

人工智能 2023年7月25日
0060
Tensorboard的使用—-SummaryWriter类（pytorch版）

tensorboard在pytorch1.1之后就也支持pytorch了 1.tensorboard涉及的类：SummaryWriter 全称是：torch.utils.tenso…

人工智能 2023年7月24日
0045

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

细粒度分类——数据集制作

1.裁剪边框

2.分割数据集

3.切割（256×256）

4.筛除

5.图片重命名

大家都在看