deepsort训练market1501数据集

2023年7月28日下午1:04 • 人工智能 • 阅读 85

1.market1501数据集简介

Market-1501 数据集在清华大学校园中采集，夏天拍摄，在 2015 年构建并公开。它包括由6个摄像头（其中5个高清摄像头和1个低清摄像头）拍摄到的 1501 个行人、32668 个检测到的行人矩形框。每个行人至少由2个摄像头捕获到，并且在一个摄像头中可能具有多张图像。训练集有 751 人，包含 12,936 张图像，平均每个人有 17.2 张训练数据；测试集有 750 人，包含 19,732 张图像，平均每个人有 26.3 张测试数据。3368 张查询图像的行人检测矩形框是人工绘制的，而 gallery 中的行人检测矩形框则是使用DPM检测器检测得到的。该数据集提供的固定数量的训练集和测试集均可以在single-shot或multi-shot测试设置下使用。

1.1目录结构

1） “bounding_box_test”——用于测试集的 750 人，包含 19,732 张图像，前缀为 0000 表示在提取这 750 人的过程中DPM检测错的图（可能与query是同一个人），-1 表示检测出来其他人的图（不在这 750 人中）
2） “bounding_box_train”——用于训练集的 751 人，包含 12,936 张图像
3） “query”——为 750 人在每个摄像头中随机选择一张图像作为query，因此一个人的query最多有 6 个，共有 3,368 张图像
4） “gt_query”——matlab格式，用于判断一个query的哪些图片是好的匹配（同一个人不同摄像头的图像）和不好的匹配（同一个人同一个摄像头的图像或非同一个人的图像）
5） “gt_bbox”——手工标注的bounding box，用于判断DPM检测的bounding box是不是一个好的box

1.2命名规则
以 0001_c1s1_000151_01.jpg 为例
1） 0001 表示每个人的标签编号，从0001到1501；
2） c1 表示第一个摄像头(camera1)，共有6个摄像头；
3） s1 表示第一个录像片段(sequece1)，每个摄像机都有数个录像段；
4） 000151 表示 c1s1 的第000151帧图片，视频帧率25fps；
5） 01 表示 c1s1_001051 这一帧上的第1个检测框，由于采用DPM检测器，对于每一帧上的行人可能会框出好几个bbox。00 表示手工标注框

2.数据集划分

由于有1501个行人，因此需要划分成1501个文件夹，每个文件夹下放同一个人的图片，用前751个行人的文件夹做训练集，后750个行人的文件夹做测试集。

2.1划分数据的代码

import os
from PIL import Image
from shutil import copyfile, copytree, rmtree, move

PATH_DATASET = '/home/zqy/Desktop/yolov5-master/nxm_data/crops'  # 需要处理的文件夹
PATH_NEW_DATASET = '/home/zqy/Desktop/yolov5-master/nxm_data/stitches'  # 处理后的文件夹
PATH_ALL_IMAGES = PATH_NEW_DATASET + '/all_images'
PATH_TRAIN = PATH_NEW_DATASET + '/train'
PATH_TEST = PATH_NEW_DATASET + '/test'

定义创建目录函数
def mymkdir(path):
    path = path.strip()  # 去除首位空格
    path = path.rstrip("\\")  # 去除尾部 \ 符号
    isExists = os.path.exists(path)  # 判断路径是否存在
    if not isExists:
        os.makedirs(path)  # 如果不存在则创建目录
        print(path + ' 创建成功')
        return True
    else:
        # 如果目录存在则不创建，并提示目录已存在
        print(path + ' 目录已存在')
        return False

class BatchRename():
    '''
    批量重命名文件夹中的图片文件
    '''

    def __init__(self):
        self.path = PATH_DATASET  # 表示需要命名处理的文件夹

    # 修改图像尺寸
    def resize(self):
        for aroot, dirs, files in os.walk(self.path):
            # aroot是self.path目录下的所有子目录（含self.path）,dir是self.path下所有的文件夹的列表.

            filelist = files  # 注意此处仅是该路径下的其中一个列表
            # print('list', list)

            # filelist = os.listdir(self.path) #获取文件路径
            total_num = len(filelist)  # 获取文件长度（个数）

            for item in filelist:
                if item.endswith('.jpg'):  # 初始的图片的格式为jpg格式的（或者源文件是png格式及其他格式，后面的转换格式就可以调整为自己需要的格式即可）
                    src = os.path.join(os.path.abspath(aroot), item)

                    # 修改图片尺寸到128宽*256高
                    im = Image.open(src)
                    out = im.resize((128, 256), Image.ANTIALIAS)  # resize image with high-quality
                    out.save(src)  # 原路径保存

    def rename(self):

        for aroot, dirs, files in os.walk(self.path):
            # aroot是self.path目录下的所有子目录（含self.path）,dir是self.path下所有的文件夹的列表.

            filelist = files  # 注意此处仅是该路径下的其中一个列表
            # print('list', list)

            # filelist = os.listdir(self.path) #获取文件路径
            total_num = len(filelist)  # 获取文件长度（个数）

            i = 1  # 表示文件的命名是从1开始的
            for item in filelist:
                if item.endswith('.jpg'):  # 初始的图片的格式为jpg格式的（或者源文件是png格式及其他格式，后面的转换格式就可以调整为自己需要的格式即可）
                    src = os.path.join(os.path.abspath(aroot), item)

                    # 根据图片名创建图片目录
                    dirname = str(item.split('_')[0])
                    # 为相同车辆创建目录
                    # new_dir = os.path.join(self.path, '..', 'bbox_all', dirname)
                    new_dir = os.path.join(PATH_ALL_IMAGES, dirname)
                    if not os.path.isdir(new_dir):
                        mymkdir(new_dir)

                    # 获得new_dir中的图片数
                    num_pic = len(os.listdir(new_dir))

                    dst = os.path.join(os.path.abspath(new_dir),
                                       dirname + 'C1T0001F' + str(num_pic + 1) + '.jpg')
                    # 处理后的格式也为jpg格式的，当然这里可以改成png格式    C1T0001F见mars.py filenames 相机ID，跟踪指数
                    # dst = os.path.join(os.path.abspath(self.path), '0000' + format(str(i), '0>3s') + '.jpg')    这种情况下的命名格式为0000000.jpg形式，可以自主定义想要的格式
                    try:
                        copyfile(src, dst)  # os.rename(src, dst)
                        print('converting %s to %s ...' % (src, dst))
                        i = i + 1
                    except:
                        continue
            print('total %d to rename & converted %d jpgs' % (total_num, i))

    def split(self):
        # ---------------------------------------
        # train_test
        images_path = PATH_ALL_IMAGES
        train_save_path = PATH_TRAIN
        test_save_path = PATH_TEST
        if not os.path.isdir(train_save_path):
            os.mkdir(train_save_path)
            os.mkdir(test_save_path)

        for _, dirs, _ in os.walk(images_path, topdown=True):
            for i, dir in enumerate(dirs):
                for root, _, files in os.walk(images_path + '/' + dir, topdown=True):
                    for j, file in enumerate(files):
                        if (j == 0):  # test dataset；每个车辆的第一幅图片
                            print("序号：%s  文件夹： %s  图片：%s 归为测试集" % (i + 1, root, file))
                            src_path = root + '/' + file
                            dst_dir = test_save_path + '/' + dir
                            if not os.path.isdir(dst_dir):
                                os.mkdir(dst_dir)
                            dst_path = dst_dir + '/' + file
                            move(src_path, dst_path)
                        else:
                            src_path = root + '/' + file
                            dst_dir = train_save_path + '/' + dir
                            if not os.path.isdir(dst_dir):
                                os.mkdir(dst_dir)
                            dst_path = dst_dir + '/' + file
                            move(src_path, dst_path)
        rmtree(PATH_ALL_IMAGES)

if __name__ == '__main__':
    demo = BatchRename()
    demo.resize()
    demo.rename()
    demo.split()

运行代码之后，在/home/zqy/Desktop/yolov5-master/nxm_data/stitches生成了train和test文件夹，每个文件夹中有1501个文件夹，每个test的子目录中的文件里都只有一张图片，因此我将所有test目录下的文件全部删除，将train子目录中的752-1501命名的文件夹放入test子目录中。

1.2修改train.py文件

transform_train = torchvision.transforms.Compose([
    torchvision.transforms.Resize((128, 64)),
    torchvision.transforms.RandomCrop((128, 64), padding=4),
    torchvision.transforms.RandomHorizontalFlip(),
    torchvision.transforms.ToTensor(),
    torchvision.transforms.Normalize(
        [0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
])

修改149行的权值文件，以免覆盖原来的权值文件

        torch.save(checkpoint, './checkpoint/ckpt1.t7')

1.3修改model.py

训练集中有751个类别，因此需要修改类别个数为751

class Net(nn.Module):
    def __init__(self, num_classes= 751 ,reid=False): #将num_class修改为自己想要的类别数
        super(Net,self).__init__()
        # 3 128 64
        self.conv = nn.Sequential(
            nn.Conv2d(3,64,3,stride=1,padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(inplace=True),
            # nn.Conv2d(32,32,3,stride=1,padding=1),
            # nn.BatchNorm2d(32),
            # nn.ReLU(inplace=True),
            nn.MaxPool2d(3,2,padding=1),
        )

3.开始训练

3.1修改train.py下的数据集地址

其他参数可使用默认值

parser = argparse.ArgumentParser(description="Train on market1501")
parser.add_argument("--data-dir",default="D:/market1501/stitches",type=str) #修改此处的default  改为自己数据集保存的位置
parser.add_argument("--no-cuda",action="store_true")
parser.add_argument("--gpu-id",default=0,type=int)
parser.add_argument("--lr",default=0.1, type=float)
parser.add_argument("--interval",'-i',default=20,type=int)
parser.add_argument('--resume', '-r',action='store_true')
args = parser.parse_args()

3.2修改epoch数

def main():
    for epoch in range(start_epoch, start_epoch+40): # 代码默认为跑40个epoch，通过修改后面的数字，可以根据自己的需求控制epoch的数目
        train_loss, train_err = train(epoch)
        test_loss, test_err = test(epoch)
        draw_curve(epoch, train_loss, train_err, test_loss, test_err)
        if (epoch+1)%20==0:
            lr_decay()

Original: https://blog.csdn.net/weixin_45459097/article/details/126819099
Author: 凤酱
Title: deepsort训练market1501数据集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/720460/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

DNN（全连接神经网络）

一. DNN网络一般分为三层 1.输入层 2.隐藏层 3.输出层简单网络如下：二.前向传播从第二层开始，每一个神经元都会获得它上一层所有神经元的结果。即每一个 y = wx …

人工智能 2023年6月23日
0057
人工智能导论

人工智能导论人工智能定义及其研究目标人工智能发展历史知识及其表示知识图谱人工智能关键技术机器学习（ML）神经网络与深度学习自然语言处理计算机视觉语音处理人工智…

人工智能 2023年6月1日
00102
R语言-层次分析法–AHP

3.1多准则决策模型将决策问题按目标、评价准则及各备选方案的顺序分解为不同的层次结构，然后用求解的判断矩阵的特征矢量，求得每一层次的各元素对上一层次某元素的优先权重，最后用…

人工智能 2023年7月18日
0058
复现KGAT: Knowledge Graph Attention Network for Recommendation（六）

复现KGAT: Knowledge Graph Attention Network for Recommendation（六）啊，再次感慨，上次写博客已经是十二天前了。。。这回真…

人工智能 2023年6月1日
00103
目标检测中的IoU、GIoU、DIoU与CIoU

什么是IOU？简单来说IOU就是用来度量目标检测中预测框与真实框的重叠程度。在图像分类中，有一个明确的指标准确率来衡量模型分类模型的好坏。其公式为： a c c = P t r…

人工智能 2023年7月12日
00132
【机器学习笔记1】一元线性回归模型及预测

目录什么是线性回归模型？一元线性回归模型问题引入：问题解析：代价函数（损失函数）：代价函数的图像为什么不是最小而是极小值？梯度下降算法梯度下降算法公式（对于一元线…

人工智能 2023年6月15日
0091
轻量级网络之mobilenet_v1详解

轻量级网络之mobilenet_v1详解前言：学习网络结构有一段时间了，记录下mobilenet_v1的结构论文地址：https://arxiv.org/pdf/1704.048…

人工智能 2023年6月16日
0066
一文速学-Pandas索引设置操作各类方法详解+代码展示

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月7日
0053
15分钟带你入门Pandas

Pandas的Series 类似表格中的一个列（column），类似于一维数组，可以保存任何数据类型。 Series 由索引（index）和列组成，函数如下： pandas.Ser…

人工智能 2023年7月8日
00106
目标检测中的损失函数IoU、GIoU、DIoU、CIoU、SIoU

IoU损失函数 IoU损失是目标检测中最常见的损失函数，表示的就是真实框和预测框的交并比，数学公式如下：I o U = ∣ A ∩ B ∣ ∣ A ∪ B ∣ IoU =\frac…

人工智能 2023年6月16日
0055
在window的pycharm里的pytorch框架上使用AMDgpu加速深度学习训练

AMD加速训练介绍 AMD加速深度学习使用dml框架pytorch 软件架构软件架构说明 python3.8版本可用在pycharm里使用说明使用torchvision0…

人工智能 2023年7月23日
0089
Tensorboard安装及使用

TensorBoard 是 TensorFlow 提供的实用工具（utility），可以图形化的显示 computational graph（计算图）。 Tensorboard原本…

人工智能 2023年5月23日
00109
LabVIEW什么时候需要使用DLL封装 Calling External APIs

LabVIEW什么时候需要使用DLL封装所谓封装就是指为另一种软件提供兼容性接口的程序。由于第三方DLL的开发设计通常是为了从C语言（或者其它类似的底层语言）中调用，而不从是La…

人工智能 2023年6月30日
0069
【多智能体感知与协同调度】

多智能体感知与协同调度非结构化场景多智能体网联协同感知与动态决策 * 平台整体实现框架 SLAM建图 hdl 定位障碍物检测局部路径规划与路径跟随上层调度算法 Demo …

人工智能 2023年6月2日
0070
Pytorch中nn.Module中的self.register_buffer解释

self.register_buffer作用解释今天遇到了这样一种用法，self.register_buffer(‘name’,Tensor)，该方法的作…

人工智能 2023年7月5日
00101
Arduino从零开始(0)——介绍与点亮LED

0.前言 Arduino大致由两个要素构成。硬件，Arduino控制板，如Arduino Uno，Arduino Mega2560等这些；软件，Arduino IDE开发环境，通过…

人工智能 2023年6月28日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

deepsort训练market1501数据集

1.market1501数据集简介

2.数据集划分

3.开始训练

大家都在看