yolov5超级详细教程（包含win10的错误解决方案）

2023年7月12日上午6:12 • 人工智能 • 阅读 60

一、下载yolov5

https://github.com/ultralytics/yolov5

git clone也可以，下载压缩包解压缩也可以
得到我们的yolov5文件夹

二、准备我们的权重文件和数据集

在D:\jestonnano\yolov5\data\scripts下有相应下载的文件，运行即可下载
或者在网上下载相应的coco128.zip数据集和yolov5权重

将权重文件放在yolov5下，然后在yolov5下创建文件夹dataset,把coco128放入

三、配置对应的环境

1.&#x8FD0;&#x884C;&#x547D;&#x4EE4;
pip install -r requirements.txt

2.&#x6216;&#x8005;&#x624B;&#x52A8;&#x4E0B;&#x8F7D;
base ----------------------------------------
matplotlib>=3.2.2
numpy>=1.18.5
opencv-python>=4.1.2
Pillow
PyYAML>=5.3.1
scipy>=1.4.1
torch>=1.7.0
torchvision>=0.8.1
tqdm>=4.41.0

logging -------------------------------------
tensorboard>=2.4.1
wandb

plotting ------------------------------------
seaborn>=0.11.0
pandas

export --------------------------------------
coremltools>=4.1
onnx>=1.9.0
scikit-learn==0.19.2  # for coreml quantization

extras --------------------------------------
Cython  # for pycocotools https://github.com/cocodataset/cocoapi/issues/172
pycocotools>=2.0  # COCO mAP
albumentations>=1.0.3
thop  # FLOPs computation

四、设置训练集

在yolov5/data下，以coco128.yaml举例
我们可以看到代码：


path: ../datasets/coco128
train: images/train2017
val: images/train2017
test:

nc: 80
names: ['person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck', 'boat', 'traffic light',
        'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep', 'cow',
        'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee',
        'skis', 'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard',
        'tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
        'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'couch',
        'potted plant', 'bed', 'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote', 'keyboard', 'cell phone',
        'microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear',
        'hair drier', 'toothbrush']

download: https://github.com/ultralytics/yolov5/releases/download/v1.0/coco128.zip

由于我们已经下载了coco128.zip，我们修改代码为

path: ../datasets/coco128
train: images/train2017
val: images/train2017
test:

nc: 80
names: ['person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck', 'boat', 'traffic light',
        'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep', 'cow',
        'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee',
        'skis', 'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard',
        'tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
        'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'couch',
        'potted plant', 'bed', 'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote', 'keyboard', 'cell phone',
        'microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear',
        'hair drier', 'toothbrush']

如果我们要训练我们自己的数据集,我们可以修改训练数据集的路径，nc，names等等
即

train&#xFF1A;&#x6362;&#x6210;&#x4F60;&#x81EA;&#x5DF1;&#x7684;&#x8BAD;&#x7EC3;&#x96C6;&#x5730;&#x5740;
val&#xFF1A;&#x6362;&#x6210;&#x81EA;&#x5DF1;&#x7684;val&#x5730;&#x5740;
nc: &#x6362;&#x6210;&#x4F60;&#x81EA;&#x5DF1;&#x5B9A;&#x4E49;&#x7684;&#x7C7B;&#x522B;&#x7684;&#x6570;&#x91CF;
names&#xFF1A;&#x6362;&#x6210;&#x81EA;&#x5DF1;&#x5B9A;&#x4E49;&#x7684;&#x7C7B;&#x522B;&#x7684;&#x540D;&#x79F0;

怎么定义我们的数据集呢？

模仿coco128,我们要有我们的图片集和标签集
使用 Labelbox和 CVAT工具进行图像标记，将标签导出为darknet格式，×.txt每张图像一个文件(如果图像中没有对象，则不需要×.txt文件)。

txt文件内容有：

&#x6BCF;&#x4E2A;&#x5BF9;&#x8C61;&#x4E00;&#x884C;
&#x6BCF;&#x884C;&#x90FD;&#x662F;class x_center y_center width height&#x683C;&#x5F0F;
&#x6846;&#x5750;&#x6807;&#x5FC5;&#x987B;&#x91C7;&#x7528;&#x5F52;&#x4E00;&#x5316;&#x7684;xywh&#x683C;&#x5F0F;&#xFF08;&#x4ECE;0&#x5230;1&#xFF09;&#x3002;&#x5982;&#x679C;boxes&#x4EE5;&#x50CF;&#x7D20;&#x4E3A;&#x5355;&#x4F4D;&#xFF0C;&#x5212;&#x5206;x_center&#x548C;width&#x5173;&#x4E8E;&#x56FE;&#x50CF;&#x5BBD;&#x5EA6;&#xFF0C;y_center&#x548C;height&#x5173;&#x4E8E;&#x56FE;&#x50CF;&#x9AD8;&#x5EA6;&#x3002;
&#x7C7B;&#x522B;&#x5B9A;&#x4E49;&#x5229;&#x7528;&#x5E8F;&#x53F7;&#xFF0C;&#x4E00;&#x822C;&#x4ECE;0&#x5F00;&#x59CB;&#x3002;
&#x6BCF;&#x4E2A;&#x56FE;&#x50CF;&#x7684;&#x6807;&#x7B7E;&#x6587;&#x4EF6;&#x5E94;&#x8BE5;&#x53EF;&#x4EE5;&#x901A;&#x8FC7;&#x5728;&#x5176;&#x8DEF;&#x5F84;&#x540D;&#x4E2D;&#x7B80;&#x5355;&#x5730;&#x66FF;&#x6362;/images/ *.jpg&#x4E3A;/labels/*.txt&#x6765;&#x5B9A;&#x4F4D;&#x3002;

当然我们也可以去互联网搜索现成的数据集

五、选择模型

在yolov5/models下

有五个模型文件,这里我们以yolov5s.yaml为例子
内容为


nc: 80
depth_multiple: 0.33
width_multiple: 0.50
anchors:
  - [10,13, 16,30, 33,23]
  - [30,61, 62,45, 59,119]
  - [116,90, 156,198, 373,326]

backbone:

  [[-1, 1, Focus, [64, 3]],
   [-1, 1, Conv, [128, 3, 2]],
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],
   [-1, 9, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],
   [-1, 1, SPP, [1024, [5, 9, 13]]],
   [-1, 3, C3, [1024, False]],
  ]

head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],
   [-1, 3, C3, [256, False]],

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],
   [-1, 3, C3, [1024, False]],

   [[17, 20, 23], 1, Detect, [nc, anchors]],
  ]

如果你用的自己的数据集或者其它的数据集，根据你的类别修改nc数值即可

六、开始训练

我们打开train.py,可以看到

def parse_opt(known=False):
    parser = argparse.ArgumentParser()
    parser.add_argument('--weights', type=str, default='yolov5s.pt', help='initial weights path')
    parser.add_argument('--cfg', type=str, default='', help='model.yaml path')
    parser.add_argument('--data', type=str, default='data/coco128.yaml', help='dataset.yaml path')
    parser.add_argument('--hyp', type=str, default='data/hyps/hyp.scratch.yaml', help='hyperparameters path')
    parser.add_argument('--epochs', type=int, default=300)
    parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs')
    parser.add_argument('--imgsz', '--img', '--img-size', type=int, default=640, help='train, val image size (pixels)')
    parser.add_argument('--rect', action='store_true', help='rectangular training')
    parser.add_argument('--resume', nargs='?', const=True, default=False, help='resume most recent training')
    parser.add_argument('--nosave', action='store_true', help='only save final checkpoint')
    parser.add_argument('--noval', action='store_true', help='only validate final epoch')
    parser.add_argument('--noautoanchor', action='store_true', help='disable autoanchor check')
    parser.add_argument('--evolve', type=int, nargs='?', const=300, help='evolve hyperparameters for x generations')
    parser.add_argument('--bucket', type=str, default='', help='gsutil bucket')
    parser.add_argument('--cache', type=str, nargs='?', const='ram', help='--cache images in "ram" (default) or "disk"')
    parser.add_argument('--image-weights', action='store_true', help='use weighted image selection for training')
    parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
    parser.add_argument('--multi-scale', action='store_true', help='vary img-size +/- 50%%')
    parser.add_argument('--single-cls', action='store_true', help='train multi-class data as single-class')
    parser.add_argument('--adam', action='store_true', help='use torch.optim.Adam() optimizer')
    parser.add_argument('--sync-bn', action='store_true', help='use SyncBatchNorm, only available in DDP mode')
    parser.add_argument('--workers', type=int, default=8, help='maximum number of dataloader workers')
    parser.add_argument('--project', default='runs/train', help='save to project/name')
    parser.add_argument('--entity', default=None, help='W&B entity')
    parser.add_argument('--name', default='exp', help='save to project/name')
    parser.add_argument('--exist-ok', action='store_true', help='existing project/name ok, do not increment')
    parser.add_argument('--quad', action='store_true', help='quad dataloader')
    parser.add_argument('--linear-lr', action='store_true', help='linear LR')
    parser.add_argument('--label-smoothing', type=float, default=0.0, help='Label smoothing epsilon')
    parser.add_argument('--upload_dataset', action='store_true', help='Upload dataset as W&B artifact table')
    parser.add_argument('--bbox_interval', type=int, default=-1, help='Set bounding-box image logging interval for W&B')
    parser.add_argument('--save_period', type=int, default=-1, help='Log model after every "save_period" epoch')
    parser.add_argument('--artifact_alias', type=str, default="latest", help='version of dataset artifact to be used')
    parser.add_argument('--local_rank', type=int, default=-1, help='DDP parameter, do not modify')
    parser.add_argument('--freeze', type=int, default=0, help='Number of layers to freeze. backbone=10, all=24')
    opt = parser.parse_known_args()[0] if known else parser.parse_args()
    return opt

这都是可以修改的参数，学习率啥的我们都不用修改，我们只用修改模型路径，权重，batch-size，epoch即可，在yolov5下打开我们的powershell/cmd

python train.py --img 640 --batch-size 16 --epochs 10
                --data data/coco128.yaml 之间空格间隔就行，我是为了美观
                --cfg  models/yolov5s.yaml
                --weights '' 代表从头开始训练
                --weights 'yolov5s.pt' 代表从我们下载的权重即预训练的模型加载开始训练

到这里我们win10的小伙伴可能会遇到一些错误，就是

UnicodeDecodeError: 'gbk' codec can't decode byte .................

这是因为我们open文件的时候txt的编码是utf8
解决方案：

只需要将train.py里面的69行with open(hyp) as f: 改为 with open(hyp,’rb’) as f:，将yolo.py里的86行with open(cfg) as f:也改为with open(cfg,’rb’) as f:即可

然后你就开始慢慢等吧

结束以后在yolov5目录下，使用：

tensorboard --logdir=runs

我们可以可视化我们的结果：

训练完以后会在runs/train/exp/weights下保留两个权重，一个是最好的，一个是最后一次
七、使用训练好的预训练模型进行测试

我们可以看到detect.py:

def run(weights='yolov5s.pt',
        source='data/images',
        imgsz=640,
        conf_thres=0.25,
        iou_thres=0.45,
        max_det=1000,
        device='',
        view_img=False,
        save_txt=False,
        save_conf=False,
        save_crop=False,
        nosave=False,
        classes=None,
        agnostic_nms=False,
        augment=False,
        visualize=False,
        update=False,
        project='runs/detect',
        name='exp',
        exist_ok=False,
        line_thickness=3,
        hide_labels=False,
        hide_conf=False,
        half=False,
        ):

同样我们也只用修改几个地方

python detect.py --source &#x53EF;&#x4EE5;&#x662F;&#x56FE;&#x7247;&#xFF0C;&#x6444;&#x50CF;&#x5934;&#xFF0C;&#x56FE;&#x7247;&#x94FE;&#x63A5;
                 --weights &#x6211;&#x4EEC;&#x521A;&#x521A;&#x8BAD;&#x7EC3;&#x597D;&#x7684;&#x6743;&#x91CD;
                 --device 0

python detect.py --source 0(代表摄像头)
                 --weights runs/train/exp/weights/best.pt
                 --device 0

后面的你们自行测试嘞！

Original: https://blog.csdn.net/qq_45978858/article/details/119686255
Author: Esaka7
Title: yolov5超级详细教程（包含win10的错误解决方案）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/687090/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

(三)大话深度学习编译器中的自动调优·Empirical Search

前面的第一篇”(一)大话深度学习编译器中的自动调优·前言“与第二篇”(二)大话深度学习编译器中的自动调优·DSL与IR“分别介绍了背…

人工智能 2023年6月25日
00106
yolov5模型问题解决SPPF找不到、yolov5smlx.pt文件下载、coco128文件下载、coco128yaml文件更改、coco128数据集not exist、BrokenPipeErro

问题一：运行detect.py 报错：AttributeError: Can’t get attribute ‘SPPF’ on import…

人工智能 2023年7月9日
0076
基于Matlab人脸识别(PCA算法)

摘要随着科技的发展，人类社会的进步，传统身份识别由于容易遗失，容易被破解已不能起到身份识别作用。人们需要更加安全可靠的身份识别技术。而生物特征的独一无二，不易丢失和被复制的特性很…

人工智能 2023年5月28日
0060
关于OpenCV for Python入门-dlib实现人脸检测

Dlib 是用编程语言 C ++编写的通用跨平台软件库。它的设计深受来自契约式设计和基于组件的软件工程的思想的影响。因此，首先也是最重要的是一组独立的软件组件。这是一个加速软件许可…

人工智能 2023年7月17日
0050
ONNX的模型优化与量化细节

layout: posttitle: ONNX的模型优化与量化细节date: 2021-09-21 18:18:48.000000000 +09:00categories: [算法…

人工智能 2023年5月24日
0061
【YOLOV5-5.x源码解读】train.py

这个文件是yolov5的训练脚本。 import argparse import logging import math import os import random impor…

人工智能 2023年7月24日
0044
【注意力机制】Bottom-up and top-down attention for image captioning and visual question answering

文章下载地址：https://arxiv.org/pdf/1707.07998.pdf 代码地址：GitHub – peteanderson80/bottom-up-a…

人工智能 2023年6月20日
00142
Linux安装Anaconda(Anaconda3-2022.10-Linux-x86_64.sh版本)

目录一、Anaconda包安装 1、先通过Xshell链接到Linux服务器上 3、上传Anaconda安装包 4、通过bash/sh来安装Anaconda安装包二、系统环境设…

人工智能 2023年6月26日
0074
最基本的25道深度学习面试问题和答案

近年来，对深度学习的需求不断增长，其应用程序被应用于各个商业部门。各公司现在都在寻找能够利用深度学习和机器学习技术的专业人士。在本文中，将整理深度学习面试中最常被问到的25个问题和…

人工智能 2023年6月16日
0061
常用的图像处理标准图片汇总

常用的图像处理标准图片汇总在进行图像处理时，有一些常用的图像数据需要用到，这里总结一下这些图像。 1.Lena、Baboon等数据主要包括：Baboon、Barbara、Cam…

人工智能 2023年6月17日
0084
绘图

import numpy as np import pandas as pd import matplotlib.pyplot as plt pandas和seaborn绘图折线…

人工智能 2023年7月8日
0055
云GPU（恒源云）训练的具体操作流程

简介这篇博客主要讲一下怎么使用云服务器上的GPU跑程序，主要是一些设置和操作步骤，具体的训练步骤可以看我的另一篇博客。以下步骤可能会有遗漏，也可能和你们有一些差别，有什么问题可…

人工智能 2023年7月26日
00167
rolabellmg可计算角度的标注工具(旋转数据标注)

先附上代码GitHub地址：https://github.com/cgvict/roLabelImg 一.进入rolabellmg编辑界面下载代码后，首先创建anaconda环境…

人工智能 2023年7月12日
0043
第一章 UCI数据集wine.data主成分分析PCA

文章目录前言一、什么是PCA？二、PCA算法流程二、使用步骤 * 1.引入库 2.读入数据 3.数据标准化（规范化） 4.主成分分析PCA 5.PCA可视化总结（拓展） …

人工智能 2023年6月19日
00134
关于OpenCV–C++处理音视频的学习01

Opencv作为优秀的图像视频处理模块库系统，如今在音视频开发上也正绽放异彩，闲暇之余不如学习音视频开发吧 在这里…

人工智能 2023年7月19日
0055
vue2.6 + ts 使用vuex

目录 vue2.6 + ts 使用vuex * 安装 01：直接使用 store / index.ts的数据 – store / index.ts main.ts 00…

人工智能 2023年6月27日
00100

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

yolov5超级详细教程（包含win10的错误解决方案）

大家都在看