旷世开源yolox的目标检测使用

2023年7月10日下午2:09 • 人工智能 • 阅读 103

如何使用yolox训练自己的目标检测模型

1. 源码的下载，及网络模型的选择

1.1 源码下载

在github官网上搜索yolox，链接

pycharm下yolox的目录结构
旷世开源yolox的目标检测使用

; 1.2 docker下yolox环境的配置

作者做的yolox实验是在docker环境下进行的，想要安装yolox环境可转至：如何使用docker制作深度学习镜像，并参考官方源码中的环境配置自行安装。

yolox对数据集的处理

由于yolox和传统的yolo系列算法不同，yolox可以支持VOC格式的数据。所以此次训练针对于VOC格式数据的训练。

2.1 代码中数据需要处理的部分

在根目录下创建data目录，并将data目录的整体格式修改为如下所示：
选取网络模型
在yolox官网上，我们可以看到yolox有多个网络模型，我们可以根据自己的需要选取自己的网络模型。作者不关心检测的速率问题，只关注与检测的准确问题，所以此次实验采用的是YOLOX-x。

在项目的 exps/example/yolox_voc目录下，复制 yolox_voc_s.py并重新命名为 yolox_voc_x.py。

修改 yolox_voc_x.py中的 num_class、self.depth、self.width:，三个参数其中：
num_class: 为当前训练所需要的类别数
self.depth：为当前网络模型的深度
self.width：为当前网络模型的宽度（也不知道对不对，反正就这样吧）。注意：修改self.depth、self.width时请参考 exps/default下的yolox_x.py

修改完成后的模样如下所示：注意：num_classes一定要修改为自己的类别数目。
训练类别标签的修改
在项目 yolox/data/datasets/voc_classes.py中修改数据集类别，将当前的类别改为自己数据集的类别标签。
数据集查找的代码部分修改。
在第一步中我们给出了数据集的格式和目录结构，在此步骤中需要将这个目录结构填写到代码中，告诉代码数据集的路径。
先修改data_dir:此处的修改只针对于个人项目的路径。
修改image_sets test路径的修改：

注意：作者在文章目标检测-数据处理常用脚本文件已经说明了：非比赛项目，基本不使用test数据，所有的数据因划分为train和val两部分。所以在test环节中我们直接使用val集代替。此处修改的train和val是对应我们的train.txt和val.txt文件。
其他需要修改的地方
打开yolox/data/datasets/voc.py,这里面有个错误。画框位置，将大括号的”%s”去掉，否则验证的时候一直报找不到文件的错误。

; 2.2 配置文件的修改

图像resize尺寸的修改
在yolox/exp/yolox_base.py做如下修改：如果修改了train的图像size，那么val的图像size也要做相应修改。
关于学习率和训练轮次epoch的修改：在yolox/exp/yolox_base.py做如下修改：
关于训练过程中容易出错的多线程修改：在yolox/exp/yolox_base.py中将 data_num_workers修改为0。

预训练权重的下载：在官网上根据自己所选取的网络模型，下载对应的预训练权重。
docker容器的挂载

Docker run --runtime=nvidia --name=&#x5BB9;&#x5668;&#x7684;&#x540D;&#x5B57;
    -v yolox&#x4EE3;&#x7801;&#x7684;&#x8DEF;&#x5F84;/:/&#x6302;&#x8F7D;&#x5230;&#x5BB9;&#x5668;&#x4E2D;&#x7684;&#x540D;&#x5B57;&#xFF08;&#x81EA;&#x5DF1;&#x8D77;&#xFF09;
    -v &#x6570;&#x636E;&#x96C6;&#x7684;&#x8DEF;&#x5F84;/:/&#x6302;&#x8F7D;&#x5230;&#x5BB9;&#x5668;&#x4E2D;&#x7684;&#x540D;&#x5B57;&#xFF08;&#x81EA;&#x5DF1;&#x8D77;&#xFF09;/data/ VOCdevkit/VOC2007
    -i -t &#x955C;&#x50CF;&#x7684;id  /bin/bash

&#x5982;&#xFF1A; docker run --runtime=nvidia --name=test01 -v yolox/:/yolox_test -v datasets/:/yolox_test/data/VOCdevkit/VOC2007 -i -t 123456 /bin/bash

多gpu训练

Python toos/train.py -f exps/example/yolox_voc_x.py -d 8 -b 64 &#x2013;fp16 -c checkpoints/yolox_x.pth

&#x5176;&#x4E2D;&#xFF1A; -d:&#x4E3A;gpu&#x8BAD;&#x7EC3;&#x6570;&#x91CF;
       -f :&#x4E3A;&#x9700;&#x8981;&#x8BAD;&#x7EC3;&#x7684;&#x7F51;&#x7EDC;&#x8DEF;&#x5F84;
       -b: &#x4E3A;&#x7F51;&#x7EDC;&#x8BAD;&#x7EC3;&#x7684;bathsize
       -c: &#x4E3A;&#x9884;&#x8BAD;&#x7EC3;&#x6743;&#x91CD;&#x7684;&#x8DEF;&#x5F84;

&#x6CE8;&#x610F;&#xFF1A;&#x4F5C;&#x8005;&#x5728;&#x8BAD;&#x7EC3;&#x7684;&#x65F6;&#x5019;&#x53D1;&#x73B0;&#xFF0C;&#x6E90;&#x4EE3;&#x7801;&#x53EA;&#x80FD;&#x591F;&#x8F93;&#x51FA;&#x6A21;&#x578B;&#x9A8C;&#x8BC1;&#x7684;ap&#x6307;&#x6807;&#xFF0C;&#x5E76;&#x6CA1;&#x6709;&#x8F93;&#x51FA;recall,&#x6211;&#x4EEC;&#x53EF;&#x4EE5;&#x5728; yolox/data/datasets/voc.py
&#x7684;_do_python_eval&#x51FD;&#x6570;&#x4E2D;&#xFF08;&#x9884;&#x8BA1;&#x5728;313&#x884C;&#x4E2D;&#xFF09;&#x81EA;&#x5DF1;&#x624B;&#x52A8;&#x6253;&#x5370;recall,&#x5982;&#x4E0B;&#x56FE;&#x6240;&#x793A;&#xFF1A;

模型的测试

解释说明：作者通过观察源码发现，yolox官方源码封装较好，并没有给出如何测试多张图片的demo脚本，如果需要测试多张图片需要自己根据源码中的测试单张图片的demo修改，作者自己根据这个脚本修改出一个测试多张图片的脚本，如下所示：

&#x6D4B;&#x8BD5;&#x547D;&#x4EE4;&#xFF1A;python tools/test_mutil_jpg.py image -f exps/default/yolox_s.py -c checkpoints/yolox_s.pth  --conf 0.3 --nms 0.65 --tsize 640 --device gpu
        -f &#xFF1A;&#x4E3A;&#x7B97;&#x6CD5;&#x6A21;&#x578B;
        -c&#xFF1A;&#x4E3A;&#x6743;&#x91CD;&#x6240;&#x5728;&#x8DEF;&#x5F84;
        --conf 0.3
        --nms 0.65
        --tsize 640 &#xFF1A;&#x4E3A;&#x56FE;&#x7247;&#x9700;&#x8981;resize&#x7684;&#x5927;&#x5C0F;&#xFF0C;&#x9700;&#x8981;&#x8DDF;&#x81EA;&#x5DF1;&#x8BAD;&#x7EC3;&#x65F6;&#x7684;&#x5927;&#x5C0F;&#x4E00;&#x81F4;
        --device gpu  &#xFF1A; &#x662F;&#x5426;&#x4F7F;&#x7528;gpu&#x6D4B;&#x8BD5;


'''

    测试命令： python tools/test_mutil_jpg.py image -f exps/default/yolox_s.py -c checkpoints/yolox_s.pth  --conf 0.3 --nms 0.65 --tsize 640 --device gpu
                其中：
                    -f ：为算法模型
                    -c：为权重所在路径
                    --conf 0.3
                    --nms 0.65
                    --tsize 640 ：为图片需要resize的大小，需要跟自己训练时的大小一致
                    --save_result ： 测试完成是否需要保存图片
                    --device gpu  ： 是否使用gpu测试

    以下代码需要修改的地方：
        1.  测试图片输入的地方：
        2. 测试图片输出的地方:

'''
import argparse
import os
import time
from loguru import logger

import cv2

import torch

from yolox.data.data_augment import ValTransform
from yolox.data.datasets import COCO_CLASSES
from yolox.exp import get_exp
from yolox.utils import fuse_model, get_model_info, postprocess, vis

IMAGE_EXT = [".jpg", ".jpeg", ".webp", ".bmp", ".png"]

def make_parser():
    parser = argparse.ArgumentParser("YOLOX Demo!")
    parser.add_argument(
        "demo", default="image", help="demo type, eg. image, video and webcam"
    )
    parser.add_argument("-expn", "--experiment-name", type=str, default=None)
    parser.add_argument("-n", "--name", type=str, default=None, help="model name")

    parser.add_argument(
        "--path", default="./assets/dog.jpg", help="path to images or video"
    )
    parser.add_argument("--camid", type=int, default=0, help="webcam demo camera id")

    parser.add_argument(
        "--save_result",
        default="./result",
        action="store_true",
        help="whether to save the inference result of image/video"
    )

    parser.add_argument(
        "-f",
        "--exp_file",
        default=None,
        type=str,
        help="pls input your experiment description file",
    )
    parser.add_argument("-c", "--ckpt", default=None, type=str, help="ckpt for eval")
    parser.add_argument(
        "--device",
        default="cpu",
        type=str,
        help="device to run our model, can either be cpu or gpu",
    )
    parser.add_argument("--conf", default=0.3, type=float, help="test conf")
    parser.add_argument("--nms", default=0.3, type=float, help="test nms threshold")
    parser.add_argument("--tsize", default=None, type=int, help="test img size")
    parser.add_argument(
        "--fp16",
        dest="fp16",
        default=False,
        action="store_true",
        help="Adopting mix precision evaluating.",
    )
    parser.add_argument(
        "--legacy",
        dest="legacy",
        default=False,
        action="store_true",
        help="To be compatible with older versions",
    )
    parser.add_argument(
        "--fuse",
        dest="fuse",
        default=False,
        action="store_true",
        help="Fuse conv and bn for testing.",
    )
    parser.add_argument(
        "--trt",
        dest="trt",
        default=False,
        action="store_true",
        help="Using TensorRT model for testing.",
    )
    return parser

def get_image_list(path):
    image_names = []
    for maindir, subdir, file_name_list in os.walk(path):
        for filename in file_name_list:
            apath = os.path.join(maindir, filename)
            ext = os.path.splitext(apath)[1]
            if ext in IMAGE_EXT:
                image_names.append(apath)
    return image_names

class Predictor(object):
    def __init__(
        self,
        model,
        exp,
        cls_names=COCO_CLASSES,
        trt_file=None,
        decoder=None,
        device="cpu",
        fp16=False,
        legacy=False,
    ):
        self.model = model
        self.cls_names = cls_names
        self.decoder = decoder
        self.num_classes = exp.num_classes
        self.confthre = exp.test_conf
        self.nmsthre = exp.nmsthre
        self.test_size = exp.test_size
        self.device = device
        self.fp16 = fp16
        self.preproc = ValTransform(legacy=legacy)
        if trt_file is not None:
            from torch2trt import TRTModule

            model_trt = TRTModule()
            model_trt.load_state_dict(torch.load(trt_file))

            x = torch.ones(1, 3, exp.test_size[0], exp.test_size[1]).cuda()
            self.model(x)
            self.model = model_trt

    def inference(self, img):
        img_info = {"id": 0}
        if isinstance(img, str):
            img_info["file_name"] = os.path.basename(img)
            img = cv2.imread(img)
        else:
            img_info["file_name"] = None

        height, width = img.shape[:2]
        img_info["height"] = height
        img_info["width"] = width
        img_info["raw_img"] = img

        ratio = min(self.test_size[0] / img.shape[0], self.test_size[1] / img.shape[1])
        img_info["ratio"] = ratio

        img, _ = self.preproc(img, None, self.test_size)
        img = torch.from_numpy(img).unsqueeze(0)
        img = img.float()
        if self.device == "gpu":
            img = img.cuda()
            if self.fp16:
                img = img.half()

        with torch.no_grad():
            t0 = time.time()
            outputs = self.model(img)
            if self.decoder is not None:
                outputs = self.decoder(outputs, dtype=outputs.type())
            outputs = postprocess(
                outputs, self.num_classes, self.confthre,
                self.nmsthre, class_agnostic=True
            )
            logger.info("Infer time: {:.4f}s".format(time.time() - t0))
        return outputs, img_info

    def visual(self, output, img_info, cls_conf=0.35):
        ratio = img_info["ratio"]
        img = img_info["raw_img"]
        if output is None:
            return img
        output = output.cpu()

        bboxes = output[:, 0:4]

        bboxes /= ratio

        cls = output[:, 6]
        scores = output[:, 4] * output[:, 5]

        vis_res = vis(img, bboxes, scores, cls, cls_conf, self.cls_names)
        return vis_res

def image_demo(predictor, vis_folder, path, current_time, save_result):
    if os.path.isdir(path):
        files = get_image_list(path)
    else:
        files = [path]
    files.sort()
    for image_name in files:
        outputs, img_info = predictor.inference(image_name)
        result_image = predictor.visual(outputs[0], img_info, predictor.confthre)

        save_folder =vis_folder
        os.makedirs(save_folder, exist_ok=True)
        save_file_name = os.path.join(save_folder, os.path.basename(image_name))
        logger.info("Saving detection result in {}".format(save_file_name))
        cv2.imwrite(save_file_name, result_image)
        ch = cv2.waitKey(0)
        if ch == 27 or ch == ord("q") or ch == ord("Q"):
            break

def imageflow_demo(predictor, vis_folder, current_time, args):
    cap = cv2.VideoCapture(args.path if args.demo == "video" else args.camid)
    width = cap.get(cv2.CAP_PROP_FRAME_WIDTH)
    height = cap.get(cv2.CAP_PROP_FRAME_HEIGHT)
    fps = cap.get(cv2.CAP_PROP_FPS)
    save_folder = os.path.join(
        vis_folder, time.strftime("%Y_%m_%d_%H_%M_%S", current_time)
    )
    os.makedirs(save_folder, exist_ok=True)
    if args.demo == "video":
        save_path = os.path.join(save_folder, args.path.split("/")[-1])
    else:
        save_path = os.path.join(save_folder, "camera.mp4")
    logger.info(f"video save_path is {save_path}")
    vid_writer = cv2.VideoWriter(
        save_path, cv2.VideoWriter_fourcc(*"mp4v"), fps, (int(width), int(height))
    )
    while True:
        ret_val, frame = cap.read()
        if ret_val:
            outputs, img_info = predictor.inference(frame)
            result_frame = predictor.visual(outputs[0], img_info, predictor.confthre)
            if args.save_result:
                vid_writer.write(result_frame)
            ch = cv2.waitKey(1)
            if ch == 27 or ch == ord("q") or ch == ord("Q"):
                break
        else:
            break

def main(exp, args):
    if not args.experiment_name:
        args.experiment_name = exp.exp_name

    file_name = os.path.join(exp.output_dir, args.experiment_name)
    os.makedirs(file_name, exist_ok=True)
    print("======================")
    vis_folder = args.save_result

    os.makedirs(vis_folder, exist_ok=True)

    if args.trt:
        args.device = "gpu"

    logger.info("Args: {}".format(args))

    if args.conf is not None:
        exp.test_conf = args.conf
    if args.nms is not None:
        exp.nmsthre = args.nms
    if args.tsize is not None:
        exp.test_size = (args.tsize, args.tsize)

    model = exp.get_model()
    logger.info("Model Summary: {}".format(get_model_info(model, exp.test_size)))

    if args.device == "gpu":
        model.cuda()
        if args.fp16:
            model.half()
    model.eval()

    if not args.trt:
        if args.ckpt is None:
            ckpt_file = os.path.join(file_name, "best_ckpt.pth")
        else:
            ckpt_file = args.ckpt
        logger.info("loading checkpoint")
        ckpt = torch.load(ckpt_file, map_location="cpu")

        model.load_state_dict(ckpt["model"])
        logger.info("loaded checkpoint done.")

    if args.fuse:
        logger.info("\tFusing model...")
        model = fuse_model(model)

    if args.trt:
        assert not args.fuse, "TensorRT model is not support model fusing!"
        trt_file = os.path.join(file_name, "model_trt.pth")
        assert os.path.exists(
            trt_file
        ), "TensorRT model is not found!\n Run python3 tools/trt.py first!"
        model.head.decode_in_inference = False
        decoder = model.head.decode_outputs
        logger.info("Using TensorRT to inference")
    else:
        trt_file = None
        decoder = None

    predictor = Predictor(
        model, exp, COCO_CLASSES, trt_file, decoder,
        args.device, args.fp16, args.legacy,
    )
    current_time = time.localtime()
    if args.demo == "image":
        image_demo(predictor, vis_folder, args.path, current_time, args.save_result)
    elif args.demo == "video" or args.demo == "webcam":
        imageflow_demo(predictor, vis_folder, current_time, args)

if __name__ == "__main__":
    print("==============")
    args = make_parser().parse_args()
    exp = get_exp(args.exp_file, args.name)
    print("=================")

    main(exp, args)

模型的验证

1.&#x5982;&#x679C;&#x53EA;&#x60F3;&#x9A8C;&#x8BC1;&#x5F53;&#x524D;&#x6570;&#x636E;&#x96C6;&#x7684;&#x9A8C;&#x8BC1;&#x96C6;&#x5219;&#x53EA;&#x9700;&#x8981;&#x8FD0;&#x884C;&#x4E00;&#x4E0B;&#x547D;&#x4EE4;&#xFF1A;
    python tools/eval.py -f exps/example/yolox_voc/yolox_voc_x.py -d 3 -b 24 --conf 0.001
            -f &#xFF1A;&#x6A21;&#x578B;&#x8DEF;&#x5F84;
            -d :&#x4F7F;&#x7528;gpu&#x6570;&#x91CF;
            -b : bath_size
2.&#x5982;&#x679C;&#x60F3;&#x4F7F;&#x7528;&#x5F53;&#x524D;&#x6A21;&#x578B;&#x9A8C;&#x8BC1;&#x5176;&#x4ED6;&#x6570;&#x636E;&#x96C6;&#xFF1A;
    python tools/eval.py -f exps/example/yolox_voc/yolox_voc_x.py -d 3 -b 24 --conf 0.001

注意： 作者在做模型验证的时候发现过一些bug,当我们的验证集更改后，再进行测试文件时需要将之前测试文件的缓存给删除，不然容易报错。

输出指定格式的检测结果

解释说明：源码中输出的结果要不就是txt文件格式的、或者直接在图片上画框，作者根据自己的需求写了一个脚本文件，这个脚本文件可以将预测结果以列表的形式返回，如果想一次性测试多张图片可以采用for训练。

这个脚本需要输入的参数有：图片名、config文件、权重路径、检测类别。

import os
import cv2
import torch
from yolox.data.data_augment import ValTransform
from yolox.exp import get_exp
from yolox.utils import  postprocess

def vis_list(boxes, scores, cls_ids, conf=0.5, class_names=None):
    result_list = []
    for i in range(len(boxes)):
        box = boxes[i]
        cls_id = int(cls_ids[i])
        score = scores[i]
        if score < conf:
            continue
        x0 = int(box[0])
        y0 = int(box[1])
        x1 = int(box[2])
        y1 = int(box[3])
        class_name = class_names[cls_id]
        one_line = [str(x0), str(y0), str(x1), str(y1), class_name, str(float(score))]
        result_list.append(one_line)

    return result_list

class Predictor(object):
    def __init__(
        self,
        model,
        exp,
        cls_names,
        device="gpu",
    ):
        self.model = model
        self.cls_names = cls_names
        self.num_classes = exp.num_classes
        self.confthre = exp.test_conf
        self.nmsthre = exp.nmsthre
        self.test_size = exp.test_size
        self.device = device
        self.preproc = ValTransform(legacy=False)
    def inference(self, img):
        img_info = {"id": 0}
        if isinstance(img, str):
            img_info["file_name"] = os.path.basename(img)
            img = cv2.imread(img)
        else:
            img_info["file_name"] = None
        height, width = img.shape[:2]
        img_info["height"] = height
        img_info["width"] = width
        img_info["raw_img"] = img
        ratio = min(self.test_size[0] / img.shape[0], self.test_size[1] / img.shape[1])
        img_info["ratio"] = ratio
        img, _ = self.preproc(img, None, self.test_size)
        img = torch.from_numpy(img).unsqueeze(0)

        img = img.float()
        if self.device == "gpu":
            img = img.cuda()

        with torch.no_grad():
            outputs = self.model(img)
            outputs = postprocess(
                outputs, self.num_classes, self.confthre,
                self.nmsthre, class_agnostic=True
            )
        return outputs, img_info
    def visual(self, output, img_info, cls_conf=0.35):
        ratio = img_info["ratio"]
        img = img_info["raw_img"]
        if output is None:
            return img
        output = output.cpu()
        bboxes = output[:, 0:4]
        bboxes /= ratio
        cls = output[:, 6]
        scores = output[:, 4] * output[:, 5]
        result_list = vis_list(bboxes, scores, cls, cls_conf, self.cls_names)
        return result_list

def test(config,ckpt_file,image_name,VOC_CLASSES):
    name = None
    exp = get_exp(config, name)
    exp.test_conf = 0.3
    exp.nmsthre = 0.5
    exp.test_size = (960, 960)
    model = exp.get_model()
    model.cuda()
    model.eval()
    ckpt = torch.load(ckpt_file, map_location="cpu")

    model.load_state_dict(ckpt["model"])

    predictor = Predictor(
        model, exp, VOC_CLASSES
    )
    outputs,img_info= predictor.inference(image_name)

    result_list = predictor.visual(outputs[0], img_info, predictor.confthre)

    return result_list

if __name__ == '__main__':

    config = "exps/example/yolox_voc/yolox_voc_x.py"
    ckpt_file = "YOLOX_outputs/yolox_voc_x/best_ckpt.pth"
    image_name = "./test_jpg/202011_338646.jpg"

    VOC_CLASSES = ('xcxjpy', 'fzchy', 'fzctl', 'fzcpy', "fzcxs", "pbhxs", "zcxs")
    test(config,ckpt_file,image_name,VOC_CLASSES)

Original: https://blog.csdn.net/qq_28384023/article/details/121930393
Author: 爱学习的小奶狗
Title: 旷世开源yolox的目标检测使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/682944/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图解机器学习算法(7) | 随机森林分类模型详解（机器学习通关指南·完结）

作者：韩信子@ShowMeAI 教程地址：https://www.showmeai.tech/tutorials/34 本文地址：https://www.showmeai.tech…

人工智能 2023年6月23日
0085
基于Blinker的小爱同学语音控制【脱坑指南】

基于Blinker的小爱同学语音控制ESP8266 前些天在使用esp8266时遇到很多小爱不能控制设备问题，现在来叙述我控制过程中所遇到的问题，以及到完整的小爱能成功控制Esp8…

人工智能 2023年5月25日
00108
将三张灰度图转换为RGB三通道图片python

import cv2 import numpy as np from PIL import Image import matplotlib.pyplot as plt #使用cv2…

人工智能 2023年5月28日
0098
语音信号处理：预处理【预加重、分帧、加窗】

; 一、预处理预加重是语音信号处理的前提，主要目的是提升语音信号中的高频分量。人的发生系统是从肺开始，肺作为能量源，气流通过声带，引发周期性震动（元音），能量经过咽、口腔、唇、…

人工智能 2023年7月28日
0087
Package | 解决 Windows10 Anaconda环境 CUDA11.5 pytorch运行报错 No CUDA runtime is found

在windows下使用anaconda管理多个环境（尤其用于模型训练），已成为算法工程师的一种基本技能。平时大部分时间都在用linux+docker，我也趁着这次的环境调试好好学习…

人工智能 2023年7月20日
0078
(二) CNN Explainer一款形象具体的CNN解释工具

论文题目：CNN EXPLAINER：Learning Convolutional Neural Networks with Interactive Visualization论文…

人工智能 2023年7月9日
0078
多示例学习 (multi-instance learning, MIL)学习路线 (分类)

文章目录 1 简单认知 2 学习伙伴 * 2.1 关于这本书的使用 2.2 不同方向的多示例方法 – 2.2.1 基于实例的方法 2.2.2 基于包的方法 2.2.3 …

人工智能 2023年6月30日
00118
gps做成门禁卡模样_一种可导航用临时门禁卡及其使用方法与流程

本发明涉及智能门禁卡领域，具体涉及一种临时导航门禁卡及其使用方法。 [En] The invention relates to the field of intelligent a…

人工智能 2023年5月27日
0081
深度学习与神经网络有什么区别

深度学习与神经网络有什么区别找深度学习和神经网络的不同点，其实主要的就是：原来多层神经网络做的步骤是：特征映射到值。特征是人工挑选。深度学习做的步骤是信号->特征->…

人工智能 2023年6月25日
0093
解决调用torch_geometric报错No module named ‘torch_sparse‘等问题，以及torch_sparse torch_scatter等的安装问题

出现的问题：torch_geometric报错会出现为torch_sparse torch_scatter等的问题最近又开始搞图神经网络方面的东西，要用到 torch_geom…

人工智能 2023年7月23日
0085
YOLOV4 Windows10 VS2017 OPENCV4.6 CUDA11.5安装记录（简单）

YOLOV4 Windows10 VS2017 OPENCV4.6 CUDA11.5安装记录（简单）前言 * 1、安装环境 2、使用VS编译 3、测试前言本篇文章主要介绍yo…

人工智能 2023年7月19日
0062
一篇文章SQL语言快速上手(零基础入门)

数据库系列文章1. 零基础带你快速上手SQL语言2. 玩转表及其数据3. 上手表设计4. 索引和事务5. 最新版MySQL的JDBC编程目录 📖前言 🎈SQL的分类 🎨数据库的分…

人工智能 2023年6月30日
0080
MXNet在自动语音识别（ASR）任务方面有什么应用和优势

人工智能 2024年1月1日
0061
如何在PyTorch中加载和处理数据集

如何在PyTorch中加载和处理数据集在PyTorch中，我们可以使用torchvision模块来加载和处理数据集。torchvision提供了一些常用的计算机视觉数据集的函数，…

人工智能 2024年1月3日
0071
ubuntu20.04安装VITIS_HLS2021.2配置OPENCV4.4和VITIS_LIBRARIES(详细版)

一、引言大家好，今天给研友们配置一下这个VITIS_HLS，因这其中经历太多的坎坷，为让大家原理配置环境的烦扰，本人出个详细版，望大家喜欢二、VITIS的安装我之前的博客已经…

人工智能 2023年5月26日
00131
YOLOv5解析 | 第二篇：用YOLOv5训练自己的数据集（超级详细完整版）

大家好，我是K同学啊！我们接着上一篇文章 YOLOv5解析 | 第一篇：快速部署YOLOv5模型配置完YOLOv5需要的环境后，今天我们试着用YOLOv5训练自己的数据。（在…

人工智能 2023年6月16日
0093

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31