pytorch使用detectron2模型库模型训练自己的数据

2023年6月17日上午9:01 • 人工智能 • 阅读 72

一应用场景

在x86 （Ubuntu18.04）cpu，在pytorch1.10框架下，使用detectron2模型库模型训练自己的数据集，并进行目标检测推理。

二环境配置

我的环境是：

pytorch==1.10+cpu
torchvision==0.11.2+cpu
detectron2==0.6
opencv==4.5.5

1 基础环境配置

这里可使用conda，或者python3-venv创建虚拟环境，这里不做赘述，仅讲解基础环境搭建。

$ sudo apt-get install python3-pip git cmake make gcc g++

$ python3 -m pip intall –upgrade pip

在官网（https://pytorch.org/）根据自己的实际情况安装pytorch和torchvison

$ pip3 install torch==1.10.1+cpu torchvision==0.11.2+cpu torchaudio==0.10.1+cpu -f https://download.pytorch.org/whl/cpu/torch_stable.html

$ pip3 install opencv-python

$ pip3 install setuptools==58.2.0

2 detectron2 搭建

$ git clone https://github.com/facebookresearch/detectron2.git

$ python3 -m pip install -e detectron2

安装后，主要库版本如下：

3 demo运行测试

先在detecron2/demo文件夹，下载好测试图片，这里我下载命名为dog.jpg

运行demo

$python3 demo.py --config-file ../configs/COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml \

--input dog.jpg –output dog_out.jpg \

--opts MODEL.DEVICE cpu MODEL.WEIGHTS detectron2://COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x/137849600/model_final_f10217.pkl

参数解释：
–config-file 后面接配置文件，可以在detectron2/configs下找到
–input 后面接输入文件
–output 后面接预测保存图片
–opt为配置选项，后面需要加具体参数 MODEL.DEVICE 后面接设备，这里是cpu，不加这个默认cud
MODEL.WEIGHTS 后面接模型的权重

模型运行预测结果：

测试成功，api安装没问题，下面开始操作流程。

三数据集准备

这里涉及到的文件操作较为复杂，请仔细阅读。这里使用labelimg数据标注工具，先将图片标注为xml文件，后转化为coco2017数据集格式

1 labelimg安装

$ pip3 install labelimg

打开labelimg：

2 voc数据处理

在 detectron2/datasets文件夹新建文件夹生成以下目录：

VOC2007
xml_json.py ####脚本

将VOC2007/train_JPEGImages和VOC2007/val_JPEGImages里的图片分别对应放在coco/train2017 ，coco/val2017 文件夹里

先生成训练集instances_train2017.json文件

对xml_json.py（datasets路径下）：


import xml.etree.ElementTree as ET
import os
import json
import collections

coco = dict()
coco['images'] = []
coco['type'] = 'instances'
coco['annotations'] = []
coco['categories'] = []

#category_set = dict()
image_set = set()
image_id = 2017000001  #train:2018xxx; val:2019xxx; test:2020xxx
category_item_id = 0
annotation_id = 0
#category_set = ['open','close',"mopen","mclose"]
category_set = ['mushroom']
'''
def addCatItem(name):
    global category_item_id
    category_item = dict()
    category_item['supercategory'] = 'none'
    category_item_id += 1
    category_item['id'] = category_item_id
    category_item['name'] = name
    coco['categories'].append(category_item)
    category_set[name] = category_item_id
    return category_item_id
'''

def addCatItem(name):
    '''
    增加json格式中的categories部分
    '''
    global category_item_id
    category_item = collections.OrderedDict()
    category_item['supercategory'] = 'none'
    category_item['id'] = category_item_id
    category_item['name'] = name
    coco['categories'].append(category_item)
    category_item_id += 1

def addImgItem(file_name, size):
    global image_id
    if file_name is None:
        raise Exception('Could not find filename tag in xml file.')
    if size['width'] is None:
        raise Exception('Could not find width tag in xml file.')
    if size['height'] is None:
        raise Exception('Could not find height tag in xml file.')
    #image_item = dict()    #按照一定的顺序，这里采用collections.OrderedDict()
    image_item = collections.OrderedDict()
    print(file_name,"*******")
    # jpg_name = os.path.splitext(file_name)[0]+'.png'
    jpg_name = file_name
    image_item['file_name'] = jpg_name
    image_item['width'] = size['width']
    image_item['height'] = size['height']
    image_item['id'] = image_id
    coco['images'].append(image_item)
    image_set.add(jpg_name)
    image_id = image_id+1
    return image_id

def addAnnoItem(object_name, image_id, category_id, bbox):
    global annotation_id
    #annotation_item = dict()
    annotation_item = collections.OrderedDict()
    annotation_item['segmentation'] = []
    seg = []
    # bbox[] is x,y,w,h
    # left_top
    seg.append(bbox[0])
    seg.append(bbox[1])
    # left_bottom
    seg.append(bbox[0])
    seg.append(bbox[1] + bbox[3])
    # right_bottom
    seg.append(bbox[0] + bbox[2])
    seg.append(bbox[1] + bbox[3])
    # right_top
    seg.append(bbox[0] + bbox[2])
    seg.append(bbox[1])
    annotation_item['segmentation'].append(seg)
    annotation_item['area'] = bbox[2] * bbox[3]
    annotation_item['iscrowd'] = 0
    annotation_item['image_id'] = image_id
    annotation_item['bbox'] = bbox
    annotation_item['category_id'] = category_id
    annotation_item['id'] = annotation_id
    annotation_item['ignore'] = 0
    annotation_id += 1
    coco['annotations'].append(annotation_item)

def parseXmlFiles(xml_path):
    xmllist = os.listdir(xml_path)
    xmllist.sort()
    for f in xmllist:
        if not f.endswith('.xml'):
            continue

        bndbox = dict()
        size = dict()
        current_image_id = None
        current_category_id = None
        file_name = None
        size['width'] = None
        size['height'] = None
        size['depth'] = None

        xml_file = os.path.join(xml_path, f)
        print(xml_file)

        tree = ET.parse(xml_file)
        root = tree.getroot() #抓根结点元素

        if root.tag != 'annotation': #根节点标签
            raise Exception('pascal voc xml root element should be annotation, rather than {}'.format(root.tag))

        # elem is , , ,
        for elem in root:
            current_parent = elem.tag
            current_sub = None
            object_name = None

            #elem.tag, elem.attrib，elem.text
            if elem.tag == 'folder':
                continue

            if elem.tag == 'filename':
                file_name = elem.text
                if file_name in category_set:
                    raise Exception('file_name duplicated')

            # add img item only after parse  tag
            elif current_image_id is None and file_name is not None and size['width'] is not None:
                if file_name not in image_set:
                    current_image_id = addImgItem(file_name, size)#图片信息
                    print('add image with {} and {}'.format(file_name, size))
                else:
                    raise Exception('duplicated image: {}'.format(file_name))
                    # subelem is , , , ,
            for subelem in elem:
                bndbox['xmin'] = None
                bndbox['xmax'] = None
                bndbox['ymin'] = None
                bndbox['ymax'] = None

                current_sub = subelem.tag
                if current_parent == 'object' and subelem.tag == 'name':
                    object_name = subelem.text
                    #if object_name not in category_set:
                    #    current_category_id = addCatItem(object_name)
                    #else:
                    #current_category_id = category_set[object_name]
                    current_category_id = category_set.index(object_name) #index默认从0开始,但是json文件是从1开始，所以+1
                elif current_parent == 'size':
                    if size[subelem.tag] is not None:
                        raise Exception('xml structure broken at size tag.')
                    size[subelem.tag] = int(subelem.text)

                # option is , , , , when subelem is
                for option in subelem:
                    if current_sub == 'bndbox':
                        if bndbox[option.tag] is not None:
                            raise Exception('xml structure corrupted at bndbox tag.')
                        bndbox[option.tag] = int(option.text)

                # only after parse the  tag
                if bndbox['xmin'] is not None:
                    if object_name is None:
                        raise Exception('xml structure broken at bndbox tag')
                    if current_image_id is None:
                        raise Exception('xml structure broken at bndbox tag')
                    if current_category_id is None:
                        raise Exception('xml structure broken at bndbox tag')
                    bbox = []
                    # x
                    bbox.append(bndbox['xmin'])
                    # y
                    bbox.append(bndbox['ymin'])
                    # w
                    bbox.append(bndbox['xmax'] - bndbox['xmin'])
                    # h
                    bbox.append(bndbox['ymax'] - bndbox['ymin'])
                    print(
                    'add annotation with {},{},{},{}'.format(object_name, current_image_id-1, current_category_id, bbox))
                    addAnnoItem(object_name, current_image_id-1, current_category_id, bbox)
    #categories部分
    for categoryname in category_set:
        addCatItem(categoryname)

if __name__ == '__main__':
    xml_path = 'VOC2007/val_annotations'
    json_file = './coco/annotations/instances_val2017.json'

    parseXmlFiles(xml_path)
json.dump(coco, open(json_file, 'w'))

进行修改

首先是数据集类别，我这里只有mushroom

然后是xml文件和输出json文件路径

后开始运行$ python3 xml_json.py

运行成功后在coco/

annotations生成instances_train2017.json

先生成训练集instances_val2017.json文件

对xml_json.py（datasets路径下）进行修改

首先是数据集类别，我这里只有mushroom

然后是xml文件和输出json文件路径

后开始运行$ python3 xml_json.py

运行成功后在coco/

annotations生成instances_val2017.json。

至此coco数据集制作完毕。

4 数据集测试

因为数据集比较关键，我们来测试一下我们所制作的数据集

我写了一个脚本dataset_test.py放置在detectron2文件夹下：

import os
import cv2
import logging
from collections import OrderedDict

import detectron2.utils.comm as comm
from detectron2.utils.visualizer import Visualizer
from detectron2.checkpoint import DetectionCheckpointer
from detectron2.config import get_cfg
from detectron2.data import DatasetCatalog, MetadataCatalog
from detectron2.data.datasets.coco import load_coco_json
from detectron2.engine import DefaultTrainer, default_argument_parser, default_setup, launch
from detectron2.evaluation import COCOEvaluator, verify_results
from detectron2.modeling import GeneralizedRCNNWithTTA

数据集路径
DATASET_ROOT = './datasets/coco'
ANN_ROOT = os.path.join(DATASET_ROOT, 'annotations')

TRAIN_PATH = os.path.join(DATASET_ROOT, 'train2017')
VAL_PATH = os.path.join(DATASET_ROOT, 'val2017')

TRAIN_JSON = os.path.join(ANN_ROOT, 'instances_train2017.json')
#VAL_JSON = os.path.join(ANN_ROOT, 'val.json')
VAL_JSON = os.path.join(ANN_ROOT, 'instances_val2017.json')

CLASS_NAMES =['mushroom']
数据集类别元数据
DATASET_CATEGORIES = [
    # {"name": "background", "id": 0, "isthing": 1, "color": [220, 20, 60]},
    {"name": "mushroom", "id": 0, "isthing": 1, "color": [219, 142, 185]},
]

数据集的子集
PREDEFINED_SPLITS_DATASET = {
    "train_2019": (TRAIN_PATH, TRAIN_JSON),
    "val_2019": (VAL_PATH, VAL_JSON),
}

def register_dataset():
"""
    purpose: register all splits of dataset with PREDEFINED_SPLITS_DATASET
"""
    for key, (image_root, json_file) in PREDEFINED_SPLITS_DATASET.items():
        register_dataset_instances(name=key,
                                   metadate=get_dataset_instances_meta(),
                                   json_file=json_file,
                                   image_root=image_root)

def get_dataset_instances_meta():
"""
    purpose: get metadata of dataset from DATASET_CATEGORIES
    return: dict[metadata]
"""
    thing_ids = [k["id"] for k in DATASET_CATEGORIES if k["isthing"] == 1]
    thing_colors = [k["color"] for k in DATASET_CATEGORIES if k["isthing"] == 1]
    # assert len(thing_ids) == 2, len(thing_ids)
    thing_dataset_id_to_contiguous_id = {k: i for i, k in enumerate(thing_ids)}
    thing_classes = [k["name"] for k in DATASET_CATEGORIES if k["isthing"] == 1]
    ret = {
        "thing_dataset_id_to_contiguous_id": thing_dataset_id_to_contiguous_id,
        "thing_classes": thing_classes,
        "thing_colors": thing_colors,
    }
    return ret

def register_dataset_instances(name, metadate, json_file, image_root):
"""
    purpose: register dataset to DatasetCatalog,
             register metadata to MetadataCatalog and set attribute
"""
    DatasetCatalog.register(name, lambda: load_coco_json(json_file, image_root, name))
    MetadataCatalog.get(name).set(json_file=json_file,
                                  image_root=image_root,
                                  evaluator_type="coco",
                                  **metadate)

注册数据集和元数据
def plain_register_dataset():
    DatasetCatalog.register("train_2019", lambda: load_coco_json(TRAIN_JSON, TRAIN_PATH, "train_2019"))
    MetadataCatalog.get("train_2019").set(thing_classes=CLASS_NAMES,
                                                    json_file=TRAIN_JSON,
                                                    image_root=TRAIN_PATH)
    DatasetCatalog.register("val_2019", lambda: load_coco_json(VAL_JSON, VAL_PATH, "val_2019"))
    MetadataCatalog.get("val_2019").set(thing_classes=CLASS_NAMES,
                                                json_file=VAL_JSON,
                                                image_root=VAL_PATH)

查看数据集标注
def checkout_dataset_annotation(name="train_2019"):
    dataset_dicts = load_coco_json(TRAIN_JSON, TRAIN_PATH, name)
    for d in dataset_dicts:
        img = cv2.imread(d["file_name"])
        visualizer = Visualizer(img[:, :, ::-1], metadata=MetadataCatalog.get(name), scale=1.5)
        vis = visualizer.draw_dataset_dict(d)
        cv2.imshow('show', vis.get_image()[:, :, ::-1])
        cv2.waitKey(0)

register_dataset()

checkout_dataset_annotation()

如果你前面的操作是完全跟我走过的，那么仅需修改dataset_test.py以下部分即可。

1 标签分类

根据你自己的分类填写，要和上面xml_json.py的顺序保持一直

2 id和颜色映射

跟上面的顺序保持一致

开始运行测试脚本

$ python3 dataset_test.py

运行成功可以抽样检查一下数据集

检查无误，数据集制作完毕。

四模型训练

因为pytorch训练自己的数据集，涉及到数据集的注册，元数据集注册和加载，过程比较麻烦，这里我参考官方样本，写了一个脚本trainsample.py放置于model_train文件夹下。

import os
import cv2
import logging
from collections import OrderedDict

import detectron2.utils.comm as comm
from detectron2.utils.visualizer import Visualizer
from detectron2.checkpoint import DetectionCheckpointer
from detectron2.config import get_cfg
from detectron2.data import DatasetCatalog, MetadataCatalog
from detectron2.data.datasets.coco import load_coco_json
from detectron2.engine import DefaultTrainer, default_argument_parser, default_setup, launch
from detectron2.evaluation import COCOEvaluator, verify_results
from detectron2.modeling import GeneralizedRCNNWithTTA

数据集路径
DATASET_ROOT = '../datasets/coco'
ANN_ROOT = os.path.join(DATASET_ROOT, 'annotations')

TRAIN_PATH = os.path.join(DATASET_ROOT, 'train2017')
VAL_PATH = os.path.join(DATASET_ROOT, 'val2017')

TRAIN_JSON = os.path.join(ANN_ROOT, 'instances_train2017.json')
#VAL_JSON = os.path.join(ANN_ROOT, 'val.json')
VAL_JSON = os.path.join(ANN_ROOT, 'instances_val2017.json')

CLASS_NAMES =['mushroom']
数据集类别元数据
DATASET_CATEGORIES = [
    # {"name": "background", "id": 0, "isthing": 1, "color": [220, 20, 60]},
    {"name": "mushroom", "id": 0, "isthing": 1, "color": [219, 142, 185]},
]

数据集的子集
PREDEFINED_SPLITS_DATASET = {
    "train_2019": (TRAIN_PATH, TRAIN_JSON),
    "val_2019": (VAL_PATH, VAL_JSON),
}

def register_dataset():
"""
    purpose: register all splits of dataset with PREDEFINED_SPLITS_DATASET
"""
    for key, (image_root, json_file) in PREDEFINED_SPLITS_DATASET.items():
        register_dataset_instances(name=key,
                                   metadate=get_dataset_instances_meta(),
                                   json_file=json_file,
                                   image_root=image_root)

def get_dataset_instances_meta():
"""
    purpose: get metadata of dataset from DATASET_CATEGORIES
    return: dict[metadata]
"""
    thing_ids = [k["id"] for k in DATASET_CATEGORIES if k["isthing"] == 1]
    thing_colors = [k["color"] for k in DATASET_CATEGORIES if k["isthing"] == 1]
    # assert len(thing_ids) == 2, len(thing_ids)
    thing_dataset_id_to_contiguous_id = {k: i for i, k in enumerate(thing_ids)}
    thing_classes = [k["name"] for k in DATASET_CATEGORIES if k["isthing"] == 1]
    ret = {
        "thing_dataset_id_to_contiguous_id": thing_dataset_id_to_contiguous_id,
        "thing_classes": thing_classes,
        "thing_colors": thing_colors,
    }
    return ret

def register_dataset_instances(name, metadate, json_file, image_root):
"""
    purpose: register dataset to DatasetCatalog,
             register metadata to MetadataCatalog and set attribute
"""
    DatasetCatalog.register(name, lambda: load_coco_json(json_file, image_root, name))
    MetadataCatalog.get(name).set(json_file=json_file,
                                  image_root=image_root,
                                  evaluator_type="coco",
                                  **metadate)

注册数据集和元数据
def plain_register_dataset():
    DatasetCatalog.register("train_2019", lambda: load_coco_json(TRAIN_JSON, TRAIN_PATH, "train_2019"))
    MetadataCatalog.get("train_2019").set(thing_classes=CLASS_NAMES,
                                                    json_file=TRAIN_JSON,
                                                    image_root=TRAIN_PATH)
    DatasetCatalog.register("val_2019", lambda: load_coco_json(VAL_JSON, VAL_PATH, "val_2019"))
    MetadataCatalog.get("val_2019").set(thing_classes=CLASS_NAMES,
                                                json_file=VAL_JSON,
                                                image_root=VAL_PATH)

class Trainer(DefaultTrainer):
    @classmethod
    def build_evaluator(cls, cfg, dataset_name, output_folder=None):
        if output_folder is None:
            output_folder = os.path.join(cfg.OUTPUT_DIR, "inference")
        return COCOEvaluator(dataset_name, cfg, distributed=False, output_dir=output_folder)

    @classmethod
    def test_with_TTA(cls, cfg, model):
        logger = logging.getLogger("detectron2.trainer")
        # In the end of training, run an evaluation with TTA
        # Only support some R-CNN models.

        logger.info("Running inference with test-time augmentation ...")
        model = GeneralizedRCNNWithTTA(cfg, model)
        evaluators = [
            cls.build_evaluator(
                cfg, name, output_folder=os.path.join(cfg.OUTPUT_DIR, "inference_TTA")
            )
            for name in cfg.DATASETS.TEST
        ]
        res = cls.test(cfg, model, evaluators)
        res = OrderedDict({k + "_TTA": v for k, v in res.items()})
        return res

def setup(args):
"""
    Create configs and perform basic setups.

"""
    cfg = get_cfg() # 拷贝default config副本
    args.config_file = "./config.yaml"
    cfg.merge_from_file(args.config_file)   # 从config file 覆盖配置
    cfg.merge_from_list(args.opts)          # 从CLI参数 覆盖配置

    # 更改配置参数
    cfg.DATASETS.TRAIN = ("train_2019",)
    cfg.DATASETS.TEST = ("val_2019",)
    cfg.DATALOADER.NUM_WORKERS = 2 # 单线程
    # cfg.INPUT.MAX_SIZE_TRAIN = 400
    # cfg.INPUT.MAX_SIZE_TEST = 400
    # cfg.INPUT.MIN_SIZE_TRAIN = (160,)
    # cfg.INPUT.MIN_SIZE_TEST = 160
    cfg.MODEL.DEVICE = 'cpu'
    cfg.MODEL.ROI_HEADS.NUM_CLASSES = 1# 类别数
    cfg.MODEL.WEIGHTS = "./model_final.pth"    # 预训练模型权重
    cfg.SOLVER.IMS_PER_BATCH = 6 # batch_size=2; iters_in_one_epoch = dataset_imgs/batch_size
    ITERS_IN_ONE_EPOCH = int(118/ cfg.SOLVER.IMS_PER_BATCH)
    # (ITERS_IN_ONE_EPOCH * ) - 1 # 12 epochs
    cfg.SOLVER.MAX_ITER = 640
    cfg.SOLVER.BASE_LR = 0.002
    cfg.SOLVER.MOMENTUM = 0.9
    cfg.SOLVER.WEIGHT_DECAY = 0.0001
    cfg.SOLVER.WEIGHT_DECAY_NORM = 0.0
    cfg.SOLVER.GAMMA = 0.1
    cfg.SOLVER.STEPS = (500,)
    cfg.SOLVER.WARMUP_FACTOR = 1.0 / 1000
    cfg.SOLVER.WARMUP_ITERS = 300
    cfg.SOLVER.WARMUP_METHOD = "linear"
    cfg.SOLVER.CHECKPOINT_PERIOD = ITERS_IN_ONE_EPOCH - 1
    cfg.OUTPUT_DIR = "./output_trainsample/"
    cfg.freeze()
    default_setup(cfg, args)
    return cfg

def main(args):
    cfg = setup(args)
    print(cfg)

    # 注册数据集
    register_dataset()

    if args.eval_only:
        model = Trainer.build_model(cfg)
        DetectionCheckpointer(model, save_dir=cfg.OUTPUT_DIR).resume_or_load(
            cfg.MODEL.WEIGHTS, resume=args.resume
        )
        res = Trainer.test(cfg, model)
        if comm.is_main_process():
            verify_results(cfg, res)
        return res

    trainer = Trainer(cfg)
    trainer.resume_or_load(resume=args.resume)
    return trainer.train()

if __name__ == "__main__":
    args = default_argument_parser().parse_args()
    print("Command Line Args:", args)
    launch(
        main,
        args.num_gpus,
        num_machines=args.num_machines,
        machine_rank=args.machine_rank,
        dist_url=args.dist_url,
        args=(args,),
    )

1训练文件修改

如果你的数据集制作过程跟我保持一致的话，仅需对trainsample.py以下地方进行修改：

1 标签分类

根据你自己的分类填写，要和上面xml_json.py的顺序保持一直

2 id和颜色映射

跟上面的顺序保持一致

3 配置文件

args.config_file = 后跟的是配置文件路径，detectron2里配置文件放在detectron2/configs

这里我要实现的是目标检测，使用COCO-Detection文件夹里的配置文件

我这里因为是多次训练后，所以使用了自己的配置文件

4 相关参数

第一项是设备，我这里是cpu，不指定cpu，默认cuda

第二项是类别数，根据你的标签类别总数修改

第三项是预训练权重，第一次训练可以注释掉，使用配置文件的默认权重，后面重复训练修改为你自己的权重。

cfg.SOLVER.IMS_PER_BATCH是batchsize根据你电脑性能设置
ITERS_IN_ONE_EPOCH = int(118/ cfg.SOLVER.IMS_PER_BATCH)里的118是测试集总数，所以ITERS_IN_ONE_EPOCH代表1个epoch所需要的迭代次数
cfg.SOLVER.MAX_ITER代表最大迭代次数，你可以直接设置数字，但是为了epoch次数为整数，可以等于(ITERS_IN_ONE_EPOCH * epoch次数) – 1

cfg.SOLVER.STEPS是运行步数，不大于最大迭代次数即可

cfg.OUTPUT_DIR：模型输出路径
其他部分参数，请由个人需求自行进行修改

至此训练文件配置完毕。

2 模型训练

在detectron2路径下执行

$ python3 model_train/trainsample.py

训练过程中，会在output_trainsample/生成多个中间权重

生成太多权重，可以自行清楚。

训练过程中可以打开tensorboard 查看训练损失及相关数据。

$ tensorboard --logdir output_trainsample/

五目标推理

在训练结束后，会在输出文件夹（我这里detectron2/output_trainsample文件夹）生成

config.yaml和model_final.pth，这就是我们最终获得的配置文件和权重文件。

1 推理样例

我们使用之前的demo文件，和生成的模型进行预测。

进入detectron2/demo文件夹运行

$ python demo.py --config-file ../output_trainsample/config.yaml --input mushroom2.jpg --output mushroom2_out.jpg

–opts MODEL.DEVICE cpu MODEL.WEIGHTS ../output_trainsample/model_final.pth
–config-file 配置文件
–input 输入文件，如果采用文件夹/*可以输入当前文件夹的所有图片
–output 输出文件路径，如果没有，会显示在窗口上
MODEL.DEVICE设备，根据实际需求选择设备
MODEL.WEIGHTS 模型权重

预测结果：

2 预测结果展示与总结

总结：训练后的模型在单目标检测和多目标目标背景差异较大的情况，推理效果良好，在多目标检测且目标背景相似度较高，容易出现检测框重复，等待后续优化修改。

Original: https://blog.csdn.net/qq_43218533/article/details/123273968
Author: 编程爱撞墙的铁头娃
Title: pytorch使用detectron2模型库模型训练自己的数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/629450/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

神经网络中常用的损失函数

在神经网络中，常用的损失函数来评估算法模型得到的预测值与真实值之间的差距。损失函数值越小，说明二者之间的差距越小，表明模型拟合的越好。一般用来表示损失函数，其中y表示真实值，表示…

人工智能 2023年7月13日
0067
Pytorch中的grid_sample算子功能解析

pytorch中的grid_sample是一种特殊的采样算法。调用接口为： torch.nn.functional.grid_sample(input,grid,mode=&#8…

人工智能 2023年7月26日
0048
opencv基于模板匹配的银行卡卡号识别项目实战

最近在恶补opencv，在前期不太那么认真的学习状态下，着手搞了一下这个小项目实战，基于模板匹配下的银行卡卡号识别。整体思路：首先对于该项目而言，我们所需要考虑的是，该如何让计…

人工智能 2023年6月22日
0078
加密流量分类-论文2：Deep Packet: A Novel Approach For Encrypted Traffic Classification Using Deep Learning

加密流量分类-论文2：Deep Packet: A Novel Approach For Encrypted Traffic Classification Using Deep L…

人工智能 2023年7月2日
0085
深度学习模型理解-CNN-手写数据字代码

系列文章目录 提示：这里可&#x4EE5…

人工智能 2023年6月16日
0065
0092 图

import java.util.ArrayList;import java.util.Arrays;import java.util.LinkedList; /* 图* 图是一种…

人工智能 2023年6月29日
0083
速来！人社部发布100个最缺工职业；人均梵高的自画像工具；YSDA深度视觉与图形课程；机器学习系统VS机器学习模型；前沿论文 | ShowMeAI资讯日报

👀日报合辑; | 📆电子月刊 | 🔔公众号下载资料 | 🍩@韩信子 📢 人社部：2022年第二季度全国招聘大于求职『最缺工』的100个职业排行 http://www.mohrss….

人工智能 2023年6月16日
00114
C++与Python实现逆透视变换IPM（鸟瞰图）

一、待解决的问题这是一张普通单目相机拍摄的图像，需要将其处理成鸟瞰图，效果图如下：上面这幅鸟瞰图只包含原图像的一部分信息，并没有包含所有内容（这个问题接下来再回答），但是可以验…

人工智能 2023年7月19日
0069
基于JAVA仁爱公益网站计算机毕业设计源码+系统+mysql数据库+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年7月20日
0054
inx函数python_Python数据分析入门

如今数据分析越来越重要，比起使用excel等工具，使用编程语言更加高效。这篇文章主要介绍一些简单的数据分析入门知识，使用的语言是python。读取csv文件数据分析的第一步是要…

人工智能 2023年7月8日
00118
如何将一个PyTorch模型部署到生产环境中

如何将一个PyTorch模型部署到生产环境中在本文中，将介绍如何部署一个基于PyTorch的深度学习模型到生产环境中。我们将使用一个虚拟数据集来作为示例，并详细解释算法原理、计算…

人工智能 2024年1月2日
0042
基于卷积神经网络的实体关系抽取（SemEval-2010 Task-8数据集）

摘要关系抽取旨在识别命名实体之间的语义关系.作为自然语言处理中信息抽取的重要子任务,是构建知识图谱,实现语义搜索,建立智能问答系统等应用领域必不可少的关键技术,具有极其重要的研究…

人工智能 2023年6月10日
0082
数据分析—开发环境

DataGear是一款数据可视化分析平台，使用Java语言开发，采用浏览器/服务器架构，支持SQL、CSV、Excel、HTTP接口、JSON等多种数据源，主要功能包括数据管理、…

人工智能 2023年7月15日
0099
1分钟推荐一个深度学习领域的必备网站，高能！

花一分钟的时间收获一个深度学习必备网站，入股不亏！目录深度学习领域的论文和代码 1.1 点击首页的Browse State-of-the-Art（也可以直接搜索关键词） 1.2…

人工智能 2023年7月13日
00108
传奇开服很难吗？教你怎么给Hero传奇引擎添加NPC

一般人们用官方里面的NPC形象代码但是找不到这个代码因为我们发现用这个wil查看器查看到的第一个npc的数据除以六十得不到我们想要的npc 比如说铁匠是一号他占的位置是0…

人工智能 2023年6月28日
0077
超详细的Python matplotlib 绘制柱状图

复习回顾 Python 为数据展示提供了大量优秀的功能包，其中 matplotlib 模块可以方便绘制制作折线图、柱状图、散点图等高质量的数据包。关于 matplotlib 模块…

人工智能 2023年7月14日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch使用detectron2模型库模型训练自己的数据

1 基础环境配置

2 detectron2 搭建

3 demo运行测试

1 labelimg安装

2 voc数据处理

4 数据集测试

1 标签分类

2 id和颜色映射

1训练文件修改

1 标签分类

2 id和颜色映射

3 配置文件

4 相关参数

2 模型训练

1 推理样例

2 预测结果展示与总结

大家都在看