Win10配置SlowFast全过程并使用slowfast进行视频行为识别检测

2023年6月17日上午5:25 • 人工智能 • 阅读 82

SlowFast在Windows10环境配置全过程并使用自己的视频进行demo检测

环境简介
1. 开始配置
2.配置demo环境
3. 测试结果

环境简介

pycharm
python=3.7.11

我就是不用linux，就要用window10配置。
你还需要安装git，下下来以后一直下一步即可。
可能还需要Visual Studio。

开始配置

首先下载官网的代码库

git clone https://github.com/facebookresearch/slowfast
cd SlowFast

新建一个虚拟环境。

安装 pytorch 和 torchvision 对应cuda的GPU版本。

接下来就按我给的安装提示一步一步的安装。


pip install 'git+https://github.com/facebookresearch/fvcore'
pip install 'git+https://github.com/facebookresearch/fairscale'
pip install simplejson
pip install -U iopath
pip install psutil tensorboard opencv-python moviepy pytorchvideo
pip install pillow pyyaml pandas matplotlib sklearn

其中Detection2的安装可以按这个：

git clone https://github.com/facebookresearch/detectron2.git
python -m pip install -e detectron2

千万要有耐心，一步一步走。

接下来就是就是编译：

python setup.py build develop

如果没报错的话就代表没有错误，如果报错了就代表有错误。

2.配置demo环境

终于到了测试自己视频的环节。
在主目录下/demo/AVA下新建ava.json，复制下面的标签到里面。

ava.json

{"bend/bow (at the waist)": 0, "crawl": 1, "crouch/kneel": 2, "dance": 3, "fall down": 4, "get up": 5, "jump/leap": 6, "lie/sleep": 7, "martial art": 8, "run/jog": 9, "sit": 10, "stand": 11, "swim": 12, "walk": 13, "answer phone": 14, "brush teeth": 15, "carry/hold (an object)": 16, "catch (an object)": 17, "chop": 18, "climb (e.g., a mountain)": 19, "clink glass": 20, "close (e.g., a door, a box)": 21, "cook": 22, "cut": 23, "dig": 24, "dress/put on clothing": 25, "drink": 26, "drive (e.g., a car, a truck)": 27, "eat": 28, "enter": 29, "exit": 30, "extract": 31, "fishing": 32, "hit (an object)": 33, "kick (an object)": 34, "lift/pick up": 35, "listen (e.g., to music)": 36, "open (e.g., a window, a car door)": 37, "paint": 38, "play board game": 39, "play musical instrument": 40, "play with pets": 41, "point to (an object)": 42, "press": 43, "pull (an object)": 44, "push (an object)": 45, "put down": 46, "read": 47, "ride (e.g., a bike, a car, a horse)": 48, "row boat": 49, "sail boat": 50, "shoot": 51, "shovel": 52, "smoke": 53, "stir": 54, "take a photo": 55, "text on/look at a cellphone": 56, "throw": 57, "touch (an object)": 58, "turn (e.g., a screwdriver)": 59, "watch (e.g., TV)": 60, "work on a computer": 61, "write": 62, "fight/hit (a person)": 63, "give/serve (an object) to (a person)": 64, "grab (a person)": 65, "hand clap": 66, "hand shake": 67, "hand wave": 68, "hug (a person)": 69, "kick (a person)": 70, "kiss (a person)": 71, "lift (a person)": 72, "listen to (a person)": 73, "play with kids": 74, "push (another person)": 75, "sing to (e.g., self, a person, a group)": 76, "take (an object) from (a person)": 77, "talk to (e.g., self, a person, a group)": 78, "watch (a person)": 79}

然后下载官网权重文件

打开/demo/AVA/SLOWFAST_32x2_R101_50_50.yaml将我的配置信息粘贴进去

TRAIN:
  ENABLE: False
  DATASET: ava
  BATCH_SIZE: 16
  EVAL_PERIOD: 1
  CHECKPOINT_PERIOD: 1
  AUTO_RESUME: True

  CHECKPOINT_FILE_PATH: 'D:/python/video_classify/SlowFast-main/weights/SLOWFAST_32x2_R101_50_50.pkl'
  CHECKPOINT_TYPE: pytorch
DATA:
  NUM_FRAMES: 32
  SAMPLING_RATE: 2
  TRAIN_JITTER_SCALES: [256, 320]
  TRAIN_CROP_SIZE: 224
  TEST_CROP_SIZE: 256
  INPUT_CHANNEL_NUM: [3, 3]
DETECTION:
  ENABLE: True
  ALIGNED: False
AVA:
  BGR: False
  DETECTION_SCORE_THRESH: 0.8
  TEST_PREDICT_BOX_LISTS: ["person_box_67091280_iou90/ava_detection_val_boxes_and_labels.csv"]
SLOWFAST:
  ALPHA: 4
  BETA_INV: 8
  FUSION_CONV_CHANNEL_RATIO: 2
  FUSION_KERNEL_SZ: 5
RESNET:
  ZERO_INIT_FINAL_BN: True
  WIDTH_PER_GROUP: 64
  NUM_GROUPS: 1
  DEPTH: 101
  TRANS_FUNC: bottleneck_transform
  STRIDE_1X1: False
  NUM_BLOCK_TEMP_KERNEL: [[3, 3], [4, 4], [6, 6], [3, 3]]
  SPATIAL_DILATIONS: [[1, 1], [1, 1], [1, 1], [2, 2]]
  SPATIAL_STRIDES: [[1, 1], [2, 2], [2, 2], [1, 1]]
NONLOCAL:
  LOCATION: [[[], []], [[], []], [[6, 13, 20], []], [[], []]]
  GROUP: [[1, 1], [1, 1], [1, 1], [1, 1]]
  INSTANTIATION: dot_product
  POOL: [[[2, 2, 2], [2, 2, 2]], [[2, 2, 2], [2, 2, 2]], [[2, 2, 2], [2, 2, 2]], [[2, 2, 2], [2, 2, 2]]]
BN:
  USE_PRECISE_STATS: False
  NUM_BATCHES_PRECISE: 200
SOLVER:
  MOMENTUM: 0.9
  WEIGHT_DECAY: 1e-7
  OPTIMIZING_METHOD: sgd
MODEL:
  NUM_CLASSES: 80
  ARCH: slowfast
  MODEL_NAME: SlowFast
  LOSS_FUNC: bce
  DROPOUT_RATE: 0.5
  HEAD_ACT: sigmoid
TEST:
  ENABLE: False
  DATASET: ava
  BATCH_SIZE: 8
DATA_LOADER:
  NUM_WORKERS: 2
  PIN_MEMORY: True

NUM_GPUS: 1
NUM_SHARDS: 1
RNG_SEED: 0
OUTPUT_DIR: .

DEMO:
  ENABLE: True
  LABEL_FILE_PATH: "./demo/AVA/ava.json"
  INPUT_VIDEO: "./input/1.mp4"
  OUTPUT_FILE: "./output/1.mp4"

  DETECTRON2_CFG: "COCO-Detection/faster_rcnn_R_50_FPN_3x.yaml"
  DETECTRON2_WEIGHTS: detectron2://COCO-Detection/faster_rcnn_R_50_FPN_3x/137849458/model_final_280758.pkl

注意修改，权重文件的路径，label文件的路径，输入视频的路径以及输出视频的路径

运行以下代码进行测试：

python tools/run_net.py --cfg demo/AVA/SLOWFAST_32x2_R101_50_50.yaml

测试结果

这样就代表demo运行成功。

结果展示

Windows10配置SlowFast环境全过程并使用自己的视频进行demo检测

看起来是不是很简单呢。

有什么问题，及时评论留言。

Original: https://blog.csdn.net/qq_44523137/article/details/123630564
Author: 月光下的小趴菜
Title: Win10配置SlowFast全过程并使用slowfast进行视频行为识别检测

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628838/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深度学习经典应用——鸢尾花分类(基于sklearn包)+三维成果可视化

文章目录任务描述数据集 Step1. 数据准备 Step2. 模型搭建 Step3.模型训练 Step4. 模型评估 Step5. 模型使用 3D可视化模型任务描述构建一个…

人工智能 2023年7月3日
0098
python–matplotlib-绘制折线图

matplotlib 一、matplotlib–数据可视化图表二、绘制折线图 * – 1.设置图片大小： 2. 保存图片： 3.设置x、y轴的刻度 4.设置坐标中文字…

人工智能 2023年6月19日
0051
基于LSTM的中文文本多分类实践

使用深度学习中的LSTM（Long Short-Term Memory）长短期记忆网络，来尝试一下中文文本多分类,LSTM它是一种时间循环神经网络，适合于处理和预测时间序列中间隔和…

人工智能 2023年7月3日
0053
python –opencv图像处理轮廓(寻找轮廓、绘制轮廓)详解

什么是轮廓？轮廓是一系列相连的点组成的曲线，代表了物体的基本外形，相对于边缘，轮廓是连续的，边缘并不全部连续。寻找轮廓寻找轮廓 OpenCV 为我们提供了一个现成的函数 fi…

人工智能 2023年7月19日
0055
ROS————tf2介绍及教程

本文参考资料： tf2 – ROS Wiki http://wiki.ros.org/tf2 ; 目录前言一、tf2的作用以及为什么要使用tf2 1.安装demo …

人工智能 2023年7月28日
0063
病毒组学数据分析 -03 Virsorter2病毒序列识别

VirSorter2 应用多分类器、专家指导的方法来检测不同的 DNA 和 RNA 病毒基因组。它对其之前版本（virsorter）进行了重大更新：与更多的病毒组合作，包括 ds…

人工智能 2023年7月16日
0055
SpringBoot整合JPA+SQLite

文章目录背景介绍 SQLite安装以及生成db库创建SpringBoot项目 * POM文件所需要的依赖配置数据源配置JAP 测试效果 * 创建pojo类创建Reposi…

人工智能 2023年6月26日
00123
PaddleDetection使用详解(包括常见报错及修复方法)

一、PaddleDetection的安装前言：PaddleDetection依赖paddlepaddle，需要先安装paddlepaddle1.从github/gitee获取Pad…

人工智能 2023年5月26日
0058
Hadoop 综合揭秘——HBase的原理与应用

前言现今互联网科技发展日新月异，大数据、云计算、人工智能等技术已经成为前瞻性产品，海量数据和超高并发让传统的 Web2.0 网站有点力不从心，暴露了很多难以克服的问题。为此，Go…

人工智能 2023年6月4日
0080
Pandas这一篇就够了（建议收藏）

前言：pandas主要分为两大块，Series和datafram，下面对这两块分别进行总结。其次，在看该篇文章时候，需有一点numpy的知识，后面我都会将其类型转换的numpy的数…

人工智能 2023年7月7日
0069
在线会议中人脸面部轮廓图像提取（三）——Dlib库人脸面部轮廓图像特征提取

前言：所使用图片并无盈利等目的，如有侵犯他人肖像权请联系删除。当当当当，第三期来廖！接上一期在线会议中人脸面部轮廓图像提取（二）——HOG人脸面部轮廓图像特征提取，介绍完HOG特…

人工智能 2023年6月18日
0089
并发基础（三）：线程

尺有所短，寸有所长；不忘初心，方得始终。请关注公众号：星河之码线程是一个Java开发者必备的基础知识，整个并发编程离不来线程，那么线程有些基本概念呢？本文通过以下七点对线程的基本…

人工智能 2023年6月27日
00127
计算神经网络每一层需要训练的参数和每一层的FLOPs

FLOPs是什么？ FLOPs：注意s小写，是floating point operations的缩写（s表复数），意指浮点运算数，理解为计算量。可以用来衡量算法/模型的复杂度。 …

人工智能 2023年7月14日
0076
计算机视觉之目标检测库安装记录

detectron2开源项目位置： detectron2安装文档：测试demo python demo.py –config-file ../configs/COCO-Inst…

人工智能 2023年7月12日
0061
pandas入门

目录 1.导入pandas 2.pandas两个常用的工具数据结构——Series和DataFrame 2.1. Series 2.2. DataFrame 2.2.1 构建dat…

人工智能 2023年7月17日
0049
【大数据】十、社会网络图挖掘（Girvan-Newman、拉普拉斯矩阵、Simrank）

文章目录 * – + * 1 社会网络图的聚类 * – 1.1 社交图网络的距离计算 – + 1.2 中介度 – 1.2 Girva…

人工智能 2023年6月2日
0063

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Win10配置SlowFast全过程并使用slowfast进行视频行为识别检测

SlowFast在Windows10环境配置全过程并使用自己的视频进行demo检测

大家都在看