跑通mmf：visualBert实现过程

2023年5月30日下午8:57 • 人工智能 • 阅读 107

使用代码github链接：https://github.com/di-dimitrov/propaganda-techniques-in-memes

该代码相当在mmf-master上展开自己的任务，之前想直接跑通facebook的MMF，但是被两个问题困扰：

环境配置
新数据集的构造

后来被推荐了这套代码，才跑通了visualBert模型。

实现过程

1 将项目下载并存放到服务器

2 Install MMF

Prerequisites – generating image caption features for VisualBERT and ViLBERT:
i. Install MMF according to the instructions here:
https://mmf.readthedocs.io/en/website/notes/installation.html

该链接中给出了安装MMF的两种方法：

我使用方法1安装总会在后期出现各种环境报错，方法2安装就成功了，所以建议安装不成功的试试方法2安装。

; 3 Install the following packages

ii. Install the following packages: pip install yacs, opencv-python, cython (if using ‘pip’, any package manager works)

4 Clone vqa-maskrcnn-benchmark repository

iii. Clone vqa-maskrcnn-benchmark repository: https://gitlab.com/vedanuj/vqa-maskrcnn-benchmark
a. Run python setup.py build
b. Run python setup.py develop

5 feature extraction

c. Run the feature extraction script from the following path:
mmf/tools/scripts/features/extract_features_vmb.py

这一步对图片进行处理，先将图片存放到 data/datasets/propaganda/defaults/images下，执行

python tools/scripts/features/extract_features_vmb.py

控制台显示如下即为正在处理（这里，”/”后的数字应该和images文件夹下的图片总数一致）：

如果图片文件夹的布局不寻常，可在 extract_features_vmb.py的 line273以下稍作修改。该步骤的生成文件默认存储在 ./output文件夹下。

5 convert the features to a .mdb file

d. After feature extraction is done convert the features to a .mdb file with the following script: mmf/tools/scripts/features/extract_features_vmb.py

此处存在笔误，实际运行程序为：

python tools/scripts/features/lmdb_conversion.py --mode convert --lmdb_path ./save --features_folder ./output

其中，传参内容的含义可见 lmdb_conversion.py：

        parser.add_argument(
            "--mode",
            required=True,
            type=str,
            help="Mode can either be convert (for conversion of \n"
            + "features to an LMDB file) or extract (extract \n"
            + "raw features from a LMDB file)",default="convert"
        )
        parser.add_argument(
            "--lmdb_path", required=True, type=str, help="LMDB file path",default="./save"
        )
        parser.add_argument(
            "--features_folder", required=True, type=str, help="Features folder",default="./output"
        )

该步骤会在./save文件夹下生成 data.mdb文件。

6 Rename the .mdb features file to deceptron.lmdb and move it

Rename the .mdb features file to deceptron.lmdb and move it to /root/.cache/torch/mmf/data/datasets/propaganda/defaults/features/

7 Running the models

2.Running the models – open ‘Propaganda_Detection.ipynb’ and run the code inside.

程序默认是多GPU的，指定服务器上的固定节点跑程序：

CUDA_VISIBLE_DEVICES=1 !mmf_run config=./projects/propaganda/configs/visual_bert/direct.yaml \
 datasets=propaganda \
 model=visual_bert

visualBert：对于关键修改位置的备注

参数修改位置

/root/propaganda-techniques-in-memes-main/projects/propaganda/configs/visual_bert/defaults.yaml

修改数据集标签数

/root/propaganda-techniques-in-memes-main/mmf/datasets/builders/propaganda/dataset.py
line81, line147修改标签数量

数据集存放位置

/root/.cache/torch/mmf/data/datasets/propaganda/defaults/annotations/

Bug记录

显示’mmf_run’是不可识别的语法

mmf安装不成功，注意安装过程中出现的bug

ERROR: Cannot uninstall ‘certifi’. It is a distutils installed project and …

直接pip uninstall certifi不成功，执行：

pip install certifi --ignore-installed

参考博客：ERROR: Cannot uninstall ‘certifi’. It is a distutils installed project and thus we cannot accurately

实现环境备注

torch == 1.7.1+cu110
torchtext == 0.5.0
torchvision == 0.8.2+cu110
pytorch-lightning == 1.4.9

Original: https://blog.csdn.net/xiyou__/article/details/121792839
Author: xiyou__
Title: 跑通mmf：visualBert实现过程

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/545056/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

论文|Jointly Pre-Training Transformers on Unpaired Images and Text

最近本专栏都在介绍多模态机器翻译，而近期多模态联合表示的工作很火热，笔者也准备和大家一起学习学习最新期的几篇论文。今天讲的这篇Google的工作利用知识蒸馏，把BERT和ViT的…

人工智能 2023年5月30日
0091
为了摸鱼，我开发了一个工具网站

🏡 博客首页：派大星⛳️ 欢迎关注 🐳 点赞 🎒 收藏 ✏️ 留言🎢 本文由派大星原创编撰🚧 系列专栏：《开源专栏》🎈 本系列主要输出作者自创的开源项目🔗 作品：www.jso…

人工智能 2023年7月30日
0070
DeepLabv3+

一.摘要本文在进行语义分割任务时将空间金字塔池化（SPP）模块或encoder-decoder结构引入到深度神经网络中。以前的网络通过对输入的feature map使用多种尺度的…

人工智能 2023年5月26日
0089
【总目录】机器学习原理剖析、开源实战项目、全套学习指南（50篇合集）

; 写在前面我为了更加的高效的学习，需要不断地输入和输出相信不管此时的你是怀着好奇心打开这篇文章；还是偶然间刷到这篇博文；或者带有学习目的性走到这片领域，我都相信，面前的你一定…

人工智能 2023年6月16日
0081
Mediapipe实战——导出身体节点坐标并用TensorFlow搭建LSTM网络来训练自己的手势检测模型再部署到树莓派4B

一、前言在YouTube上看到up主——Nicholas Renotte的相关教程，觉得非常有用。使用他的方法，我训练了能够检测四种手势的模型，在这里和大家分享一下。附上该up主的…

人工智能 2023年6月23日
0085
Ubuntu18.04挂载错误后修复

由于操作失误,把硬盘挂载到了/home,导致系统启动失败,用Ubuntu的安装U盘进入Try,然后输入以下命令: sudo gedit ./etc/fstab 发现fstab文件是…

人工智能 2023年6月4日
0093
人工智能理解与解析

目录人工智能概述智能意识应用领域应用行业人工智能影响推测人工智能商业落地伴随着GDP增速放缓，中国进入互联网下半场，40万亿5G新基建，伴随5G的全面商业化应用的开展…

人工智能 2023年6月1日
0090
关于神经网络的模型训练时loss和val_loss变化的问题（笔记整理）

train loss 下降⬇，val loss下降⬇，说明网络仍在学习；~~ 奈斯，继续训练train loss 下降⬇，val loss上升⬆，说明网络开始过拟合了；~~ 赶紧停…

人工智能 2023年6月16日
0098
协同过滤算法是否适用于大规模分布式系统

是否适用于大规模分布式系统？在大规模分布式系统中，协同过滤算法可以应用于推荐系统、个性化广告等领域。协同过滤算法通过分析用户的历史行为和评分，找出相似的用户或物品，从而进行推荐。…

人工智能 2024年1月2日
0046
【OpenCV 例程200篇】209. HSV 颜色空间的彩色图像分割

OpenCV 例程200篇总目录【youcans 的 OpenCV 例程300篇】209. HSV 颜色空间的彩色图像分割 5.1 HSV 颜色空间的彩色图像分割 HSV 模型…

人工智能 2023年6月17日
00105
最基本的25道深度学习面试问题和答案

近年来，对深度学习的需求不断增长，其应用程序被应用于各个商业部门。各公司现在都在寻找能够利用深度学习和机器学习技术的专业人士。在本文中，将整理深度学习面试中最常被问到的25个问题和…

人工智能 2023年7月25日
0061
Opencv中circle(),line(),cv2.rectangle(),cv2.putText()

Opencv中circle(),line(),cv2.rectangle(),cv2.putText() 一、circle()画圆 cv2.circle() 方法用于在任何图像上绘…

人工智能 2023年7月19日
0058
从零开始的线性回归的代码实现

（注：我们将从零开始实现整个方法，包括流水线，模型，损失函数和小批量随机梯度下降优化器）一：需要的包，并载入 random（juterbook好像是自带了） torch d2l …

人工智能 2023年6月17日
0099
语音转文本中如何解决多人交谈引起的干扰问题

问题介绍语音转文本是将语音信号转换为文本形式的技术。在多人交谈场景中，会出现多个人同时说话的情况，这会导致语音转文本系统在处理时出现干扰。本文将详细介绍如何解决多人交谈引起的干扰…

人工智能 2024年1月3日
0046
深度学习跨层网络结构–特征融合

### 回答1：《PyTorch生物医学视觉深度学习_入门与实战–豪华版》是一本针对生物医学领域的 _深度学习_入门教材。它涵盖了PyTorch框架下的生物医学图像…

人工智能 2023年7月27日
0061
Linux环境下OpenCV的安装与配置

目录安装 1.准备工作 1.1C/C++编译环境配置 1.2安装相关依赖库 2.安装OpenCV 3.OpenCV测试问题汇总问题1：部分软件包无法下载，网络连接失败问题2…

人工智能 2023年6月18日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31