DJL快速入门（纯Java跑深度学习模型）

2023年6月16日下午3:55 • 人工智能 • 阅读 98

文章目录

1. 本文介绍
2. DJL核心内容讲解
*
2.1 DJL简介
2.2 DJL核心API
–
3. 实战：DJL使用Pytorch模型完成图片分类
参考资料
本文介绍

服务端大多都是用Java做的，而深度学习模型大多又是用Python写的，所以很多人都是用Java调Python的接口，这样效率低，而且也不优雅，最重要的是 如果想使用Android做推理，那就必须要用Java写了。

本文使用了一个重要的工具：Deep Java Library，这是一个用Java进行深度学习的库，你可以用它来进行模型推理，甚至是训练模型。很多文章也都介绍过该模型，但是他们都漏了一个重要的内容： 深度学习代码不只是推理部分，还有很多预处理和后续处理的部分需要很多Tensor操作，但是他们都没说怎么做。

为了符合大家的实际需求，本文不使用DJL进行模型训练，只做推理。本文的具体内容包括：

DJL核心内容讲解
DJL加载Pytorch模型
DJL的Tensor操作
DJL简单案例（DJL使用Pytorch模型完成图片分类）
DJL核心内容讲解

2.1 DJL简介

DJL是一个开源的深度学习 Java 框架（ 支持Android），其可以用于深度学习模型构建和训练、 Tensor操作、 使用预训练好的常见模型（MXNet、Pytorch、TensorFlow等）。 Java1.8 以上就可以用，且 支持GPU

2.2 DJL核心API

在实际案例之前，先讲解下DJL的核心API，这样在后续的案例也知道代码是做什么的。

2.2.1 Criteria

Criteria 类对象定义了模型的情况，如模型路径、输入和输出等。

例如，这是一段初始化DJL模型的代码：

Criteria<Input, Output> criteria = Criteria.builder()
        .setTypes(Input.class, Output.class)
        .optTranslator(new InputOutputTranslator())
        .optModelPath(Paths.get("/var/models/my_resnet50"))
        .optModelName("model/resnet50")
        .build();

ZooModel<Image, Classifications> model = criteria.loadModel();

在上述代码中，Criteria描述了模型的情况，主要包含以下几点：

Criteria<i, o></i,> 定义了模型输入和输出。这里的 I 和 O 可以是自定义的类，也可以使用DJL提供的类。
setTypes(I.class, O.class)：这个代码是必须的。直接从泛型的 I, O是获取不到输入和输出的 class对象的，所以需要手动设置一下。
optModelTranslator：模型的输入和输出是一个Tensor类型。这里就是设置你的 I类和 O类应该如何与Tensor类型进行转化。后续会具体讲 Translator。
optModelName：设置一下模型名称

定义好模型的情况，就可以使用 loadModel方法实例化出 Model Zoo 对象了。

Model Zoo 是DJL的模型，你需要通过该类对象对模型进行进行管理，例如创建模型、创建Predictor，保存模型等。

2.2.2 Translator

在上一节中，模型的输入类和输出类是可以自定义的，但Pytorch模型不可能接收你自己定义的类对象啊，它只会接受Tensor类型，所以我们就需要使用 Translator接口来定义如何将我们的自定义输入输出类转换为Tensor类型。

private Translator<Input, Output> translator = new Translator<Input, Output>() {

    @Override
    public NDList processInput(TranslatorContext ctx, Input input) throws Exception {
        return null;
    }

    @Override
    public Output processOutput(TranslatorContext ctx, NDList ndList) throws Exception {
        return null;
    }
};

Translator接口包含两个接口：

processInput：将输入类对象转化为Tensor。这里的Input就是输入类对象，而 NDList就是Tensor的集合（因为模型的forward可能会接收多个Tensor参数）。在DJL中，Tensor对应的类为 NDArray（类似numpy中的ndarray），后续会详细讲解。
processOutput：将模型输出的Tensor转换为自定义类。由于模型可能会输出多个Tensor，所以这里也是 NDList。

上述这两个方法还包含一个重要的参数 TranslatorContext，这个保存了Translator的上下文，可以用它来拿到一些对象（Model, Predictor等），也可以通过 setAttachment 和 getAttachment 方法来存取一些东西。

在官方的例子中，Translator是对图像进行处理，但Translator并非只能处理图像，这里的Input和Output可以是任意Java类。

2.2.3 NDArray

在python中，我们有numpy，而在Java中，我们有DJL的NDArray，使用该类，我们几乎可以实现Numpy中的所有Tensor操作。本节将会介绍常用的tensor操作。

开始前先介绍与NDArray相关的几个类：

NDArray：相当于 numpy.ndarray，可以通过 getShape()方法获取其shape
NDManager：NDArray的管理类，全局new一个就行了，需要用该类对象创建NDArray
NDIndex：用于对Tensor进行切片
Shape: 创建NDArray的时候，需要指定Shape。获取NDArray的Shape时返回的也是该类的对象。

接下来开始具体演示Tensor的常见操作（这里只举几个例子，有不会的操作可以在评论区告知，我会进行补充）：

创建NDArray(Tensor)

创建一个Shape为 (1,2,3,4)的Tensor

NDManager ndManager = NDManager.newBaseManager();
NDArray ndArray = ndManager.create(new Shape(1, 2, 3, 4));

ndManager全局应只创建一个

指定值创建：

ndManager.create(new int[]{1, 2, 3, 4});

变更数据类型

变为float类型

ndManager.create(new int[]{1, 2, 3, 4}).toType(DataType.FLOAT32, false);

变为float数组：

ndManager.create(new int[]{1, 2, 3, 4}).toType(DataType.FLOAT32, false)
                                    .toFloatArray();

注意，在toArray()前需要将NDArray转变为相对应的类型，且字节数要对上。例如在java中float是使用32个bit(4个字节)存储的，所以NDArray的类型必须是Float32，不能是Float64，否则会报错。

运算

加减乘除：

ndArray.add(1);
ndArray.sub(1);
ndArray.mul(1);
ndArray.div(1);

也可以使用 NDArrays.add，类似 np.add()：

NDArrays.add(ndArray, ndArray);

切片

NDArray ndArray = ndManager.arange(24).reshape(3, 8);
ndArray = ndArray.get(new NDIndex("1:, :"));

等价于python中的 [1:, :]

DJL的切片好像不能指定index，例如 x = [1,2,3], y = [2,3,4]，然后切片 nums[x, y]。 DJL中我还没找到应该如何这样切，所以我只能自己用for循环实现，如果大家知道怎么弄，欢迎在评论区告诉我

赋值

NDArray ndArray = ndManager.arange(24).reshape(3, 8);
ndArray.set(new NDIndex("1:, :"), 1);

等价于Python的 ndArray[1:, :] = 1

翻转

在Python中，对数组进行翻转可以使用 [..., ::-1]，但java中不行，但可以利用 flip函数实现

NDArray ndArray = ndManager.arange(24).reshape(3, 8);
ndArray = ndArray.flip(-1);

2.2.3 Predictor

创建好模型后，需要new一个Predictor，然后用这个 Predictor进行预测：

predictor = zooModel.newPredictor();
Output output = predictor.predict(input);

到这里DJL常用的API就讲完了，接下来使用一个简单的案例进行实战。

实战：DJL使用Pytorch模型完成图片分类

这里使用Pytorch提供的resnet18模型完成一个图片分类任务。

首先引入依赖：

<dependency>
    <groupId>ai.djl.pytorchgroupId>
    <artifactId>pytorch-engineartifactId>
    <version>0.17.0version>
    <scope>runtimescope>
dependency>

<dependency>
    <groupId>ai.djl.pytorchgroupId>
    <artifactId>pytorch-native-cpuartifactId>
    <classifier>win-x86_64classifier>
    <scope>runtimescope>
    <version>1.11.0version>
dependency>
<dependency>
    <groupId>ai.djl.pytorchgroupId>
    <artifactId>pytorch-jniartifactId>
    <version>1.11.0-0.17.0version>
    <scope>runtimescope>
dependency>

<dependency>
    <groupId>ai.djlgroupId>
    <artifactId>apiartifactId>
    <version>0.17.0version>
dependency>

<dependency>
    <groupId>ai.djlgroupId>
    <artifactId>basicdatasetartifactId>
    <version>0.17.0version>
dependency>

<dependency>
    <groupId>ai.djl.opencvgroupId>
    <artifactId>opencvartifactId>
    <version>0.17.0version>
dependency>

导出pytorch的resnet18模型：

import torch
import torchvision

model = torchvision.models.resnet18(pretrained=True)

model.eval()

example = torch.rand(1, 3, 224, 224)

traced_script_module = torch.jit.trace(model, example)

traced_script_module.save("traced_resnet_model.pt")

将导出的模型拷贝到项目的model目录下：
创建Translator，这里我们定义输入为 String类型，表示图片的输入路径；输出也为 String，表示类别。将图片送入Resnet18网络，需要做一些预处理：

...

preprocess = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])
...

这里利用Java的NDArray的

Translator<String, String> translator = new Translator<String, String>() {

    @Override
    public NDList processInput(TranslatorContext ctx, String input) throws Exception {

        Image image = ImageFactory.getInstance().fromFile(Paths.get(input));
        NDArray ndArray = image.toNDArray(ctx.getNDManager());

        Resize resize = new Resize(256, 256);
        ndArray = resize.transform(ndArray);

        ndArray = ndArray.get(new NDIndex("16:240, 16:240, :"));

        ndArray = new ToTensor().transform(ndArray);

        Normalize normalize = new Normalize(new float[]{0.485f, 0.456f, 0.406f}, new float[]{0.229f, 0.224f, 0.225f});
        ndArray = normalize.transform(ndArray);

        return new NDList(ndArray);
    }

    @Override
    public String processOutput(TranslatorContext ctx, NDList list) throws Exception {

        int index = list.get(0).argMax().toType(DataType.INT32, false).getInt();

        return index + "";
    }
};

定义 Criteria，然后实例化模型，并new Predictor

Criteria<String, String> criteria = Criteria.builder()
        .setTypes(String.class, String.class)
        .optModelPath(Paths.get("model/traced_resnet_model.pt"))
        .optOption("mapLocation", "true")
        .optTranslator(translator)
        .build();

ZooModel model = criteria.loadModel();
Predictor predictor = model.newPredictor();

准备一张图片，我这里放在项目的test目录下：

进行预测

System.out.println(predictor.predict("test/test.jpg"));

由于resnet可以识别1000个物体，太多了，所以我只输出了index，全部的类别可以到该链接查找。最终输出为：

258对应的类别为Samoyed（萨摩耶），可以看得到预测对了。

DJL更多的例子可以参考官方Demo。

参考资料

Deep Java Library官方文档：https://docs.djl.ai/

Dive Into Deep Learning: https://d2l.djl.ai/chapter_preliminaries/ndarray.html

djl-demo: https://github.com/deepjavalibrary/djl-demo

Original: https://blog.csdn.net/zhaohongfei_358/article/details/125501778
Author: iioSnail
Title: DJL快速入门（纯Java跑深度学习模型）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/625194/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

R2CNN模型——用于文本目标检测的模型

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

人工智能 2023年6月6日
0080
人脸识别系统FaceNet原理

概述近年来，随着深度学习在CV领域的广泛应用，人脸识别领域也得到了巨大的发展。在深度学习中，通过多层网络的连接，能够学习到图像的特征表示，那么两张人脸的图像，是不是可以通过深度学…

人工智能 2023年6月16日
0058
哪些蓝牙耳机口碑比较好？平价好用的蓝牙耳机推荐

如今，有线耳机的使用率越来越低，很多人首先选择无线蓝牙耳机。很多人在选购蓝牙耳机时，都希望能选择既便宜又好用又不浪费钱的产品，所以很多朋友都希望我能把便宜好用的蓝牙耳机推荐总结出来…

人工智能 2023年5月25日
0087
Matlab的神经网络（一）BP网络

感觉这个讲解的很好，要把里面的参数弄明白； BP神经网络的matlab写法： 1.导入数据（导入.mat数据，用load函数导入） 2.随机产生训练集和测试集（用randperm函…

人工智能 2023年6月15日
0059
如此优雅，4款 Python 自动数据分析神器真香啊

我们做数据分析，在第一次拿到数据集的时候，一般会用统计学或可视化方法来了解原始数据。比如了解列数、行数、取值分布、缺失值、列之间的相关关系等等，这个过程我们叫做 EDA（Explo…

人工智能 2023年7月7日
0079
pandas学习笔记

pandas学习笔记 1.导入pandas库 import pandas as pd 2.文件的导入导出 data=pd.read_csv("1.csv",en…

人工智能 2023年6月29日
0087
记录使用tensorflow时的一些报错

ImportError: cannot import name ‘abs’ 问题在于，tensorflow和protobuf发生了冲突。先删掉tensor…

人工智能 2023年5月25日
00105
实体关系抽取笔记（一）

1. 背景实体关系抽取是NLP领域的一个基础任务，在文本挖掘、信息检索、智能问答等领域广泛存在、非常重要。实体关系抽取是指在实体识别的基础上从非结构化文本中抽取出预先定义的实体关…

人工智能 2023年5月28日
0055
典型卷积神经网络算法（AlexNet、VGG、GoogLeNet、ResNet）

好好学习，天天向上！活动地址：CSDN21天学习挑战赛一、 AlexNet 1.结构 ●AlexNet有八个带权层，前五个是卷积层，剩下三层是全连接层。第一个卷积层利用96…

人工智能 2023年6月24日
0080
率先推出器件可替代分析功能，达观知识图谱推理技术赋能库存管理智能化

一直以来，备件管理是工业制造型企业库存管理的重要工作，也是公司降低运营成本、改善库存周转效率的主要举措。完善的管理体系结合先进的技术，是工业制造领域优秀企业的进行库存管理的关键。达…

人工智能 2023年6月10日
0093
RCNN原文理解与代码分析

RCNN是比较老的行人检测算法，用到的各项技术也都是很古老的方法，对于算法急速更新的现状来看，它的作用不大，但是却可以帮助我们入门行人检测算法。充分理解它的每个过程可以帮助我们对行…

人工智能 2023年7月28日
0074
关系抽取方法总结（基于规则-传统机器学习-深度学习）

信息抽取——命名实体识别文章目录 1 关系抽取介绍 2 基于规则的关系抽取算法 * 2.1 基于触发词（基于模式） 2.2 基于依存关系（语法树） 2.3 基于规则的RE优缺点…

人工智能 2023年5月27日
00105
【FreeSwitch开发实践】UniMRCP编译与安装

🏠 博客主页：小小马车夫的主页🍅 所属专栏：FreeSwitch开发实践🥝 专栏介绍：主要介绍博主在实际项目中使用FreeSwitch开发外呼类项目的一些经验心得，主要涉及Free…

人工智能 2023年5月25日
0093
分享本周所学——人工智能语音识别模型CTC、RNN-T、LAS详解

本人是一名人工智能初学者，最近一周学了一下AI语音识别的原理和三种比较早期的语音识别的人工智能模型，就想把自己学到的这些东西都分享给大家，一方面想用浅显易懂的语言让大家对这几个模型…

人工智能 2023年6月23日
0092
机器人抓取系列——CBAM注意力机制

因为本项目对点云分割网络进行了一些改进，引入了注意力机制，因此今天将注意力机制模块进行一个简单的介绍注意力机制在计算机视觉中能够能够把注意力聚集在图像重要区域而丢弃掉不相关的方…

人工智能 2023年6月17日
0098
万字长文让你学会MyBatis

又是一篇万字长文，万字长文让你学会Mybatis 目录 MyBatis介绍： mybatis快速入门： Mapper代理开发：完成品牌数据的增删改查操作准备阶段：（1）查询所…

人工智能 2023年6月30日
0053

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31