图解来啦！机器学习工业部署最佳实践！10分钟上手机器学习部署与大规模扩展 ⛵

2023年10月29日下午2:45 • Python • 阅读 48

💡 作者：韩信子@ShowMeAI
📘 机器学习实战系列：https://www.showmeai.tech/tutorials/41
📘 深度学习实战系列：https://www.showmeai.tech/tutorials/42
📘 本文地址：https://www.showmeai.tech/article-detail/396
📢 声明：版权所有，转载请联系平台与作者并注明出处
📢 收藏ShowMeAI查看更多精彩内容

📘BentoML; 是一个用于机器学习模型服务的开源框架，设计初衷是让数据科学和 DevOps（software development and IT operations）之间的衔接更顺畅。数据科学家更多的时候聚焦在模型的效果优化上，而对于模型部署和管理等开发工作涉及不多。借助 BentoMl 可以轻松打包使用任何 ML 框架训练的模型，并重现该模型以用于生产。

BentoML有以下优点：

将 ML 模型转换为生产就绪的 API 非常简单
高性能模型服务，并且全部使用 Python
标准化模型打包和 ML 服务定义以简化部署
支持所有主流的机器学习训练框架
通过 Yatai 在 Kubernetes 上大规模部署和运行 ML 服务

在本篇内容中，ShowMeAI就带大家来详细了解一下 BentoML 和模型部署相关的知识和实践方法。

💡 训练模型之后的工作

算法工程师完成针对业务场景的建模与调优之后，我们就需要进行后续上线部署工作。

如果团队中的开发人员（例如后端或前端开发人员）想要使用它，他们需要需要封装好的服务接口 API 模式。
如果 DevOps 团队想要管理模型的部署，则需要处理模型环境和各种依赖项。
如果产品团队想要对模型进行压力测试或向客户展示它，那么 API 必须扩展到能支撑并发请求。

从构建 ML 模型到实际生产环境使用，有很多工作和注意点：

多个 ML 框架的使用和支持
创建 API 并以最低性能水平提供服务
再现性和依赖性管理
API 文档
监控、日志记录、指标等

下面ShowMeAI带大家来看看 BentoML 是如何支持所有这些需求的。

💡 BentoML 简介&核心思想

BentoML 是用于模型服务和部署的端到端解决方案。BentoML 将 ML 项目中需要的一切打包成一种称为 bento（便当）的分发格式（便当最初是一种日本午餐盒，里面装着一份由主菜和一些配菜组成的单份餐点）。

更准确地说，bento 是一个文件存档，其中包含模型训练的所有源代码、定义的API 、保存的二进制模型、数据文件、Dockerfile、依赖项和其他配置。我们可以将这里的”便当”视为用于 ML 的 Docker 映像。

当 bento 构建完成后（下文会详细说明），你可以将它变成一个可以部署在云上的 Docker 镜像，或者使用 bentoctl（它依赖 Terraform）将 bento 部署到任何云服务和基础设施上（例如 AWS Lambda 或 EC2、GCP Cloud Run、Azure functions等）。

💡 模型版本化及存储

可以通过 pip install bentoml命令安装 bentoml

安装后， bentoml命令已添加到您的 shell。

可以使用 BentoML 将模型保存在特定文件夹（称为模型存储）中。在下面的示例中，我们保存了一个在鸢尾花数据集上训练的 SVC 模型。

import bentoml

from sklearn import svm
from sklearn import datasets

Load training data set
iris = datasets.load_iris()
X, y = iris.data, iris.target

Train the model
clf = svm.SVC(gamma='scale')
clf.fit(X, y)

Save model to the BentoML local model store
saved_model = bentoml.sklearn.save_model("iris_clf", clf)
print(f"Model saved: {saved_model}")

Model saved: Model(tag="iris_clf:hrcxybszzsm3khqa")

这会生成一个唯一的模型标签，我们可以获取相应的模型，如下图所示。

它还会创建一个以模型标签命名的文件夹。打开和查看此文件夹，会找到二进制文件和一个名为 model.yaml描述模型元数据。

💡 创建推理服务（模型访问 API 化）

创建模型并将其保存在模型存储中后，您可以将其部署为可以请求的 API 。

在下面的示例中，用 api当有效负载数据（Numpy Ndarray 类型）通过 HTTP POST 请求发送到 /classify路径进行访问。

 import numpy as np
 import bentoml
 from bentoml.io import NumpyNdarray

 iris_clf_runner = bentoml.sklearn.get("iris_clf:latest").to_runner()

 svc = bentoml.Service("iris_classifier", runners=[iris_clf_runner])

 @svc.api(input=NumpyNdarray(), output=NumpyNdarray())
 def classify(input_series: np.ndarray) -> np.ndarray:
     result = iris_clf_runner.predict.run(input_series)
     return result

接下来就可以通过使用以下命令运行服务来在本地提供模型：

bentoml serve service:svc --reload

上述命令会开启一个 HTTP 本地服务，我们可以使用 Python 请求该服务，代码如下：

import requests

requests.post(
  "http://127.0.0.1:3000/classify",
  headers={"content-type": "application/json"},
  data="[[5.9, 3, 5.1, 1.8]]"
).text

'[2]'

也可以通过界面访问和请求（在浏览器访问 http://localhost:3000）)

💡 定制 bento “便当”

可以手动定制 bento “便当”，我们先创建一个名为 bentofile.yaml的配置文件，它配置了 bento 的构建方式：包括元数据、列出有用的源代码并定义包列表。

service: "service:svc"  # Same as the argument passed to bentoml serve
labels:
   owner: bentoml-team
   stage: dev
include:
- "*.py"  # A pattern for matching which files to include in the bento
python:
   packages:  # Additional pip packages required by the service
   - scikit-learn
   - pandas

要构建打包便当，请在包含的文件夹中运行以下命令：

bentoml build

运行完成之后，如果我们查看”便当”并检查里面的内容，将看到以下文件夹结构，其中包含以下内容：

API的描述和架构
构建 Docker 镜像所需的 Dockerfile
Python及环境依赖
经过训练的模型及其元数据
训练模型和定义 API 路由的源代码
bento 构建选项配置文件 bentoml.yaml

💡 打包 bento 为 Docker 镜像

创建便当后，您可以使用 dockerize命令来构建镜像，BentoML 提供了这个简单的命令方便使用。具体操作如下：

bentoml containerize iris_classifier:latest

构建镜像后，您可以在系统上查看它：

这里的 Docker 镜像是独立的，用于在本地提供服务或将其部署到云中。

docker run -it --rm -p 3000:3000 iris_classifier:jclapisz2s6qyhqa serve --production

💡 使用 Runners 扩展并行推理

借助于bentoml架构，可以独立运行处理器处理不同服务。也就是说，在预估阶段，我们的推理管道可以有任意数量的运行器，并且可以垂直扩展（通过分配更多 CPU）。每个runner也可以有特定的配置（RAM、CPU 与 GPU 等）。

在以下示例中，两个运行器（一个执行 OCR 任务，另一个执行文本分类）在输入图像上顺序运行。

import asyncio
import bentoml
import PIL.Image

import bentoml
from bentoml.io import Image, Text

transformers_runner = bentoml.transformers.get("sentiment_model:latest").to_runner()
ocr_runner = bentoml.easyocr.get("ocr_model:latest").to_runner()

svc = bentoml.Service("sentiment_analysis", runners=[transformers_runner, ocr_runner])

@svc.api(input=Image(),output=Text())
def classify(input: PIL.Image.Image) -> str:
    ocr_text = ocr_runner.run(input)
    return transformers_runner.run(ocr_text)

对于 runners 感兴趣的同学可以在 📘这里查看官方的更多讲解.

💡 自适应批处理

在机器学习中，批处理是很常见的处理模式，在批处理模式下，可以并行地进行数据处理，而非串行等待。它提高了性能和吞吐量并利用了加速硬件（我们都知道GPU就可以对向量化计算进行批量化处理）。

不过FastAPI、Flask 或 Django 等 Web 框架没有处理批处理的机制。但是 BentoML 为批处理提供了一个很好的解决方案。它是上图这样一个处理过程：

多输入请求并行处理
负载均衡器在worker之间分发请求（worker是 API 服务器的运行实例）
每个worker将请求分发给负责推理的模型运行器
每个运行器通过在延迟和吞吐量之间找到权衡来动态地将请求分批分组
runner对每个批次进行预测
最后将批量预测拆分并作为单独的响应返回

要启用批处理，我们需要设置 batchable参数为 True。如下例：

bentoml.pytorch.save_model(
    name="mnist",
    model=model,
    signature={
        "__call__": {
            "batchable": True,
            "batch_dim": (0, 0),
        },
    },
)

对于批处理感兴趣的同学可以在 📘这里查看官方的更多讲解.

💡 并行推理

BentoML 的 runners 设计非常巧妙，我们可以根据需要组合它们，创建可自定义的推理图。在前面的示例中，我们观察了两个顺序运行的runner（任务顺序为 OCR -> 文本分类）。

下面示例中，可以看到运行器也可以通过异步请求并发运行。

import asyncio
import PIL.Image

import bentoml
from bentoml.io import Image, Text

preprocess_runner = bentoml.Runner(MyPreprocessRunnable)
model_a_runner = bentoml.xgboost.get('model_a:latest').to_runner()
model_b_runner = bentoml.pytorch.get('model_b:latest').to_runner()

svc = bentoml.Service('inference_graph_demo', runners=[
    preprocess_runner,
    model_a_runner,
    model_b_runner
])

@svc.api(input=Image(), output=Text())
async def predict(input_image: PIL.Image.Image) -> str:
    model_input = await preprocess_runner.async_run(input_image)

    results = await asyncio.gather(
        model_a_runner.async_run(model_input),
        model_b_runner.async_run(model_input),
    )

    return post_process(
        results[0], # model a result
        results[1], # model b result
    )

💡 云端部署

BentoML 的”便当”的妙处在于，一旦完成构建，我们可以通过两种方式部署它：

① 将 Docker 镜像推送和部署到云端
② 通过使用由 BentoML 团队开发的 bentoctl 来部署

使用 bentoctl 有助于将构建的 bento 部署为云上的生产就绪 API 端点。它支持许多云提供商（AWS、GCS、Azure、Heroku）以及同一云提供商（AWS Lambda、EC2 等）中的多种服务。核心的部署步骤为：

安装 BentoML
安装 📘Terraform
设置 AWS CLI 并完成配置（请参阅 📘安装指南）
安装 bentoctl (pip install bentoctl)
构建好 bento”便当”
安装允许在 AWS Lambda 上部署的 aws-lambda 运算符（bentoctl 也支持其他运算符）： bentoctl operator install aws-lambda
通过运行生成部署文件 bentoctl init
通过运行构建部署所需的镜像 bentoctl build
通过运行 🚀 部署到 Lambda bentoctl apply -f deployment_config.yaml

部署完成后，系统会提示您提供一个 API URL，我们可以请求该 URL 与模型进行交互。

💡 API 文档和交互式 UI

当部署 BentoML 服务或在本地提供服务时，可以访问 📘Swagger UI，借助它可以可视化 API 资源并与之交互。如下例，它根据 OpenAPI 规范生成的，非常方便后端和客户端调用服务使用。

参考资料

推荐阅读

Original: https://www.cnblogs.com/showmeai/p/16938150.html
Author: ShowMeAI
Title: 图解来啦！机器学习工业部署最佳实践！10分钟上手机器学习部署与大规模扩展 ⛵

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/807611/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

手把手教你玩转 Gitea｜在 Windows 系统上安装 Gitea

Gitea 支持在 Windows 系统上安装和使用。Gitea 本身作为一个单体应用程序，即点即用，如需长期驻留作为后台服务并开机运行就要依靠 Windows 服务工具 sc.e…

Python 2023年10月19日
0035
Django中根据URI来获取返回的数据

1，首先，如果url传递的参数形式是这样的： http://192.168.1.210:8999/category/id=4 那我们需要写一个方法来获取url传递的参数，然后再和从…

Python 2023年8月4日
0070
Python从门到精通(五):文件处理-04-xml文件处理

Python从门到精通(五):文件处理-04-xml文件处理原创生而为人我很遗憾2022-06-24 17:47:38博主文章分类：python ©著作权文章标签 html …

Python 2023年5月25日
0073
第一单元初始Django上

GET 获取服务端数据 POST 向服务端提交数据 PUT向服务端上传数据DELETE删除服务端通过 200 客户端的请求服务端正常完成 301 客户端请求的资源已被永久移动到新的…

Python 2023年8月4日
0063
Flask项目（二）Restful风格、图片、短信验证码、注册登录

Flask项目 Restful风格如何设计符合RESTful风格的API * 一、域名：二、版本：三、路径： * 四、使用标准的HTTP方法：五、过滤信息：六、状态码： …

Python 2023年8月11日
0045
Python3 编程面试题

Python global 语句的作用 lambda 匿名函数好处 Python 错误处理 Python 内置错误类型简述 any() 和 all() 方法 Python 中什么…

Python 2023年10月30日
0024
GO编译时避免引入外部动态库的解决方法

最近碰到一个问题，有一个流量采集的组件中使用到了github.com/google/gopacket 这个库，这个库使用一切正常，但是唯独有一个缺点，编译后的二进制文件依赖于lib…

Python 2023年10月18日
0035
Python 爬取天气数据

Python 2023年5月24日
0059
小虫吃草（基础版）

主方法 import sys from wg import * screen = pygame.display.set_mode((800, 800)) pygame.displa…

Python 2023年9月19日
0041
scrapy__邓治安

命令提示符下载需要的依赖包 python -m pip install –upgrade pip 这条是更新 pip install wheel pip install…

Python 2023年10月2日
0044
【Windows】六种正确清理C盘的方法，解决你的红色烦恼

如何正确的清理C盘前言清理方法 * 1. 利用Windows自己附带的磁盘清理工具 2. 开启自动清理 3. 通过”配置存储感知或立即运行”来清理 4….

Python 2023年10月27日
0038
【移动安全】—apk反编译基础及静态分析

作者名：Demo不是emo 主页面链接：主页传送门创作初心：一切为了她座右铭：不要让时代的悲哀成为你的悲哀专研方向：网络安全，数据结构每日emo： ctf被大佬吊打的一天，裂开 …

Python 2023年11月6日
0038
已解决ModuleNotFoundError: No module named ‘paddle‘

已解决（paddleocr导包报错）ModuleNotFoundError: No module named ‘paddle’ 文章目录报错代码报错翻译…

Python 2023年8月2日
0041
部分聚类算法简介及优缺点分析

之前项目有聚类的一些需求，现大致对一些聚类算法总结下：聚类是对一系列事物根据其潜在特征按照某种度量函数归纳成一个个簇的动作，使得簇内数据间的相似度尽可能大，不同簇的数据相似度尽可…

Python 2023年10月28日
0048
【web】web前端table循环显示整理（列表+字典+QuerySet）

文章目录一、列表 * 1.1 后端数据 1.2 前端代码 1.3 前端效果 1.4 python与django遍历列表的区别： – 1.4.1 python 1.4….

Python 2023年8月6日
00131
《外星人入侵》——基于蟒蛇书

外星人入侵蟒蛇书源代码下载：图灵社区随书下载最近开始系统学习python基础，主要目的是为了接触数据挖掘以及数据可视化分析。通过跟着书做一些项目来巩固基础，并明确了解大致项目制…

Python 2023年9月23日
0035

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

图解来啦！机器学习工业部署最佳实践！10分钟上手机器学习部署与大规模扩展 ⛵

大家都在看