Stable Diffusion8

2023年7月30日下午3:14 • 人工智能 • 阅读 80

也写到第八了 ~~ 这次还是和mac相关哦~~

先吹吹,苹果亲自下场优化，在iPhone、iPad、Mac等设备上以惊人的速度运行Stable Diffusion就是这么简单。

输入一句话就能生成图像的 Stable Diffusion 已经火爆数月。它是一个开源模型，而且在消费级 GPU 上就能运行，是一项普通人就能接触到的「黑科技」。

在该模型走红之初，就有人尝试将其移植到苹果设备上运行，比如 M1 Mac、iPhone 14 Pro，并把教程传授给大家。

但令人没想到的是，前几天，苹果竟亲自下场了，手把手教大家如何直接将 Stable Diffusion 模型转换为自家 iPhone、iPad 和 Mac 可以运行的版本。

以下是生成结果示例：

苹果在 macOS 13.1 和 iOS 16.2 中发布了针对 Stable Diffusion 的 Core ML 优化，并通过一个代码库对部署过程进行了详细讲解。

在三款苹果设备（M1 iPad Pro 8GB、M1 MacBook Pro 16GB、M2 MacBook Air 8GB）上的测试结果表明，苹果推出的相关优化基本可以保证最新版 Stable Diffusion（SD 2.0）在半分钟内生成一张分辨率为 512×512 的图。

对于苹果的这一举动，不少人感叹，一个开源社区构建的模型已经优秀到可以让大公司主动采用，确实非常了不起。

另外，大家也开始猜测，未来，苹果会不会直接把 Stable Diffusion 放到自己的设备里？

为什么要让 Stable Diffusion 可以在苹果设备上运行？

自 2022 年 8 月首次公开发布以来，Stable Diffusion 已经被艺术家、开发人员和爱好者等充满活力的社区广泛采用，能够以最少的文本 prompt 创建前所未有的视觉内容。相应地，社区在几周内就围绕这个核心技术构建了一个包含扩展和工具的庞大生态系统。Stable Diffusion 已经变得个性化，而且可以拓展到英语以外的其他语言，这要归功于像 Hugging Face diffusers 这样的开源项目。

除了通过文本 prompt 生成图像，开发人员还发现了 Stable Diffusion 其他创造性的用途，如图像编辑、修复、补全、超分辨率、风格迁移。随着 Stable Diffusion 应用的增多，要想打造出任何地方的创意人员都能使用的应用程序，就需要确保开发者能够有效地利用这项技术，这一点至关重要。

在所有应用程序中，模型在何处运行是 Stable Diffusion 的一大关键问题。有很多原因可以解释为什么在设备上部署 Stable Diffusion 比基于服务器的方法更可取。首先，终端用户的隐私可以受到保护，因为用户提供的作为模型输入的任何数据都保留在用户自己的设备上。

其次，在初次下载之后，用户不需要连接互联网就可以使用该模型。最后，在本地部署此模型能让开发人员减少或消除服务器方面的成本。

用 Stable Diffusion 产出可观的结果需要经过长时间的迭代，因此在设备上部署模型的核心挑战之一在于生成结果的速率。这需要执行一个复杂的流程，包括 4 个不同的神经网络，总计约 12.75 亿个参数。要了解更多关于如何优化这种大小和复杂性的模型，以在 Apple Neural Engine 上运行，可以参阅以前的文章：Deploying Transformers on the Apple Neural Engine。

文章地址：https://machinelearning.apple.com/research/neural-engine-transformers

上文中概述的优化原则可以推广到 Stable Diffusion，尽管它比文中研究的模型大 18 倍。为 Stable Diffusion 优化 Core ML 和简化模型转换，可以让开发者更容易在他们的应用程序中以保护隐私和经济可行的方式利用该技术，并使其在 Apple Silicon 上展现出的性能达到最佳状态。

这次发布的版本包括一个 Python 包，用于使用 diffusers 和 coremltools 将 Stable Diffusion 模型从 PyTorch 转换到 Core ML，以及一个 Swift 包来部署模型。请访问 Core ML Stable Diffusion 代码存储库以启动，并获取关于基准测试和部署的详细说明。

项目地址：https://github.com/apple/ml-stable-diffusion

项目介绍

整个代码库包括：

python_coreml_stable_diffusion，一个 Python 包，用于将 PyTorch 模型转换为 Core ML 格式，并使用 Python 版的 Hugging Face diffusers 执行图像生成；
StableDiffusion，一个 Swift 包，开发者可以把它作为依赖包添加到他们的 Xcode 项目中，在他们的应用程序中部署图像生成功能。Swift 包依赖于 python_coreml_stable_diffusion 生成的 Core ML 模型文件。

将模型转换为 Core ML 版本

步骤 1：创建 Python 环境并安装依赖包：

步骤 2：登录或注册 Hugging Face 账户，生成用户访问令牌，并使用令牌通过在终端窗口运行 huggingface-cli login 来设置 Hugging Face API 访问。

步骤 3：找到想在 Hugging Face Hub 上使用的 Stable Diffusion 版本，接受使用条款。默认型号版本为 “CompVis/stable-diffusion-v1-4″。

步骤 4：从终端执行以下命令生成 Core ML 模型文件 (.mlpackage)

python -m python_coreml_stable_diffusion.torch2coreml --convert-unet --convert-text-encoder --convert-vae-decoder --convert-safety-checker -o <output-mlpackages-directory></output-mlpackages-directory>

M1 MacBook Pro 一般需要 15-20 分钟。成功执行后，构成 Stable Diffusion 的 4 个神经网络模型将从 PyTorch 转换为 Core ML 版 (.mlpackage)，并保存到指定的 < output-mlpackages-directory>.

用 Python 生成图像

使用基于 diffusers 的示例 Python 管道运行文本到图像生成。

python -m python_coreml_stable_diffusion.pipeline --prompt "a photo of an astronaut riding a horse on mars" -i <output-mlpackages-directory> -o  --compute-unit ALL --seed 93</output-mlpackages-directory>

使用 Swift 生成图像

构建 Swift 项目需要：

macOS 13 或更新版本
安装了命令行工具的 Xcode 14.1 或更新版本。
Core ML 模型和 tokenization 资源。

如果将此模型部署到：

iPhone: iOS 16.2 及以上版本和 iPhone 12 及以上版本
iPad: iPadOS 16.2 或更新版本和 M1 或更新版本
Mac: macOS 13.1 或更新版本和 M1 或更新版本

Swift 包包含两个产品：StableDiffusion 库和 StableDiffusionSample 命令行工具。这两个产品都需要提供 Core ML 模型和 tokenization 资源。

性能基准测试

标准 CompVis/stable-diffusion-v1-4 基准。该基准测试由苹果公司在 2022 年 11 月使用 iOS 16.2、iPadOS 16.2 和 macOS 13.1 的公开测试版进行。

针对 macOS 设备，执行的程序是 python_coreml_stable_diffusion。对于 iOS 和 ipad 设备，有一个建立在 StableDiffusion Swift 包上的最小 Swift 测试应用程序。

图像生成过程遵循标准配置：

50 个推理步骤，512×512 输出图像分辨率，77 文本 token 序列长度，无分类器引导 (unet 批大小为 2)。

whaosoft aiot http://143ai.com

Original: https://blog.csdn.net/qq_29788741/article/details/128201020
Author: whaosoft143
Title: Stable Diffusion8

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/724265/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【机器学习】21天挑战赛学习笔记（二）

活动地址：CSDN21天学习挑战赛学习的最大理由是想摆脱平庸，早一天就多一份人生的精彩；迟一天就多一天平庸的困扰。各位小伙伴，如果您：想系统/深入学习某技术知识点……

人工智能 2023年6月2日
00104
GCN的通俗理解

GCN 一、与CNN的区别和联系 1、GCN（图卷积神经网络) 类似CNN（卷积神经网络），只不过CNN用于二维数据结构，GCN用于图数据结构。2、GCN实际上跟CNN的作用一样，…

人工智能 2023年6月13日
00133
kaldi代码编译

kaldi源码编译环境：centos7 如果下载速度较慢，可以尝试讲https改为git,即：git clone git://github.com/kaldi-asr/kaldi…

人工智能 2023年6月4日
0081
Elasticsearch：词分析中的 Normalizer 的使用

在 Elasticsearch 的词分析中，normalizer 与 analyzer 类似，只是它们只能发出一个 token。因此，它们没有 tokenizer，只接受可用 …

人工智能 2023年5月30日
0096
如何成为数据分析师？数据分析师的职业路线是什么样的？

很多人知道数据分析这个岗位，但是不知道具体的岗位职责是什么？以为会做表，会用EXCEL等于是数据分析师了? 其实不然，会EXCEL不代表会数据分析。众所周知，精通Excel不叫精…

人工智能 2023年7月16日
00122
深度学习(18):nerf、nerf-pytorch代码运行与学习

文章目录 0 前言一 NeRF代码运行–放弃复现 * 1.1 下载代码 1.2 配置环境 1.3 下载示例数据 1.4 运行demo 1.5 删除虚拟环境&#8211…

人工智能 2023年7月20日
00102
【使用Pytorch实现ResNet网络模型：ResNet50、ResNet101和ResNet152】

使用Pytorch实现Resnet网络模型：ResNet50、ResNet101和ResNet152 介绍什么是 ResNet？ ResNet 的架构使用Pytorch构建 R…

人工智能 2023年7月26日
00147
基于ROS的导航框架

前言这篇博客给各位介绍一下在ROS环境下常用的局部/全局的导航框架。在机器人运动控制当中。路径规划作为感知定位的下一个部分，机器人需要有一个比较合适的路径规划功能才能使机器人安全…

人工智能 2023年6月2日
00121
【竞赛】竞赛的常见思路和方案——目标检测

文章目录 1. 数据： 2 模型 3. 训练 4. 模型融合+后处理数据：数据研究：是如何获得的，宽高比，类别平衡，采样环境标注框和感受野的设置，rpn中anchor rat…

人工智能 2023年7月10日
0071
【视觉SLAM14讲】【汇总】

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月18日
0086
Python中的groupby分组

Python中的groupby分组一、groupby函数 groupby函数功能：对DataFrame进行分组（可单类分组，可多类分组）需求：按”字段”列…

人工智能 2023年7月4日
00118
基于Matlab的极限学习机(ELM)实现

最近打算做一些参数预测相关内容，选基学习器的时候注意到了极限学习机。极限学习机简介极限学习机（Extreme Learning Machine, ELM）最早于2004年由南洋…

人工智能 2023年6月15日
00107
Docker从入门到进阶之进阶操作(6) —— 【在docker上运行gitlab】

上一章节讲了使用docker来做nginx的负载均衡，这一章节讲【在docker上运行gitlab】在本章节中，将为您演示如何在docker上运行gitlab GitLab 是一…

人工智能 2023年6月29日
00107
利用科大讯飞webAPI实现语音识别

人工智能兴起，搞语音识别的公司很多，这里介绍怎么用科大讯飞提供的webAPI和python实现语音识别。讯飞还提供了sdk，但是需要在visal code上运行，vs体积太大为了…

人工智能 2023年5月23日
00118
C#快速入门（vs安装和环境配置）

一、Visual Studio安装（1）从网上下载VS的安装包文件（例如：vs2015.ent_chs.iso），双击该文件解压，其中vs_enterprise.exe启动安装向…

人工智能 2023年6月18日
0086
open-mmlab / mmpose安装、使用教程

mmpose安装、使用教程 mmpose 安装教程 * 1. 安装mmcv-full 2. 安装MMPose 2. 安装mmdet 使用教程 * 1. 预测图片 2. 预测视频 m…

人工智能 2023年6月16日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Stable Diffusion8

大家都在看