Java 和低延迟

2023年6月30日上午9:25 • 人工智能 • 阅读 68

Java 从一开始就被设计为在广泛的硬件和系统架构中以二进制级别可移植。这是通过设计和实现虚拟机（执行平台的抽象模型）并让它执行Java 源编译器的输出来完成的。争论的焦点是迁移到不同类型的硬件平台只需要移植虚拟机。应用程序和库无需修改即可运行（”一次编写，到处运行”的口号）。

但是，具有严格延迟和性能要求的应用程序通常需要在执行时尽可能接近硬件 – 他们希望从硬件中榨取所有可能的性能，并且不想要纯粹为了可移植性或像动态内存管理这样的抽象编程概念阻碍了。

多年来，Java 虚拟机已经发展成为一个极其复杂的执行平台，可以在运行时从 Java 字节码生成机器代码，并根据动态收集的指标优化该代码。这是静态编译语言（如 C++）无法做到的，因为它们没有所需的运行时信息。选择数据结构和算法时的谨慎方法可以最大限度地减少甚至消除垃圾收集的需要——这可能是 Java 运行时环境中最明显的一个方面，它阻止了一致的延迟时间。

但归根结底，Java 虚拟机只是——虚拟的——它需要在操作系统之上运行以管理其对硬件平台的访问。无论该操作系统是 Linux（可能是服务器端环境中使用最广泛的）、Windows 还是其他操作系统，问题仍然存在。

Linux 的”问题”
Linux作为 Unix 操作系统家族的一员，多年来一直在发展。Unix 的第一个版本是在 1960 年代后期开发的。它首先在学术界和研究界发展壮大并获得了极大的知名度，然后在商业界以各种形式出现。Linux 已成为 Unix 的主要变体——尽管它仍然保留了许多原始特性。如今，随着基于容器的执行环境和云的出现，它的主导地位几乎已经完全。

但是，从实时或延迟敏感型应用程序的角度来看，Linux/Unix 确实存在问题。这些主要源于 Unix 被设计为分时系统这一基本事实。它最初的硬件平台是微型计算机，同时被许多不同的用户共享。所有用户都有自己的工作要做，而 Unix 竭尽全力确保所有人都能”公平地分享”计算机资源。

实际上，操作系统会偏爱执行大量 I/O 的用户——包括在终端与系统交互——以牺牲主要执行计算的任务（所谓的 CPU 密集型作业）为代价。当我们考虑到当时的计算机几乎都是单 CPU（单核）时，这是有道理的。

然而，随着多 CPU 计算机的发展，需要对 Unix 操作系统的核心进行一些认真的重新设计，以允许有效地使用这些执行内核。但同样的方法仍然适用，交互式任务总是比 CPU 密集型任务更受欢迎。有了多个内核可用，最终效果仍然是提高整体性能。

如今，几乎每台计算机都将拥有多个内核，从手机等移动设备到工作站，再到服务器级机器。检查这些环境并查看我们是否可以采取不同的方法来改进平台以更有效地支持实时、延迟敏感的应用程序似乎是有效的。

我们如何解决这些问题？
在我工作的 Chronicle Software，我们已经开发了许多开源库来支持构建针对低延迟进行优化的应用程序，这是基于该领域多年的经验。本文的其余部分描述了我们学到的一些帮助我们实现这一目标的东西。

Java 运行时
影响 Java 应用程序延迟的主要问题是那些与垃圾收集堆管理和使用锁同步访问共享资源有关的问题。存在解决这两个问题的技术，尽管它们确实需要开发人员在一定程度上偏离惯用的 Java 编程风格。理想情况下，我们会使用封装较低级别细节和专门技术的库，但我们确实需要了解”幕后”正在发生的事情。

为低延迟应用程序设计的框架和库青睐的一种方法是绕过 Java 垃圾收集器，利用不属于正常 Java 堆的内存（称为”堆外”内存）。内存使用正常的操作系统机制映射到持久存储，或者通过网络连接复制到其他系统。

使用这种方法的明显优势是对内存的访问不受垃圾收集器的非确定性干预。缺点是管理在这些区域中创建的对象的生命周期成为应用程序或库的责任。

现代应用程序的通用架构在组件之间包含某种形式的通信，通常基于消息传递。消息在通信过程中被序列化为 JSON 或 YAML 等标准格式或从标准格式反序列化，提供此功能的库通常可以引入高级别的对象分配。经过仔细考虑，可以选择经过精心设计的库，以最大限度地减少新 Java 对象的创建，从而对性能产生积极影响。

从 Java 的早期开始，对共享可变数据的并发访问就使用互斥锁进行同步。如果一个线程试图获取另一个线程持有的锁，那么它会被阻塞，直到锁被释放。在多核环境中，可以使用不需要获取线程阻塞的替代技术来实现同步，并且已经表明，在大多数情况下，这对减少延迟有积极的影响。

编写此类代码并不简单，但是，可以在标准 Java 库中的 Lock 接口后面进行封装，甚至可以进一步定义允许通过标准 API 进行安全、无锁并发访问的数据结构。一些标准的 Java Collections 库使用这种方法，尽管这对用户是透明的。

Linux
公平地说，多年来，Unix 的”实时”变体已经为专门的应用程序提供了不同的执行环境。虽然这些通常是利基产品，但如今，这些方法和功能中的许多都可以在 Unix 和 Linux 的主流发行版中使用。

最小化延迟的特性通常分为两类，内存管理和线程调度。

Linux 进程中的所有内存，包括 Java 的垃圾收集堆，都会被临时”换出”到磁盘，以便其他进程可以在需要将内存重新带入之前将 RAM 用于自己的目的。这一切都会发生对进程完全透明，内存中的数据和后备存储中的数据之间的访问时间差异可能有几个数量级。当然，堆外内存也有同样的行为。

但是，现代 Unix 和 Linux 系统允许标记内存区域，以便操作系统在寻找要从进程中回收的区域时忽略它们。这意味着，对于该进程中的那些内存区域，内存访问时间将是一致的（并且总体上被认为更快）。不得不说，在繁忙的Java应用程序中，访问进程内存的频率会降低该内存被分页的可能性，但风险仍然存在。

以这种方式固定一个进程的内存意味着其他进程的内存更少，这可能会因此受到影响，但在”实时”世界中，我们必须有点自私！

为低延迟而设计的数据结构通常会默认或通过选项提供将其内存锁定或固定在 RAM 中的能力。

Java 程序中的线程，就像来自其他应用程序甚至操作系统任务的线程一样，可以访问由称为调度程序的操作系统组件管理的 CPU。调度程序有一组策略，用于决定选择哪些需要访问 CPU 的线程（称为 Runnable 线程）——通常 Runnable 线程比 CPU 多。

如前所述，Unix/Linux 中的传统调度策略旨在支持交互式线程而不是 CPU 绑定线程。如果我们试图运行对延迟敏感的应用程序，这对我们没有帮助——我们希望我们的线程以某种方式优先于其他非延迟敏感的线程。

现代 Unix/Linux 系统提供了可以提供这些功能的替代调度策略，通过允许将线程调度优先级固定在高级别，以便它们在可运行时总是从其他线程接管 CPU 资源，这意味着它们可以更多地响应事件迅速地。

但也可以进一步影响调度程序的行为。通常，在管理线程时会使用所有可用的 CPU 资源。如今，可以更改调度程序使用哪些 CPU。我们可以从调度程序可用的 CPU 中完全移除 CPU，并将它们专门用于我们的专用线程。

或者，我们可以将 CPU 分成组，并将一组 CPU 与特定的线程组相关联。此功能是 Linux 更通用的资源管理组件（称为组）的一部分。它构成了 Linux 对虚拟化的支持的一部分，并且是实现容器的关键，例如在现代环境中由 Docker 生成的容器。但是，它可以通过特定的系统调用用于一般应用程序。

就像上面描述的内存锁定一样，我们是自私的，因为这样做显然会对系统的其他部分产生负面影响。需要非常小心地配置以获得最佳结果，因为错误的可能性很高，而且出错的后果可能很严重。

Original: https://blog.csdn.net/vvoennvv/article/details/127826903
Author: vvoennvv
Title: Java 和低延迟

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/661051/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【数据压缩（二）】PNG文件格式分析

PNG文件格式（一）概述 PNG（可移植网络图形），是一种可扩展的文件格式，用于光栅图像的无损、可移植、压缩良好的存储。PNG是一种无损压缩的位图图形格式。其设计目的是试图替代G…

人工智能 2023年6月20日
0063
实验—采用SOM网络进行聚类

1.SOM网络简介自组织特征映射网络SOFM又称自组织映射网络SOM，是一种自组织竞争神经网络，一个神经网络接受外界输入模式时，将会分为不同的对应区域，各区域对输入模式具有不同的…

人工智能 2023年6月16日
0076
我的，小金库

大家好，我是 IT界搬运喵！好久没给大家分享优质的项目了，今天给大家分享几个收藏已久的宝藏，这可都是我的”小金库”。 Paper 指南这个项目的名字叫 …

人工智能 2023年7月12日
0067
yolov3原理解析及代码流程

一.原理解析 1.yolov3在yolo、yolov2基础之上进行了优化，使得模型既保提升了一定的性能又在速度上做了折中；结构网络示意图如下： (注：图片借鉴网上相关领域大佬制作的…

人工智能 2023年7月12日
0083
音频特征于音频信号提取总结

这里写目录标题 1 语音的产生简介 2 声音特性 3. 声音的种类计算机听觉的应用 4. 什么是音频特征 5 音频特征的类别 * 5.1 可以从以下几个角度区分 5.2. 常见…

人工智能 2023年5月25日
00149
NeRF：神经辐射场论文原理讲解

一、新视角合成 NeRF是开创了一种全新的视角合成方法。新视角合成任务指的是给定源图像（Source Image）及对应的源姿态(Source Pose)以及目标姿态(Target…

人工智能 2023年7月21日
0051
看懂Azure DevOps燃尽图（Burndown Chart）

1. 概述燃尽图是一种由于展示特定时间段内剩余工作的趋势图，为用户评估工作进展是否健康提供依据；燃尽图是一张二维趋势图，横轴表示时间，纵轴表示剩余工作量；在软件开发过程中，特别是…

人工智能 2023年6月11日
0078
人工智能不仅应当提高物质福利，而且应当满足人类的精神需求

然而，遵循阿西莫夫三定律而建造的人工智能或者机器人是奴隶般的，它们在社会上运行可以帮助人类整体，但它们奴隶般的地位是我们人类希望的吗？这是技术社会的理想形态吗？弗洛里迪说：&#82…

人工智能 2023年5月31日
0093
mysql 学生信息管理系统

一、分析 ①业务分析：学生信息管理系统是面向学生和学校教师的一个多功能数据管理平台 ②系统分析：本系统所涉及到的用户有学校学生和教师，对于不同的用户系统所提供的功能也有所不同，…

人工智能 2023年7月29日
0048
pandas在excel中的应用

1、pandas 中一维数组，二维数组和exce，csv的简单应用。 import pandas as pd series 方法代表一维数组 li_st = ["r&q…

人工智能 2023年7月8日
0054
数据分析 | Pandas 200道练习题进阶篇（1）

文章目录 * – 前期准备 – DA5 牛客网用户没有补全的信息 – DA6 查看牛客网哪些用户使用Python – DA7 牛客网…

人工智能 2023年6月27日
0092
2022春山东大学人工智能导论期末题库附答案

人工智能题目汇总正向规则的一般形式是：如果前提则（）答案：结论隐马尔可夫模型可以由五个元素来描述：隐含状态，可观测状态，初始状态概率矩阵，（），（）答案：隐含状态转移概率矩…

人工智能 2023年7月27日
0071
python 知识图谱数据库_使用图数据库 Nebula Graph 数据导入快速体验知识图谱 OwnThink…

本文由 Nebula Graph 实习生@王杰贡献。本文介绍如何将这份数据快速导入图数据库 Nebula Graph，全过程大约需要 30 分钟。中文知识图谱 OwnThink…

人工智能 2023年6月1日
0080
单目相机标定结果的评估——重投影误差与畸变校正

目录 1.重投影误差的概念 2.基于摄像机模型的重投影误差 3.畸变校正算法 3.1利用畸变模型正向求解 3.2利用畸变模型反向求解 1.重投影误差的概念在相机标定后，我们可以通…

人工智能 2023年6月17日
00316
联邦学习综述（二）——联邦学习的分类、框架及未来研究方向

文章目录第三章联邦学习分类 * 3.1 横向联邦学习 3.2 纵向联邦学习 3.3 联邦迁移学习第四章联邦学习框架 * 4.1 开源框架介绍 4.2 FATE——企业级框架…

人工智能 2023年7月3日
00114
论文笔记-RippleNet: Propagating User Preferences on the KnowledgeGraph for Recommender Systems

RippleNet | Proceedings of the 27th ACM International Conference on Information and Knowle…

人工智能 2023年6月10日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Java 和低延迟

大家都在看