HashMap的哈希函数为何用(n – 1) & hash

2023年10月21日下午7:55 • Python • 阅读 29

在上一篇 Java 中HashMap详解(含HashTable, ConcurrentHashMap) 中提到在map.put(key, value)的过程中，计算完key的hash值，是通过hash & (n-1)来得出该元素在Node数组中的下标的，其中n是Node数组的长度。其实我们更容易想到的是hash % n，这样刚好会得到0~n-1之间的数字，可以用作数组下标。那么为何此处是用的位运算呢？

先说结论。这里有一个前提，那就是HashMap中Node数组的长度始终保持是 2^n，比如默认的16，如果创建HashMap的时候指定了初始的capacity,而这个capacity可能不是2^n, 会在内部转化一下，得到一个大于这个capacity的最小的2^n的数字来初始化数组。每次扩容的时候也是进行2倍的扩容。

在这个前提下，hash & (n-1) 与 hash % n 是等价的。而位运算更快一些。

先来看一组数字：

n （格式为2^m=十进制数字=二进制数字） n-1 （格式为2^m – 1=十进制数字=二进制数字） 2^2 = 4 = 100 2^2 – 1 = 3 = 011 2^3 = 8 = 1000 2^3 – 1 = 7 = 0111 2^4 = 16 = 10000 2^4 – 1 = 15 = 01111 2^5 = 32 = 100000 2^5 -1 = 31 = 011111

此处我们可以看到规律，2^m的二进制就是1的后面加上m个0, 而2^m -1的二进制就是0的后面加上m个1.

下面我们来看 hash % n（求余数）的运算：

首先看hash/n，由于n=2^m，我们先看hash/2的情况，这样一来就简单了，因为我们都知道，二进制的情况下，一个数字除以2其实就是右移一位，在左边加一个0，右边移出去一位。如果觉得不好理解，就类比十进制的数字除以10的情况，是一样的。举一反三一下，hash/4的情况自然就是右移2位， 由于n=2^m，其实hash/n的操作就是右移m位。

右移之后我们得到的是hash/n的整除，那么余数呢？其实就是我们移出去的数字。

举个例子，假设hash = 18, n=4,我们知道18/4=4 , 18%4 =2,看看按照我们上面的运算是否会得到相同的结果：

18=10010， 4=2^2

1 0 0 1 0 右移2位 0 0 1 0 0 1 0 hash=18 数组长度n=4=2^2 18/4得到的整除余数18%4

通过运算可以很容易的验证18/4 = 00100 = 4 ，而18%4 = 10 = 2，是正确的。

现在假设Node数组进行了扩容n=8，再来看一下：

Original: https://www.cnblogs.com/adeline-tech/p/16701991.html
Author: adeline.pan
Title: HashMap的哈希函数为何用(n – 1) & hash

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/802493/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

初识pytest

初识pytest pytest单元测试框架（1）什么是单元测试框架？单元测试是指在软件开发过程当中，针对软件的最小单位（函数、方法）进行正确性的检查测试。（2）单元测试框架主要做什…

Python 2023年9月10日
0033
airtest/poco+pytest+allure+jenkins框架来了

如果这些内容对你有帮助，也可以打开微信扫一扫，加关注: 好多朋友在问前几篇文章的poco+pytest+allure框架源码在哪可以Get到，接下来将分几篇文章来让你看看此框架的全…

Python 2023年9月10日
00205
python学习与数据挖掘_Python学习之数据挖掘（三）

Pandas 基础处理 Pandas是什么？为什么用？核心数据结构 DataFrame Panel Series 基本操作文件的读取与存储高级处理 4.1Pandas介绍 4…

Python 2023年8月9日
0076
uni-app的三元表达式

csharp;gutter:true;002277 500万股作者：子钦加油出处：https://www.cnblogs.com/zmdComeOn/个性签名：努力生活，努力…

Python 2023年6月10日
0064
【Java】反射, 枚举,Lambda表达式

✨系列专栏: 【Java SE】✨一句短话:难在坚持,贵在坚持,成在坚持! 文章目录一. 反射 * 1. 反射的概述 2. 反射的使用 – 2.1 反射常用的类 2….

Python 2023年8月30日
0041
pandas进阶–Dataframe的drop_duplicates方法(数据去重)

文章目录欢迎关注公众号【Python开发实战】，免费领取Python学习电子书！ Dataframe的drop_duplicates方法 * drop_duplicates方法介…

Python 2023年8月9日
0064
2.69分钟完成BERT训练！新发CANN 5.0加持

摘要：快，着实有点快。现在，经典模型BERT只需2.69分钟、ResNet只需16秒。啪的一下，就能完成训练！快，着实有点快。现在，经典模型BERT只需 2.69分钟、Re…

Python 2023年10月25日
0025
python-面向对象属性的访问与self的理解

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

Python 2023年6月9日
0059
CentOS 安装Django及启动

7是一种基于Linux的操作系统， Oracle数据库后出现无法图形界面的问题可能是由于以下原因导致的： 1. 错误的显卡驱动： 7默认使用的显卡驱动可能不兼容您的显卡硬件。您可…

Python 2023年8月4日
0066
痞子衡嵌入式：i.MXRT中FlexSPI外设不常用的读选通采样时钟源 – loopbackFromSckPad

大家好，我是痞子衡，是正经搞技术的痞子。今天痞子衡给大家分享的是 i.MXRT中FlexSPI外设不常用的读选通采样时钟源 – loopbackFromSckPad。 …

Python 2023年10月17日
0071
数据分析：Python库之numpy、pandas、matplotlib

目录一、numpy 1、构造一维数组 2、构造二维数组 3、填充 4、矩阵乘法 5、广播 6、一些常用函数 7、io 二、pandas 1、Series 2、DataFrame …

Python 2023年9月2日
0068
金融数据挖掘—科学计算语言—基础篇2

金融数据挖掘—科学计算语言—基础篇2 一、Python基础二、Numpy科学计算包（一）数组的创建与运算数组是一个同一类型的数据的有限类集合列表是由一系列按特定顺序排列的元素…

Python 2023年8月26日
0038
python dash callback_Python dash回调函数

这可能会问很多问题，但我很好奇是否有人有任何技巧来组合这两个破折号脚本。其目的是合并下拉菜单，以删除/添加可视化图上的数据点。在第一个脚本将很好地可视化我的数据，第二个带有回调函…

Python 2023年8月8日
0048
scrapy mysql测试连接_Scrapy管道mysql连接模块错误-问答-阿里云开发者社区-阿里云…

我无法通过管道到本地数据库运行scrapy。我已经安装了mysql-connector-python 8.0.19，并且能够在同一项目中但在Scrapy管道之外将数据写入数据库。有…

Python 2023年10月6日
0027
Python库的几种安装方法：Pycharm、Command Prompt、Anaconda Prompt、Anaconda Navigator；常用conda命令。

学习目标学会利用Pycharm、Command Prompt、Anaconda Prompt(anaconda3)、Anaconda Navigato来安装python库、 An…

Python 2023年9月8日
0071
一些实验中用过的python函数/方法（持续更新）

衡量运行时间很多时候你需要计算某段代码执行所需的时间，可以使用 time 模块来实现这个功能。 import time startTime = time.time() write…

Python 2023年11月2日
0023

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

HashMap的哈希函数为何用(n – 1) & hash

大家都在看