HashMap扩容机制解读[通俗易懂]

HashMap扩容机制解读[通俗易懂]扩容机制什么时候需要扩容:当hashmap中的元素个数超过数组大小*loadFactor(负载因子)时,就会进行数组扩容,loadFactor的默认值(DEFAULT_LOAD_FACTOR)是0.75这是一个折中的取值,也就是说,默认情况下数组大小为16,那么当hashmap中的元素个数超过16*0.75=12(阈值或者边界值的时候)就把数组的大小扩展Wie2*16=32,然后重新计算出每个元素在数组中的位置,而这是一个非常耗性能的操作,所以我们最好能够提前预知并设置元素的个数。注

大家好,又见面了,我是你们的朋友全栈君。

扩容机制

什么时候需要扩容:

当hashmap中的元素个数超过数组大小 * loadFactor(负载因子)时,就会进行数组扩容,loadFactor的默认值(DEFAULT_LOAD_FACTOR)是0.75这是一个折中的取值,也就是说,默认情况下数组大小为16,那么当hashmap中的元素个数超过16*0.75 = 12 (阈值或者边界值的时候)就把数组的大小扩展为2 * 16 = 32,然后重新计算出每个元素在数组中的位置,而这是一个非常耗性能的操作,所以我们最好能够提前预知并设置元素的个数。

注意:
当hashmap中的其中一个链表的对象个数达到了8个,此时如果数组长度没有达到64,那么hashmap会先扩容解决,如果达到了64,就会变成红黑树,节点类型由Node变成TreeNode类型,当然如果映射关系被移除后,下次执行resize()方法时会判断树的节点个数低于6也会再把树转换为链表

什么是扩容:

  • 进行扩容,会伴随着一次新的hash分配,并且会遍历hash表中所有的元素,是非常耗时的,在编写程序的过程中,要尽量避免resize()

  • 每次扩容都是翻倍的与原来的 (n-1)& hash 结果相比,只是多了一个bit位,所以节点要么就在原来的位置,要么就会被分配到 “原位置+旧容量”这个位置

在这里插入图片描述

原数组长度 : 16 n = n - 1 ---> 15
(n - 1) & hash
0000 0000 0000 0000 0000 0000 0001 0000   16
0000 0000 0000 0000 0000 0000 0000 1111   15  n - 1
hash1 (key1):1111 1111 1111 1111 0000 1111 0000 0101    
----------------------------------------------------------------
0000 0000 0000 0000 0000 0000 0000 1111   索引 5
0000 0000 0000 0000 0000 0000 0000 1111   15  n - 1
hash2 (key2):1111 1111 1111 1111 0000 1111 0000 0101   
----------------------------------------------------------------
0000 0000 0000 0000 0000 0000 0000 1111   索引 5
================================================================
数组长度扩容 ——> 16 * 32 n - 1 ---> 31
(n - 1) & hash
0000 0000 0000 0000 0000 0000 0010 0000   32
0000 0000 0000 0000 0000 0000 0001 1111   31 n - 1
hash1(key1): 1111 1111 1111 1111 0000 1111 0000 0101   
----------------------------------------------------------------		 
0000 0000 0000 0000 0000 0000 0000 0101  索引 5
0000 0000 0000 0000 0000 0000 0001 1111   31 n - 1
hash2 (key2):1111 1111 1111 1111 0000 1111 0000 0101   			
----------------------------------------------------------------			
0000 0000 0000 0000 0000 0000 0001 0101  索引 5 + 16

因此元素在重新计算hash之后,因为N变为2倍,那么n-1的标记范围在高位多1bit 因此新的index就会发生这样的变化
在这里插入图片描述
原位置 = 原位置 + oldCap

  • 说明: 5是假设计算出来的原来的索引值,这样就验证了函数所描述的,扩容之后所以节点要么就在原来的位置,要么就是被分配到了‘原位置 +旧容量’位置

  • 因此我们在扩容hashmap的时候,不需要重新计算hash值,只需要看看原来的hash值新增的那个bit是1还是0就可以了,
    (0表示索引没有变化,1表示原索引 + 旧容量)

在这里插入图片描述

正是因为这种巧妙的rehash方式,既省去了重新计算hash值的时间,而且同时,由于新增的1bit 是 0还是1
这是随机的,在reszie的过程中保证了rehash之后的每个桶上的结点数一定小于等于原来桶上的节点数,保证了rehash之后不会出现更加严重的hash冲突,均匀的把之前的冲突的节点分散到新的桶中了。

初始化map注意:

HashMap 的扩容机制,就是当达到扩容条件时会进行扩容。HashMap 的扩容条件就是当 HashMap 中的元素个数(size)超过临界值(threshold)时就会自动扩容。所以,如果我们没有设置初始容量大小,随着元素的不断增加,HashMap 会有可能发生多次扩容,而 HashMap 中的扩容机制决定了每次扩容都需要重建 hash 表,是非常影响性能的。

关于设置 HashMap 的初始化容量大小:

可以认为,当我们明确知道 HashMap 中元素的个数的时候,把默认容量设置成 initialCapacity/ 0.75F + 1.0F 是一个在性能上相对好的选择,但是,同时也会牺牲些内存。

而 Jdk 并不会直接拿用户传进来的数字当做默认容量,而是会进行一番运算,最终得到一个 2 的幂。

实例:

  • initalCapacity = (需要存储的元素的个数 / 负载因子) + 1

  • 负载因子默认是 0.75 ,建议暂时无法确定大小则一般设置为16

  • 如果不一开始指定初始化因子。需要放置1024个元素的时候,随着元素的不断增加,就需要扩容7次,重新建立hash表,严重的影响性能。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/150159.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • 几何画板 很实用的一个软件

    几何画板 很实用的一个软件

  • 2022 pycharm 激活码【2022最新】2022.03.10

    (2022 pycharm 激活码)本文适用于JetBrains家族所有ide,包括IntelliJidea,phpstorm,webstorm,pycharm,datagrip等。https://javaforall.cn/100143.htmlIntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,上面是详细链接哦~1…

  • lrzsz linux安装包,linux 离线安装lrzsz「建议收藏」

    lrzsz linux安装包,linux 离线安装lrzsz「建议收藏」安装gcc环境yuminstall–downloadonly–downloaddir=/usr/local/gccgccyuminstall–downloadonly–downloaddir=/usr/local/gcc++gcc-c++cd/usr/local/gcccd/usr/local/gcc++1.下载lrzsz-0.12.20.tar.gz2.上传压缩包到服…

  • mac idea 2021 激活码(JetBrains全家桶)

    (mac idea 2021 激活码)最近有小伙伴私信我,问我这边有没有免费的intellijIdea的激活码,然后我将全栈君台教程分享给他了。激活成功之后他一直表示感谢,哈哈~https://javaforall.cn/100143.htmlIntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,上面是详细链接哦~MLZP…

  • matlab的plot颜色_matlab plot线型和颜色

    matlab的plot颜色_matlab plot线型和颜色MATLABPlot如何自定义颜色Tip:Matlab作图时最好保存成fig格式,便于以后修改。写论文是一个漫长的过程,成文后最重要的一个问题就是如何让自己的论文排版和插图更加的好看,让枯燥的论文有一点生动的色彩。这里记录我在写论文时的困惑和一些小小的技巧。以下面这个图为例:X=linspace(0,5,51);Y1=sin(X);Y2=cos(0.5*X);Z=2*Y1+…

    2022年10月15日
  • 通俗讲解 同步、异步、阻塞、非阻塞 编程

    通俗讲解 同步、异步、阻塞、非阻塞 编程#真正意义上的异步IO是说内核直接将数据拷贝至用户态的内存单元,再通知程序直接去读取数据。#select/poll/epoll都是同步IO的多路复用模式1.同步和异步#同步和异步关注的是消息通信机制#所谓同步,就是在发出一个*调用*时,没得到结果之前,该*调用*就不返回。但是一旦调用返回就得到返回值了,*调用者*主动等待这个*调用*的结果#所谓异步,就是在发出一个*调用*时,这个*调用*就直接返回了,不管返回有没有结果。当一个异步过程调用发出后,*被调用者*.

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号