java集合专题 (ArrayList、HashSet等集合底层结构及扩容机制、HashMap源码)
一、数组与集合比较
数组:
1)长度开始时必须指定,而且一旦指定,不能更改
2)保存的必须为同一类型的元素
3)使用数组进行增加/删除元素-比较麻烦
集合:
1)可以动态保存任意多个对象,使用比较方便
2)提供了一系列方便的操作对象的方法: add、remove、set、 get等
3)使用集合添加,删除新元素-更加简洁
二、常见集合体系图
(1)常见单列集合
List: 有序可重复、支持索引、可根据索引值取数据、可以存入多个null值
Set: 无序不可重复、无索引、最多只包含一个null值
(2)常见双列集合
三、List集合
1.List接口介绍及常用方法
1) List集合类中元素有序(即添加顺序和取出顺序一致)、 且可重复[案例]
2) List集合中的每个元素都有其对应的顺序索引,即支持索引。[案例]
3) List容器中的元素都对应一 个整数型的序号记载其在容器中的位置,可以根
据序号存取容器中的元素。
2.ArrayList底层分析
2.1 ArrayList基本介绍
1) permits all elements, including null , ArrayList可以加入null,并且可以添加多个null
2) ArrayList底层是由可变数组来实现数据存储的
3) ArrayList基本等同于Vector ,除了ArrayList是线程不安全(执行效率高),在多线程情况下,不建议使用ArrayList
2.2 ArrayList的底层底层结构及扩容机制
1) ArrayList中维护了一个Object类型的数组elementData. [debug 看源码] transient Object[] elementData; //transient 表示瞬间、短暂的,表示该属性不会被序列化
2)当创建ArrayList对象时,如果使用的是无参构造器,则初始elementData容量为0, 第1次添加,则扩容elementData为10, 如大小不够需要再次扩容,则调用grow()扩容elementData为1.5倍。grow()内部数据拷贝使用Arrays.Copyof()。
3)如果使用的是指定大小的构造器,则初始elementData容量为指定大小, 如果需要扩容,则直接扩容elementData为1.5倍。
3.Vector底层分析
3.1 Vector基本介绍
1) Vector底层也是一个对象数组,protected Object[] elementData;
2) Vector是线程同步的,即线程安全,Vector类的操作方法带有synchronized
public synchronized E get(int index) {
if (index >= elementCount)
throw new ArrayIndexOutOfBoundsException(index);
return elementData(index);}
3)在开发中,需要线程同步安全时,考虑使用Vector
3.2 Vector与ArrayList的比较(扩容机制)
4.LinkedList底层分析
4.1 LinkedList基本介绍
1) LinkedList底层实现了双向链表和双端队列特点
2)可以添加任意元素(元素可以重复),包括null
3)线程不安全,没有实现同步
4.2 LinkedList底层结构
1) LinkedList底层维护了一个双向链表
2) LinkedList中维护了两个属性first和last分别指向首节点和尾节点
3)每个节点(Node对象) ,里面又维护了prev、next、 item三个属性,其中通过prev指向前一 个,通过next指向后个节点,而item就是真正存放数据的属性。最终实现双向链表
4)所以LinkedList的元素的添加和删除,不是通过数组完成的,相对来说效率较高,添加是添加在双向链表的尾部,remove()不指定索引默认删除的是第一个数据
4.3 ArrayList和LinkedList的比较
四、Set集合
1.Set接口介绍及常用方法
1)无序(添加和取出的顺序不一致) ,没有索引后面演示]
2)不允许重复元素,所以最多包含一个null
2.HashSet底层分析
2.1 HashSet基本介绍
1) HashSet实际上是HashMap(jdk1.7:数组+链表 jdk1.8:数组+链表+红黑树 ),看下源码
public HashSet() {
map = new HashMap<>();
}
2)可以存放null值,但是只能有一个null
3) HashSet不保证元素是有序的,取决于hash后,再确定索引的结果
4)不能有重复元素/对象在前面Set接口使用已经讲过
2.2 HashSet底层结构及源码解读
1. HashSet 底层是HashMap
2.添加一个元素时,先得到hash值-会转成->索引值
3.找到存储数据表table ,看这个索引位置是否已经存放的有元素
4.如果没有,直接加入
5.如果有,调用equals比较,如果相同,就放弃添加,如果不相同,则添加到最后
6.在Java8中,如果一条链表的元素个数到达TREEIFY THRESHOLD(默认是8),并且table的大小>=MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树)
public class Debug{
public static void main(String[] args) { //添加实例
HashSet set = new HashSet();
set.add("java");
set.add("php");
set.add("java");
System.out.println(set);
/*
源码解读
. 执行HashSet()
public HashSet() {
map = new HashMap<>();
}
. 执行add()
public boolean add(E e) { //e="java"
return map.put(e, PRESENT)==null; // (static) PRESENT = new Object();
}
. 执行put(),该方法会执行hash(key)得到key对应的hash值 算法 (h = key.hashCode()) ^ (h >>> 16) 避免碰撞
public V put(K key, V value) { //key="java" value=PRESENT 共享的
return putVal(hash(key), key, value, false, true);
}
. 执行putVal()
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i; //定义了辅助变量
// table就是HashMap的一个数组,类型是Node[]
// if 语句表示如果当前table 是null或者 大小 = ,就是第一次扩容,到16
if ((tab = table) == null || (n = tab.length) == )
n = (tab = resize()).length;
//()根据key,得到hash 去计算该key应该存放到table表的哪个索引位置,并把这个位置的对象,赋给 p
//()判断p 是否为null
//(.1)如果p 为null,表示还没有存放元素,就创建一个Node(key="java",value=PRESENT)
//(.2)就放在该位置 tab[i] = newNode(hash, key, value, null)
if ((p = tab[i = (n - ) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
// 一个开发技巧提示:在需要局部变量(辅助变量)时候,再创建
Node<K,V> e; K k;
// 如果当前索引位置对应的链表的第一个元素和准备添加的key的hash值一样
// 并且满足 下面两个条件之一:
//()准备加入的key 和 p 指向的Node节点的key是同一个对象
//()p指向的node节点的key的equals() 和准备加入的key比较后相同
// 就不能加入
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 再判断 p 是不是一颗红黑树,
// 如果是一颗红黑树,就调用 putTreeVal,来进行添加
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
// 如果table对应的索引位置,已经是一个链表,就使用for循环比较
//()依次和该链表的每一个元素比较后,都不相同,则加入到该链表的最后
// 注意在把元素添加到链表后,立即判断该链表是否已经达到个结点
// 就调用treeifyBin() 对当前这个链表进行树化(转成红黑树)
// 注意,在转成红黑树时,要进行判断,判断条件
// if (tab == null | (n = tab.Length) < MIN_ TREEIFY_ CAPACITY() )
// resize() ;
// 如果上面条件成立,先table扩容。
// 只有上面条件不成立时,才进行转成红黑树
//()依次和该链表的每一个元素比较过程中,如果有相同情况,就直接break
else {
for (int binCount = ; ; ++binCount) { //死循环
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - ) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount; //size 就是我们加入一个节点Node(k,v,h,next),size++
if (++size > threshold)
resize(); //扩容
afterNodeInsertion(evict);
return null;
}
*/
}
}
2.3 HashSet扩容及树化机制
1. HashSet底层是HashMap,第一次添加时,table 数组扩容到16,临界值(threshold)是16*加载因子(loadFactor)是0.75 = 12
2.如果table数组使用到了临界值12,就会扩容到16* 2 = 32,新的临界值就是32*0.75 = 24,依次类推正
3.在Java8中,如果条链表的元素个数到达TREEIFY THRESHOLD(默认是8 ),并且table的大小>=MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树),否则仍然采用数组扩容机制
3.LinkedHashSet底层分析
1)LinkedHashSet加入顺序和取出元素,数据的顺序一致
2) LinkedHashSet 底层维护的是一个LinkedHashMap(是HashMap的子类)
3) LinkedHashSet 底层结构( 数组table+双向链表)
4) 第一次添加元素时,直接将数组tabLe扩容到16 ,存放的结点类型是LinkedHashMap$Entry 每一个节点有before、after分别指向前一个和后一个元素
5)数组是HashMap$Node[] 存放的元素/数据是L inkedHashMap$Entry类型
4.TreeSet底层分析
4.1 TreeSet基本介绍
1)当我们使用无参构造器, 创建TreeSet时,仍然是无序的,存储数据的底层结构是TreeMap$Entry
2)若希望添加的元素,按照字符串字典顺序来排序
3)使用Treeset提供的一一个构造器,可以传入-个比较器(匿名内部类) 并指定排序规则
4.2 TreeSet源码解读
public class TreeSet_ {
public static void main(String[] args) {//TreeSet treeSet = new TreeSet();
//、简单看下源码
TreeSet treeSet = new TreeSet(new Comparator() {
@Override
public int compare(Object o, Object o2) {
// 下面 调用String的compareTo方法进行字符串 字典顺序 排序
// return ((String)o).compareTo((String)o2);
// 如果按照长度大小排序 小-->大
return ((String)o).length()-((String)o2).length();
}
});
treeSet.add("jack");
treeSet.add("tom");
treeSet.add("sp");
treeSet.add("a");
System.out.println(treeSet);
/*
源码解读:
.构造器把传入的比较器对象,赋给了TreeSet的底层的TreeMap的属性this。comparator
public TreeMap(Comparator<? super K> comparator) {
this.comparator = comparator;
}
、在 调用treeSet.add("tom"),在底层会执行到
if (cpr != null) { //cpr 就是我们的匿名内部类(对象)
do {
parent = t;
//动态的绑定到我们的匿名内部类(对象)compare
cmp = cpr.compare(key, t.key);
if (cmp < )
t = t.left;
else if (cmp > )
t = t.right;
else { //如果相等,即返回,这个key就没有加入
V oldValue = t.value;
if (replaceOld || oldValue == null) {
t.value = value;
}
return oldValue;
}
} while (t != null);
}
*/
}
}
五、Map集合
1.Map接口介绍及常用方法
1) Map与Collection并列存在。用于保存具有映射关系的数据:Key-Value
2) Map中的key和value 可以是任何引用类型的数据,会封装到HashMap$Node对象中
3) Map中的key不允许重复,原因和HashSet一样,前面分析过源码
4) Map中的value可以重复
5) Map的key可以为null, value也可以为null ,注意key为null,只能有一个,value 为null ,可以多个
6)常用String类作为Map的key
7) key和value之间存在单向一对一关系,即通过指定的key总能找到对应的value
8) Map存放数据的key-value示意图,一对k-v是放在一个HashMap$Node中的, 又因为Node实现了Entry 接口,有些书上也说一对k-v就是一个Entry
2.Map集合的六种遍历方式
public class Map{
public static void main(String[] args) {
Map map = new HashMap();
map.put(, "张三");
map.put(, "李四");
map.put(, "王五");
map.put(, "赵六");
map.put(, "田七");
//第一组:先取出所有的key,通过key取出对应的value
Set set = map.keySet();
//()增强for
for (Object key : set) {
System.out.println(key + "-" + map.get(key));
}
//()迭代器
Iterator iterator = set.iterator();
while (iterator.hasNext()) {
Object key = iterator.next();
System.out.println(key + "-" + map.get(key));
}
//第二组:把所有的values取出
Collection values = map.values();
//这里可以使用所有的Collection使用的遍历方法
//()增强for
for (Object value : values) {
System.out.println(value);
}
//()迭代器
Iterator iterator= values.iterator();
while (iterator.hasNext()) {
Object values= iterator1.next();
System.out.println(values);
}
//第三组:通过EntrySet 获取 k-v
//()增强for
Set entrySet = map.entrySet();
for (Object entry : entrySet) {
//将entry 转成 Map.Entry
Map.Entry m = (Map.Entry) entry;
System.out.println(m.getKey()+"-"+m.getValue());
}
//()迭代器
Iterator iterator= entrySet.iterator();
while (iterator.hasNext()) {
Object entry = iterator.next();
Map.Entry m = (Map.Entry) entry;
System.out.println(m.getKey()+"-"+m.getValue());
}
}
}
3.HashMap底层分析
3.1 HashMap基本介绍
1) Map接口的常用实现类: HashMap、 Hashtable和Properties。
2) HashMap是Map接口使用频率最高的实现类。
3) HashMap是以key-val对的方式来存储数据[案例Entry ]
4) key不能重复,但是是值可以重复,允许使用null键和null值。
5)如果添加相同的key ,则会覆盖原来的key-val ,等同于修改.(key不会替换,val会替换)
6)与HashSet-样,不保证映射的顺序,因为底层是以hash表的方式来存储的.
7) HashMap没有实现同步,因此是线程不安全的
3.2 HashMap底层扩容(和HashSet相同)及源码解读
1) HashMap底层维护了Node类型的数组table,默认为null
2)当创建对象时,将加载因子(loadfactor)初始化为0.75.
3)当添加key-val时,通过key的哈希值得到在table的索引。然后判断该索引处是否有元素,如果没有元素直接添加。如果该索引处有元素,继续判断该元素的key和准备加入的key相是否等,如果相等,则直接替换val;如果不相等需要判断是树 结构还是链表结构,做出相应处理。如果添加时发现容量不够,则需要扩容
4)第1次添加,则需要扩容table容量为16,临界值(threshold)为12.
5)以后再扩容,则需要扩容table容量为原来的2倍,临界值为原来的2倍,即24,依次类推
6)在Java8中,如果条链表的元素个数超过TREEIFY THRESHOLD(默认是8),并且table的大小>= MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树)
public class HashMapDebug {
public static void main(String[] args) {
HashMap hashMap=new HashMap();
hashMap.put("java",);
hashMap.put("php",);
hashMap.put("java",); //替换 10
System.out.println(hashMap);
/*HashMap源码解读
、执行构造器 new HashMap()
初始化加载因子 loadfactor=.75
HashMap$Node[] table = null
、执行put() 调用 hash方法,计算key的hash值 (h = key.hashCode()) ^ (h >>> 16)
public V put(K key, V value) { key="java" value=
return putVal(hash(key), key, value, false, true);
}
、执行putVal()
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i; //辅助变量
//如果底层的table数组为空,或者长度等于,就进行第一次扩容到16
if ((tab = table) == null || (n = tab.length) == )
n = (tab = resize()).length;
//取出hash值对应的table的索引位置的Node,如果为null,就直接把加入的k-v创建成一个Node,加入该位置即可
if ((p = tab[i = (n - ) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k; //辅助变量
//如果tabLe的索引位置的key的hash相同和新的key的hash值相同,
//并 满足(tabLe现有的结点的key和准备添加的key是同一个对象 || equals返回真)
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode) //如果当前的table的已有的Node 是红黑树,就按照红黑树的方式处理
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else { //如果找到的节点 后面是链表,就循环比较
for (int binCount = ; ; ++binCount) { //死循环
if ((e = p.next) == null) { //如果整个链表,没有和他相同,就加在该链表的最后
p.next = newNode(hash, key, value, null);
//加入后,判断当前链表的个数,是否到达个,到达8个后
//就调用treeifyBin()进行红黑树的转化
if (binCount >= TREEIFY_THRESHOLD - ) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash && //如果在循环比较过程中,发现有相同,就break,替换value
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value; //替换,key对应的value
afterNodeAccess(e);
return oldValue;
}
}
++modCount; //每增加一个Node,就size++
if (++size > threshold) //如 size > 临界值,就扩容
resize();
afterNodeInsertion(evict);
return null;
}
. 关于树化(转成红黑树)
//如果table为null,或者大小还没有到,暂时不树化,而是进行扩容
//否则才会正真的树化 -> 剪枝
final void treeifyBin(Node<K,V>[] tab, int hash) {
int n, index; Node<K,V> e;
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
resize();
......
*/
}
}
4.HashTable底层分析
4.1 HashTable基本介绍
1) 存放的元素是键值对: 即K-V
2) hashtable的键和值都不能为null, 否则会抛出NullPointerException
3) hashTable使用方法基本上和HashMap-样
4) hashTable是线程安全的(synchronized), hashMap是线程不安全的
4.2 HashTable底层扩容机制
1) 底层有数组Hashtable$Entry[] 初始化大小为11
2) 临界值threshold 8 = 11 * 0.75
3) 扩容:按照自己的扩容机制来进行即可。
4) 执行方法addEntry(hashp key, value, index); 添加K-V 封装到Entry
5) 当if (count >= threshoLd) 满足时,就进行扩容
6) 按照int newCapacity = (oldCapacity << 1) + 1;的大小扩容。
4.3 HashTable和HashMap对比
5.TreeMap底层分析
5.1 TreeMap基本介绍
使用默认 的构造器,创建TreeMap, 是无序的( 也是没有排序的)
compare方法的比较条件若相同 则不添加 而不是替换
5.2 TreeMap底层源码
public class TreeMap_ {
public static void main(String[] args) {
//TreeMap treeMap= new TreeMap();
TreeMap treeMap = new TreeMap(new Comparator() {
@Override
public int compare(Object o, Object o2) {
//要求:按照传入的 k(String) 的 字典顺序 进行排序
//return ((String)o).compareTo((String)o2);
//按照字符串的长度大小排序 小-->大
return ((String)o).length()-((String)o2).length();
}
});
treeMap.put("jack","杰克");
treeMap.put("tom","汤姆");
treeMap.put("kiri","凯瑞");//"kiri"长度和"jack"长度相等无法加入
treeMap.put("smith","史密斯");
System.out.println(treeMap);
/*
源码解读:
. 构造器:把实现了 Comparator接口的匿名内部类(对象),传给了TreeMap的comparator
public TreeMap(Comparator<? super K> comparator) {
this.comparator = comparator;
}
. 调用put方法
.1 第一次添加,把k-v封装到Entry对象,放入root
Entry<K,V> t = root;
if (t == null) {
addEntryToEmptyMap(key, value);
return null;
}
.2 以后添加
Comparator<? super K> cpr = comparator;
if (cpr != null) {
do { //遍历所有的key,给当前的key找到适当的位置
parent = t;
cmp = cpr.compare(key, t.key); //动态的绑定到我们的匿名内部类的compare
if (cmp < )
t = t.left;
else if (cmp > )
t = t.right;
else { //如果遍历过程中,发现准备添加的key 和当前已有的key相等(compare比较),就不添加
V oldValue = t.value;
if (replaceOld || oldValue == null) {
t.value = value;
}
return oldValue;
}
} while (t != null);
}
*/
}
}
六、Collections工具类
1) Collections是个操作 Set、List和Map等集合的工具类
2) Collections中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作
排序操作
1) reverse(List):反转List中元素的顺序
2) shuffle(List):对List集合元素进行随机排序
3) sort(List):根据元素的自然顺序对指定List集合元素按升序排序
4) sort(List, Comparator): 根据指定的Comparator产生的顺序对List集合元素进行排序
5) swap(List, int, int): 将指定list集合中的i处元素和j处元素进行交换
查找、替换
1) Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素
2) Object max(Collection, Comparator): 根据Comparator指定的顺序,返回给定集合中的最大元素
3) Object min(Collection)
4) Object min(Collection, Comparator)
5) int frequency(Collection, Object): 返回指定集合中指定元素的出现次数
6)void copy(List dest,List src):将src中的内容复制到dest中
7) boolean replaceAll(List list, Object oldVal, Object newVal):使用新值替换List对象的所有旧值
本笔记参考视频:https://www.bilibili.com/video/BV1YA411T76k?p=55(其他的集合源码的debug可以去看老韩讲解的视频)