Map - LinkedHashMap & LinkedHashSet 源码解析

# Map - LinkedHashMap & LinkedHashSet 源码解析

# LinkedHashMap

LinkedHashMap_base

# 1. 介绍

# 1.1 HashMap 无法保证顺序

对于 HashMap 而言，将数据放入其中后，如果我们需要遍历 map 中的所有元素，可以这么做：

通过 map.entrySet() 来获取包含所有数据的set，对该 set 进行遍历；
通过 map.keySet() 获取所有的 key，然后遍历 key，调用 get 方法获取 value；

上面这两种方式都是可以进行 map 元素的遍历，但是同时也存在一个问题：数据的顺序无法保证，也就是说，在打印出所有元素前，元素的顺序是未知的。

# 1.2 如何保证 HashMap 的顺序

因为 HashMap 不能保证顺序，就需要借助其他的数据结构，比如可以额外使用一个List（比如 ArrayList ），每次加入 map 后，同时再加入 ArrayList，如果需要顺序遍历数据，则直接遍历 ArrayList 即可，就不用遍历 map 了。

但是这样的话，开销就会相对较高，首先需要创建 ArrayList，还需要每次增删元素后，都要对 ArrayList 进行操作（移动元素），时间复杂度 O(n），空间复杂度 O(n)。

# 1.3 使用 LinkedHashMap

上面使用 ArrayList 来保证数据的顺序性，当元素发生变化时，就需要移动 ArrayList 中的元素，时间复杂度 O(n)，空间复杂度为 O(n)，那么如果可以降低时间复杂度和空间复杂度就好了。

于是，就会联想到链表，不考虑查找元素的开销，增删元素的时间复杂度为 O(1)；但是还是需要 O(n) 的空间复杂度，因为需要保存节点值，如果能把空间复杂度降下来就好了，此时就可以了解一下 LinkedHashMap。

LinkedHashMap，其实从名字上就可以看出他是功能，Linked+HashMap，说到 Linked，自然就会联系到 LinkedList，所以，LinkedhashMap 可以简单的理解为 LinkedList+HashMap。

需要注意的是，LinkedHashMap 并没有完全创建一个新的节点类型，而是在 HashMap 的 Node 内部类上进行扩充，增加前后指针，这样也是可以节省很多空间的。

# 1.4 LinkedHashMap 的顺序分类

LinkedHashMap 可以保证 HashMap 元素的顺序，这个顺序，有两种：

遍历元素的顺序与插入元素的顺序一致，也就是说，依次插入 A->B->C，那么遍历时的顺序就是 A->B->C;
初始时，遍历元素的顺序与插入的顺序一致，但是当元素被访问，也就是说，插入 A->B->C 后，遍历的顺序是 A->B->C；如果中间访问或者修改过 B，那么顺序就会变为A->C->B，

在 LinkedHashMap 中，有一个 accessOrder 属性来设定是否按照访问顺序来遍历，默认为f alse，也就是上面默认使用第一种方式。

# 1.5 LinkedHashMap使用示例

package cn.ganlixin.util;
import org.junit.Test;
import java.util.LinkedHashMap;
import java.util.Map;
 
public class TestLinkedHashMap {
 
    /**
     * 遍历顺序和插入顺序相同，期间访问或者修改元素，顺序不会发生改变
     */
    @Test
    public void testNormal() {
        Map<String, String> map = new LinkedHashMap<>();
 
        map.put("one", "1111");
        map.put("two", "2222");
        map.put("three", "3333");
 
        for (Map.Entry entry : map.entrySet()) {
            System.out.println(entry.getKey() + "=>" + entry.getValue());
        }
        /** 输出如下：
         one=>1111
         two=>2222
         three=>3333
         */
 
        map.put("two", "2");
        for (Map.Entry entry : map.entrySet()) {
            System.out.println(entry.getKey() + "=>" + entry.getValue());
        }
        /** 输出如下：
         one=>1111
         two=>2222
         three=>3333
         */
    }
 
    /**
     * 遍历顺序为访问（修改）顺序，元素被访问或者被修改后，会移到最后
     */
    @Test
    public void testAccessOrder() {
        // public LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder)
        Map<String, String> map = new LinkedHashMap<>(16, 0.75f, true);
        // 创建map时，设置遍历顺序按照访问顺序
 
        map.put("one", "1111");
        map.put("two", "2222");
        map.put("three", "3333");
 
        for (Map.Entry entry : map.entrySet()) {
            System.out.println(entry.getKey() + "=>" + entry.getValue());
        }
        /**
         one=>1111
         two=>2222
         three=>3333
         */
 
        map.get("one"); // 某个元素访问后，会将该元素移动到末尾
        for (Map.Entry entry : map.entrySet()) {
            System.out.println(entry.getKey() + "=>" + entry.getValue());
        }
        /**
         two=>2222
         three=>3333
         one=>1111
         */
 
        map.put("two", "2"); // 修改元素后，也会将元素移动到最后
        for (Map.Entry entry : map.entrySet()) {
            System.out.println(entry.getKey() + "=>" + entry.getValue());
        }
        /**
         three=>3333
         one=>1111
         two=>2
         */
 
        map.replace("three", "3"); // 修改元素后，也会将元素移动到最后
        for (Map.Entry entry : map.entrySet()) {
            System.out.println(entry.getKey() + "=>" + entry.getValue());
        }
        /**
         three=>3333
         one=>1111
         two=>2
         */
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91

# 2. LinkedHashMap源码解析

# 2.1 LinkedHashMap原理概览

在阅读 LinkedHashMap 前，要先了解 HashMap 的原理，方便后面对LinkedHashMap源码的理解。

LinkedHashMap 继承自 HashMap，也就是说 HashMap 的功能，LinkedHashMap 都支持。

public class LinkedHashMap<K, V> extends HashMap<K, V> implements Map<K, V>

LinkedHashMap 对 HashMap 的部分 API 进行了重写，以此来保证 map 中元素遍历时的顺序。通过第一部分的一些介绍，其实我们大概才出 LinkedHashMap 是如何保证顺序的：

对于遍历顺序与插入顺序相同的情况，只需要在将元素 put 到双链表后，维护节点的指针，链入上一次 put 的节点后面（成为尾结点）；
对于遍历顺序与访问顺序相同一致的情况，只需要在 get、put、replace..操作之后，将节点移动到末尾即可。

# 2.2 双链表的节点

LinkedHashMap 中双链表的节点类型，是直接在 HashMap 的节点类型上进行扩充的，增加了 before 和 after 指针；

/**
 * 链表的节点类型Entry，继承自HashMap的Node内部类
 */
static class Entry<K, V> extends HashMap.Node<K, V> {
    Entry<K, V> before, after;
 
    Entry(int hash, K key, V value, Node<K, V> next) {
        super(hash, key, value, next);
    }
}

1
2
3
4
5
6
7
8
9
10

# 2.3 新增属性

LinkedHashMap 继承自 HashMap，也继承了 HashMap 中的所有属性，比如默认的初始容量、默认的负载因子、默认转换为红黑树和链表的阈值...

除此之前，LinkedHashMap 增加了 3 个额外的属性，其中两个属性用于实现双链表的头尾节点，另外一个属性用于控制顺序的类型：

/**
 * 指向双链表的头结点（如果map为空=>双链表为空=>head为空）
 */
transient LinkedHashMap.Entry<K, V> head;
 
/**
 * 指向双链表的尾结点（如果map为空=>双链表为空=>tail为空）
 */
transient LinkedHashMap.Entry<K, V> tail;
 
/**
 * 设置LinkedHashMap的顺序类型
 * false：表示遍历元素的顺序与插入顺序相同
 * true：表示遍历元素的顺序按照访问的顺序排列，当一个数据被访问（修改）后，该数据就会移动到最后
 */
final boolean accessOrder;

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

# 2.4 构造方法

LinkedHashMap 的构造方法，其实主要有两个点：1.设置 HashMap 的初始容量和负载因子；2.设置顺序类型（accessOrder）。

/**
 * 创建LinkedHashMap，使用HashMap默认的初始容量16，默认的负载因子0.75
 */
public LinkedHashMap() {
    super();
    accessOrder = false;
}
 
/**
 * 创建LinkedHashMap，指定HashMap的初始容量，使用默认的负载因子0.75
 */
public LinkedHashMap(int initialCapacity) {
    // 指定HashMap的初始容量
    super(initialCapacity);
    accessOrder = false;
}
 
/**
 * 创建LinkedHashMap，指定HashMap的初始容量和负载因子
 */
public LinkedHashMap(int initialCapacity, float loadFactor) {
    super(initialCapacity, loadFactor);
    accessOrder = false;
}
 
/**
 * 创建LinkedHashMap，指定HashMap初始容量和负载因子，以及是否顺序获取
 */
public LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder) {
    super(initialCapacity, loadFactor);
    this.accessOrder = accessOrder;
}
 
/**
 * 创建LinkedHashMap，使用HashMap默认的初始容量(16)和负载因子(0.75)
 * 并且将传入的map放入到LinkedHashMap中
 */
public LinkedHashMap(Map<? extends K, ? extends V> m) {
    super();
    accessOrder = false;
    putMapEntries(m, false);
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42

# 2.5 LinkedHashMap 的 put

LinkedHashMap 并没有覆盖 HashMap 的 put 方法，而是直接沿用 HashMap 的 put 方法。那么 LinkedHashMap 是如何保证顺序的呢？是这样的，HashMap 在 put 的时候：

如果是新增节点，那么就会创建一个节点，然后放入到 map 中；
如果 put 操作时修改操作（也就是 put 的 key 已经存在），那么不需要创建节点，只需要修改已有节点的 value 即可；

对于第一种情况，创建节点，是 HashMap 和 LinkedHashMap 都有的，LinkedHashMap 重写了 HashMap 创建新节点的方法（newNode 和 newTreeNode 两个方法），在这个时候将新创建的节点加入链表的末尾：

/**
 * HashMap的newNode，创建一个Node节点
 */
Node<K, V> newNode(int hash, K key, V value, Node<K, V> next) {
    return new Node<>(hash, key, value, next);
}
 
/**
 * HashMap中的newTreeNode，创建一个红黑树的节点
 */
TreeNode<K, V> newTreeNode(int hash, K key, V value, Node<K, V> next) {
    return new TreeNode<>(hash, key, value, next);
}
 
/**
 * LinkedHashMap重写HashMap的newNode方法，
 * 创建一个双链表节点，同时将新节点作为双链表的尾结点
 */
@Override
Node<K, V> newNode(int hash, K key, V value, Node<K, V> e) {
    // 创建双链表节点
    LinkedHashMap.Entry<K, V> p = new LinkedHashMap.Entry<K, V>(hash, key, value, e);
 
    // 将新创建的节点加入链表尾部
    linkNodeLast(p);
    return p;
}
 
/**
 * LinkedHashMap重写HashMap的newTreeNode方法
 * 创建一个红黑树的节点，并将节点加入到双链表的最后
 */
@Override
TreeNode<K, V> newTreeNode(int hash, K key, V value, Node<K, V> next) {
    TreeNode<K, V> p = new TreeNode<K, V>(hash, key, value, next);
 
    // 将新创建的节点加入链表尾部
    linkNodeLast(p);
    return p;
}
 
/**
 * 将节点加入链表中（挂在最后位置）
 */
private void linkNodeLast(LinkedHashMap.Entry<K, V> p) {
    // tail指向的尾结点
    LinkedHashMap.Entry<K, V> last = tail;
 
    tail = p;
    if (last == null) {
        // last==null，证明插入节点前链表为空，此时head也需要指向p
        head = p;
 
    } else {
        // 插入节点前，链表不为空，维护指针关系，将p插入到最后
        p.before = last;
        last.after = p;
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59

对于put方法，进行了替换操作，就需要用到后面说的一些 post-actions（后置处理）来完成顺序的保证。

# 2.6 some post-actions

由于 LinkedHashMap 是继承自 HashMap，并且大部分的代码都没有做更改，也就是直接沿用 HashMap 的接口。那么 LinkedHashMap是如何保证顺序的呢？特别是前面说的保证插入的顺序，保证访问的顺序？？

其实 HashMap 的一些 API 中，比如 put 方法，其中就包含了一些 callback，当插入元素或者查找到元素后，就调用某个方法；这些callback 方法在 HashMap 中没有进行任何操作（方法体为空），留给子类 LinkedHashMap 进行实现的，如下面所示：

// Callbacks to allow LinkedHashMap post-actions
 
/**
 * 当节点被访问后调用，比如
 *
 * @param p 被访问的节点
 */
void afterNodeAccess(Node<K, V> p) {
}
 
/**
 * 当元素添加到map后，执行的操作
 * @param evict
 */
void afterNodeInsertion(boolean evict) {
}
 
/**
 * 当元素被移除后，执行的操作
 * @param p 被移除的节点
 */
void afterNodeRemoval(Node<K, V> p) {
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

# 2.6.1 afterNodeAccess

afterNodeAccess 方法，是在元素节点被访问之后被调用，主要是以下几种（一部分）：

get 操作
put 操作，如果是替换，那么就会先查找是否存在已有节点，若发现已经存在该节点（则该节点被访问），就会回调afterNodeAccess 方法；
遍历操作

在 LinkedHashMap 中 afterNodeAccess，主要执行的就是将元素移动到链表的最后，前提是 accessOrder 为 true（在访问元素后，就将元素移动到链表移动到最后）。

/**
 * accessOrder为true时，表示map中元素保持和访问的顺序相同
 * 所以需要将访问的节点移动到双链表的末尾
 *
 * @param e 包含元素最新值的Node节点
 */
void afterNodeAccess(Node<K, V> e) { // move node to last
    LinkedHashMap.Entry<K, V> last;
 
    // accessOrder为true，表示map中数据的顺序按照访问顺序排序
    // 如果e不是最后一个元素才进行操作（因为
    if (accessOrder && (last = tail) != e) {
 
        // p指向e，b指向e的前继节点，a指向e的后继节点
        LinkedHashMap.Entry<K, V> p = (LinkedHashMap.Entry<K, V>) e, b = p.before, a = p.after;
 
        // 将p的后继设为null（因为要将其设为尾结点，尾结点的after为null）
        p.after = null;
 
        if (b == null) {
            // e的前继节点为null，证明e为头结点，则将e的后继节点设置为新头结点
            head = a;
        } else {
            // e不是头结点，则将e的后继节点设置为前继节点的后继节点
            b.after = a;
        }
 
        if (a != null) {
            // e节点不是尾结点，那么就将e的前继节点设置为后继节点的前继节点
            a.before = b;
        } else {
            // e的后继节点为null，证明e为尾结点，则将e的前继节点设置为尾结点
            last = b;
        }
 
        if (last == null) {
            // 如果修改指针关系（删除e后），last为null，也就是尾结点为null，证明链表为空了
            // 此时将p节点（也就是e节点）作为头结点
            head = p;
        } else {
 
            // 链表不为null，则将e节点挂到最后
            p.before = last;
            last.after = p;
        }
 
        // tail指针指向e节点
        tail = p;
 
        // 修改次数加1
        ++modCount;
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53

# 2.6.2 afterNodeInsertion

afterNodeInsertion 方法是在 HashMap 的 put 和 putAll 方法调用后执行的，主要做的就是删除链表的头结点。

在 LinkedHashMap 中，默认是不会每次删除头结点的，如果需要加入节点后进行删除头结点，则需要另外创建子类进行实现逻辑。

上面提到一个 eldestEntry，也就是最老的 Entry，其实也就是链表的头结点（accessOrder=false->最早插入，accessOrder=true->最久未访问）。

# 2.6.3 afterNodeRemoval

当调用 LinkedHashMap 的 remove 接口，其实也就是调用 HashMap 的 remove 接口（LinkedHashMap 没有重写该接口）。

在 HashMap 中移除元素后，会回调 afterNodeRemoval 方法，该方法在 HashMap 中并做任何操作，而是留给子类 LinkedHashMap 进行定义对应的操作，LinkedHashMap 做的就是维护链表指针，将删除的元素从链表中删除。

/**
 * LinkedHashMap删除元素后，维护链表间的指针关系，将节点从双链表中删除
 */
@Override
void afterNodeRemoval(Node<K, V> e) { // unlink
    LinkedHashMap.Entry<K, V> p = (LinkedHashMap.Entry<K, V>) e, b = p.before, a = p.after;
    p.before = p.after = null;
 
    if (b == null) {
        // b为e的前继节点，如果前继节点为null，证明e为头结点，则将第二个节点（e的后继）作为新的头结点
        head = a;
    } else {
        // e不是头结点，维护前继和后继的关系
        b.after = a;
    }
 
    if (a == null) {
        // 后继节点为空，表示e为尾结点，此时将e的前继节点b作为尾结点
        tail = b;
    } else {
        // e不是尾结点，则前继和后继的关系
        a.before = b;
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

# 2.6.4 internalWriteEntries

当序列化 map 的时候（使用 ObjectOutputStream），会调用 HashMap 中的 writeObject 方法

/**
 * 调用ObjectOutputStream来序列化map时，会调用writeObject方法
 */
private void writeObject(java.io.ObjectOutputStream s) throws IOException {
    int buckets = capacity();
     
    // 将一些属性写入到流中
    s.defaultWriteObject();
    s.writeInt(buckets);
    s.writeInt(size);
 
    // 将数据写入
    internalWriteEntries(s);
}
 
/**
 * HashMap中的实现，将map中的数据顺序写入
 */
void internalWriteEntries(java.io.ObjectOutputStream s) throws IOException {
    Node<K, V>[] tab;
    // 如果map不为空，则遍历数组的每个位置进行操作
    if (size > 0 && (tab = table) != null) {
        for (int i = 0; i < tab.length; ++i) {
 
            // 每个位置可能是链表或者红黑树结构，则进行遍历时写入
            for (Node<K, V> e = tab[i]; e != null; e = e.next) {
                s.writeObject(e.key);
                s.writeObject(e.value);
            }
        }
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

internalWriteEntries 方法，就是在输出的时候决定数据的顺序，可以看到上面是 HashMap的internalWriteEntries 方法，是依次遍历数组的每个位置，然后遍历每个位置上的链表或者红黑树，这个时候顺序并没有什么规律。而 LinkedHashMap，只是重写了internalWriteEntries 方法，在其中对顺序进行调整：

/**
 * LinkedHashMap中的实现
 */
void internalWriteEntries(java.io.ObjectOutputStream s) throws IOException {
    // 遍历双链表，从头到尾进行遍历，保证了顺序
    for (LinkedHashMap.Entry<K, V> e = head; e != null; e = e.after) {
        s.writeObject(e.key);
        s.writeObject(e.value);
    }
}

1
2
3
4
5
6
7
8
9
10

# 2.7 LinkedHashMap.get 方法

/**
 * 获取key对应的值
 */
public V get(Object key) {
    Node<K, V> e;
 
    // 调用HashMap中的getNode
    if ((e = getNode(hash(key), key)) == null) {
        return null;
    }
 
    // 如果设置的顺序是按照访问顺序，那么就需要在访问节点后，将节点移到末尾
    if (accessOrder) {
        afterNodeAccess(e);
    }
 
    return e.value;
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

# 3. 总结

其实对于 LinkedHashMap，没有太多的需要阐述的，更多的应该是看 HashMap，因为维护节点顺序的操作都是在 HashMap 中进行回调的。

简单理解 LinkedHashMap，也就是利用双链表数据结构，在 HashMap 的 Node 节点类型上增加前后指针，每次访问或者修改节点后，会回调相关的 callback，进行节点顺序的维护。节点的顺序可以分为插入顺序和访问顺序，通过 accessOrder 进行控制。

# 4. 常见的面试题

一般是问LinkedHashMap的原理，比如：

节点类型
底层是双链表还是单链表
节点的顺序（accessOrder）
几个扩展点（afterNodeAccess、afterNodeInsertion、afterNodeRemoval）

而关于节点的顺序，如果时间长了，可能会忘记，这里简单记一下：对于 accessOrder 为 false，也就是默认情况下，遍历时元素的顺序只与插入的顺序有关；如果某个 key 对应的数据已经存在，再次put、replace 该 key 后，元素的顺序不会发生改变。对于 accessOrder 为 true，将元素加入 map 后：1.在没有访问的情况下，遍历map元素，顺序与插入顺序一致；2.访问元素（access），包括get、put、replace操作，无论是替换还是新增，元素都将移动到最后！！

# 5. LinkedHashSet

LinkedHashSet 是对 LinkedHashMap 的简单包装，对 LinkedHashSet 的函数调用都会转换成合适的 LinkedHashMap 方法，因此 LinkedHashSet 的实现非常简单，这里不再赘述。

# 6. 参考

https://www.cnblogs.com/-beyond/p/13412164.html
https://pdai.tech/md/java/collection/java-map-LinkedHashMap&LinkedHashSet.html

#Java #LinkedHashSet #LinkedHashMap

上次更新: 2024-08-19

← Map - HashMap & HashSet 源码解析 Map - TreeSet & TreeMap 源码解析→