首页 > 编程 > Java > 正文

Java集合类框架学习 5.2 —— ConcurrentHashMap(JDK1.7)

2019-11-06 07:08:53
字体:
来源:转载
供稿:网友
以下内容,如有问题,烦请指出,谢谢!jdk1.7的ConcurrentHashMap整体设计、存储结构、思路,和1.6的基本一样,都是用代理给相应的Segment进行对应的操作。设计实现上一个比较大的改变就HashEntry的next指针不再是final的,改为volatile,并且用Unsafe提供的操作进行有序的延迟写入(lazySet)。理解1.7的代码,需要对sun.misc.Unsafe有基本的了解,可以看下这里,然后我下面也有说。零、主要改动1、jdk1.7开始,集合类大多使用懒初始化,也就是默认构造的集合类,底层的存储结构使用尽量少的空间,等真正添加元素时才真正初始化。1.7的ConcurrentHashMap默认构造时只初始化 index = 0 的Segment,其余的都是put时初始化,另外会出现Segment = null的情况,需要多判断下。2、大量使用 sun,misc.Unsafe 提供的底层操作方法,代替了一些实现比较简单的方法,稍微强化了方法的在并发上功能(比如对普通变量,也能够进行volatile读写),另外也带来了一些效率的提升。3、修复1.6的一些小问题(具体看后面的代码分析注释)。一、基本性质跟1.6基本一样,没涉及这方面的修改。二、常量和变量1、常量

这块因为Unsafe的引入,多了一些相关的常量。

static final int DEFAULT_INITIAL_CAPACITY = 16;static final float DEFAULT_LOAD_FACTOR = 0.75f;static final int DEFAULT_CONCURRENCY_LEVEL = 16;static final int MAXIMUM_CAPACITY = 1 << 30;static final int MAX_SEGMENTS = 1 << 16;static final int RETRIES_BEFORE_LOCK = 2;// 每个段的最小容量。段容量必须是2^n,最少是2能够保证在初始化一个Segment后的第一次put时不会立即扩容// 1.6的Segment最小容量是1,第一次put就会用满结合1.6的构造方法和Segment.put中扩容部分一起看static final int MIN_SEGMENT_TABLE_CAPACITY = 2;// 下面的全都是Unsafe有关的// Unsafe mechanicsPRivate static final sun.misc.Unsafe UNSAFE;// Segment数组的每个实例的内存结构中,存储数组第一个元素的地址相对于该对象实例起始地址的偏移量// 此值和对象指针(对象引用)结合使用,可以得到数组首地址// java对象会有对象头,数组对象还有length属性,因此Java数组的第一个元素的地址不再是C语言中数组实例的首地址// 可以理解为C结构体中有个数组,求这个数组的第一个元素的地址相对结构体实例地址的偏移量private static final long SBASE;// Segment数组的每个元素在Segment实例的内存中占用的空间,基本类型就是基本类型的字节大小,引用类型存储的是指针,具体根据系统环境确定// 相当于C语言中 *(p+1) 中这个1实际代表多少字节private static final int SSHIFT;// 同上面两个private static final long TBASE;private static final int TSHIFT;// 下面几个相当于C语言结构体中属性相对实例地址的偏移量,知道起始地址、偏移量、变量类型,就能用 * 运算快速读写变量的值private static final long HASHSEED_OFFSET;private static final long SEGSHIFT_OFFSET;private static final long SEGMASK_OFFSET;private static final long SEGMENTS_OFFSET;static {    int ss, ts;    try {        UNSAFE = sun.misc.Unsafe.getUnsafe();        Class tc = HashEntry[].class;        Class sc = Segment[].class;        TBASE = UNSAFE.arrayBaSEOffset(tc);        SBASE = UNSAFE.arrayBaseOffset(sc);        ts = UNSAFE.arrayIndexScale(tc);        ss = UNSAFE.arrayIndexScale(sc);        HASHSEED_OFFSET = UNSAFE.objectFieldOffset(ConcurrentHashMap.class.getDeclaredField("hashSeed"));        SEGSHIFT_OFFSET = UNSAFE.objectFieldOffset(ConcurrentHashMap.class.getDeclaredField("segmentShift"));        SEGMASK_OFFSET = UNSAFE.objectFieldOffset(ConcurrentHashMap.class.getDeclaredField("segmentMask"));        SEGMENTS_OFFSET = UNSAFE.objectFieldOffset(ConcurrentHashMap.class.getDeclaredField("segments"));    } catch (Exception e) {        throw new Error(e);    }    if ((ss & (ss-1)) != 0 || (ts & (ts-1)) != 0)        throw new Error("data type scale not a power of two");    // 下面的是求 lb(ss),lb = log2,具体可以看下Integer.numberOfLeadingZeros的实现和注释    // 这个方法求一个int二进制中从左边开始最长的连续的0的数目(最左边的符号位不算),因为ss是2^n,这里可以看做是求这个n    // 本人环境 Java(TM) SE Runtime Environment (build 1.8.0_111-b14) Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode)    //     默认开启指针压缩,一个指针(引用)占用4字节时    // 那么ss = ts = 4,得到SSHIFT = TSHIFT = 2    // 下面两个值主要是为了用位运算代替乘法提高效率    SSHIFT = 31 - Integer.numberOfLeadingZeros(ss);    TSHIFT = 31 - Integer.numberOfLeadingZeros(ts);}

关于偏移量有关的,可以用下面两个C语言的例子了解下。这几个偏移量只和Java虚拟机有关,一次程序运行过程中它们是确定的。

#include <stdio.h>#include <stdlib.h>int main(int argc, char *argv[]) {    int a[] = {0, 1, 2, 3, 4, 5}; /* 这里就用简单的数组,实际比较像C结构体中有个数组类型的属性 */    /* SBASE相当于数组首地址base */    /* 你可以把 Unsafe.arrayBaseOffset 看出是求数组首地址 base ,实际中更像是求一个结构体中某个类型为数组的成员变量的 0 下标的地址*/    int* base = a;    int x = base;    /* 指针的加减运算会特殊处理,这里的加1,实际上是加上 sizeof(int) */    /* SSHIFT相当于shift,是指针移动一个单元的实际字节偏移量,这里是一个int的字节大小,在我的环境64bit windows下是4字节 */    /* arrayIndexScale 可以看做是求 base + 1 中这个 1 的实际字节数,也就是 sizeof(实际类型) */    int y = base + 1;    int shift = y - x;    return 0;    /* ConcurrentHashMap源码中的s = (Segment<K,V>)UNSAFE.getObject(segments, (j << SSHIFT) + SBASE),相当于就是 *(base + j),也就是读取segments[j] */}
#include <stdio.h>#include <stdlib.h>#pragma pack(4) /* 4字节内存对齐,下面的struct不会有填充空间 */typedef struct chm {    int hashseed;    int segshift;    int segmask;    long long otherValue;    int* p;} s_chm;int main(int argc, char *argv[]) {    int a[] = {100, 101, 102, 103, 104, 105};    s_chm c;    long long x;    long long hashseed_offset, segshift_offset, segmask_offset, otherValue_offset, p_offset;    c.hashseed = 0;    c.segshift = 28;    c.segmask = 15;    c.p = a;    c.otherValue = 12;    s_chm* pC = &c;    x = pC;    /* 求偏移量,也就是内存地址之间的差,直观但是不通用 */    /* 可以把 Unsafe.objectFieldOffset 看出是进行下面这种运算求得的值 */    hashseed_offset = (long long)&c.hashseed - (long long)&c;    segshift_offset = (long long)&c.segshift - (long long)&c;    segmask_offset = (long long)&c.segmask - (long long)&c;    otherValue_offset = (long long)&c.otherValue - (long long)&c;    p_offset = (long long)&c.p - (long long)&c;    printf("hashseed_offset = %d/n", hashseed_offset);     // hashseed_offset = 0    printf("segshift_offset = %d/n", segshift_offset);     // segshift_offset = 4    printf("segmask_offset = %d/n", segmask_offset);       // segmask_offset = 8    printf("otherValue_offset = %d/n", otherValue_offset); // otherValue_offset = 12    printf("p_offset = %d/n", p_offset);                   // p_offset = 20    /* 已知偏移量和实例的起始地址,就可以用 * 运算读取变量的值,需要用强转指明类型 */    /* Unsafe.getObjectVolatile/getObject(Object obj, long offset),中,obj == x == &c,offset就是offset */    /* Unsafe中这两个方法主要的功能就相当于是C语言的 * 运算,getObject(Object obj, long offset)相当于 "p = obj + offset, return *p" */    printf("hashseed = %d/n", *(int*)(x + hashseed_offset));      // hashseed = 0    printf("segshift = %d/n", *(int*)(x + segshift_offset));      // segshift = 28    printf("segmask = %d/n", *(int*)(x + segmask_offset));        // segmask = 15    printf("otherValue = %d/n", *(long*)(x + otherValue_offset)); // otherValue = 12    printf("*p = %d/n", **(int**)(x + p_offset));                 // *p = 100,也就是a[0]    system("pause");    return 0;    /* Unsafe.putObject/putObjectVolatile(Object obj, long offset, Object value) 这几个put方法,就相当于 "p = obj + offset, *(类型指针)(p) = value " */}2、变量一点点变化,1.7的HashMap中说了,hashseed不影响基本流程。
// 跟 jdk1.7 的HashMap一样,会根据系统属性生成一个 hashSeed,提高hash随机性。// 不过Entry的hash值是不会变的,这一点跟1.6的一样private transient final int hashSeed = randomHashSeed(this);final int segmentMask;final int segmentShift;final Segment<K,V>[] segments;transient Set<K> keySet;transient Set<Map.Entry<K,V>> entrySet;transient Collection<V> values;三、基本类
static final class HashEntry<K,V> {    final int hash; // hash是final的,1.7的HashMap中不是final的,用final对扩容比较友好    final K key;    volatile V value;    volatile HashEntry<K,V> next; // jdk1.7中next指针不再是final的,改为volatile,使用 setNext 方法(内部用Unsafe的提供的方法)更新    HashEntry(int hash, K key, V value, HashEntry<K,V> next) {        this.hash = hash;        this.key = key;        this.value = value;        this.next = next;    }    // putOrderedObject,这个方法只有作用于volatile才有效,它能保证写操作的之间的顺序性,但是不保证能立马被其他线程读取到最新结果,是一种lazySet,效率比volatile高,但是只有volatile的“一半”的效果    // 普通的volatile保证写操作的结果能立马被其他线程看到,不论其他线程是读操作还写操作    // putOrderedObject能保证其他线程在写操作时一定能看到这个方法对变量的改变,但是其他线程只是进行读操作时,不一定能看到这个方法对变量的改变    final void setNext(HashEntry<K,V> n) {        UNSAFE.putOrderedObject(this, nextOffset, n);    }    // 初始化执行Unsafe有关的操作    static final sun.misc.Unsafe UNSAFE;    static final long nextOffset;    static {        try {            UNSAFE = sun.misc.Unsafe.getUnsafe();            Class k = HashEntry.class;            nextOffset = UNSAFE.objectFieldOffset                (k.getDeclaredField("next"));        } catch (Exception e) {            throw new Error(e);        }    }}jdk1.7的Segment
static final class Segment<K,V> extends ReentrantLock implements Serializable {    private static final long serialVersionUID = 2249069246763182397L;    static final int MAX_SCAN_RETRIES = Runtime.getRuntime().availableProcessors() > 1 ? 64 : 1; // 尝试次数    transient volatile HashEntry<K,V>[] table;    transient int count;    transient int modCount;    transient int threshold;    final float loadFactor;    Segment(float lf, int threshold, HashEntry<K,V>[] tab) {        this.loadFactor = lf;        this.threshold = threshold;        this.table = tab;    }    // jdk1.6中的 newArray、setTable 这两个方法因为实现太简单了,直接不用了    // jdk1.6中的 get、containsKey、containsValue 这几个方法,因为都是读操作,实现基本类似,用 Unsafe 提供的一些底层操作代替了    // jdk1.6中的 getFirst 虽然实现也很简单,但还是用 Unsafe 提供的一些底层方法强化了这个操作,    //     保证了对数组元素的volatile读取,1.6的只保证对整个数组的读取是volatile    // jdk1.6中的 readValueUnderLock 在1.7中彻底去掉了        // 1.7多了个scanAndLockForPut的操作,也完善了put触发扩容的机制(见1.6版本我在Segment.put中触发扩容处写的注释),同时处理了超过最大容量的情况,其余的跟1.6差不多    final V put(K key, int hash, V value, boolean onlyIfAbsent) {        HashEntry<K,V> node = tryLock() ? null : scanAndLockForPut(key, hash, value); // 看scanAndLockForPut方法的注释        V oldValue;        try {            HashEntry<K,V>[] tab = table;            int index = (tab.length - 1) & hash;            HashEntry<K,V> first = entryAt(tab, index);            for (HashEntry<K,V> e = first;;) {                if (e != null) {                    K k;                    if ((k = e.key) == key || (e.hash == hash && key.equals(k))) {                        oldValue = e.value;                        if (!onlyIfAbsent) {                            e.value = value;                            ++modCount; // 1.7的put相同的key(这时候相当于replace)时也会修改modCount了,1.6是不会的,能够更大地保证containValue这个方法的准确性                        }                        break;                    }                    e = e.next;                }                else {                    if (node != null)                        node.setNext(first); // 尝试添加在链表头部                    else                        node = new HashEntry<K,V>(hash, key, value, first);                    int c = count + 1; // 先加1                    if (c > threshold && tab.length < MAXIMUM_CAPACITY) // 超过最大容量的情况,在put这里一并处理了                        rehash(node);                    else                        setEntryAt(tab, index, node); // 不扩容时,直接让新节点成为头节点                    ++modCount;                    count = c;                    oldValue = null;                    break;                }            }        } finally {            unlock();        }        return oldValue;    }    // 1.7的rehash方法带有参数了,这个参数node就是要新put进去的node,新的rehash方法带有部分put的功能    // 节点迁移的基本思路还是和1.6的一样    @SuppressWarnings("unchecked")    private void rehash(HashEntry<K,V> node) {        HashEntry<K,V>[] oldTable = table;        int oldCapacity = oldTable.length;        int newCapacity = oldCapacity << 1;        threshold = (int)(newCapacity * loadFactor);        HashEntry<K,V>[] newTable = (HashEntry<K,V>[]) new HashEntry[newCapacity];        int sizeMask = newCapacity - 1;        for (int i = 0; i < oldCapacity ; i++) {            HashEntry<K,V> e = oldTable[i];            if (e != null) {                HashEntry<K,V> next = e.next;                int idx = e.hash & sizeMask;                if (next == null) //  Single node on list 只有一个节点,简单处理                    newTable[idx] = e;                else { // Reuse consecutive sequence at same slot 最大地重用链表尾部的一段连续的节点(这些节点扩容后在新数组中的同一个hash桶中),并标记位置                    HashEntry<K,V> lastRun = e;                    int lastIdx = idx;                    for (HashEntry<K,V> last = next;                         last != null;                         last = last.next) {                        int k = last.hash & sizeMask;                        if (k != lastIdx) {                            lastIdx = k;                            lastRun = last;                        }                    }                    newTable[lastIdx] = lastRun;                    // Clone remaining nodes 对标记之前的不能重用的节点进行复制,再重新添加到新数组对应的hash桶中去                    for (HashEntry<K,V> p = e; p != lastRun; p = p.next) {                        V v = p.value;                        int h = p.hash;                        int k = h & sizeMask;                        HashEntry<K,V> n = newTable[k];                        newTable[k] = new HashEntry<K,V>(h, p.key, v, n);                    }                }            }        }        int nodeIndex = node.hash & sizeMask; // add the new node 部分的put功能,把新节点添加到链表的最前面        node.setNext(newTable[nodeIndex]);        newTable[nodeIndex] = node;        table = newTable;    }    // 为put方法而编写的,在尝试获取锁的同时时进行一些准备工作的方法    // 获取不到锁时,会尝试一定次数的准备工作,这个准备工作指的是“遍历并预先创建要被添加的新节点,同时监测链表是否改变”    // 这样有可能在获取到锁时新的要被put的节点已经创建了,可以在put时少做一些工作    // 准备工作中也会不断地尝试获取锁,超过最大准备工作尝试次数就直接阻塞等待地获取锁    private HashEntry<K,V> scanAndLockForPut(K key, int hash, V value) {        HashEntry<K,V> first = entryForHash(this, hash);        HashEntry<K,V> e = first;        HashEntry<K,V> node = null;        int retries = -1; // negative while locating node        while (!tryLock()) {            HashEntry<K,V> f; // to recheck first below            if (retries < 0) {                if (e == null) { // 这条链表上没有“相等”的节点                    if (node == null) // speculatively create node 预先创建要被添加的新节点                        node = new HashEntry<K,V>(hash, key, value, null);                    retries = 0;  // 遍历完都没碰见“相等”,不再遍历了,改为 尝试直接获取锁,没获取到锁时尝试监测链表是否改变                }                else if (key.equals(e.key)) // 碰见“相等”,不再遍历了,改为 尝试直接获取锁,没获取到锁时尝试监测链表是否改变                    retries = 0;                else             // 遍历链表                    e = e.next;            }            else if (++retries > MAX_SCAN_RETRIES) { // 超过最大的准备工作尝试次数,放弃准备工作尝试,直接阻塞等待地获取锁                lock();                break;            }            else if ((retries & 1) == 0 && (f = entryForHash(this, hash)) != first) { // 间隔一次判断是否有新节点添加进去                e = first = f; // re-traverse if entry changed 如果链表改变,就重新遍历一次链表                retries = -1; // 重置次数            }        }        return node;    }    // 基本同scanAndLockForPut,但是更简单些,只用遍历链表并监测改变,不用创建新节点    private void scanAndLock(Object key, int hash) {        HashEntry<K,V> first = entryForHash(this, hash);        HashEntry<K,V> e = first;        int retries = -1;        while (!tryLock()) {            HashEntry<K,V> f;            if (retries < 0) {                if (e == null || key.equals(e.key))                    retries = 0;                else                    e = e.next;            }            else if (++retries > MAX_SCAN_RETRIES) {                lock();                break;            }            else if ((retries & 1) == 0 && (f = entryForHash(this, hash)) != first) {                e = first = f;                retries = -1;            }        }    }    // 因为1.7的HashEntry.next是volatile的,可以修改,因此remove操作简单了很多,就是基本的链表删除操作。    final V remove(Object key, int hash, Object value) {        if (!tryLock())            scanAndLock(key, hash);        V oldValue = null;        try {            HashEntry<K,V>[] tab = table;            int index = (tab.length - 1) & hash;            HashEntry<K,V> e = entryAt(tab, index);            HashEntry<K,V> pred = null;            while (e != null) {                K k;                HashEntry<K,V> next = e.next;                if ((k = e.key) == key || (e.hash == hash && key.equals(k))) {                    V v = e.value;                    if (value == null || value == v || value.equals(v)) {                        if (pred == null)                            setEntryAt(tab, index, next); // remove的是第一个节点                        else                            pred.setNext(next); // 直接链表操作,前面说了1.7的HashEntry.next是volatile的,可以修改,不再跟1.6一样是final的!!!                        ++modCount;                        --count;                        oldValue = v;                    }                    break;                }                pred = e;                e = next;            }        } finally {            unlock();        }        return oldValue;    }    // 1.7相对1.6的两点改动:    // 1、多了个scanAndLock操作;2、会修改modCount    final boolean replace(K key, int hash, V oldValue, V newValue) {        if (!tryLock())            scanAndLock(key, hash);        boolean replaced = false;        try {            HashEntry<K,V> e;            for (e = entryForHash(this, hash); e != null; e = e.next) {                K k;                if ((k = e.key) == key || (e.hash == hash && key.equals(k))) {                    if (oldValue.equals(e.value)) {                        e.value = newValue;                        ++modCount; // 1.7的replace方法也会修改modCount了,1.6是不会的,能够更大地保证containValue这个方法                        replaced = true;                    }                    break;                }            }        } finally {            unlock();        }        return replaced;    }    // 基本同replace(K key, int hash, V oldValue, V newValue)    final V replace(K key, int hash, V value) {        if (!tryLock())            scanAndLock(key, hash);        V oldValue = null;        try {            HashEntry<K,V> e;            for (e = entryForHash(this, hash); e != null; e = e.next) {                K k;                if ((k = e.key) == key || (e.hash == hash && key.equals(k))) {                    oldValue = e.value;                    e.value = value;                    ++modCount; // 1.7的replace方法也会修改modCount了,1.6是不会的,能够更大地保证containValue这个方法                    break;                }            }        } finally {            unlock();        }        return oldValue;    }    // 基本没改变    final void clear() {        lock();        try {            HashEntry<K,V>[] tab = table;            for (int i = 0; i < tab.length ; i++)                setEntryAt(tab, i, null);            ++modCount;            count = 0;        } finally {            unlock();        }    }}

四、构造方法

主要改变是使用懒初始化,只初始化Sgement数组的第一个Segment,剩下的Segment都是使用时再参照第一个Segment的参数初始化,相对 jdk1.6 整体没多大变化。
public ConcurrentHashMap(int initialCapacity, float loadFactor, int concurrencyLevel) {    if (!(loadFactor > 0) || initialCapacity < 0 || concurrencyLevel <= 0)        throw new IllegalArgumentException();    if (concurrencyLevel > MAX_SEGMENTS)        concurrencyLevel = MAX_SEGMENTS;    // Find power-of-two sizes best matching arguments    int sshift = 0;    int ssize = 1;    while (ssize < concurrencyLevel) {        ++sshift;        ssize <<= 1;    }    this.segmentShift = 32 - sshift;    this.segmentMask = ssize - 1;    if (initialCapacity > MAXIMUM_CAPACITY)        initialCapacity = MAXIMUM_CAPACITY;    int c = initialCapacity / ssize;    if (c * ssize < initialCapacity)        ++c;    int cap = MIN_SEGMENT_TABLE_CAPACITY;    while (cap < c)        cap <<= 1;    // create segments and segments[0] 构造方法只构造第一个Segment,后面懒初始化时构造的其余的 Segment 使用的参数,都从 segments[0] 中读取    Segment<K,V> s0 = new Segment<K,V>(loadFactor, (int)(cap * loadFactor), (HashEntry<K,V>[])new HashEntry[cap]);    Segment<K,V>[] ss = (Segment<K,V>[])new Segment[ssize];    UNSAFE.putOrderedObject(ss, SBASE, s0); // ordered write of segments[0]    this.segments = ss;}// 其余的几个不说

五、一些内部方法

主要改变也是使用Unsafe来进行底层操作代替普通的Java方法1、hash函数使用了jdk 1.7 HashMap的设计,引入了 hashseed ,会根据系统属性生成一个 hashSeed,提高hash随机性。hash的具体计算跟 ConcurrentHashMap 1.6的一样。
private int hash(Object k) {    int h = hashSeed;    if ((0 != h) && (k instanceof String)) {        return sun.misc.Hashing.stringHash32((String) k);    }    h ^= k.hashCode();    // Spread bits to regularize both segment and index locations,    // using variant of single-Word Wang/Jenkins hash.    h += (h <<  15) ^ 0xffffcd7d;    h ^= (h >>> 10);    h += (h <<   3);    h ^= (h >>>  6);    h += (h <<   2) + (h << 14);    return h ^ (h >>> 16);}

2、Segment/Entry定位方法

使用Unsafe提供的功能强大的底层操作代替普通的Java操作,增强方法的性能(运行速度,CAS,普通变量的volatile读写,volatile变量的lazySet)

// 通过下标定位到Segment中下标为 i 的hash桶的第一个节点,也就是链表的头结点,用 Unsafe 提供对数组元素的 volatile 读取,还要处理下Segment为null的情况static final <K,V> HashEntry<K,V> entryAt(HashEntry<K,V>[] tab, int i) {    return (tab == null) ? null : (HashEntry<K,V>) UNSAFE.getObjectVolatile(tab, ((long)i << TSHIFT) + TBASE);}// 设置某个Segment中下标为 i 的hash桶的第一个节点,也就是链表的头结点为e,使用的是lazySet提高效率static final <K,V> void setEntryAt(HashEntry<K,V>[] tab, int i, HashEntry<K,V> e) {    UNSAFE.putOrderedObject(tab, ((long)i << TSHIFT) + TBASE, e);}// 使用Unsafe提供的volatile读取功能,通过下标求segments[j]// segments是用final修饰的,构造方法保证它会在ConcurrentHashMap的实例被引用前初始化成正确的值,null的情况只在反序列化时才会出现static final <K,V> Segment<K,V> segmentAt(Segment<K,V>[] ss, int j) {    long u = (j << SSHIFT) + SBASE; // 计算实际的字节偏移量    return ss == null ? null : (Segment<K,V>) UNSAFE.getObjectVolatile(ss, u);}// 确保Segment被初始化// 因为懒初始化的原因,只有segments[0]在构造方法中被初始化,其余的都是后面按需初始化,此方法就是做这个初始化的// 使用 CAS 不加锁,同时也能保证每个Segment只被初始化一次private Segment<K,V> ensureSegment(int k) {    final Segment<K,V>[] ss = this.segments;    long u = (k << SSHIFT) + SBASE; // raw offset 实际的字节偏移量    Segment<K,V> seg;    if ((seg = (Segment<K,V>)UNSAFE.getObjectVolatile(ss, u)) == null) {        Segment<K,V> proto = ss[0]; // use segment 0 as prototype        int cap = proto.table.length;        float lf = proto.loadFactor;        int threshold = (int)(cap * lf);        HashEntry<K,V>[] tab = (HashEntry<K,V>[])new HashEntry[cap];        if ((seg = (Segment<K,V>)UNSAFE.getObjectVolatile(ss, u)) == null) { // recheck 再检查一次是否已经被初始化            Segment<K,V> s = new Segment<K,V>(lf, threshold, tab);            while ((seg = (Segment<K,V>)UNSAFE.getObjectVolatile(ss, u)) == null) {                if (UNSAFE.compareAndSwapObject(ss, u, null, seg = s)) // 使用 CAS 确保只被初始化一次                    break;            }        }    }    return seg;}// 使用hash定位Segment,相对于 segmentAt 多一次用 (h >>> segmentShift) & segmentMask 求下标过程private Segment<K,V> segmentForHash(int h) {    long u = (((h >>> segmentShift) & segmentMask) << SSHIFT) + SBASE;    return (Segment<K,V>) UNSAFE.getObjectVolatile(segments, u);}// 使用hash定位头结点,相对于 entryAt 多用一次 (tab.length - 1) & h 求下标的过程static final <K,V> HashEntry<K,V> entryForHash(Segment<K,V> seg, int h) {    HashEntry<K,V>[] tab;    return (seg == null || (tab = seg.table) == null) ? null :        (HashEntry<K,V>) UNSAFE.getObjectVolatile        (tab, ((long)(((tab.length - 1) & h)) << TSHIFT) + TBASE);}

六、常用方法

理解了下面三个:1、jdk 1.7 的 HashMap(可以看我写的这篇)2、jdk 1.6 的 ConcurrentHashMap(可以看我写的这篇)3、jdk 1.7 的 ConcurrentHashMap 相对 jdk 1.6 的总体变化(看上面)就可以一个个方法过流水帐了,基本思路还是一样,通过hash定位到Segment,交给相应的Segment去执行。

读方法

// isEmpty方法,实现思路跟1.6的基本一样,利用modCount单调递增的性质偷了个懒,只进行sum(modCount)的前后比较,不用一个个单独地前后比较public boolean isEmpty() {    long sum = 0L;    final Segment<K,V>[] segments = this.segments;    for (int j = 0; j < segments.length; ++j) {        Segment<K,V> seg = segmentAt(segments, j);        if (seg != null) {            if (seg.count != 0)                return false;            sum += seg.modCount;        }    }    if (sum != 0L) { // recheck unless no modifications        for (int j = 0; j < segments.length; ++j) {            Segment<K,V> seg = segmentAt(segments, j);            if (seg != null) {                if (seg.count != 0)                    return false;                sum -= seg.modCount; // 1.6这里的一个个modCount对比,1.7改为总体对比一次,因为modCount的单调递增的,不会有count可能出现的 ABA 问题            }        }        if (sum != 0L)            return false;    }    return true;}// size方法,实现思路跟1.6的基本一样,也利用了modCount单调递增的性质偷了个懒public int size() {    final Segment<K,V>[] segments = this.segments;    int size;    boolean overflow; // true if size overflows 32 bits    long sum;         // sum of modCounts    long last = 0L;   // previous sum    int retries = -1; // first iteration isn't retry    try {        for (;;) {            if (retries++ == RETRIES_BEFORE_LOCK) {                for (int j = 0; j < segments.length; ++j)                    ensureSegment(j).lock(); // force creation            }            sum = 0L;            size = 0;            overflow = false;            for (int j = 0; j < segments.length; ++j) {                Segment<K,V> seg = segmentAt(segments, j);                if (seg != null) {                    sum += seg.modCount;                    int c = seg.count;                    if (c < 0 || (size += c) < 0)                        overflow = true;                }            }            if (sum == last)                break;            last = sum;        }    } finally {        if (retries > RETRIES_BEFORE_LOCK) {            for (int j = 0; j < segments.length; ++j)                segmentAt(segments, j).unlock();        }    }    return overflow ? Integer.MAX_VALUE : size;}// get方法整体实现思路跟1.6基本一样// 1.7的使用了Unsafe.getObjectVolatile,它能为普通对象提供volatile读取功能,能够强化这里的get方法// get方法的操作都比较简单,就都把操作集中在这里,省略了Segment.get,减少方法调用带来的开销,抽象性层次性也没有变差public V get(Object key) {    Segment<K,V> s; // manually integrate access methods to reduce overhead 集中在这里手动访问减少方法调用开销    HashEntry<K,V>[] tab;    int h = hash(key);    long u = (((h >>> segmentShift) & segmentMask) << SSHIFT) + SBASE;    if ((s = (Segment<K,V>)UNSAFE.getObjectVolatile(segments, u)) != null &&(tab = s.table) != null) {        for (HashEntry<K,V> e = (HashEntry<K,V>) UNSAFE.getObjectVolatile(tab, ((long)(((tab.length - 1) & h)) << TSHIFT) + TBASE);            e != null; e = e.next) {            K k;            if ((k = e.key) == key || (e.hash == h && key.equals(k)))                return e.value;        }    }    return null;}// 跟上面的get几乎一样public boolean containsKey(Object key);// 基本同size方法// 1.6中put相同的key不改变modCount的问题,在上面说了,因此也提高了containsValue方法的准确性public boolean containsValue(Object value) {    // Same idea as size()    if (value == null)        throw new NullPointerException();    final Segment<K,V>[] segments = this.segments;    boolean found = false;    long last = 0;    int retries = -1;    try {        outer: for (;;) {            if (retries++ == RETRIES_BEFORE_LOCK) {                for (int j = 0; j < segments.length; ++j)                    ensureSegment(j).lock(); // force creation            }            long hashSum = 0L;            int sum = 0;            for (int j = 0; j < segments.length; ++j) {                HashEntry<K,V>[] tab;                Segment<K,V> seg = segmentAt(segments, j);                if (seg != null && (tab = seg.table) != null) {                    for (int i = 0 ; i < tab.length; i++) {                        HashEntry<K,V> e;                        for (e = entryAt(tab, i); e != null; e = e.next) {                            V v = e.value;                            if (v != null && value.equals(v)) {                                found = true;                                break outer; // 这里就算是contains也会再执行一次,1.6如果第一次contains就直接return,不会执行第二次                            }                        }                    }                    sum += seg.modCount;                }            }            if (retries > 0 && sum == last)                break;            last = sum;        }    } finally {        if (retries > RETRIES_BEFORE_LOCK) {            for (int j = 0; j < segments.length; ++j)                segmentAt(segments, j).unlock();        }    }    return found;}// 等价于containsValuepublic boolean contains(Object value);写方法
// 1.7开始大部分集合类都是懒初始化,put这里处理下懒初始化,其余基本思路跟1.6的差不多,都是代理给相应的Segment的同名方法public V put(K key, V value) {    Segment<K,V> s;    if (value == null)        throw new NullPointerException();    int hash = hash(key);    int j = (hash >>> segmentShift) & segmentMask;    if ((s = (Segment<K,V>)UNSAFE.getObject(segments, (j << SSHIFT) + SBASE)) == null) // nonvolatile; recheck in ensureSegment 非volatile方式读取,在ensureSegment中再检查一次        s = ensureSegment(j); // 处理Segment的初始化,上面第五点中说了    return s.put(key, hash, value, false);}// 同putpublic V putIfAbsent(K key, V value);// 跟1.6一样,都是循环put,不用全局锁,其他线程还是可以在这个方法执行期间成功进行写操作public void putAll(Map<? extends K, ? extends V> m);public void clear();// 额外处理下Segment为null的情况,其余基本同1.6,代理给相应的Segement的同名方法public V remove(Object key) {    int hash = hash(key);    Segment<K,V> s = segmentForHash(hash);    return s == null ? null : s.remove(key, hash, null); // 1.7使用懒初始化,会出现Segment为null的情况}// 同removepublic boolean remove(Object key, Object value);// 学remove一样额外处理下Segment为null的情况,其余思路跟1.6差不多,都是代理给相应的Segement的同名方法public boolean replace(K key, V oldValue, V newValue);public V replace(K key, V value);

七、视图和迭代器

除了Unsafe导致的一些读取方式变化外,其余的基本和 jdk1.6的保持不变,思路还是一样的。1.7相对1.6,主要的改动还是Unsafe那块的,基本设计上的改动并不大。一些方法看起来差异大,是因为Unsafe的操作就是那样原始,逻辑上还是跟1.6对应的基本操作等价,理解起来不算难。

以上内容,如有问题,烦请指出,谢谢!


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表