|

Copy-On-Write簡稱COW,是一種用于程序設(shè)計中的優(yōu)化策略。其基本思路是,從一開始大家都在共享同一個內(nèi)容,當(dāng)某個人想要修改這個內(nèi)容的時候,才會真正把內(nèi)容Copy出去形成一個新的內(nèi)容然后再改,這是一種延時懶惰策略。從JDK1.5開始Java并發(fā)包里提供了兩個使用CopyOnWrite機制實現(xiàn)的并發(fā)容器,它們是CopyOnWriteArrayList和CopyOnWriteArraySet。CopyOnWrite容器非常有用,可以在非常多的并發(fā)場景中使用到。
什么是CopyOnWrite容器
CopyOnWrite容器即寫時復(fù)制的容器。通俗的理解是當(dāng)我們往一個容器添加元素的時候,不直接往當(dāng)前容器添加,而是先將當(dāng)前容器進行Copy,復(fù)制出一個新的容器,然后新的容器里添加元素,添加完元素之后,再將原容器的引用指向新的容器。這樣做的好處是我們可以對CopyOnWrite容器進行并發(fā)的讀,而不需要加鎖,因為當(dāng)前容器不會添加任何元素。所以CopyOnWrite容器也是一種讀寫分離的思想,讀和寫不同的容器。
CopyOnWriteArrayList的實現(xiàn)原理
在使用CopyOnWriteArrayList之前,我們先閱讀其源碼了解下它是如何實現(xiàn)的。以下代碼是向ArrayList里添加元素,可以發(fā)現(xiàn)在添加的時候是需要加鎖的,否則多線程寫的時候會Copy出N個副本出來。
01 | public boolean add(T e) { |
02 | final ReentrantLock lock = this.lock; |
06 | Object[] elements = getArray(); |
08 | int len = elements.length; |
11 | Object[] newElements = Arrays.copyOf(elements, len + 1); |
15 | // 把原數(shù)組引用指向新數(shù)組 |
17 | setArray(newElements); |
29 | final void setArray(Object[] a) { |
讀的時候不需要加鎖,如果讀的時候有多個線程正在向ArrayList添加數(shù)據(jù),讀還是會讀到舊的數(shù)據(jù),因為寫的時候不會鎖住舊的ArrayList。
1 | public E get(int index) { |
2 | return get(getArray(), index); |
JDK中并沒有提供CopyOnWriteMap,我們可以參考CopyOnWriteArrayList來實現(xiàn)一個,基本代碼如下:
01 | import java.util.Collection; |
05 | public class CopyOnWriteMap<K, V> implements Map<K, V>, Cloneable { |
06 | private volatile Map<K, V> internalMap; |
08 | public CopyOnWriteMap() { |
09 | internalMap = new HashMap<K, V>(); |
12 | public V put(K key, V value) { |
15 | Map<K, V> newMap = new HashMap<K, V>(internalMap); |
16 | V val = newMap.put(key, value); |
22 | public V get(Object key) { |
23 | return internalMap.get(key); |
26 | public void putAll(Map<? extends K, ? extends V> newData) { |
28 | Map<K, V> newMap = new HashMap<K, V>(internalMap); |
29 | newMap.putAll(newData); |
實現(xiàn)很簡單,只要了解了CopyOnWrite機制,我們可以實現(xiàn)各種CopyOnWrite容器,并且在不同的應(yīng)用場景中使用。
CopyOnWrite的應(yīng)用場景
CopyOnWrite并發(fā)容器用于讀多寫少的并發(fā)場景。比如白名單,黑名單,商品類目的訪問和更新場景,假如我們有一個搜索網(wǎng)站,用戶在這個網(wǎng)站的搜索框中,輸入關(guān)鍵字搜索內(nèi)容,但是某些關(guān)鍵字不允許被搜索。這些不能被搜索的關(guān)鍵字會被放在一個黑名單當(dāng)中,黑名單每天晚上更新一次。當(dāng)用戶搜索時,會檢查當(dāng)前關(guān)鍵字在不在黑名單當(dāng)中,如果在,則提示不能搜索。實現(xiàn)代碼如下:
01 | package com.ifeve.book; |
05 | import com.ifeve.book.forkjoin.CopyOnWriteMap; |
13 | public class BlackListServiceImpl { |
15 | private static CopyOnWriteMap<String, Boolean> blackListMap = new CopyOnWriteMap<String, Boolean>( |
18 | public static boolean isBlackList(String id) { |
19 | return blackListMap.get(id) == null ? false : true; |
22 | public static void addBlackList(String id) { |
23 | blackListMap.put(id, Boolean.TRUE); |
31 | public static void addBlackList(Map<String,Boolean> ids) { |
32 | blackListMap.putAll(ids); |
代碼很簡單,但是使用CopyOnWriteMap需要注意兩件事情:
1. 減少擴容開銷。根據(jù)實際需要,初始化CopyOnWriteMap的大小,避免寫時CopyOnWriteMap擴容的開銷。
2. 使用批量添加。因為每次添加,容器每次都會進行復(fù)制,所以減少添加次數(shù),可以減少容器的復(fù)制次數(shù)。如使用上面代碼里的addBlackList方法。
CopyOnWrite的缺點
CopyOnWrite容器有很多優(yōu)點,但是同時也存在兩個問題,即內(nèi)存占用問題和數(shù)據(jù)一致性問題。所以在開發(fā)的時候需要注意一下。
內(nèi)存占用問題。因為CopyOnWrite的寫時復(fù)制機制,所以在進行寫操作的時候,內(nèi)存里會同時駐扎兩個對象的內(nèi)存,舊的對象和新寫入的對象(注意:在復(fù)制的時候只是復(fù)制容器里的引用,只是在寫的時候會創(chuàng)建新對象添加到新容器里,而舊容器的對象還在使用,所以有兩份對象內(nèi)存)。如果這些對象占用的內(nèi)存比較大,比如說200M左右,那么再寫入100M數(shù)據(jù)進去,內(nèi)存就會占用300M,那么這個時候很有可能造成頻繁的Yong GC和Full GC。之前我們系統(tǒng)中使用了一個服務(wù)由于每晚使用CopyOnWrite機制更新大對象,造成了每晚15秒的Full GC,應(yīng)用響應(yīng)時間也隨之變長。
針對內(nèi)存占用問題,可以通過壓縮容器中的元素的方法來減少大對象的內(nèi)存消耗,比如,如果元素全是10進制的數(shù)字,可以考慮把它壓縮成36進制或64進制?;蛘卟皇褂肅opyOnWrite容器,而使用其他的并發(fā)容器,如ConcurrentHashMap。
數(shù)據(jù)一致性問題。CopyOnWrite容器只能保證數(shù)據(jù)的最終一致性,不能保證數(shù)據(jù)的實時一致性。所以如果你希望寫入的的數(shù)據(jù),馬上能讀到,請不要使用CopyOnWrite容器。
關(guān)于C++的STL中,曾經(jīng)也有過Copy-On-Write的玩法,參見陳皓的《C++ STL String類中的Copy-On-Write》,后來,因為有很多線程安全上的事,就被去掉了。
花名清英,并發(fā)網(wǎng)()創(chuàng)始人,暢銷書《Java并發(fā)編程的藝術(shù)》作者,螞蟻金服技術(shù)專家。目前工作于支付寶微貸事業(yè)部,關(guān)注互聯(lián)網(wǎng)金融,并發(fā)編程和敏捷實踐。 添加本文到我的收藏
|