Java并发集合CopyOnWriteArrayList与synchronizedList对比

发布时间：2025-02-14 18:58:48 (有修改)
本文热度：浏览 303 赞 0 评论 0
文章标签： Java 并发编程集合框架
全文共1字，阅读约需1分钟

在Java并发编程中，处理集合的线程安全性是开发者必须直面的挑战。CopyOnWriteArrayList和Collections.synchronizedList()这两个看似相似的解决方案，在底层实现、性能特性和适用场景上存在着根本性差异。理解这些差异需要深入分析它们的实现原理，而不仅仅是停留在表面特征。

一、基因层面的差异剖析

1.1 同步机制的实现差异

Collections.synchronizedList()采用传统互斥锁机制，通过synchronized关键字对所有方法进行同步控制。其本质是在方法调用层面加锁，每次访问都会获取同一个监视器锁：

public static <T> List<T> synchronizedList(List<T> list) {
    return new SynchronizedList<>(list);
}

static class SynchronizedList<E> {
    final List<E> list;
    final Object mutex;

    public E get(int index) {
        synchronized (mutex) {return list.get(index);}
    }

    public E set(int index, E element) {
        synchronized (mutex) {return list.set(index, element);}
    }
    // 其他方法类似
}

而CopyOnWriteArrayList采用写时复制（Copy-On-Write）技术，所有修改操作（add/set/remove）都会创建底层数组的新副本：

public class CopyOnWriteArrayList<E> {
    private transient volatile Object[] array;

    public boolean add(E e) {
        synchronized (lock) {
            Object[] elements = getArray();
            int len = elements.length;
            Object[] newElements = Arrays.copyOf(elements, len + 1);
            newElements[len] = e;
            setArray(newElements);
            return true;
        }
    }
}

1.2 内存可见性保障

synchronizedList的可见性保障来自synchronized内置锁的happens-before关系，确保锁释放前的修改对后续获取该锁的线程可见。而CopyOnWriteArrayList通过volatile数组引用和final字段的语义保证可见性：

final transient Object lock = new Object();
private transient volatile Object[] array;

final Object[] getArray() {
    return array;
}

final void setArray(Object[] a) {
    array = a;
}

在写操作完成后，新数组引用通过volatile写立即对其他线程可见，这种设计避免了锁竞争但需要付出复制数组的代价。

二、迭代器行为的本质区别

2.1 快照迭代器 vs 实时视图

CopyOnWriteArrayList的迭代器基于创建时的数组快照：

public Iterator<E> iterator() {
    return new COWIterator<E>(getArray(), 0);
}

static final class COWIterator<E> implements ListIterator<E> {
    private final Object[] snapshot;
    private int cursor;

    COWIterator(Object[] elements, int initialCursor) {
        cursor = initialCursor;
        snapshot = elements;
    }
}

这意味着迭代过程中看到的集合状态是固定的，不会反映后续修改。而synchronizedList的迭代器是实时视图，需要外部同步来避免ConcurrentModificationException：

List<String> syncList = Collections.synchronizedList(new ArrayList<>());

// 错误用法：可能抛出ConcurrentModificationException
for (String s : syncList) {
    System.out.println(s);
}

// 正确用法
synchronized(syncList) {
    for (String s : syncList) {
        System.out.println(s);
    }
}

2.2 修改操作的可见性窗口

CopyOnWriteArrayList的写操作完成后，新数组立即对所有后续读操作可见。但已存在的迭代器仍继续使用旧数组。这种设计带来特殊的可见性特征：

CopyOnWriteArrayList<String> cowList = new CopyOnWriteArrayList<>();

// 线程A
new Thread(() -> {
    cowList.add("new element");
    System.out.println("Write completed");
}).start();

// 线程B
new Thread(() -> {
    // 可能看到旧状态，也可能看到新状态，取决于执行时序
    System.out.println(cowList); 
}).start();

相比之下，synchronizedList的修改在同步块结束后立即对所有线程可见，但需要其他线程在访问时也获取锁才能保证可见性。

三、性能特征与量化分析

3.1 读写操作的时间复杂度对比

通过JMH基准测试可以量化两者的性能差异（测试环境：8核CPU，JDK17）：

@BenchmarkMode(Mode.Throughput)
@State(Scope.Thread)
public class ListBenchmark {
    
    @Param({"1000", "10000"})
    private int size;
    
    private List<Integer> syncList;
    private List<Integer> cowList;

    @Setup
    public void setup() {
        syncList = Collections.synchronizedList(new ArrayList<>());
        cowList = new CopyOnWriteArrayList<>();
        // 预填充数据
        IntStream.range(0, size).forEach(i -> {
            syncList.add(i);
            cowList.add(i);
        });
    }

    @Benchmark
    public void syncListRead(Blackhole bh) {
        for (int i = 0; i < size; i++) {
            bh.consume(syncList.get(i));
        }
    }

    @Benchmark
    public void cowListRead(Blackhole bh) {
        for (int i = 0; i < size; i++) {
            bh.consume(cowList.get(i));
        }
    }

    @Benchmark
    public void syncListWrite() {
        syncList.add(size);
        syncList.remove(0);
    }

    @Benchmark
    public void cowListWrite() {
        cowList.add(size);
        cowList.remove(0);
    }
}

测试结果摘要：

操作类型	列表类型	吞吐量（ops/ms）size=1000	吞吐量（ops/ms）size=10000
读操作	synchronizedList	4523	387
读操作	CopyOnWriteArrayList	12897	1124
写操作	synchronizedList	892	67
写操作	CopyOnWriteArrayList	43	2

数据表明：

读操作：CopyOnWriteArrayList吞吐量是synchronizedList的2.8倍（小数据集）到2.9倍（大数据集）
写操作：synchronizedList吞吐量是CopyOnWriteArrayList的20倍（小数据集）到33倍（大数据集）

3.2 内存占用分析

创建包含百万元素的列表时：

List<Integer> list = new CopyOnWriteArrayList<>();
IntStream.range(0, 1_000_000).forEach(list::add);

// 内存占用约：4MB (每个Integer约4 bytes)
// 每次add操作需要复制整个数组，最后一次复制需要4MB内存

每次写操作的内存消耗公式：

内存消耗 = 当前数组长度 * 元素大小

这意味着频繁的写操作会导致：

大量临时对象产生
频繁的GC停顿
内存带宽压力增大

四、适用场景的深度解析

4.1 CopyOnWriteArrayList的理想场景

事件监听器管理是典型用例。考虑GUI框架中的事件监听器实现：

public class EventSource {
    private final CopyOnWriteArrayList<EventListener> listeners 
        = new CopyOnWriteArrayList<>();

    public void addListener(EventListener listener) {
        listeners.add(listener);
    }

    public void fireEvent(Event event) {
        for (EventListener listener : listeners) {
            listener.onEvent(event);
        }
    }
}

这种场景的优势：

注册/注销监听器（写操作）频率低
事件触发时需要遍历所有监听器（读操作）
迭代过程不需要同步，避免死锁风险

4.2 synchronizedList的适用情况

配置信息缓存的典型实现：

public class ConfigManager {
    private List<ConfigItem> configItems = 
        Collections.synchronizedList(new ArrayList<>());
    
    public void reloadConfig() {
        List<ConfigItem> newItems = loadFromDB();
        synchronized(configItems) {
            configItems.clear();
            configItems.addAll(newItems);
        }
    }
    
    public String getConfig(String key) {
        // 需要遍历查找
        synchronized(configItems) {
            for (ConfigItem item : configItems) {
                if (item.key.equals(key)) {
                    return item.value;
                }
            }
        }
        return null;
    }
}

这里选择synchronizedList的原因：

配置重载频率较低
需要保证配置读取的强一致性
遍历操作需要原子性保证

五、高级使用模式与陷阱规避

5.1 复合操作的原子性处理

即使使用线程安全集合，组合操作仍需额外同步：

// 错误用法：check-then-act存在竞态条件
if (!cowList.contains(element)) {
    cowList.add(element);
}

// 正确用法：使用原子方法
public class ConcurrentUtils {
    public static <E> boolean addIfAbsent(List<E> list, E element) {
        if (list instanceof CopyOnWriteArrayList) {
            CopyOnWriteArrayList<E> cowList = (CopyOnWriteArrayList<E>) list;
            return cowList.addIfAbsent(element);
        }
        synchronized(list) {
            if (!list.contains(element)) {
                return list.add(element);
            }
            return false;
        }
    }
}

5.2 内存泄漏防范

由于CopyOnWriteArrayList保留所有旧数组引用，在长时间运行的系统中需要注意：

public class DataProcessor {
    private final CopyOnWriteArrayList<byte[]> buffer = new CopyOnWriteArrayList<>();
    
    public void process(byte[] data) {
        buffer.add(data);
        // 处理完成后需要及时清除
    }
    
    public void cleanup() {
        buffer.clear(); // 显式释放内存
    }
}

六、底层机制对比表

特性	CopyOnWriteArrayList	Collections.synchronizedList
并发读	无锁，完全并行	需要获取锁，串行化
并发写	串行化（通过内部锁）	完全串行化
迭代器失败策略	弱一致性，不抛异常	快速失败（Fast-Fail）
内存占用	写操作时内存翻倍	恒定内存消耗
GC影响	频繁写操作会导致GC压力	常规GC影响
批量操作性能	addAll等操作效率低	批量操作效率高
遍历期间修改	允许，不影响当前遍历	会导致ConcurrentModificationException
适用场景	读多写少（≥90%读操作）	写操作较多或读写均衡

七、架构设计启示

不可变状态优势：CopyOnWriteArrayList的成功验证了不可变对象在并发编程中的价值。这种模式可以扩展到其他需要高并发读取的领域，如配置管理、路由表维护等。
代价与收益权衡：选择同步策略时需要考虑操作比例。假设读操作耗时R，写操作耗时W，当读操作占比P满足：
```
P > W/(R+W)
```
时，CopyOnWriteArrayList更具优势。
分片策略的启示：对于超大规模数据，可以采用分片化CopyOnWriteArrayList，将单个大数组拆分为多个小数组，降低单个写操作的影响范围。
版本化数据管理：CopyOnWriteArrayList的每次修改都生成新版本，这种思想可以应用于需要维护历史版本的系统，如区块链的账本结构、文档编辑历史等。

正文到此结束

所属分类：后端技术

本文链接： https://refblogs.com/article/802
版权声明： 本文由老牛原创发布，转载或复制请以超链接形式转载,并注明出处搬砖的码农。