parallelStream是Java 8提供的并行流,可提升大集合计算性能,适用于数据量大、CPU密集型、无状态操作;需注意线程安全、避免共享变量、非线程安全集合及IO密集场景,并可通过ForkJoinPool控制并行度。

在Java中,parallelStream 可以显著提升对大集合进行计算时的性能,通过将数据操作并行化,充分利用多核CPU资源。但使用不当也可能带来性能下降或线程安全问题。以下是关键用法和注意事项。
什么是 parallelStream?
parallelStream 是 Java 8 引入的 Stream API 的并行版本。它将一个数据源(如 List、Set)拆分成多个片段,由多个线程同时处理,最后合并结果。
与 stream() 不同,parallelStream() 自动使用 ForkJoinPool.commonPool 来执行并行任务。
示例:普通 stream 与 parallelStream 性能对比
立即学习“Java免费学习笔记(深入)”;
假设我们要对一个大列表求平方和:
Listnumbers = IntStream.rangeClosed(1, 1_000_000) .boxed() .collect(Collectors.toList()); // 使用 stream(串行) long start = System.currentTimeMillis(); int sum1 = numbers.stream() .map(n -> n * n) .mapToInt(Integer::intValue) .sum(); System.out.println("Serial time: " + (System.currentTimeMillis() - start));
// 使用 parallelStream(并行) start = System.currentTimeMillis(); int sum2 = numbers.parallelStream() .map(n -> n * n) .mapToInt(Integer::intValue) .sum(); System.out.println("Parallel time: " + (System.currentTimeMillis() - start));
在多核机器上,parallelStream 通常更快。
适合使用 parallelStream 的场景
并不是所有操作都能从并行流中受益。以下情况更适合使用:
- 数据量大(一般建议超过 10,000 元素)
- 操作是 CPU 密集型的(如数学计算、映射、过滤复杂逻辑)
- 操作之间无状态、无依赖
- 结果不依赖顺序(如 reduce、sum、count)
例如:统计日志中错误条目数量、计算大量商品的总价、对大数据集做 map-reduce 操作。
需要注意的问题
parallelStream 虽然方便,但也容易踩坑:
- 线程安全:若在操作中修改共享变量,可能引发数据竞争。应避免使用可变共享状态。
- 非线程安全集合:如 ArrayList、HashMap,在并行流中写入会导致异常或数据错乱。
- IO 密集型操作:如读文件、网络请求,并行反而可能因上下文切换增加开销。
- 顺序敏感操作:forEachOrdered、findFirst 等会削弱并行优势。
反例:不要在 parallelStream 中修改共享列表
Listresult = new ArrayList<>(); numbers.parallelStream().forEach(x -> result.add(x * x)); // 危险!
应改用 collect 或 toList 等归约操作:
Listresult = numbers.parallelStream() .map(x -> x * x) .collect(Collectors.toList());
如何控制并行度?
默认并行度为 CPU 核心数(Runtime.getRuntime().availableProcessors())。如果想自定义:
可通过系统属性设置公共线程池大小:
System.setProperty("java.util.concurrent.ForkJoinPool.common.parallelism", "4");
或创建自定义的 ForkJoinPool 执行任务:
ForkJoinPool customPool = new ForkJoinPool(2); customPool.submit(() -> numbers.parallelStream().map(...).forEach(...)); customPool.shutdown();
基本上就这些。parallelStream 是个好工具,但要清楚它的适用边界。合理使用能提升性能,滥用则适得其反。










