
引言
在数据处理中,我们经常会遇到需要对结构化数据进行分组和聚合的场景。当数据以list
问题描述
假设我们有一个List
ListdataLines = List.of( new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "84M", "-101.87", "0"}, new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "120M", "-102.48", "0"}, new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "60M", "-103.75", "0"}, new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "120M", "-10.8", "0"}, new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "60M", "-110.39", "0"}, new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "120M", "-10.8", "0"}, new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "CZK", "12670012.4055", "60M", "-103.75", "0"}, new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4066", "20M", "-10.8", "0"} );
我们的目标是:
- 根据数组的第0、1、3和5个元素(索引)进行分组。
- 对每个分组中所有数组的第6个元素(一个表示double的字符串)进行求和。
- 最终生成一个新的List
,其中每个数组代表一个分组的聚合结果,第6个元素是求和后的值,其他元素保持分组的共同值。
直接使用多层嵌套的Collectors.groupingBy虽然可以实现分组求和,但其结果是一个深度嵌套的Map (Map
解决方案:自定义Key对象
解决这个问题的关键在于定义一个能够封装分组条件的自定义Key对象。这个Key对象不仅要包含用于分组的元素,还需要包含那些在分组后需要保留但又不参与分组条件的元素,以便最终能够重构完整的String[]。
立即学习“Java免费学习笔记(深入)”;
1. 定义Key类
我们需要创建一个Key类,它将存储String[]中除第6个元素(求和目标)以外的所有元素。特别重要的是,它需要正确地实现equals()和hashCode()方法,以确保只有在指定的分组索引(s0, s1, s3, s5)相同时才被认为是同一个Key。
以下是Key类的实现示例:
import java.util.Objects;
public class Key {
private final String s0; // 参与分组
private final String s1; // 参与分组
private final String s2;










