
本文介绍如何在 php 中高效识别并合并关联数组中的重复项(基于指定字段),同时将重复项的 `repeat` 值累加至保留的唯一项中,适用于音乐播放列表等场景。
在处理数据库查询返回的播放列表数据时,常会遇到同一首歌曲(相同 ARTIST + TITLE + TIME)多次出现的情况。理想的数据结构应去重后保留一条记录,并将原始每条记录的 REPEAT(默认为 1)累加为总播放次数。例如:5 条完全相同的歌曲记录,应合并为 1 条,且 REPEAT => 5。
下面提供一个健壮、可读性强的解决方案:
✅ 推荐实现:使用哈希键聚合(时间复杂度 O(n),推荐)
相比原答案中每次遍历 array_filter 的 O(n²) 方案,更优解是利用「唯一标识键」进行一次遍历聚合:
function mergeDuplicateTracks(array $playlist, string $artistKey = 'ARTIST', string $titleKey = 'TITLE', string $timeKey = 'TIME', string $repeatKey = 'REPEAT'): array {
$merged = [];
$seenKeys = [];
foreach ($playlist as $track) {
// 构建唯一键:用 artist+title+time 组合(可按需增减字段)
$key = $track[$artistKey] . '|' . $track[$titleKey] . '|' . $track[$timeKey];
if (!isset($merged[$key])) {
// 首次出现:深拷贝原始项,并初始化 REPEAT(确保存在)
$merged[$key] = [
'ID' => $track['ID'] ?? null,
$artistKey => $track[$artistKey],
$titleKey => $track[$titleKey],
$timeKey => $track[$timeKey],
$repeatKey => (int)($track[$repeatKey] ?? 1)
];
} else {
// 重复出现:仅累加 REPEAT
$merged[$key][$repeatKey] += (int)($track[$repeatKey] ?? 1);
}
}
// 重置数组索引,返回纯数字索引数组
return array_values($merged);
}? 使用示例
$music_playlist = [
['ID' => 0, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 1, 'ARTIST' => 'SOMETHING2', 'TITLE' => 'SOMETHING2', 'TIME' => '02:40', 'REPEAT' => 1],
['ID' => 2, 'ARTIST' => 'SOMETHING3', 'TITLE' => 'SOMETHING3', 'TIME' => '03:20', 'REPEAT' => 1],
['ID' => 3, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 4, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 5, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 6, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
];
$result = mergeDuplicateTracks($music_playlist);
print_r($result);输出结果:
立即学习“PHP免费学习笔记(深入)”;
Array
(
[0] => Array
(
[ID] => 0
[ARTIST] => SOMETHING1
[TITLE] => SOMETHING1
[TIME] => 04:00
[REPEAT] => 5
)
[1] => Array
(
[ID] => 1
[ARTIST] => SOMETHING2
[TITLE] => SOMETHING2
[TIME] => 02:40
[REPEAT] => 1
)
[2] => Array
(
[ID] => 2
[ARTIST] => SOMETHING3
[TITLE] => SOMETHING3
[TIME] => 03:20
[REPEAT] => 1
)
)⚠️ 注意事项与最佳实践
- 字段一致性:确保 $artistKey、$titleKey、$timeKey 在所有数据中存在且类型一致(建议数据库层统一非空约束);
- 键冲突风险:若 ARTIST 或 TITLE 含 | 字符,建议改用 md5(serialize([$a, $b, $c])) 构建安全哈希键;
- ID 保留逻辑:本方案保留首次出现的 ID;如需保留最小/最大 ID,可在 if (!isset(...)) 分支中记录并更新;
- 性能对比:对于千级数据,哈希方案比嵌套 array_filter 快 10–100 倍,且内存可控;
- 扩展性:函数支持自定义键名(如适配 artist_name / song_title 等不同字段命名风格)。
通过该方法,你不仅能精准完成播放列表去重与计数合并,还能轻松复用于订单汇总、日志聚合、统计报表等同类业务场景。











