
本文介绍如何在 php 中识别并合并数组中具有相同 artist 和 title 的音乐条目,将重复项的 repeat 字段累加,最终保留唯一记录。适用于播放列表去重与播放次数统计场景。
在构建音乐播放列表等业务场景中,数据库查询结果常包含语义重复的条目(如同一首歌多次出现),但前端或统计逻辑仅需一条记录,并携带其总播放/出现次数(即 REPEAT 字段)。此时,简单使用 array_unique() 无法满足需求——它只能基于完整值去重,而我们需要的是按指定字段(ARTIST + TITLE)分组聚合,并累加 REPEAT 值。
以下是一个健壮、可读性强的解决方案:
✅ 核心思路
遍历原始数组,对每条记录检查目标字段(ARTIST 和 TITLE)是否已在结果数组中存在:
- 若不存在 → 直接追加到结果数组;
- 若已存在 → 找到对应索引,将其 REPEAT 值递增 1。
✅ 推荐实现函数(优化版)
function mergeDuplicateTracks(array $playlist): array
{
$merged = [];
foreach ($playlist as $track) {
// 定义唯一标识键:由 ARTIST 和 TITLE 拼接而成(可扩展为 SHA256 哈希提升性能)
$key = $track['ARTIST'] . '|' . $track['TITLE'];
if (isset($merged[$key])) {
$merged[$key]['REPEAT'] += $track['REPEAT']; // 支持原始 REPEAT > 1 的情况
} else {
// 保留原始 ID(取首次出现的 ID),也可改为最小/最大 ID 或忽略
$merged[$key] = [
'ID' => $track['ID'],
'ARTIST' => $track['ARTIST'],
'TITLE' => $track['TITLE'],
'TIME' => $track['TIME'],
'REPEAT' => $track['REPEAT']
];
}
}
// 重置数组键为连续数字索引(可选)
return array_values($merged);
}✅ 使用示例
$music_playlist = [
['ID' => 0, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 1, 'ARTIST' => 'SOMETHING2', 'TITLE' => 'SOMETHING2', 'TIME' => '02:40', 'REPEAT' => 1],
['ID' => 2, 'ARTIST' => 'SOMETHING3', 'TITLE' => 'SOMETHING3', 'TIME' => '03:20', 'REPEAT' => 1],
['ID' => 3, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 4, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 5, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 6, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
];
$result = mergeDuplicateTracks($music_playlist);
print_r($result);输出结果:
立即学习“PHP免费学习笔记(深入)”;
Array
(
[0] => Array
(
[ID] => 0
[ARTIST] => SOMETHING1
[TITLE] => SOMETHING1
[TIME] => 04:00
[REPEAT] => 5
)
[1] => Array
(
[ID] => 1
[ARTIST] => SOMETHING2
[TITLE] => SOMETHING2
[TIME] => 02:40
[REPEAT] => 1
)
[2] => Array
(
[ID] => 2
[ARTIST] => SOMETHING3
[TITLE] => SOMETHING3
[TIME] => 03:20
[REPEAT] => 1
)
)⚠️ 注意事项
- 字段一致性:确保 ARTIST 和 TITLE 字段内容严格一致(注意空格、大小写、不可见字符)。建议入库前标准化(如 trim(strtoupper()))。
- 性能考量:对于超大数据集(>10,000 条),推荐改用 array_reduce() 或预建哈希表($map[$key] = $index)避免嵌套循环,时间复杂度从 O(n²) 降至 O(n)。
- ID 策略:当前实现保留首次出现的 ID;若需其他策略(如最新 ID),可改用 max($merged[$key]['ID'], $track['ID'])。
- 扩展性:如需支持更多去重维度(如专辑、年份),只需扩展 $key 拼接逻辑即可。
该方法简洁、可靠,无需依赖外部库,可直接集成至 Laravel、Symfony 或原生 PHP 项目中,是处理播放列表聚合的通用实践方案。











