
本文介绍如何在 php 中高效合并音乐播放列表数组中的重复项(基于 artist + title),保留唯一记录并将所有重复项的 repeat 字段值累加,适用于数据库查询后需聚合统计的场景。
在处理从数据库读取的音乐播放列表时,常遇到同一首歌曲(相同 ARTIST 和 TITLE)多次出现的情况。理想做法不是简单剔除重复,而是将其归并为一条记录,并将 REPEAT 字段累加,以反映该曲目实际出现频次。这既节省内存,又便于前端展示或后续统计分析。
以下是一个健壮、可复用的 PHP 函数实现:
function remove_duplicates($playlist) {
$filtered = [];
foreach ($playlist as $music) {
// 查找已存在的同名歌曲(ARTIST + TITLE 完全匹配)
$existingIndex = null;
foreach ($filtered as $index => $item) {
if ($item['ARTIST'] === $music['ARTIST'] &&
$item['TITLE'] === $music['TITLE']) {
$existingIndex = $index;
break;
}
}
if ($existingIndex !== null) {
// 存在重复:累加 REPEAT 值
$filtered[$existingIndex]['REPEAT'] += $music['REPEAT'];
} else {
// 首次出现:直接加入结果集
$filtered[] = $music;
}
}
return $filtered;
}✅ 使用示例:
$music_playlist = [
['ID' => 1, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 2, 'ARTIST' => 'SOMETHING2', 'TITLE' => 'SOMETHING2', 'TIME' => '02:40', 'REPEAT' => 1],
['ID' => 3, 'ARTIST' => 'SOMETHING3', 'TITLE' => 'SOMETHING3', 'TIME' => '03:20', 'REPEAT' => 1],
['ID' => 4, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 5, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 6, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
['ID' => 7, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1]
];
$result = remove_duplicates($music_playlist);
print_r($result);? 输出结果:
立即学习“PHP免费学习笔记(深入)”;
Array
(
[0] => Array
(
[ID] => 1
[ARTIST] => SOMETHING1
[TITLE] => SOMETHING1
[TIME] => 04:00
[REPEAT] => 5
)
[1] => Array
(
[ID] => 2
[ARTIST] => SOMETHING2
[TITLE] => SOMETHING2
[TIME] => 02:40
[REPEAT] => 1
)
[2] => Array
(
[ID] => 3
[ARTIST] => SOMETHING3
[TITLE] => SOMETHING3
[TIME] => 03:20
[REPEAT] => 1
)
)⚠️ 注意事项:
- 本函数默认以 ARTIST 和 TITLE 作为去重联合键;如需扩展(例如增加 ALBUM 或忽略大小写),可修改判断逻辑:strtolower($item['ARTIST']) === strtolower($music['ARTIST'])。
- 若原始数据中 REPEAT 字段可能大于 1(如批量导入已含计数),函数会正确累加而非硬设为 +1,确保语义准确。
- 时间复杂度为 O(n²),对千级以内数据表现良好;若需处理万级数据,建议改用哈希映射(如以 "ARTIST|TITLE" 为键的关联数组)优化至 O(n)。
? 进阶提示: 数据库层聚合更高效——若源头可控,推荐直接使用 SQL GROUP BY artist, title 配合 SUM(repeat),减少 PHP 层计算压力。但当业务逻辑复杂(如需保留首个 ID、自定义时间格式等)时,PHP 后处理仍是灵活之选。











