
场景与挑战
在处理包含大量时间戳的数据时,一个常见的需求是识别出一天中最早和最晚的“时钟时间”所对应的原始完整时间戳。例如,我们可能有一个包含数千个不同日期和时间的时间戳数组,需要找出其中时间部分(如“00:00:01 am”或“11:59:59 pm”)最早和最晚的那些记录,并保留其原始的日期信息。
一个直观但存在问题的尝试是先将所有时间戳转换为仅包含时钟时间的部分,然后找出最小值和最大值,例如:
$timestamps = array();
for ($i = 0; $i < 5000; $i++) {
$timestamps[] = mt_rand(strtotime('1900-01-01 00:00:00 am'), strtotime('2100-12-31 11:59:59 pm'));
}
function callback($timestamp) {
return strtotime(date('h:i:s a', $timestamp));
}
// 这种方法会返回最早和最晚的时钟时间,但日期会被重置为当前日期
echo date('Y-m-d h:i:s a', min(array_map('callback', $timestamps)));
echo "\n";
echo date('Y-m-d h:i:s a', max(array_map('callback', $timestamps)));上述方法虽然能找到最早和最晚的时钟时间,但由于 strtotime(date('h:i:s a', $timestamp)) 默认会将日期部分设置为当前日期,导致我们无法获取到原始的时间戳信息。我们需要一种方法,在比较时只考虑时钟时间,但在返回结果时保留原始的完整时间戳。
解决方案:使用 array_reduce 进行高效查找
为了解决上述问题,我们可以利用 PHP 的 array_reduce 函数。array_reduce 能够迭代数组中的每个元素,并使用回调函数将它们归结为一个单一的结果。这使得它非常适合在一次遍历中同时找出最早和最晚的时钟时间对应的原始时间戳。
以下是实现此功能的代码示例:
$carry['max'][0]) {
$carry['max'] = [$currentTimeString, $formattedOriginalTimestamp];
}
// 5. 返回更新后的累加器
return $carry;
},
// 初始累加器值:将 'min' 和 'max' 都初始化为包含两个 null 的数组
// [0] 用于存储时钟时间字符串进行比较,[1] 用于存储对应的原始格式化时间戳
['min' => [null, null], 'max' => [null, null]]
);
// 输出结果
print_r($res);
?>代码解析与工作原理
-
array_reduce($timestamps, function($carry, $currentTimestamp) { ... }, ['min' => [null, null], 'max' => [null, null]]):
- $timestamps:我们要处理的原始时间戳数组。
- 匿名函数:这是 array_reduce 的回调函数,它在每次迭代中被调用。
- $carry:累加器,它在每次迭代中保存上一次回调函数返回的值。初始值是第三个参数 ['min' => [null, null], 'max' => [null, null]]。
- $currentTimestamp:当前正在处理的时间戳。
- ['min' => [null, null], 'max' => [null, null]]:累加器的初始值。我们用一个数组来存储 min 和 max,每个又是一个包含两个元素的数组:第一个元素用来存储时钟时间字符串(用于比较),第二个元素用来存储对应的原始格式化时间戳(用于最终输出)。
-
$currentTimeString = date('H:i:s', $currentTimestamp);:
- 在每次迭代中,我们首先使用 date('H:i:s', $currentTimestamp) 将当前时间戳格式化为 HH:ii:ss(24小时制)字符串。这种格式的字符串可以直接进行字典序比较,从而判断时间的早晚。
-
$formattedOriginalTimestamp = date('Y-m-d h:i:s a', $currentTimestamp);:
- 同时,我们将原始的 $currentTimestamp 格式化为我们希望在最终结果中显示的完整日期和时间字符串(例如 1997-05-03 12:00:30 am)。
-
比较逻辑 (if (is_null($carry['min'][0]) || $currentTimeString :
- 初始化检查: is_null($carry['min'][0]) 用于处理第一次迭代。在第一次迭代中,$carry['min'][0] 和 $carry['max'][0] 都是 null,所以它们会被当前时间戳的值初始化。
- 最小值更新: 如果当前时钟时间字符串 $currentTimeString 比当前累加器中记录的最小时间 $carry['min'][0] 更早,我们就更新 $carry['min'] 为当前的时间字符串和格式化的原始时间戳。
- 最大值更新: 同样地,如果当前时钟时间字符串 $currentTimeString 比当前累加器中记录的最大时间 $carry['max'][0] 更晚,我们就更新 $carry['max']。
-
return $carry;:
- 每次迭代结束时,回调函数返回更新后的 $carry 数组,这个数组将作为下一次迭代的 $carry 参数。
示例输出
运行上述代码,你将得到类似以下的结果(具体日期和时间取决于随机生成的时间戳):
Array
(
[min] => Array
(
[0] => 00:00:30
[1] => 1997-05-03 12:00:30 am
)
[max] => Array
(
[0] => 23:59:36
[1] => 1983-07-21 11:59:36 pm
)
)结果清晰地展示了最早的时钟时间(00:00:30)及其对应的原始完整时间戳 (1997-05-03 12:00:30 am),以及最晚的时钟时间(23:59:36)及其对应的原始完整时间戳 (1983-07-21 11:59:36 pm)。
注意事项与总结
- 效率: array_reduce 只需要对数组进行一次遍历,这对于处理大型时间戳数组非常高效。
- 字符串比较: 关键在于将时间戳转换为 HH:ii:ss 格式的字符串进行比较。这种格式确保了字符串的字典序比较结果与时间的早晚顺序一致。
- 数据结构: 累加器 $carry 的设计至关重要,它同时存储了用于比较的时间字符串和用于输出的原始格式化时间戳,确保了信息的完整性。
- 时区: 在处理时间戳时,始终要注意服务器的时区设置 (date_default_timezone_set()),以确保 date() 函数返回的时间是预期的。
通过这种 array_reduce 的方法,我们不仅能够精确地找出最早和最晚的时钟时间,还能保留它们原始的日期信息,完美解决了在不丢失上下文的情况下进行时间比较的需求。










