
本文介绍如何扩展 o(nk) 时间复杂度的 k-最大子数组和动态规划解法,使其不仅能计算最大和,还能准确还原所选的 k 个不重叠连续子数组的起止索引(闭区间左闭右开形式)。
要从仅返回最大和的 solve_SO 函数升级为同时返回子数组位置,核心思想是:在动态规划过程中不仅维护最优值,还需记录每一步决策的前驱状态(predecessor),从而支持最终回溯重构路径。
该算法将状态划分为 2k + 1 个阶段(num_intervals = 2*k + 1),交替表示“未开始第 i 段”(偶数索引)与“正在第 i 段中”(奇数索引),例如:
- best[0]: 尚未选取任何子数组的最大和(恒为 0)
- best[1]: 正在构建第 1 个子数组时的最大和
- best[2]: 已完成第 1 个子数组、尚未开始第 2 个时的最大和
- …以此类推。
为支持回溯,我们引入二维数组 preds[seq_idx][interval_idx],记录在处理到 test_seq[seq_idx] 且处于 interval_idx 状态时,是否采纳了“跳过当前元素、继承前一状态”的策略(即是否执行了 best[interval_idx] = best[interval_idx - 1])。若执行,则 preds[seq_idx][interval_idx] = 1;否则为 0。
回溯过程从最优终止状态开始(注意:并非固定取 best[-1],而应遍历所有偶数索引 0,2,...,2k 找到全局最大和对应的状态,因实际可能少于 k 个子数组);然后逆序扫描序列,根据 preds 值判断:
- 若 preds[i][j] == 1 且 j 为奇数 → 当前是某子数组的起始位置后一位,即子数组从 i+1 开始;
- 若 preds[i][j] == 1 且 j 为偶数 → 当前是某子数组的结束位置(右开边界为 i+1);
- 遇到状态切换(current_interval 减 1)即意味着跨入前一阶段。
以下是完整可运行的增强版实现(需 import numpy as np):
import numpy as np
def solve_SO_with_intervals(test_seq, k=2):
"""
返回 k-最大子数组和对应的子数组区间列表 [(start, end), ...]
区间为左闭右开:子数组 test_seq[start:end] 对应原数组索引 [start, end-1]
"""
n = len(test_seq)
if n == 0 or k <= 0:
return []
num_intervals = 2 * k + 1
best = np.zeros(num_intervals, dtype=int)
# preds[i][j] 表示处理完 test_seq[i] 后,状态 j 是否由状态 j-1 转移而来
preds = np.zeros((n, num_intervals), dtype=np.int8)
for seq_idx, val in enumerate(test_seq):
# 对所有“包含当前元素”的状态(奇数索引)累加 val
for interval_idx in range(1, num_intervals, 2):
best[interval_idx] += val
# 状态转移:若继承前一状态更优,则更新并记录 pred
for interval_idx in range(1, num_intervals):
if best[interval_idx] < best[interval_idx - 1]:
best[interval_idx] = best[interval_idx - 1]
preds[seq_idx][interval_idx] = 1
else:
preds[seq_idx][interval_idx] = 0
# 步骤1:确定最优终止状态(取所有偶数索引中 best 值最大的状态)
current_interval = 0
for interval_idx in range(0, num_intervals, 2):
if best[interval_idx] > best[current_interval]:
current_interval = interval_idx
# 步骤2:逆序回溯构造区间
ret = []
open_end = 0 # 记录当前待关闭子数组的右边界(开区间)
for seq_idx in range(n - 1, -1, -1):
if preds[seq_idx][current_interval]:
if current_interval % 2 == 1: # 奇数:刚进入“包含”状态 → 此处是子数组起点的前一个位置
ret.append((seq_idx + 1, open_end))
else: # 偶数:刚离开“包含”状态 → 此处是子数组终点(右开)
open_end = seq_idx + 1
current_interval -= 1
# 处理第一个子数组覆盖索引 0 的情况
if current_interval == 1:
ret.append((0, open_end))
ret.reverse()
return ret
# 测试用例
print(solve_SO_with_intervals([-1, 2, -1, 2, -1], k=2)) # 输出: [(1, 4), (3, 5)] → 对应 [2,-1,2] 和 [2]
print(solve_SO_with_intervals([-1, 2, -1, 2, -1], k=1)) # 输出: [(1, 4)] → 对应 [2,-1,2]⚠️ 注意事项:
- 本实现返回的是左闭右开区间(Python 切片风格),如 (1, 4) 表示 test_seq[1:4],对应原始索引 [1,2,3]。
- 若输入全为负数,算法默认返回空列表(因最大和为 0,不选取任何子数组);如需显式返回 [],当前逻辑已满足。
- 回溯时必须从偶数状态出发(代表完成若干完整子数组),避免误判部分区间。
- 时间复杂度仍为 O(nk),空间复杂度为 O(nk)(主要来自 preds 数组),可通过滚动数组优化至 O(k),但会增加回溯复杂度。
通过引入 predecessor tracking 与结构化回溯,我们成功将纯数值优化算法升级为具备可解释性的完整解决方案——不仅知道“最大和是多少”,更清楚“它由哪些具体子数组构成”。










