如何用指针实现数组的归并排序递归与非递归指针版本实现

P粉602998670

发布时间：2025-08-15 19:00:02

1007人浏览过

来源于php中文网

原创

归并排序的指针实现相较于数组索引更贴近底层操作，其核心在于通过直接操作内存地址定义子数组范围并进行合并。1.递归版本代码简洁、逻辑清晰，体现分治思想，但存在栈溢出风险和函数调用开销，适用于数据量适中或教学场景；2.非递归版本通过迭代控制步长避免栈溢出，性能稳定，适合处理大规模数据及对稳定性要求高的环境，但代码复杂度高，边界计算需谨慎。两者均需精准掌握指针算术与内存管理，确保合并过程中临时数组分配合理、指针移动不越界、复制回原数组范围准确，以保障算法正确性和稳定性。

如何用指针实现数组的归并排序递归与非递归指针版本实现

用指针实现数组的归并排序，无论是递归还是非递归版本，核心都在于直接操作内存地址来定义子数组范围并进行合并。递归版本以其简洁的逻辑优雅地体现了分治思想；非递归版本则通过迭代的方式，更稳健地处理大规模数据，避免了栈溢出的潜在风险。两者都要求对指针算术和内存管理有清晰的理解。

解决方案

递归指针版本实现

递归版本的归并排序，其美妙之处在于它对问题的分解与合并逻辑的直观映射。我们定义一个

merge

函数来完成两个已排序子数组的合并，以及一个

mergeSortRecursive

函数来递归地分解数组。

#include 
#include 
#include  // For std::min

// 辅助合并函数：将 arr[left...mid] 和 arr[mid+1...right] 合并
void merge(int* arr, int* temp, int left, int mid, int right) {
    int i = left;      // 左子数组起始索引
    int j = mid + 1;   // 右子数组起始索引
    int k = left;      // 临时数组起始索引

    // 比较并合并两个子数组
    while (i <= mid && j <= right) {
        if (*(arr + i) <= *(arr + j)) { // 比较指针指向的值
            *(temp + k++) = *(arr + i++);
        } else {
            *(temp + k++) = *(arr + j++);
        }
    }

    // 复制剩余的左子数组元素
    while (i <= mid) {
        *(temp + k++) = *(arr + i++);
    }

    // 复制剩余的右子数组元素
    while (j <= right) {
        *(temp + k++) = *(arr + j++);
    }

    // 将临时数组的内容复制回原数组
    for (i = left; i <= right; ++i) {
        *(arr + i) = *(temp + i);
    }
}

// 递归归并排序函数
void mergeSortRecursive(int* arr, int* temp, int left, int right) {
    if (left >= right) { // 基本情况：单个元素或空数组
        return;
    }

    int mid = left + (right - left) / 2; // 计算中间点，避免溢出

    // 递归排序左半部分
    mergeSortRecursive(arr, temp, left, mid);
    // 递归排序右半部分
    mergeSortRecursive(arr, temp, mid + 1, right);

    // 合并两个已排序的半部分
    merge(arr, temp, left, mid, right);
}

// 外部调用接口
void sortRecursive(int* arr, int size) {
    if (size <= 1) return;
    int* temp = new int[size]; // 分配临时数组
    mergeSortRecursive(arr, temp, 0, size - 1);
    delete[] temp; // 释放临时数组
}

非递归指针版本实现

非递归版本，或者说迭代版本，通过控制合并的“步长”来逐步完成排序。它从最小的子数组（长度为1）开始合并，然后是长度为2，4，依此类推，直到整个数组有序。

// 非递归归并排序函数
void mergeSortIterative(int* arr, int* temp, int size) {
    // current_size 表示当前合并的子数组长度
    for (int current_size = 1; current_size < size; current_size *= 2) {
        // left_start 表示当前子数组的起始索引
        for (int left_start = 0; left_start < size - 1; left_start += 2 * current_size) {
            int mid = left_start + current_size - 1; // 左子数组的结束索引
            // 右子数组的结束索引，确保不超过数组边界
            int right_end = std::min(left_start + 2 * current_size - 1, size - 1);

            // 确保 mid 是有效的
            if (mid >= size -1) continue; // 如果左子数组已经到达或超过数组末尾，则无需合并

            // 调用合并函数
            merge(arr, temp, left_start, mid, right_end);
        }
    }
}

// 外部调用接口
void sortIterative(int* arr, int size) {
    if (size <= 1) return;
    int* temp = new int[size]; // 分配临时数组
    mergeSortIterative(arr, temp, size);
    delete[] temp; // 释放临时数组
}

为什么选择指针来实现归并排序，而不是数组索引？

说实话，用指针来实现归并排序，有时候会让我觉得像是在做一次对底层内存操作的“朝圣”。这不是说数组索引不好，它更直观，更安全，也更符合现代编程的习惯。但指针，它提供了一种不同的视角，一种更接近硬件的思考方式。

选择指针，首先是为了更直接地触碰内存地址。当你写

*(arr + i)

而不是

arr[i]

时，你是在明确地告诉编译器：“嘿，我要访问的是从

arr

这个地址开始，偏移

个单位（通常是

i * sizeof(int)

字节）的那块内存！”这种直接性，在某些场景下，比如处理非常大的数据集，或者在需要严格控制内存布局的嵌入式系统中，可能会带来微观的性能优势（虽然现代编译器的优化让这种差异越来越小）。

再者，指针的运用，尤其是在C/C++这种语言里，是其强大和灵活性的体现。用指针实现归并排序，能让你更深刻地理解数据在内存中的物理排布，以及算法是如何通过操作这些地址来达到排序目的的。这有点像是在拆解一个复杂的机械装置，你不仅知道它能做什么，更清楚它是怎么一步步运作的。它强迫你更严谨地思考内存边界、数据访问模式，这对于提升编程技能、减少潜在的内存错误（比如越界访问）是很有帮助的。

当然，这其中也带着一些挑战。指针的灵活性也意味着更高的出错风险，比如野指针、内存泄漏等等。但正是这些挑战，让指针实现归并排序变得更有趣，它不是一个简单的“套公式”，而是一次对数据结构和算法底层逻辑的探索。它让代码看起来没那么“教科书式”的规整，反而多了几分手工打造的质感。

归并排序中“合并”操作的指针细节是什么？如何避免内存溢出或越界？

归并排序最核心也最巧妙的部分，就是那个“合并”操作。它就像一个精密的流水线，把两个已经整理好的小堆数据，高效地整合成一个更大的有序堆。在指针的世界里，这个过程就更显得步步为营。

想象一下，你有两个已经排好序的“小队伍”，它们的起始位置分别是

arr + left

和

arr + mid + 1

。我们还需要一个临时的“大广场”——通常是一个与原数组等大小的临时数组

temp

，它的起始地址是

temp + left

。

Ideogram

Ideogram是一个全新的文本转图像AI绘画生成平台，擅长于生成带有文本的图像，如LOGO上的字母、数字等。

下载

合并的指针细节是这样的：

我们用三个指针或索引变量来控制流程：

```
i
```
：指向左边小队伍的当前队员（
```
arr + i
```
）。
```
j
```
：指向右边小队伍的当前队员（
```
arr + j
```
）。
```
k
```
：指向临时“大广场”的当前空位（
```
temp + k
```
）。

合并逻辑其实很简单：

比较
```
*(arr + i)
```
和
```
*(arr + j)
```
。哪个小，就把哪个队员“请”到
```
*(temp + k)
```
的位置，然后对应的指针（
```
i
```
或
```
j
```
）和
```
k
```
都向前移动一位。
当一个队伍的队员都“入场”完毕（比如
```
i
```
超过了
```
mid
```
，或者
```
j
```
超过了
```
right
```
），剩下的另一个队伍的队员，就直接全部按顺序“入场”到临时广场的剩余空位。
最后，也是非常关键的一步，就是把临时广场上整理好的所有队员，再“请”回原数组的相应位置。这个复制过程，也是通过指针操作
```
*(arr + idx) = *(temp + idx)
```
完成的。

关于内存溢出或越界，这是指针操作的“雷区”，但也恰恰是需要我们格外小心的地方：

临时数组的分配与释放： 必须确保
```
temp
```
数组有足够的空间来存放合并后的所有元素。它的尺寸应该至少是
```
(right - left + 1)
```
，即当前合并范围内的元素总数。在整个排序开始前一次性分配，并在排序结束后立即释放，是避免内存泄漏和确保空间足够的关键。例如，
```
int* temp = new int[size];
```
并在结束时
```
delete[] temp;
```
。
指针移动的边界检查： 在比较和复制过程中，
```
i
```
和
```
j
```
都不能超出它们各自子数组的有效范围。
```
i
```
不能超过
```
mid
```
，
```
j
```
不能超过
```
right
```
。这些条件在
```
while (i <= mid && j <= right)
```
这样的循环判断中得到了体现。一旦任何一个指针越界，就意味着一个子数组已经处理完毕，我们就不再从它那里取数据了。
复制回原数组的范围： 最后将
```
temp
```
复制回
```
arr
```
时，也必须确保复制的范围是从
```
left
```
到
```
right
```
，不多不少，不偏不倚。

说到底，指针操作就像是驾驶一辆没有安全带的跑车，它能带你飞速前进，但也要求你对路况（内存布局）和驾驶技术（指针算术）有绝对的掌控。每一步的指针偏移、每次的解引用，都必须精确无误，才能确保算法的正确性和稳定性。

递归与非递归指针实现归并排序的优缺点及适用场景？

在编程实践中，选择递归还是非递归实现，往往不是一个简单的“哪个更好”的问题，更多的是一个权衡利弊、适应场景的决策。指针在这两种实现中，各自扮演着略有不同的角色。

递归指针版本：

优点：
- 代码简洁，逻辑清晰： 递归天然地契合了分治算法的思想。
```
mergeSortRecursive(arr, temp, left, mid)
```
  和
```
mergeSortRecursive(arr, temp, mid + 1, right)
```
  这样的调用，直观地表达了“把问题分解成两半”的意图。指针在这里，更多是作为传递子问题边界的参数，让函数调用看起来更自然。
- 符合直觉： 对于初学者来说，理解递归的分治过程可能比理解迭代的步长控制更容易。
缺点：
- 栈溢出风险： 这是递归算法的通病。当数组非常大时，递归深度会非常深，可能导致调用栈溢出，程序崩溃。这是在处理海量数据时需要特别警惕的一点。
- 函数调用开销： 每次函数调用都会伴随一些额外的开销（如参数入栈、保存返回地址等），虽然现代编译器优化得很不错，但在极端性能敏感的场景下，这仍然是一个考虑因素。
适用场景：
- 数组大小适中： 当数据量不是特别巨大，不会导致栈溢出时，递归版本因其代码的优雅和易读性，是很好的选择。
- 教学与理解： 作为算法教学或个人学习时，递归版本能更好地帮助理解归并排序的分治思想。

非递归指针版本：

优点：
- 避免栈溢出： 这是非递归版本最大的优势。它通过循环来模拟递归过程，避免了深度递归带来的栈空间限制，可以处理任意大小的数组，尤其是在内存受限或需要处理超大规模数据集的环境下，这是非常关键的。
- 性能稳定： 没有递归调用的额外开销，通常在性能上更稳定，甚至在某些情况下会略优于递归版本。
缺点：
- 代码逻辑相对复杂： 尤其是指针的边界计算和循环控制，需要手动管理合并的“步长”（
```
current_size
```
  ）和起始位置（
```
left_start
```
  ），这不如递归直观，更容易出错。我个人在写非递归版本时，总是要多花些时间来确保
```
mid
```
  和
```
right_end
```
  的计算是准确无误的。
- 可读性稍差： 相比递归的简洁，非递归的代码看起来更“忙碌”，理解其内在逻辑需要更多的思考。
适用场景：
- 处理超大型数据集： 当数据规模可能导致递归栈溢出时，非递归版本是首选。
- 对性能和内存稳定性有严格要求： 在嵌入式系统、高性能计算等对资源利用率和稳定性有高要求的环境中，非递归版本更具优势。
- 避免递归： 有些编程规范或特定环境可能禁止或不推荐使用深度递归。