
归并排序原理概述
归并排序(merge sort)是一种高效、稳定的排序算法,其核心思想是“分而治之”。它将一个大问题分解为若干个小问题,递归地解决这些小问题,然后将小问题的解合并起来,从而得到原问题的解。具体步骤如下:
- 分解(Divide):将待排序的序列从中间一分为二。
- 解决(Conquer):对这两个子序列分别递归地进行归并排序,直到子序列只包含一个元素(一个元素被认为是自然有序的)。
- 合并(Combine):将两个已排序的子序列合并成一个完整的有序序列。合并是归并排序的关键步骤,它通过比较两个子序列的元素,将较小的元素依次放入一个临时空间,直至所有元素都被合并。
常见实现错误:ArrayList.add()的误用
在Java中实现归并排序的合并(merge)阶段时,一个常见的错误是使用ArrayList.add()方法将临时列表中排序好的元素回写到原始列表。这会导致意想不到的行为,例如只排序部分元素或数据被覆盖。
考虑以下错误的合并实现片段:
// 错误的回写方式
for(j = 0; j< n; j++)
{
a.add(from+j, b.get(j)); // 错误:使用 add 方法
}ArrayList.add(index, element)方法的行为是:在指定索引处插入元素,并将该索引及其之后的所有元素向后移动一位。这意味着每次调用add()时,原始列表a的尺寸都会增加,并且现有元素的索引会发生变化。
例如,如果原始列表a有5个元素,你想将临时列表b中的5个排序好的元素放回a的特定位置。当第一次调用a.add(from, b.get(0))时,a的尺寸变为6。第二次调用a.add(from+1, b.get(1))时,a的尺寸变为7,并且之前插入的元素以及原始元素都会被进一步向后移动。这导致:
立即学习“Java免费学习笔记(深入)”;
- 列表尺寸膨胀:a的尺寸会不断增长,远超预期。
- 数据错位与覆盖:由于元素的不断后移,你尝试插入的元素最终会出现在错误的索引位置,或者覆盖掉本应保留的原始数据,因为add是插入操作,而不是替换操作。
这就是为什么在原始问题中,归并排序在元素数量较少时(如3个以下)能正常工作,而当元素数量增多时就会出现问题——因为列表的膨胀和元素的错位在小规模数据上可能不明显或恰好“蒙混过关”,但在大规模数据上就会暴露其根本缺陷。
正确的数据回写方式:使用ArrayList.set()
为了正确地将临时列表中排序好的元素回写到原始列表的指定位置,应该使用ArrayList.set()方法。set(index, element)方法的行为是:替换指定索引处的现有元素。它不会改变列表的尺寸,也不会移动其他元素。
以下是正确的合并实现片段:
// 正确的回写方式
for(j = 0; j< n; j++)
{
a.set(from+j, b.get(j)); // 正确:使用 set 方法
}通过使用set(),我们可以确保临时列表b中排序好的元素被精确地放置回原始列表a的正确位置,覆盖掉旧的未排序元素,而不会导致列表尺寸膨胀或数据错位。
完整且优化的归并排序实现
结合上述修正,以下是一个完整且优化的Java归并排序实现示例:
import java.util.ArrayList;
import java.util.List; // 推荐使用接口
public class MergeSortExample {
/**
* 对给定的List进行归并排序。
*
* @param a 待排序的List
* @param from 排序范围的起始索引(包含)
* @param to 排序范围的结束索引(包含)
*/
public static void mergeSort(List a, int from, int to) {
if (from >= to) { // 基本情况:如果只有一个或零个元素,则已经有序
return;
}
int mid = from + (to - from) / 2; // 避免 (from + to) 溢出
mergeSort(a, from, mid); // 递归排序左半部分
mergeSort(a, mid + 1, to); // 递归排序右半部分
merge(a, from, mid, to); // 合并两个已排序的子序列
}
/**
* 合并两个有序的子序列。
*
* @param a 原始List
* @param from 左子序列的起始索引
* @param mid 左子序列的结束索引
* @param to 右子序列的结束索引
*/
public static void merge(List a, int from, int mid, int to) {
int n = to - from + 1; // 合并后的总元素数量
// 使用List接口声明临时列表,保持一致性
List b = new ArrayList<>(n); // 临时列表,用于存放合并结果
int i1 = from; // 左子序列的当前索引
int i2 = mid + 1; // 右子序列的当前索引
// 比较两个子序列的元素,将较小的放入临时列表b
while (i1 <= mid && i2 <= to) {
if (a.get(i1).compareTo(a.get(i2)) < 0) {
b.add(a.get(i1));
i1++;
} else {
b.add(a.get(i2));
i2++;
}
}
// 将左子序列剩余的元素全部放入b
while (i1 <= mid) {
b.add(a.get(i1));
i1++;
}
// 将右子序列剩余的元素全部放入b
while (i2 <= to) {
b.add(a.get(i2));
i2++;
}
// 将临时列表b中的元素回写到原始列表a的正确位置
// 使用 set 方法替换元素,而不是 add 方法插入元素
for (int j = 0; j < n; j++) {
a.set(from + j, b.get(j));
}
}
public static void main(String[] args) {
List patients = new ArrayList<>();
patients.add("Charlie");
patients.add("Alice");
patients.add("David");
patients.add("Bob");
patients.add("Eve");
patients.add("Frank");
patients.add("Grace");
patients.add("Heidi");
System.out.println("原始列表: " + patients);
// 调用归并排序
mergeSort(patients, 0, patients.size() - 1);
System.out.println("排序后列表: " + patients);
// 预期输出: [Alice, Bob, Charlie, David, Eve, Frank, Grace, Heidi]
}
} 编程实践建议
-
面向接口编程:在Java中,推荐使用接口(如List)而非具体的实现类(如ArrayList)来声明变量和方法参数。这样做可以提高代码的灵活性和可维护性,因为你可以在不改变方法签名的情况下,轻松地切换底层的数据结构实现(例如,从ArrayList切换到LinkedList)。
// 推荐 public static void mergeSort(List
a, int from, int to) // 而非 // public static void mergeSort(ArrayList a, Integer from, Integer to) 避免包装类用于基本类型索引:对于像from, to, mid, j这样的索引变量,使用基本数据类型int通常比使用包装类Integer更高效,因为避免了自动装箱和拆箱的开销。
-
处理复杂数据结构:如果需要对包含多个属性的自定义对象(如Patient对象,其中包含姓名和疾病信息)进行排序,并希望在排序过程中保持这些属性的关联性,可以直接对List
进行排序。这时,你需要为Patient类实现Comparable接口(如果按照自然顺序排序),或者提供一个Comparator(如果需要多种排序方式或自定义比较逻辑)。 // 示例:对Patient对象列表进行排序 class Patient implements Comparable
{ String name; String sickness; public Patient(String name, String sickness) { this.name = name; this.sickness = sickness; } @Override public int compareTo(Patient other) { return this.name.compareTo(other.name); // 按姓名排序 } @Override public String toString() { return name + "(" + sickness + ")"; } } // 在merge方法中,比较 Patient 对象: // if (a.get(i1).compareTo(a.get(i2)) < 0) { ... } // 或者使用 Comparator: // List patients; // patients.sort(Comparator.comparing(Patient::getName)); // Java 8+ 通过对包含所有相关信息的对象进行排序,可以确保在排序过程中,所有属性都与其所属的对象保持关联,不会出现数据分离或错位的问题。
总结
归并排序作为一种高效的排序算法,其正确实现的关键在于合并(merge)阶段的数据回写。务必使用ArrayList.set()方法来替换原始列表中的元素,而不是错误地使用ArrayList.add()进行插入。遵循面向接口编程的原则,并根据需要为复杂数据类型实现Comparable或Comparator,将有助于构建健壮、高效且易于维护的Java排序代码。










