摘要
选择排序的逻辑是先遍历比较出序列中最大的,然后把最大的放在最后位置。
遵循这个逻辑,用代码实现时,做到1.减少比较次数之外,这里引入一个新的指标 - 稳定性,2.保证排序过程中的稳定性也是一个优化处理
依据逻辑来看,最大值是放在尾部,并放置后,下次循环排除这个放置最大值的位置,for 循环从尾部开始最合适。
小循环开始前,需要先创建变量记录最大值坐标,这里使用的是 0 位置坐标,那么小循环开始时,就可以直接从 1 位置遍历,这就减少比较次数。
for (int end = array.length-1; end > 0; end--) { int maxIndex = 0; for (int begin = 1; begin <= end; begin++) { if (cmp(maxIndex, begin) < 0) { maxIndex = begin; } } swap(maxIndex, end); }
开始前,先解释一下稳定性,稳定性是尽量保持序列中两个元素在排序前和排序后的相对位置。比如下面伪代码:
// a1 与 a2 的值相等 a1 = a2 = 3 // 序列中 a1 值的位置在 a2 前面 array = [5, a1, 4, a2, 2] // 排序之后, a1 值位置在 a2 前面,保持了稳定性 array = [2, a1, a2, 4, 5]
序列中需要保证多次排序后数据位置的相对稳定。比如信息表中,以 age 从小到大排序,不希望 age 相等的一组数据中,它的名称在每一次排序之后都会有不同的顺序。
这里为了保证排序之后的稳定性,就当出现最大值时,也更新最大值的坐标。
为什么这样就可以保证稳定性?
首先最大值被交换到尾部之后,下次遍历比较的时候,就不再比较这个位置,小循环的比较是从头开始的,如果出现等于最大值时,不更新最大值的位置,排序之后,相等的值,最靠前的值就被放在了最后面,改变了之前序列中相等值的相对位置。
for (int end = array.length-1; end > 0; end--) { int maxIndex = 0; for (int begin = 1; begin <= end; begin++) { if (cmp(maxIndex, begin) <= 0) { // 保证稳定性 maxIndex = begin; } } swap(maxIndex, end); }