build

2026-04-23 18:11:45 +08:00 · 2023-04-10 03:12:02 +08:00
parent 2289822dfd
commit 867ecf6d92
32 changed files with 329 additions and 445 deletions
--- a/chapter_sorting/merge_sort.md
+++ b/chapter_sorting/merge_sort.md
@@ -4,10 +4,10 @@ comments: true

 # 11.5. &nbsp; 归并排序

-「归并排序 Merge Sort」是算法中“分治思想”的典型体现，其有「划分」和「合并」两个阶段：
+「归并排序 Merge Sort」基于分治思想实现排序，包含“划分”和“合并”两个阶段：

-1. **划分阶段**：通过递归不断 **将数组从中点位置划分开**，将长数组的排序问题转化为短数组的排序问题；
-2. **合并阶段**：划分到子数组长度为 1 时，开始向上合并，不断将 **左、右两个短排序数组** 合并为 **一个长排序数组**，直至合并至原数组时完成排序；
+1. **划分阶段**：通过递归不断地将数组从中点处分开，将长数组的排序问题转换为短数组的排序问题；
+2. **合并阶段**：当子数组长度为 1 时终止划分，开始合并，持续地将左右两个较短的有序数组合并为一个较长的有序数组，直至结束；

 ![归并排序的划分与合并阶段](merge_sort.assets/merge_sort_overview.png)

@@ -15,14 +15,12 @@ comments: true

 ## 11.5.1. &nbsp; 算法流程

-**「递归划分」** 从顶至底递归地 **将数组从中点切为两个子数组**，直至长度为 1 ；
+“划分阶段”从顶至底递归地将数组从中点切为两个子数组，直至长度为 1 ；

 1. 计算数组中点 `mid` ，递归划分左子数组（区间 `[left, mid]` ）和右子数组（区间 `[mid + 1, right]` ）；
-2. 递归执行 `1.` 步骤，直至子数组区间长度为 1 时，终止递归划分；
+2. 递归执行步骤 `1.` ，直至子数组区间长度为 1 时，终止递归划分；

-**「回溯合并」** 从底至顶地将左子数组和右子数组合并为一个 **有序数组** ；
-
-需要注意，由于从长度为 1 的子数组开始合并，所以 **每个子数组都是有序的**。因此，合并任务本质是要 **将两个有序子数组合并为一个有序数组**。
+“合并阶段”从底至顶地将左子数组和右子数组合并为一个有序数组。需要注意的是，从长度为 1 的子数组开始合并，合并阶段中的每个子数组都是有序的。

 === "<1>"
    ![归并排序步骤](merge_sort.assets/merge_sort_step1.png)
@@ -54,10 +52,10 @@ comments: true
 === "<10>"
    ![merge_sort_step10](merge_sort.assets/merge_sort_step10.png)

-观察发现，归并排序的递归顺序就是二叉树的「后序遍历」。
+观察发现，归并排序的递归顺序与二叉树的后序遍历相同，具体来看：

- **后序遍历**：先递归左子树、再递归右子树、最后处理根节点。
- **归并排序**：先递归左子树、再递归右子树、最后处理合并。
+- **后序遍历**：先递归左子树，再递归右子树，最后处理根节点。
+- **归并排序**：先递归左子数组，再递归右子数组，最后处理合并。

 === "Java"

@@ -484,30 +482,24 @@ comments: true
    }
    ```

-下面重点解释一下合并方法 `merge()` 的流程：
+合并方法 `merge()` 代码中的难点包括：

-1. 初始化一个辅助数组 `tmp` 暂存待合并区间 `[left, right]` 内的元素，后续通过覆盖原数组 `nums` 的元素来实现合并；
-2. 初始化指针 `i` , `j` , `k` 分别指向左子数组、右子数组、原数组的首元素；
-3. 循环判断 `tmp[i]` 和 `tmp[j]` 的大小，将较小的先覆盖至 `nums[k]` ，指针 `i` , `j` 根据判断结果交替前进（指针 `k` 也前进），直至两个子数组都遍历完，即可完成合并。
-
-合并方法 `merge()` 代码中的主要难点：
-
- `nums` 的待合并区间为 `[left, right]` ，而因为 `tmp` 只复制了 `nums` 该区间元素，所以 `tmp` 对应区间为 `[0, right - left]` ，**需要特别注意代码中各个变量的含义**。
- 判断 `tmp[i]` 和 `tmp[j]` 的大小的操作中，还 **需考虑当子数组遍历完成后的索引越界问题**，即 `i > leftEnd` 和 `j > rightEnd` 的情况，索引越界的优先级是最高的，例如如果左子数组已经被合并完了，那么不用继续判断，直接合并右子数组元素即可。
+- **在阅读代码时，需要特别注意各个变量的含义**。`nums` 的待合并区间为 `[left, right]` ，但由于 `tmp` 仅复制了 `nums` 该区间的元素，因此 `tmp` 对应区间为 `[0, right - left]` 。
+- 在比较 `tmp[i]` 和 `tmp[j]` 的大小时，**还需考虑子数组遍历完成后的索引越界问题**，即 `i > leftEnd` 和 `j > rightEnd` 的情况。索引越界的优先级是最高的，如果左子数组已经被合并完了，那么不需要继续比较，直接合并右子数组元素即可。

 ## 11.5.2. &nbsp; 算法特性

-**时间复杂度 $O(n \log n)$** ：划分形成高度为 $\log n$ 的递归树，每层合并的总操作数量为 $n$ ，总体使用 $O(n \log n)$ 时间。
+**时间复杂度 $O(n \log n)$** ：划分产生高度为 $\log n$ 的递归树，每层合并的总操作数量为 $n$ ，因此总体时间复杂度为 $O(n \log n)$ 。

-**空间复杂度 $O(n)$** ：需借助辅助数组实现合并，使用 $O(n)$ 大小的额外空间；递归深度为 $\log n$ ，使用 $O(\log n)$ 大小的栈帧空间，因此是“非原地排序”。
+**空间复杂度 $O(n)$** ：递归深度为 $\log n$ ，使用 $O(\log n)$ 大小的栈帧空间；合并操作需要借助辅助数组实现，使用 $O(n)$ 大小的额外空间；因此是“非原地排序”。

-在合并时，不改变相等元素的次序，是“稳定排序”。
+在合并过程中，相等元素的次序保持不变，因此归并排序是“稳定排序”。

 ## 11.5.3. &nbsp; 链表排序 *

-归并排序有一个很特别的优势，用于排序链表时有很好的性能表现，**空间复杂度可被优化至 $O(1)$** ，这是因为：
+归并排序在排序链表时具有显著优势，空间复杂度可以优化至 $O(1)$ ，原因如下：

- 由于链表可仅通过改变指针来实现节点增删，因此“将两个短有序链表合并为一个长有序链表”无需使用额外空间，即回溯合并阶段不用像排序数组一样建立辅助数组 `tmp` ；
- 通过使用「迭代」代替「递归划分」，可省去递归使用的栈帧空间；
+- 由于链表仅需改变指针就可实现节点的增删操作，因此合并阶段（将两个短有序链表合并为一个长有序链表）无需创建辅助链表。
+- 通过使用“迭代划分”替代“递归划分”，可省去递归使用的栈帧空间；

-> 详情参考：[148. 排序链表](https://leetcode-cn.com/problems/sort-list/solution/sort-list-gui-bing-pai-xu-lian-biao-by-jyd/)
+具体实现细节比较复杂，有兴趣的同学可以查阅相关资料进行学习。