build

2026-04-23 18:11:45 +08:00 · 2023-03-26 22:05:35 +08:00
parent 43c3bc8838
commit 906182485d
6 changed files with 444 additions and 31 deletions
--- a/chapter_sorting/bucket_sort.md
+++ b/chapter_sorting/bucket_sort.md
@@ -2,11 +2,13 @@
 comments: true
 ---

-# 11.7. &nbsp; 桶排序
+# 11.6. &nbsp; 桶排序

-「桶排序 Bucket Sort」是分治思想的典型体现，其通过设置一些桶，将数据平均分配到各个桶中，并在每个桶内部分别执行排序，最终根据桶之间天然的大小顺序将各个桶内元素合并，从而得到排序结果。
+前面介绍的几种排序算法都属于 **基于比较的排序算法**，即通过比较元素之间的大小来实现排序，此类排序算法的时间复杂度无法超越 $O(n \log n)$ 。接下来，我们将学习几种 **非比较排序算法** ，其时间复杂度可以达到线性级别。

-## 11.7.1. &nbsp; 算法流程
+「桶排序 Bucket Sort」是分治思想的典型体现，其通过设置一些具有大小顺序的桶，每个桶对应一个数据范围，将数据平均分配到各个桶中，并在每个桶内部分别执行排序，最终按照桶的顺序将所有数据合并即可。
+
+## 11.6.1. &nbsp; 算法流程

 输入一个长度为 $n$ 的数组，元素是范围 $[0, 1)$ 的浮点数，桶排序流程为：

@@ -105,11 +107,11 @@ comments: true
    [class]{}-[func]{bucketSort}
    ```

-!!! note "桶排序是计数排序的一种推广"
+!!! question "桶排序的应用场景是什么？" 

-    从桶排序的角度，我们可以把计数排序中计数数组 `counter` 的每个索引想象成一个桶，将统计数量的过程想象成把各个元素分配到对应的桶中，再根据桶之间的有序性输出结果，从而实现排序。
+    桶排序一般用于排序超大体量的数据。例如输入数据包含 100 万个元素，由于空间有限，系统无法一次性将所有数据加载进内存，那么可以先将数据划分到 1000 个桶里，再依次排序每个桶，最终合并结果即可。

-## 11.7.2. &nbsp; 算法特性
+## 11.6.2. &nbsp; 算法特性

 **时间复杂度 $O(n + k)$** ：假设元素平均分布在各个桶内，则每个桶内元素数量为 $\frac{n}{k}$ 。假设排序单个桶使用 $O(\frac{n}{k} \log\frac{n}{k})$ 时间，则排序所有桶使用 $O(n \log\frac{n}{k})$ 时间，**当桶数量 $k$ 比较大时，时间复杂度则趋向于 $O(n)$** 。最后合并结果需要遍历 $n$ 个桶，使用 $O(k)$ 时间。

@@ -119,7 +121,7 @@ comments: true

 桶排序是否稳定取决于排序桶内元素的算法是否稳定。

-## 11.7.3. &nbsp; 如何实现平均分配
+## 11.6.3. &nbsp; 如何实现平均分配

 桶排序的时间复杂度理论上可以达到 $O(n)$ ，**难点是需要将元素均匀分配到各个桶中**，因为现实中的数据往往都不是均匀分布的。举个例子，假设我们想要把淘宝的所有商品根据价格范围平均分配到 10 个桶中，然而商品价格不是均匀分布的，100 元以下非常多、1000 元以上非常少；如果我们将价格区间平均划为 10 份，那么各个桶内的商品数量差距会非常大。