build

2026-04-13 16:19:46 +08:00 · 2023-08-19 22:07:27 +08:00
parent 71c7786f51
commit 2e27ad1680
99 changed files with 283 additions and 283 deletions
--- a/chapter_hashing/hash_algorithm.md
+++ b/chapter_hashing/hash_algorithm.md
@@ -2,7 +2,7 @@
 comments: true
 ---

-# 6.3. &nbsp; 哈希算法
+# 6.3 &nbsp; 哈希算法

 在上两节中，我们了解了哈希表的工作原理和哈希冲突的处理方法。然而无论是开放寻址还是链地址法，**它们只能保证哈希表可以在发生冲突时正常工作，但无法减少哈希冲突的发生**。

@@ -22,7 +22,7 @@ index = hash(key) % capacity

 这意味着，为了减小哈希冲突的发生概率，我们应当将注意力集中在哈希算法 `hash()` 的设计上。

-## 6.3.1. &nbsp; 哈希算法的目标
+## 6.3.1 &nbsp; 哈希算法的目标

 为了实现“既快又稳”的哈希表数据结构，哈希算法应包含以下特点：

@@ -42,7 +42,7 @@ index = hash(key) % capacity

 请注意，**“均匀分布”与“抗碰撞性”是两个独立的概念**，满足均匀分布不一定满足抗碰撞性。例如，在随机输入 `key` 下，哈希函数 `key % 100` 可以产生均匀分布的输出。然而该哈希算法过于简单，所有后两位相等的 `key` 的输出都相同，因此我们可以很容易地从哈希值反推出可用的 `key` ，从而破解密码。

-## 6.3.2. &nbsp; 哈希算法的设计
+## 6.3.2 &nbsp; 哈希算法的设计

 哈希算法的设计是一个复杂且需要考虑许多因素的问题。然而对于简单场景，我们也能设计一些简单的哈希算法。以字符串哈希为例：

@@ -520,7 +520,7 @@ $$

 总而言之，我们通常选取质数作为模数，并且这个质数最好足够大，以尽可能消除周期性模式，提升哈希算法的稳健性。

-## 6.3.3. &nbsp; 常见哈希算法
+## 6.3.3 &nbsp; 常见哈希算法

 不难发现，以上介绍的简单哈希算法都比较“脆弱”，远远没有达到哈希算法的设计目标。例如，由于加法和异或满足交换律，因此加法哈希和异或哈希无法区分内容相同但顺序不同的字符串，这可能会加剧哈希冲突，并引起一些安全问题。

@@ -544,7 +544,7 @@ $$

 </div>

-## 6.3.4. &nbsp; 数据结构的哈希值
+## 6.3.4 &nbsp; 数据结构的哈希值

 我们知道，哈希表的 `key` 可以是整数、小数或字符串等数据类型。编程语言通常会为这些数据类型提供内置的哈希算法，用于计算哈希表中的桶索引。以 Python 为例，我们可以调用 `hash()` 函数来计算各种数据类型的哈希值，包括：