mirror of
https://github.com/krahets/hello-algo.git
synced 2026-04-13 16:19:46 +08:00
build
This commit is contained in:
@@ -2,7 +2,7 @@
|
||||
comments: true
|
||||
---
|
||||
|
||||
# 6.3. 哈希算法
|
||||
# 6.3 哈希算法
|
||||
|
||||
在上两节中,我们了解了哈希表的工作原理和哈希冲突的处理方法。然而无论是开放寻址还是链地址法,**它们只能保证哈希表可以在发生冲突时正常工作,但无法减少哈希冲突的发生**。
|
||||
|
||||
@@ -22,7 +22,7 @@ index = hash(key) % capacity
|
||||
|
||||
这意味着,为了减小哈希冲突的发生概率,我们应当将注意力集中在哈希算法 `hash()` 的设计上。
|
||||
|
||||
## 6.3.1. 哈希算法的目标
|
||||
## 6.3.1 哈希算法的目标
|
||||
|
||||
为了实现“既快又稳”的哈希表数据结构,哈希算法应包含以下特点:
|
||||
|
||||
@@ -42,7 +42,7 @@ index = hash(key) % capacity
|
||||
|
||||
请注意,**“均匀分布”与“抗碰撞性”是两个独立的概念**,满足均匀分布不一定满足抗碰撞性。例如,在随机输入 `key` 下,哈希函数 `key % 100` 可以产生均匀分布的输出。然而该哈希算法过于简单,所有后两位相等的 `key` 的输出都相同,因此我们可以很容易地从哈希值反推出可用的 `key` ,从而破解密码。
|
||||
|
||||
## 6.3.2. 哈希算法的设计
|
||||
## 6.3.2 哈希算法的设计
|
||||
|
||||
哈希算法的设计是一个复杂且需要考虑许多因素的问题。然而对于简单场景,我们也能设计一些简单的哈希算法。以字符串哈希为例:
|
||||
|
||||
@@ -520,7 +520,7 @@ $$
|
||||
|
||||
总而言之,我们通常选取质数作为模数,并且这个质数最好足够大,以尽可能消除周期性模式,提升哈希算法的稳健性。
|
||||
|
||||
## 6.3.3. 常见哈希算法
|
||||
## 6.3.3 常见哈希算法
|
||||
|
||||
不难发现,以上介绍的简单哈希算法都比较“脆弱”,远远没有达到哈希算法的设计目标。例如,由于加法和异或满足交换律,因此加法哈希和异或哈希无法区分内容相同但顺序不同的字符串,这可能会加剧哈希冲突,并引起一些安全问题。
|
||||
|
||||
@@ -544,7 +544,7 @@ $$
|
||||
|
||||
</div>
|
||||
|
||||
## 6.3.4. 数据结构的哈希值
|
||||
## 6.3.4 数据结构的哈希值
|
||||
|
||||
我们知道,哈希表的 `key` 可以是整数、小数或字符串等数据类型。编程语言通常会为这些数据类型提供内置的哈希算法,用于计算哈希表中的桶索引。以 Python 为例,我们可以调用 `hash()` 函数来计算各种数据类型的哈希值,包括:
|
||||
|
||||
|
||||
Reference in New Issue
Block a user