mirror of
https://github.com/krahets/hello-algo.git
synced 2026-06-18 01:37:17 +08:00
Re-translate the Japanese version (#1871)
* Retranslate Japanese docs with GPT-5.4 * Retranslate Japanese code with GPT-5.4
This commit is contained in:
@@ -1,60 +1,60 @@
|
||||
# ハッシュアルゴリズム
|
||||
|
||||
前の2つの節では、ハッシュ表の動作原理とハッシュ衝突を処理する方法を紹介しました。しかし、オープンアドレス法と連鎖法はどちらも**衝突が発生した際にハッシュ表が正常に機能することのみを保証でき、ハッシュ衝突の発生頻度を減らすことはできません**。
|
||||
前の 2 節では、ハッシュテーブルの動作原理とハッシュ衝突の処理方法を紹介しました。しかし、オープンアドレス法であれ連鎖方式であれ、**それらが保証できるのは衝突発生時でもハッシュテーブルが正常に動作することだけであり、ハッシュ衝突そのものを減らすことはできません**。
|
||||
|
||||
ハッシュ衝突があまりにも頻繁に発生すると、ハッシュ表の性能は劇的に悪化します。下図に示すように、連鎖法ハッシュ表では、理想的なケースではキー値ペアがバケット間に均等に分散され、最適なクエリ効率を実現します。最悪のケースでは、すべてのキー値ペアが同じバケットに格納され、時間計算量が$O(n)$に悪化します。
|
||||
ハッシュ衝突があまりにも頻繁に発生すると、ハッシュテーブルの性能は急激に劣化します。下図のように、連鎖方式のハッシュテーブルでは、理想的な場合にはキーと値のペアが各バケットに均等に分布し、最良の検索効率を達成します。最悪の場合には、すべてのキーと値のペアが同じバケットに格納され、時間計算量は $O(n)$ に劣化します。
|
||||
|
||||

|
||||

|
||||
|
||||
**キー値ペアの分布はハッシュ関数によって決定されます**。ハッシュ関数の計算ステップを思い出すと、まずハッシュ値を計算し、次に配列長で剰余を取ります:
|
||||
**キーと値のペアの分布はハッシュ関数によって決まります**。ハッシュ関数の計算手順を思い出すと、まずハッシュ値を計算し、その後で配列長に対して剰余を取ります。
|
||||
|
||||
```shell
|
||||
index = hash(key) % capacity
|
||||
```
|
||||
|
||||
上記の式を観察すると、ハッシュ表の容量`capacity`が固定されている場合、**ハッシュアルゴリズム`hash()`が出力値を決定し**、それによってハッシュ表におけるキー値ペアの分布を決定します。
|
||||
上の式から分かるように、ハッシュテーブルの容量 `capacity` が固定されているとき、**出力値を決めるのはハッシュアルゴリズム `hash()` です**。したがって、それがキーと値のペアのハッシュテーブル内での分布も決定します。
|
||||
|
||||
これは、ハッシュ衝突の確率を減らすために、ハッシュアルゴリズム`hash()`の設計に焦点を当てるべきであることを意味します。
|
||||
これは、ハッシュ衝突の発生確率を下げるには、ハッシュアルゴリズム `hash()` の設計に注目すべきだということを意味します。
|
||||
|
||||
## ハッシュアルゴリズムの目標
|
||||
|
||||
「高速で安定した」ハッシュ表データ構造を実現するために、ハッシュアルゴリズムは以下の特性を持つべきです:
|
||||
「高速かつ安定した」ハッシュテーブルというデータ構造を実現するために、ハッシュアルゴリズムは次の特徴を備える必要があります。
|
||||
|
||||
- **決定性**: 同じ入力に対して、ハッシュアルゴリズムは常に同じ出力を生成するべきです。そうでなければハッシュ表は信頼できません。
|
||||
- **高効率**: ハッシュ値を計算するプロセスは十分に高速である必要があります。計算オーバーヘッドが小さいほど、ハッシュ表はより実用的になります。
|
||||
- **均等分散**: ハッシュアルゴリズムはキー値ペアがハッシュ表に均等に分散されることを保証するべきです。分散が均等であるほど、ハッシュ衝突の確率は低くなります。
|
||||
- **決定性**:同じ入力に対して、ハッシュアルゴリズムは常に同じ出力を生成しなければなりません。そうして初めて、ハッシュテーブルの信頼性が保たれます。
|
||||
- **高効率**:ハッシュ値の計算過程は十分に高速であるべきです。計算コストが小さいほど、ハッシュテーブルの実用性は高くなります。
|
||||
- **均一分布**:ハッシュアルゴリズムは、キーと値のペアがハッシュテーブル内に均等に分布するようにすべきです。分布が均一であるほど、ハッシュ衝突の確率は低くなります。
|
||||
|
||||
実際、ハッシュアルゴリズムはハッシュ表の実装だけでなく、他の分野でも広く応用されています。
|
||||
実際には、ハッシュアルゴリズムはハッシュテーブルの実装だけでなく、ほかの多くの分野でも広く利用されています。
|
||||
|
||||
- **パスワード保存**: ユーザーパスワードのセキュリティを保護するために、システムは通常平文パスワードを保存せず、パスワードのハッシュ値を保存します。ユーザーがパスワードを入力すると、システムは入力のハッシュ値を計算し、保存されているハッシュ値と比較します。一致すれば、パスワードは正しいと見なされます。
|
||||
- **データ整合性チェック**: データ送信者はデータのハッシュ値を計算して一緒に送信できます。受信者は受信したデータのハッシュ値を再計算し、受信したハッシュ値と比較できます。一致すれば、データは完全であると見なされます。
|
||||
- **パスワード保存**:ユーザーのパスワードを保護するために、システムは通常、平文パスワードを直接保存せず、そのハッシュ値を保存します。ユーザーがパスワードを入力すると、システムは入力内容のハッシュ値を計算し、保存済みのハッシュ値と比較します。一致すれば、そのパスワードは正しいと見なされます。
|
||||
- **データ完全性検査**:送信側はデータのハッシュ値を計算してデータと一緒に送信できます。受信側は受け取ったデータのハッシュ値を再計算し、受信したハッシュ値と比較できます。両者が一致すれば、そのデータは完全だと見なされます。
|
||||
|
||||
暗号化アプリケーションでは、ハッシュ値から元のパスワードを推測するなどの逆行分析を防ぐために、ハッシュアルゴリズムはより高いレベルのセキュリティ機能が必要です。
|
||||
暗号分野の応用では、ハッシュ値から元のパスワードを推測するといった逆解析を防ぐために、ハッシュアルゴリズムにはさらに高いレベルの安全性が求められます。
|
||||
|
||||
- **一方向性**: ハッシュ値から入力データに関する情報を推測することは不可能であるべきです。
|
||||
- **衝突耐性**: 同じハッシュ値を生成する2つの異なる入力を見つけることは極めて困難であるべきです。
|
||||
- **雪崩効果**: 入力の小さな変更は、出力に大きく予測不可能な変化をもたらすべきです。
|
||||
- **一方向性**:ハッシュ値から入力データに関するいかなる情報も逆算できないこと。
|
||||
- **耐衝突性**:異なる 2 つの入力で同じハッシュ値になるものを見つけることが、極めて困難であること。
|
||||
- **アバランシェ効果**:入力のわずかな変化が、出力の大きく予測不能な変化を引き起こすこと。
|
||||
|
||||
**「均等分散」と「衝突耐性」は2つの別々の概念**であることに注意してください。均等分散を満たしても、必ずしも衝突耐性があるとは限りません。例えば、ランダムな入力`key`の下で、ハッシュ関数`key % 100`は均等に分散された出力を生成できます。しかし、このハッシュアルゴリズムは過度にシンプルで、下二桁が同じすべての`key`は同じ出力を持つため、ハッシュ値から使用可能な`key`を簡単に推測でき、パスワードを破ることができます。
|
||||
注意してほしいのは、**「均一分布」と「耐衝突性」は独立した 2 つの概念である**という点です。均一分布を満たしていても、耐衝突性を満たすとは限りません。たとえば、入力 `key` がランダムである場合、ハッシュ関数 `key % 100` は均一に分布した出力を生成できます。しかし、このハッシュアルゴリズムはあまりにも単純で、下 2 桁が同じ `key` はすべて同じ出力になります。そのため、ハッシュ値から利用可能な `key` を容易に逆算でき、結果としてパスワードが破られてしまいます。
|
||||
|
||||
## ハッシュアルゴリズムの設計
|
||||
|
||||
ハッシュアルゴリズムの設計は多くの要因を考慮する必要がある複雑な問題です。しかし、要求が少ない一部のシナリオでは、いくつかの簡単なハッシュアルゴリズムを設計することもできます。
|
||||
ハッシュアルゴリズムの設計は、多くの要素を考慮しなければならない複雑な問題です。しかし、要求の高くない場面であれば、いくつかの単純なハッシュアルゴリズムを設計することもできます。
|
||||
|
||||
- **加算ハッシュ**: 入力の各文字のASCIIコードを合計し、合計をハッシュ値として使用します。
|
||||
- **乗算ハッシュ**: 乗算の非相関性を利用し、各ラウンドで定数を乗算し、各文字のASCIIコードをハッシュ値に累積します。
|
||||
- **XORハッシュ**: 入力データの各要素をXORすることでハッシュ値を累積します。
|
||||
- **回転ハッシュ**: 各文字のASCIIコードをハッシュ値に累積し、各累積前にハッシュ値に回転操作を実行します。
|
||||
- **加算ハッシュ**:入力の各文字の ASCII コードを足し合わせ、その合計をハッシュ値とします。
|
||||
- **乗算ハッシュ**:乗算の非相関性を利用し、各ラウンドで定数を掛けながら、各文字の ASCII コードをハッシュ値に累積します。
|
||||
- **XOR ハッシュ**:入力データの各要素を XOR 演算で 1 つのハッシュ値に累積します。
|
||||
- **回転ハッシュ**:各文字の ASCII コードを 1 つのハッシュ値に累積し、各回の累積前にハッシュ値を回転させます。
|
||||
|
||||
```src
|
||||
[file]{simple_hash}-[class]{}-[func]{rot_hash}
|
||||
```
|
||||
|
||||
各ハッシュアルゴリズムの最後のステップが大きな素数$1000000007$の剰余を取ることで、ハッシュ値が適切な範囲内にあることを保証していることが観察されます。なぜ素数の剰余を取ることが強調されるのか、または合成数の剰余を取ることの欠点は何かを考える価値があります。これは興味深い質問です。
|
||||
見て分かるように、各ハッシュアルゴリズムの最後のステップでは、大きな素数 $1000000007$ で剰余を取り、ハッシュ値が適切な範囲に収まるようにしています。ここで考えてみる価値があるのは、なぜ素数での剰余を強調するのか、あるいは合成数で剰余を取ることにどんな欠点があるのか、という点です。これは興味深い問題です。
|
||||
|
||||
結論として:**大きな素数を剰余として使用することで、ハッシュ値の均等分散を最大化できます**。素数は他の数と共通因子を持たないため、剰余演算によって引き起こされる周期的パターンを減らし、ハッシュ衝突を回避できます。
|
||||
先に結論を述べると、**法として大きな素数を使うと、ハッシュ値が均一に分布することを最大限に保証できます**。素数はほかの数と公約数を持たないため、剰余演算によって生じる周期的なパターンを減らし、ハッシュ衝突を避けやすくなります。
|
||||
|
||||
例えば、合成数$9$を剰余として選択するとします。これは$3$で割り切れるため、$3$で割り切れるすべての`key`はハッシュ値$0$、$3$、$6$にマッピングされます。
|
||||
たとえば、法として合成数 $9$ を選ぶとします。これは $3$ で割り切れるため、$3$ で割り切れるすべての `key` は、$0$、$3$、$6$ の 3 つのハッシュ値に写像されます。
|
||||
|
||||
$$
|
||||
\begin{aligned}
|
||||
@@ -64,7 +64,7 @@ $$
|
||||
\end{aligned}
|
||||
$$
|
||||
|
||||
入力`key`がたまたまこの種の等差数列分布を持つ場合、ハッシュ値がクラスターし、ハッシュ衝突を悪化させます。今度は`modulus`を素数$13$に置き換えるとします。`key`と`modulus`の間に共通因子がないため、出力ハッシュ値の均等性が大幅に改善されます。
|
||||
入力 `key` がたまたまこのような等差数列の分布をしていると、ハッシュ値に偏りが生じ、ハッシュ衝突がさらに深刻になります。そこで `modulus` を素数 $13$ に置き換えると仮定すると、`key` と `modulus` の間に公約数が存在しないため、出力されるハッシュ値の均一性は明らかに向上します。
|
||||
|
||||
$$
|
||||
\begin{aligned}
|
||||
@@ -74,71 +74,71 @@ $$
|
||||
\end{aligned}
|
||||
$$
|
||||
|
||||
`key`がランダムで均等に分散されることが保証されている場合、剰余として素数または合成数を選択しても、両方とも均等に分散されたハッシュ値を生成できることは注目に値します。しかし、`key`の分布にある種の周期性がある場合、合成数の剰余はクラスタリングを引き起こしやすくなります。
|
||||
補足すると、`key` がランダムかつ均一に分布していると保証できるなら、法に素数を選んでも合成数を選んでも構いません。どちらでも均一に分布したハッシュ値を出力できます。しかし、`key` の分布に何らかの周期性がある場合、合成数で剰余を取るほうが偏りが生じやすくなります。
|
||||
|
||||
要約すると、通常は素数を剰余として選択し、この素数は周期的パターンを可能な限り排除し、ハッシュアルゴリズムの堅牢性を向上させるために十分大きくある必要があります。
|
||||
要するに、通常は法として素数を選び、その素数はできるだけ大きいほうが望ましいです。そうすることで周期的なパターンをできる限り取り除き、ハッシュアルゴリズムの堅牢性を高められます。
|
||||
|
||||
## 一般的なハッシュアルゴリズム
|
||||
|
||||
上記で言及した簡単なハッシュアルゴリズムはかなり「脆弱」で、ハッシュアルゴリズムの設計目標から程遠いことは難しくありません。例えば、加算とXORは交換法則に従うため、加算ハッシュとXORハッシュは同じ内容だが順序が異なる文字列を区別できず、ハッシュ衝突を悪化させ、セキュリティ問題を引き起こす可能性があります。
|
||||
上で紹介した単純なハッシュアルゴリズムは、どれも比較的「脆弱」であり、ハッシュアルゴリズムの設計目標にはほど遠いことが分かります。たとえば、加算と XOR は交換法則を満たすため、加算ハッシュと XOR ハッシュでは、内容が同じで順序だけ異なる文字列を区別できません。これはハッシュ衝突を悪化させ、一部の安全上の問題を引き起こす可能性があります。
|
||||
|
||||
実際には、通常MD5、SHA-1、SHA-2、SHA-3などの標準ハッシュアルゴリズムを使用します。これらは任意の長さの入力データを固定長のハッシュ値にマッピングできます。
|
||||
実際には、MD5、SHA-1、SHA-2、SHA-3 などの標準的なハッシュアルゴリズムを用いることが一般的です。これらは任意長の入力データを、固定長のハッシュ値へ写像できます。
|
||||
|
||||
過去1世紀にわたって、ハッシュアルゴリズムは継続的なアップグレードと最適化のプロセスにありました。一部の研究者はハッシュアルゴリズムの性能向上に努め、ハッカーを含む他の人々はハッシュアルゴリズムのセキュリティ問題を見つけることに専念しています。以下の表は、実用的なアプリケーションで一般的に使用されるハッシュアルゴリズムを示しています。
|
||||
ここ 1 世紀近くの間、ハッシュアルゴリズムは継続的に改良と最適化が進められてきました。ある研究者たちは性能向上に取り組み、別の研究者やハッカーたちは安全性の弱点を探し続けてきました。次の表は、実際の応用でよく使われるハッシュアルゴリズムを示したものです。
|
||||
|
||||
- MD5とSHA-1は複数回攻撃に成功しており、さまざまなセキュリティアプリケーションで放棄されています。
|
||||
- SHA-2シリーズ、特にSHA-256は、現在最も安全なハッシュアルゴリズムの1つで、成功した攻撃は報告されておらず、さまざまなセキュリティアプリケーションとプロトコルで一般的に使用されています。
|
||||
- SHA-3はSHA-2と比較して実装コストが低く、計算効率が高いですが、現在の使用範囲はSHA-2シリーズほど広範囲ではありません。
|
||||
- MD5 と SHA-1 は何度も攻撃に成功されているため、各種のセキュリティ用途では廃止されています。
|
||||
- SHA-2 系列の SHA-256 は最も安全なハッシュアルゴリズムの 1 つであり、いまだに成功した攻撃例がないため、多くのセキュリティ用途やプロトコルで広く使われています。
|
||||
- SHA-3 は SHA-2 と比べて実装コストが低く、計算効率も高い一方で、現時点での普及度は SHA-2 系列に及びません。
|
||||
|
||||
<p align="center"> 表 <id> 一般的なハッシュアルゴリズム </p>
|
||||
|
||||
| | MD5 | SHA-1 | SHA-2 | SHA-3 |
|
||||
| --------------- | ----------------------------------------------- | ----------------------------------- | ----------------------------------------------------------------- | ---------------------------- |
|
||||
| リリース年 | 1992 | 1995 | 2002 | 2008 |
|
||||
| 出力長 | 128 bit | 160 bit | 256/512 bit | 224/256/384/512 bit |
|
||||
| ハッシュ衝突 | 頻繁 | 頻繁 | まれ | まれ |
|
||||
| セキュリティレベル | 低、攻撃に成功している | 低、攻撃に成功している | 高 | 高 |
|
||||
| アプリケーション | 放棄、データ整合性チェックにまだ使用 | 放棄 | 暗号通貨取引検証、デジタル署名など | SHA-2の代替として使用可能 |
|
||||
| | MD5 | SHA-1 | SHA-2 | SHA-3 |
|
||||
| -------- | ------------------------------ | ---------------- | ---------------------------- | ------------------- |
|
||||
| 発表年 | 1992 | 1995 | 2002 | 2008 |
|
||||
| 出力長 | 128 bit | 160 bit | 256/512 bit | 224/256/384/512 bit |
|
||||
| ハッシュ衝突 | 多い | 多い | 非常に少ない | 非常に少ない |
|
||||
| セキュリティレベル | 低く、攻撃に成功されている | 低く、攻撃に成功されている | 高い | 高い |
|
||||
| 用途 | 廃止済みだが、データ完全性検査には使われる | 廃止済み | 暗号資産の取引検証、デジタル署名など | SHA-2 の代替に使える |
|
||||
|
||||
# データ構造におけるハッシュ値
|
||||
## データ構造のハッシュ値
|
||||
|
||||
ハッシュ表のキーは整数、小数、文字列などのさまざまなデータ型にできることを知っています。プログラミング言語は通常、これらのデータ型に対して組み込みのハッシュアルゴリズムを提供し、ハッシュ表のバケットインデックスを計算します。Pythonを例に取ると、`hash()`関数を使用してさまざまなデータ型のハッシュ値を計算できます。
|
||||
ご存じのように、ハッシュテーブルの `key` には整数、小数、文字列などのデータ型を使えます。プログラミング言語は通常、これらのデータ型に対して組み込みのハッシュアルゴリズムを提供し、ハッシュテーブル内のバケットインデックス計算に利用します。Python を例にすると、`hash()` 関数を呼び出して各種データ型のハッシュ値を計算できます。
|
||||
|
||||
- 整数とブール値のハッシュ値は、それら自身の値です。
|
||||
- 浮動小数点数と文字列のハッシュ値の計算はより複雑で、興味のある読者は自分で研究することをお勧めします。
|
||||
- タプルのハッシュ値は、その各要素のハッシュ値の組み合わせで、単一のハッシュ値になります。
|
||||
- オブジェクトのハッシュ値は、そのメモリアドレスに基づいて生成されます。オブジェクトのハッシュメソッドをオーバーライドすることで、内容に基づいてハッシュ値を生成できます。
|
||||
- 整数と真理値のハッシュ値は、その値自身です。
|
||||
- 浮動小数点数と文字列のハッシュ値の計算はやや複雑なので、興味がある読者は自分で調べてみてください。
|
||||
- タプルのハッシュ値は、各要素のハッシュ値を求めてから、それらを組み合わせて 1 つのハッシュ値にしたものです。
|
||||
- オブジェクトのハッシュ値は、そのメモリアドレスに基づいて生成されます。オブジェクトのハッシュメソッドをオーバーライドすれば、内容に基づくハッシュ値を実装できます。
|
||||
|
||||
!!! tip
|
||||
|
||||
異なるプログラミング言語における組み込みハッシュ値計算関数の定義と方法は異なることに注意してください。
|
||||
注意してください。組み込みのハッシュ値計算関数の定義や方法は、プログラミング言語ごとに異なります。
|
||||
|
||||
=== "Python"
|
||||
|
||||
```python title="built_in_hash.py"
|
||||
num = 3
|
||||
hash_num = hash(num)
|
||||
# 整数3のハッシュ値は3
|
||||
# 整数 3 のハッシュ値は 3
|
||||
|
||||
bol = True
|
||||
hash_bol = hash(bol)
|
||||
# ブール値Trueのハッシュ値は1
|
||||
# 真理値 True のハッシュ値は 1
|
||||
|
||||
dec = 3.14159
|
||||
hash_dec = hash(dec)
|
||||
# 小数3.14159のハッシュ値は326484311674566659
|
||||
# 小数 3.14159 のハッシュ値は 326484311674566659
|
||||
|
||||
str = "Hello 算法"
|
||||
str = "Hello アルゴリズム"
|
||||
hash_str = hash(str)
|
||||
# 文字列"Hello 算法"のハッシュ値は4617003410720528961
|
||||
# 文字列「Hello アルゴリズム」のハッシュ値は 4617003410720528961
|
||||
|
||||
tup = (12836, "小哈")
|
||||
tup = (12836, "シャオハ")
|
||||
hash_tup = hash(tup)
|
||||
# タプル(12836, '小哈')のハッシュ値は1029005403108185979
|
||||
# タプル (12836, 'シャオハ') のハッシュ値は 1029005403108185979
|
||||
|
||||
obj = ListNode(0)
|
||||
hash_obj = hash(obj)
|
||||
# ListNodeオブジェクト0x1058fd810のハッシュ値は274267521
|
||||
# ノードオブジェクト <ListNode object at 0x1058fd810> のハッシュ値は 274267521
|
||||
```
|
||||
|
||||
=== "C++"
|
||||
@@ -146,22 +146,22 @@ $$
|
||||
```cpp title="built_in_hash.cpp"
|
||||
int num = 3;
|
||||
size_t hashNum = hash<int>()(num);
|
||||
// 整数3のハッシュ値は3
|
||||
// 整数 3 のハッシュ値は 3
|
||||
|
||||
bool bol = true;
|
||||
size_t hashBol = hash<bool>()(bol);
|
||||
// ブール値1のハッシュ値は1
|
||||
// 真理値 1 のハッシュ値は 1
|
||||
|
||||
double dec = 3.14159;
|
||||
size_t hashDec = hash<double>()(dec);
|
||||
// 小数3.14159のハッシュ値は4614256650576692846
|
||||
// 小数 3.14159 のハッシュ値は 4614256650576692846
|
||||
|
||||
string str = "Hello 算法";
|
||||
string str = "Hello アルゴリズム";
|
||||
size_t hashStr = hash<string>()(str);
|
||||
// 文字列"Hello 算法"のハッシュ値は15466937326284535026
|
||||
// 文字列「Hello アルゴリズム」のハッシュ値は 15466937326284535026
|
||||
|
||||
// C++では、組み込みstd::hash()は基本データ型のハッシュ値のみを提供
|
||||
// 配列とオブジェクトのハッシュ値は別途実装が必要
|
||||
// C++ では、組み込みの std:hash() は基本データ型のハッシュ値計算のみを提供する
|
||||
// 配列やオブジェクトのハッシュ値計算は自分で実装する必要がある
|
||||
```
|
||||
|
||||
=== "Java"
|
||||
@@ -169,27 +169,27 @@ $$
|
||||
```java title="built_in_hash.java"
|
||||
int num = 3;
|
||||
int hashNum = Integer.hashCode(num);
|
||||
// 整数3のハッシュ値は3
|
||||
// 整数 3 のハッシュ値は 3
|
||||
|
||||
boolean bol = true;
|
||||
int hashBol = Boolean.hashCode(bol);
|
||||
// ブール値trueのハッシュ値は1231
|
||||
// 真理値 true のハッシュ値は 1231
|
||||
|
||||
double dec = 3.14159;
|
||||
int hashDec = Double.hashCode(dec);
|
||||
// 小数3.14159のハッシュ値は-1340954729
|
||||
// 小数 3.14159 のハッシュ値は -1340954729
|
||||
|
||||
String str = "Hello 算法";
|
||||
String str = "Hello アルゴリズム";
|
||||
int hashStr = str.hashCode();
|
||||
// 文字列"Hello 算法"のハッシュ値は-727081396
|
||||
// 文字列「Hello アルゴリズム」のハッシュ値は -727081396
|
||||
|
||||
Object[] arr = { 12836, "小哈" };
|
||||
Object[] arr = { 12836, "シャオハ" };
|
||||
int hashTup = Arrays.hashCode(arr);
|
||||
// 配列[12836, 小哈]のハッシュ値は1151158
|
||||
// 配列 [12836, シャオハ] のハッシュ値は 1151158
|
||||
|
||||
ListNode obj = new ListNode(0);
|
||||
int hashObj = obj.hashCode();
|
||||
// ListNodeオブジェクトutils.ListNode@7dc5e7b4のハッシュ値は2110121908
|
||||
// ノードオブジェクト utils.ListNode@7dc5e7b4 のハッシュ値は 2110121908
|
||||
```
|
||||
|
||||
=== "C#"
|
||||
@@ -197,33 +197,33 @@ $$
|
||||
```csharp title="built_in_hash.cs"
|
||||
int num = 3;
|
||||
int hashNum = num.GetHashCode();
|
||||
// 整数3のハッシュ値は3;
|
||||
// 整数 3 のハッシュ値は 3;
|
||||
|
||||
bool bol = true;
|
||||
int hashBol = bol.GetHashCode();
|
||||
// ブール値trueのハッシュ値は1;
|
||||
// 真理値 true のハッシュ値は 1;
|
||||
|
||||
double dec = 3.14159;
|
||||
int hashDec = dec.GetHashCode();
|
||||
// 小数3.14159のハッシュ値は-1340954729;
|
||||
// 小数 3.14159 のハッシュ値は -1340954729;
|
||||
|
||||
string str = "Hello 算法";
|
||||
string str = "Hello アルゴリズム";
|
||||
int hashStr = str.GetHashCode();
|
||||
// 文字列"Hello 算法"のハッシュ値は-586107568;
|
||||
// 文字列「Hello アルゴリズム」のハッシュ値は -586107568;
|
||||
|
||||
object[] arr = [12836, "小哈"];
|
||||
object[] arr = [12836, "シャオハ"];
|
||||
int hashTup = arr.GetHashCode();
|
||||
// 配列[12836, 小哈]のハッシュ値は42931033;
|
||||
// 配列 [12836, シャオハ] のハッシュ値は 42931033;
|
||||
|
||||
ListNode obj = new(0);
|
||||
int hashObj = obj.GetHashCode();
|
||||
// ListNodeオブジェクト0のハッシュ値は39053774;
|
||||
// ノードオブジェクト 0 のハッシュ値は 39053774;
|
||||
```
|
||||
|
||||
=== "Go"
|
||||
|
||||
```go title="built_in_hash.go"
|
||||
// Goには組み込みのハッシュコード関数が提供されていません
|
||||
// Go は組み込みの hash code 関数を提供していない
|
||||
```
|
||||
|
||||
=== "Swift"
|
||||
@@ -231,39 +231,39 @@ $$
|
||||
```swift title="built_in_hash.swift"
|
||||
let num = 3
|
||||
let hashNum = num.hashValue
|
||||
// 整数3のハッシュ値は9047044699613009734
|
||||
// 整数 3 のハッシュ値は 9047044699613009734
|
||||
|
||||
let bol = true
|
||||
let hashBol = bol.hashValue
|
||||
// ブール値trueのハッシュ値は-4431640247352757451
|
||||
// 真理値 true のハッシュ値は -4431640247352757451
|
||||
|
||||
let dec = 3.14159
|
||||
let hashDec = dec.hashValue
|
||||
// 小数3.14159のハッシュ値は-2465384235396674631
|
||||
// 小数 3.14159 のハッシュ値は -2465384235396674631
|
||||
|
||||
let str = "Hello 算法"
|
||||
let str = "Hello アルゴリズム"
|
||||
let hashStr = str.hashValue
|
||||
// 文字列"Hello 算法"のハッシュ値は-7850626797806988787
|
||||
// 文字列「Hello アルゴリズム」のハッシュ値は -7850626797806988787
|
||||
|
||||
let arr = [AnyHashable(12836), AnyHashable("小哈")]
|
||||
let arr = [AnyHashable(12836), AnyHashable("シャオハ")]
|
||||
let hashTup = arr.hashValue
|
||||
// 配列[AnyHashable(12836), AnyHashable("小哈")]のハッシュ値は-2308633508154532996
|
||||
// 配列 [AnyHashable(12836), AnyHashable("シャオハ")] のハッシュ値は -2308633508154532996
|
||||
|
||||
let obj = ListNode(x: 0)
|
||||
let hashObj = obj.hashValue
|
||||
// ListNodeオブジェクトutils.ListNodeのハッシュ値は-2434780518035996159
|
||||
// ノードオブジェクト utils.ListNode のハッシュ値は -2434780518035996159
|
||||
```
|
||||
|
||||
=== "JS"
|
||||
|
||||
```javascript title="built_in_hash.js"
|
||||
// JavaScriptには組み込みのハッシュコード関数が提供されていません
|
||||
// JavaScript は組み込みの hash code 関数を提供していない
|
||||
```
|
||||
|
||||
=== "TS"
|
||||
|
||||
```typescript title="built_in_hash.ts"
|
||||
// TypeScriptには組み込みのハッシュコード関数が提供されていません
|
||||
// TypeScript は組み込みの hash code 関数を提供していない
|
||||
```
|
||||
|
||||
=== "Dart"
|
||||
@@ -271,27 +271,27 @@ $$
|
||||
```dart title="built_in_hash.dart"
|
||||
int num = 3;
|
||||
int hashNum = num.hashCode;
|
||||
// 整数3のハッシュ値は34803
|
||||
// 整数 3 のハッシュ値は 34803
|
||||
|
||||
bool bol = true;
|
||||
int hashBol = bol.hashCode;
|
||||
// ブール値trueのハッシュ値は1231
|
||||
// 真理値 true のハッシュ値は 1231
|
||||
|
||||
double dec = 3.14159;
|
||||
int hashDec = dec.hashCode;
|
||||
// 小数3.14159のハッシュ値は2570631074981783
|
||||
// 小数 3.14159 のハッシュ値は 2570631074981783
|
||||
|
||||
String str = "Hello 算法";
|
||||
String str = "Hello アルゴリズム";
|
||||
int hashStr = str.hashCode;
|
||||
// 文字列"Hello 算法"のハッシュ値は468167534
|
||||
// 文字列「Hello アルゴリズム」のハッシュ値は 468167534
|
||||
|
||||
List arr = [12836, "小哈"];
|
||||
List arr = [12836, "シャオハ"];
|
||||
int hashArr = arr.hashCode;
|
||||
// 配列[12836, 小哈]のハッシュ値は976512528
|
||||
// 配列 [12836, シャオハ] のハッシュ値は 976512528
|
||||
|
||||
ListNode obj = new ListNode(0);
|
||||
int hashObj = obj.hashCode;
|
||||
// ListNodeオブジェクトInstance of 'ListNode'のハッシュ値は1033450432
|
||||
// ノードオブジェクト Instance of 'ListNode' のハッシュ値は 1033450432
|
||||
```
|
||||
|
||||
=== "Rust"
|
||||
@@ -304,53 +304,107 @@ $$
|
||||
let mut num_hasher = DefaultHasher::new();
|
||||
num.hash(&mut num_hasher);
|
||||
let hash_num = num_hasher.finish();
|
||||
// 整数3のハッシュ値は568126464209439262
|
||||
// 整数 3 のハッシュ値は 568126464209439262
|
||||
|
||||
let bol = true;
|
||||
let mut bol_hasher = DefaultHasher::new();
|
||||
bol.hash(&mut bol_hasher);
|
||||
let hash_bol = bol_hasher.finish();
|
||||
// ブール値trueのハッシュ値は4952851536318644461
|
||||
// 真理値 true のハッシュ値は 4952851536318644461
|
||||
|
||||
let dec: f32 = 3.14159;
|
||||
let mut dec_hasher = DefaultHasher::new();
|
||||
dec.to_bits().hash(&mut dec_hasher);
|
||||
let hash_dec = dec_hasher.finish();
|
||||
// 小数3.14159のハッシュ値は2566941990314602357
|
||||
// 小数 3.14159 のハッシュ値は 2566941990314602357
|
||||
|
||||
let str = "Hello 算法";
|
||||
let str = "Hello アルゴリズム";
|
||||
let mut str_hasher = DefaultHasher::new();
|
||||
str.hash(&mut str_hasher);
|
||||
let hash_str = str_hasher.finish();
|
||||
// 文字列"Hello 算法"のハッシュ値は16092673739211250988
|
||||
// 文字列「Hello アルゴリズム」のハッシュ値は 16092673739211250988
|
||||
|
||||
let arr = (&12836, &"小哈");
|
||||
let arr = (&12836, &"シャオハ");
|
||||
let mut tup_hasher = DefaultHasher::new();
|
||||
arr.hash(&mut tup_hasher);
|
||||
let hash_tup = tup_hasher.finish();
|
||||
// タプル(12836, "小哈")のハッシュ値は1885128010422702749
|
||||
// タプル (12836, "シャオハ") のハッシュ値は 1885128010422702749
|
||||
|
||||
let node = ListNode::new(42);
|
||||
let mut hasher = DefaultHasher::new();
|
||||
node.borrow().val.hash(&mut hasher);
|
||||
let hash = hasher.finish();
|
||||
// ListNodeオブジェクトRefCell { value: ListNode { val: 42, next: None } }のハッシュ値は15387811073369036852
|
||||
// ノードオブジェクト RefCell { value: ListNode { val: 42, next: None } } のハッシュ値は15387811073369036852
|
||||
```
|
||||
|
||||
=== "C"
|
||||
|
||||
```c title="built_in_hash.c"
|
||||
// Cには組み込みのハッシュコード関数が提供されていません
|
||||
// C は組み込みの hash code 関数を提供していない
|
||||
```
|
||||
|
||||
=== "Kotlin"
|
||||
|
||||
```kotlin title="built_in_hash.kt"
|
||||
val num = 3
|
||||
val hashNum = num.hashCode()
|
||||
// 整数 3 のハッシュ値は 3
|
||||
|
||||
val bol = true
|
||||
val hashBol = bol.hashCode()
|
||||
// 真理値 true のハッシュ値は 1231
|
||||
|
||||
val dec = 3.14159
|
||||
val hashDec = dec.hashCode()
|
||||
// 小数 3.14159 のハッシュ値は -1340954729
|
||||
|
||||
val str = "Hello アルゴリズム"
|
||||
val hashStr = str.hashCode()
|
||||
// 文字列「Hello アルゴリズム」のハッシュ値は -727081396
|
||||
|
||||
val arr = arrayOf<Any>(12836, "シャオハ")
|
||||
val hashTup = arr.hashCode()
|
||||
// 配列 [12836, シャオハ] のハッシュ値は 189568618
|
||||
|
||||
val obj = ListNode(0)
|
||||
val hashObj = obj.hashCode()
|
||||
// ノードオブジェクト utils.ListNode@1d81eb93 のハッシュ値は 495053715
|
||||
```
|
||||
|
||||
多くのプログラミング言語では、**不変オブジェクトのみがハッシュ表の`key`として機能できます**。リスト(動的配列)を`key`として使用する場合、リストの内容が変更されると、そのハッシュ値も変更され、ハッシュ表で元の`value`を見つけることができなくなります。
|
||||
=== "Ruby"
|
||||
|
||||
カスタムオブジェクト(連結リストノードなど)のメンバー変数は可変ですが、ハッシュ可能です。**これは、オブジェクトのハッシュ値が通常そのメモリアドレスに基づいて生成されるためです**。オブジェクトの内容が変更されても、メモリアドレスは同じままなので、ハッシュ値は変更されません。
|
||||
```ruby title="built_in_hash.rb"
|
||||
num = 3
|
||||
hash_num = num.hash
|
||||
# 整数 3 のハッシュ値は -4385856518450339636
|
||||
|
||||
異なるコンソールで出力されるハッシュ値が異なることに気づいたかもしれません。**これは、Pythonインタープリターが起動するたびに文字列ハッシュ関数にランダムソルトを追加するためです**。このアプローチはHashDoS攻撃を効果的に防ぎ、ハッシュアルゴリズムのセキュリティを向上させます。
|
||||
bol = true
|
||||
hash_bol = bol.hash
|
||||
# 真理値 true のハッシュ値は -1617938112149317027
|
||||
|
||||
dec = 3.14159
|
||||
hash_dec = dec.hash
|
||||
# 小数 3.14159 のハッシュ値は -1479186995943067893
|
||||
|
||||
str = "Hello アルゴリズム"
|
||||
hash_str = str.hash
|
||||
# 文字列「Hello アルゴリズム」のハッシュ値は -4075943250025831763
|
||||
|
||||
tup = [12836, 'シャオハ']
|
||||
hash_tup = tup.hash
|
||||
# タプル (12836, 'シャオハ') のハッシュ値は 1999544809202288822
|
||||
|
||||
obj = ListNode.new(0)
|
||||
hash_obj = obj.hash
|
||||
# ノードオブジェクト #<ListNode:0x000078133140ab70> のハッシュ値は 4302940560806366381
|
||||
```
|
||||
|
||||
??? pythontutor "可視化実行"
|
||||
|
||||
https://pythontutor.com/render.html#code=class%20ListNode%3A%0A%20%20%20%20%22%22%22%E9%93%BE%E8%A1%A8%E8%8A%82%E7%82%B9%E7%B1%BB%22%22%22%0A%20%20%20%20def%20__init__%28self,%20val%3A%20int%29%3A%0A%20%20%20%20%20%20%20%20self.val%3A%20int%20%3D%20val%20%20%23%20%E8%8A%82%E7%82%B9%E5%80%BC%0A%20%20%20%20%20%20%20%20self.next%3A%20ListNode%20%7C%20None%20%3D%20None%20%20%23%20%E5%90%8E%E7%BB%A7%E8%8A%82%E7%82%B9%E5%BC%95%E7%94%A8%0A%0A%22%22%22Driver%20Code%22%22%22%0Aif%20__name__%20%3D%3D%20%22__main__%22%3A%0A%20%20%20%20num%20%3D%203%0A%20%20%20%20hash_num%20%3D%20hash%28num%29%0A%20%20%20%20%23%20%E6%95%B4%E6%95%B0%203%20%E7%9A%84%E5%93%88%E5%B8%8C%E5%80%BC%E4%B8%BA%203%0A%0A%20%20%20%20bol%20%3D%20True%0A%20%20%20%20hash_bol%20%3D%20hash%28bol%29%0A%20%20%20%20%23%20%E5%B8%83%E5%B0%94%E9%87%8F%20True%20%E7%9A%84%E5%93%88%E5%B8%8C%E5%80%BC%E4%B8%BA%201%0A%0A%20%20%20%20dec%20%3D%203.14159%0A%20%20%20%20hash_dec%20%3D%20hash%28dec%29%0A%20%20%20%20%23%20%E5%B0%8F%E6%95%B0%203.14159%20%E7%9A%84%E5%93%88%E5%B8%8C%E5%80%BC%E4%B8%BA%20326484311674566659%0A%0A%20%20%20%20str%20%3D%20%22Hello%20%E7%AE%97%E6%B3%95%22%0A%20%20%20%20hash_str%20%3D%20hash%28str%29%0A%20%20%20%20%23%20%E5%AD%97%E7%AC%A6%E4%B8%B2%E2%80%9CHello%20%E7%AE%97%E6%B3%95%E2%80%9D%E7%9A%84%E5%93%88%E5%B8%8C%E5%80%BC%E4%B8%BA%204617003410720528961%0A%0A%20%20%20%20tup%20%3D%20%2812836,%20%22%E5%B0%8F%E5%93%88%22%29%0A%20%20%20%20hash_tup%20%3D%20hash%28tup%29%0A%20%20%20%20%23%20%E5%85%83%E7%BB%84%20%2812836,%20'%E5%B0%8F%E5%93%88'%29%20%E7%9A%84%E5%93%88%E5%B8%8C%E5%80%BC%E4%B8%BA%201029005403108185979%0A%0A%20%20%20%20obj%20%3D%20ListNode%280%29%0A%20%20%20%20hash_obj%20%3D%20hash%28obj%29%0A%20%20%20%20%23%20%E8%8A%82%E7%82%B9%E5%AF%B9%E8%B1%A1%20%3CListNode%20object%20at%200x1058fd810%3E%20%E7%9A%84%E5%93%88%E5%B8%8C%E5%80%BC%E4%B8%BA%20274267521&cumulative=false&curInstr=19&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=311&rawInputLstJSON=%5B%5D&textReferences=false
|
||||
|
||||
多くのプログラミング言語では、**不変オブジェクトだけがハッシュテーブルの `key` として使えます**。仮にリスト(動的配列)を `key` とすると、その内容が変化したときにハッシュ値も変わってしまうため、もとの `value` をハッシュテーブルから検索できなくなります。
|
||||
|
||||
カスタムオブジェクト(たとえば連結リストのノード)のメンバ変数は可変ですが、それでもハッシュ可能です。**これは、オブジェクトのハッシュ値が通常はメモリアドレスに基づいて生成されるためです**。オブジェクトの内容が変化しても、メモリアドレスが変わらなければ、ハッシュ値も変わりません。
|
||||
|
||||
注意深い人なら、異なるコンソールでプログラムを実行したときに、出力されるハッシュ値が異なることに気づくかもしれません。**これは、Python インタプリタが起動のたびに文字列ハッシュ関数へランダムな salt 値を追加しているためです**。この方法によって HashDoS 攻撃を効果的に防ぎ、ハッシュアルゴリズムの安全性を高めています。
|
||||
|
||||
Reference in New Issue
Block a user