7.3 KiB
全順列問題
全順列問題はバックトラッキングアルゴリズムの典型的な応用例です。これは、ある集合(配列や文字列など)が与えられたとき、その要素のあり得るすべての順列を求める問題です。
下表に、入力配列とそれに対応するすべての順列から成る例をいくつか示します。
表 全順列の例
| 入力配列 | すべての順列 |
|---|---|
[1] |
[1] |
[1, 2] |
[1, 2], [2, 1] |
[1, 2, 3] |
[1, 2, 3], [1, 3, 2], [2, 1, 3], [2, 3, 1], [3, 1, 2], [3, 2, 1] |
等しい要素がない場合
!!! question
重複要素を含まない整数配列を入力として受け取り、あり得るすべての順列を返します。
バックトラッキングアルゴリズムの観点から見ると、順列生成の過程は一連の選択の結果として捉えられます。入力配列が [1, 2, 3] だとすると、最初に 1 を選び、次に 3 を選び、最後に 2 を選べば、順列 [1, 3, 2] が得られます。戻る操作は 1 つの選択を取り消し、その後で別の選択を試し続けることを表します。
バックトラッキングコードの観点では、候補集合 choices は入力配列中のすべての要素であり、状態 state は現時点までに選ばれた要素です。各要素は 1 回しか選べないことに注意してください。したがって state 内の要素はすべて一意でなければなりません。
下図のように、探索過程は再帰木として展開できます。木の各ノードは現在の状態 state を表します。根ノードから始めて 3 ラウンドの選択を経て葉ノードに到達し、各葉ノードが 1 つの順列に対応します。
重複選択の枝刈り
各要素が 1 回しか選ばれないようにするため、ブール配列 selected の導入を考えます。ここで selected[i] は choices[i] がすでに選ばれているかどうかを表し、これに基づいて次の枝刈りを行います。
- 選択
choice[i]を行った後、selected[i]を\text{True}に設定し、その要素が選択済みであることを表します。 - 選択肢リスト
choicesを走査するとき、すでに選ばれたノードはすべてスキップします。これが枝刈りです。
下図のように、1 回目に 1、2 回目に 3、3 回目に 2 を選ぶとします。このとき 2 回目では要素 1 の分岐を、3 回目では要素 1 と要素 3 の分岐を刈り取る必要があります。
上図から、この枝刈りにより探索空間の大きさは O(n^n) から O(n!) へ削減されることがわかります。
コード実装
以上を整理できれば、フレームワークコードの「穴埋め」を行えます。全体のコードを短くするため、フレームワークコード中の各関数を個別には実装せず、これらを backtrack() 関数内に展開します。
[file]{permutations_i}-[class]{}-[func]{permutations_i}
等しい要素を考慮する場合
!!! question
整数配列を入力として受け取り、**配列には重複要素が含まれる場合があります**。重複しない順列をすべて返します。
入力配列が [1, 1, 2] だと仮定します。2 つの重複する要素 1 を区別しやすくするため、2 つ目の 1 を \hat{1} と記します。
下図のように、上述の方法で生成される順列の半分は重複しています。
では、重複した順列をどのように取り除けばよいのでしょうか。最も直接的なのは、ハッシュ集合を用いて順列結果をそのまま重複排除する方法です。しかしこのやり方は十分に洗練されていません。なぜなら、重複順列を生成する探索分岐はそもそも不要であり、事前に見つけて枝刈りすべきだからです。そうすることで、アルゴリズム効率をさらに高められます。
等しい要素の枝刈り
下図を見ると、1 回目のラウンドでは 1 を選ぶことと \hat{1} を選ぶことは等価であり、これら 2 つの選択の下で生成される順列はすべて重複します。したがって \hat{1} を枝刈りすべきです。
同様に、1 回目で 2 を選んだ後では、2 回目のラウンドにおける 1 と \hat{1} も重複分岐を生むため、2 回目の \hat{1} も枝刈りすべきです。
本質的には、各ラウンドの選択において、等しい複数の要素が 1 回しか選ばれないようにすることが目標です。
コード実装
前問のコードを土台として、各ラウンドの選択でハッシュ集合 duplicated を 1 つ用意し、そのラウンドですでに試した要素を記録して、重複要素を枝刈りすることを考えます。
[file]{permutations_ii}-[class]{}-[func]{permutations_ii}
要素どうしがすべて互いに異なると仮定すると、n 個の要素には全部で n! 通りの順列(階乗)があります。結果を記録する際には、長さ n のリストをコピーする必要があり、これに O(n) 時間を要します。したがって時間計算量は $O(n!n)$ です。
再帰の最大深さは n であり、O(n) のスタックフレーム空間を使います。selected は O(n) 空間を使用します。同時刻に存在する duplicated は最大で n 個であり、O(n^2) 空間を要します。したがって空間計算量は $O(n^2)$ です。
2 種類の枝刈りの比較
selected と duplicated はどちらも枝刈りに用いられますが、目的は異なる点に注意してください。
- 重複選択の枝刈り:探索全体を通して
selectedは 1 つだけです。これは現在の状態にどの要素が含まれているかを記録し、ある要素がstateに重複して現れるのを防ぎます。 - 等しい要素の枝刈り:各ラウンドの選択、すなわち各回の
backtrack呼び出しにはduplicatedが含まれます。これはそのラウンドの走査(forループ)でどの要素がすでに選ばれたかを記録し、等しい要素が 1 回しか選ばれないことを保証します。
下図は、2 つの枝刈り条件が有効になる範囲を示しています。木の各ノードは 1 つの選択を表し、根ノードから葉ノードまでの経路上の各ノードが 1 つの順列を構成することに注意してください。