Уровень алгоритма

Участница:Александра/Метод встречи посередине

Материал из Алговики
Перейти к навигации Перейти к поиску


Метод встречи посередине
Последовательный алгоритм
Последовательная сложность O(\sqrt n\log(n))
Объём выходных данных n
Параллельный алгоритм
Высота ярусно-параллельной формы O()
Ширина ярусно-параллельной формы O()


Автор описания: А.В.Батарина

1 Свойства и структура алгоритма

1.1 Общее описание алгоритма

Метод "Встреча посередине" криптоанализа блочных шифров был впервые предложен в 1977 году Уитфилдом Диффи и Мартином Хеллманом [1]. Встреча посередине используется для ускорения перебора ключей шифра за счёт увеличения требуемой памяти. Метод применим в случае каскадного построения сложного шифра из нескольких простых, другими словами, в случае последовательного применения шифрующих преобразований на разных ключах к блокам открытого текста.

1.1.1 Блочный шифр с ключевым расписанием

1.1.2 Усложнённые шифры

В качестве примера шифра, поддающегося атаке "встреча посередине" можно привести криптоалгоритм 2DES, являющийся модификацией шифра DES. В 2DES открытый текст шифруется дважды алгоритмом DES на двух разных 56-битных ключах. Однако из-за атаки "встреча посередине" сложность перебора двойного ключа (112 бит) шифра 2DES составляет 2^{57} вместо ожидаемых 2^{112}.

1.2 Математическое описание алгоритма

Исходные данные: открытый текст x, шифртекст y.

Алгоритм зашифрования — композиция двух преобразований T_1(x,k_1) и T_2(x,k_2), т.е. y=T_2(T_1(x,k_1),k_2).

Алгоритм расшифрования — x=T_1^{-1}(T_2^{-1}(x,k_2),k_1)

Вычисляемые данные: ключи шифрования k_1 \in K_1, k_2 \in K_2, где K_1, K_2 — множества возможных ключей.

Трудоёмкость полного перебора всех возможных пар k_1,k_2 составляет в среднем \frac{|K_1||K_2|}{2}. Однако используя дополнительную память, можно сократить перебор.

Предположим, что открытый текст x и шифртекст y однозначно определяют ключи k_1,k_2. Составим две таблицы:

\begin{align} z_1 & =T_1(x,k_1^1) & z_1^' &=T_2^{-1}(x,k_2^1)\\\\ z_2 & =T_1(x,k_1^2) & z_2^' & =T_2^{-1}(x,k_2^2)\\ ... & ................. & ... & .................... \\ z_{|K_1|} & =T_1(x,k_1^{|K_1|}) & z_{|K_1|}^' & =T_2^{-1}(x,k_2^{|K_1|}) \end{align}

Для всех k_1 \in K_1, k_2 \in K_2. Далее таблицы объединяются и сортируются по значениям z_i,z_j^'. Индексы i,j, при которых z_i=z_j^', однозначно определяют искомую пару ключей k_1=k_1^i,k_2=k_2^j. Для нахождения такой пары достаточно просмотреть отсортированную таблицу один раз.

1.2.1 Оптимизации

1. От генерации второй таблицы со значениями z_j^' можно отказаться, перебирая ключи k_2^j до того момента, когда значение z_j^' совпадёт с одним из значений z_i. В таком случае опробование ключей k_2^j в среднем сократится вдвое. Также вдвое сократится объём используемой памяти. Для нахождения совпадающего значения в отсортированном массиве можно применить бинарный поиск.

2. Вместо сортировки таблицы со значениями z_i и последующего бинарного поиска можно использовать хэш-таблицу.

1.3 Макроструктура алгоритма

Основную сложность алгоритма составляет сортировка таблицы, полученной в результате опробования ключей. В случае использования хэш-таблицы достаточно большого размера вместо сортировки основную сложность составит опробование ключей k_1,k_2.

1.4 Схема реализации последовательного алгоритма

Далее приводится последовательность действий для варианта алгоритма с генерацией одной таблицы значений z_i.

1. Вычислить таблицу z_i, записывая значения в порядке вычисления или используя хэш-таблицу

2. В случае записи значений в порядке вычисления отсортировать массив

3. Опробовать ключи k_2^j, ища совпадения с таблицей значений z_i. Для нахождения совпадения использовать поиск по хэш-таблице (если она есть) или бинарный поиск

1.5 Последовательная сложность алгоритма

1. Сложность вычисления таблиц значений z_i,z_j^' составит O(|K_1|+|K_2|) операций опробования

2. Объединение таблиц и их сортировка будет иметь сложность O((|K_1|+|K_2|)\log(|K_1|+|K_2|)) (например, при сортировке слиянием).

3. Сложность бинарного поиска в отсортированном массиве — O(log_2(|K_1|)) для каждого поиска

4. Сложность поиска в достаточно большой хэш-таблице составит O(1) для каждого поиска

Итого асимптотическая сложность алгоритма:

1. С генерацией двух таблиц — O(|K_1|+|K_2|) + O((|K_1|+|K_2|)\log(|K_1|+|K_2|)) + O(|K_1|+|K_2|)=O((|K_1|+|K_2|)\log(|K_1|+|K_2|))

2. C генерацией одной таблицы, сортировкой и бинарным поиском — O(|K_1|) + O((|K_1|)\log(|K_1|)) + O(|K_2|\log_2(|K_1|))=O(max(|K_1|,|K_2|)\log(|K_1|))

3. C генерацией одной (достаточно большой) хэш-таблицы — O(|K_1|) + O(|K_2|)=O(|K_1|+|K_2|)

Пусть n - количество всевозможных пар k_1,k_2 и пусть |K_1|=|K_2|. В этом случае |K_1|=|K_2|=\sqrt n.

Тогда сложность алгоритма в первых двух пунктах составляет O(\sqrt n\log(n)), в третьем — O(\sqrt n).

1.6 Информационный граф

Опишем граф алгоритма. На вход подаётся открытый (Open) и закрытый (Close), т.е. зашифрованный, текст. Далее открытый текст шифруется (Enc) на ключах k_1^i, а зашифрованный расшифруется (Dec) на ключе k_2^j. Далее полученные криптограммы сравниваются (Cmp) и все ключи, на которых они совпали, являются выходом алгоритма.

Рисунок 1. Граф алгоритма c отображением входных и выходных данных. Open - открытый текст Close — шифртекст Enc — операция зашифрования Dec — операция расшифрования, Cmp — операция сравнения, Keys — полученные ключи

1.7 Ресурс параллелизма алгоритма

Как видно из информационного графа, для реализации атаки "встреча посередине" в параллельном варианте потребуются следующие шаги (в предположении, что |K_1|=|K_2|):

1. O(\sqrt n) зашифрований и столько же расшифрований

2. n сравнений

2 Литература

<references \>

  1. (June 1977) «Exhaustive Cryptanalysis of the NBS Data Encryption Standard». Computer 10 (6): 74–84. DOI:10.1109/C-M.1977.217750