Метод Видемана-Копперсмита

{Автор - Участник:GKormakov}

Содержание

1 Свойства и структура алгоритма
2 Программная реализация алгоритма
3 Литература

1 Свойства и структура алгоритма

1.1 Общее описание алгоритма

Алгоритм Видемана-Копперсмита был предложен Дугласом Видеманом в статье 1986 года ^[1]. Алгоритм позволял получить решение системы линейных уравнений $Ax = b$ над полем GF(2) (в общем случае, над конечным полем GF(q)) в случае, когда матрица A являлась разреженной. В частности, совместный алгоритм Видемана-Копперсмита решал задачу поиска нетривиальных векторов из ядра матрицы $A$ , т.е. нетривиальные решения уравнения $Ax = 0$

Стоит отметить, что алгоритм описывался для квадратной матрицы $A$ , однако его легко можно обобщить на случай прямоугольной матрицы, переходя к матрице $A^T A$

Статья обосновывала корректность алгоритма, оценивала сложность вычислений, рассматривала разложения многочленов на множители и вычисление матричных полиномов. После выхода статьи сам метод не получил широкого применения, однако теоретические оценки и вспомогательные алгоритмы получили признание.

В рамках вычислений алгоритм является улучшенной версией алгоритма Копперсмита и алгоритма Монтгомери. В отличии от алгоритма Монтгомери имеет более эффективную реализацию на параллельных вычислительных системах - одним из главных отличий является меньший обмен данными между вычислительными узлами.

Алгоритм получил широкое применение в алгоритмах криптографии, в том числе, в алгоритме факторизации, использующего факторные базы^[2]

Использование стандартных методов Крылова (например, метода Ланцоша) не могли гарантировать условий на матрицу в GF(2), которые гарантировали сходимость, в связи с этим и были предложены перечисленные выше методы.

1.2 Математическое описание алгоритма

1.2.1 Метод Видемана

1.2.1.1 Невырожденный случай

Пусть $Ax = b, A\in\mathbb{F}_2^{n \times n}, b\in \mathbb{F}_2^n$ - согласованная СЛАУ с квадратной невырожденной матрицей.

$\begin{align} f(\lambda) = 1 + \sum_{i=1}^n f_i \lambda^i \end{align}$ - характеристический полином матрицы $A$ с коэффициентами $f_i\in\mathbb{F}_2$

По теореме Гамильтона-Кэли $f(A) = 0$ , следовательно, $f(A)b = 0$ . И, учитывая вид характеристической функции:

$\begin{align} b = \sum_{i=1}^n f_i A^i b = A(\sum_{i=1}^{n-1} f_{i+1}A^i b ) \end{align}$

Таким образом, если коэффициенты характеристического полинома известны, то единственное решение исследуемой системы можно найти как линейную комбинацию векторов Крылова: $\begin{align} x = \sum_{i=1}^{n-1} f_{i+1}A^i b \end{align}$

Но как искать эти коэффициенты? Для случая СЛАУ с разреженной матрицей Видеман предложил следующую идею: Выбрать случайный вектор $y \in \mathbb{F}_2^n$ , тогда для $j = 0...n$ верны следующие соотношения:

$\begin{align} y^Tf(A)A^jb = y^T(\sum_{i=0}^{n} f_iA^i)A^jb = \sum_{i=0}^{n}(y^TA^{i+j}b)f_i = 0 \end{align}$

Пусть $\alpha_i = y^T A^ib \in \mathbb{F}_2, \forall i=0...n$ , тогда верхняя система преобразуется в однородную СЛАУ:

$\begin{align} \sum_{i=0}^{n}\alpha_{i+j}f_i = 0 , j = 0...n \end{align}$

с матрицей $H_{ij}=\alpha_{i+j}$ порядка n + 1, имеющую ганкелеву структуру, что позволяет проще (за $O(n^2)$ - алгоритм Тренча) решать СЛАУ, поскольку матрица задаётся 2n + 1 параметрами. Если переставить строки матрицы $H$ в обратном порядке, то матрица станет теплицевой. Над GF(2) также известны быстрые алгоритмы решения СЛАУ (алгоритм Берлекампа - Масси)

1.2.1.2 Вырожденный случай

Для случая нахождения произвольного вектора из ядра матрицы $A$ идея Видемана применяется в следующем виде:

Поскольку $A$ теперь вырожденная, то характеристический полином будет выглядеть иначе (занулятся младшие коэффициенты):

$\begin{align} f(\lambda) = \lambda^s(\sum_{i=0}^{n-s} f_{i+s} \lambda^i), причём f_s \neq 0 \end{align}$

В этом случае выбираем произвольный вектор $x\in\mathbb{F}_2^n$ и находим вектор $\omega \in \mathbb{F}_2^n$ : $\begin{align} \omega = (\sum_{i=0}^{n-s} f_{i+s} A^i)x \end{align}$

Т.к. размерность ядра матрицы $\sum_{i=0}^{n-s} f_{i+s} A^i$ не может быть больше n - 1, а размерность пространства $\mathbb{F}$ равна n, то с вероятностью 1/2 $\omega \neq 0$ . Если же он равен 0, то выбираем другой x и ищем степень матрицы $A$ : $A^\delta \omega \neq 0, а A^{\delta + 1} \omega = 0$ , тогда $A^\delta \omega$ - искомый вектор из ядра.

Перепишем итоговый алгоритм Видемана для нахождения вектора из ядра A:

Шаг 1. Выбираем случайные векторы $x, y \in \mathbb{F}_2^n$

Шаг 2. $\forall s = 0, ... 2n$ вычисляем $\alpha_s = y^TA^sx$ и строим полином $a(x) = \sum\alpha_ix^i \textit{формальной}$ степени 2n

Шаг 3. Характеристическому полиному $f(x)$ ставим в соответствие полином $\widetilde{f(x)} = x^n f(\frac{1}{x}), тогда f_i = \widetilde{f(x)}_{n-i}$ и

$\sum_{i=0}^n\alpha_{i+j}f_i = \sum_{i=0}^n\alpha_{i+j}\widetilde{f(x)}_{n-i} = 0, j=0...n$ , т.е. все коэффициенты в $a(x)\widetilde{f(x)}$ при $x^n, x^{n+1}, ..., x^{2n}$ будут равны

Т.е. $a(x)\widetilde{f(x)} = g(x) mod \,x^{2n + 1}, где\, deg(g) \lt n$

Таким образом построили полином $\widetilde{f(x)}$

Шаг 4. Получаем решение $\omega = A^\delta \sum_if_iA^ix : A\omega = 0$ алгоритмом, описанным выше

1.2.2 Алгоритм Видемана-Копперсмита

Алгоритм Видемана по поиску вектора из ядра матрицы A сводился к решению СЛАУ с генкелевой или теплицевой матрицей, что ускоряло алгоритм, однако алгоритм Видемана является последовательным алгоритмом (коэффициенты полинома $a(x)$ вычисляются последовательно), т.е. он не имеет выигрыша по скорости перед методом Монтгомери при распараллеливании на несколько узлов. Поэтому Копперсмит добавил в алгоритм Видемана работу с блочными матрицами.

Пусть также задана однородная СЛАУ $Ax = 0\, , A\in\mathbb{F}_2^{n\times n}$ , так же требуется найти нетривиальное решение. Опишем предложения Копперсмита:

Шаг 1. Рассмотрим два случайных блока $Z\in \mathbb{F}_2^{n\times m_b}$ и $Y\in \mathbb{F}_2^{n\times n_b}$ , $m_b \neq n_b$ . Тогда столбцы матрицы $AZ = X\in \mathbb{F}_2^{n\times m_b}$ будут принадлежать линейной оболочке столбцов матрицы $A$ . На практике числа $m_b, n_b$ кратны размеру машинного слова, это будет использовано при параллельной реализации.

Далее вычисляются матрицы $a_i = Y^TA^iX \in \mathbb{F}_2^{n_b\times m_b} \forall\, i=0...L$ , где $L = \frac{n}{n_b} + \frac{n}{m_b} + \Delta$ , где $\Delta$ - небольшое натуральное число, например, 10. С помощью этих матриц определяем полином $a(x) = \sum_{i=0}^La_ix^i$

Определение Степенью матричного полинома назовём степень полинома максимальной степени.

Однако на практике оказывается более важным смотреть на формальную степень. Работая с ними можно использовать следующие правила: 1) Формальная степень суммы полиномов равна максимуму из формальных степеней каждого слагаемого; 2) Умножение полинома на одночлен увеличивает его формальную степень на 1. Таким образом, построенный на шаге 1 полином является формальной степени L.

Шаг 2. Построим матричный полином $f(x) = \sum_{i=0}^Df_ix^i$ формальной степени D с матричными коэффициентами $f_i\in\mathbb{F}_2^{m_b\times(m_b + n_b)}$ , для которого выполняются следующие условия:

Справедливо полиномиальное соотношение $a(x)f(x) = g(x) + e(x)x^M$ , где $g(x)$ и $e(x)$ - матричные полиномы;
Степень матричного полинома $g$ не превосходит $D$ ;
$M$ и $D$ удовлетворяют соотношению $M - D - 1 \gt \frac{n}{n_b}$

(Метод построения матричного полинома $f(x)$ изложим ниже)

Т.к. $deg(g) \leq D$ , то матричные коэффициенты при степенях, больших D, равны 0. Следовательно, матричные коэффициенты a(x) и f(x) удовлетворяют системе:

$\sum\limits_{k=0}^D a_{i + k + 1}f_{D-k} = 0, \; \forall i=\overline{0, M-D-2}$ , что эквивалентно, при подстановке $a_{i+k+1}$ , следующему уравнению:

$Y^T A^i A\underbrace{\left(\sum\limits_{k=0}^D (A^{k} X) f_{D - k}\right)}_{W} = 0, \; \forall i = \overline{0, M - D - 2}$

Таким образом, W удовлетворяет условиям А-ортагональности со всеми блоками векторов вида $Y, A^TY, (A^T)^2Y... (A^T)^{M - D - 2}Y$ . Далее возможно два варианта:

1) Если линейная оболочка блоков вышеперечисленных векторов совпала со всем пространством $\mathbb{F}_2^n$ , то выбором n линейно независимых столбцов и составлением невырожденной матрицы $\hat{Y}$ получили бы следующее равенство: $\hat{Y}AW = 0$ . Домножив на обратную, получим $AW = 0$ и если $W \neq 0$ , то задача решена.

2)Оболочка блоков не охватила всего пространства, тогда можно вероятностно оценить, что: Т.к. $M - D - 1 \gt \frac{n}{n_b}$ , то почти наверняка размерность линейной оболочки $(A^T)^iY, \; \forall i=\overline{0,M-D-2}$ близка к n. Этого достаточно, чтобы утверждать, что задача решена. (Для деталей см. ^[3])

1.2.3 Метод построения матричного полинома

Копперсмит предложил итерационную процедуру:

Инициализация: $M := 0,\; f(x) := [I_{m_b}\; 0],\; e(x) := [a(x)\; I_{n_b}],\; \delta_j = 0$ , где j -- номер столбца $f(x), \delta_j$ -- формальная степень;
Итерация:
1. Вычислить $e_0 = e(0)$ ;
2. Найти P: $e_0P = [0\; F_{n_b}]$ , причём преобразование P должно быть допустимым;
3. Вычислить $e:=\frac{eP(x)}{x}, \; f:=fP(x)$ , где $P(x) = P \begin{pmatrix}I_{m_b} & 0\\ 0 & xI_{n_b}\end{pmatrix}$ ;
4. $M:=M+1$
5. $\delta_{j_k}:= \delta_{j_k} + 1$ для тех столбцов, которые были умножены на x;
6. Вычислить формальную степень D матричного полинома f(x);
Останов Проверить критерий останова: $M - D \gt \frac{n}{n_b} + \Delta$ . Если выполнен, то остановиться, нет - продолжить.

Сколько всего потребуется итераций? Если $m_b = n_b$ , то будет выполнена оценка $s \approx 2\left(\frac{n}{n_b} + 1\right)$ . Если же брать $m_b = 2n_b$ , как советовал Копперсмит, то $s \approx \frac{3}{2}\left(\frac{n}{n_b} + 1\right)$ (Более подробный анализ см. в ^[4] ). С точки зрения вероятностной устойчивости и скорости логичнее использовать второй случай, однако, как показывал опыт, и исходя из указаний Копперсмита (глава 5 ^[5]), для практического применения подходит первый случай.

1.3 Вычислительное ядро алгоритма

1.4 Макроструктура алгоритма

1.5 Схема реализации последовательного алгоритма

1.6 Последовательная сложность алгоритма

1.7 Информационный граф

1.8 Ресурс параллелизма алгоритма

1.9 Входные и выходные данные алгоритма

1.10 Свойства алгоритма

2 Программная реализация алгоритма

2.1 Особенности реализации последовательного алгоритма

2.2 Локальность данных и вычислений

2.3 Возможные способы и особенности параллельной реализации алгоритма

2.4 Масштабируемость алгоритма и его реализации

2.5 Динамические характеристики и эффективность реализации алгоритма

2.6 Выводы для классов архитектур

2.7 Существующие реализации алгоритма

3 Литература

↑ Wiedemann D.H. Solving sparce linear equations over finite fields (англ.). — 1986. — Январь (т. 32, № 1). — С. 54—62.
↑ Замарашкин, Николай Леонидович. Алгоритмы для разряженных систем линейных уравнений в GF(2) [Текст] : учебное пособие для студентов высших учебных заведений, обучающихся по направлениям ВПО 010400 "Прикладная математика и информатика" и 010300 "Фундаментальная информатика и информационные технологии" / Н. Л. Замарашкин ; Московский гос. ун-т им. М. В. Ломоносова. - Москва : Изд-во Московского ун-та, 2013. - 128, [2] с. : ил., табл.; 21 см. - (Серия: Суперкомпьютерное образование / Суперкомпьютерный консорциум ун-тов России).; ISBN 978-5-211-06483-6
↑ Don Coppersmith. 1994. Solving homogeneous linear equations over GF(2) via block Wiedemann algorithm. Math. Comput. 62, 205 (January 1994), 333-350. DOI=10.2307/2153413 http://dx.doi.org/10.2307/2153413
↑ Замарашкин, Николай Леонидович. Алгоритмы для разряженных систем линейных уравнений в GF(2) [Текст] : учебное пособие для студентов высших учебных заведений, обучающихся по направлениям ВПО 010400 "Прикладная математика и информатика" и 010300 "Фундаментальная информатика и информационные технологии" / Н. Л. Замарашкин ; Московский гос. ун-т им. М. В. Ломоносова. - Москва : Изд-во Московского ун-та, 2013. - 128, [2] с. : ил., табл.; 21 см. - (Серия: Суперкомпьютерное образование / Суперкомпьютерный консорциум ун-тов России).; ISBN 978-5-211-06483-6
↑ Don Coppersmith. 1994. Solving homogeneous linear equations over GF(2) via block Wiedemann algorithm. Math. Comput. 62, 205 (January 1994), 333-350. DOI=10.2307/2153413 http://dx.doi.org/10.2307/2153413

[1] Wiedemann D.H. Solving sparce linear equations over finite fields (англ.). — 1986. — Январь (т. 32, № 1). — С. 54—62.

[2] Замарашкин, Николай Леонидович. Алгоритмы для разряженных систем линейных уравнений в GF(2) [Текст] : учебное пособие для студентов высших учебных заведений, обучающихся по направлениям ВПО 010400 "Прикладная математика и информатика" и 010300 "Фундаментальная информатика и информационные технологии" / Н. Л. Замарашкин ; Московский гос. ун-т им. М. В. Ломоносова. - Москва : Изд-во Московского ун-та, 2013. - 128, [2] с. : ил., табл.; 21 см. - (Серия: Суперкомпьютерное образование / Суперкомпьютерный консорциум ун-тов России).; ISBN 978-5-211-06483-6

[3] Don Coppersmith. 1994. Solving homogeneous linear equations over GF(2) via block Wiedemann algorithm. Math. Comput. 62, 205 (January 1994), 333-350. DOI=10.2307/2153413 http://dx.doi.org/10.2307/2153413

[4] Замарашкин, Николай Леонидович. Алгоритмы для разряженных систем линейных уравнений в GF(2) [Текст] : учебное пособие для студентов высших учебных заведений, обучающихся по направлениям ВПО 010400 "Прикладная математика и информатика" и 010300 "Фундаментальная информатика и информационные технологии" / Н. Л. Замарашкин ; Московский гос. ун-т им. М. В. Ломоносова. - Москва : Изд-во Московского ун-та, 2013. - 128, [2] с. : ил., табл.; 21 см. - (Серия: Суперкомпьютерное образование / Суперкомпьютерный консорциум ун-тов России).; ISBN 978-5-211-06483-6

[5] Don Coppersmith. 1994. Solving homogeneous linear equations over GF(2) via block Wiedemann algorithm. Math. Comput. 62, 205 (January 1994), 333-350. DOI=10.2307/2153413 http://dx.doi.org/10.2307/2153413

[1]

[2]

[3]

[4]

[5]