Уровень алгоритма

Участник:Nikita/Построение матрицы Адамара: различия между версиями

Материал из Алговики
Перейти к навигации Перейти к поиску
Строка 236: Строка 236:
  
 
[https://github.com/snikersman/Hadamard Исследованная параллельная реализация на языке C++]
 
[https://github.com/snikersman/Hadamard Исследованная параллельная реализация на языке C++]
 +
Построим оценки масштабируемости, используя полученные результаты:
 +
*По размерности задачи. Увеличение размерности задачи приводит к увеличению производительности. Причем чем больше используется процессоров, тем сильнее увеличивается производительность при увеличении размерности.
 +
*По числу процессоров. С ростом числа процессоров растет производительность, но при малых размерностях задачи этот рост незначителен. Это связано с дополнительными издержками по
  
 
=== Динамические характеристики и эффективность реализации алгоритма ===
 
=== Динамические характеристики и эффективность реализации алгоритма ===

Версия 23:46, 19 ноября 2016

Symbol wait.svgЭта работа прошла предварительную проверку
Дата последней правки страницы:
19.11.2016
Данная работа соответствует формальным критериям.
Проверено Sleo.



Построение матрицы Адамара
Последовательный алгоритм
Последовательная сложность [math]O(n^2)[/math]
Объём входных данных [math]1[/math]
Объём выходных данных [math]n^2[/math]
Параллельный алгоритм
Высота ярусно-параллельной формы [math]O(1)[/math]
Ширина ярусно-параллельной формы [math]O(n^2)[/math]


Авторы статьи: Иванов Н.В. (1.1,1.7,1.9,1.10,2.7), Цыганов Н.И. (1.2,1.3,1.4,1.5,1.6,1.7,1.8).

1 Свойства и структура алгоритма

1.1 Общее описание алгоритма

Матрицы Адамара были введены в математический обиход в конце прошлого века и играют важную роль в алгебре и комбинаторике. Они находят широкое применение в теории кодирования (коды, исправляющие ошибки), теории планирования многофакторных экспериментов (блок-схемы) и других областях математики.[1] Сравнительно недавно (в 1960 г.) было замечено, что эти матрицы могут быть использованы для построения кодов с большим кодовым расстоянием.

Матрицей Адамара порядка n называется [math]n*n[/math] матрица [math]H[/math], элементами которой являются +1 и −1 такая, что [math]H H^T = n E_n[/math], где [math]E_n[/math] - единичная матрица размера n.

Матрица Адамара обладает следующими свойствами:

  • Различные строки матрицы ортогональны
  • Скалярное произведение любой строки саму на себя равно n
  • Умножение любой строки или столбца на -1 переводит H в другую матрицу Адамара
  • Если все элементы первой строки и первого столбца равны +1, то матрица Адамара называется нормализованной

Ниже показаны примеры нормализованных матриц Адамара порядка 1,2 и 4, причем нормализованность матриц сохраняется при перестановке любых строк и столбцов, кроме первых:

[math]H_1 = (1)[/math] [math], H_2 = \begin{pmatrix} 1 & 1\\ 1 & -1\end{pmatrix} [/math], [math], H_4 = \begin{pmatrix} 1 & 1 & 1 & 1\\ 1 & -1 & 1 & -1\\ 1 & 1 & -1 & -1\\ 1 & -1 & -1 & 1\end{pmatrix} [/math]


Предполагается, что существуют матрицы Адамара порядка 1, 2 и всех порядков n, кратных 4, хотя это до сих пор еще не было доказано. Нет универсального алгоритма построения матрицы Адамара произвольного размера, но известно большое число методов для различных частных случаев, и наименьший порядок, для которого матрица Адамара еще не построена, равен 268 (на 1977 г.). [2] Мы приведем метод построения Пейли, который важен для теории кодирования.

1.1.1 Метод Пейли

Это построение дает матрицы Адамара любого порядка [math]n=p+1[/math], кратного 4, где p-простое число.

Определение. Пусть p-простое число. Ненулевые квадраты чисел, приведенные по модулю p, называются квадратичными вычетами по модулю p или просто вычетами по модулю p.

Функция [math]X(i)[/math], называемая символом Лежандра, определяется на целых числах следующим образом:

  • [math]X(i)=0[/math], если i кратно p;
  • [math]X(i)=1[/math], если остаток от деления i на p является квадратным вычетом по модулю p;
  • [math]X(i)=-1[/math], если остаток от деления i на p является невычетом.


Теперь мы построим матрицу Джекобстола [math]Q=(q_{ij})[/math]. Она представляет собой [math](p*p)[/math]-матрицу, строки и столбцы которой пронумерованы числами 0,1,..., p-1, а элементы [math]q_{ij}=X(j-i)[/math].

Пусть теперь [math] H = \begin{pmatrix} 1 & 1\\ 1^T & Q-I\end{pmatrix} [/math].

Доказано, что такая матрица [math]H[/math] представляет собой нормализованную матрицу Адамара порядка p+1, которую называют матрицей типа Пейли.[3]

1.2 Математическое описание алгоритма

Исходные данные - это порядок генерируемой матрицы Адамара [math]n[/math], удовлетворяющее следующим свойствам:

  • [math]n\gt 0[/math];
  • [math]n[/math] делится на 4;
  • [math]n-1[/math] - простое число.

Вспомогательные данные:

  • Число [math]p=n-1[/math];
  • Вектор квадратичных вычетов (по модулю [math]p[/math]) [math]R[/math] (элементы [math]r_i[/math]) размера [math]2p[/math]. В этом векторе индексация идёт с нуля.

Вычисляемые данные:

  • Матрица Адамара [math]H[/math] (элементы [math]h_{ij}[/math]) размера [math]n \times n[/math]. Индексация строчек и столбцов идёт с нуля.

Алгоритм:

1. Строится вектор квадратичных вычетов [math]R[/math].
Первые [math]p[/math] элементов вектора [math]R[/math] ([math]i=0,1,...,p-1[/math]) определяются следующим образом:
[math]r_i=1[/math], если [math]i \in \{1^2[/math] [math]mod[/math] [math]p, 2^2[/math] [math]mod[/math] [math]p, ... , (\frac{p-1}{2})^2[/math] [math] mod[/math] [math] p\}[/math], [math]i=0,1,...,p-1[/math], то есть если [math]i[/math] является квадратичным вычетом по модулю [math]p[/math];
[math]r_i=-1[/math], иначе.
Вторые [math]p[/math] элементов ([math]i=p,1,...,2p-1[/math]) являются копией первых [math]p[/math] элементов:
[math]r_i=r_{i-p}, i=p,1,...,2p-1.[/math]
2. Строится матрица Адамара [math]H[/math].
Элементы матрицы Адамара [math]H[/math] находятся следующим образом:
[math]h_{0j}=1, j=0,1, ... ,n-1;[/math]
[math]h_{i0}=1, i=1,2, ... ,n-1;[/math]
[math]h_{ij}=r_{j-i+p}, i=1,2, ... ,n-1, j=1,2, ... ,n-1.[/math]

1.3 Вычислительное ядро алгоритма

Вычислительное ядро алгоритма состоит из [math](n-1) \times (n-1)[/math] операций присваивания следующего вида:

[math]h_{ij}=r_{j-i+p},[/math] [math] i=1,2, ... ,n-1, j=1,2, ... ,n-1.[/math]

1.4 Макроструктура алгоритма

Как видно из математического описания, алгоритм основан на простейших операциях с числами, поэтому макроструктура алгоритма полностью соответствует его математическому описанию.

1.5 Схема реализации последовательного алгоритма

Приведем процедуру на языке С++, реализующую описанный алгоритм. На вход процедуре подается порядок матрицы [math]n[/math] и ссылка на заполняемую матрицу [math]result[/math]. Считаем, что [math]n[/math] положительно, делится на [math]4[/math], [math]n-1[/math] - простое число, а размер матрицы [math]result[/math] равен [math]n \times n[/math].

void buildHadamardMatrix(int n, vector<vector<int>> & result)
{
	// 1) Считаем вычеты по модулю p=n-1 и создаем вспомогательный массив вычетов residues
	// Достаточно посчитать значения (1^2 mod p), (2^2 mod p), ... , (((p-1)/2)^2 mod p) - эти значениями и будут являться вычетами.
	// Строим массив residues размера 2*p, в котором первые p элементов заполняются по следующей схеме: 1, если индекс элемента - вычет, -1 - иначе.
	// Вторая половина массива получается дублированием первой половины
	int p=n-1;
	vector<int> residues;
	residues.resize(2*p);
	// Заполняем массив
	for (int i=0; i<p; i++) {
		residue[i] = -1;
	}
	for (int i=1; i<= (p-1)/2; i++) {
		residue[i^2 % p] = 1;
	}
	for (int i=p; i<2*p; i++) {
		residue[i] = residue[i-p];
	}

	// 2) Построение матрицы Адамара
	// Заполнение первой строки 1-цами
	for (int j=0; j<n; j++) {
		result[0][j] = 1;
	}
	// Заполнение первого столбца 1-цами
	for (int i=1; i<n; i++) {
		result[i][0] = 1;
	}
	// Заполнение оставшейся части матрицы с использованием вспомогательного массива вычетов residues
	for (int i=1; i<n; i++) {
		for (int j=1; j<n; j++) {
			result[i][j] = residues[j-i+p];
		}
	}
}

1.6 Последовательная сложность алгоритма

Под сложностью будем понимать зависимость числа операций от задаваемого порядка матрицы [math]n[/math].

Основными операциями алгоритма являются:

  • [math]\frac{n}{2}-2[/math] операций умножения;
  • [math]\frac{n}{2}-2[/math] операций взятия остатка;
  • [math]n^2+\frac{5}{2}n-3[/math] операций присваивания.

Из чего следует, что алгоритм имеет квадратичную последовательную сложность.

1.7 Информационный граф

Информационный граф алгоритма можно представить в виде четырёх последовательных блоков. Первый блок содержит [math]n-1[/math] параллельных ветвей, второй блок - [math]\frac{n}{2}-1[/math] параллельных ветвей, третий - [math]n-1[/math] и четвёртый - [math]n^2[/math].

I graph2.png

Каждая вершина из [math]A_1-A_{n-1}[/math], [math]C_1-C_{n-1}[/math], [math]D_1-D_{n^2}[/math] соответствует операции присваивания, каждая вершина из [math]B_1-B_{\frac{n}{2}-1}[/math] соответствует трём последовательным операциям: умножения, взятия остатка по модулю и присваивания, а вершины, окрашенные серым, представляют собой промежуточные точки синхронизации.

1.8 Ресурс параллелизма алгоритма

Как видно из информационного графа алгоритма, в параллельном варианте необходимо последовательно выполнить следующие блоки:

  • [math]n-1[/math] операций присваивания;
  • [math]\frac{n}{2}-1[/math] участков, состоящих из трёх операций: умножения, взятия остатка и присваивания;
  • [math]n-1[/math] операций присваивания;
  • [math]n^2[/math] операций присваивания.

Из этого можно сделать вывод, что высота ярусно-параллельной формы информационного графа равняется 6 (присваивание, умножение, взятие остатка, присваивание, присваивание, присваивание). Ширина ярусно-параллельной формы равняется [math]n^2[/math], что означает, что при использовании [math]n^2[/math] процессоров матрица Адамара будет строиться за 6 операций.

1.9 Входные и выходные данные алгоритма

Входные данные: число [math]n[/math] - порядок матрицы Адамара [math]H_n[/math]. Дополнительные ограничения на [math]n[/math]:

  • [math]n[/math] - натуральное;
  • [math]n[/math] делится на 4;
  • [math]n-1[/math] - простое.

Объем входных данных: 1 (число [math]n[/math]).

Выходные данные: построенная матрица Адамара [math]H_n[/math] (её элементы [math]h_{ij}[/math]).

Объем выходных данных: [math]n^2[/math] (количество элементов матрицы Адамара размера [math]n*n[/math]).

1.10 Свойства алгоритма

Соотношение последовательной и параллельной сложности в случае неограниченных ресурсов является квадратичным.

Вычислительная мощность алгоритма является постоянной ([math]O(1)[/math]).

Алгоритм является полностью детерминированным.

Для вершин [math]A_1-A_{n-1}[/math], [math]B_1-B_{\frac{n}{2}-1}[/math], [math]C_1-C_{n-1}[/math] информационного графа степени исхода являются линейными, что означает, что при возможности на этапе реализации необходимо позаботиться об эффективном доступе к элементам массива "[math]residues[/math]".

2 Программная реализация алгоритма

2.1 Особенности реализации последовательного алгоритма

2.2 Локальность данных и вычислений

2.3 Возможные способы и особенности параллельной реализации алгоритма

2.4 Масштабируемость алгоритма и его реализации

Исследование масштабируемости параллельной реализации алгоритма построения матрицы Адамара проводилось на суперкомпьютере «Ломоносов». Для этого была исследована собственная реализация алгоритма с использованием средств MPI. В ходе исследования было произведено множество запусков программы с различными значениями параметра [math]n[/math] (размер матрицы Адамара) и числом процессоров.

Набор и границы значений изменяемых параметров запуска реализации алгоритма:

  • число процессоров (p): [2,64] с шагом 2;
  • размер матрицы: простые числа в диапазоне [4,10000].

В результате проведённых экспериментов был получен следующий диапазон эффективности реализации алгоритма:

  • минимальная эффективность реализации 0.0000029% при n=4, p=2;
  • максимальная эффективность реализации 0.323409% при n=908, p=2.

Ниже представлены графики времени работы, производительности и эффективности данной реализации алгоритма построения матрицы Адамара в зависимости от изменяемых параметров запуска.

Время работы параллельного алгоритма в зависимости от размерности системы и числа процессоров.
Изменение производительности параллельного алгоритма в зависимости от размерности системы и числа процессоров.
Эффективность работы параллельного алгоритма в зависимости от размерности системы и числа процессоров.


Исследованная параллельная реализация на языке C++ Построим оценки масштабируемости, используя полученные результаты:

  • По размерности задачи. Увеличение размерности задачи приводит к увеличению производительности. Причем чем больше используется процессоров, тем сильнее увеличивается производительность при увеличении размерности.
  • По числу процессоров. С ростом числа процессоров растет производительность, но при малых размерностях задачи этот рост незначителен. Это связано с дополнительными издержками по

2.5 Динамические характеристики и эффективность реализации алгоритма

2.6 Выводы для классов архитектур

2.7 Существующие реализации алгоритма

Алгоритм построения матрицы Адамара реализован в различных математических пакетах и библиотеках:

3 Литература

  1. http://cyberleninka.ru/article/n/matritsy-adamara-nechetnogo-poryadka.pdf
  2. Мак-Вильямс Ф. Дж., Слоэн Н. Дж. А. Теория кодов, исправляющих ошибки: Пер. с англ. — М: Связь, 1979. — c. 52-57
  3. http://tc.nsu.ru/uploads/codingtheory.pdf