Участник:BDA/Ортогонализация Грама-Шмидта
Версия от 00:52, 16 октября 2016; Zodiac (обсуждение | вклад) (→Входные и выходные данные алгоритма)
Ортогонализация Грама-Шмидта | |
Последовательный алгоритм | |
Последовательная сложность | O(nm^2) |
Объём входных данных | nm |
Объём выходных данных | nm |
Параллельный алгоритм | |
Высота ярусно-параллельной формы | ? |
Ширина ярусно-параллельной формы | ? |
Основные авторы описания: Белов Н. А., Богомолов Д. А..
Содержание
- 1 Свойства и структура алгоритма
- 1.1 Общее описание алгоритма
- 1.2 Математическое описание алгоритма
- 1.3 Вычислительное ядро алгоритма
- 1.4 Макроструктура алгоритма
- 1.5 Схема реализации последовательного алгоритма
- 1.6 Последовательная сложность алгоритма
- 1.7 Информационный граф
- 1.8 Ресурс параллелизма алгоритма
- 1.9 Входные и выходные данные алгоритма
- 1.10 Свойства алгоритма
- 2 Программная реализация алгоритма
- 2.1 Особенности реализации последовательного алгоритма
- 2.2 Локальность данных и вычислений
- 2.3 Возможные способы и особенности параллельной реализации алгоритма
- 2.4 Масштабируемость алгоритма и его реализации
- 2.5 Динамические характеристики и эффективность реализации алгоритма
- 2.6 Выводы для классов архитектур
- 2.7 Существующие реализации алгоритма
- 3 Литература
1 Свойства и структура алгоритма
1.1 Общее описание алгоритма
1.2 Математическое описание алгоритма
1.3 Вычислительное ядро алгоритма
Основное время работы алгоритма приходится на вычисление сумм \sum_{i=1}^{j-1} \mathbf{proj}_{\mathbf{b}_i} \mathbf{a}_i \forall j: j=\overline{1, m}.
1.4 Макроструктура алгоритма
1.5 Схема реализации последовательного алгоритма
1.6 Последовательная сложность алгоритма
Рассмотрим n векторов длины m.
- Скалярное произведение векторов требует n - 1 сложение и n произведений.
- Нормализация вектора требует 1 скалярного произведения, 1 вычисления квадратного корня и n делений, то есть:
- n-1 (+);
- n (\times);
- n (\div);
- 1 (\sqrt{}).
- Вычитание проекции вектора требует 1 скалярного произведения, n сложений и n умножений, то есть:
- 2n-1 (+);
- 2n (\times).
- Вычисление i-го вектора требует i-1 вычитаний проекций с нормализацией, то есть:
- (2n-1)(i-1)+n-1 (+);
- 2n(i-1)+n (\times);
- n (\div);
- 1 (\sqrt{}).
- Мы вычисляем вектора от i=1 до m, поэтому i-1 множителей выражаются треугольным числом (m-1)\frac{m}{2}, а элементы независимых i умножаются на m.
- (2n-1)(m-1)\frac{m}{2}+(n-1)m (+);
- 2n(m-1)\frac{m}{2}+nm (\times);
- nm (\div);
- m (\sqrt{}).
- В скалярном произведении n делений могут быть рассмотрены как n умножений:
- (2n-1)(m-1)\frac{m}{2}+(n-1)m (+);
- 2n(m-1)\frac{m}{2}+2nm (\times);
- m (\div);
- m (\sqrt{}).
Таким образом, требуется 2nm^2 операций. Сложность алгоритма O(nm^2).
1.7 Информационный граф
1.8 Ресурс параллелизма алгоритма
1.9 Входные и выходные данные алгоритма
Входные данные. Матрица A с элементами \alpha_{ij}, где i = \overline{1, n} (размерность пространства) и j = \overline{1, m} (количество линейно-независимых векторов), при этом n \leqslant m.
Объем входных данных. nm
Выходные данные. Матрица B с элементами \beta_{ij}, где i = \overline{1, n} и j = \overline{1, m}, тогда b_{i1}, \dots, b_{im} — система ортогональных векторов.
Объем выходных данных. nm
1.10 Свойства алгоритма
2 Программная реализация алгоритма
2.1 Особенности реализации последовательного алгоритма
2.2 Локальность данных и вычислений
2.3 Возможные способы и особенности параллельной реализации алгоритма
2.4 Масштабируемость алгоритма и его реализации
Срок сдачи продлен до 15 ноября.