Участник:Nikita270a: различия между версиями

Текущая версия на 01:14, 18 октября 2016

Алгоритм Ланцоша с полной переортогонализацией
Последовательный алгоритм
Последовательная сложность	$O(n^2)+O(nk^2)$
Объём входных данных	$\frac{n(n + 1)}{2}$
Объём выходных данных	$k(n + 1)$

Авторы: Алексейчук Н.Н 616, Ястребов К.С. 609.

1 Общее описание алгоритма.

Алгоритм Ланцоша ищет собвственные значения и собственные векторы для симетричной матрицы A вещественных чисел. Является итерацонным алгоритмом. Алгоритм Ланцоша использует степенной метод ( $b_{k+1} = \frac{Ab_k}{||Ab_k||}$ ) для поиска наибольших собственных значений и векторов матриц.

В отличие от прямых алгоритмов требует мешьше памяти и мощности, что является несомненным плюсом для больших матриц.

Несмотря на свою скорость работы и экономию памяти, сначала не был популярным алгоритмом из – за недостаточной вычислительной устойчивости. В 1970 году Ojalvo и Newman [1] показали способ сделать алгоритм достаточно устойчивым. В этой же статье алгоритм был применен к расчету инженерной конструкции с большим количеством узлов, которые подвергались динамической нагрузке.

2 Математическое описание алгоритма

Памятка: Степенной метод нахождения наибольшего собственного числа матрицы можно сформулировать в предельном виде: если $b_0$ – случайный вектор, и $b_n+1 = Ab_n$ , тогда для больших чисел n предел $x_n/||x_n||$ стремится к нормированному наибольшему собственному вектору.

Алгоритм Ланцоша комбинирует метод Ланцоша для нахождения крыловского подпространства и метод Релэя – Ритца.

Подпространство Крылова для степенного метода: $K_m(v,A) = span[x_1, Ax_1, A^2x_1, ..., A^{k-1}x_1]$

В качестве входных данных для алгоритма Ланцоша подаются квадратная матрица размерности $n$ X $n$ : $A=A^T$ ; а так же вектор начального приближения $b$ .

Метод осуществляет поиск трехдиагональной симметричной матрицы $T_k=Q_k^TAQ_k$ . Причем собственные значения $T_k$ таковы, что приближают собственные значения исходной матрицы $A$ . То есть на каждом $k$ -м шаге из ортонормированных векторов Ланцоша строится матрица $Q_k = [q_1,q_2,...,q_k]$ и в качестве приближенных собственных значений матрицы $A$ принимаются числа Ритца.

Из-за ошибок округления вектора $A^{k-1}x_1$ , формирующие подпространство Крылова, становятся неортогональными. Чтобы решить данную прорблему, проводят переортогонализацию методом Грамма-Шмидта.

3 Вычислительное ядро алгоритма

Вычислительным ядром данного алгоритма являются следующие шаги:

1. $Aq=( \sum\nolimits_{i=^n}a_{1i}q_i, \sum\nolimits_{i=2}^na_{2i}q_i, ..., \sum\nolimits_{i=1}^na_{ni}q_i)$ .

2. $z=z-\sum\nolimits_{i=1}^{k}(z^Tq_i)q_i.$

В данном случае первая операция выполняет умножение симметричной матрицы $A$ размерности $n$ X $n$ на $n$ -мерный вектор $q$ , вследствие чего вычислительная сложность выполнения заключается в $n^2$ умножений и $n^2-n$ сложений. Второе действие является процессом ортогонализации Грама-Шмидта. В последнем действии вычисляются $k^2n+k(n+2)$ умножений и $k^2n + k(n + 1) + 2$ операций сложения.

4 Макроструктура алгоритма

1. Скалярное произведение: $(x,y)$ .

2. Суммирование: $x+\alpha y$ .

5 Схема

Input: A, b (random vector with unit norm)

$\begin{align} q_1 = b/||b||_2, \beta_0 = 0, q_0 = 0 \\ j = 1 ,...,k \\ q_1&=b/||b||,\beta_0=0,q_o=0. \\ z&=Aq_j, \\ \alpha_j&=q_j^Tz, \\ z&=z-\alpha_jq_j-\beta_{j-1}q_{j-1}, \\ \beta&=||z||,\\ q_{j+1}&=z/\beta_j, \quad j \in [1, k]. \end{align}$

6 Вычислительная сложность

Количество операций складывается из количества операций для классического метода Ланцоша[2] и и количества операций для переортогонализации методом грамма-Шмидта[3].

Итоговая сложность составляет $O(n^2)+O(nk^2)$ .

7 Информационный граф

8 Входные и выходные данные

На вход принимается сама матрица $A \in R^{n \times n}$ , случайный вектор $b$ (впрочем возможен вариант, при котором этот вектор генерируется случайным образом). Ввиду симметричности входной матрицы достаточно передать лишь ее верхнюю треугольную матрицу, что дает объем входных данных $\frac{n(n + 1)}{2}$ .

Выходными данными для $j$ ой итерации являются вектор $Aq_j$ и собственное число $\lambda$ . Общий объем выходных данных $k(n+1)$ .

9 Свойства алгоритма

Если $A$ эрмитова матрица, то алгоритм Ланцоша и Bi-Lanczos сходятся к одинаковым трехдиагональным матрицам ритца[4].

При реализации классического алгоритма Ланцоша возникает большая погрешность при округлении. Вариант с полной переортогонализацией позволяет избегать больших погрешностей, однако является более ресурсоемким. Существует промежуточный вариант с частичной переортогонализацией.

Алгоритм может завершить свою работу досрочно, когда найденные собственные значения будут достаточно близки к целевым.

10 Реусурс параллелизма алгоритма

Хотя алгоритм является итерационным, возможно распараллелить внутри каждой итерации умножение матрицы на вектор и процесс переортогонализации Грамма-Шмидта.

Процесс умножения матриц matvec можно распараллелить несколькими способами[5].

11 Библиотеки реализующие алгоритм

The IETL Project http://www.comp-phys.org/software/ietl/ C++

NAG Library http://www.nag.com/content/nag-library C, C++, Fortran, C#, MATLAB, R

ARPACK https://people.sc.fsu.edu/~jburkardt/m_src/arpack/arpack.html MATLAB

GrapLab https://turi.com/products/create/open_source.html C++

С частичной переортаганализацией

LANSO/PLANSO http://web.cs.ucdavis.edu/~bai/ET/lanczos_methods/overview_PLANSO.html Fortran (уже распараллелена)

12 Литература

Ojalvo, I.U. and Newman, M., "Vibration modes of large structures by an automatic matrix-reduction method", AIAA J., 8 (7), 1234–1239 (1970).

@@ Строка 1: / Строка 1: @@
 {{algorithm
 | name              = Алгоритм Ланцоша с полной переортогонализацией
-| serial_complexity = <math>O(n^2)</math>
+| serial_complexity = <math>O(n^2)+O(nk^2) </math>
-| pf_height         = <math>O(k)</math>
-| pf_width          = <math>O(n^2)</math>
 | input_data        = <math>\frac{n(n + 1)}{2}</math>
 | output_data       = <math>k(n + 1)</math>
@@ Строка 17: / Строка 15: @@
 В отличие от прямых алгоритмов требует мешьше памяти и мощности, что является несомненным плюсом для больших матриц.
-Несмотря на свою скорость работы и экономию памяти, сначала не был популярным алгоритмом из – за недостаточной вычислительной устойчивости. В 1970 году Ojalvo и Newman показали способ сделать алгоритм достаточно устойчивым. В этой же статье алгоритм был применен к расчету инженерной конструкции с большим количеством узлов, которые подвергались динамической нагрузке.
+Несмотря на свою скорость работы и экономию памяти, сначала не был популярным алгоритмом из – за недостаточной вычислительной устойчивости. В 1970 году Ojalvo и Newman [http://arc.aiaa.org/doi/abs/10.2514/3.5878?journalCode=aiaaj] показали способ сделать алгоритм достаточно устойчивым. В этой же статье алгоритм был применен к расчету инженерной конструкции с большим количеством узлов, которые подвергались динамической нагрузке.
@@ Строка 33: / Строка 31: @@
 Метод осуществляет поиск трехдиагональной симметричной матрицы <math>T_k=Q_k^TAQ_k</math>. Причем собственные значения <math>T_k</math> таковы, что приближают собственные значения исходной матрицы <math>A</math>. То есть на каждом <math>k</math>-м шаге из ортонормированных векторов Ланцоша строится матрица <math>Q_k = [q_1,q_2,...,q_k]</math> и в качестве приближенных собственных значений матрицы <math>A</math> принимаются числа Ритца.
+Из-за ошибок округления вектора <math> A^{k-1}x_1 </math>, формирующие подпространство Крылова, становятся неортогональными. Чтобы решить данную прорблему, проводят переортогонализацию методом Грамма-Шмидта.
 == Вычислительное ядро алгоритма ==
@@ Строка 42: / Строка 42: @@
 В данном случае первая операция выполняет умножение симметричной матрицы <math>A</math> размерности <math>n</math>X<math>n</math> на <math>n</math>-мерный вектор <math>q</math>, вследствие чего вычислительная сложность выполнения заключается в <math>n^2</math> умножений и <math>n^2-n</math> сложений. Второе действие является процессом ортогонализации Грама-Шмидта. В последнем действии вычисляются <math>k^2n+k(n+2)</math> умножений и <math>k^2n + k(n + 1) + 2</math> операций сложения.
+== Макроструктура алгоритма ==
+*1. Скалярное произведение: <math> (x,y) </math>.
+*2. Суммирование:  <math> x+\alpha y </math>.
 == Схема ==
@@ Строка 62: / Строка 68: @@
 </math>
+==Вычислительная сложность==
+Количество операций складывается из количества операций для классического метода Ланцоша[https://books.google.ru/books?id=T8EPBwAAQBAJ&pg=PA242&lpg=PA242&dq=lanczos+algorithm+complexity&source=bl&ots=kWVnVP_uJp&sig=a-4GTEt6vRE8YhR1R6dOPwvOSIk&hl=en&sa=X&ved=0ahUKEwiQ2u3U4-LPAhWvbZoKHe0QBaw4ChDoAQg7MAY#v=onepage&q=lanczos%20algorithm%20complexity&f=false] и и количества операций для переортогонализации методом грамма-Шмидта[http://stackoverflow.com/questions/27986225/computational-complexity-of-gram-schmidt-orthogonalization-algorithm].
+Итоговая сложность составляет <math>O(n^2)+O(nk^2) </math>.
 == Информационный граф ==
 [[Файл:Graph.jpg]]
+== Входные и выходные данные==
+На вход принимается сама матрица <math> A \in R^{n \times n}</math>, случайный вектор <math>b</math> (впрочем возможен вариант, при котором этот вектор генерируется случайным образом).
+Ввиду симметричности входной матрицы достаточно передать лишь ее верхнюю треугольную матрицу, что дает объем входных данных <math>\frac{n(n + 1)}{2}</math>.
+Выходными данными для <math>j</math>ой итерации являются вектор <math> Aq_j </math> и собственное число <math> \lambda </math>. Общий объем выходных данных <math>k(n+1)</math>.
+==Свойства алгоритма==
+Если <math>A</math> эрмитова матрица, то алгоритм Ланцоша и Bi-Lanczos сходятся к одинаковым трехдиагональным матрицам ритца[http://ta.twi.tudelft.nl/nw/users/vuik/papers/DUT-TWI-96-44.pdf].
+При реализации классического алгоритма Ланцоша возникает большая погрешность при округлении. Вариант с полной переортогонализацией позволяет избегать больших погрешностей, однако является более ресурсоемким. Существует промежуточный вариант с частичной переортогонализацией.
+Алгоритм может завершить свою работу досрочно, когда найденные собственные значения будут достаточно близки к целевым.
+==Реусурс параллелизма алгоритма==
+Хотя алгоритм является итерационным, возможно распараллелить внутри каждой итерации умножение матрицы на вектор и процесс переортогонализации Грамма-Шмидта.
+Процесс умножения матриц matvec можно распараллелить несколькими способами[https://eprint.iacr.org/2011/416.pdf].
 == Библиотеки реализующие алгоритм==
@@ Строка 77: / Строка 110: @@
 GrapLab https://turi.com/products/create/open_source.html C++
-С частично переортаганализацией
+С частичной переортаганализацией
 LANSO/PLANSO http://web.cs.ucdavis.edu/~bai/ET/lanczos_methods/overview_PLANSO.html Fortran (уже распараллелена)
+== Литература ==
+Ojalvo, I.U. and Newman, M., "Vibration modes of large structures by an automatic matrix-reduction method", AIAA J., 8 (7), 1234–1239 (1970).

Участник:Nikita270a: различия между версиями

Текущая версия на 01:14, 18 октября 2016

Содержание

1 Общее описание алгоритма.

2 Математическое описание алгоритма

3 Вычислительное ядро алгоритма

4 Макроструктура алгоритма

5 Схема

6 Вычислительная сложность

7 Информационный граф

8 Входные и выходные данные

9 Свойства алгоритма

10 Реусурс параллелизма алгоритма

11 Библиотеки реализующие алгоритм

12 Литература

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Хранилище файлов

Инструменты