Алгоритм Ланцоша для точной арифметики (без переортогонализации): различия между версиями

[непроверенная версия]

[выверенная версия]

@@ Строка 1: / Строка 1: @@
-{{algorithm
-| name              = Алгоритм Ланцоша без переортогонализации
-| serial_complexity = <math>O(kn^2)</math>
-| pf_height         = <math>O(k \log{n})</math>
-| pf_width          = <math>O(n^2)</math>
-| input_data        = <math>\frac{n(n + 1)}{2}</math>
-| output_data       = <math>k(n + 1)</math>
-}}
-Основные авторы описания: [[Участник:KAKTUZ|А.Ю.Заспа]] ([[#Описание локальности данных и вычислений|раздел 2.2]]), [[Участник:A.Freeman| А.А.Фролов]]
-== Свойства и структура алгоритма ==
-=== Общее описание алгоритма ===
-'''Алгоритм Ланцоша''' был опубликовн физиком и математиком Корнелием Ланцощем в 1950 году. Этот метод является частным случаем алгоритма Арнольда в случае, если исходная матрица <math>A</math> - симметрична, и был представлен как итерационный метод вычисления собственных значений симметричной матрицы. Этот метод позволяет за <math>k</math> итераций вычислять <math>k</math> приближений собственных значений и собственных векторов исходной матрицы. Хотя алгоритм и был эффективным в вычислительном смысле, но он на некоторое время был предан забвению из-за численной неустойчивости. Только в 1970 Ojalvo и Newman модифицировали алгоритм для использования в арифметике с плавающей точкой. Новый метод получил название [[Алгоритм Ланцоша с полной переортогонализацией | алгоритма Ланцоша с полной переортогонализацией]]. Но эта статья про его исходную версию.
-На вход алгоритма подается вещественная симметричная матрица  <math>A = A^{T}</math>,
-{{Шаблон:ASymmetric}}
-Поэтому достаточно хранить только чуть больше половины элементов исходной матрицы.
-Сам алгоритм соединяет в себя метод Ланцоша построения крыловского подпространства с процедурой Релея-Ритца. На каждой итерации строится матрица <math>Q_k = [q_1, q_2, \dots, q_k]</math> размерности <math>n \times k</math>, состоящая из ортонормированных векторов Ланцоша. А в качестве приближенных собственных значений берутся числа Ритца, т.е. собственные значения симметричной трехдиагональной матрицы <math>T_k = Q^T_k A Q</math> размерности <math>k \times k</math>.
-:<math>
-T_k = \begin{pmatrix}
-\alpha_1 & \beta_1 \\
-\beta_1 & \alpha_2 & \beta_2 \\
-& \beta_2 & \ddots & \ddots \\
-& & \ddots & \ddots & \beta_{k-1} \\
-& & & \beta_{k-1} & \alpha_k
-\end{pmatrix}
-</math>
-Нахождение собственных значений и собственных векторов такой матрицы значительно проще чем их вычисление для исходной матрицы. Например, они могут быть вычислены с помощью [[Метод «разделяй и властвуй» вычисления собственных значений и векторов симметричной трехдиагональной матрицы| метода «разделяй и властвуй» вычисления собственных значений и векторов симметричной трехдиагональной матрицы]]. В этом методе эта процедура занимает <math>O(k^3)</math> операций, где константа оказывается на практике довольно мала.
-=== Математическое описание алгоритма ===
-'''Исходные данные''': симметрическая матрица <math>A</math>, начальный вектор <math>b</math>.
-'''Вычисляемые данные''': собственные вектора матрицы  <math>T_k</math> являющиеся столбцами матрицы <math>Q_k V</math>,  и матрица собственных значений <math>\Lambda</math>, где <math>V, \Lambda</math> из спектрального разложения <math>T_k = V\Lambda V^T</math>.
-Алгоритм на псевдокоде:
-<math>
-\begin{align}
-q_1 = & \frac{b}{\|b\|_2},\; \beta_0 = 0,\; q_0 = 0\\
-for \; & i = 1 \; to \; k \\
-& z = Aq_i\\
-& \alpha_i = q^T_i z\\
-& z = z - \alpha_i q_i - \beta_{i-1}q_{i-1}\\
-& \beta_i = \|z\|_2\\
-& if \; \beta_i == 0 \; then \; break\\
-& q_{i+1} = \frac{z}{\beta_i}\\
-end \; & for
-\end{align}
-</math>
-''Затем вычислить собственные значения и собственные вектора матрицы <math>T_k</math>''
-=== Вычислительное ядро алгоритма ===
-Вычислительным ядром на каждой итерации является вычисление произведения матрицы на вектор:
-:<math>z = Aq_i</math>
-=== Макроструктура алгоритма ===
-Макрооперациями алгоритма являются:
-* умножение матрицы на вектор,
-* скалярное произведение векторов,
-* умножение вектора на число,
-* вычисление собственных векторов и собственных значений трехдиагональной симметричной матрицы.
-=== Схема реализации последовательного алгоритма ===
-Последовательность исполнения метода следующая:
-<math>
-\begin{align}
-. \, \beta_0 = & 0,\; q_0 = 0,\\
-\|b\|_2 = &\sqrt{\sum\limits_{j=1}^{n} b_j^2},\\
-. \, q_{1_{j}} = &\frac{b_{j}}{\|b\|_2}, \; j = 1,\, \dots \,, n\\
-for \; i = & 1 \; to \; k \\
-. \, z_j & = \sum\limits_{m=1}^{n} a_{jm} q_{i_m}, \; j = 1,\, \dots \,, n\\
-. \, \alpha_i & = \sum\limits_{j=1}^{n}q_j z_j\\
-. \, z_j & = z_j - \alpha_i q_{i_j} - \beta_{i-1}q_{i-1_j}, \, j = 1,\, \dots \,, n\\
-. \, \beta_i & = \|z\|_2 = \sqrt{\sum\limits_{j=1}^{n} z_m^2}\\
-if \; \beta_i & == 0 \; then \; break\\
-. \, q_{i+1_j} & = \frac{z_j}{\beta_i}, \; j = 1,\, \dots \,, n\\
-end \; & for
-\end{align}
-</math>
-=== Последовательная сложность алгоритма ===
-Для вычисления <math>k</math> собственных значений матрицы порядка <math>n</math> и соответствующих им собственных векторов алгоритмом Ланцоша без переортогонализации в худшем случае требуется:
-* <math> kn^2 + 4 kn + n </math> умножений,
-* <math> k + 1 </math> вычислений квадратного корня,
-* <math> n(k + 1) </math> делений,
-* <math> n + k(n^2+3n-1)</math> сложений (вычитаний),
-* нахождение собственных значений и векторов трехдиагональной симметричной матрицы размера <math> k \times k </math>.
-Умножения и сложения (вычитания) составляют ''основную часть алгоритма''.
-Для нахождение собственных значений и векторов трехдиагональной симметричной матрицы эффективней всего использовать [[Метод «разделяй и властвуй» вычисления собственных значений и векторов симметричной трехдиагональной матрицы | метод «разделяй и властвуй» вычисления собственных значений и векторов симметричной трехдиагональной матрицы]], который требует <math> O(k^3) </math> операций.
-При классификации по последовательной сложности, таким образом, метод Ланцоша без переортогонализации относится к алгоритмам ''с квадратичной сложностью''.
-=== Информационный граф ===
-TBD
-=== Ресурс параллелизма алгоритма ===
-Алгоритм Ланцоша в параллельной форме состоит из инициализации, <math>k</math> итераций и вычисления собственных значений матрицы <math>T_k</math>, рассмотрение которого выходит за рамки данной статьи.
-Заметим, что вычисление суммы <math>n</math> элементов имеет высоту <math>\log n</math> и линейную ширину ярусов <math>\frac{n}{2}, \frac{n}{4}, ... , 1</math>.
-Инициализации состоит из следующих операций:
-* вычисление нормы:
-** вычисление скалярного произведения вектора самого на себя:
-*** ярус умножений шириной <math>n</math>
-*** <math>\log{n}</math> ярусов сложений с  наибольшей шириной <math>\frac{n}{2}</math>
-** ярус извлечения квадратного корня с единичным вычислением
-* деление вектора на число (нормирование вектора):
-** ярус <math>n</math> операций деления
-Итерационная часть алгоритма состоит из следующих операций:
-* умножение матрицы на число:
-** ярус умножений с шириной <math>n^2</math>
-** <math>\log n</math> ярусов с наибольшей шириной <math>\frac{n^2}{2}</math> (блок вычисления n сумм n элементов)
-* вычисление скалярного произведения двух векторов:
-** ярус умножений шириной <math>n</math>
-** <math>\log{n}</math> ярусов сложений с  наибольшей шириной <math>\frac{n}{2}</math>
-* вычисление линейной комбинации векторов:
-** ярус умножений шириной <math>2n</math>
-** два яруса сложений шириной <math>n</math>
-* вычисление нормы:
-** вычисление скалярного произведения вектора самого на себя:
-*** ярус умножений шириной <math>n</math>
-*** <math>\log{n}</math> ярусов сложений с максимальной шириной <math>\frac{n}{2}</math>
-** ярус извлечения квадратного корня с единичным вычислением
-* проверка на выход из цикла
-* деление вектора на число (нормирование вектора, может отсутствовать на последней итерации):
-** ярус <math>n</math> операций деления
-Таким образом, в параллельном варианте основную долю времени будут занимать операции сложения при умножении матрицы на вектор.
-При классификации по высоте ЯПФ Алгоритм Ланцоша относится к алгоритмам со сложностью <math>O(k \log n)</math>. При классификации по ширине ЯПФ его сложность будет <math>O(n^2)</math>.
-=== Входные и выходные данные алгоритма ===
-TBD
-=== Свойства алгоритма ===
-TBD
-== Программная реализация ==
-=== Существующие реализации ===

Алгоритм Ланцоша для точной арифметики (без переортогонализации): различия между версиями

Версия 16:31, 31 октября 2016

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Хранилище файлов

Инструменты