Участник:Руфина Третьякова/Хранение ненулевых элементов разреженных матриц. Умножение разреженной матрицы на вектор: различия между версиями
Строка 88: | Строка 88: | ||
=== Свойства алгоритма === | === Свойства алгоритма === | ||
− | = | + | == Программная реализация алгоритма == |
− | == Особенности реализации последовательного алгоритма == | + | === Особенности реализации последовательного алгоритма === |
− | == Локальность данных и вычислений == | + | === Локальность данных и вычислений === |
− | == Возможные способы и особенности параллельной реализации алгоритма == | + | === Возможные способы и особенности параллельной реализации алгоритма === |
− | == Масштабируемость алгоритма и его реализации == | + | === Масштабируемость алгоритма и его реализации === |
− | == Динамические характеристики и эффективность реализации алгоритма == | + | === Динамические характеристики и эффективность реализации алгоритма === |
− | == Выводы для классов архитектур == | + | === Выводы для классов архитектур === |
− | == Существующие реализации алгоритма == | + | === Существующие реализации алгоритма === |
Последовательная реализация имеется в пакете SPARSKIT | Последовательная реализация имеется в пакете SPARSKIT |
Версия 14:09, 13 октября 2016
Умножение разреженной матрицы на вектор | |
Последовательный алгоритм | |
Последовательная сложность | nnz |
Объём входных данных | 2nnz+2n+1 |
Объём выходных данных | n |
Параллельный алгоритм | |
Высота ярусно-параллельной формы | |
Ширина ярусно-параллельной формы |
Авторы статьи: Третьякова Р. М. (группа 603), Буторина Е. В. (группа 603)
Содержание
- 1 Свойства и структура алгоритма
- 1.1 Общее описание алгоритма
- 1.2 Математическое описание алгоритма
- 1.3 Вычислительное ядро алгоритма
- 1.4 Макроструктура алгоритма
- 1.5 Схема реализации последовательного алгоритма
- 1.6 Последовательная сложность алгоритма
- 1.7 Информационный граф
- 1.8 Ресурс параллелизма алгоритма
- 1.9 Входные и выходные данные алгоритма
- 1.10 Свойства алгоритма
- 2 Программная реализация алгоритма
- 2.1 Особенности реализации последовательного алгоритма
- 2.2 Локальность данных и вычислений
- 2.3 Возможные способы и особенности параллельной реализации алгоритма
- 2.4 Масштабируемость алгоритма и его реализации
- 2.5 Динамические характеристики и эффективность реализации алгоритма
- 2.6 Выводы для классов архитектур
- 2.7 Существующие реализации алгоритма
- 3 Литература
1 Свойства и структура алгоритма
1.1 Общее описание алгоритма
Разрежённая матрица — это матрица с преимущественно нулевыми элементами. В противном случае, если бо́льшая часть элементов матрицы ненулевые, матрица считается плотной. Среди специалистов нет единства в определении того, какое именно количество ненулевых элементов делает матрицу разрежённой. Разные авторы предлагают различные варианты. Огромные разрежённые матрицы часто возникают при решении таких задач, как дифференциальное уравнение в частных производных. При хранении и преобразовании разрежённых матриц в компьютере бывает полезно, а часто и необходимо, использовать специальные алгоритмы и структуры данных, которые учитывают разрежённую структуру матрицы. Операции и алгоритмы, применяемые для работы с обычными, плотными матрицами, применительно к большим разрежённым матрицам работают относительно медленно и требуют значительных объёмов памяти. Однако разрежённые матрицы могут быть легко сжаты путём записи только своих ненулевых элементов, что снижает требования к компьютерной памяти.
1.2 Математическое описание алгоритма
Исходные данные: разреженная матрица M^{n*n}, вектор x^{n*1}
Наиболее удобным форматом для вычисления произведения матрицы на вектор является "Compressed Sparse Row" или сокращенно CSR-формат.
Рассмотрим CSR-представление разреженной матрицы: пусть число ненулевых элементов матрицы равно nnz CSR-формат представляет матрицу M в виде 3-х одномерных массивов:
массив A размера nnz содержит ненулевые значения матрицы, JA размера nnz - номера столбцов ненулевых элементов., IA размера n- содержит номер с которого начинается описание элементов строки в массивах A и JA. Этот формат позволяет производить перемножение матрицы M на вектор x за O(nnz) умножений и сложений.
Например, это разреженная матрица с 4-мя ненулевыми элементами
- \begin{pmatrix} 0 & 0 & 0 & 1 \\ 2 & 0 & 0 & 0 \\ 0 & 0 & 3 & 0 \\ 0 & 4 & 0 & 0 \\ \end{pmatrix},
представляемая в формате CSR A = [ 1 2 3 4 ] IA = [ 0 1 2 3 4 ] JA = [ 3 0 2 1 ]
Вычисляемые данные: вектор M*x=y
1.3 Вычислительное ядро алгоритма
- y_i = \sum_{k = IA_i}^{IA_{i+1}} A_k x_{JA_k}
1.4 Макроструктура алгоритма
Псевдокод алгоритма:
Входные данные: число строк матрицы n; разреженная матрица в формате CSR: строчные указатели IA, столбцовые указателиJA, ненулевые элементы A; вектор x. Выходные данные: произведение матрицы на вектор y. read CSR n, IA, JA, A; read x for i = 1,n: for k = IA(i), IA(i+1)-1: y(i) += A(k)*x(JA(k)); write y;
1.5 Схема реализации последовательного алгоритма
Метод можно описать следующим образом:
- привести матрицу M к формату CSR
- для i от 0 до n-1 вычислить y_i по формуле y_i = \sum_{k = IA_i}^{IA_{i+1}} A_k x_{JA_k}
1.6 Последовательная сложность алгоритма
Для вычисления матрично-векторного произведения матрицы размера n*n и вектора размера n в последовательном варианте требуется:
- nnz сложений,
- nnz умножений.
1.7 Информационный граф
1.8 Ресурс параллелизма алгоритма
1.9 Входные и выходные данные алгоритма
1.10 Свойства алгоритма
2 Программная реализация алгоритма
2.1 Особенности реализации последовательного алгоритма
2.2 Локальность данных и вычислений
2.3 Возможные способы и особенности параллельной реализации алгоритма
2.4 Масштабируемость алгоритма и его реализации
2.5 Динамические характеристики и эффективность реализации алгоритма
2.6 Выводы для классов архитектур
2.7 Существующие реализации алгоритма
Последовательная реализация имеется в пакете SPARSKIT
3 Литература
[1] С. Писсанецки. Технология разреженных матриц. Изд. Мир, 1988.