Lanczos, C, MPI
Перейти к навигации
Перейти к поиску
Содержание
1 Ссылки
Для исследования масшабируемости алгоритма была написана реализация на языке C с использованием MPI.
2 Локальность данных и вычислений
2.1 Локальность реализации алгоритма
2.1.1 Структура обращений в память и качественная оценка локальности
2.1.2 Количественная оценка локальности
3 Масштабируемость алгоритма и его реализации
3.1 Масштабируемость алгоритма
3.2 Масштабируемость реализации алгоритма
Реализация была протестирована на суперкомпьютере Ломоносов.
Сборка осуществлялась со следующими параметрами:
- gcc-5.2.0
- openmpi-1.8.4
- аргументы компилятора: -std=c11 -Ofast
Набор и границы значений изменяемых параметров реализации алгоритма:
- число процессоров [32 : 256] с шагом 16;
- размер матрицы [5000 : 200000] с шагом 5000.
В результате проведённых экспериментов был получен следующий диапазон эффективности реализации алгоритма:
- минимальная эффективность реализации 1.92%;
- максимальная эффективность реализации 59.47%.
График полученного распределения эффективности:
На следующих рисунках приведены графики производительности и эффективности данной реализации в зависимости от изменяемых параметров запуска.
Средняя эффективность для матриц с размером больше 25000 составила 52.7%.