Обсуждение участника:Lexaloris
Основной вопрос. Ядро это все-таки умножение матрицы или строки матрицы? Соответственно под это нужно подстраивать и остальной текст, потому что можно понять и так, и так.
--Evgeny Mortikov (обсуждение) 02:21, 2 декабря 2016 (MSK) К Вашей работе есть несколько замечаний по содержанию
Содержание
1 Пункт 1.1.1.1
--Evgeny Mortikov (обсуждение) 02:21, 2 декабря 2016 (MSK)
Эта схема предъявляет минимальные требования к памяти и в то же время оказывается очень удобной для умножения разреженной матрицы на вектор.
Минимальные требования к памяти, по отношению к любым другим способам хранения разреженных матриц даже специального вида? Нужно также пояснить в чем удобство именно этого подхода, по отношению к другим.
2 Пункт 1.1.1.2
--Evgeny Mortikov (обсуждение) 02:21, 2 декабря 2016 (MSK)
Неупорядоченные представления могут быть очень удобны. Результаты большинства матричных операций получаются не упорядоченными, и упорядочение их стоило бы больших затрат машинного времени. В то же время, за немногими исключениями, алгоритмы для разреженных матриц не требуют, чтобы представления были упорядоченными.
Хорошо бы привести примеры матричных операций, для которых неупорядоченное представление дает выигрыш, по сравнению с упорядоченным.
3 Пункт 1.5
--Evgeny Mortikov (обсуждение) 02:21, 2 декабря 2016 (MSK)
Псевдокод и схема алгоритма написаны с ошибками и отличаются друг от друга.
4 Пункт 1.6
--Evgeny Mortikov (обсуждение) 02:21, 2 декабря 2016 (MSK)
Нужно привести точное число операций для данного алгоритма и описать какие операции используются.
5 Пункт 1.8
--Evgeny Mortikov (обсуждение) 02:21, 2 декабря 2016 (MSK)
При классификации по высоте ЯПФ, алгоритм имеет линейную сложность. При классификации по высоте ЯПФ также линейную.
Дважды описывается сложность по высоте ЯПФ.
6 Пункт 1.10
--Evgeny Mortikov (обсуждение) 02:21, 2 декабря 2016 (MSK)
Алгоритм в рамках выбранной версии полностью детерминирован.
Будет ли влиять выполнение свойства ассоциативности для сложения на детерминированность алгоритма?
7 Пункт 2.4
Dan (обсуждение) 14:17, 17 ноября 2016 (MSK) необходимо доработать:
Требования были такие: - Реализация: полностью собственная или обращение к библиотечной функции (Intel MKL, PETSc, FFTW, ScaLAPACK). В любом случае, текст исследуемой программы должен быть представлен в отчете. - Компьютерная платформа может быть любой (Ломоносов, BlueGene или что-то иное). Описание компьютерной платформы должно быть в отчете. - Должен быть представлен график сильной масштабируемости (зависимости производительности от числа процессов; если при этом ещё и зависимость от размера задачи - это только в плюс). График должен выглядеть пристойно и понятно, оси и единицы измерения должны быть подписаны. К графику обязательно должны быть словесные пояснения! Требовалось подобрать такие размеры задачи и числа процессоров, чтобы отразить на графике характерные точки, описывающие свойства алгоритма и программы.
Dan (обсуждение) 11:00, 21 ноября 2016 (MSK) - Приведите код, параметры компиляции.
- График построен по каким значениям?
- Укажите все параметры, при которой исследовалась задача: размер матрицы и т.д.
--Evgeny Mortikov (обсуждение) 02:21, 2 декабря 2016 (MSK)
Параллельная реализация алгоритма позволяет до некоторой степени сократить время вычислений в несколько раз.
Почему в несколько раз, если на графике время счета уменьшается почти на порядок?
В разделе нужно пояснить, какая программная реализация использовалась в экспериментах с (RR (С) U) форматом, входит ли в расчет генерация матрицы, ее преобразование в разреженный формат, операции записи-чтения. Также нужно указать размерность и структуру матрицы в экспериментах и привести ссылку на описание кластера.