Обсуждение участника:VolkovNikita94

Содержание

1 Статья Участник:VolkovNikita94/Алгоритм Ланцоша для точной арифметики (без переортогонализации)
- 1.1 Замечания по тексту
2 Исправления.
3 Новые замечания

1 Статья Участник:VolkovNikita94/Алгоритм Ланцоша для точной арифметики (без переортогонализации)

1.1 Замечания по тексту

В разделе 1.5 помимо текста программы нужно дать словесные пояснения. Александр Сергеевич Антонов (обсуждение) 16:09, 27 октября 2016 (MSK)
Подписи к рисунку в разделе 2.4 очень мелкие, почти неразличимые. Александр Сергеевич Антонов (обсуждение) 15:06, 16 ноября 2016 (MSK)
В разделе 2.4 не приведены все параметры запуска теста - какой компилятор, с какими опциями использовался, какая версия MKL, на каких узлах проводился запуск и т.д. Александр Сергеевич Антонов (обсуждение) 15:06, 16 ноября 2016 (MSK)
- Это замечание остаётся. Александр Сергеевич Антонов (обсуждение) 13:56, 21 ноября 2016 (MSK)
В разделе 2.4 не приведена использованная в экспериментах реализация алгоритма. Александр Сергеевич Антонов (обсуждение) 15:06, 16 ноября 2016 (MSK)
Рисунки в статье не пронумерованы. Александр Сергеевич Антонов (обсуждение) 13:56, 21 ноября 2016 (MSK)
На рис. в разделе 2.4 по-прежнему очень мелкие подписи. Александр Сергеевич Антонов (обсуждение) 13:56, 21 ноября 2016 (MSK)

2 Исправления.

Поправили замечания, прогнали на большом числе процессоров.

Мой личный комментарий "вне задания": есть довольно любопытная вещь, на которую стоит обратить внимание - небольшие скачки производительности, которые заметны на небольшом числе процессов для небольшого размера задачи. Для большего числа процессов эти скачки полностью не охватываются ( см. линию для 50 процессоров ), но, вероятно, имеют место быть. Какая-никакая, а "характерная особенность", спасибо кэшам ? На 100 процессорах какое-то безумие :)

для стабильности можно просчитать задачу несколько раз во время одного запуска и сравнить времена (потом взять среднее или минимальное), отличия но 10% должны получиться. А если сравнивать времена различных запуском (когда очередь выделит узлы с другими номерами), то отличие в 30% тоже могут случиться. На заре установки Ломоносова знакомые исследовали это и составили карту скоростей обменов между физическими узлами, а потом даже одсуждали это с производителями. Вроде бы даже у них есть публикации... (ИНК) P.S. Если замеренное время счета получается меньше 1 сек., то лучше запустить задачу в цикле несколько раз подряд.

3 Новые замечания

ваша работа дошла до проверяющего только вчера, так что извиняйте за задержку (ИНК)
везде удрать * как символ математического умножения (в самом крайнем случае можно использовать \cdot)
в формулах ну очень часто неверно набраны верхние индексы, состоящие более чем из одной буквы. Не забывайте фигурные скобки! (например, стоит набирать K^{-1})
п.1.5 греческие буквы в обозначениях лучше сделать греческими, добавив \ (например, \alpha, \beta)
п.1.6 поправить показатель степени "в среднем затрачивается [math]O(k^{2.3})[/math] операций"
п.1.7 "из статей от матрично-векторных операциях" (статьи в Алговики? добавить линк на них)
п.1.8 "Ланцоща" --> "Ланцоша", "классисифкации" --> "классификации" (безобразие! вы очень торопились при наборе... --> в режиме правки взять всю статью мышкой и поместить в Word чтобы он подчеркнул ошибочно набранные слова, после чего исправить все описки)
п.2.4 "предметом отдельных статей ( QR-алгоритм, метод «Разделяй-и-властвуй», итерации Арнольди и.т.д. )" (линки на статьи)
п.2.4 собственная реализация - это хорошо (MPI v.2.2? может стоит упомянуть это? И вообще сказать, что это гибридная MPI+OpenMP реализация. А сейчас модно писать код прямо с *.h файле без *.cpp? Хотя никому не мешает, реализация хорошая...)
п.2.4 "Максимальная эффективность - 30.76%" малоинформативная фраза если не сказано на скольки ядрах, на одном или 800? Неплохо было бы для тех же данных привести пару-тройку графиков ускорения, для двух-трех размерностей матрицы.
п.2.7 - замечательно, спасибо
п.3 стоит занумеровать и сделать настоящие ссылки

Основные замечания поправил, Леонид скоро зальёт графики ускорения и еще подправит 2.4

PS: "модно..." - нет, не модно :) Просто а) программа маленькая и это не мешает, так что нет "против" и б) программа писалась в Visual Studio, где процедура компиляции настроена с отличиями от того, что происходит на кластере; в таком виде при переносе переписывать не нужно вообще ничего, так что есть "за".

Обсуждение участника:VolkovNikita94

Содержание

1 Статья Участник:VolkovNikita94/Алгоритм Ланцоша для точной арифметики (без переортогонализации)

1.1 Замечания по тексту

2 Исправления.

3 Новые замечания

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Хранилище файлов

Инструменты