Участник:Abogovski/Вспомогательная задача при решении задачи Штурма-Лиувилля с условиями сопряжения

Материал из Алговики
Перейти к навигации Перейти к поиску

Боговский Антон, 409

Содержание

1 Свойства и структура алгоритмов

К этой вспомогательной задаче (см. Математическое описание алгоритма) сводится решение задачи Штурма-Лиувилля с условия сопряжения, возникающей при разделении переменных в краевой задаче для эллиптического оператора с кусочно-постоянными коэффицентами. Ищутся области (углы) для которых, существуют собственное число равное единице.

1.1 Общее описание алгоритма

Искомые области находятся перебором параметров области (углы, на которых коэффицент постоянен, и значения коэффицента на этих подобластях.

1.2 Математическое описание алгоритма

Рассмотрим задачу Дирихле на ограниченной области для эллиптического уравнения в дивергентной форме с кусочно-постоянными коэффицентами. [math]div(\varkappa grad u) = div F [/math], где коэффицент [math]\varkappa[/math] -- кусочно-постоянный. При решении задачи методом разделения переменных в полярных возникает задача Штурма-Лиувилля относительного полярного угла [math]\Phi'(\varphi) = \lambda \Phi(\varphi)[/math] c условиями сопряжения на разрывах коэффицента: непрерывность [math]\Phi(\varphi)[/math] и [math]\varkappa(\varphi)\Phi'(\varphi)[/math].

В качестве области для модельной задачи возьмем круг (или сектор круга) с радиальными линиями разрыва [math]\varkappa(\varphi)[/math]. Тогда на каждом отрезке непрерывности [math]\varkappa(\varphi)[/math] решение -- линейная комбинация [math]cos(\sqrt{-\lambda}\varphi)[/math] и [math]sin(\sqrt{-\lambda}\varphi)[/math]. Если для области такого вида (набора значений [math]\varkappa[/math] и величин углов) существуют набор постоянных при [math]cos(\sqrt{-\lambda}\varphi)[/math] и [math]sin(\sqrt{-\lambda}\varphi)[/math], такой что граничные условия и условия сопряжения выполнены, то существует собственная функция.

Ищем такие области. Заметим, что решения задачи штурма Лиувилля зависят от [math]\alpha = \sqrt{-\lambda}\varphi[/math] -- перейдем к такой переменной. Зададим граничное условие на одной стороне сектора, условия сопряжения на линиях разрыва и проверим (переберем) различные значения [math]\alpha, \varkappa[/math] на выполнение граничного условия на правой стороне.

(Условия сопряжения дают связь между коэффицентами при [math]cos,sin[/math] через композицию матриц растяжения и поворота, зависящих от [math]\alpha, \varkappa[/math]).

1.3 Вычислительное ядро алгоритма

Перебор параметров. Можно рассматривать вычислительное как обход дерева всех наборов значений параметров.

  • Для первой подобласти фиксируется значение [math]\varkappa=1[/math] и поддиапазон перебора значений [math]\alpha[/math] (или весь диапазон, в случае последовательной реализации)
  • Остальные значения перебираются в заданном диапазоне -- обход дерева всех наборов значений параметра (при заданном шаге по значениям).

1.3.1 Выбор диапазонов перебора для параметров каждой области

Вычисление диапазона перебора из настроек перебора (заданных при компиляции) и "порядкового номера" процесса (ранга в MPI_COMM_WORLD) можно отнести к вычислительному ядру

struct Area
{
	double angle;
	double kappa;
};

template<typename T>
struct Range
{
	T min;
	T max;
	T step;
};

vector<Range<Area>> ParallelParams(int mpi_rank, int mpi_size)
{
	vector<Range<Area>> ranges(AREAS_CNT);
	constexpr double angle_step = (ANGLE_TO - ANGLE_FROM) / (double) RANGE_STEPS_CNT;
	constexpr double kappa_step = (KAPPA_TO - KAPPA_FROM) / (double) RANGE_STEPS_CNT;
	Range<Area> r0 = { { ANGLE_FROM + mpi_rank * angle_step, 1 }, { ANGLE_FROM + (mpi_rank + 1) * angle_step, 1 },{ angle_step, kappa_step } };
	Range<Area> r1 = { { ANGLE_FROM, KAPPA_FROM },{ ANGLE_TO, KAPPA_TO },{ angle_step, kappa_step } };
	ranges[0] = r0;
	for (size_t i = 1; i < AREAS_CNT; ++i)
		ranges[i] = r1;
	return ranges;
}

1.3.2 Перебор на заданных диапазонах

Проверяется выполнения правого граничного условия при заданных условиях сопряжения решения в областях (условия зависят от параметров [math]\varkappa, \alpha[/math]) и заданном левом граничном условии.


Способ обхода выбран таким образом, чтобы переход к следующему набору параметров требовал наименьшее число операций, для этого же используется стек T из n = AREAS_CNT матриц 2x2.

struct Matrix
{
	double elems[2][2];
};

const Matrix IdentityMatrix = { { { 1, 0 }, { 0, 1 } } };


inline void RotateScale(Matrix& out, const Matrix& in, double phi, double scale = 1.0)
{
	double c = cos(phi);
	double s = sin(phi);
	out.elems[0][0] = in.elems[0][0] * c + in.elems[1][0] * s;
	out.elems[0][1] = in.elems[0][1] * c + in.elems[1][1] * s;
	out.elems[1][0] = scale * (- in.elems[0][0] * s + in.elems[1][0] * c);
	out.elems[1][1] = scale * (- in.elems[0][1] * s + in.elems[1][1] * c);
}

int vector<vector<Area>> CheckRBoundaryCond(vector<Range<Area>> ranges)
{
	vector<vector<Area>> results;
	vector<Area> areas(AREAS_CNT);
	vector<Matrix> T(AREAS_CNT);
	
	for (size_t i = 0; i < AREAS_CNT; ++i)
		areas[i] = ranges[i].min;

	T[0] = IdentityMatrix;
	for (size_t i = 1; i < AREAS_CNT; ++i)
		RotateScale(T[i], T[i - 1], areas[i - 1].angle, areas[i - 1].kappa / areas[i].kappa);

	for (int lvl = AREAS_CNT; lvl > 0; ) {
		// check boundary condition if at top lvl area
		if (lvl == AREAS_CNT) {
			
			double angle = 0.0;
			for (size_t i = 0; i < AREAS_CNT; ++i)
				angle += areas[i].angle;
			double rbcond = T.back().elems[0][1] * cos(angle) + T.back().elems[1][1] * sin(angle);
			if (abs(rbcond) < EPS) {
				results.push_back(areas);
			}
			lvl--;
			continue;
		}

		// try increase kappa at lvl-th area and go up
		double next_kappa = areas[lvl].kappa + ranges[lvl].step.kappa;
		if (next_kappa <= ranges[lvl].max.kappa + 0.5 * ranges[lvl].step.kappa) {
			areas[lvl].kappa = next_kappa;
			RotateScale(T[lvl], T[lvl - 1], areas[lvl - 1].angle, areas[lvl - 1].kappa / areas[lvl].kappa);
			lvl++;
			continue;
		} 
		
		// try increase angle at lvl-th area and go up
		double next_angle = areas[lvl].angle + ranges[lvl].step.angle;
		if (next_angle <= ranges[lvl].max.angle + 0.5 * ranges[lvl].step.angle) {
			areas[lvl].angle = next_angle;
			RotateScale(T[lvl], T[lvl - 1], areas[lvl - 1].angle, areas[lvl - 1].kappa / areas[lvl].kappa);
			lvl++;
			continue;
		}

		// jump to previous area
		areas[lvl] = ranges[lvl].min;
		lvl--;
	}

	return results;		
}

1.4 Макроструктура алгоритма

  • Для каждого процесса из его номера вычисляется поддерево наборов значений для обхода.
  • Каждым из процессов выполняется обход своего поддерева
  • 0-ой процесс, закончив обход своего поддерева, собирает все результаты и сохраняет их в файл с уникальным именем

1.5 Схема реализации последовательного алгоритма

Приведенная выше паралелльная реализация является эффективной последовательной:

CheckRBoundaryCond(ParallelParams(0, 1)) // 0 - номер процесса, 1 - количество процессов

Подробнее см. раздел вычислительное ядро

1.6 Последовательная сложность алгоритма

  • n - число областей непрерывности [math]\varkappa[/math]
  • k - число пробных значений в диапазоне перебора

сложноcть последовательной реализации -- [math]O(k^{2n})[/math]

1.7 Информационный граф

mpi_rank, mpi_size = p -- ранг процесса в MPI_COMM_WORLD, размер MPI_COMM_WORLD (число процессов)

n -- число областей непрерывности

My info graph.png

1.8 Ресурс параллелизма алгоритма

Пусть [math]p[/math] -- число параллельных процессов, тогда паралелльная сложность -- амортизированное [math]O(k^{2n - p})[/math] (в сравнении с последовательной [math]O(k^{2n})[/math]), так как пересылка и сохранение результатов в конце занимают намного меньше времени чем сам перебор, который распараллеливается с линейной масштабируемостью.

1.9 Входные и выходные данные алгоритма

Параметрами задачи являются: число областей непрерывности, диапазон и точность перебора [math]\varkappa, \alpha[/math], требуемая точность выполнения граничного условия. Они определены в коде как константы (задаются во время компиляции)

В данной реализации "входными данными" времени исполнения является лишь идентификатор процесса и количество процессов.

В качестве выходных данных было взято число всех найденных наборов [math]\{ \varkappa\}, \{ \alpha\}[/math], удовлетворяющих требованиям с заданной точностью.

1.10 Свойства алгоритма

2 Программная реализация алгоритма

2.1 Особенности реализации последовательного алгоритма

2.2 Локальность данных и вычислений

2.3 Возможные способы и особенности параллельной реализации алгоритма

2.4 Масштабируемость алгоритма и его реализации

Масштабируемость линейная. Ключевым ограничением масштабируемости может стать только сбор и сохранение всех результатов одним процессом, но он занимает очень мало времени по сравнению с перебором.

Ось абсцисс -- число процессов (логарифмическая шкала), ось ординат -- время (линейная шкала). Получилось что-то похожее на [math]t = 1/p[/math]

Пример: JobId = 1382989, p = 128, Time = 00:14

Graph fixed1.png

2.5 Динамические характеристики и эффективность реализации алгоритма

2.6 Выводы для классов архитектур

  • Алгоритм имеет линейную масштабируемость на любой системе, где сохранение данных не займет существенную часть времени. (вычислительные ядра не взаимодействуют)
  • Алгоритм не учитывает возможность оптимизации с помощью векторизации.

2.7 Существующие реализации алгоритма

Задача очень специфическая, поэтому других существующих реализаций не найдено.

3 Литература


Диссертация: Дудкина А.А. "К [math]L_p[/math]-теории эллиптических краевых задач с разрывными коэффицентами", Москва, 2009