Версия 17:20, 29 ноября 2017

Автор текущей версии статьи: Иванов Сергей, гр. 417, 2017-ый год

Содержание

1 Структура алгоритма
2 Литература

1 Структура алгоритма

1.1 Описание алгоритма

Генетический алгоритм - универсальный^[1] субоптимальный метод оптимизации $F(x) \rightarrow \mathop{max}_x$ . Универсальность проявляется в его пригодности к задачам с произвольными функциями $F\colon \mathbb{X} \to \mathbb{R}$ и нетривиальной природой пространства аргументов $\mathbb{X}$ .

От функции $F$ требуется только возможность вычислять её значение в произвольной точке. От пространства аргументов требуется наличие т.н. функции кроссинговера, т.е. функции $Crossover\colon \mathbb{X}\times \mathbb{X}\to \mathbb{X}$ . Обычно для этого объекты пространства представляются в виде набора генов, т.е. по сути вещественных или бинарных векторов фиксированной (или даже меняющийся по ходу оптимизации^[2]) размерности. Функция кроссинговера обычно полагается независимой для каждого гена (то есть для каждого элемента последовательности): для бинарных генов с вероятностью 1/2 берётся ген первого аргумента, иначе второго; для вещественных генов $g_1, g_2$ результатом обычно полагается $\alpha g_1 + (1 - \alpha) g_2$ , где $\alpha \sim Unifrom(0, 1)$

Такие слабые требования позволяют алгоритму работать в случаях, где традиционные методы непрерывной оптимизации неприменимы, таких как отбор признаков в задачах машинного обучения^[3] и задачи обучения с подкреплением^[4].

Канонически использующаяся для описания алгоритма терминология взята из теории эволюции. Под "особью" в биологии понимают совокупность фенотипа и генотипа живого организма; с математической точки зрения, в рамках задачи оптимизации, можно положить, что генотипом является некоторая точка $x$ , а фенотипом - значение в данной точке функции $F$ . Основная идея алгоритма заключается в том, чтобы в рамках некоторой популяции, т.е. набора особей, отобрать лучшие по фенотипу особи, а затем построить новую популяцию на основе только лучших генотипов. Одна такая итерация называется эпохой. Соответственно, два основных параметра алгоритма - размер популяции, и число отбираемых ("выживающих") особей на каждой итерации.

1.2 Математическое описание алгоритма

Входные данные: функция $F\colon \mathbb{X} \to \mathbb{R}$

Параметры алгоритма: размер популяции $PopulationSize$ , число выживающих особей на каждом этапе $SurvivalSize$ , функция кроссинговера $Crossover\colon \mathbb{X}\times \mathbb{X}\to \mathbb{X}$ , критерий останова. Опционально: функция мутации $Mutation\colon \mathbb{X}\to \mathbb{X}$ , вероятность мутации $\epsilon$ .

Выходные данные: субоптимальный экстремум $x*$

Инициализация: $Population_0 := PopulationSize$ случайных объектов из $\mathbb{X}$

До выполнения критерия останова:

вычислить $F(x)$ для всех $x$ из $Population_i$
оставить топ- $SurvivalSize$ особей из $Population_i$
составить $Population_{i+1}$ : каждая новая особь есть результат применения $Crossover$ к двум случайным выжившим особям
при наличии мутаций к каждой особи с вероятностью $\epsilon$ применить функцию $Mutation$

На выход алгоритм подаётся $\mathop{argmax}_{x \in Population_{last}} F(x)$

1.3 Возможные вариации

Стоит отдельно отметить, что алгоритм допускает бесчисленное количество вариаций, и редко применяется в исходной форме. Модификациям можно подвергнуть практически любой этап алгоритма без существенного изменения идеи процесса. Большинство модификаций призвано бороться с главным недостатком алгоритма - отсутствием вариативности, вызванной похожестью результата операции кроссинговера на свои операнды. Ниже перечислены некоторые из возможных модификаций:

битвы на выживание: на этапе отбора выбирать две случайные особи и устраивать между ними "сражение", в котором одна из них "погибает" (удаляется из популяции). Сражение может проходить по принципу "побеждает сильнейший", или стохастически, с вероятностью победы пропорциональной силе особи, где сила - значение функции $F$ .
острова: запускать генетический поиск для нескольких независимо сэмплированных популяций и допускать редкие обмены генотипами между ними. Нестрого говоря, это позволяет найти несколько локальных максимумов, и проверить, нет ли лучших вариантов между ними.
старение: оставлять топ-k особей популяции неизменными для следующего поколения; удалять их, если их "возраст" превысил определённый порог.

1.4 Вычислительное ядро алгоритма

В типичной ситуации вычислительным ядром алгоритма является вычисление $PopulationSize$ значений оптимизируемой функции $F$ . Основными причинами такого положения являются следующие:

генетические алгоритмы "специализированы" для оптимизации функций, для которых вычисление значения в точке является нетривиальной или достаточно вычислительно трудоёмкой процедурой.
все остальные макрооперации алгоритма обычно имеют сложность или линейную от размерности пространства аргументов, или $O(PopulationSize \log PopulationSize)$ , где $PopulationSize$ редко превосходит 1000

1.5 Макроструктура алгоритма

Алгоритм, как видно из математического описания алгоритма, состоит в проведении следующих макроопераций:

вычисление значений $F$ для каждой особи
сортировка полученных значений
сэмплирование индексов родителей для каждой особи из дискретного равномерного распределения
проведение кроссинговера для генерации новых особей (типично представляет собой поэлементную процедуру над двумя векторами)

1.6 Схема реализации последовательного алгоритма

1. Провести инициализацию первой популяции ${x}$

2. Для каждой особи вычислить значение $f_i = F(x_i)$

3. Отсортировать особи по массиву значений $f_i$

4. Проверить критерий останова. Если он выполнен, ответом алгоритма является $x_0$

5. Для каждой особи засэмплировать $p_{i1}, p_{i2} ~ \mathcal{U}\{0, SelectionSize\}$

6. Составить ${y_i = Crossover(x_{p_{i1}}, x_{p_{i2}})}$

7. Положить ${x} = {y}$

8. Перейти к пункту 2

1.7 Последовательная сложность алгоритма

Предположим, что сложность одного вычисления функции $F$ имеет сложность $N$ , процедура кроссинговера --- $D$ ; размер популяции для сокращения выкладок обозначим $P$ . Рассчитаем сложность одной эпохи алгоритма:

Этап 2 является наиболее вычислительно трудоёмким и имеет сложность $PF$ ;

Этап 3 имеет сложность $P \log P$

Этапы 4-5 имеют константную сложность.

Этап 6 имеет сложность $PD$

Этап 7 также имеет сложность $PD$

Для произвольной $F$ в общем случае сложность алгоритма составляет $O(PF + P \log P + PD)$ , обычно выбор параметров таков, что вторым слагаемым можно пренебречь.

При этом в памяти необходимо хранить два массива из $P$ объектов из пространства $\mathbb{X}$ . В предположении, что его размерность совпадает со сложностью кроссинговера, это $2PD$ вещественных чисел.

1.8 Информационный граф

На рис.1 показана информационная структура типичного генетического поиска. Стоит отметить, что на рисунке p1 и p2 формально являются не индексами родителей, а их генотипами, т.е. с точки зрения данного графа процедура сортировки возвращает отсортированный список именно что объектов ${x}$ ; более частой реализацией является применение кроссинговера к особям с сэмплированными индексами, в таком случае формально требовалось бы соединить каждую из операций кроссинговера со всеми $x$ , получая таким образом на графе полносвязную структуру, являющуюся основным препятствием к распараллеливанию алгоритма.

Рис.1. Информационный граф генетического поиска

Формально граф на рис.1 состоит из следующих элементов:

для очередной популяции высчитываются значения фитнес-функции. Это происходит независимо для каждой особи, и может быть сделано параллельно.
полученный набор значений подаётся на вход алгоритму сортировки ${x}$ в качестве критерия сортировки.
вычисляются генотипы p1, p2 среди случайных особей, оказавшихся в топ- $SelectionSize$ по результатам сортировки
после предыдущей операции к генотипам p1, p2 независимо для каждой особи применяется $Crossover$
полученные значения становятся новыми особями популяции

1.9 Ресурс параллелизма алгоритма

На информационном графе на рис. 1 видно, что все вычисления фитнес-функции, самой трудоёмкой операции алгоритма, на одной эпохе можно распараллелить. Это позволяет в общем случае снизить стоимость одной эпохи с $O(PN)$ до $O(N)$ , и при больших $N$ эта сложность принципиально неулучшаема (на каждом шаге оптимизации функции, для которой мы умеем только считать значение в некоторой точке, не может быть ничего оптимальнее, чем сделать это один раз). При возможности неограниченно распараллеливать вычисление, одна эпоха генетического алгоритма начинает стоить всего один вызов функции $F$ , что фундаментально является существенным преимуществом алгоритма.

Информационный граф показывает, что также доступно для распараллеливания и операция кроссинговера. Однако, для этого требуется каждому процессу получить доступ к двум требуемым генотипам, находящимся у двух других процессов. В возникающей схеме взаимных обменов информации потенциальные затраты на организацию доступа и передачу данных могут оказаться выше проведения кроссинговера $P$ раз на одном процессоре, однако такая альтернатива существует, и, особенно при нелинейной сложности кроссинговера, её стоит принимать во внимание.

Поскольку алгоритм эвристический, в оптимизационных целях был придуман ряд эвристик, направленных на увеличение потенциала распараллеливания:

индексы родителей могут сэмплироваться так, чтобы заранее упростить процесс обмена сообщениями; в предельной идее, например, индексы родителей из топа- $SelectionSize$ для каждой новой особи можно зафиксировать, чтобы точно указать на информационном графе, какие именно генотипы для какой операции кроссинговера используются.
отчасти упрощает распараллеливание такое ответвление генетического поиска, как естественный генетический поиск, в целом являющимся Монте-Карло методом оценки невычислимого градиента.

1.10 Входные и выходные данные алгоритма

В данном разделе необходимо описать объем, структуру, особенности и свойства входных и выходных данных алгоритма: векторы, матрицы, скаляры, множества, плотные или разреженные структуры данных, их объем. Полезны предположения относительно диапазона значений или структуры, например, диагональное преобладание в структуре входных матриц, соотношение между размером матриц по отдельным размерностям, большое число матриц очень малой размерности, близость каких-то значений к машинному нулю, характер разреженности матриц и другие.

2 Литература

[1] ttp://www.boente.eti.br/fuzzy/ebook-fuzzy-mitchell.pdf

[2] ttp://nn.cs.utexas.edu/downloads/papers/stanley.ec02.pdf

[3] ttp://lib.dr.iastate.edu/cgi/viewcontent.cgi?article=1174&context=cs_techreports

[4] ttps://www.jair.org/media/613/live-613-1809-jair.pdf

[1]

[2]

[3]

[4]

@@ Строка 86: / Строка 86: @@
 === Информационный граф ===
-На рис.1 показана информационная структура типичного генетического поиска. Стоит отметить, что на рисунке <math>p1</math> и <math>p2</math> формально являются не индексами родителей, а их генотипами, т.е. с точки зрения данного графа процедура сортировки возвращает отсортированный список именно что объектов <math>{x}</math>; более частой реализацией является применение кроссинговера к особям с сэмплированными индексами, в таком случае формально требовалось бы соединить каждую из операций кроссинговера со всеми <math>x</math>, получая таким образом на графе полносвязную структуру, являющуюся основным препятствием к распараллеливанию алгоритма.
+На рис.1 показана информационная структура типичного генетического поиска. Стоит отметить, что на рисунке p1 и p2 формально являются не индексами родителей, а их генотипами, т.е. с точки зрения данного графа процедура сортировки возвращает отсортированный список именно что объектов <math>{x}</math>; более частой реализацией является применение кроссинговера к особям с сэмплированными индексами, в таком случае формально требовалось бы соединить каждую из операций кроссинговера со всеми <math>x</math>, получая таким образом на графе полносвязную структуру, являющуюся основным препятствием к распараллеливанию алгоритма.
 [[file:GA_Graph.png|thumb|center|300px|Рис.1. Информационный граф генетического поиска]]
@@ Строка 95: / Строка 95: @@
 * вычисляются генотипы p1, p2 среди случайных особей, оказавшихся в топ-<math>SelectionSize</math> по результатам сортировки
 * после предыдущей операции к генотипам p1, p2 независимо для каждой особи применяется <math>Crossover</math>
 * полученные значения становятся новыми особями популяции
 === Ресурс параллелизма алгоритма ===

Участник:Sergey Ivanov/Генетические алгоритмы: различия между версиями

Версия 17:20, 29 ноября 2017

Содержание

1 Структура алгоритма

1.1 Описание алгоритма

1.2 Математическое описание алгоритма

1.3 Возможные вариации

1.4 Вычислительное ядро алгоритма

1.5 Макроструктура алгоритма

1.6 Схема реализации последовательного алгоритма

1.7 Последовательная сложность алгоритма

1.8 Информационный граф

1.9 Ресурс параллелизма алгоритма

1.10 Входные и выходные данные алгоритма

2 Литература

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Хранилище файлов

Инструменты