Участник:Артем Карпухин/Алгоритм CLOPE кластеризации категориальных данных
Алгоритм CLOPE | |
Последовательный алгоритм | |
Последовательная сложность | [math]O(N*K*A)[/math] |
Объём входных данных | [math]N*A[/math] |
Объём выходных данных | [math]2N[/math] |
Параллельный алгоритм | |
Высота ярусно-параллельной формы | [math]O( \log (N*K*A))[/math] |
Ширина ярусно-параллельной формы | [math]O(N*K*A)[/math] |
Основные авторы описания: А.В.Карпухин, А.А.Желтков
1 Свойства и структура алгоритма
1.1 Общее описание алгоритма
Алгоритм CLOPE (Clustering with sLOPE) - неиерархический итеративный метод кластерного анализа, предназначенный для обработки больших наборов категориальных данных. Алгоритм был предложен группой исследователей из Шанхайского университета (Yiling Yang, Xudong Guan, Jinyuan You) в статье "CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data" [1] на конференции SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining) в 2002 году.
Основной идеей данного метода является использование глобального критерия оптимизации на основе максимизации градиента высоты гистограммы кластера применительно к задачам кластеризации. Во время выполнения алгоритма в оперативной памяти требуется хранить относительно малое количество информации о каждом кластере и производится минимальное число проходов по набору данных. При использовании метода CLOPE количество кластеров подбирается автоматически и зависит от коэффициента отталкивания - параметра, задаваемого пользователем.
https://basegroup.ru/community/articles/clope http://www.fundamental-research.ru/ru/article/view?id=33381 http://www.olap.ru/home.asp?artId=155
Задачи кластеризации больших массивов категорийных данных весьма актуальна для систем анализа данных.
- ↑ Y.Yang, X.Guan J.You. CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data