Уровень алгоритма

Участник:Артем Карпухин/Алгоритм CLOPE кластеризации категориальных данных

Материал из Алговики
Перейти к навигации Перейти к поиску


Алгоритм CLOPE
Последовательный алгоритм
Последовательная сложность O(N*K*A)
Объём входных данных N*A
Объём выходных данных 2N
Параллельный алгоритм
Высота ярусно-параллельной формы O( \log (N*K*A))
Ширина ярусно-параллельной формы O(N*K*A)


Основные авторы описания: А.В.Карпухин, А.А.Желтков

1 Свойства и структура алгоритма

1.1 Общее описание алгоритма

Алгоритм CLOPE (Clustering with sLOPE) - неиерархический итеративный метод кластерного анализа, предназначенный для обработки больших наборов категориальных данных. Алгоритм был предложен группой исследователей из Шанхайского университета (Yiling Yang, Xudong Guan, Jinyuan You) в статье "CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data" [1] на конференции SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining) в 2002 году.

Основной идеей данного метода является использование глобального критерия оптимизации на основе максимизации градиента высоты гистограммы кластера применительно к задачам кластеризации. Во время выполнения алгоритма в оперативной памяти требуется хранить относительно малое количество информации о каждом кластере и производится минимальное число проходов по набору данных. При использовании метода CLOPE количество кластеров подбирается автоматически и зависит от коэффициента отталкивания - параметра, задаваемого пользователем.

https://basegroup.ru/community/articles/clope http://www.fundamental-research.ru/ru/article/view?id=33381 http://www.olap.ru/home.asp?artId=155

Задачи кластеризации больших массивов категорийных данных весьма актуальна для систем анализа данных.

  1. Y.Yang, X.Guan J.You. CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data