Уровень алгоритма

Участник:Артем Карпухин/Алгоритм CLOPE кластеризации категориальных данных: различия между версиями

Материал из Алговики
Перейти к навигации Перейти к поиску
Строка 13: Строка 13:
  
 
=== Общее описание алгоритма ===
 
=== Общее описание алгоритма ===
Алгоритм '''CLOPE (Clustering with sLOPE)''' - неиерархический итеративный метод кластерного анализа, предназначенный для обработки больших наборов категориальных данных. Алгоритм был предложен группой исследователей из Шанхайского университета (Yiling Yang, Xudong Guan, Jinyuan You) в статье "CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data" <ref> Y.Yang, X.Guan J.You. CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data</ref> на конференции [http://www.kdd.org SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining)] в 2002 году.
+
Алгоритм '''CLOPE (Clustering with sLOPE)''' - неиерархический итеративный метод кластерного анализа, предназначенный для обработки больших наборов категориальных данных. Алгоритм был предложен группой исследователей из Шанхайского университета (Yiling Yang, Xudong Guan, Jinyuan You) в статье "''CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data''" <ref> Y.Yang, X.Guan J.You. CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data</ref> на конференции [http://www.kdd.org SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining)] в 2002 году.
  
 
Основной идеей данного метода является использование глобального критерия оптимизации на основе максимизации градиента
 
Основной идеей данного метода является использование глобального критерия оптимизации на основе максимизации градиента

Версия 00:09, 16 октября 2016


Алгоритм CLOPE
Последовательный алгоритм
Последовательная сложность [math]O(N*K*A)[/math]
Объём входных данных [math]N*A[/math]
Объём выходных данных [math]2N[/math]
Параллельный алгоритм
Высота ярусно-параллельной формы [math]O( \log (N*K*A))[/math]
Ширина ярусно-параллельной формы [math]O(N*K*A)[/math]


Основные авторы описания: А.В.Карпухин, А.А.Желтков

1 Свойства и структура алгоритма

1.1 Общее описание алгоритма

Алгоритм CLOPE (Clustering with sLOPE) - неиерархический итеративный метод кластерного анализа, предназначенный для обработки больших наборов категориальных данных. Алгоритм был предложен группой исследователей из Шанхайского университета (Yiling Yang, Xudong Guan, Jinyuan You) в статье "CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data" [1] на конференции SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining) в 2002 году.

Основной идеей данного метода является использование глобального критерия оптимизации на основе максимизации градиента высоты гистограммы кластера применительно к задачам кластеризации. Во время выполнения алгоритма в оперативной памяти требуется хранить относительно малое количество информации о каждом кластере и производится минимальное число проходов по набору данных. При использовании метода CLOPE количество кластеров подбирается автоматически и зависит от коэффициента отталкивания - параметра, задаваемого пользователем.

https://basegroup.ru/community/articles/clope http://www.fundamental-research.ru/ru/article/view?id=33381 http://www.olap.ru/home.asp?artId=155

Задачи кластеризации больших массивов категорийных данных весьма актуальна для систем анализа данных.

  1. Y.Yang, X.Guan J.You. CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data