[ссылки] [литература] [проекты] [программы] [методические указания] [монографии и статьи] [вопросы и ответы] [школы] [учебники] [новости]
ENG  |   Карта сайта
Информация
Проект преследует цель популяризации идей применения природных механизмов функционирования для решения задач прогнозирования, оптимизации и поддержки принятия решений

Cписок рассылки
Открыть в новом окне

  1. Введение
  2. Генетические алгоритмы (1)
  3. Генетические алгоритмы (2)
  4. Генетические алгоритмы (3)
  5. Тренды
  6. Полиномиальные тренды
  7. Тригонометрические тренды
  8. Нейронные сети
  9. Метод наименьших квадратов
  10. Метод обратного распространения ошибки
  11. Множественная линейная модель
  12. Нестандартный выпуск. Анкета
  13. МЛМ. Пример расчета
  14. RBF-сеть
  15. Сеть встречного распространения
  16. Первая интерполяционная формула Ньютона
  17. МГУА (1)
  18. Вторая интерполяционная формула Ньютона
  19. Метод Брандона
  20. МГУА (2)
  21. Интерполяционные формулы Гаусса
  22. Интерполяционные формулы Стирлинга и Лагранжа
  23. МГУА (3)
  24. МГУА (4)
  25. Предварительная обработка данных (1)
  26. Предварительная обработка данных (2)
  27. Предварительная обработка данных (3)
  28. Box-counting
  29. Гетероскедастичность
  30. Введение в нечеткую логику
  31. Обобщённый метод наименьших квадратов
  32. Прогнозирование с помощью функций с гибкой структурой
  33. Автокорреляция
  34. Дистрибутивно-лаговые модели (1)
  35. Дистрибутивно-лаговые модели (2)
  36. Дистрибутивно-лаговые модели (3)
  37. Моделирование данных при помощи кривых для восстановления пробелов в таблицах (1)
  38. Нестандартный выпуск. Анонс книги Цейтлина Н.А."Опыт аналитического статистика"
  39. Алгоритм ZET
  40. Алгоритм ZetBraid
  41. Метод эволюционной кластеризации
  42. Эволюционный метод восстановления пропусков в данных
  43. Алгоритмы кластеризации класса FOREL

АЛГОРИТМ FOREL

АЛГОРИТМ FOREL

 

Задача таксономии заключается в разделении множества объектов на заданное количество групп (таксонов, кластеров) с заранее неизвестными параметрами по заданному критерию.

Разбиение одного и того же множества объектов на таксоны может различаться, поэтому для определения наилучшего разбиения вводится критерий качества таксономии.

Введем обозначения:

 - количество объектов в множестве, которое необходимо разделить на группы;

 - количество таксонов ();

 - критерий качества таксономии.

 

Алгоритмы таксономии класса FOREL используют критерий , основанный на гипотезе компактности: в один таксон должны собираться объекты, "похожие"  по  своим  свойствам на некоторый „центральный” объект, то есть объекты близкие по своим характеристикам должны попасть в один таксон. В результате получаются таксоны сферической формы. 

 

Пусть

 - координаты центра -го таксона,

 - количество объектов в -ом таксоне,

,  - объекты -го таксона,

 - расстояние между центром и -м элементом -го таксона,

тогда сумма расстояний от всех элементов до центра -го таксона равна

.

Сумма внутренних расстояний для всех  таксонов:

.

Смысл критерия состоит в том, что нужно найти такое разбиение  объектов на  таксонов, чтобы приведенная выше величина  была минимальной. Выполне­ние этого условия достигается с помощью алгоритма FOREL. Опишем базовую версию и некоторые модификации этого алгоритма.

 

Алгоритм FOREL. Таксоны, получаемые по этому алго­ритму, имеют сферическую форму. Количество таксонов зави­сит от радиуса сфер: чем меньше радиус, тем больше получается таксонов. Вначале признаки объектов нормируются так, чтобы значения всех признаков находились в диапазоне от нуля до еди­ницы. Затем строится гиперсфера минимального радиуса , ко­торая охватывает все  точек (все объекты входят в один таксон). Далее радиус сфер постепенно уменьшается. Задаем радиус  и помещаем центр сферы в любую из имеющихся точек. Находим точки, расстояние до которых меньше радиуса, и вычисляем координаты центра тяжести этих «внутренних» то­чек. Переносим центр сферы в этот центр тяжести и снова находим внутренние точки. Сфера как бы плывет в сторону локаль­ного сгущения точек. Такая процедура определения внутренних точек и переноса центра сферы продолжается до тех пор, пока сфера не остановится, т. е. пока на очередном шаге мы не обна­ружим, что состав внутренних точек, а, следовательно, и их центр тяжести, не меняется. Это означает, что сфера остановилась в области локального максимума плотности точек в признаковом пространстве.

Точки, оказавшиеся внутри остановившейся сферы, мы объя­вляем принадлежащими таксону номер 1 и исключаем их из даль­нейшего рассмотрения. Для оставшихся точек описанная выше процедура повторяется до тех пор, пока все точки не окажутся включенными в таксоны.

Доказана сходимость алгоритма за ко­нечное число шагов, однако легко видеть, что решение может быть не единственным. Так, на рис. 1 видно, что результат так­сономии зависит от того, с какой первой точки был начат про­цесс

РЕКЛАМА:

Администрация сайта: ()
Используются технологии uCoz