Научная статья на тему 'РЕШЕНИЕ ЗАДАЧИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ НА ОСНОВЕ БИОИНСПИРИРОВАННОГО АЛГОРИТМА'

РЕШЕНИЕ ЗАДАЧИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ НА ОСНОВЕ БИОИНСПИРИРОВАННОГО АЛГОРИТМА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
158
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМИЗАЦИЯ МУРАВЬИНОЙ КОЛОНИИ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / КЛАСТЕРИЗАЦИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кулиев Эльмар Валерьевич, Запорожец Дмитрий Юрьевич, Кравченко Юрий Алексеевич, Семенова Марина Максимовна

Рассматривается биоинспирированный алгоритм для решения задач интеллектуального анализа. Интеграция биоинспирированных алгоритмов для решения задач интеллектуального анализа данных является перспективным направлением исследований. В качестве биоинспирированного алгоритма, рассмотрен алгоритм, основанный на адаптивном поведении муравьиной колонии. Алгоритм муравьиной колонии позволяет производить качественный поиск перспективных решений для получения оптимальных и квазиоптимальных решений. Алгоритм обладает способностью выполнять поиск подходящей логических условий. Алгоритм муравьиной колонии основан на примере поведения живых муравьев в природе. Муравьи способны находить кратчайшее решение адаптируясь к изменениям окружающей среды. Авторами предложен модифицированный алгоритм муравьиной колонии для решения задачи интеллектуального анализа данных. В качестве задачи интеллектуального анализа данных выбрана задача кластеризации. Кластеризация - объединение в группы схожих объектов - является одной из фундаментальных задач в области анализа данных и Data Mining. Список прикладных областей, где она применяется, широк: сегментация изображений, маркетинг, борьба с мошенничеством, прогнозирование, анализ текстов и многие другие. Решение данной задачи приобретает особую актуальность в условиях постоянно растущего объема генерируемых, передаваемых и обрабатываемых данных. Классические методы кластеризации оптимизированы путем объединения с предложенным алгоритмом биоинспирированной оптимизации - муравьиным алгоритмом. Предложенный метод представляет собой модель, в которой муравьи представлены в виде агентов, которые случайным образом перемещаются в пространстве решений с некоторыми ограничений (например, препятствия на их пути). Для определения эффективности разработанного модифицированного муравьиного алгоритма (АСО) с алгоритмом кластеризации, авторами была проведена серия вычислительных экспериментов. Для сравнения были взять генетический алгоритм, алгоритм обезьян и алгоритм волков. Результаты моделирования доказывают, что муравьиный алгоритм на основе кластеризации дает лучшие результаты, чем другие предлагаемые алгоритмы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кулиев Эльмар Валерьевич, Запорожец Дмитрий Юрьевич, Кравченко Юрий Алексеевич, Семенова Марина Максимовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOLUTION OF THE PROBLEM OF INTELLECTUAL DATA ANALYSIS BASED ON BIOINSPIRED ALGORITHM

The article discusses a bioinspired algorithm for solving the problems of intellectual analysis. The integration of bioinspired algorithms for solving data mining problems is a promising area of research. As a bioinspired algorithm, an algorithm based on the adaptive behavior of an ant colony is considered. The ant colony algorithm allows for a high-quality search for promising solutions to obtain optimal and quasi-optimal solutions. The algorithm has the ability to search for suitable logical conditions. The ant colony algorithm is based on the example of the behavior of living ants in nature. Ants are able to find the shortest solution by adapting to changes in the environment. The authors proposed a modified ant colony algorithm for solving the problem of data mining. The clustering problem was chosen as the task of data mining. Clustering is a combining of similar objects into groups, is one of the fundamental tasks in the field of data analysis and Data Mining. The list of application areas where it is applied is wide: image segmentation, marketing, anti-fraud, forecasting, text analysis and many others. The solution to this problem is of particular relevance in the context of the constantly growing volume of generated, transmitted and processed data. Classical clustering methods are optimized by combining with the proposed bioinspired optimization algorithm - the ant algorithm. The proposed method is a model in which ants are represented as agents that randomly move in the solution space with some restrictions (for example, obstacles in their path). To determine the effectiveness of the developed modified ant algorithm (ALA) with the clustering algorithm, the authors carried out a series of computational experiments. For comparison, we took the genetic algorithm, the monkey algorithm and the wolf algorithm. The simulation results prove that the clustering-based ant algorithm gives better results than other proposed algorithms.

Текст научной работы на тему «РЕШЕНИЕ ЗАДАЧИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ НА ОСНОВЕ БИОИНСПИРИРОВАННОГО АЛГОРИТМА»

УДК 004.89 DOI 10.18522/2311-3103-2021-6-89-99

Э.В. Кулиев, Д.Ю. Запорожец, Ю.А. Кравченко, М.М. Семенова

РЕШЕНИЕ ЗАДАЧИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ НА ОСНОВЕ БИОИНСПИРИРОВАННОГО АЛГОРИТМА*

Рассматривается биоинспирированный алгоритм для решения задач интеллектуального анализа. Интеграция биоинспирированных алгоритмов для решения задач интеллектуального анализа данных является перспективным направлением исследований. В качестве биоинспирированного алгоритма, рассмотрен алгоритм, основанный на адаптивном поведении муравьиной колонии. Алгоритм муравьиной колонии позволяет производить качественный поиск перспективных решений для получения оптимальных и квазиоптимальных решений. Алгоритм обладает способностью выполнять поиск подходящей логических условий. Алгоритм муравьиной колонии основан на примере поведения живых муравьев в природе. Муравьи способны находить кратчайшее решение адаптируясь к изменениям окружающей среды. Авторами предложен модифицированный алгоритм муравьиной колонии для решения задачи интеллектуального анализа данных. В качестве задачи интеллектуального анализа данных выбрана задача кластеризации. Кластеризация - объединение в группы схожих объектов - является одной из фундаментальных задач в области анализа данных и Data Mining. Список прикладных областей, где она применяется, широк: сегментация изображений, маркетинг, борьба с мошенничеством, прогнозирование, анализ текстов и многие другие. Решение данной задачи приобретает особую актуальность в условиях постоянно растущего объема генерируемых, передаваемых и обрабатываемых данных. Классические методы кластеризации оптимизированы путем объединения с предложенным алгоритмом биоинспирированной оптимизации - муравьиным алгоритмом. Предложенный метод представляет собой модель, в которой муравьи представлены в виде агентов, которые случайным образом перемещаются в пространстве решений с некоторыми ограничений (например, препятствия на их пути). Для определения эффективности разработанного модифицированного муравьиного алгоритма (АСО) с алгоритмом кластеризации, авторами была проведена серия вычислительных экспериментов. Для сравнения были взять генетический алгоритм, алгоритм обезьян и алгоритм волков. Результаты моделирования доказывают, что муравьиный алгоритм на основе кластеризации дает лучшие результаты, чем другие предлагаемые алгоритмы.

Оптимизация муравьиной колонии; интеллектуальный анализ данных; кластеризация.

E.V. Kuliev, D.Yu. Zaporozhets, Yu.A. Kravchenko, M.M. Semenova

SOLUTION OF THE PROBLEM OF INTELLECTUAL DATA ANALYSIS BASED ON BIOINSPIRED ALGORITHM

The article discusses a bioinspired algorithm for solving the problems of intellectual analysis. The integration of bioinspired algorithms for solving data mining problems is a promising area of research. As a bioinspired algorithm, an algorithm based on the adaptive behavior of an ant colony is considered. The ant colony algorithm allows for a high-quality search for promising solutions to obtain optimal and quasi-optimal solutions. The algorithm has the ability to search for suitable logical conditions. The ant colony algorithm is based on the example of the behavior of living ants in nature. Ants are able to find the shortest solution by adapting to changes in the environment. The authors proposed a modified ant colony algorithm for solving the problem of data mining. The clustering problem was chosen as the task of data mining. Clustering is a combining of similar objects into groups, is one of the fundamental tasks in the field of data analysis and Data Mining. The list of application areas where it is applied is wide: image segmentation, marketing, anti-fraud, forecasting, text analysis and many others. The solution to this problem is of

*

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 18-29-22019.

particular relevance in the context of the constantly growing volume of generated, transmitted and processed data. Classical clustering methods are optimized by combining with the proposed bioinspired optimization algorithm - the ant algorithm. The proposed method is a model in which ants are represented as agents that randomly move in the solution space with some restrictions (for example, obstacles in their path). To determine the effectiveness of the developed modified ant algorithm (ALA) with the clustering algorithm, the authors carried out a series of computational experiments. For comparison, we took the genetic algorithm, the monkey algorithm and the wolf algorithm. The simulation results prove that the clustering-based ant algorithm gives better results than other proposed algorithms.

Ant colony optimization; data mining; clustering.

Введение. Целью интеллектуального анализа данных является извлечение знаний из данных. Интеллектуальный анализ данных - это междисциплинарная область, ядро которой находится на пересечении машинного обучения, статистики и баз данных.

В интеллектуальном анализе данных цель состоит в том, чтобы обнаружить знания, которые не только точны, но и понятны для пользователя. Понятность важна всякий раз, когда обнаруженные знания будут использоваться для поддержки решения, принятого пользователем-человеком [1]. В конце концов, если обнаруженные знания непонятны для пользователя, он не сможет интерпретировать и подтвердить их. В этом случае, вероятно, пользователь не будет достаточно доверять обнаруженным знаниям, чтобы использовать их для принятия решений. Это может привести к неправильным решениям.

Существует несколько задач интеллектуального анализа данных, включая классификацию, регрессию, кластеризацию, моделирование зависимостей и т.д. Каждую из этих задач можно рассматривать как своего рода проблему, которую необходимо решить с помощью алгоритма интеллектуального анализа данных. Поэтому первым шагом при разработке алгоритма интеллектуального анализа данных является определение того, какую задачу будет решать алгоритм

Разработка алгоритмов муравьиной колонии для решения задач интеллектуального анализа данных является перспективным направлением исследований. В контексте обнаружения правил алгоритм ACO обладает способностью выполнять гибкий и надежный поиск подходящей комбинации терминов (логических условий), включающих значения атрибутов предиктора

1. Постановка задачи. Использование различных методов оптимизации развивалось на протяжении многих лет, и было предложено множество методов для того, чтобы приблизиться к оптимальному решению или набору приближенных решений для целого ряда задач в конкретных областях.

Социальные насекомые, такие как муравьи, выполняют ряд задач как группа, а не атомарно. Такое поведение иллюстрирует высокий уровень интеллекта роя.

Интеллектуальный анализ данных, дисциплина, которая состоит из методов обнаружения ранее неизвестных, действительных закономерностей и взаимосвязей в больших наборах данных, была признана ключевой областью исследований и стала важной технологией с многочисленными практическими приложениями, благодаря широкой доступности огромного объема данных [1-4]. Крупные организации применяют различные методы интеллектуального анализа данных к своим данным, чтобы извлечь полезную информацию и закономерности.

Технология поддержки, полученная в результате совместного использования метода оптимизации муравьиной колонии и интеллектуального анализа данных, приводит к усовершенствованию алгоритмов и методов с многочисленными применениями в реальных задачах и может быть использована в приложениях следующего поколения.

2. Метод оптимизация муравьиной колонии. Идея метода оптимизации муравьиной колонии (ACO) возникла в результате наблюдения за муравьями в ходе поиска пищи. Муравьи по отдельности обладают ограниченными когнитивными способностями, но коллективно способны найти кратчайший путь между источником пищи и своим гнездом. В природе муравьи бродят беспорядочно в поисках пищи. Добившись успеха, они возвращаются в свое гнездо. Во время своего перемещения они выделяют феромон, который образует испаряющийся химический путь. Другие муравьи, которые находят этот след, следуют по нему и укрепляют его, так как они также выделяют феромон. В результате более короткие пути к пище содержат больше феромонов, и по ним с большей вероятностью будут следовать остальные муравьи [5-7]. Таким образом, эта положительная обратная связь в итоге ведет всех муравьев по одному пути. Алгоритмы ACO - вероятностные методы решения вычислительных задач, которые основаны на поиске путей через графики, имитируя поиск муравьями пищи.

Алгоритмы ACO основаны на прокладке феромонного следа и следующем поведении некоторых видов муравьев, которое позволяет реальным колониям муравьев находить кратчайший путь между их колонией и источниками пищи. В настоящее время успешное применение алгоритмов ACO позволяют решать различные сложные алгоритмические разработки и теоретические исследования для сложных задач оптимизации.

В колонии насекомых, таких как муравьи, пчелы и осы каждое насекомое обычно выполняет свои собственные задачи независимо от других членов колонии. Однако задачи, выполняемые разными насекомыми, связаны друг с другом таким образом, что колония в целом способна решать сложные задачи посредством взаимного взаимодействия. Важные проблемы, связанные с выживанием, такие как выбор и сбор материалов, поиск и хранение продуктов питания, которые требуют сложного планирования, решаются колониями насекомых без какого-либо руководителя или централизованного контроллера.

Муравьи способны находить кратчайший путь между источником пищи и гнездом (адаптируясь к изменениям окружающей среды) без использования визуальной информации. Эта способность почти слепых муравьев была тщательно изучена этологами. Они обнаружили, что для обмена информацией о том, по какому пути следует следовать, муравьи общаются друг с другом с помощью следов феромонов (химического вещества). Когда муравьи двигаются, определенное количество феромона падает на землю, отмечая путь следом этого вещества. Чем больше муравьев следует по заданному следу, тем более привлекательным становится этот след для других муравьев. Этот процесс можно описать как цикл положительной обратной связи, в котором вероятность того, что муравей выберет путь, пропорциональна количеству муравьев, которые уже прошли по этому пути [8].

Когда установленный путь между источником пищи и муравьиным гнездом нарушается присутствием какого-либо предмета, муравьи вскоре попытаются обойти препятствие. Во-первых, каждый муравей может выбрать обход слева или справа от объекта с распределением вероятности 0,5-0,5. Все муравьи движутся примерно с одинаковой скоростью и оставляют феромон на тропе примерно с одинаковой скоростью. Поэтому муравьи, которые (случайно) обходят препятствие кратчайшим путем, достигнут исходной дорожки быстрее, чем другие, которые прошли более длинные пути, чтобы обойти препятствие. В результате феромон накапливается быстрее на более коротком пути вокруг препятствия. Поскольку муравьи предпочитают следовать по тропам с большим количеством феромонов, в конце концов все муравьи сходятся на более коротком пути.

ACO был вдохновлен наблюдением за поведением настоящих муравьев. Колонии муравьев состоят из особей муравьев с простым поведением, не способных решать сложные задачи. Однако на коллективном уровне эти общества способны решать сложные задачи, такие как построение оптимальной структуры гнезда или поиск кратчайшего пути к источнику пищи. На рис. 1 показано гнездо муравьиной колонии (в данном примере предполагается, что их насчитывается восемь муравьев), источник пищи и два возможных пути между ними.

/ /ч \ >х

Sal / / \ \ Взш1 >«Я / \ —1V "-ir xV'Í NtM /j¡tY food

"яда* г j к \ /Г \ гг * л Тг

\\// у/ V/

YV / bV W/ Y / XV/ W IW

Шаг 1 Шаг 2 Шаг 3 Шаг 4

Рис. 1. Процедура поиска пищи, за которой следуют муравьи

Интенсивность цвета представляет уровень феромона для каждого пути. Более того, предполагается, что самый короткий путь - это путь A, и он имеет время прохождения, равное одной единице времени, в то время как путь B - самый длинный, с временем прохождения, равным двум единицам времени. Первоначальный выбор одного пути случаен. Предполагается, что половина колонии выбирает путь A, а оставшаяся часть - путь B. Поскольку муравьи, которые прошли по пути A, находятся в источнике пищи, и они разделили определенное количество феромона на этом пути. С другой стороны, муравьи, выбравшие путь B, все еще находятся в середине пути. Когда муравьи, выбравшие путь A в первом путешествии, возвращаются в гнездо, трое из них выбирают путь A, а один выбирает путь B из-за уровня феромона. Ведь муравьи, выбравшие путь А, теперь находятся в гнезде, и они увеличили уровень феромона на этом пути, в то время как муравей, выбравший путь B вместо пути A, чтобы вернуться в гнездо, все еще находится в гнезде. середина этого пути. Муравьи, выбравшие путь B, только что приближаются к источнику пищи [9]. Когда они возвращаются в гнездо из-за большей концентрации феромонов, трое выбирают путь A, и только один выбирает путь B. Семь муравьев, пересекающих путь A, и только один - путь B. В более поздние времена путь A будет иметь большую вероятность быть выбранным, чем путь B, поскольку концентрация феромона уменьшается на пути B (из-за того, что он не используется) и увеличивается на пути А. Однако всегда есть несколько муравьев, исследующих новые пути. Последние позволяют муравьям не застаиваться только на одном пути, придавая методике оптимизации глобальный характер. Описанный выше процесс показывает, как муравьи направляются по кратчайшему пути между гнездом и источником пищи.

Алгоритм ACO должен обладать следующими основными характеристиками: ♦ требуется соответствующее представление проблемы, позволяющее искусственным муравьям постепенно строить решение с использованием вероятностного правила перехода. В качестве примера искусственные муравьи строят свое решение, перемещаясь по графику задач из одного города в другой, пока не завершат алгоритм;

♦ локальная эвристика предоставляет руководство муравью при выборе следующего узла для пути, который он строит. Эта эвристика зависит от проблемы и так как она обратно пропорциональна расстоянию между двумя городами;

♦ вероятностное правило перехода, которое определяет, какой узел искусственный муравей должен посетить следующим. Правило перехода зависит от эвристического значения и уровня феромонов, связанного с ребром, соединяющим два узла;

♦ метод удовлетворения ограничений, который заставляет создавать выполнимые правила [12] муравей должен посетить каждый город один и только один раз во время построения решения;

♦ функция пригодности, которая определяет качество решения, построенного искусственным муравьем. Для алгоритма муравей, который производит замкнутый тур минимальной длины, имеет наибольшее качество;

♦ правило обновления феромонов, которое определяет, как будет происходить модификация следа феромонов, проложенного по краям графика. Уровни феромонов являются неотъемлемой частью правила перехода, упомянутого выше.

Система муравьиных колоний имитирует поведение реальных муравьиных колоний, поскольку искусственные муравьи предпочитают тропы с большим количеством феромона, более короткие пути имеют более сильное увеличение феромона, и муравьи косвенно общаются с другими муравьями, чтобы найти кратчайший путь

3. Современные элементы интеллектуального анализа данных. Интеллектуальный анализ данных фМ) - это процесс анализа данных с целью обнаружения полезных, возможно, неожиданных закономерностей в данных [7, 10-15]. Двумя наиболее важными методами DM являются классификация и кластеризация. Модель классификации выполняет задачу присвоения метки класса неизвестному входному объекту после того, как он был обучен нескольким примерам из заданного набора обучающих данных. С другой стороны, кластеризация - это разделение набора входных данных на подмножества (именованные кластеры), чтобы данные в одном и том же подмножестве имели что-то общее.

Вклад DM в научное сообщество неоспорим. По мере того, как DM становится все более популярным, он получает широкое признание во многих областях, таких как здравоохранение, биомедицина, фондовый рынок, обнаружение мошенничества, телекоммуникации, текстовый и веб-майнинг и другие. В биомедицинских исследованиях в области анализа ДНК привели к открытию генетических причин многих заболеваний и инвалидности, а также подходов к диагностике, профилактике и лечению заболеваний. Кроме того, DM для бизнеса продолжает расширяться, поскольку электронная коммерция и маркетинг становятся основными направлениями розничной торговли.

Разработка языков DM, разработка эффективных и действенных методов и систем интеллектуального анализа данных, создание интерактивных и интегрированных сред интеллектуального анализа данных и приложений интеллектуального анализа данных для решения крупномасштабных прикладных задач являются важными задачами как для исследователей интеллектуального анализа данных, так и для разработчиков систем и приложений интеллектуального анализа данных.

4. ACO и DM. Интересной областью исследований АСО является сочетание с методами DM для классификации и кластеризации задач принятия решений. Моделирование классификации и кластеризации в качестве задач поиска по графам позволяет использовать АСО для поиска оптимальных решений этих задач DM. До сегодняшнего дня АСО сочетался с методами DM для классификации и кластеризации в ограниченном числе исследований [11, 16].

Методы кластеризации данных также были объединены с методами ACO для поиска оптимального решения ряда проблем. Классические методы кластеризации могут быть улучшены, когда они сочетаются с концепциями ACO. Более конкретно, алгоритм Ant K-Средних модифицировал алгоритм кластеризации K-средних по вероятности нахождения объектов в кластере с использованием феромона, в то время как правило этого обновления подчиняется общей дисперсии в пределах кластера [6].

5. Кластеризация данных и оптимизация муравьиной колонии. Базовая модель для методов кластеризации данных, основанная на идеях, полученных из муравьиных колоний, была впервые представлена Deneubourg et al. (1990). Основная идея, лежащая в основе их метода, включает в себя основные действия колонии муравьев по сбору предметов для формирования куч, и сортировки их с различием между различными видами предметов. Предлагаемая модель представляет собой непрерывную модель, в которой муравьи представлены в виде простых агентов, которые случайным образом перемещаются в двумерную (квадратную) сетку с рядом ограничений для того, чтобы складывать свои предметы. Предметы, распределенные в такой среде, могут быть подобраны с вероятностью [1, 2, 17]

рр = (г-Ь)2

или сброшены с вероятностью

р« = Ф2-

На каждом шаге итерации муравей исследует свою окрестность и вычисляет вышеуказанные вероятности. Параметры аг и а2 являются пороговыми константами, и их значения сравниваются со значением функции /, которая обозначает высокую вероятность подбора или опускания предмета. Например, если а1 намного выше /, то Рр сходится к 1, что делает вероятность того, что муравей поднимет предмет, довольно высокой. Функция / - это функция, которая инкапсулирует понятие среднего расстояния между элементами.

На эту процедуру влияет ряд параметров в локальной окрестности агентов, которые задаются эмпирически и могут создавать больше кластеров, чем оптимальное число. Более того, в базовой модели отсутствие феромона в ряде случаев может иметь решающее значение. По этой причине было предложено множество улучшений этого алгоритма.

Основные этапы алгоритма кратко изложены ниже. На этапе инициализации выбираются п точек данных и т муравьев назначаются т узлам (п представляет количество узлов, а т-количество муравьев). Затем выполняется вычисление количества узлов, которые должны посетить муравьи (сначала в первый раз, а затем случайным образом для каждого муравья в произвольных направлениях). После этого выполняется случайный выбор нескольких трасс, и с помощью механизма отбора (в данном случае выбора турнира) алгоритм находит феромонный след с большим количеством. На следующем шаге это количество феромонов каждого следа обновляется и выполняется повторение вышеуказанных шагов, пока все следы количества феромонов не достигнут стабильного состояния. На последнем этапе выполняется кластеризация с использованием значения количества феромонов.

Более того, результаты, полученные с помощью алгоритма ACODF, были сопоставлены с двумя другими известными подходами к кластеризации данных, быстрой самоорганизующейся картой (FSOM), объединяющей К-средние (он же Б80М+К-средние) и генетический алгоритм К-средних ^КА) [6]. Сравнение показало, что алгоритм ACODF работает лучше с точки зрения временных затрат, когда используемые наборы данных представляют собой наборы данных из 300 и

579 выборок, а используемые методы кластеризации являются как несферическими, так и сферическими. Кроме того, ACODF выдает меньшее количество ошибок (лучшие результаты кластеризации), чем два других алгоритма.

Другие подходы включают совершенствование классических методов кластеризации, когда они сочетаются с концепциями ACO. Основная парадигма такого подхода представлена в, где представлен алгоритм Ant K-средних, который модифицирует знакомый алгоритм кластеризации K-средних по вероятности нахождения объектов в кластере с использованием феромона, в то время как правило этого обновления соответствует общей дисперсии в кластере (TWCV). Основным недостатком методов, основанных на алгоритме Ant K-средних и его вариациях, является то, что количество кластеров и соответствующие центроиды должны быть известны заранее и сгенерированы с целью алгоритма кластеризации на основе системы Ant (ASCA).

Этот алгоритм состоит из четырех подпроцедур (разделить, agglomerate_obj, агломерировать и удалить) и вычисляет TWCV. Введенный основной алгоритм изменяет хорошо известный алгоритм K-средних в том, как вычисляется местоположение объектов в кластере, и используемая вероятность изменяется феромоном (обновление феромона в соответствии с TWCV). Первым шагом алгоритма AK (ANT K-means) является фаза инициализации, на которой инициализируются все параметры, включая количество кластеров и его центроид. На втором этапе на каждый путь накладывается равное количество феромона, а затем каждый муравей выбирает центроид с вероятностью Р,

рк _ Tt]^tj

i j уп с-а р' ¿■с Tt]'ltj

где i - начальная точка, j - конечная точка, которую муравей k выбирает в итоге для перемещения, c - центроид, а nc - общее количество центроидов. Следующим шагом является обновление феромона с помощью

тij < Тij ^ TWCV'

где Q - константа. Затем выполняется вычисление объекта О сепtег( Тк), который является центром всех объектов в , где , и при необходимости вы-

полняется пересчет TWCV. Параметр T описывает набор, включающий все используемые объекты (максимальное число равно п). Если TWCV изменяется, вероятность P пересчитывается на третьем шаге. Последним шагом является выполнение процедуры , чтобы перейти от локального минимального решения и если количество итераций выполнено, алгоритм останавливается, в противном случае пересчитывается.

Во время первой итерации алгоритма каждый элемент матрицы инициализируется одинаковыми значениями. По мере выполнения алгоритма матрица феромонов обновляется соответствующим образом, в зависимости от полученных решений. На каждой итерации агенты или программные муравьи производят пробные решения с использованием следов феромонов, чтобы получить оптимальное или почти оптимальное разделение заданных объектов на кластеров (групп). После генерации пробных решений достигается дальнейшее улучшение предлагаемых решений путем выполнения локального поиска. Вероятность феромона используется для выбора между различными кластерами и определяется

- тч Рi j ~ П-^ш

где - нормализованная вероятность феромона для элемента i, принадлежащего кластеру , и .

Экспериментальные исследования. Для определения эффективности разработанного модифицированного муравьиного алгоритма (АСО) с алгоритмом кластеризации, авторами была проведена серия вычислительных экспериментов. Для сравнения были взять генетический алгоритм [20], алгоритм обезьян (МА) [18-19] и алгоритм волков (GWO) [14-17]. Результаты моделирования доказывают, что муравьиный алгоритм на основе кластеризации дает лучшие результаты, чем другие предлагаемые алгоритмы.

Таблица 1

Сравнение предложенных алгоритмов

Алгоритм Время работы (сек) Скорость классификации MSE (среднеквадратическое отклонение)

АСО 7400 98,6667% 0,0156

GWO 8956 88,6667% 0,0725

GA 8412 78,6667% 0,2094

MA 27 729 81,3333% 0,1674

м i» i» г» í»

Итерации

Рис. 2. Кривая сходимости

Факторами, рассматриваемыми для сравнительного исследования, являются сходимость, время выполнения, скорость классификации и MSE. Результаты моделирования доказывают, что муравьиный алгоритм на основе кластеризации дает лучшие результаты, чем другие предлагаемые алгоритмы. Данный алгоритм может быть рассмотрены для будущего исследования задач интеллектуального анализа данных.

Заключение. Была рассмотрена модель для методов кластеризации данных, основанная оптимизации муравьиной колонии. Метод оптимизации муравьиной колонии была вдохновлен поведением настоящих муравьев и того, как они себя ведут, чтобы решить проблемы, такие как поиск пищи или сортировка выводков. Этот метод, названный ACO, и его совместное использование с методом DM кластеризацией, которая является наиболее часто используемой в задачах интеллектуального анализа данных. В этой статье основное внимание уделяется обзору работы по использованию ACO для кластеризации. Технологии, обеспечивающие совместное использование ACO и DM приводят к усовершенствованным алгоритмам и методам с многочисленными применениями.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Jun Wu, Mianxiong Dong, Kaoru Ota, Jianhua Li, Zhitao Guan. Big Data Analysis-Based Secure Cluster Management for Optimized Control Plane in Software-Defined Networks // Network and Service Management IEEE Transactions on. - 2018. - Vol. 15, No. 1. - P. 27-38.

2. Farha Haneef, Ganesh Raj Kushwaha, Ashutosh K. Dubey. Analysis with Data Mining and Ant Colony Algorithm for Implementing of Object Pool Optimization // 2011 International Conference on Communication Systems and Network Technologies.

3. Rodzin S.I., Rodzina L.S. Theory of Bionic Optimization and its Application to Evolutionary Synthesis of Digital Devices // 12th IEEE EAST-WEST DESIGN & TEST SYMPOSIUM (EWDTS 2014). - Kharkov: Kharkov National University of Radio Electronics. - P. 147-151.

4. Bova V.V., Kureichik V.V., Lezhebokov A.A. The integrated model of representation of problemoriented knowledge in information systems // IEEE 8th International Conference on Application of Information and Communication Technologies - AICT2014, Astana. - P. 111-114.

5. Родзин С.И., Курейчик В.В. Теоретические вопросы и современные проблемы развития когнитивных биоинспирированных алгоритмов оптимизации // Кибернетика и программирование. - 2017. - № 3. - С. 51-79.

6. Кравченко Ю.А., Нацкевич А.Н. Модель решения задачи кластеризации данных на основе использования бустинга алгоритмов адаптивного поведения муравьиной колонии и k-средних // Известия ЮФУ. Технические науки. - 2017. - № 7 (192). - С. 90-102.

7. Ершов К.С., Романова Т.Н. Анализ и классификация алгоритмов кластеризации // Новые информационные технологии в автоматизированных системах. - 2016. - Вып. 19.

- С. 274-279.

8. Van D.M. and Engelbrecht A.P. Data clustering using particle swarm optimization // Proceedings of The Congress on Evolutionary Computation. - 2003. - P. 215-220.

9. Кравченко Ю.А., Нацкевич А.Н., Курситыс И.О. Бустинг биоинспирированных алгоритмов для решения задачи кластеризации // Международная конференция по мягким вычислениям и измерениям. - 2018. - Т. 1. - С. 777-780.

10. Shelokar P.S., Jayaraman V.K. and Kulkarni B.D. An Ant Colony Approach for Clustering // Analytica Chimica Acta. - 2004. - Vol. 509, No. 2. - P. 187-195.

11. Yi-Tung Kao, Erwie Zahara and I-Wei Kao. A hybridized approach to data clustering // Expert Systems with Applications. - 2008. - Vol. 34, No. 3. - P. 1754-1762.

12. Changsheng Zhang, Dantong Ouyang and Jiaxu Ning. An artificial bee colony approach for clustering // Expert Systems with Applications. - 2010. - Vol. 37, No. 7. - P. 4761-4767

13. Miao Wan, Lixiang Li, Jinghua Xiao, Cong Wang and Yixian Yang. Data clustering using bacterial foraging optimization // Journal of Intelligent Information Systems. - 2012. - Vol. 38, No. 2. - P. 321-341.

14. Кулиев Э.В., Лежебоков А.А., Кравченко Ю.А. Роевой алгоритм поисковой оптимизации на основе моделирования поведения летучих мышей // Известия ЮФУ. Технические науки. - 2016. - № 7 (180). - С. 53-62.

15. Kursitys I., Kravchenko Y., Kuliev E., Natskevich A. A bioinspired algorithm for improving the effectiveness of knowledge processing // Advances in Intelligent Systems and Computing (см. в книгах). - 2021. - Vol. 1197 AISC. - P. 1491-1498.

16. Kuliev E.V., Zaporozhets D.Y., Kureichik V.V., Kursitys I.O. Wolf pack algorithm for solving vlsi design tasks // Journal of Physics: Conference Series. Ser. "International Conference "Information Technologies in Business and Industry" - 1 - Microprocessor Devices, Telecommunication and Networking" 2019. - P. 022009.

17. Kuliev E.V., Kureichik V.V., Kursitys I.O. Decision making in VLSI components placement problem based on grey wolf optimization // 2019 IEEE East-West Design and Test Symposium, EWDTS 2019. - 2019. - P. 8884371.

18. Курейчик В.В., Кулиев Э.В., Курейчик В.В. Модель адаптивного поведения "обезьян" для решения задачи компоновки блоков ЭВА // Информатизация и связь. - 2018. - № 4. - С. 31-37.

19. Kuliev E., Kureichik V., Kureichik V. Monkey search algorithm for ece components partitioning // Journal of Physics: Conference Series. International Conference Information Technologies in Business and Industry 2018 - Enterprise Information Systems. - 2018. - P. 042026.

20. Bova V.V., Kravchenko Y.A., Kureichik V.V. Development of distributed information systems: ontological approach // Advances in Intelligent Systems and Computing. - 2015. - Vol. 349.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- P. 113-122.

REFERENCES

1. Jun Wu, Mianxiong Dong, Kaoru Ota, Jianhua Li, Zhitao Guan. Big Data Analysis-Based Secure Cluster Management for Optimized Control Plane in Software-Defined Networks, Network and Service Management IEEE Transactions on, 2018, Vol. 15, No. 1, pp. 27-38.

2. Farha Haneef, Ganesh Raj Kushwaha, Ashutosh K. Dubey. Analysis with Data Mining and Ant Colony Algorithm for Implementing of Object Pool Optimization, 2011 International Conference on Communication Systems and Network Technologies.

3. Rodzin S.I., Rodzina L.S. Theory of Bionic Optimization and its Application to Evolutionary Synthesis of Digital Devices, 12th IEEE EAST-WEST DESIGN & TEST SYMPOSIUM (EWDTS 2014). Kharkov: Kharkov National University of Radio Electronics, pp. 147-151.

4. Bova V.V., Kureichik V.V., Lezhebokov A.A. The integrated model of representation of problemoriented knowledge in information systems, IEEE 8th International Conference on Application of Information and Communication Technologies - AICT2014, Astana, pp. 111-114.

5. Rodzin S.I., Kureychik V.V. Teoreticheskie voprosy i sovremennye problemy razvitiya kognitivnykh bioinspirirovannykh algoritmov optimizatsii [Theoretical issues and modern problems of the development of cognitive bioinspired optimization algorithms], Kibernetika i programmirovanie [Cybernetics and programming], 2017, No. 3, pp. 51-79.

6. Kravchenko Yu.A., Natskevich A.N. Model' resheniya zadachi klasterizatsii dannykh na osnove ispol'zovaniya bustinga algoritmov adaptivnogo povedeniya murav'inoy kolonii i k-srednikh [A model for solving the problem of data clustering based on the use of boosting algorithms for adaptive behavior of an ant colony and k-means] Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2017, No. 7 (192), pp. 90-102.

7. Ershov K.S., Romanova T.N. Analiz i klassifikatsiya algoritmov klasterizatsii [Analysis and classification of clustering algorithms], Novye informatsionnye tekhnologii v avtomatizirovannykh sistemakh [New information technologies in automated systems], 2016, Issue 19, pp. 274-279.

8. Van D.M. and Engelbrecht A.P. Data clustering using particle swarm optimization, Proceedings of The Congress on Evolutionary Computation, 2003, pp. 215-220.

9. Kravchenko Yu.A., Natskevich A.N., Kursitys I.O. Busting bioinspirirovannykh algoritmov dlya resheniya zadachi klasterizatsii [Boosting bioinspired algorithms for solving the clustering problem] Mezhdunarodnaya konferentsiya po myagkim vychisleniyam i izmereniyam [International Conference on Soft Computing and Measurements], 2018, Vol. 1, pp. 777-780.

10. Shelokar P.S., Jayaraman V.K. and Kulkarni B.D. An Ant Colony Approach for Clustering, Analytica Chimica Acta, 2004, Vol. 509, No. 2, pp. 187-195.

11. Yi-Tung Kao, Erwie Zahara and I-Wei Kao. A hybridized approach to data clustering, Expert Systems with Applications, 2008, Vol. 34, No. 3, pp. 1754-1762.

12. Changsheng Zhang, Dantong Ouyang and Jiaxu Ning. An artificial bee colony approach for clustering, Expert Systems with Applications, 2010, Vol. 37, No. 7, pp. 4761-4767

13. Miao Wan, Lixiang Li, Jinghua Xiao, Cong Wang and Yixian Yang. Data clustering using bacterial foraging optimization, Journal of Intelligent Information Systems, 2012, Vol. 38, No. 2, pp. 321-341.

14. Kuliev E.V., Lezhebokov A.A., Kravchenko Yu.A. Roevoy algoritm poiskovoy optimizatsii na osnove modelirovaniya povedeniya letuchikh myshey [Swarm search engine optimization algorithm based on bat behavior modeling], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2016, No. 7 (180), pp. 53-62.

15. Kursitys I., Kravchenko Y., Kuliev E., Natskevich A. A bioinspired algorithm for improving the effectiveness of knowledge processing, Advances in Intelligent Systems and Computing, 2021, Vol. 1197 AISC, pp. 1491-1498.

16. Kuliev E.V., Zaporozhets D.Y., Kureichik V.V., Kursitys I.O. Wolf pack algorithm for solving vlsi design tasks, Journal of Physics: Conference Series. Ser. "International Conference "Information Technologies in Business and Industry" - 1 - Microprocessor Devices, Telecommunication and Networking" 2019, pp. 022009.

17. Kuliev E.V., Kureichik V.V., Kursitys I.O. Decision making in VLSI components placement problem based on grey wolf optimization, 2019 IEEE East-West Design and Test Symposium, EWDTS 2019, 2019, pp. 8884371.

18. Kureychik V.V., Kuliev E.V., Kureychik V.V. Model' adaptivnogo povedeniya "obez'yan" dlya resheniya zadachi komponovki blokov EVA [Model of adaptive behavior of "monkeys" for solving the problem of EVA block layout], Informatizatsiya i svyaz' [Informatization and communication], 2018, No. 4, pp. 31-37.

19. Kuliev E., Kureichik V., Kureichik V. Monkey search algorithm for ece components partitioning // Journal of Physics: Conference Series, International Conference Information Technologies in Business and Industry 2018 - Enterprise Information Systems, 2018, pp. 042026.

20. Bova V.V., Kravchenko Y.A., Kureichik V.V. Development of distributed information systems: ontological approach, Advances in Intelligent Systems and Computing, 2015, Vol. 349, pp. 113-122.

Статью рекомендовал к опубликованию к.т.н., доцент С.Г. Буланов.

Кулиев Эльмар Валерьевич - Южный федеральный университет; e-mail: ekuliev@sfedu.ru; г. Таганрог, Россия, тел.: 88634371651; кафедра систем автоматизированного проектирования; доцент.

Запорожец Дмитрий Юрьевич - e-mail: duzaporozhets@sfedu.ru; тел.: 88634371651; кафедра систем автоматизированного проектирования; доцент.

Кравченко Юрий Алексеевич - e-mail: yakravchenko@sfedu.ru; тел.: 88634371651; кафедра систем автоматизированного проектирования; доцент.

Семенова Марина Максимовна - e-mail: bogomolova@sfedu.ru; тел.: 88634371651; кафедра систем автоматизированного проектирования; студент.

Kuliev Elmar Valerievich - Southern Federal University; e-mail: ekuliev@sfedu.ru; Taganrog, Russia; phone: +78634371651; the department of computer aided design; associate professor.

Zaporozhets Dmitriy Yurievich - e-mail: duzaporozhets@sfedu.ru; phone: +78634371651; the department of computer aided design; associate professor.

Kravchenko Yuriy Alekseevich - e-mail: yakravchenko@sfedu.ru; phone: +78634371651; the department of computer aided design; associate professor.

Semenova Marina Maximovna - e-mail: bogomolova@sfedu.ru; phone: +78634371651; the department of computer aided design; student.

УДК 004.896 Б01 10.18522/2311-3103-2021-6-99-114

А.К. Фархуд

УПРАВЛЕНИЕ МОБИЛЬНЫМ РОБОТОМ С ПРИМЕНЕНИЕМ

НЕЙРОННОЙ СЕТИ ДЛЯ ПЛАНИРОВАНИЯ ДВИЖЕНИЯ В НЕКАРТОГРАФИРОВАННОЙ СРЕДЕ С ПРЕПЯТСТВИЯМИ

В данной работе применяется нейронная сеть глубокого обучения специальной структуры, которая позволяет мобильному роботу перемещаться без столкновения с препятствиями в неизвестной среде. Основными проблемами, на решение которых направлены усилия исследователей в области нейросетевых планировщиков движения, являются повышение производительности нейронных сетей, оптимизация их структуры и автоматизация процессов обучения. Основным результатом данной статьи является новый итерационный алгоритм разработки обучающего набора. На первой итерации разрабатывается стартовый обучающий набор и производится начальное обучение нейронной сети. В следующих итерациях обученная на предыдущем этапе нейронная сеть используется в качестве фильтра для следующих обучающих наборов. Фильтр выбирает траектории с коллизиями, обусловленными ошибками нейронной сети. В процессе обучения количество сверточных и полностью связанных слоев итеративно увеличивается. Таким образом, предложенный алгоритм позволяет разработать как обучающий набор, так и архитектуру нейронной сети. Выполняется сравнение результатов обучения для отфильтрованных и нефильтрованных наборов. Подтверждена высокая эффективность фильтрации, в результате которой изменяется распределение примеров в обучающей выборке. Алгоритм может быть использован для разработки блока планирования системы управления мо-

i Надоели баннеры? Вы всегда можете отключить рекламу.