Научная статья на тему 'К ВОПРОСУ ИСПОЛЬЗОВАНИЯ САМООРГАНИЗУЮЩЕЙСЯ КАРТЫ КОХОНЕНА ДЛЯ ОБРАБОТКИ АНАЛИЗИРУЕМЫХ ДАННЫХ'

К ВОПРОСУ ИСПОЛЬЗОВАНИЯ САМООРГАНИЗУЮЩЕЙСЯ КАРТЫ КОХОНЕНА ДЛЯ ОБРАБОТКИ АНАЛИЗИРУЕМЫХ ДАННЫХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
53
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
САМООРГАНИЗУЮЩАЯСЯ КАРТА КОХОНЕНА / СЕТИ КОХОНЕНА / НЕЙРОННЫЕ СЕТИ / КЛАСТЕР / ОБРАБОТКА / SELF ORGANIZING MAP / SOM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Жжонов В.А., Евсина В.А., Широбокова С.Н.

В процессе ведения информационной деятельности скапливается большой набор данных, который отражает специфические особенности производимой работы. Не всегда хранимая информация находится в упорядоченном и понятном виде, благодаря чему с ней очень тяжело работать. Это затрудняет выполнение анализа, увеличивает сроки обработки. Решить эту проблему в силах нейросети. Сегодня нейронные сети повсеместно используются во многих сферах деятельности, за счёт их применения, например, появляется возможность более тщательно анализировать ситуацию на рынке и принимать соответствующие решения, прямо влияющие на успех. Благодаря использованию нейросети можно провести набор информации в удобный для анализа вид. В статье будет приведен перечень информации о самоорганизующейся карте Кохонена, касающийся принципов работы нейронной сети. Рассмотрена обработка тестовых данных с визуализацией карт.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON THE ISSUE OF USING THE KOHONEN SELF-ORGANIZING MAP FOR PROCESSING THE ANALYZED DATA

In the process of conducting information activities, a large set of data accumulates, which reflects the specific features of the work performed. The stored information is not always in an orderly and understandable form, which makes it very difficult to work with it. This complicates the analysis, increases the processing time. Neural networks can solve this problem. Today, neural networks are widely used in many fields of activity, due to their application, for example, it becomes possible to analyze the market situation more thoroughly and make appropriate decisions that directly affect success. Thanks to the use of a neural network, it is possible to carry out a set of information in a convenient form for analysis. The article will provide a list of information about the self-organizing Kohonen map, concerning the principles of the neural network. The processing of test data with visualization of maps is considered.

Текст научной работы на тему «К ВОПРОСУ ИСПОЛЬЗОВАНИЯ САМООРГАНИЗУЮЩЕЙСЯ КАРТЫ КОХОНЕНА ДЛЯ ОБРАБОТКИ АНАЛИЗИРУЕМЫХ ДАННЫХ»

К вопросу использования самоорганизующейся карты Кохонена для

обработки анализируемых данных

В.А. Жжонов, В.А. Евсина, С.Н. Широбокова

Южно-Российский государственный политехнический университет (НПИ) имени М.И. Платова, Новочеркасск

Аннотация: В процессе ведения информационной деятельности скапливается большой набор данных, который отражает специфические особенности производимой работы. Не всегда хранимая информация находится в упорядоченном и понятном виде, благодаря чему с ней очень тяжело работать. Это затрудняет выполнение анализа, увеличивает сроки обработки. Решить эту проблему в силах нейросети. Сегодня нейронные сети повсеместно используются во многих сферах деятельности, за счёт их применения, например, появляется возможность более тщательно анализировать ситуацию на рынке и принимать соответствующие решения, прямо влияющие на успех. Благодаря использованию нейросети можно привести набор информации в удобный для анализа вид. В статье будет приведен перечень информации о самоорганизующейся карте Кохонена, касающийся принципов работы нейронной сети. Рассмотрена обработка тестовых данных с визуализацией карт.

Ключевые слова: самоорганизующаяся карта Кохонена, сети Кохонена, нейронные сети, кластер, обработка, Self Organizing Map, SOM.

В современном мире повсеместно используются нейросети. Они нашли свое применение во многих областях, касающихся науки, производства, искусства и даже развлечений. Разумеется, наиболее ощутимую пользу от их применения можно ощутить в сферах, которые имеют непосредственную связь с обработкой данных. Накопленные объемы информации, которые продолжают увеличиваться, нужно оперативно обрабатывать, чтобы получить от них наибольшую пользу [1]. На данный момент существует множество различных нейронных сетей, позволяющих решать множество подобных проблем. Одним из вариантов сети, который отлично подходит под задачи кластеризации, анализа, а также прогнозирования, является нейронная сеть Кохонена, которую относят к самоорганизующимся сетям [2]. Её также разделяют на слои и карты Кохонена. Слои - это сети с неупорядоченными нейронами, а карты, напротив, с упорядоченными. Метод, включающий в

себя самоорганизующуюся карту (Self Organizing Map, SOM) Кохонена, был разработан в 1982 году финским ученым Тейво Кохоненом [3].

Основной особенностью нейросети является то, что она позволяет визуализировать многомерное пространство в виде двумерного [4-5]. Такая интерпретация обеспечивает более удобное восприятие обработанной информации. На рис. 1 показана схема самоорганизующейся карты, где видно, что данные из входного вектора распределяются по всей карте, занимая при этом свое место, соответствующее определенным признакам.

Карта

[X1 Х2 ХЗ Х4 ... Хп]

Вектор входных данных

Рис. 1. - Самоорганизующаяся карта Кохонена Сама карта состоит из ячеек, чаще всего, шестиугольной формы, что показано на рис. 2, однако, ячейки могут быть и прямоугольными. В ячейку попадают близкие по признакам объекты, после чего к ней применяется определённый цвет, который зависит от самих значений параметров объекта, присвоенного ей, а также помогает определить глубину параметра. Таким

образом для каждого отдельного параметра строится своя, соответствующая ему, двумерная карта.

В картах обучение производится без учителя и благодаря механизмам конкуренции. Это означает, что выигрывает нейрон, у которого направление весов менее всего отличается от направления входных данных. Подобный нейрон это - нейрон-победитель [6-7]. Иными словами, каждая итерация соответствует активации одного узла, где сети доступны лишь характеристики образца входных данных [8]. Вокруг него образуется радиус обучения, который определяет количество нейронов, помимо победителя, которые будут учувствовать в коррекции весов на текущей итерации. Туда войдут те нейроны, расстояние от вектора весов которых будет меньше радиуса обучения. В процессе обучения радиус уменьшается [9]. Веса нейронов, которые находятся в области радиуса, обучаются по правилу Кохонена:

где х - входной вектор, к - номер цикла, п - коэффициент скорости обучения. Сам процесс обучения состоят из двух фаз:

Рис. 2. - Пример ячейки карты Кохонена

(к+1) Ре) , (ЛЕ) Г (*)!

= - .V - г/. ,

X — IV.

и

1) Выбор наибольшего значения скорости и радиуса обучения

2) Точная настройка весов

Первая фаза применяется для начального распределения векторов нейронов, по основным направлениям в выборке данных, а заключительная фаза необходима для корректировки весов, при меньшей скорости обучения нейросети. Само обучение производится, пока погрешность сети не будет являться малой величиной:

,2

^ „ 2 = 1 ||

где р - количество элементов в наборе входных данных, w - вектор весов нейрона победителя.

Стоит также отметить, что входные значения следует нормировать для наиболее правильного обучения. Это можно сделать с помощью формулы:

где Хц - нормированное значение вектора.

Рассмотрим построение карты Кохонена на примере тестовых данных, представленных в таблице 1.

Таблица №1

Тестовый набор данных для анализа

Количество билетов Длительность Регион Период

1 2 3 4

15 2 Европа 01.сен

16 4 Азия 02.сен

17 5 Европа 03.сен

18 5 Европа 04.сен

19 4 Европа 05.сен

20 6 Европа 06.сен

22 4 Азия 08.сен

23 1 Америка 09.сен

24 4 Азия 10.сен

Продолжение таблицы №1

1 2 3 4

25 8 Азия 11.сен

26 6 Америка 12.сен

27 5 Америка 13.сен

28 4 Америка 14.сен

29 8 Европа 15.сен

30 4 Америка 16.сен

31 2 Америка 17.сен

32 5 Европа 18.сен

33 1 Америка 19.сен

Для работы с данными и построения используем инструменты аналитического пакета Deductor Academic [10]. Определим количество билетов, длительность, регион в качестве входных параметров для обучения, представлено на рис. 3.

Рис. 3. - Входной набор данных Далее произведем построение карт входов для данных. Итого сформировалось 4 карты, отражающие параметры, которые были загружены для обработки в виде кластеров, отмеченных на каждой карте черным контуром. Выделяя ячейку на одной из карт, можно увидеть, какие ячейки на

других картах будут соответствовать ей (представлено на рис. 4).

Рис. 4. - Сформированные карты входов

Итак, возможности, предоставляемые картами Кохонена, позволяют значительно упростить анализ информации, путем вывода их в удобной для работы с данными форме.

Литература

1. Питкевич П.И. Методы объединения, сокращения размеров и обработка больших данных // Инженерный вестник Дона, 2022, №7. URL: ivdon.ru/ru/magazine/archive/n 12y2021/7338.

2. Кохонен, Т. Самоорганизующиеся карты. М.: Лаборатория знаний, 2021. 660 с.

3. Хайкин С. Нейронные сети: полный курс. М.: Издательский дом «Вильямс», 2006. 1104 с.

4. Алёшин С.П. Бородина Е.А. Нейросетевое распознавание классов в режиме реального времени // Инженерный вестник Дона, 2022, №7. URL: ivdon.ru/ru/magazine/archive/n1y2013/1494.

5. Achraf Khazri. Self Organizing Maps (Kohonen's maps) // Towards Data Science, 2019 URL: towardsdatascience.com/self-organizing-maps-1b7d2a84e065

6. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия - Телеком, 2006. 383 с.

7. Тархов, Д. А. Нейронные сети. Модели и алгоритмы. М. : Радиотехника, 2005. 256 с.

8. Eklavya. Kohonen Self-Organizing Maps A special type of Artificial Neural Network // Towards Data Science, 2019. URL:towardsdatascience.com/kohonen-self-organizing-maps-a29040d688da.

9. Осовский, С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2002. 344 с.

10. Карта Кохонена. URL: basegroup.ru/deductor/function/algorithm/kohonen.

References

1. Pitkevich P.I. Inzhenernyj vestnik Dona, 2022, №7. URL: ivdon.ru/ru/magazine/archive/n 12y2021/7338.

2. Koxonen, T. Samoorganizuyushhiesya karty. [Self Organizing Maps]. M.: Knowledge Lab, 2021. 660 p.

3. Hajkin S. Nejronnye seti: Polnyj Kurs. [Neural networks: Full Course]. M.: Williams Publishing House, 2006. 1104 p.

4. Alyoshin S.P. Borodina E.A. Inzhenernyj vestnik Dona, 2022, №7. URL: ivdon.ru/ru/magazine/archive/n 1y2013/1494.

5. Achraf Khazri. Towards Data Science, 2019. URL: towardsdatascience.com/self-organizing-maps-1b7d2a84e065

6. Rutkovskaya D., Pilinskij M., Rutkovskij L. Nejronnye seti, geneticheskie algoritmy i nechetkie sistemy. [Neural networks, genetic algorithms and fuzzy systems]. M.: Hotline - Telecom, 2006. 383 p.

7. Tarxov, D. A. Nejronnye seti. Modeli i algoritmy. [Neural networks. Models and algorithms]. M.: Radio Engineering, 2005. 256 p.

8. Eklavya. Towards Data Science, 2019. URL: towardsdatascience.com/kohonen-self-organizing-maps-a29040d688da.

9. Osovskij, S. Nejronnye seti dlya obrabotki informacii. [Neural networks for information processing]. M.: Finance and statistics, 2002. 344 p.

10. Karta Koxonena. [Kohonen Map]. URL: basegroup.ru/deductor/function/algorithm/kohonen.

i Надоели баннеры? Вы всегда можете отключить рекламу.