Научная статья на тему 'ПРОЕКТИРОВАНИЕ ИНТЕРФЕЙСА ПОЛЬЗОВАТЕЛЯ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ НЕЙРОСЕТЕВОЙ КЛАСТЕРИЗАЦИИ ДАННЫХ'

ПРОЕКТИРОВАНИЕ ИНТЕРФЕЙСА ПОЛЬЗОВАТЕЛЯ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ НЕЙРОСЕТЕВОЙ КЛАСТЕРИЗАЦИИ ДАННЫХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
56
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННЫЕ СЕТИ / МЕТОДЫ КЛАСТЕРИЗАЦИИ / НЕЙРОННАЯ СЕТЬ КОХОНЕНА / ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Куниевский В.В., Дударов С.П.

С каждым годом нейросетевые методы набирают все большую популярность в области анализа данных и машинного обучения. Однако, процесс кластеризации данных с использованием нейросетевых алгоритмов может быть сложным для пользователя без опыта работы с программным обеспечением. Для решения этой проблемы необходимо разработать удобный и интуитивно понятный интерфейс, который позволит пользователям без специальных знаний в области программирования эффективно использовать нейросетевую кластеризацию данных. В этой статье рассматривается проектирование такого интерфейса пользователя программного обеспечения для нейросетевой кластеризации данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Куниевский В.В., Дударов С.П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DESIGNING A SOFTWARE USER INTERFACE FOR NEURAL NETWORK CLUSTERING OF DATA

Every year neural network methods are gaining more and more popularity in the field of data analysis and machine learning. However, the process of clustering data using neural network algorithms can be difficult for a user without experience with software. To solve this problem, it is necessary to develop a convenient and intuitive interface that will allow users without special programming knowledge to effectively use neural network clustering of data. This article discusses the design of such a software user interface for neural network clustering of data

Текст научной работы на тему «ПРОЕКТИРОВАНИЕ ИНТЕРФЕЙСА ПОЛЬЗОВАТЕЛЯ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ НЕЙРОСЕТЕВОЙ КЛАСТЕРИЗАЦИИ ДАННЫХ»

УДК 004.8

Куниевский В.В., Дударов С.П.

Проектирование интерфейса пользователя программного обеспечения для нейросетевой кластеризации данных

Куниевский Валерий Владимирович, студент 3 курса бакалавриата факультета цифровых технологий и химического инжиниринга;

Дударов Сергей Павлович, к.т.н., доцент кафедры информационных компьютерных технологий; dudarov@muctr.ru,

ФГБОУ ВО «Российский химико-технологический университет им. Д.И. Менделеева», Россия, Москва.

С каждым годом нейросетевые методы набирают все большую популярность в области анализа данных и машинного обучения. Однако, процесс кластеризации данных с использованием нейросетевых алгоритмов может быть сложным для пользователя без опыта работы с программным обеспечением. Для решения этой проблемы необходимо разработать удобный и интуитивно понятный интерфейс, который позволит пользователям без специальных знаний в области программирования эффективно использовать нейросетевую кластеризацию данных. В этой статье рассматривается проектирование такого интерфейса пользователя программного обеспечения для нейросетевой кластеризации данных.

Ключевые слова: нейронные сети, методы кластеризации, нейронная сеть Кохонена, программное обеспечение, интеллектуальный анализ данных.

Designing a software user interface for neural network clustering of data

Kunievskiy V.V., Dudarov S.P.

D. Mendeleev University of Chemical Technology of Russia, Moscow, Russian Federation

Every year neural network methods are gaining more and more popularity in the field of data analysis and machine learning. However, the process of clustering data using neural network algorithms can be difficult for a user without experience with software. To solve this problem, it is necessary to develop a convenient and intuitive interface that will allow users without special programming knowledge to effectively use neural network clustering of data. This article discusses the design of such a software user interface for neural network clustering of data. Keywords: neural networks, clustering methods, Kohonen neural network, software, data mining.

Задача проектирования интерфейса пользователя программного обеспечения всегда остается актуальной, так как при ее решении следует учитывать все современные требования к воспроизведению рабочего программного инструмента на новых платформах. Мультидисциплинарное и многоотраслевое использование искусственных нейронных сетей, в свою очередь, вынуждают сосредоточиться на решении соответствующих проблем и при разработке средств интеллектуального анализа данных. Рассмотрим особенности проектирования пользовательского интерфейса современного программного обеспечения для нейросетевой кластеризации данных.

Перед проектированием программного обеспечения необходимо определиться с использованием нейронной сети в зависимости от требуемых результатов, целей кластеризации. В данной статье в примерах будет использована нейронная сеть Кохонена, обучающаяся без учителя, которая используется для кластеризации данных. Она состоит из вектора входных переменных и слоя Кохонена [1]. На входы сети подаются данные для кластеризации, а слой Кохонена выполняет распределение объектов по кластерам путем сравнения входных данных с прототипами, формирующими каждый кластер. Формирование кластера зависит как от случайного порядка примеров, предъявляемых сети в процессе обучения,

так и от архитектуры нейронной сети с соответствующим алгоритмом обучения. Так для нейронной сети адаптивного резонанса АРТ-2, решающей аналогичную задачу, используется не только другой состав этапов алгоритма с расчетными соотношениями, но и иные методы предварительной обработки данных [2].

Для пользователей программного обеспечения, решающего задачи кластеризации данных, важно понимать, как работает выбранная нейронная сеть и какой тип обучения следует использовать в конкретной ситуации. Это поможет эффективно использовать программное обеспечение для достижения желаемых результатов кластеризации данных.

После выбора нейронной сети следует продумать функциональное наполнение программного обеспечения, чтобы дать пользователю максимальные возможности для достижения требуемых целей. При всем этом следует учитывать, что интерфейс программного инструмента должен быть интуитивно понятным, а также защищенным от некорректной работы с ним, то есть необходимо предусмотреть весь спектр ошибок и исключительных ситуаций, которые могут возникать в ходе работы.

Для программного обеспечения нейросетевой кластеризации характерна функциональная структура, представленная на рис. 1.

Интерфейс пользователя

данных

стка данных

>

|Очи

[Изменение данных |

Выборка

Подсистема ввода данных

Ввод параметров кластеризации

Настройка выборки

Ввод весовых коэффициентов

Подсистема настройки кластеризации

Коррекция весовых коэффициентов

Распределение

Фиксированная структура

Результат кластеризации

Используемы е данные

Результаты кластеризации

Случайная инициализация весовых коэффициентов

Коррекция весовых коэффици ентов

Распред ел ени е

Самоорганизация структуры

Подсистема кластеризации

|Прос

:ыотр примеров кластера |

X

Выгрузка примеров кластера

Х

Перенос данных в исходную выборку

С---

Подсистема визуализации результатов

Диаграмма свойств Диаграмма количества примеров кластеров Таблица средних значений кластеров Описание кластеров

Подсистема анализа кластеров

Рис.1. Функциональная структура программного обеспечения для нейросетевой кластеризации данных

Как мы можем видеть на рис.1, функциональная структура включает в себя 5 основных подсистем. При этом следует учитывать, что одна из них, а именно подсистема кластеризации, не связана напрямую с визуализацией исходных данных или результатов.

Рассмотрим подробнее подсистемы данной схемы.

В подсистеме ввода данных происходит внесение выборки и ее редактирование с возможностью считывания данных из нескольких файлов, после чего, в случае если среди выбранных признаков кластеризации в обучающем примере имеются пробелы, он не будет использован в процессе кластеризации, а также кластерного анализа.

Подсистема настройки кластеризации имеет в себе возможности для определения варианта кластеризации, который будет использован, путем

заполнения определенных в данной подсистеме параметров.

По значениям параметров, полученным из ранее описанной подсистемы настройки кластеризации, происходит выбор вида обучения нейронной сети. Данную часть программного обеспечения мы можем видеть в подсистеме кластеризации, которая не видна пользователю во избежание ошибок в работе программы.

Полученные данные записываются в программу для последующего дообучения и анализа кластеров. В данной схеме подсистема визуализации результатов дает возможность просмотра примеров с последующим переносом данных конкретного кластера в качестве исходной выборки либо же выгрузки информации о них в файл.

В приведенной на рис. 1 функциональной структуре присутствует подсистема анализа кластеров, необходимая для удобства работы

пользователя при выделении закономерностей и зависимостей в данных. Она включает различные диаграммы для графической интерпретации результатов, а также таблицы с подробным описанием кластеров.

После определения функциональной структуры можно приступать к программной составляющей приложения, при этом не забывая о том, что интерфейс программы должен быть интуитивно понятен и удобен для работы с ней. Один из способов повышения удобства работы пользования с программным инструментом - выделение нескольких функционально обособленных страниц, привязанных, как правило, к рассмотренным выше подсистемам.

На рис. 2 представлен один из вариантов реализации подсистемы ввода данных с использованием таблицы для демонстрации примеров, добавленных в исходную выборку, а также кнопки для редактирования сделанной выборки.

Среди параметров кластеризации следует по возможности выделить группы для интуитивно понятной настройки алгоритма. На рис. 3 приведен пример реализации подсистемы настройки кластеризации с учётом указанной выше рекомендации.

На рис. 4 показан пример реализации интерфейса подсистемы визуализации результатов нейросетевой кластеризации. Для удобства просмотра примеров, попавших в какой-либо из кластеров, аналогично странице исходных данных, используется табличное представление данных.

Реализация подсистемы анализа полученных кластеров приведена на рис. 5. Как можно увидеть на изображении, данный вариант реализации предусматривает возможность просмотра значений в кластерах с помощью диаграмм и в таблице с содержанием средних значений по каждому свойству.

Главная

Исходные данные

- □ X

Дс (; в бить данные Очистить

Исходные данные

Процедура кластеризации

Кластеры, информация

Диаграммы

Рис.2. Интерфейс подсистемы ввода данных

Главная

Параметры кластеризации

-ох

ИЙМнИ ионные

Процедура клфс териэ вц^ и

Клмтвры. информации онкс

Диаграммы

Необходимые данные Л Скорбетье/овимости [¿13 ] Границ» разрыва 1

Дополнительный сведения л

язтта

зиепдА*

1опа_5-1чг1з

0 Кластеризирсвать г» выбранным свойствам Весовые коэффициенты V

Рис.3. Интерфейс подсистемы настройки кластеризации

Главная

Итоги кластеризации

- п х

Г IpGHMti Г|< «ллгтЕриыцик?

К-лОЛШ*!'' ПЛММЫ^

Процедуре кп5СТ|?ри:)15иии

Кластеры, информация ом

Ляагрвммы

rlint ¿dfCTlG

Ддн1Н -

пДПЗП Lt

bur. R ШОъ fixbica iidtka

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

177.5

Abdcio 1»,5

Амал т.тг ¡в? зз

■4>duWa 1тг.тг

лмал iai-.aa <

Bt<6«pl<f( кЛ«Р(р

ITU.IS

¡аз за

1Е.И

Ш.ЗЗ

¡HI

175-.S

ITS,»

177,S

17VS

177,i

Ш.ЗЗ

Ш.72

«чИ Binsjj... trftrH^. (¡refenr.. drfirt*

163 2И02 SS JO ПТвАжЛ mecfcum БЗ

1» 12022 71 7S nqht me&m hp* 59

154 22Ki ТЗ ч чм

№1 ива 75 S3 Hi irwdun nieihjTi <6

133 22022 79 эд ПН h^n metkjn 7\

14 soгг 64 4« S3

ISO асаг «3 67 hur 55

ггогг 71 85 nft meekjn hw 5J

3» аогг й 72 m^kiii 69

№1 22 СЕ 2 « 85 "Sit medun mediin БЙ

173 ггогг В $7 »ft mefkjn »

ггогг 70 е t л 6C

157 22.022 63 еэ nwkiiTi medun 70

¡51 ггогг 7S та «ft 0 J> 73

1Ы S012 и ?Э thQfjkfti fntfafti 6T

1С» тъ пта -я 71 75 nft s 59

РЧГ1

1 кльстер в та т »ft mtdMn mrtun Si 71

njft

Смв1рС1ь ncp<4ttiw с Ht'lWtJ!

Рис.4. Интерфейс подсистемы визуализации результатов

Рис.5. Интерфейс подсистемы анализа кластеров

С помощью реализованных диаграмм и таблиц пользователь может получить представление о том, какие значения свойств были определены в каждом кластере и как они отличаются от значений в других кластерах. Это помогает лучше понять, какие характеристики объединяют объекты в каждом кластере, и может представлять собой важную информацию для принятия решений.

Таким образом, проектирование удобного интерфейса для нейросетевой кластеризации данных с последующим анализом результатов является важной составляющей процесса исследования данных.

В заключение следует отметить, что нейросетевая кластеризация данных - это важный аналитический инструмент, который позволяет исследовать большие массивы данных. Применение методов нейросетевой кластеризации особенно полезно в областях, где необходимо анализировать большие объемы

информации: при медицинской диагностике, финансовом анализе, в маркетинговых исследованиях и т. д. Целесообразность использования нейронных сетей для анализа данных заключается в их способности работать с данными высокой размерности и извлекать из них скрытые закономерности, обычно незаметные специалисту.

Список литературы

1. Kohonen T. Self-Organizing Maps. - Berlin; Heidelberg; New York; Barcelona, Hong Kong, London, Milan, Paris, Singapore, Tokyo: Springer, 2001. - 501 p.

2. Дударов С. П. Модели самоорганизующихся искусственных нейронных сетей для идентификации стационарных промышленных источников загрязнения воздуха. - Математическое моделирование, 2017, Т. 29, № 1. - С. 33-44.

i Надоели баннеры? Вы всегда можете отключить рекламу.