Научная статья на тему 'Кластеризация с помощью нейронных сетей и поиск зависимостей'

Кластеризация с помощью нейронных сетей и поиск зависимостей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
283
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАСТЕРИЗАЦИЯ / КЛАССИФИКАЦИЯ / НЕЙРОННАЯ СЕТЬ / СЕТЬ КОХОНЕНА / SOM / ОБУЧЕНИЕ СЕТИ / ФУНКЦИОНИРОВАНИЕ СЕТИ / ФУНКЦИЯ ГАУССА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Юнусова Лилия Рафиковна, Магсумова Алия Рафиковна

В статье рассматривается кластеризация при помощи нейронных сетей. Кластеризацией можно назвать задачу размещения входящих образов по категориям или иначе говоря кластерам, так чтобы близкие векторы (схожие образы) оказались в одной категории. Отличие задачи кластеризации от похожей на нее задачи классификации заключается в том, что набор категорий изначально не задан и определяется в процессе обучения нейронной сети. Примером задачи кластеризации служит задача сжатия информации путем уменьшения разнообразия данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Кластеризация с помощью нейронных сетей и поиск зависимостей»

КЛАСТЕРИЗАЦИЯ С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ

И ПОИСК ЗАВИСИМОСТЕЙ 1 2 Юнусова Л.Р. , Магсумова А.Р.

1Юнусова Лилия Рафиковна - магистрант; 2Магсумова Алия Рафиковна - магистрант, направление: информатика и вычислительная техника, магистерская программа: технология разработки программного обеспечения кафедра информационных систем, отделение информационных технологий и энергетических систем Высшая инженерная школа Набережночелнинский институт Казанский федеральный университет, г. Набережные Челны

Аннотация: в статье рассматривается кластеризация при помощи нейронных сетей. Кластеризацией можно назвать задачу размещения входящих образов по категориям или иначе говоря кластерам, так чтобы близкие векторы (схожие образы) оказались в одной категории. Отличие задачи кластеризации от похожей на нее задачи классификации заключается в том, что набор категорий изначально не задан и определяется в процессе обучения нейронной сети. Примером задачи кластеризации служит задача сжатия информации путем уменьшения разнообразия данных.

Ключевые слова: кластеризация, классификация, нейронная сеть, сеть Кохонена, БОЫ, обучение сети, функционирование сети, функция Гаусса.

Кластеризация или естественная классификация — это процесс объединение в группы объектов, обладающих схожими признаками. В отличие от обычной классификации, где количество групп объектов фиксировано и заранее определено набором идеалов, здесь ни группы и ни их количество заранее не определены и формируются в процессе работы системы исходя из определённой меры близости объектов.

Кластеризация применяется для решения многих прикладных задач: от сегментации изображений до экономического прогнозирования и борьбы с электронным мошенничеством.

Существует несколько основных методов разбиения групп объектов на кластеры. В данной статье описан кластеризатор на основе нейронной сети Кохонена.

Нейронная необходимо сеть Кохонена

Искусственная нейронная сеть Кохонена или самоорганизующаяся карта признаков (80М) была предложена финским исследователем Тойво Кохоненом в начале 1980-х годов.

Она представляет собой двухслойную сеть. Каждый нейрон первого (распределительного) слоя соединен со всеми нейронами второго (выходного) слоя, которые расположены в виде двумерной решетки.

Нейроны выходного слоя называются кластерными элементами, их количество определят максимальное количество групп, на которые система может разделить входные данные. Увеличивая количество нейронов второго слоя можно увеличивать детализацию результатов процесса кластеризации.

Функционирование сети

Система работает по принципу соревнования - нейроны второго слоя соревнуются друг с другом за право наилучшим образом сочетаться с входным вектором сигналов, побеждает тот элемент-нейрон, чей вектор весов ближе всего к входному вектору сигналов. За меру близости двух векторов можно взять квадрат евклидова расстояния. Таким образом, каждый входной вектор относится к некоторому кластерному элементу.

Обучение сети

Для обучения сети Кохонена используется соревновательный метод. На каждом шаге обучения из исходного набора данных случайно выбирается один вектор. Затем производится поиск нейрона выходного слоя, для которого расстояние между его вектором весов и входным вектором - минимально.

По определённому правилу производится корректировка весов для нейрона-победителя и нейронов из его окрестности, которая задаётся соответствующей функцией окрестности. В данном случае в качестве функции окрестности была использована функция Гаусса.

Рис. 1. Функция Гаусса: где и - номер нейрона в двумерной решетке второго слоя сети, для которого вычисляем значение к; с - номер нейрона-победителя в двумерной решетке второго

слоя сети; Г - параметр времени

Список литературы

1. Бенджио, Гудфеллоу, Курвилль: Глубокое обучение. Издательство: ДМК-Пресс, 2018 г. С. 400-455.

2. Осовский С. Нейронные сети для обработки информации, 2002г, С. 252-291.

i Надоели баннеры? Вы всегда можете отключить рекламу.