Научная статья на тему 'Влияние обучающих выборок на процесс обучения адаптивных нейро-нечетких сетей для решения задачи классификаций деталей'

Влияние обучающих выборок на процесс обучения адаптивных нейро-нечетких сетей для решения задачи классификаций деталей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
183
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРО-НЕЧЕТКАЯ СЕТЬ / ОБУЧАЮЩАЯ ВЫБОРКА / КЛАССИФИКАЦИЯ ДЕТАЛЕЙ / СИСТЕМА НЕЧЕТКОГО ВЫВОДА / NEURAL-FUZZY NETWORK / TRAINING DATA / CLASSIFICATION OF DETAILS / FUZZY INFERENCE SYSTEM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Нгуен Д. М.

В работе рассматривается задача классификации с помощью системы нечеткого вывода, описываются возможности ANFIS для решения задачи, и обсуждается влияние экспериментальных данных на качество получаемых результатов. Приводятся результаты применения ANFIS для создания системы классификации втулок, анализируется зависимость точности работы системы от количеств обучающих выборок.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The effects of training data in the learning process of adaptive neural-fuzzy networks for solving the problem of classification of details

This work consider the problem of fuzzy inference system for classification, describes possible solutions to the problem of ANFIS and the impact of experimental data on the quality of results. The application of ANFIS to create a classification system of plugs, depending on system accuracy is analyzed on the amounts of training data.

Текст научной работы на тему «Влияние обучающих выборок на процесс обучения адаптивных нейро-нечетких сетей для решения задачи классификаций деталей»

Выполним простые математические преобразования:

Считая что

I

J шах т г

'test — '-ha.s

ггdb г г do гт

Строго говоря, у нас нет никаких оснований считать, что предыдущее выражение верно. Но, учитывая то, что обе части равенства относятся к одной и той же записи (оригинальный вариант и закодированный), будем считать что при кодировании максимальный уровень сигнала не изменяется или почти не изменяется.

Таким образом, мы вывели формулу для анализа АЧХ и построения нужных для исследования зависимостей. В базе данных

хранится библиотека с информацией о аудиоконтенте в следующем виде: название, исполнитель, baserythm Гц, Г\...Тп Алгоритм поиска информации о запрашиваемом файле сводится к сравнению его ритма с ритмами из библиотеки, хранящейся на сервере. Сравнивается значение длительности каждой ноты, то есть расстояний между максимумами амплитуды.

Считается количество совпадений базового и тестируемого ритмов:

db

получим

db

1, (!слnrythm^ = baserythm О, wmirythm: yt baserythm

у

com

ill pi■ п иr ?iTnm. =£ ПП.ЯР.П1Тnm..

, где i=1..n - количество всплесков, j=1..m - размер библиотеки Идентичность базовому образцу определяется как отношение величины coin к количеству всплесков:

ident = . юо%

п

В зависимости от полученного значения определяется, какую информацию выдавать пользователю.

Литература

1. Фадеев А.С.Идентификация музыкальных объектов на основе непрерывного вейвлет-преобразования. Томск: «Кибернетический центр» ТПУ, 2008. - с. 6-8

2. Асмаков С. Идентификация звука: миссия выполнима.// Компьютер Пресс - 2010 - №10:

http://wwwxompress.ru/artide.aspx?id=21709&iid=991

3. Андреев Г. Напевы Рабиновича.//КомпьюТерра - 2001 - №17 : http://www.kinnet.ru/cterra/394/index.html

4. Булучевский Ю., Фомин В. Краткий музыкальный словарь. — М.: Музыка, 2005. — 461 с.

5. Чанаев С.А. Тестирование MPEG Layer 3 (MP3) кодеров - Самара: СГАСУ, 2004

Нгуен Д.М

Аспирант, Иркутский государственный технический университет ВЛИЯНИЕ ОБУЧАЮЩИХ ВЫБОРОК НА ПРОЦЕСС ОБУЧЕНИЯ АДАПТИВНЫХ НЕЙРО-НЕЧЕТКИХ СЕТЕЙ ДЛЯ

РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИЙ ДЕТАЛЕЙ

Аннотация

В работе рассматривается задача классификации с помощью системы нечеткого вывода, описываются возможности ANFIS для решения задачи, и обсуждается влияние экспериментальных данных на качество получаемых результатов. Приводятся результаты применения ANFIS для создания системы классификации втулок, анализируется зависимость точности работы системы от количеств обучающих выборок.

Ключевые слова: нейро-нечеткая сеть, обучающая выборка, классификация деталей, система нечеткого вывода.

Nguyen D. M

Postgraduate student, Irkutsk State Technical University

THE EFFECTS OF TRAINING DATA IN THE LEARNING PROCESS OF ADAPTIVE NEURAL-FUZZY NETWORKS FOR SOLVING THE PROBLEM OF CLASSIFICATION OF DETAILS

Abstract

This work consider the problem offuzzy inference system for classification, describes possible solutions to the problem of ANFIS and the impact of experimental data on the quality of results. The application of ANFIS to create a classification system ofplugs, depending on system accuracy is analyzed on the amounts of training data.

Keywords: neural-fuzzy network, training data, classification of details, fuzzy inference system.

Введение

Детали, изготавливаемые на машиностроительных предприятиях, обрабатываются с использованием различных технологических процессов. Успешное решение задач унификации и нормализации технологических процессов в большой степени зависит от решения вопросов классификации объектов производства. Для решения задачи классификации деталей можно использовать различные информационные технологии, в том числе адаптивные нейро-нечеткие сети, на основе которых генерируются системы нечеткого вывода [2, 3].

Адаптивные нейро-нечеткие сети или гибридные сети по замыслу их разработчиков призваны объединить в себе достоинства нейронных сетей и систем нечеткого вывода. С одной стороны, они позволяют разрабатывать и представлять модели систем в форме правил нечетких продукций, которые обладают наглядностью и простотой содержательной интерпретации. С другой стороны, для построения правил нечетких продукций используются методы нейронных сетей, что является более удобным и менее трудоемким процессом для системных аналитиков [4].

Вся информация, используемая сетью для построения системы нечеткого вывода, содержится в множестве обучающих выборок. Поэтому качество обучения сети напрямую зависит от количества примеров, а также от того, насколько полно эти примеры описывают данную задачу.

106

В работе рассматривается возможность использования системы нечеткого вывода для решения задачи классификации, формирование обучающих выборок для генерации системы классификации втулок с помощью ANFIS и анализируется точность системы.

Нечеткий логический вывод для задач классификации.

Классификация деталей дает возможность повысить технологичность конструкций деталей; решить вопросы выбора оптимального варианта производственной структуры участка, цеха, завода.

Нечеткая логика - обобщение традиционной Аристотелевой логики на случай, когда истинность рассматривается как лингвистическая переменная, принимающая значения «очень истинно», «более или менее истинно», «не очень ложно» и т.н. Эти лингвистические значения представляются «нечеткими множествами» [4].

Задача классификации состоит в отнесении объекта, заданного вектором информативных признаков X = (X|_,X;,..,jXn), к

одному из наперед описанных классов { dL. d 2,..., dm}.

Классификация соответствует отображению вида:

X = (xL,x;... „Хц) - у ё {dL. d,,..., in,}

Для классификации необходима нечеткая база знаний вида: Если и X; = a-и ... и Хц = an^j1j

ЕЛИ AL = aL f; ИХ; = 8: j; II ... Н Xn= lnj;

илк Х]^ = a, jt и X- = a- jt и ... и xn = an j,

ТО V" = dj. j = 1 ,пт: с некоторой степенью уверенности.

где aj нечеткий терм, которым оценивается переменная Xj в правиле с номером

jt t = 1. kj! kj - количество правил, описывающих класс dj.

Степени принадлежности объекта X* = классам dj рассчитывают по формуле:

= max mm

j = l.m:

a'

где -функция принадлежности входа Xj нечеткому терму a, jt,

В качестве решения выбирают класс с максимальной степенью принадлежности [4]:

У = тах(^,рО,М-щОО.....GO)

Г ибридная сеть как адаптивная система нейро-нечеткого вывода (ANFIS).

Гибридная сеть представляет собой многослойную нейронную сеть специальной структуры без обратных связей, в которой используются обычные (не нечеткие) сигналы, веса и функции активации.

Основная идея, положенная в основу модели гибридных сетей, заключается в том, чтобы использовать существующую выборку данных для определения параметров функций принадлежности, которые лучше всего соответствуют некоторой системе нечеткого вывода. При этом для нахождения параметров функций принадлежности используются известные процедуры обучения нейронных сетей.

С одной стороны, гибридная сеть ANFIS представляет собой нейронную сеть с единственным выходом и несколькими входами, которые представляют собой нечеткие лингвистические переменные. При этом термы входных лингвистических переменных описываются стандартными функциями принадлежности, а термы выходной переменной представляются линейной или константной функцией принадлежности.

С другой стороны, гибридная сеть ANFIS представляет собой систему нечеткого вывода FIS (fuzzy inference system) типа Сугено [4].

Решение задачи классификаций деталей с использованием ANFIS.

В вычислительную среду MATLAB интегрированы десятки пакетов прикладных инженерных и математических программ, одним из них является Fuzzy Logic Toolbox, который поддерживает все фазы разработки нечетких систем, включая синтез, исследование, проектирование, моделирование и внедрение в режиме реального времени [4]. Функции пакета реализуют большинство современных нечетких технологий, включая нечеткий логический вывод, нечеткую кластеризацию и адаптивную нейро-нечеткую настройку (ANFIS).

107

Рис. 1 - Окно редактора гибридных систем.

Редактор нейро-нечеткой сети (ANFIS Editor) позволяет автоматически синтезировать из экспериментальных данных нейронечеткие сети и настраивать их. Графический интерфейс гибридных нейронных систем вызывается из командного окна функцией anfisedit. Исполнение функции приводит к появлению окна редактора гибридных систем, вид которого приведен на рис. 1.

С помощью редактора осуществляется создание или загрузка структуры гибридной сети, просмотр структуры, настройка ее параметров, проверка качества функционировании такой системы. Создание структуры, настройка параметров и проверка осуществляются по выборкам (наборам данных) - обучающей (Training data), проверочной (Checking data) и тестирующей (Testing data), которые предварительно должны быть представлены в виде текстовых файлов (с расширением .dat и разделителями табуляциями), первые колонки которых соответствуют входным переменным, а последняя - единственной выходной переменной. Вид обучающей выборки представлен в табл. 1.______________________________________________________

Табл.1 Фрагмент обучающей выборки

Диаметр Высота Класс

18.5 19.0 5

12.0 17.3 4

12.6 10.0 2

26.5 9.2 3

13 3 1

Обучающая выборка будет использоваться в процессе настройки системы нечеткого вывода для классификации.

Данные записаны в файл data_leam.dat.

В режиме Load data (загрузить данные) выбираем Training и file, нажав кнопку Load Data ... ,загрузим файл data_leam.dat Затем в режиме Generate FIS (создание нечеткой системы вывода) выбираем Grid partition, нажимаем кнопку Generate FIS ..., появится окно задания функции принадлежности. Для каждого входного параметра выбираем pimf - пи-подобную функцию принадлежности, а в качестве параметров функций задаем [6 6], чтобы создать по шесть термов для каждой входной переменной. Функция принадлежности выходной величины назначается как constant.

Рис.2 - Результат обучения сети

108

Далее зададим режим обучения (Train FIS). Не будем менять задаваемые по умолчанию метод настройки параметров (hybrid -гибридный) и уровень ошибки (0), но количество циклов обучения зададим достаточно большим. Получившийся результат в виде графика ошибки сети в зависимости от числа проведенных циклов обучения представлен на рис.2.

Влияние обучающих выборок на процесс обучения адаптивных нейро-нечетких сетей (НС).

При подготовке решения задачи на НС не всегда удается точно определить, сколько и каких входных данные нужно подавать на ее вход при обучении. В случае недостатка данных сеть не сможет обучиться решению задачи. Проблема усугубляется тем, что в большинстве плохо формализуемых областей человеческой деятельности эксперт часто не может точно сказать, какие именно данные являются важными. Поэтому обычно на вход сети подается избыточный набор данных. Для уменьшения времени обучения и повышения качества работы НС требуется определить, какие данные необходимы для решения конкретной задачи. Кроме того, в ходе решения этой задачи определяются значимости входных сигналов, что во многих предметных областях представляет самостоятельную ценность [1].

При отборе данных для НС необходимо учитывать следующие факты:

• при решении реальных задач с помощью НС довольно часто трудно установить связь выходного показателя с имеющимися данными, поэтому проводят сбор как можно большего числа данных;

• наличие корреляции между данными не позволяет произвести их ранжирование и, следовательно, невозможно использовать простой алгоритм отбраковки по степени важности.

• для того чтобы снизить действие фактора «очень большой размерности», часто просто удаляют некоторое число переменных; при этом возможно удаление таких, которые несут существенную информацию.

Чтобы гарантированно получить только полезные (информативные) данные, необходимо выполнить перебор большого количества наборов данных и архитектур НС. Однако практически это реализовать трудно даже при наличии мощных и эффективных нейроимитаторов [1, 5].

Экспериментальные результаты обучения ANFIS

В данной работе исследуется классификация втулок, которые имеют максимальные диаметры и высоты меньше 30 миллиметров, класс детали определен в соответствии с положениями, приведенными в [2, 3]: детали, характеризующиеся определенном соотношением высоты и максимального диаметра, попадут в определенный класс по технологии их обработки. Поэтому можно предположить наличие 5 классов для определенного соотношения высоты и диаметра, то есть 5 значений выходной величины в системе нечеткого вывода. Случайным образом были сгенерированы пять множеств обучающих примеров с разными размерами. В таблице 2 показан характер данных и ошибка обучения ANFIS при использовании этих данных.

Таблица 2.

Количество обучающих примеров Количество экземпляров каждого класса в каждом множестве обучающих примеров Ошибка обучения ANFIS

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Класс 1 Класс 2 Класс 3 Класс 4 Класс 5

30 5 1 3 5 16 0.00003837

50 7 3 6 7 27 0.00000539

100 11 12 11 15 51 0.00000227

150 15 17 16 25 77 0.00000150

200 20 26 23 32 99 0.00000080

Из таблицы 2 видно, что при использовании описанной структуры нейро-нечеткой сети при обучении на разных множествах данных получены разные величины ошибок обучения системы нечеткого вывода. Чем больше число примеров, тем лучше полученный результат, значит, тем точнее система нечеткого вывода для классификации втулок.

Был реализован проверочный режим, фактически классифицирующий 34 реальные втулки на основе системы нечеткого вывода, сгенерированной ANFIS. Результаты приведены в табл. 3; они соответствуют фактическому распределению втулок по классам технологии. Из таблицы видно, что при классификации втулки № 16 наблюдается ошибка из-за неточности в процессе обучения ANFIS. Однако эта ошибка незначительная, то есть можно считать, что эта втулка попадает в класс 1._

Табл.3 Результаты классификации втулок с помощью системы нечеткого вывода.

№ Признаки деталей Результаты классификации

Макс. Высота диаметр Фактически Метод ANFIS

1 28.0 15.0 4 4.0000

2 28.0 9.5 3 3.0000

3 28.0 8.5 3 3.0000

4 28.0 11.0 3 3.0000

5 28.0 10.0 3 3.0000

6 19.0 4.5 1 1.0000

7 19.0 4.5 1 1.0000

8 24.3 20.0 5 5.0000

9 24.3 20.0 5 5.0000

10 23.0 17.0 4 4.0000

11 28.0 18.5 5 5.0000

12 18.2 13.5 4 4.0000

13 18.2 22.5 5 5.0000

14 19.0 4.0 1 1.0000

15 18.0 4.2 1 1.0000

16 19.0 5.3 1 1.1286

17 19.0 4.3 1 1.0000

18 16.0 4.0 1 1.0000

19 23.0 6.5 3 3.0000

20 23.0 6.5 3 3.0000

21 23.0 7.0 3 3.0000

22 23.0 9.0 3 3.0000

23 23.0 8.2 3 3.0000

109

24 12.0 6.5 2 2.0000

25 23.0 10.5 3 3.0000

26 28.0 7.0 3 3.0000

27 23.0 10.5 3 3.0000

28 19.0 5.0 1 1.0000

29 17.0 9.5 2 2.0000

30 26.0 23.5 5 5.0000

31 16.0 18.5 5 5.0000

32 24.0 16.5 4 4.0000

33 28.0 7.3 3 3.0000

34 28.0 15.0 4 4.0000

Заключение

На основе проделанных экспериментов можно сделать вывод, что использование ANFIS для решения задачи классификации деталей является весьма перспективным. Недостатком является то, что качество результатов зависит от качества экспериментальных данных или обучающих выборок. Поэтому отбор обучающих выборок является важным процессом при использовании ANFIS.

Литература

1. Комарцова Л.Г., Максимов А.В. К 63 Нейрокомпьютеры. Учеб. пособие для вузов - 2ое изд, перерав. и доп - М.: изд-во МГГУ им. Н.Э.Баумана 2004. - 400.с.

2. Митрофанов С.П. Научная организация серийного производства. - Изд-во «Машиностроение», 1970. 768 стр.

3. Митрофанов С.П. Групповая технология изготовления заготовок серийного производства. - Л.: Машиностроение, Лелингр. отд-ние, 1985.-240с., ил.

4. Леоненков А. В. Нечеткое моделирование в среде MATLAB и fuzzyTECH. - СПб.: БХВ - Перербург - 2005. - 736с.

5. Нейрокомпьютеры и интеллектуальные работы/ Н.М. Амосов, Т.М. Байдык, А.Д. Гольцев и др.; Под ред. Н.М. Амосова; АН УССР Ин - т кибернетики. Киев: Наукова дума 1991.

Овчинкин О.В.1, Пыхтин А.И.2

'Аспирант, Юго-Западный государственный университет (г. Курск); 2Кандидат технических наук Юго-Западный

государственный университет (г. Курск)

АЛГОРИТМ РАССАДКИ ЛИЦ В АУДИТОРИЯХ ПРИ ПРОВЕДЕНИИ АТТЕСТАЦИОННЫХ, ВСТУПИТЕЛЬНЫХ ИСПЫТАНИЙ ИЛИ ОЛИМПИАД С ПРИМЕНЕНИЕМ ДЕТЕРМИНИРОВАННЫХ ХАОТИЧЕСКИХ РЯДОВ

Аннотация

В статье предложен алгоритм рассадки лиц по аудитории во время проведения вступительных, аттестационных испытаний или олимпиад школьников и студентов с применением детерминированных хаотических рядов.

Ключевые слова: алгоритм рассадки, аттестационные испытания.

Ovchinkin O.V.1, Pykhtin A.I.2

'Postgraduate student Southwest State University (Kursk); 2Candidate of technical Sciences, Southwest State University (Kursk) ALGORITHM SEATING PERSONS IN THE AUDIENCE DURING ATTESTATION, ENTRANCE EXAMINATION OR THE OLYMPICS WITH DETERMINISTIC CHAOTIC SERIES

Abstract

An algorithm of seating people the auditorium at the time of admission, evaluation tests or Olympiad schoolchildren and students with the use of deterministic chaotic series.

Keywords: Seating algorithm, evaluation tests

При проведении вступительных испытаний в образовательные учреждения, аттестационных испытаний при приеме на второй и последующие курсы, олимпиад школьников и студентов требуется осуществить рассадку участников соответствующих мероприятий по аудиториям с соблюдением различных ограничений. Например, при проведении олимпиад школьников требуется, чтобы олимпийцы, сидящие рядом, не представляли один и тот же регион; при проведении аттестационных испытаний требуется, чтобы аттестуемые не учились в одной группе. Основной принцип любой рассадки - перемешать людей в аудиториях в псевдослучайном порядке.

Предлагаем использовать следующий алгоритм:

1. Все участники сортируются по какому-нибудь принципу, например, по фамилии, имени и отчеству.

2. Задается начальный член хаотического ряда.

3. На втором этапе каждому участнику ставится в соответствие следующий член детерминированного хаотического ряда

x„+1 = 1 - 2 • \x\

(например, ряда 1 1 n 1).

Все участники сортируются по возрастанию соответствующего члена хаотического ряда.

Далее осуществляется назначение каждому участнику в отсортированной последовательности аудитории, ряда и места. Это можно сделать тремя вложенными циклами: по всем аудиториям, по рядам в аудитории и по местам в ряду. Проверяется выполнение ограничений на рассадку. Например, если запрещено сажать рядом представителей одной школы, то проверяется, чтобы образовательное учреждение для каждого j-го места i-го ряда не совпадало с образовательным учреждением для j+1 места i+1 ряда. Если ограничение не выполняется, то переход к пункту 3, иначе - переход к пункту 7.

Итоговая последовательность участников сортируется в требуемом порядке, например, по аудитории и по фамилии, имени и отчеству.

Преимущество использования детерминированных хаотических рядов в отличие от псевдослучайных чисел состоит в том, что для заданных начальных условий (первого члена ряда и списка участников) всегда генерируется один и тот же вариант рассадки.

Работа выполнена в рамках государственного задания ЮЗГУ на 2013 год в части проведения научно-исследовательских работ, проект 8.8356.2013 «Модели, алгоритмы и программное обеспечение для управления процессом переводов и зачисления в вуз на второй и последующие курсы».

7

Литература

1. Пыхтин, А. И. Метод и алгоритм решения задачи конкурсного отбора и зачисления в вуз / А. И. Пыхтин, Е. А. Спирин, И. С. Захаров // Телекоммуникации. - М, 2008. - №5. - С. 12-19.

110

i Надоели баннеры? Вы всегда можете отключить рекламу.