Научная статья на тему 'Обработка данных для обучения нейронной сети анализирующей состояние асинхронного электропривода'

Обработка данных для обучения нейронной сети анализирующей состояние асинхронного электропривода Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
209
138
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Казаков Д. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Обработка данных для обучения нейронной сети анализирующей состояние асинхронного электропривода»

Список литературы

Lhttp://www.urcd.ru/serviceses/elektrodvigately/elektrodvigately-postoyanog o-toka. html

2. Труды IV Международной (XI Всероссийской) конференции по автоматизированному электроприводу АЭП 2004, Часть 1. Магнитогорск, 14-17 сентября 2004 г. - С. 20

З.Зеленченко А. П. Устройства диагностики тяговых двигателей электрического подвижного состава- М.: Учебно-методический кабинет МПС России, 2002 г.,- С. 38.

4.http://www.induction.ru/library/book_002/pred.html

5.Усольцев A.A. Общая электротехника: Учебное пособие, 2009 г., -С. 243.

6. Беляевский O.A., Курбатова А.Ф., Идиатуллов P.M., Степенков

В.В. Теория и практика измерения частичных разрядов при контроле

-

тации, Санкт-Петербург, октябрь 1999г.

7. http://ru.wikipedia. org/wiki/LabVIEW

8. http://www.labview.ru/labview/what_is_labview/integration_with_ hardware.php

УДК 681.518.5

ОБРАБОТКА ДАННЫХ ДЛЯ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ АНАЛИЗИРУЮЩЕЙ СОСТОЯНИЕ АСИНХРОННОГО ЭЛЕКТРОПРИВОДА

Д. С. Казаков

Магнитогорский государственный технический университет им. Г.И. Носова, Россия, г. Магнитогорск pathfinder00 7@mail. ru

При анализе состояние асинхронного электропривода с помощью нейронной сети необходимо собрать данные для ее обучения. Обучающий набор данных (в случае обучения с учителем) представляет собой набор наблюдений, для которых указаны значения входных и выходных переменных. При работе нейронной сети мы знаем, какими могут быть выходные переменные, но то, что будет подаваться на вход, зачастую вызывает трудности. Первый вопрос, который нужно решить, - какие переменные использовать и сколько (и каких) наблюдений собрать.

Наиболее важным фактором, влияющим на качество обучения, является доступность и целостность данных. Данные должны в полной мере представить все возможные состояния решаемой проблемы, их должно быть достаточно для того, чтобы из них можно было извлечь данные для тестирования и проверки правильности их обработки сетью. Особое внимание следует уделить областям, близким к границе разделяющей классы. В противном случае сеть при попадании переменных в эту область может классифицировать их с ошибкой. Лучше всего, чтобы образцы каждого класса были представлены равномерно.

Так же данные необходимо проверить на согласованность. Величины, значение которых существенно отличается от среднего значения переменной, могут оказывать влияние на сеть, которое не адекватно вызванной ими ошибке. Этот эффект усиливается если выбросы вызваны шумом. Нейронные сети в целом устойчивы к шумам. Однако у этой устойчивости есть предел. По этой причине желательно удалять такие выбросы до начала тренировки. Для выявления и удаления выбросов из тренировочного набора данных могут быть использованы среднее значение и величина стандартного отклонения. Под выбросами понимаются значения, которые лежат далее, чем за заданное число стандартных отклонений от среднего. Два стандартных отклонения охватывают 95% нормально распределённых данных, а три стандартных отклонения охватывают 99%. Но здесь требуется внимательность - подобные значения могут сформироваться и полезной информацией об отказе двигателя. Поэтому предварительно необходимо произвести статистический анализ данный и выявить потенциальные проблемы с ними.

Наборы для тестовых данных и данных для проверки выбираются случайным образом из множества начальных наблюдений. Тестовые данные требуются для того чтобы исключить переобучение сети, а данные для проверки - позволяют проверить адекватность ее работы .

-

лить их количество, необходимое для тренировки сети. Один из главных факторов, влияющих на это - размерность данных. Количество данных, требующихся для тренировки, прямо пропорционально количеству переменных используемых сетью. Данная задача решается либо увеличением набора данных, либо уменьшением их размерности. Существует два основных способа уменьшения размерности. Первый состоит в удалении тех переменных, которые несут наименьшее количе-

-

стью. Второй, более конструктивный метод, состоит в проектировании

-

стью. Этот метод включает преобразование набора данных в меньшее количество новых переменных, которые как можно полнее описывают исходный набор данных. Понижение размерности входных данных может быть выполнено по отношению к одной из двух категорий. Либо в терминах новых входных переменных, либо в терминах выходных эталонных значений.

В большинстве случаев исходные данные требуют масштабирования. Причиной этого является то, что выходы различных функций активации лежат в различных диапазонах. Например, выход сигмои-дальной функции лежит в диапазоне от 0 до 1, у гиперболического тангенса от -1 до 1, а выходные значения линейной функции не ограничены. Другой причиной для выполнения масштабирования данных, или приведения к фиксированному диапазону, является то, что возникают ситуации, когда переменные изменяются в существенно отличных по величине и ширине диапазонах, например, одна в диапазоне от 500 до 5000, а другая в диапазоне от 1 до 10. Очевидно, что ошибки, обусловленные влиянием первой переменной, будут сильнее влиять на тренировку, чем ошибки, обусловленные второй. Приведя изменения переменных к одному общему диапазону, мы обеспечим равное влия-

.

-

ные программно-аппаратные комплексы. Удобным для работы пакетом программного обеспечения является STATISTICA Neural Networks. Простой и удобный интерфейс системы позволяет быстро создавать нейросетевые приложения. Существует возможность встроить решения, подеченные с помощью STATISTICA в уже имеющуюся

.

-

ру данных (для предсказания) несколькими способами: Можно сохранить обученную сеть или ансамбль сетей (например, для вычисления среднего предсказания на основе нескольких архитектур) и затем применить ее к новому набору данных (для предсказания, предсказанной классификации или прогнозирования); Можно использовать генератор кода для автоматического создания программного кода на языке С (С++, С#) или Visual Basic и в дальнейшем использовать его для предсказания новых данных в любой программной среде visual basic или С++ (С#), т.е. внедрить полностью обученную нейронную сеть в уже имеющуюся систему, например управления асинхронным электроприводом. В заключение, все функциональные возможности системы STATISTICA, включая STATISTICA Neural Networks могут быть использованы в качестве СОМ объектов (Component Object Model) в других приложениях (например, Java, MS Excel и т.д.).

Даннные полученные от измерительных приборов

Проверка на доступность и целостность

Проверка на согласованность Устранение шумов

Проверка на избыточность Понижение размерности

Масштабирование

Разделение на наборы

Тестовые набор

Обучающий

Набор для проверки

Рис. 1. Блок-схема обработки данных для обучения нейросети

Плюсом так же является малая ресурсоемкость данного программного пакета. STATISTICA Neural Networks может работать даже на устаревших компьютерах. При построении нейронной сети допускается до 128 слоев без ограничений по количеству нейронов, а вычислительные возможности при решении любых практических задач ограничены только аппаратными возможностями компьютера.

Пакет фирмы "The Math Works" MATLAB также предоставляет пользователям возможность работы с нейронными сетями. Входящий

в стандартную поставку MATLAB Neural Network Toolbox предостав-

-

пов. Использование "Neural Network Toolbox" совместно с другими средствами MATLAB открывает широкий простор для эффективного комплексного использования современных математических методов для решения самых разных задач прикладного и научного характера.

В русскоязычной литературе практически отсутствует методическая литература по применению "Neural Network Toolbox". Это создает определенные сложности, и пользователи предпочитают использовать специализированные нейронно-сетевые программные средства, такие как BrainMaker, NeuroOffice, NeuroPro, Deductor и др.

Так же в среду MATLAB имеются возможности для получения

-

ального времени. Например, Instrument Control Toolbox, который содержит функции для взаимодействия с осциллографами непосредственно из MATLAB. Поддерживаются GPIB и VISA коммуникационные протоколы. Instrument Control Toolbox содержит набор М-файлов и графических интерфейсов, которые позволяют посылать команды на измерительные приборы. Преобразованные данные могут быть двоичные или ASCII.

Выбор методики анализа и обработки данных, образующих наборы образцов представляемых нейронной сети, оказывает существенное влияние на ход обучения. Применение программных пакетов и вышеизложенных методик, позволяет существенно увеличить качество, и

уменьшите время обучения нейронной сети. При этом обеспечивается

-

вичной обработки входных переменных в технологический процесс

.

Список литературы

1. Kevin Swingler Mohiuddin Applying Neural Networks: A Practical Guide / Morgan Kaufmann; Pap/Dsk edition, 1996

2. Каллан Роберт. Основные концепции нейронных сетей / Пер. с англ. — М.: Издательский дом "Вильяме", 2001. — 287 с.

3. Электронный учебник StatSoft: Нейронные сети [Электронный ресурс] / Режим доступа:

http://www.statsoft.ru/home/textbook/default.htm

4. Neural Network Toolbox - Математика [Электронный ресурс] / Режим доступа: http://matlab.exponenta.ru/neuralnetwork/index.php

i Надоели баннеры? Вы всегда можете отключить рекламу.