Научная статья на тему 'Использование результатов математического планирования эксперимента при формировании обучающей выборки нейросети'

Использование результатов математического планирования эксперимента при формировании обучающей выборки нейросети Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
410
98
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКОЕ ПЛАНИРОВАНИЕ / MATHEMATICAL PLANNING / НЕЙРОСЕТЬ / NEURAL NETWORK / ОБУЧАЮЩАЯ ВЫБОРКА / LEARNING SAMPLE / КОСМИЧЕСКИЙ АППАРАТ / SPACE VEHICLE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гришелёнок Дмитрий Анатольевич, Ковель Анатолий Архипович

Рассмотрены результаты применения метода математического планирования эксперимента при формировании обучающей выборки нейронной сети.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of Mathematical Planning of Experiment Method for Neural Network Training

Results of application of experimental design methods to formation of learning sample for neural network are presented.

Текст научной работы на тему «Использование результатов математического планирования эксперимента при формировании обучающей выборки нейросети»

УДК 621.396.6-001.4

Д. А. Гришелёнок, А. А. Ковель

ИСПОЛЬЗОВАНИЕ РЕЗУЛЬТАТОВ МАТЕМАТИЧЕСКОГО ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА ПРИ ФОРМИРОВАНИИ ОБУЧАЮЩЕЙ ВЫБОРКИ НЕЙРОСЕТИ

Рассмотрены результаты применения метода математического планирования эксперимента при формировании обучающей выборки нейронной сети.

Ключевые слова: математическое планирование, нейросеть, обучающая выборка, космический аппарат.

Увеличение срока активного существования космических аппаратов (КА) до 10—15 лет, а также эксплуатация бортовой аппаратуры вне гермоконтейнера предопределяют строгие требования к надежности КА. Эксплуатация бортовой аппаратуры в условиях открытого космического пространства значительно усложняет задачу точного измерения параметров, так как под влиянием внешних факторов может происходить деградация электрорадиоизделий (ЭРИ) и, как следствие, увеличение погрешности измерений. Повышение точности измерений за счет усложнения схемотехнической части измерительных систем снижает их надежность. Решение проблемы компенсации внешних воздействий и упрощения схемотехнического исполнения заключается в математической обработке данных непосредственно при проектировании бортовой аппаратуры КА.

Нейронные сети и проблемы их обучения. Для решения задач компенсации внешних воздействий математическими методами целесообразно применение аппарата нейросе-тей. Нейронные сети (НС) — это современные вычислительные системы, в которых процесс преобразования информации аналогичен процессам, происходящим в мозге человека. Обрабатываемая информация имеет цифровое представление, что позволяет использовать нейронную сеть, например, в качестве модели объекта с совершенно неизвестными характеристиками.

Возможности искусственных нейронных сетей ограничены методом их обучения. Наиболее известным методом обучения нейросетей является алгоритм обратного распространения ошибки [1]. Существенные недостатки этого метода заключаются в непредсказуемости результата, а также длительности процесса обучения, в худшем случае нейросеть может оказаться вообще не обученной. Длительность обучения может быть результатом неоптимального выбора длины шага, а неудачи в обучении обычно возникают по двум причинам: паралича сети и попадания ее в локальный минимум.

Если в процессе обучения нейросети значения весов в результате коррекции становятся очень большими, это может привести к тому, что нейроны будут функционировать в области, где производная сжимающей функции очень мала. Так как посылаемая обратно в процессе обучения ошибка пропорциональна этой производной, то процесс обучения может практически приостановиться. Такое поведение нейросети в процессе обучения называют ее параличом. При обратном распространении ошибки используется разновидность градиентного спуска, т. е. осуществляется спуск по поверхности ошибки с непрерывным подстраиванием веса в направлении минимума. Поверхность ошибки сложной сети сильно изрезана и состоит из холмов, долин, складок и оврагов в пространстве высокой размерности. Сеть может попасть в локальный минимум, когда рядом имеется гораздо более глубокий минимум. В точке локального минимума все направления ведут вверх, и сеть неспособна из него выбраться [2].

52

Д. А. Гришелёнок, А. А. Ковель

Информационная модель объекта исследования. В условиях промышленного производства измерительной аппаратуры, базирующейся на использовании математического аппарата нейросетей, актуальным является уменьшение количества экспериментов для получения обучающих пар. Количество обучающих выборок должно в достаточной степени описывать модель поведения прибора, т.е. содержать максимум информации о взаимном влиянии параметров. С этих позиций представляет интерес использование результатов математического планирования эксперимента (МПЭ) [3].

Важно отметить, что вся информация, которую нейронная сеть имеет о задаче, содержится в наборе примеров. Поэтому качество обучения нейронной сети непосредственно зависит от количества примеров в обучающей выборке, а также от того, насколько полно эти примеры описывают данную задачу.

Для минимизации количества экспериментальных данных при обучении нейросети целесообразно синтезировать недостающие обучающие пары из предварительно построенной математической модели (ММ) измерительного устройства (ИУ) (см. рисунок).

ЭУ

При построении математической модели сложной измерительной системы (например, электронного устройства — ЭУ) на основе экспериментов или наблюдений определяется системная функция Г лишь для конечного количества параметров |хг}:

{х} _ {хвх, •внт •вншК (1)

где хвх — входные, хвнт — внутренние (отклонения параметров ЭРИ, взаимовлияние ЭРИ и др.), хвнш — внешние (температура, напряжение питания, радиация и др.) воздействия соответственно.

При этом значения {у} данной функции и параметры {хг} вычисляются приближенно, так как измерения подвержены ошибкам различной природы. Целью моделирования является получение значений системных откликов при изменении {хг}.

При моделировании сложных технических систем широко используются статистические модели, но в условиях промышленного производства (когда по экономическим причинам или вследствие временных ограничений нельзя получить достаточное количество данных) применение статистических моделей невозможно. В данном случае более эффективна математическая модель, построенная с использованием метода МПЭ. Применение этого метода для построения полиномиальной математической модели, отражающей функционирование электронного устройства в условиях {хг} (см. формулу (1)), позволяет сократить количество проводимых экспериментов [3].

п п п

пэу = Ъо +Еъх + Е Ъ^х] +... + Е V2, (2)

г=1 1=1,]>{ 1=1,] >1

где ПЭУ характеризует реакцию ЭУ на воздействие совокупности факторов, Ъ — коэффициенты регрессии, п — количество факторов.

Точность поведения объекта исследования и его информационной модели определяется свойствами этой модели (порядком нелинейности) и экспериментальными данными. Множество входных и выходных переменных не может содержать все параметры, существенные для

описания поведения системы. Это связано как с техническими условиями, так и с ограниченностью представлений о моделируемой системе. Кроме того, при увеличении числа переменных ужесточаются требования к объему необходимых экспериментальных данных для построения модели. База экспериментальных данных, на которых основывается построение математической модели, рассматривается как объективная реальность. При этом в данных всегда присутствуют погрешности разной природы и шум. Такие особенности базы данных и постановки задач требуют особого подхода к анализу ошибок информационных моделей [4].

При построении математической модели следует учитывать, что из-за разброса внутренних параметров {хвнт} пассивных и активных ЭРИ измерительного устройства влияние факторов {хвх}, {хвнш} на выходной параметр {y} будет различным для каждой реализации ЭУ. Так как речь идет о промышленном изготовлении устройств, то использование индивидуальной математической модели для каждой реализации нецелесообразно, и осуществляется построение обобщенной модели [5].

Формирование обучающей и тестовой выборок. В качестве обучающей выборки используются те же экспериментальные результаты, что и для построения обобщенной математической модели. Если объем данных ограничен, то требуется анализ его достаточности для решения поставленной задачи. В любом случае обучающих данных должно быть больше, чем обучаемых параметров НС. Если результатов эксперимента оказалось недостаточно, то для дополнения обучающей выборки используется обобщенная модель. Такой прием позволяет увеличить количество обучающих пар без увеличения количества экспериментов.

Невязка выхода НС и системной функции на обучающем множестве называется ошибкой обучения НС. Основной интерес представляет отклик НС на новое воздействие, пример которого отсутствует в обучающей выборке. Неизвестная ошибка, допускаемая НС при воздействиях, не использовавшихся при обучении, называется ошибкой обобщения. Основной целью при обучении НС является уменьшение именно ошибки обобщения.

Важно отметить, что незначительность ошибки обучения не гарантирует малого значения ошибки обобщения. Поскольку истинное значение ошибки обобщения недоступно, на практике используется ее оценка. Для ее получения проводится анализ части примеров из имеющейся базы данных, для которых известны отклики системы, но которые не использовались при обучении. Эта выборка примеров называется тестовой. Ошибка обобщения оценивается на множестве примеров из тестовой выборки.

После построения обобщенной математической модели устройства определяются факторы, изменение которых в процессе эксплуатации ЭУ вызывает наибольшее влияние на выходной параметр ПЭУ. Определив наиболее критичные из факторов {хвнш}, проводят дополнительный эксперимент при значениях {хвнш}, соответствующих нормальным условиям эксплуатации ЭУ. Результаты дополнительного эксперимента используются в дальнейшем в качестве тестовой выборки для определения ошибки обобщения.

Применение метода математического планирования эксперимента для получения обучающих пар НС и использование обобщенной математической модели исследуемого устройства позволяют выбрать оптимальное количество проводимых экспериментов.

Рассмотренный подход при формировании обучающей выборки нейросети внедряется в практику разработки бортовой аппаратуры КА.

Исследования, результаты которых представлены в настоящей статье, выполнены в рамках Федеральной целевой программы „Научные и научно-педагогические кадры инновационной России" на 2009—2013 гг., гос. контракт № 02.740.11.0621.

54

А. А. Ковель, С. В. Покидько

список литературы

1. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия—Телеком, 2006. 252 с.

2. Пауков Д. Прогнозирование с помощью искусственных нейронных сетей [Электронный ресурс]: <http://paukoif.fromru.com/neuro/wneuro/index.html>.

3. Барабащук В. И., Креденцер Б. П., Мирошниченко В. И. Планирование эксперимента в технике. Киев: Техника, 1984.

4. Горбань А. Н., Дунин-Барковский В. Л., Кирдин А. Н. и др. Нейроинформатика. Новосибирск: Наука, 1998. 296 с.

5. Ковель А. А. Установление допусков на параметры электронных устройств по результатам многофакторного эксперимента // Изв. вузов. Приборостроение. 2008.Т. 51, № 8. С. 18—22.

Сведения об авторах

Дмитрий Анатольевич Гришелёнок — ОАО „Информационные спутниковые системы" им. акад. М. Ф. Ре-

шетнёва, Железногорск, Красноярский край; инженер-конструктор; E-mail: dimass_13@mail.ru

Анатолий Архипович Ковель — д-р техн. наук, профессор; Сибирский государственный аэрокосмиче-

ский университет им. акад. М. Ф. Решетнёва, кафедра космических информационных систем, Красноярск; E-mail: kovel.bogdan@mail.ru

Рекомендована СибГАУ Поступила в редакцию

19.11.10 г.

УДК 621.396.6-001.4

А. А. Ковель, С. В. Покидько

ИССЛЕДОВАНИЕ ЭЛЕМЕНТНОЙ БАЗЫ БОРТОВОЙ АППАРАТУРЫ В УСЛОВИЯХ КОСМИЧЕСКОГО ПРОСТРАНСТВА

Рассмотрен принцип организации исследований элементной базы бортовой аппаратуры в условиях воздействия факторов космического пространства.

Ключевые слова: элементная база, параллельные исследования, воздействие факторов космического пространства, наземные условия.

Проблемы увеличения сроков активного существования космических аппаратов (КА) приобрели особую актуальность при разработке космической техники в середине прошлого века. Потенциальные возможности совершенствования схемотехники, резервирования и конструирования бортовой аппаратуры были практически исчерпаны, и сдерживающим фактором развития космической техники оказалась элементная база КА (электрорадиоизделия — ЭРИ). При ее разработке не учитывалась специфика условий эксплуатации КА, более того, опыт эксплуатации КА с малым ресурсом показал избыточность массогабаритных параметров контейнерных КА и перспективность использования бесконтейнерных аппаратов. Накопленная информация об эксплуатационной среде КА свидетельствовала о значительном разрыве между требуемыми и возможными качественными показателями существовавших тогда ЭРИ.

В состав систем КА входит широкий спектр устройств различного назначения (механических, электромеханических, электрохимических, оптических, электронных и др.). Очевидно, что корректное комплексное воспроизведение всего спектра эксплуатационных воздействий (тем более, длительное) при наземно-эксплуатационный отработке элементов КА невозможно. Это обусловлено тем, что оборудование, используемое при наземных испытаниях,

i Надоели баннеры? Вы всегда можете отключить рекламу.