Научная статья на тему 'Математическая модель для обучения и самообучения эксплуатации объектов авиационной техники'

Математическая модель для обучения и самообучения эксплуатации объектов авиационной техники Текст научной статьи по специальности «Математика»

CC BY
141
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / ОБУЧЕНИЕ / САМООБУЧЕНИЕ / ЭКСПЛУАТАЦИЯ СЛОЖНЫХ СИСТЕМ / MATHEMATICAL MODEL / TRANING / SELF-TRANING / EXPLOITATION OF COMPLEX SYSTEMS

Аннотация научной статьи по математике, автор научной работы — Коптев А. Н., Тихонова А. А., Чернышов В. П.

В статье рассматриваются вопросы моделирования, обучения и самообучения эксплуатации сложных систем. Особое внимание уделено формализации взаимодействия в системе "человек-среда".

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MATHEMATICAL MODEL FOR TRANING AND SELF-TRANING OF EXPLOITATION OF AIRCRAFT ENGINEERING OBJECTS

We consider the problems of modeling, training and self-training of exploitation of complex systems. We have took into special account the formalization of interaction in «man-environment» system.

Текст научной работы на тему «Математическая модель для обучения и самообучения эксплуатации объектов авиационной техники»

УДК 62-60

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ДЛЯ ОБУЧЕНИЯ И САМООБУЧЕНИЯ ЭКСПЛУАТАЦИИ ОБЪЕКТОВ АВИАЦИОННОЙ ТЕХНИКИ

© 2011 А.Н. Коптев, А.А. Тихонова, В.П. Чернышов Самарский государственный аэрокосмический университет Поступила в редакцию 12.05.2011

В статье рассматриваются вопросы моделирования, обучения и самообучения эксплуатации сложных систем. Особое внимание уделено формализации взаимодействия в системе "человек-среда". Ключевые слова: математическая модель, обучение, самообучение, эксплуатация сложных систем.

В качестве объекта эксплуатации авиационная техника выступает как некоторая материальная и функциональная целостность, сохранение и регулирование которой - непременное условие ее использования. Совершенствование научного подхода к подготовке специалистов для решения задач эксплуатации, т.е. обнаружение "рассогласования" между существующим и должным, осознание проблемы, выработка цели, поиск средств, оценка результатов и т.п., требует разработки моделей с высоким уровнем формализации процессов распознавания, лежащих в основе обучения эксплуатации сложных технических систем и, в частности, авиационной техники.

Распознавание состояния объекта эксплуатации (систем, устройств, агрегатов и т.д.) предполагает обычно наличие не нескольких, а одной реализации, т.е. реального состояния объекта. При этом возникает задача процесса получения информации о динамике объекта У по одной реализации Х.

Суть его в следующем. С поступившей на вход анализатора (человека-специалиста) реализацией Х0 им моделируются поочередно разные трансформации У1, У2,... :

Yi Y2

Yv -*Xv

Xi ► X2

Каждая из трансформаций превращает одну и ту же реализацию Х0 в набор разных искусственных реализаций Хр Х2, Х3,...

Формально в любой теории распознавания выделяются два раздела, посвященных: а) обучению распознавания как формированию в па-

Коптев Анатолий Никитович, доктор технических наук, профессор, заведующий кафедрой эксплуатации авиационной техники. E-mail: eat@ssau.ru. Тихонова Анастасия Алексеевна, аспирант. E-mail: eat@ssau.ru.

Чернышов Владимир Петрович, менеджер вспомогательного производства ОАО «Самара лифт». E-mail: samaralift@mail.ru.

мяти описания объекта и б) собственно распознаванию как сличению этого описания с новыми реализациями объекта. Более важен для нас первый раздел, в котором рассматривается информативность признаков и описания в целом. Для анализа информативности описания объекта использовался вероятностный подход [ 2 ].

Чтобы структурно реализовать предлагаемые нами алгоритмы обработки информации о динамике распознаваемых объектов, в качестве основы была выбрана структурная модель биологического анализатора, описанная в работе С.В.Фомина, Е.Н.Соколова, Г.Г.Вайткявичуса [9] и ряде работ Е.Н.Соколова [6, 7, 8]. По своему принципу многоуровневого анализа сенсорной информации параллельно в многочисленных каналах данная модель очень близка к перцепт-рону Розенблатта [4]. Это позволило нам применить математический аппарат алгоритмов обучения перцептрона к обучению детекторов и командных нейронов в модели анализатора Е.Н.Соколова при создании на ее основе новой модели константного анализатора, способного к отражению динамики.

Вместе с тем, хотя физическая структура объекта и внешние силы могут иметь небольшое конечное число составляющих, многообразие траекторий перехода из состояния Х4 в Х4+ш может стать бесконечным за счет многообразия сочетаний и перестановок, которые оказываются возможными в небольшой системе составляющих. Поэтому простота интерпретации случайной величины У оборачивается с точки зрения описания объекта сложной лингвистической задачей поиска синтаксиса и морфологии для описания многообразия У на входе анализатора. Данная задача является именно лингвистической, потому что только путем выяснения набора сил, структурных частей объекта (морфологии) и правил их сочетания (синтаксиса), т.е. на основе лингвистической модели, можно упростить запоминание всего многообразия преобразова-

Х

ний объекта и сделать реальным это запоминание в анализаторе.

Рассмотрим более детально процедуру организации обучения, которая экспериментально может привести к формированию в памяти обучаемого сведений о словаре значений У и о Р(У/а к), где сведения о вероятностном распределении Р(У/а к) приводят к увеличению максимума информации, которую потенциально может получить обучаемый о каждом из изучаемых объектов ЛА. Для этого сначала выясним, в виде какой математической величины интерпретируется переменная величина У. Как отмечалось, Ы-мерное параметрическое описание состояния объекта на входе анализатора интерпретируется как точка в Ы-мерном пространстве. Соответственно два последовательных параметрических описания объекта в моменты времени Ь и + представляются в Ы-мерном пространстве в виде двух точек: Х. и Х4+м. Учебная выборка Хуч = Х1, Х2, ..., Х., Х4+м, ... состояний (реализаций) объект, которая используется для обучения распознающей системы, является набором разных пар, каждая из которых состоит из двух соседних по времени реализаций. Однако, как было показано, для изучения трансформаций объекта учебная выборка его реализация, снятая в естественных условиях существования объекта, не годится. В такой выборке X уч не гарантировано, что из состояния точки Х. в состояние-точку Х объект переводится только одним фактором. Траекторией перехода объекта из Х. в Х4+Д в этом случае не обязательно является вектор, начинающийся в точке Х. и оканчивающийся в Х . Есть вероятность, что траекторией перехода является не прямая, а ломаная, если переход совершается под воздействием не одного, а нескольких факторов. Для выяснения ломаной траектории необходимы координаты не только конечных точек Х. и Х , но и промежуточных, которые отсутствуют в составе X 1уч .

В отличие от X "уч , снятой с объекта в естественных условиях, искусственная выборка XИч в последовательности Х1, Х2, ..., Х., Х4+м, ... ни одна из пар реализаций Х. - Х4+Д не содержит на своем промежутке смен факторов, то направление трансформации объекта на всем промежутке до точки Х остается одним и тем же и поэтому является прямолинейным и может быть задано вектором с началом в точке Х. и концом в Х .

Таким образом, благодаря "спрямлению" траектории трансформации объекта в X Ич в отличие от X Уч информация о динамике оказывается представленной в простой лингвистической форме и поэтому может быть декодирована. Декодирование, т.е. измерение случайной величины У. , может быть осуществлено по каждой паре

Х. - Х из XИ путем вычисления угла наклона или направляющих косинусов вектора Уг = {Х.,Х.+п.} в системе координат Х. Следует ожидать, что модуль вектора У. будет отражать степень интенсивности и продолжительности действия фактора. Он будет вариабелен и поэтому малоинформативен. По нашим представлениям, в амплитуде деформаций отражается главным образом вариабельность воздействий окружающей среды. Вариабельность самого объекта, его структура вносят детерминацию прежде всего не в амплитуду, а в направление происходящих с объектом трансформаций. Поэтому в качестве измеряемых значений случайной величины У. следует рассматривать лишь значения направлений вектора Уг без учета его модуля. В этом заключается математическая интерпретация величины У.

Итак, переменная У - это векторная величина. Для ее нахождения используются всякий раз две скалярные величины: Х. и Х , а именно две близко отстоящие во времени реализации "фотографии" изучаемого объекта. Вычисление У по обычной X Уч , состоящей из одинарных реализаций, принципиально невозможно. Это первый вывод, налагающий жесткие требования на процедуру обучения. Второй вывод вытекает из первого и касается экспериментально наиболее оптимального способа получения двух близко отстоящих друг от друга "фотографий" объекта. Этот вывод заключается в том, что в физическом эксперименте наиболее удачным приемом для образования Х. и Х с ранее оговоренными свойствами может быть предъявление на вход системы мгновенных скачков состояния объекта. Под мгновенным скачком понимается быстрый переход объекта из одного состояния в другое.

Таким образом, теперь можно нарисовать общую математическую модель обучения распознающей системы, в качестве которой в работе рассматривается обучаемый.

Для получения сведений о Р(Х/ак), Р(У/ а к) и Р(ак) объекты ( а 1, а 2,..., а к, ..., а М) изучаются трижды. Первый раз они изучаются в естественных условиях существования обучаемого контингента ак ( к = 1, 2, ..., М), в условиях максимально возможного отсутствия возмущающих объект воздействий. В этих условиях в случайные моменты времени существования объекта он предъявляется Учителем на вход обучаемого. Обучаемый в каждый из этих дискретных моментов времени производит многомерное описание состояния объекта. Состояния 8 объекта измеряются Ы-мерным рецепторным полем распознающей системы и описываются Ы-мерной величиной Х (представляются

точками Хр Х2, Х3, ..., Х., Х.+ш, Х ^ в Ы-мерном евклидовом пространстве. По поступившему в обучаемого ряду Xзначе-

ний случайной величины Х находится распределение Р(Х/а к) для каждого а к. Порядок следования элементов в ряду не имеет значения, важен лишь сам факт присутствия элемента в X. Условие максимального отсутствия возмущающих объект воздействий способствует малой дисперсии значений Х в распределении Р(Х/ак) вокруг математического ожидания.

Второй раз те же объекты изучаются для получения сведений о распределении Р(У/ак). Для этого в объект а к вносятся всевозможные воздействия, возмущающие его состояние. Затем в результате такого же, как и в первом случае, N мерного измерения объекта, однако не в случайные моменты времени, а производя его всякий раз до и после окончания очередного воздействия, составляется учебная выборка XИч. При этом имеется Учитель, который: а) дозирует число одновременно действующих факторов, доводя его до одного или другого предельного минимума, б) управляет моментом начала и конца воздействия, синхронизируя их с моментами многомерного измерения объекта. Реально могут быть разные варианты распределения функции Учителя между распознающей системой, моторной системой, генерирующей возмущения, и Учителем. Этот вариант изучения объектов связан с выполнением практических работ.

Наконец, третий раз те же объекты изучаются обучаемым контингентом с целью выявления вероятности Р( а к) каждого из объектов в общей их совокупности ( ^ Р( а к) = 1,0). При этом совокупность объектов предстает в наиболее естественных условиях их существования, без искажения естественного поведения объектов и не блокируя проявление внешних факторов, которые возмущают их состояния. Условно предполагается, что в силу специфики своей природы объекты появляются перед рецепторным полем обучаемого не одновременно, а последовательно. Этот вариант связан с самообучением.

Выше была рассмотрена общая математическая модель изучения объектов, определения вероятностных характеристик их формы и динамики. При этом, говоря о динамике и трансформации изучаемого объекта, имелись в виду такие его трансформации, которые являются линейными, т.е. распространяются на весь объекты как на неделимое однородное тело. Такой случай, когда изучаемые объекты однородны, не содержат в себе структурных частей с разной динамикой, следует рассматривать их как частный простой случай. Перейдем к рассмотрению более общей модели, описывающей образование различных состояний и трансформаций изучаемого объекта.

Модель основывается на предположении, что в общем случае изучаемый объект имеет много-

уровневую структуру составных частей, каждая из которых имеет для изменения состояния свои степени свободы. В результате у каждой из частей может наблюдаться независимость и самостоятельность в характере ее динамики, в способе подвергаться преобразованиям. Так, однородность материала, из которого состоит объект, топологическая его целостность обеспечивают сходный путь превращения и динамики всех его точек при воздействии на него некоторых внешних сил. Вместе с тем, наряду с относительной однородностью объекта при действии других внешних сил в нем может обнаруживаться определенное отличие в свойствах различных частей. Отличие свойств частей выражается в отличии их динамики. В свою очередь, в каждой отдельной части при более тонком анализе могут обнаруживаться еще более мелкие части, хотя и в незначительной мере, но отличающиеся друг от друга по свойствам, а значит, и по степени свободы проявления себя. Данные части проявляют свою независимость динамики при действии некоторого третьего вида внешних сил.

Представим следующим образом общую модель возникновения всевозможных реализаций некоторой группы явлений а 1, а 2, а 3,..., а , ..., а М. Реализации Х явления а 1 будем рассматривать как различные трансформации, т.е. преобразования некоторого однородного исходного состояния а 0. При этом из всех преобразований лишь преобразования определенного вида распространяют свое действие на все явление в целом. Обозначим эту группу преобразований через У( а ° ), а саму операцию преобразования а ° в новые реализации - через У( а ° ). Далее предположим, что явление а структурно состоит из частей а|. Замечено, что над каждой из них отдельно и независимо могут совершаться преобразования другого вида, образующие группу У а |. Каждая из частей а |, в свою очередь, разбивается на части а 2, отличающиеся индивидуальными группами преобразований У а 2 и т.д.

В итоге множество реализаций Х всех явлений а 1, а2, .,а1,..., а М представляется как результат аддитивного действия большого числа различных независимых преобразований У1, У2, ...,Т, ..., У1, совершенных над явлением в целом и над теми или иными его частями а [, где Ь = 1, 2, 3 ... При этом действие некоторой группы преобразований У а| на соответствующую ей часть а| одновременно выливается в преобразование всех частей а[ (где Ь' > Ь), содержащихся в а'.

В соответствии с такой многоуровневой "лингвистической" моделью преобразований в принципе любая реализация Х1 явления а 1, какой бы отличной она не была от исходного его состояния а °, может быть синтезирована путем

определенных преобразований явления а 0 и его частей а[ = 1, 2, 3 ...). Формально этот процесс синтеза можно записать в следующем виде:

Х1 = Уа 0(£ Уа|[£ Yа ?...(£ Уа [(а [))]}.

Многоуровневая иерархия совершаемых над У а 1 преобразований есть грамматика синтеза. Морфологию синтеза составляет набор У а 1 всевозможных видов преобразований явления и его частей (1 = 0,1, 2, ...). Синтаксис преобразований (сочетание элементарных преобразований) вытекает из топологии явления, т.е. многоуровневой структуры образующих его частей. Особенность предлагаемого подхода к выбору "трансформационной грамматики" в том, что она выбирается не априорно, а выводится из эксперимента, т.е. апостериорно. Именно статистические сведения о распределении Р(У/а1) и распределениях Р(У а 1) (1 = 1, 2, ...) его частей позволяют составить однозначную грамматику для синтеза, т.е. экстраполяции всевозможных реализаций одного и того же явления.

Можно отметить, что модель объекта, которая лежит в основе известного корреляционного метода распознавания [5], является частным вариантом вышеописанной модели. В соответствии с моделью корреляционного метода все множество реализаций распознаваемого объекта образуется путем линейных преобразований всего объекта в целом. В предлагаемой модели мы исходим из предположения, что линейные преобразования могут охватывать как весь объект, так и отдельные большие и малые его части.

Очень важным фактором развития этой модели является ее дополнение моделью самообучения (СО) и очень важного аспекта взаимодействием при реализации этого процесса.

При этом очевидно, что любой поведенческий акт или последовательность актов является определением процессов взаимодействия индивида с окружающей средой.

Для описания такого взаимодействия будем использовать следующие понятия. Пусть 8 - множество состояний окружающей среды, Q - множество состояний системы. Действием назовем оператор, переводящий систему и среду из одного состояния в другое. Множество действий обозначим через D. Такое определение действия подразумевает, что оператор d е D однозначно задает результат действия, т.е. состояние среды, которое реализуется после его выполнения. Тогда процесс взаимодействия может быть описан с помощью следующего набора абстрактных объектов: М = ( 8, 0, D, ф, Щ ) , где функции ф и Щ задают процесс изменения состояний системы и выбора действия в зависимости от предыдущих состояний системы и среды. Соответственно

ф х 0 ^ О

щ ^ Б . (1)

Назовем М обобщенной поведенческой моделью (ОПМ). Введенное определение ОПМ полностью совпадает с определением конечного автомата [18]. Однако мы предполагаем, что на множестве 0 может быть определена дополнительная структура, и функции ф и Щ разбиты на множество функций. Если функции ф и Щ рассматривать как распределение условных вероятностей, а множества 8, 0 и D - как пространства элементарных событий, то мы получим определение стохастической обобщенной поведенческой модели.

Процесс взаимодействия, порождаемый моделью, будем представлять с помощью поведенческой функции, которая для детерминированного случая обозначается как В(М, ц0, § ), а для стохастических моделей В8( М, ц0, §), где М = ( 8, 0, D, ф, щ) - обобщенная поведенческая модель (или ее частный случай), ц0 - начальное состояние, § = (§г.^п) - последовательность состояний среды. Значением В(М, ц0, 8) является соответствующая цепочка действий с = ^г.Лп), а В8( М, ц0, § ) представляет собой распределение вероятностей на множестве реакций с, т.е.

В( М, 00, § ) = Рг(ё|§) .

При сравнении моделей будем сопоставлять их структурные и функциональные характеристики. Модели М' = ( 8', 0', D', ф ', Щ ' ) и М"= ( 8", 0", D", ф", щ") назовем структурно-изоморфными, если между их элементами и состояниями элементов можно установить взаимооднозначное соответствие, такое, что связи между этими элементами у модели М' будут такие же, как и у модели М". В случае стохастической ОПМ это означает равенство условных вероятностей переходов между состояниями элементов моделей. Если в моделях Му и М1 множества состояний 0' и 0" тождественно равны (т.е. 0' = 0") и соответствующие связи ф ', Щ ' и ф", Щ" также равны, то М' и М' обладают эквивалентной структурой.

Функциональные характеристики моделей выражены в соответствующих поведенческих функциях. Будем говорить, что модели М' и М' реализуют изоморфное поведение, если между последовательностями § ' е § " и § ' е § " можно установить такое взаимнооднозначное соответствие, что между последовательностями сС' = В(М', , §' и сТ = В(Мq0, § ') также будет существовать взаимнооднозначное соответствие. Формально это означает, что существуют взаимнооднозначные отображения а и в такие, что диаграмма

В(М '0,8'} =

А'-- '

. 1-1

а' в а''

коммутативна.

Изоморфизм поведения говорит о том, что нет качественных различий между поведением одной и другой модели, разница только в обозначениях.

Если мы применяем различные модели для описания поведения в одной и той же реальной ситуации, т.е. когда множества 8 и D заранее определены и тождественны для всех моделей, то можно говорить об эквивалентном поведении. В этом случае для моделей М' и М' должно выполняться равенство В( М, ц0, . ) = В( М", ц0, . ).

Отметим, что процесс СО обычно представляется как возрастание некоторого показателя качества деятельности. С помощью этого показателя оценивается выполнение того или иного действия в зависимости от возникшего состояния среды. Формально это выражается заданием некоторой функции L на множестве пар (8, ф, т.е. L (8, ф.

Пусть состояния среды ..., 8п реализуются в последовательные дискретные моменты времен Ь = 1, 2, ..., п. В ответ на них летчик производит некоторые действия ^ ..., тогда значения L = L1 ..., L(sn, dn) = Ln можно представить как значения некоторой функции ^^Ь), где Ь дискретно.

Если человеку несколько раз предъявляется ситуация 8, а dk - действие, выполняемое им при к-м предъявлении, то значения L(s, dk) = Ц , к = 1, 2, ..., п также можно представить как значения некоторой функции L1(k). Функции ^^Ь) и L1(k) обычно называют кривыми СО. В качестве характеристик процесса СО берутся параметры кривых СО, такие, как скорость научения, изменение ее и т.п. Наиболее существенный параметр - время Ь* или количество повторений k*, необходимые для выхода на плато, т.е. время или количество повторений, после которого показатель качества деятельности практически перестает возрастать.

Эмпирическое содержание таких параметров кривой СО, как скорость, ее изменение, момент выхода на плато, достаточно очевидно. Площадь под кривой СО, как предложено в работе [6], может служить оценкой сложности выполняемой деятельности.

Рассмотрим теперь эмпирическое содержание функции L(s,d). Эта функция может быть порождена на основе индивидуального опыта человека и имплицитно представлена только в психике индивида. В этом случае процесс СО можно наблюдать, только фиксируя собственные состояния человека.

Чаще функция L(s,d) представлена как некоторый нормативно-одобренный критерий оценки действий в той или иной ситуации, тогда его формализация позволяет фиксировать процесс СО через изменение значения L(s,d). В экспериментальных исследования функция L(s,d) обычно представлена в форме задачи, которую предлагают решить испытуемому.

С помощью функции L(s,d) можно количественно сравнить процессы взаимодействия, реализуемые той или иной поведенческой моделью.

Таким образом, функционально процесс СО представляется как систематическое изменение взаимодействия человека с окружающей средой. Однако, оно не дает ответа на вопрос о причинах изменения, т.е. о строении внутренних механизмов, составляющих основу процесса СО. Различные психологические теории предлагают различные трактовки механизма изменения организации системы, приводящего к перестройке поведения. Введенные в статье понятия позволяют перейти к сравнительному анализу различных моделей СО.

Одними из первых моделей, примененных для описания процесса СО, были модель, представляющие кривую СО в виде зависимости между качеством решения задачи и количеством повторений [1, 4]. Эти модели, однако, не давали функционального представления о самом СО, т.е. это было описание скорее кривой СО, чем самого процесса.

Рассмотрим только те модели, которые представляют описание поведения индивида в процессе СО. Первым классом таких моделей будут модели "стимул-реакция", или 8^ модели. 8-R модель представляет собой вырожденную обобщенную поведенческую модель со структурой Z = (8, R, (р ), где (р : 8 ^ R в случае детерминированной ОПМ и j задает вероятность появления г при условии, что предъявлен s в случае стохастической ОПМ.

Легко видеть, что ни детерминированная, ни стохастическая модель не способна описать изменение поведения, а следовательно, и процесс СО.

Для описания СО модель должна предусматривать возможность изменения связей между стимулом и реакцией. Кроме того, эта модификация связей между стимулом и реакцией. Кроме того, эта модификация связей должна происходить под воздействием определенного подкрепления.

Для учета перечисленных факторов нам необходимо дополнить структуру 8^-модели множеством стимулов подкрепления и зависимостью связи между 8 и R от параметра, выбор которого определяется стимулом подкрепления.

В рамках концепции Торндайка и Хала СО состоит в образовании связей, но связи эти пони-

маются как устойчивые состояния организма. Состояние оказывается здесь как бы промежуточной переменной между раздражителем и ответом.

Такое представление очень близко к понятию конечного автомата [18], которое составит основу следующего класса обобщенных моделей. В данной статье такой автомат будем называть автоматом состояний.

Система

А = ( 8, О, R, р, щ), где р : 8 х О ^ О; щ : 8 х О ^ R, (2)

представляет детерминированный автомат состояний. Множество О есть множество состояний автомата, а функции р и у - соответственно функции переходов и выхода. Представляя функции р и Щ как соответствующие распределения условных вероятностей, получим определение стохастического автомата состояний.

В работе [23] показано, что 8^-модели составляют более узкий класс, чем автоматы состояний, т.е. при определенных условиях всегда найдется такой автомат состояний, которому нет функционбально эквивалентной 8^-модели.

Выше отмечалось, что смена состояний, определяющих связи между раздражителями и ответами, часто происходит только под воздействием стимула подкрепления. Для описания такой структуры достаточно более узкого класса - автоматов подкрепления, которые являются частным случаем автоматов состояния. В этом случае Б = Бои^,а р : 80 х О^ Ци щ : 81 х О^ R.

Легко видеть, что для любого автомата подкрепления можно построить изоморфный ему автомат состояний, у которого Б = Б0 и , а все остальные элементы те же. При этом автомат состояния будет обладать поведением, эквивалентным поведению автомата подкрепления, т.е. их поведенческие функции будут тождественно равны.

В отличие от концепции подкрепления связей Торндайка и Хала многие исследователи пользуются для описании механизма процесса СО понятием выдвижения гипотез [1]. Как отмечалось в хоошо известной книге Р. Аткинсона, Г.Бауэра, Э.Кротерса [1], при соответствующем выборе условий эксперимента можно получить результаты, подтверждающие справедливость как одного, так и другого подхода. Попытаемся вскрыть формальные различия в этих двух представлениях.

В наиболее общей форме модель СО, опирающуюся на концепцию выдвижения гипотез, можно представить в виде ОПМ, у которой 80 -множество подкреплений; 81 - множество ситуаций; Н - множество гипотез (состояний модели); R - множество реакций. Выбор следующей гипотезы происходит в зависимости от подкрепления (или неподкрепления) предыдущей, а ре-

акцию определяет принятая гипотеза и одна из ситуаций множества 81. Это полностью соответствует схеме автомата подкрепления.

Модели, основанные на выдвижении гипотез, описываемые в [1, 4], могут быть представлены соответствующими автоматами подкрепления. Существенный недостаток этих моделей в том, что в них никак не отражен процесс формирования модификации гипотез.

Таким образом, показано, что структуры моделей, основанных на концепциях подкрепления связей и выдвижения гипотез (если не рассматривается процесс формирования и модификации гипотез), изоморфны и могут быть представлены автоматом подкрепления с той лишь разницей, что в одном случае используется термин "множество состояний", а в другом - "множество гипотез".

Для описания процесса перехода из состояния в состояние или смены гипотез предлагается использовать аппарат марковских цепей [22].

Если в качестве множества состояний рассматривать множество троек {8, ц, г}, 8е 8, О, ге R в структуре, соответствующей ОПМ, то процесс функционирования в принципе можно описать с помощью марковской цепи, если только он удовлетворяет условию ( ).

В работе [24] марковская цепь определяется с помощью переходных операторов. Если (х;,1 = 1,2,..., п} - множество состояний однородной конечной марковской цепи, а (х^ = 1,2,...} - векторы вероятности состояний в момент времени то функционирование цепи задается уравнением

х+1 = Т^ , (3)

где Т - линейный оператор.

Если задавать еще множество выходов

1 = 1,2, ..., п} и их вероятностей {гг, Ь = 1, 2, ... , п}, то уравнение

г+1 = , (4)

где R - линейный оператор, совместно с (7) определит марковскую поведенческую модель.

С помощью простых выкладок можно показать, что эта модель структурно и функционально эквивалентна стохастической ОПМ со структурой ( 8, о, ^ р, щ), где р : О^ о, а Щ: О^ ^

Таким образом, среди рассмотренных моделей ("стимул-реакция", автоматы, марковские цепи) автомат состояний обладает наибольшей описательной мощностью. Существенный недостаток моделей этого класса заключается в том, что они не отражают структуру связей между ситуациями и реакциями на них в процессе СО, не описывают процессов формирования и модификации гипотез.

Следуя методам, разработанным в математической теории систем [14], конкретизация моде-

ли может быть проведена путем введения структуры ее элементов, что позволит не только ответить на вопрос, какие связи установлены между элементами модели (ситуациями и реакциями), но и выдвинуть гипотезу о причинах существования именно таких связей.

Первым шагом конкретизации может служить представление множества S через упорядоченный набор признаков. Это положение, как правило, лежит в основе различных теорий распознавания образов [2], среди которых наибольший интерес с точки зрения построения моделей СО представляют так называемые персептроны [15].

В данной работе персептрон будет интересовать нас прежде всего как система, способная к СО. Персептронная модель СО также может быть отнесена к концепциям "подкрепления связей". Наиболее существенную эмпирическую поддержку персептронное представление процесса СО в области психофизиологии, начиная с обоснования принципа персептрона Ф. Розен-блаттом [18] и кончая разработкой на основе идей персептрона концептуальной рефлекторной дуги Е.Н. Соколова [20], которая состоит из слоев рецепторов, предетекторов, детекторов и командных нейронов. Коэффициенты связи между элементами слоев могут изменяться под воздействием проходящих по ним сигналов. Самообучение (модификация реакций командных нейронов) также может происходить под воздействием модулирующих нейронов.

Дальнейшее развитие система персептрона получила при переходе к дискретным методам описания стимулов, которые представляют любую ситуацию как совокупность признаков, принимающих значение из некоторого множества.

В самом общем виде персептронную модель СО можно представить следующим набором объектов:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

<So,S1,{Qij>, A,Rф), (5)

где S0 - множество стимулов; St - множество стимулов подкреплений; Q - множество состояний i-го элемента узла j-го слоя; А - множество состояний управляющего элемента (элемент, управляющий связями между узлами); ф - множество функций переходов; R - множество выходов.

Легко видеть, что система (5) представляет собой некоторую конкретизацию системы (1). С помощью несложных выкладок можно показать, что для любого персептрона (5) существует автомат состояний (2), отвечающий на последовательность стимулов той же последовательностью реакций, что и персептрон, т.е. обладающий эквивалентным поведением. Для этого достаточно представить набор состояний каждого элемента персептрона как состояние автомата (2). Такая конкретизация дает возможность представить в концепции под-

крепления не только наличие связи между стимулом и реакцией, но и выдвинуть гипотезу о механизме, опосредствующем эту связь.

Очевидно, что эти разновидности СО могут быть представлены персептроном с разной функцией влияния состояния управляющего элемента на состояния узлов.

Таким образом, персептронные модели поведенчески эквивалентны автоматным моделям, но позволяют представить некоторый механизм связи и ее модификации при СО между ситуациями и ответными реакциями. Однако эти модели, как и автоматные, не описывают процессов формирования и модификации гипотез.

Как отмечалось, многие модели процесса СО опираются на концепцию выдвижения и проверки гипотез. Однако в автоматных моделях СО процесс смены гипотез представляется как выбор из некоторого множества, в то время как реально это процесс изменения (модификации) гипотез.

Анализ моделей СО показывает, что процесс СО может трактоваться двояким образом: с одной стороны, СО - как внешне фиксируемое изменение поведения, с другой - СО как изменение состояния индивида, т.е. изменение внутренней организации. Рассмотренные здесь математические модели описывают изменение организации как переход между состояниями или изменение коэффициентов связи в пределах заданной структуры модели. Дальнейшее развитие этого направления необходимо вести по пути создания моделей с перестраиваемой структурой.

Из проведенного теоретического анализа моделей СО можно сделать следующие выводы:

• внешне (функционально) процесс СО представляет собой изменение поведения, при котором изменяется некоторый заранее заданный показатель качества, обычно представленный как нормативно-одобренный критерий оценки действий;

• изменение поведения происходит за счет перестройки внутренней организации системы, таким образом, СО есть изменение организации системы;

• параметрами, описывающими процесс СО, могут служить скорость СО, его интенсивность, количество повторений, необходимых для насыщения;

• структуры моделей, основанных на концепциях подкрепления связей и выбора из множества гипотез, изоморфны и могут быть описаны автоматом подкрепления;

• модели автоматного типа позволяют описывать процесс СО как изменение поведения, но плохо представляют процесс перестройки внутренней организации при СО;

• персептронные модели СО поведенчески эквивалентны автоматным и представляют со-

бой их конкретизацию, которая делает возможным описание не только наличия связи между стимулом и реакцией, но и механизма, опосредствующего эту связь.

РЕЗЮМЕ

Введение единой формальной системы понятий позволило нам провести теоретический анализ моделей процессов СО, первоначально представленных на различных языках. Попытка описания поведения человека в этой системе понятий привела к более глубокому пониманию явления, позволила вскрыть некоторые нечеткости в описании эмпирических эквивалентов отдельных моделей СО. Это полностью подтверждает тезис о том, что "проникновение в психологические исследования математических методов существенно изменяет их характер. С одной стороны, возникают новые возможности исследования психических явлений, с другой -предъявляются более строгие требования к понятийному аппарату психологии, к постановке задач исследования ..." [13]

СПИСОК ЛИТЕРАТУРЫ

1. Аткинсон Р., Бауэр Г., Кротерс Э. Введение в математическую теорию обучения. М., 1969.

2. Васильев В.И. Распознающие системы. Киев, 1969. 150 с.

3. Венда В.Ф. Перспективы развития психологической теории обучения операторов // Психол. журн. 1980. Т.1. №4. С. 48-63.

4. Венда В.Ф. Инженерная психологий: синтез систем

отображения информации. М., 1975.

5. Крылов В.Ю. Нормативные модели принятия решений при вероятностном выборе // В кн.: Нормативные и дескриптивные модели принятия решений. М., 1981. С. 39-46.

6. Месарович М., Токахара Я. Общая теория систем: математические основы. М., 1978.

7. Небылицин В.Д. Современное состояние факторного анализа // Вопр. Психологии. 1960. №1.

8. Основы инженерной психологии / Под ред. Б.Ф.Ломова. М., 1977.

9. Пиаже Ж. Роль действия и формирования мышления // Вопр. Психологии. 1965. №6.

10. Розенблатт Ф. Принципы нейродинамики. М., 1965.

11. Себестиан Г.С. Процессы принятия решений при распознавании образов. Киев, 1965. 225 с.

12. Соколов Е.Н. Нейронные механизмы в памяти обучения. М., 1981.

13. Соколов Е.Н. Психофизиология принятия решения / / В кн.: Нормативные и дескриптивные модели принятия решений. М., 1981. С. 75-83.

14. Соколов Е.Н., Измайлов Ч.А., Измайлова Т.В., Зимачев М.М. Сферическая модель цвтового зрения // Вестн. МНУ. Сер.14 Психология. 1977. №1. С.45-52.

15. Фомин С.В., Соколов Е.Н., Вайткявичус Г.Г. Искусственные органы чувств. М., 1979.

16. Хант Э. Искусственный интеллект. М., 1978.

17. Kieras E.D. Finite automata and S-R models // J. Math.

Psychol.,1976, vol.13. Р.127-147.

18. Larkin H.S., Wickens D.T. Population states and eigenstructure: а simpliaying view of Markov learning models // J. Math. Psychol., 1980, vol.22, №3. Р. 176208.

19. Katal O., Iwai S. Construction of a conditional probability learning model and information theoretical evaluation of its refficiency // J. Math. Psychol., 1979, vol.19, №3. Р. 259-294.

20. Halff Н.М. Parametrizations off Marcov models for two-state learning // J. Math. Psychol., 1976, vol.14. Р. 125129.

MATHEMATICAL MODEL FOR TRANING AND SELF-TRANING OF EXPLOITATION OF AIRCRAFT ENGINEERING OBJECTS

© 2011 A.N. Koptev, A.A. Tikhonova, V.P. Chernyshev

Samara State Aerospace University

We consider the problems of modeling, training and self-training of exploitation of complex systems. We have took into special account the formalization of interaction in "man-environment" system. Key words: mathematical model, traning, self-traning, exploitation of complex systems.

Anatoliy Koptev, Doctor of Technical Sciences, Professor, Head at the Aircraft Maintenance Department. E-mail: eat@ssau.ru.

Anastasia Tihonova, Graduate Student. E-mail: eat@ssau.ru. Vladimir Chernishov, manager. E-mail: samaralift@mail.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.