Научная статья на тему 'Математическая модель обучения и самообучения техническому обслуживанию сложных систем'

Математическая модель обучения и самообучения техническому обслуживанию сложных систем Текст научной статьи по специальности «Математика»

CC BY
205
76
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
САМООБУЧЕНИЕ / ОБОБЩЁННАЯ ПОВЕДЕНЧЕСКАЯ МОДЕЛЬ / ТЕОРИЯ РАСПОЗНАВАНИЯ / МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / МОДЕЛИ АВТОМАТНОГО ТИПА / ПЕРЦЕПТРОН / SELF-TRAINING / GENERALIZED BEHAVIORAL MODEL / RECOGNITION THEORY / MATHEMATICAL MODEL / MODELS OF AUTOMATIC TYPE / PERCEPTRON

Аннотация научной статьи по математике, автор научной работы — Коптев Анатолий Никитович, Попович Анастасия Алексеевна

В статье проведён анализ различных моделей самообучения с применением единой формальной системы понятий. Рассмотрены модели, основанные на концепциях подкрепления связей и выбора из множества гипотез, модели автоматного и перцептронного типов. Выведен ряд параметров, описывающих процесс самообучения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MATHEMATICAL MODEL OF TRAINING AND SELF-TRAINING IN MAINTENANCE OF COMPLICATED SYSTEMS

The paper presents theoretical analysis of various models of self-training using a uniform formal system of concepts. Models based on concepts of reinforcement of communications and a choice from a set of hypotheses are described as well as models of automatic and perceptron types. A number of parameters describing the process of self-training is derived.

Текст научной работы на тему «Математическая модель обучения и самообучения техническому обслуживанию сложных систем»

УДК 62-60

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОБУЧЕНИЯ И САМООБУЧЕНИЯ ТЕХНИЧЕСКОМУ ОБСЛУЖИВАНИЮ СЛОЖНЫХ СИСТЕМ

© 2013 А. Н. Коптев, А. А. Попович

Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет)

В статье проведён анализ различных моделей самообучения с применением единой формальной системы понятий. Рассмотрены модели, основанные на концепциях подкрепления связей и выбора из множества гипотез, модели автоматного и перцептронного типов. Выведен ряд параметров, описывающих процесс самообучения.

Самообучение, обобщённая поведенческая модель, теория распознавания, математическая модель, модели автоматного типа, перцептрон.

Объект эксплуатации выступает как некоторая материальная и функциональная целостность, сохранение и регулирование которой - непременное условие её использования. Совершенствование научного подхода к подготовке специалистов для решения задач эксплуатации, т. е. обнаружение «рассогласования» между существующим и должным, осознание проблемы, выработка цели, поиск средств, оценка результатов и т.п., требует разработки моделей с высоким уровнем формализации процессов распознавания, лежащих в основе обучения эксплуатации сложных технических систем и, в частности, авиационной техники.

Распознавание состояния объекта эксплуатации (систем, устройств, агрегатов и т. д.) предполагает обычно наличие не нескольких, а одной реализации, т. е. реального состояния объекта. При этом возникает задача процесса получения информации о динамике объекта Y по одной реализации Х.

Суть его в следующем. С наступившей на вход анализатора (человека-специалиста) реализацией Х0 им моделируются поочерёдно разные трансформации Уь У2,... :

Уг

> Х1 Х„

Каждая из трансформаций превращает одну и ту же реализацию Х0 в набор разных искусственных реализаций X!, Х2,

х3,....

Формально в любой теории распознавания выделяются два раздела, посвященных:

а) обучению распознавания как формированию в памяти описания объекта;

б) собственно распознаванию как сличению этого описания с новыми реализациями объекта.

Чтобы структурно реализовать предлагаемые нами алгоритмы обработки информации о динамике распознаваемых объектов, в качестве основы была выбрана структурная модель биологического анализатора. По своему принципу многоуровневого анализа сенсорной информации параллельно в многочисленных каналах данная модель очень близка к перцеп-трону Розенблатта [1]. Это позволило применить математический аппарат алгоритмов обучения перцептрона к обучению детекторов и командных нейронов в модели анализатора Е.Н. Соколова [2] при создании на её основе новой модели константного анализатора, способного к отражению динамики.

Вместе с тем, хотя физическая структура объекта и внешние силы могут иметь небольшое конечное число состав-

ляющих, многообразие траекторий перехода из состояния X! в Х1+Д1 может стать бесконечным за счёт многообразия сочетаний и перестановок, которые оказываются возможными в небольшой системе составляющих. Поэтому простота интерпретации случайной величины Y оборачивается с точки зрения описания объекта сложной лингвистической задачей поиска синтаксиса и морфологии для описания многообразия Y на входе анализатора. Данная задача является именно лингвистической, потому что только путём выяснения набора сил, структурных частей объекта (морфологии) и правил их сочетания (синтаксиса), т.е. на основе лингвистической модели, можно упростить запоминание всего многообразия преобразований объекта и сделать реальным это запоминание в анализаторе.

Рассмотрим более детально процедуру организации обучения, которая экспериментально может привести к формированию в памяти обучаемого сведений о словаре значений Y и о Р^/ак), где сведения о вероятностном распределении Р^/ак) приводят к увеличению максимума информации, которую потенциально может получить обучаемый о каждом из изучаемых объектов. Для этого сначала выясним, в виде какой математической величины интерпретируется переменная величина Y. ^мерное параметрическое описание состояния объекта на входе анализатора интерпретируется как точка в N мерном пространстве. Соответственно, для последовательных параметрических описаний объекта в моменты времени t и t+Дt он представляется в ^мерном пространстве в виде двух точек: и Х1+Д1. Учебная выборка Хуч= Хь Х2, ..., Хъ Х1+Дс, ... состояний (реализаций) объекта, которая используется для обучения распознающей системы, является набором разных пар, каждая из которых состоит из двух соседних по времени реализаций. Однако для изучения трансформаций объекта учебная выборка его реализаций, снятая в естественных условиях существования объекта, не годится. В такой

выборке Хуч не гарантирует, что из состояния точки в состояние-точку Х1+д1 объект переводится только одним фактором. Траекторией перехода объекта из Хг в Х1+Д£ в этом случае не обязательно является вектор, начинающийся в точке и оканчивающийся в Х1+д1 . Есть вероятность, что траекторией перехода является не прямая, а ломаная, если переход совершается под воздействием не одного, а нескольких факторов. Для выяснения ломаной траектории необходимы координаты не только конечных точек и Х1+д1 , но и промежуточных, которые отсутствуют в составе хуч.

В отличие от Хуч, снятой с объекта в естественных условиях, искусственная выборка ХуЧ в последовательности Хь Х2, ..., Хъ Х1+Д£, ... характеризуется тем, что, если ни одна из пар реализаций Хг - Х1+Дс не содержит на своём промежутке смен факторов, то направление трансформации объекта на всём промежутке до точки Х1+дс остаётся одним и тем же и поэтому является прямолинейным и может быть задано вектором с началом в точке и концом в Х1+Д£.

Таким образом, благодаря «спрямлению» траектории трансформации объекта в ХуЧ, в отличие от Хуч, информация о динамике оказывается представленной в простой лингвистической форме и поэтому может быть декодирована. Декодирование, т.е. изменение случайной величины Уг, может быть осуществлено по каждой паре - Х1+Д£ из ХУуЧ путём вычисления угла наклона или направляющих косинусов вектора = {Х^ Х1+Дс} в системе координат X. Следует ожидать, что модуль вектора Уг будет отражать степень интенсивности и продолжительности действия фактора. Он будет вариабелен и поэтому малоинформативен. По нашим представлениям, в амплитуде деформаций отражается главным образом вариабельность воздействий окружающей среды. Вариабельность самого объекта и его структура вносят детерминацию не в амплитуду, а прежде всего в направление происходя-

щих с объектом трансформаций. Поэтому в качестве измеряемых значений случайной величины Уг следует рассматривать лишь значения направлений вектора Уг без учёта его модуля. В этом заключается математическая интерпретация величины У.

Итак, переменная Y - это векторная величина. Для её нахождения используются всякий раз две скалярные величины: и Х1+Дс, а именно: две близко отстоящие во времени реализации «фотографии» изучаемого объекта. Вычисление Y по обычной Х^ч, состоящей из одинарных реализаций, принципиально невозможно. Это первый вывод, налагающий жёсткие требования на процедуру обучения. Второй вывод вытекает из первого и касается экспериментально наилучшего способа получения двух близко отстоящих друг от друга «фотографий» объекта. Этот вывод заключается в том, что в физическом эксперименте наиболее удачным приёмом для образования А и Х^+д^ с ранее оговоренными свойствами может быть предъявление на вход системы мгновенных скачков состояния объекта. Под мгновенным скачком понимается быстрый переход объекта из одного состояния в другое.

Таким образом, теперь можно описать общую математическую модель обучения распознающей системы, в качестве которой рассматривается обучаемый.

Для получения сведений о Р(Х/а^), Р^/а^) и Р(о^) объекты (а1, а2,..., ак,..., ам) изучаются трижды. Первый раз они изучаются в естественных условиях существования обучаемого контингента ак (К = 1,2,.,М), в условиях максимально возможного отсутствия возмущающих объект воздействий. В этих условиях в случайные моменты времени существования объекта он предъявляется Учителем на вход обучаемого. Обучаемый в каждый из этих дискретных моментов времени производит многомерное описание состояния объекта. Состояния S объекта измеряются ^мерным рецептор-ным полем распознающей системы и описываются ^мерной величиной X (пред-

ставляются точками X1,Х2, Х3,..., Х{, Х1+д1, Хг в ^-мерном евклидовом пространстве).

По поступившему в обучаемого ряду ХУуЧ значений случайной величины X находится распределение Р(Х/ак) для каждого ак. Порядок следования элементов в ряду не имеет значения, важен лишь сам факт присутствия элемента в Х^ч. Условие максимального отсутствия возмущающих объект воздействий способствует малой дисперсии значений X в распределении Р(Х/ак) вокруг математического ожидания.

Второй раз те же объекты изучаются для получения сведений о распределении Р(Х/ак). Для этого в объект ак вносятся всевозможные воздействия, возмущающие его состояние. Затем в результате такого же, как и в первом случае, ^мерного изменения объекта, однако не в случайные моменты времени, а производя его всякий раз до и после окончания очередного воздействия, составляется учебная выборка ХуЧ. При этом имеется Учитель, который дозирует число одновременно действующих факторов, доводя его до одного или другого предельного минимума и управляет моментом начала и конца воздействия, синхронизируя их с моментами многомерного измерения объекта.

Реально могут быть разные варианты распределения функции Учителя между распознающей системой, моторной системой, генерирующей возмущения, и Учителем. Этот вариант изучения объектов связан с выполнением практических работ.

Наконец, третий раз те же объекты изучаются обучаемым контингентом с целью выявления вероятности ) каждого из объектов в общей их совокупности (ЕР(ак)=1,0). При этом совокупность объектов предстаёт в наиболее естественных условиях их существования, без искажения естественного поведения объектов и не блокируя проявление внешних факторов, которые возмущают их состояния. Условно предполагается, что в силу специфики своей природы объекты появляются перед рецепторным полем обуча-

емого не одновременно, а последовательно. Этот вариант связан с самообучением.

Таким образом, рассмотрена математическая модель изучения объектов, определения вероятностных характеристик их формы и динамики. Перейдём к рассмотрению более общей модели, описывающей образование различных состояний и трансформаций изучаемого объекта.

Модель основывается на предположении, что в общем случае изучаемый объект имеет многоуровневую структуру составных частей, каждая из которых имеет для изменения состояния свои степени свободы. В результате у каждой из частей может наблюдаться независимость и самостоятельность в характере её динамики, в способе подвергаться преобразованиям. Так, однородность материала, из которого состоит объект, топологическая его целостность обеспечивают сходный путь превращения и динамики всех его точек при воздействии на него некоторых внешних сил. Вместе с тем, наряду с относительной однородностью объекта, при действии других внешних сил в нём может обнаруживаться определённое отличие в свойствах различных частей. Отличие свойств частей выражается в отличии их динамики. В свою очередь, в каждой отдельной части при более тонком анализе могут обнаруживаться ещё более мелкие части, хотя и в незначительной мере, но отличающиеся друг от друга по свойствам, а значит, и по степени свободы проявления себя. Данные части проявляют свою независимость динамики при действии некоторого третьего вида внешних сил.

Представим следующим образом общую модель возникновения всевозможных реализаций некоторой группы явлений а1,а2,а^,...,ам. Реализации X явления а^ будем рассматривать как различные трансформации, т.е. преобразования некоторого однородного исходного состояния . При этом из всех преобразований лишь преобразования определённого вида распространяют своё

действие на все явление в целом. Обозначим эту группу преобразований через Y( аI ), а саму операцию преобразования аI в новые реализации - через Y( а ° ). Далее предположим, что явление структурно состоит из частей аЗамечено, что над каждой из них отдельно и независимо могут совершаться преобразования другого вида, образующие группу Y а * . Каждая из частей , в свою очередь, разбивается на части , отличающиеся индивидуальными группами преобразований Ya\ и т.д.

В итоге, множество реализаций X всех явлений а 1,а2,...,аIосм представляется как результат аддитивного действия большого числа различных независимых преобразований У^, У2,..., , ..., У, совершённых над явлением в целом и над теми или иными его частями а[, где t = 1, 2, 3.... При этом действие некоторой группы преобразований Ya[ на соответствующую ей часть а ■ одновременно выливается в преобразование всех частей а(где ^ > t), содержащихся в а [.

В соответствии с такой многоуровневой «лингвистической» моделью преобразований в принципе любая реализация явления , какой бы отличной от его исходного состояния , она ни была, может быть синтезирована путём определённых преобразований явления а ° и его частей а[ О = 1, 2, 3...). Формально этот процесс синтеза можно записать в следующем виде:

Х1=Ч а ° {^ а I [^ а ? .. .(^ а ¡( а £))]}.

Многоуровневая иерархия совершаемых над Ya ■ преобразований есть грамматика синтеза. Морфологию синтеза составляет набор Y а ■ всевозможных видов преобразований явления и его частей 0=0, 1, 2, ...). Синтаксис преобразований (сочетание элементарных преобразований) вытекает из топологии явления, т.е. многоуровневой структуры образующих его частей. Особенность предлагаемого подхода к выбору «трансформационной грамматики» в том, что она выбирается не априор-

но, а выводится из эксперимента, т. е. апо-стериорно. Именно статистические сведения о распределении Р(У/а£) и распределениях ) ^ = 1, 2, ...) его частей позволяют составить однозначную грамматику для синтеза, т. е. экстраполяции всевозможных реализаций одного и того же явления.

Можно отметить, что модель объекта, которая лежит в основе известного корреляционного метода распознавания, является частным вариантом вышеописанной модели. В соответствии с моделью корреляционного метода всё множество реализаций распознаваемого объекта образуется путём линейных преобразований всего объекта в целом. В предлагаемой модели будем исходить из предположения, что линейные преобразования могут охватывать как весь объект, так и отдельные большие и малые его части.

Очень важным фактором развития этой модели является её дополнение моделью самообучения (СО) взаимодействием при реализации этого процесса. При этом очевидно, что любой поведенческий акт или последовательность актов является определением процессов взаимодействия индивида с окружающей средой.

Для описания такого взаимодействия будем использовать следующие понятия. Пусть S - множество состояний окружающей среды, Q - множество состояний системы. Действием назовём оператор, переводящий систему и среду из одного состояния в другое. Множество действий обозначим через D. Такое определение действия подразумевает, что оператор deD однозначно задаёт результат действия, т. е. состояние среды, которое реализуется после его выполнения. Тогда процесс взаимодействия может быть описан с помощью следующего набора абстрактных объектов: М= < S, Q, D, ф, у>, где функции ф и у задают процесс изменения состояний системы и выбора действия в зависимости от предыдущих состояний системы и среды. Соответственно ф: SxQ - Q, (1)

Назовём М обобщённой поведенческой моделью (ОПМ). Введённое определение ОПМ полностью совпадает с определением конечного автомата [3]. Однако будем предполагать, что на множестве Q может быть определена дополнительная структура и функции фи у разбиты на множество функций. Если функции ф и у рассматривать как распределение условных вероятностей, а множества S, Q и О -как пространства элементарных событий, то получим определение стохастической обобщённой поведенческой модели.

Процесс взаимодействия, порождаемый моделью, будем представлять с помощью поведенческой функции, которая для детерминированного случая обозначается как В(М, ц0, §), а для стохастических моделей - В5(М, ц0, .§), где М = < S, Q, О, ф, у> - обобщённая поведенческая модель (или её частный случай), ц0 -начальное состояние, £ = (5Х.5П) - последовательность состояний среды. Значением В(М, ц0, ) является соответствующая цепочка действий С = (С... ^п), а В5 (М, ц0, §) представляет собой распределение вероятностей на множестве реакций

В5(М, Чо, §) = Рг0|5).

При сравнении моделей будем сопоставлять их структурные и функциональные характеристики. Модели М' = < S', Q', О', ф', у'>, и М'' = < Q", О'', ф'', у''> назовём структурно-изоморфными, если между их элементами и состояниями элементов можно установить взаимооднозначное соответствие, такое, что связи между этими элементами у модели М' будут такие же, как и у модели М''. В случае стохастической ОПМ это означает равенство условных вероятностей переходов между состояниями элементов моделей. Если в моделях М' и М'' множества состояний Q' и Q" тождественно равны (Q' = Q") и соответствующие связи ф', у' и ф'', у'' также равны, то М' и М'' обладают эквивалентной структурой.

Функциональные характеристики моделей выражены в соответствующих поведенческих функциях. Будем говорить,

что модели М' и М'' реализуют изоморфное поведение, если между последовательностями 5'Е Б'' и Б'' Е Б' можно установить такое взаимооднозначное соответствие, что между последовательностями й = В(М', Цо\ §') и й'' = В(М'', ц0'', §' ') также будет существовать взаимооднозначное соответствие. Формально это означает, что существуют взаимооднозначные отображения а и в такие, что диаграмма

В(М', Чо\ §' ) =

V

Я

в

-> 5 ' '

V

* а ' '

коммутативна.

Изоморфизм поведения говорит о том, что нет качественных различий между поведением одной и другой модели, а разница только в обозначениях.

Если применять различные модели для описания поведения в одной и той же реальной ситуации, т.е. когда множества S и О заранее определены и тождественны для всех моделей, то можно говорить об эквивалентном поведении. В этом случае для моделей М' и М'' должно выполняться равенство: В(М', ц0, §) = В(М'', ц0, §).

Отметим, что процесс СО обычно представляется как возрастание некоторого показателя качества деятельности. С помощью этого показателя оценивается выполнение того или иного действия в зависимости от возникшего состояния среды. Формально это выражается заданием некоторой функции L на множестве пар d): L (s, d).

Пусть состояния среды 51,.,5п реализуются в последовательные дискретные моменты времен t = 1, 2, ..., п. В ответ на них оператор производит некоторые действия й1,...,йп. Тогда значения L (5Ь й1) = ¿ь ..., L (зп, йп) = Ьп можно представить как значения некоторой функции Ь0 где t дискретно.

Если человеку несколько раз предъявляется ситуация s, а йк - действие, выполняемое им при к-м предъявлении, то

значения L(s,dk) = Ьк, к = 1,2, ..., п также можно представить как значения некоторой функции ¿х(к). Функции ¿о© и Ьх (к) обычно называют кривыми СО. В качестве характеристик процесса СО берутся параметры кривых, такие как скорость научения, изменение состояния обучаемого и т.п. Наиболее существенный параметр - время ^ или количество повторений к*, необходимые для выхода на плато, т. е. время или количество повторений, после которого показатель качества деятельности практически перестаёт возрастать.

Эмпирическое содержание таких параметров кривой СО, как скорость, её изменение, момент выхода на плато, достаточно очев идно. Площадь под кривой СО, как предложено в [3], может служить оценкой сложности выполняемой деятельности.

Рассмотрим теперь эмпирическое содержание функции L(s,d). Эта функция может быть порождена на основе индивидуального опыта человека и имплицитно представлена только в психике индивида. В этом случае процесс СО можно наблюдать, только фиксируя собственные состояния человека.

Чаще функция L(s,d) представлена как некоторый нормативно-одобренный критерий оценки действий в той или иной ситуации, и тогда его формализация позволяет фиксировать процесс СО через изменение значения L(s,d). В экспериментальных исследованиях функция L(s,d) обычно представлена в форме задачи, которую предлагают решить испытуемому.

С помощью функции L(s,d) можно количественно сравнить процессы взаимодействия, реализуемые той или иной поведенческой моделью.

Таким образом, функционально процесс СО представляется как систематическое изменение взаимодействия человека с окружающей средой. Однако это изменение не дает ответа на вопрос о строении внутренних механизмов, составляющих основу процесса СО.

а

Рассмотрим модели, которые представляют описание поведения индивида в процессе СО. Первым классом таких моделей будут модели «стимул-реакция» или S-R модели. S-R модель представляет собой вырожденную обобщённую поведенческую модель со структурой Z = R, ф>, где ф: в случае детерминиро-

ванной ОПМ задаёт вероятность появлении г при условии, что предъявлен s в случае стохастической ОПМ.

Легко видеть, что ни детерминированная, ни стохастическая модель не способна описать изменение поведения, а следовательно, и процесс СО.

Для описания СО модель должна предусматривать возможность изменения связей между стимулом и реакцией. Кроме того, эта модификация связей должна происходить под воздействием определённого подкрепления.

Для учёта перечисленных факторов необходимо дополнить структуру S-R-модели множеством стимулов подкрепления и зависимостью связи между S и R от параметра, выбор которого определяется стимулом подкрепления.

В рамках концепции Торндайка и Хала СО состоит в образовании связей, но связи эти понимаются как устойчивые состояния организма. Состояние оказывается промежуточной переменной между раздражителем и ответом.

Такое представление очень близко к понятию конечного автомата [1]. В статье такой автомат будем называть автоматом состояний.

Система

А = Q, ^ ф, у>, где ф: S х Q ^ Q; Т: S х Q ^ R, (2)

представляет детерминированный автомат состояний. Множество Q есть множество состояний автомата, а функции ф и у -соответственно функции переходов и выхода. Представляя функции ф и у как соответствующие распределения условных вероятностей, получим определение стохастического автомата состояний.

S-R-модели составляют более узкий класс, чем автоматы состояний, т.е. при

определённых условиях всегда найдётся такой автомат состояний, которому нет функционально эквивалентной S-R-модели.

Смена состояний, определяющих связи между раздражителями и ответами, часто происходит только под воздействием стимула подкрепления. Для описания такой структуры достаточно более узкого класса - автоматов подкрепления, которые являются частным случаем автоматов состояния. В этом случае S = 50и5!, а ф: 50 х Q ^ Q и Т: 5Х х Q ^ R.

Для любого автомата подкрепления можно построить изоморфный ему автомат состояний, у которого S = 50 и 5Ь а все остальные элементы те же. При этом автомат состояния будет обладать поведением, эквивалентным поведению автомата подкрепления, т.е. их поведенческие функции будут тождественно равны.

В отличие от концепции подкрепления связей Торндайка и Хала многие исследователи пользуются для описания механизма процесса СО понятием выдвижения гипотез [4].

В наиболее общей форме модель СО, опирающуюся на концепцию выдвижения гипотез, можно представить в виде ОПМ, у которой од — множество подкреплений; 5! — множество ситуаций; Н — множество гипотез (состояний модели); R — множество реакций. Выбор следующей гипотезы происходит в зависимости от подкрепления (или неподкрепления) предыдущей, а реакцию определяет принятая гипотеза и одна из ситуаций множества 5!. Это полностью соответствует схеме автомата подкрепления.

Модели, основанные на выдвижении гипотез [4], могут быть представлены соответствующими автоматами подкрепления. Существенный недостаток этих моделей заключается в том, что в них никак не отражен процесс формирования модификации гипотез.

Таким образом, структуры моделей, основанных на концепциях подкрепления связей и выдвижения гипотез, изоморфны

и могут быть представлены автоматом подкрепления с той лишь разницей, что в одном случае используется термин «множество состояний», а в другом - «множество гипотез».

Для описания процесса перехода из состояния в состояние или смены гипотез используем аппарат марковских цепей.

Если в качестве множества состояний рассматривать множество троек q, г}, sЕS, qeQ, rЕR в структуре, соответствующей ОПМ, то процесс функционирования можно описать с помощью марковской цепи, если только он удовлетворяет условию эргодичности.

Марковская цепь определяется с помощью переходных операторов. Если 1=1,2, ..., п} - множество состояний однородной конечной марковской цепи, а {хс, t=1,2, ..., п} - векторы вероятности состояний в момент времени ^ то функционирование цепи задаётся уравнением

^+1 = ^^ (3) где Т - линейный оператор.

Если задавать ещё множество выходов I = 1, 2, ..., п} и их вероятностей {г{, t = 1,2, ..., п}, то уравнение

П+1 = , (4)

где R - линейный оператор, совместно с (7) определит марковскую поведенческую модель.

Можно показать, что эта модель структурно и функционально эквивалентна стохастической ОПМ со структурой Q, О, ф, у>, где ф: Q, а у: R.

Таким образом, среди рассмотренных моделей автомат состояний обладает наибольшей описательной мощностью. Существенный недостаток моделей этого класса заключается в том, что они не отражают структуру связей между ситуациями и реакциями на них в процессе СО и не описывают процессы формирования и модификации гипотез.

Следуя методам, разработанным в математической теории систем [5], конкретизация модели может быть проведена путём введения структуры её элементов.

Первым шагом конкретизации может служить представление множества S

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

через упорядоченный набор признаков. Это положение, как правило, лежит в основе различных теорий распознавания образов, среди которых наибольший интерес с точки зрения построения моделей СО представляют перцептроны.

В общем виде перцептронную модель СО можно представить следующим набором объектов:

< 50, $, {(}, А, R<p>, (5)

где 50 - множество стимулов; - множество стимулов подкреплений; Qjj - множество состояний 1-го элемента узла j-ro слоя; А - множество состояний управляющего элемента (элемент, управляющий связями между узлами); <р - множество функций переходов; R - множество выходов.

Система (5) представляет собой некоторую конкретизацию системы (1). Можно показать, что для любого перцеп-трона (5) существует автомат состояний (2), отвечающий на последовательность стимулов той же последовательностью реакций, что и перцептрон, т.е. обладающий эквивалентным поведением. Для этого достаточно представить набор состояний каждого элемента перцептрона как состояние автомата (2). Такая конкретизация даёт возможность представить в концепции подкрепления не только наличие связи между стимулом и реакцией, но и выдвинуть гипотезу о механизме, опосредствующем эту связь.

Очевидно, что эти разновидности СО могут быть представлены перцептро-ном с разной функцией влияния состояния управляющего элемента на состояния узлов.

Таким образом, перцептронные модели поведенчески эквивалентны автоматным моделям, но позволяют представить некоторый механизм связи и её модификации при СО между ситуациями и ответными реакциями. Однако эти модели, как и автоматные, не описывают процессов формирования и модификации гипотез.

Анализ моделей СО показывает, что процесс СО может трактоваться двояким

образом: с одной стороны, СО как внешне фиксируемое изменение поведения, с другой — СО как изменение состояния индивида, т.е. изменение внутренней организации. Рассмотренные здесь математические модели описывают изменение организации как переход между состояниями или изменение коэффициентов связи в пределах заданной структуры модели.

Из проведённого анализа моделей СО можно сделать следующие выводы:

- внешне (функционально) процесс СО представляет собой изменение поведения, при котором изменяется некоторый заранее заданный показатель качества;

- изменение поведения происходит за счёт перестройки внутренней организации системы, и поэтому СО есть изменение организации системы;

- параметрами, описывающими процесс СО, могут служить скорость, интенсивность, количество повторений, необходимых для насыщения;

- структуры моделей, основанных на концепциях подкрепления связей и выбора из множества гипотез, изоморфны и могут быть описаны автоматом подкрепления;

- модели автоматного типа позволяют описывать процесс СО как изменение поведения, но плохо определяют процесс

перестройки внутренней организации при СО;

- перцептронные модели СО поведенчески эквивалентны автоматным и представляют их конкретизацию, которая делает возможным описание не только наличия связи между стимулом и реакцией, но и механизма, реализующего эту связь.

Библиографический список

1. Розенблатт, Ф. Принципы нейро-динамики. Перцептроны и теория механизмов мозга [Текст] / Ф. Розенблатт. -М.: Мир, 1965. - 480 с.

2. Соколов, Е.Н. Нейронные механизмы в памяти обучения [Текст] / Е.Н. Соколов. - М.: Наука, 1981. - 140 с.

3. Наследов, Д. А. Математические методы психологического исследования. Анализ и интерпретация данных [Текст] / Д. А. Наследов - СПб.: Речь, 2004. - 392 с.

4. Аткинсон, Р. Введение в математическую теорию обучения [Текст] / Р. Аткинсон, Г. Бауэр, Э. Кротерс. - М.: Мир, 1969. - 487 с.

5. Месарович, М. Общая теория систем: математические основы [Текст] / М.Месарович, Я.Такахара. - М.: Мир, 1978. - 312 с.

MATHEMATICAL MODEL OF TRAINING AND SELF-TRAINING IN MAINTENANCE OF COMPLICATED SYSTEMS

© 2013 A. N. Koptev, A. A. Popovich

Samara State Aerospace University named after academician S. P. Korolyov

(National Research University)

The paper presents theoretical analysis of various models of self-training using a uniform formal system of concepts. Models based on concepts of reinforcement of communications and a choice from a set of hypotheses are described as well as models of automatic and perceptron types. A number of parameters describing the process of self-training is derived.

Self-training, generalized behavioral model, recognition theory, mathematical model, models of automatic type, perceptron.

Информация об авторах

Коптев Анатолий Никитович, доктор технических наук, профессор, заведующий кафедрой эксплуатации авиационной техники, Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет). E-mail: eat@ssau.ru. Область научных интересов: организация производства.

Попович Анастасия Алексеевна, аспирант кафедры эксплуатации авиационной техники, Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет). E-mail: tikhono-va a.a@mail.ru. Область научных интересов: организация производства.

Koptev Anatoly Nikitovich, doctor of technical science, professor and head of the department of aircraft maintenance, Samara State Aerospace University named after academician S. P. Korolyov (National Research University). E-mail: eat@ssau.ru. Area of research: industrial engineering.

Popovich Anastasiya Alekseevna, postgraduate student of the department of aircraft maintenance, Samara State Aerospace University named after academician S. P. Korolyov (National Research University), E-mail: tikhonova a.a@mail.ru. Area of research: industrial engineering.

i Надоели баннеры? Вы всегда можете отключить рекламу.