УДК62.501
А. В. Медведев
ТЕОРИЯ НЕПАРАМЕТРИЧЕСКИХ СИСТЕМ. ПРОЦЕССЫ
Продолжается изложение предыдущей работы автора [1]. Основное внимание уделено описанию процессов (объектов), которые не укладываются в традиционные формулировки задач идентификации. Они более адекватны многим реальным процессам, протекающим в технологических аппаратах, производстве, объектах различной природы, в том числе в организационных системах.
Ключевые слова: непараметрические оценки, непараметрические алгоритмы, идентификация, управление, дискретно-непрерывный процесс, сходимость.
Теория - в виду практики.
Девиз конгрессов 1ШС
Искусство научного предвидения не должно полагаться на абстрактное основание, его задача расшифровать язык природы из документов самой природы - фактов, опыта.
М. Борн
При изучении различного рода реальных процессов и объектов исследователь сталкивается с неполной информацией о последних, которая может существенно отличаться от реальности в зависимости от их характера, свойств, средств контроля и т. п. Это накладывает свой отпечаток при моделировании тех или иных процессов, включающих в себя априорную информацию о них, математическую постановку задачи, подходы и методы построения моделей, оценку адекватности полученной модели реально протекающему процессу. В зависимости от особенностей исследуемого процесса развиты различные подходы к идентификации и управлению [2-4].
Приведем достаточно общую схему исследуемого процесса, принятую в теории моделирования и идентификации [5; 6].
В рассматриваемой схеме (рис. 1) приняты следующие обозначения: х(,) - векторная выходная переменная процесса; и(,) - векторное управляющее воздействие; )(,) - векторная входная переменная процесса;
Х(,) - векторное случайное воздействие; (,) - непрерывное время; Нт, И“, Нх - каналы связи, соответствующие различным переменным, включающие в себя средства контроля, приборы для измерения наблюдаемых переменных; ),, и(, х{ - означает измерение )(,), и(,), х(,) в дискретное время. Контроль переменных(х,и, )) осуществляется через интервал времени Д,, т. е. х1, , )., I = 1, 5 - выборка измерений переменных про-
цесса (^ ^ т),(Х2, и2, ^2), •••,(х, и, ),),---; 5 -
объем выборки; кт (,), кх (,), ки (,)- со значком вверху -случайные помехи измерений соответствующих переменных процесса. В этом случае х(,) определяется следующим образом:
х(,) = А(“(Г), )(,), Х(,),,), (1)
где А - неизвестный оператор объекта.
Заметим, что выход объекта х(,) зависит от всех входных переменных“(,), )(,), Х(,).
Более общая схема дискретно-непрерывного процесса приведена на рис. 2.
),
Рис. 1. Классическая схема стохастического процесса и контроля переменных
“
х
Здесь приняты те же обозначения, что и на рис. 1: ю1 (,): 1 = 1, 2,..., к - переменные процесса, контролируемые в том числе по длине объекта; Ию - каналы связи, соответствующие различным переменным, включающие в себя средства контроля, приборы для измерения наблюдаемых переменных; ю, - измерение ю(,) в дискретное время, представляет собой дополнительную информацию о процессе. Контроль переменных (х, ю, “, )) осуществляется через интервал времени Д,, т. е. х, ю1юк, “1, ), 1 = 1, , - выборка измерений переменных процесса (х1, ю},..., юк, “1, )1),
(х2, ю2, “2, )2), •••, (х,, ю1,,..., юк, “,,),),...; 5 -
объем выборки; кю (,) - случайные помехи измерений соответствующих переменных процесса. В этом случае х(,) определяется не только значениями входных переменных, как в (1), но и ю(,) и может быть представлена в следующем виде:
х(,) = А(“ (,),)(,), ю (,), Х(,),,). (2)
Следующий шаг обобщения исследуемого процесса (рис. 2) состоит во введении новой входной переменной 1(,) (рис. 3).
Входная переменная 1(,) существенно отличается по своему содержанию от переменных “(,), )(,) и ю(,). Дело в том, что эта переменная не поддается измерению. Входная переменная !(,) может быть известна исследователю, но ее контроль осуществляется достаточно редко и в соответствии, как правило, со сложной и длительной
процедурой измерения. В этом случае х(t) определяется следующим образом:
х(0 = А(ы(Г), m(t), w(t), 1(t), X(t), t). (3)
Моделирование процессов подобного типа существенно усложняется в зависимости от характера влияния l(t) на х^).
Приведем наиболее общую схему стохастического процесса, часто встречающегося во многих приложениях (рис. 4).
Отметим существенное отличие выходных переменных z(t), q(t) и x(t), представленных на рис. 4. Выходная переменная x(t) контролируется через интервалы времени At, q(t) контролируются через существенно большие интервалы времени AT, z - через Т (T >>AT >>At). С практической точки зрения для исследуемого процесса наиболее важным часто является контроль переменных z(t). Например, выходные переменные x(t) контролируются с помощью различного рода индукционных, емкостных и других датчиков, q (t) - на основе лабораторных анализов, а z (t) - в результате длительного химического анализа, физико-механических испытаний и др. Этим и обусловлено существенное отличие дискретности контроля выходных переменных x(t) и z(t). Особенностью здесь является то, что измеренное значение выхода объекта станет известным только через определенные промежутки времени, этим объясняется запаздывание в измерениях выходных переменных объек-
Рис. 2. Схема стохастического объекта, в том числе распределенного
X(t)
1(t)
mt ut raj
Л Г Л Г Л Г 1 г у
Рис. 3. Обобщенная схема стохастического процесса 5
та х(ґ), q(ґ) и г(ґ). Аґ, АТ и Т- дискретность, с которой происходят измерения.
В этом случае выходные переменные, как и ранее, зависят от входных и га(ґ) (дополнительная информация), т. е. следующим образом:
х(ґ) = А(и(ґ), т(ґ), ю(ґ), 1(ґ), Х(ґ),ґ). (4)
При моделировании подобных процессов, учитывая различную дискретизацию контроля измерений х(ґ), q(ґ) и г(ґ) при прогнозировании q(ґ) и г(ґ), естественно использовать весь набор переменных, влияющих на прогноз q(ґ):
д(ґ) = А(и(ґ), т(ґ),ю(ґ), 1(ґ),х(ґ), Х(ґ),ґ), (5)
а при прогнозе г (ґ):
г(ґ) = А(и (ґ), т(ґ), ю(ґ), 1(ґ), х(ґ), q(ґ), Х(ґ), ґ). (6)
Учитывая большие значения ДТ и Т, значительно превышающих постоянные времени объекта, при моделировании придется учитывать, что процессы относятся к классу статических с запаздыванием, что значительно повышает их роль и значение в задачах идентификации стохастических систем.
Организационный процесс можно представить в виде схемы (рис. 5) [6].
Заметим, что к организационным процессам относятся такие, которые протекают с участием человека (коллектива). Это символизируют стрелки, помещенные внутри объекта (рис. 5). Контроль переменных д(,) и г(,) осуществляется, как и х(,) (на рис. 5 не показан, чтобы не загромождать рисунок.) Переменная 9(,) представляет собой воздействие на объект внешней среды. Для организационных систем это могут быть какие-либо рас-
Рис. 4. Общая схема многомерного стохастического процесса
Є иґ га)
у 7 г і г 1 г
Рис. 5. Схема организационного процесса 6
поряжения, постановления, приказы, а также законодательные акты, которые с течением времени претерпевают те или иные изменения.
В этом случае х(0 определяется следующим образом:
х(0 = А (“(,),)(,), ю(,), 1(0, 9(0, £(0,,). (7)
При прогнозировании д(0 целесообразно использовать следующие зависимости:
<?(,) = А(“(,),)(,),ю(,), 1(0,9(0, х(0,£(,),0, (8) а при прогнозировании г(,):
г (0 = А(“(,), )(0, ю(,), 1(0, 9(0, х(0, ?(,), £(,),0, (9) Наконец, обратим внимание на важнейшее обстоятельство, возникающее при исследовании реальных процессов. Это средства контроля, измерения всех доступных переменных, характеризующих состояние процесса. Здесь следует отметить, что, если переменные процесса доступны измерению электрическими средствами, то это чаще всего позволяет установить желаемый интервал (дискретность) контроля. К таким переменным можно отнести все электрические переменные (ток, напряжение, частота и др.), а также влажность, температуру, давление, загрузку и др. Сложнее дело обстоит с существенными переменными, которые доступны контролю лабораторным способом (химический, физико-химический, физико-механический, петрографический анализ и др.). Дискретность контроля здесь может достигать часов, смены, суток и многих суток. Важнейшей здесь является сама процедура и технология отбора проб для дальнейшего анализа и измерения тех или иных переменных. На эти обстоятельства мы обратим специальное внимание в дальнейшем.
Отметим еще одну особенность, которая всегда имеет место на практике. Дело в том, что исследуемые процессы, протекающие в природных явлениях или в технических и технологических системах, почти всегда носят нестационарный характер. Иными словами, характер тех или иных зависимостей между переменными процесса изменяется с течением времени заранее неизвестным образом. Причины этого разнообразны и мы не будем их здесь рассматривать, укажем только одну, не вызыва-
ющую сомнения, - это старение оборудования или изменчивость среды, где протекает интересующий нас процесс. Заметим также, что во всех приведенных выше процессах отсутствует запаздывание, хотя предполагается, что оно имеет место. Это сделано из соображений простоты. Все это существенно влияет на исследование интересующего нас процесса, и часто является просто определяющим.
Приведем схемы двух основных структур, часто встречающихся в промышленности, экономике, социологии и др. Прежде всего, это последовательная схема (рис. 6), где объекты относятся к классу вышеприведенных (рис. 1-5), N - число объектов. Переменные из соображений простоты на рис. 6 не показаны.
Более сложной, но часто имеющей место на практике, является последовательно-параллельная схема, представленная на рис. 7.
Многообразие задач идентификации обусловлено характером и свойствами процесса, например: статический, динамический или распределенный; линейный или нелинейный (известен ли тип или класс нелинейности); с запаздыванием или без запаздывания; стационарный или нестационарный; случайные возмущения £(,) аддитивные или мультипликативные, закон распределения £(,) известен или нет; случайные помехи в каналах связи к(,) - аддитивные или мультипликативные, плотности вероятности их известны с точностью до параметров или неизвестны, сведения о моментах случайных величин, наблюдения переменных х1, ю,, “1, ), статистически зависимы или нет и т. п.
Рассмотрим еще один процесс, часто имеющий место на практике [8]. Сущность его состоит в том, что из-за стохастической зависимости компонент вектора входных переменных, которая почти всегда неизвестна, исследуемый процесс имеет «трубчатую» структуру. Пусть “ е Я1, )еЯ', х е Я1 (рис. 8). Интервалы изменения (“, ), х) е Я3 всегда известны из практических соображений. Без нарушения общности выделим в Я3 единичный куб. Реально протекающий процесс же принадлежит подобласти 0.Н (“, ), х) с ^(“, ), х), которая никогда неизвестна.
Рис. 6. Последовательная схема процесса
Рис. 7. Последовательно-параллельная схема процесса 7
Таким образом, и е [0; 1], |те[0;1], х е [0; 1] ,а триада (и, т, х) е Пн (и, т, х). Ясно, что не каждое значение триады (и, т, х), полученной в эксперименте или измеренной на реальном процессе, будет принадлежать единичному кубу 0.(и, т, х). Следует отметить, что в теории идентификации области 0.(и, т, х), 0.(и, т), О(и), О(т), ^(х) всегда известны, а область Пн (и, т, х) неизвестна никогда. Из соображений простоты иллюстрации мы рассматриваем статический объект. В случае стохастической независимости входных переменных процесса Пн(и, т, х) совпадает с 0.(и, т, х), т. е.
0.н (и, т, х) = П(и, т, х). Если объект динамический, то переменные фазового пространства обязательно стохастически зависимы. Это, безусловно, накладывает отпечаток и на особенности моделирования подобных процессов, которые мы рассмотрим в дальнейшем.
Ниже рассмотрим процессы, часто встречающиеся на практике и являющиеся предметом исследования в теории распознавания образов. Типичным для задач технической диагностики, медицинской диагностики, диагностики состояния технологического процесса или объекта является наличие облачной структуры в пространстве признаков, определяющей тот или иной класс. Пусть некоторая ситуация (образ, процесс) может быть отнесена к тому или иному классу. Эта ситуация £ характеризуется значениями вектора признаков V = (ур ..., vm) и может быть отнесена к одному из двух классов У1 или У2. Задача распознавания образов сводится к построению решающего правила на основе имеющейся обучающей выборки {V = ^,..., V'), Ц,}, где Ц, - указания учителя о принадлежности £ к V или У2; 5 - объем выборки. Данная задача иллюстрируется для трехмерного вектора V, т = 3 (рис. 9). Элементы обучающей выборки {V, Ц,} на рисунке не показаны из соображений простоты. В дальнейшем выборку наблюдений переменных {V = (^,..., V'.), и} объемом 5 будем обозначать {V = (^,...,vs), Ц,}, как это принято в монографии А. А. Фельдбаума [2]. Здесь же введен новый пограничный класс У3, который определяет область достаточно сильного перемешивания представителей обоих классов.
Таким образом, задачу обучения распознаванию образов из соображений практики целесообразно свести к трехальтернативной задаче распознавания.
Рис. 9. Иллюстрация задачи распознавания образов
Рассмотрим класс процессов, относящийся к временным рядам. Временным рядом обычно называют наблюдения над некоторым процессом, явлением, порождающие упорядоченную последовательность, развернутую во времени *. Существенную роль при изучении временных рядов играет дискретность измерения А* интересующей нас переменной х(*). Так можно говорить об урожайности сельскохозяйственных культур, выпадении осадков, численности населения и т. д. Отсюда видно, что дискретность измерения х(*) может быть год, месяц, день, а в некоторых технических процессах значительно меньше. Часто временной ряд представляют в виде
х* = и, + К, * е Т = ^2,..., ^ ), (8)
где и1 - медленная составляющая исследуемого процесса (тренд), которая может порождаться некоторым закономерным образом, часто неизвестным исследователю; К - случайная составляющая (помехи), независимая от и1 В фундаментальной монографии М. Дж. Кендалла и А. Стьюарта [9] выделены четыре основные составляющие временного ряда: тренд или систематическая составляющая; колебания относительно тренда с большей или меньшей регулярностью; эффект сезонности; случайная, несистематическая или нерегулярная компонента.
Вернемся к (8). Здесь существенную роль играет восстановление тренда , но еще более важной является задача прогнозирования, предсказания х1, где * > / . В настоящее время актуальными стали задачи прогнозирования необходимого количества продукции на следующий день, курса валют, продаж тех или иных изделий за различные интервалы времени и др. Анализ таких процессов показывает, что здесь недостаточно исследовать процесс типа (8). Совершенно необходимым является привлечение других факторов и переменных, существенно влияющих на х*, таким образом, (8) преобразуется к виду
х* = и, (у)+К, {е Т =(^ *2,..., ^ х (9)
где вектор у = (у1,..., ук) состоит из компонент, влияющих на поведение х*. Следует заметить, что компоненты векторау не обязательно вещественные, а могут принадлежать другим шкалам измерения.
Таким образом, в настоящей статье описаны процессы, часто встречающиеся в технологии, производстве, экономике, социологии и др., которые, за исключением, процесса, представленного на рис. 1, можно считать слабо изученными. Тем не менее, они представляются значимыми в связи с тем, что имеют прямое отношение к реальности. При моделировании этих процессов важнейшими являются уровень и объем априорной информации (основа для математической формулировки задачи идентификации), дополнительной информации об исследуемом процессе и средства и технология контроля, измерения переменных. Последнее особенно касается организационных процессов.
Библиографические ссылки
1. Медведев А. В. Теория непараметрических систем. Общий подход // Вестник СибГАУ 2008. Вып. 3.
2. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М. : Физматгаз, 1963.
3. Цыпкин Я. З. Адаптация и обучение в автоматических системах. М. : Наука, 1968.
4. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 1983.
5. Методы классической и современной теории автоматического управления : в 2 т. Т. 1. Математические модели, динамические характеристики и анализ систем управления / под ред. К. А. Пупкова, Н. Д. Егупова. М. : Изд. МГТУ им. Н. Э. Баумана, 2004.
6. Методы классической и современной теории автоматического управления: в 2 т. Т. 2. Статистическая динамика и идентификация систем автоматического управления / под ред. К. А. Пупкова, Н. Д. Егупова. М. : Изд. МГТУ им. Н. Э. Баумана, 2004.
7. Медведев А. В. О моделировании организационных процессов // Вестн. Сиб. гос. аэрокосмич. акад. им. акад. М. Ф. Решетнева : сб. науч. тр./ под ред. Г. П. Белякова ; Сиб. аэрокосмич. акад. Вып. 1. Красноярск, 2000.
8. Медведев А. В. О моделировании организационных процессов // Вестн. Сиб. гос. аэрокосмич. акад. им. акад. М. Ф. Решетнева : сб. науч. тр. / под ред. Г. П. Беляко -ва ; Сиб. аэрокосмич. акад. Вып. 1. Красноярск, 2000
9. Кендалл М., Стьюарт А. Многомерный статистический анализ и временные ряды. М. : Наука, 1976.
A. V. Medvedev
THEORY OF NON-PARAMETRIC SYSTEMS. PROCESSES
The article continuous to report the author’s previous work [1]. The main attention is paid to description of processes (objects), which are not traditional for the identification problems. These processes are more adequate to many real processes proceeding in technological devices, manufacturing, objects of different nature, including organizational systems.
Keywords: non-parametric estimations, non-parametric algorithms, identification, controlling, discrete-continuous processes, convergence.
© Медведев А. В., 2010
УДК519.85:519.676
В. В. Бухтояров, Е. С. Семенкин
КОМПЛЕКСНЫЙ ЭВОЛЮЦИОННЫЙ ПОДХОД ДЛЯ АВТОМАТИЧЕСКОГО ПРОЕКТИРОВАНИЯ КОЛЛЕКТИВОВ НЕЙРОННЫХ СЕТЕЙ
Предлагается новый комплексный подход для проектирования коллективов нейронных сетей, состоящий из метода автоматического проектирования нейронных сетей и метода автоматического формирования коллективного решения на основе решений отдельных нейронных сетей. Показано, что предлагаемый подход не менее эффективен, чем ряд других подходов для проектирования коллективов нейронных сетей.
Ключевые слова: нейронные сети, коллектив, автоматическое проектирование, генетическое программирование, вероятностный эволюционный алгоритм.
В настоящее время системы анализа данных, в основе методов автоматического проектирования и адаптации которых лежат интеллектуальные информационные тех- ИИТ под конкретные задачи. Такие методы могли бы по-нологии (ИИТ), становятся все более востребованными зволить отказаться от использования для проектирования во многих отраслях человеческой деятельности, а требо- ИИТ дорогих, в основном человеческих, ресурсов и сования к масштабам таких систем неуклонно растут. В связи кратить время, необходимое для разработки интеллекту -с этим все актуальнее становится вопрос о разработке альных систем.