Научная статья на тему 'Использование моделей математической эконо мики для исследования экономической динамики России'

Использование моделей математической эконо мики для исследования экономической динамики России Текст научной статьи по специальности «Математика»

CC BY
87
25
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Мазуров Вл Д., Хачай М. Ю.

Рассматриваются вопросы построения нейронных сетей для моделирования исторической динамики. Установлена корректность метода комитетов применительно к данной проблематике. Данная работа выполнена в рамках Программы «Историческая динамика России», поддерживаемой Уральским отделением РАН при участии Уральского института экономики, управления и права.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USE OF MODELS FOR THE STUDY OF MATHEMATICAL ECONOMIC DYNAMICS of RUSSIA

Questions of construction of neural networks for modeling the historical dynamics are being discussed. A correctness of the method of committees is used in relation to this issue. This work was supported by the Program «Historical Dynamics of Russia», supported by the Ural branch of RAS, with the participation of the Ural Institute of Economics, Management and Law.

Текст научной работы на тему «Использование моделей математической эконо мики для исследования экономической динамики России»

ОБРАЗОВАНИЕ

ИСПОЛЬЗОВАНИЕ МОДЕЛЕЙ МАТЕМАТИЧЕСКОЙ ЭКОНОМИКИ ДЛЯ ИССЛЕДОВАНИЯ ЭКОНОМИЧЕСКОЙ ДИНАМИКИ РОССИИ Мазуров Вл.Д., Хачай М.Ю.

Рассматриваются вопросы построения нейронных сетей для моделирования исторической динамики. Установлена корректность метода комитетов применительно к данной проблематике.

Данная работа выполнена в рамках Программы «Историческая динамика России», поддерживаемой Уральским отделением РАН при участии Уральского института экономики, управления и права.

USE OF MODELS FOR THE STUDY OF MATHEMATICAL ECONOMIC DYNAMICS of RUSSIA Vl. D. Mazurov, M. Yu. Hachai

Questions of construction of neural networks for modeling the historical dynamics are being discussed. A correctness of the method of committees is used in relation to this issue.

This work was supported by the Program «Historical Dynamics of Russia», supported by the Ural branch ofRAS, with the participation ofthe Ural Institute ofEconomics, Management and Law.

В модели социально-экономической динамики страны можно в качестве основного блока записать последовательность взаимосвязанных производственно-транспортных задач линейного программирования, включив сюда экспорт и импорт. При этом в частном случае соответствующую задачу можно решать отдельно для каждого года рассматриваемого периода конца XIX - начала XX веков. Пусть А1, ... , Ат - возможные места размещение пунктов производства. В каждом из этих пунктов задана система вариантов производства набора из 1 различных продуктов, задаются объемы производства каждого продукта на каждом пункте производства при реализацци каждого варианта, величины затрат и цены сбыта. Цены сбыта обычно известны из статистических наблюдений; может быть, их можно вычислить из двойственной задачи линейного программирования.

Однако поскольку нас (в данном случае)

интересует лишь производство зерна и железа, а также транспортировка этих продуктов и миграция работников (с учетом численности трудового ресурса), то можно применить и более простые модели. Интересно, что применение достаточно древней модели Франсуа Кенэ ("Экономической таблицы" и "Зигзага") уже дает нам интересную и существенную картину экономического равновесия в течение года.

Естественно рассматривать экономикосоциальную эволюцию России в дискретном времени. Для каждого очередного периода 1 вэкономической жизни России устанавливаются конкретные объемы производства: а(1, к, 1). Здесь к - вид продукта, 1 -пункт его производства, 1 - рассматриваемый текущий период. Потребность текущего периода в продуктах обозначим через Ь(б, ], 1), где ] - пункт потребления, б - вид потребленного продукта. При этом Ь(б,],1) включает в себя параметры потребления,

Мазуров Вл.Д., Хачай М.Ю.

личного и общественного, производственное потребление, потребности строительства, обороны, прирост запасов и экспорт.

В модели устанавливаются соотношения, определяющие экономическую и социальную динамику. При этом цикличность динамики определяется цикличностью объёемов ресурсов.

Математические методы в изучении истории экономики страны необходимы, так как экономическая теория не только изучает проблемы возможного наилучшего использования ограниченных возможностей и ресурсов человеческой деятельности, но и реальное поведение экономического субъекта, который в принципе может связывать экономические цели и средства их достижения, но, как правило, ведет себя нерационально.

Вообще же математическая экономика изучает свойства экономической динамики и равновесия с помощью математического моделирования этих процессов и точного, строгого исследования полученных моделей. При этом получены условия положительного экономического роста и условия равновесия экономики при различных предположениях о природе производства благ и услуг, их распределения, предположениях о механизме рынка и формировании цен, ренты и других экономических инструментов.

Оптимизация выбора вариантов действий в экономике может быть как статической (относящейся только к данному фиксированному моменту), так и динамической. Статическая оптимизационная проблема рационального хозяйствования такова: требуется распределить ограниченные ресурсы на различные цели и проекты в некоторый определенный фиксированный момент времени. Примеры таких проблем: составление бизнес - плана, расчеты по оптимальному планированию производства, решение проблем менеджмента, маркетинга и логистики, составление оптимальной производственной программы предприятия, транспортные задачи эффективного распре-

деления грузовых потоков, оптимальное планирование экономики регионов.

Математическая модель этой проблемы

- задача математического программирования (планирования): в этой задаче требуется максимизировать (а если речь идет об отрицательном эффекте, например, о затратах, то минимизировать) значение некоторой целевой (критериальной) функции от нескольких переменных, удовлетворяющих некоторой системе ограничений.

Для аналитической записи этой задачи введем ряд понятий и обозначений. Нужно найти значения n переменных x1, ... xn. Смысл переменной xi - это либо интенсивность использования i - й экономической (хозяйственной) технологии, либо i - й инструмент (такой как процентная ставка, тариф и т.д.), а цель - либо максимизация результата, либо сокращение безработицы, минимизация расходов, выравнивание платежного баланса и т.д. Вектор x = [ ...] = [x1, ... , xn]' предполагается элементом n - мерного векторного пространства Rn, '- знак транспонирования. Этот вектор будем называть (в зависимости от содержательного смысла задачи) либо вектором интенсивностей, либо (в более общей трактовке) вектором инструментальных переменных, либо допустимым вектором. В последнем случае предполагается, что он удовлетворяет ограничениям задачи. Множество X всех допустимых векторов называется допустимым множеством. Это подмножество пространства Rn: X <= Rn.

Целевая (критериальная) функция - это аналитическое описание цели данной задачи. Как правило, это действительная непрерывно дифференцируемая функция вектора х:

F = F(x) = F(x1, ... , xn).

Общий вид задачи математического программирования:

max F(x) при ограничении, что х принадлежит допустимому множеству X.

В классической оптимизации ограничения имеют вид системы уравнений:

й(х) = Ы ( 1 = 1, ..., т).

В векторной форме: Дх) = Ь. Здесь Дх) = [А(х),...,6п(х)], Ь = [Ь1, ., Ьт]. Значит, в этом случае

МОДЕЛЬ ЛЕОНТЬЕВА

Предполагаем, что имеются п отраслей. И каждая отрасль производит свой 1 - й продукт. То есть имеется взаимно однозначное соответствие

1 - я отрасльо 1 - й продукт.

Через х1 обозначим валовый выпуск 1 - го продукта, VI - его производственные затраты, Ы - его конечное потребление (чистый продукт). Имеем равенства: х1 = VI + Ы (1 = 1,...,п).

Теперь делаем предположение о прямой пропорциональной зависимости затрат продукта на выпуск другого продукта:

VI = 2 уц=2 ацзц;

и = 2 М)ч+ы(1= 1,...гйй 0.(1) Соотношения (1) - это и есть модель Леонтьева в статической форме. Запишем ее в матричном виде: х = Ах + Ь, х0 (2).

Здесь х и Ь - неотрицательные п - мерные векторы - столбцы, А = [ау] - неотрицательная п х п - матрица коэффициентов прямых затрат.

Для модели (2) главный вопрос - о существовании решения. На экономическом языке - о продуктивности. Модель (2) называется продуктивной (или матрица А - продуктивной), если существует строго положительный вектор Ь, при котором система (2) разрешима.

Условия продуктивности вытекают из теорем линейной алгебры: модель продуктивна тогда и только тогда, когда существует, и притом неотрицательная, матрица С, обратная к матрице Е - А. При этом условии вектор вала есть однозначная функция вектора Ь и матрицы А:

х = ДА,Ь) = СЬ = Ь + АЬ + ААЬ + ... Матрица С называется матрицей полных

затрат, а также матричным мультипликатором.

Двойственная модель Леонтьева использует вектор цен р= [р1,...,рп] °.

Соотношения двойственной модели в матричной форме: р = рА + ^?, р 0,

где w - вектор чистого продукта в стоимостной форме, он называется вектором заработной платы в отраслях.

Двойственная модель Леонтьева продуктивна, если и только если исходная модель Леонтьева продуктивна.

В модели Леонтьева можно определить вектор вала у, дающий максимальный темп а сбалансированного роста. При этом у = а Ау.

Здесь а - максимальный темп сбалансированного роста - максимальное положительное характеристическое число матрицы А, у - соответствующий собственный вектор.

МОДЕЛЬ НЕЙМАНА

Модель Неймана описывает рост капитала в многоотраслевой экономике. Имеются п отраслей, которые производят т видов продуктов. Обозначим через ау расход 1 - го продукта при единичной интенсивности работы ] - й отрасли, Ьу - выпуск 1 - го продукта при тех же условиях. Будем называть А = [ау] матрицей затрат, В = [Ьу] - матрицей выпуска. Пусть х(1) - вектор - столбец интенсивностей работы отраслей, р - вектор цен продуктов, v(t) - вектор ценностей продуктов, v(t) = р + г(1), где г(1) - вектор ренты (добавленной стоимости). В период 1 = 0 имеется вектор запасов продуктов, вектор - столбец Ь(0) = Ь. В конце периода 1: вектор запасов Ь(1) = Вх(1). Этот вектор расходуется в производстве в периоде 1+1. Расход ресурсов: А х(1+1) Ь(1). Введем вектор стоимостей выпуска продуктов во всех отраслях: с = Вр.

Получаем задачу линейного программи-

Мазуров Вл.Д., Хачай М.Ю.

рования для нахождения оптимальных интенсивностей:

максимизировать (с, х(1+1)) при условиях А х(1+1) Ь(1), х(1+1) 0.

Двойственная задача линейного программирования дает возможность найти ценности продуктов:

минимизировать ^(1+1), Ь(1)) при условиях:

А' v(t+1) с, v(t+1) 0.

В рамках модели Неймана рассматриваются темпы роста экономики. Если для всех 1: х(1+1) = а х(1), то а называется технологическим темпом сбалансированного роста, а при v(t) = Ь р: Ь называется экономическим темпом роста, это и есть темп роста капитала. Если подставить эти соотношения в условия прямой и двойственной задач, то получим:

(В - аА) х 0, р'(В-ЬА) 0.

Здесь х = х(0), р - вектор равновесных цен. Оказывается, для существования указанных неотрицательны х, р и положительных а, Ь достаточно выполнения условий: А, В - неотрицательные матрицы, сумма строк матрицы А - положительный вектор, сумма столбцов матрицы В - положительный вектор.

С этой моделью связан магистральный подход - средство моделирования долговременных экономических процессов. Теорема о магистрали утверждает, что при некоторых условиях оптимальные траектории динамических экономических моделей с большим временным горизонтом приближаются к траекториям максимального сбалансированного роста, то есть пропорционального роста - к траекториям, обладающим постоянной во времени структурой и постоянным максимально возможным темпом роста. При большом, но конечном числе периодов работы экономических технологий оптимальная траектория экономики сначала приближается (не обязательно монотонно) к лучу равновесия, то есть максимального сбалансированного роста, затем почти

все периоды проходят вблизи этого луча, почти не отличаясь от траектории максимального пропорционального роста. И в конце множества периодов траектория может отойти от этого луча.

Настоящий раздел посвящен одному из современных направлений в области информатики и задач принятия решений - математическим моделям и методам распознавания образов. Распознавание образов изучает математические методы решения задач диагностики и классификации экономических объектов и явлений на основе обучения по примерам. Задачи классификации, идентификации объектов, распознавания скрытых свойств и диагностики объектов самой различной природы можно решать на компьютерах с помощью математических методов распознавания. Эта возможность сейчас широко используется в экономике, в экологических задачах, в технике и в других областях. В то же время эти методы и модели тесно связаны с нейрокомпьютингом - решением задач с помощью искусственных нейронных сетей -чрезвычайно перспективным направлением в информатике.

Распознавание образов связано с созданием общих представлений о классах объектов и ситуаций и о различиях между классами. Методы распознавания дают возможность обнаружения, восприятия и распознавания закономерностей (инвариантных свойств) среди результатов измерений объектов и событий. С математической точки зрения это задачи приближения функций на хаотических сетках. Этот аппарат уже зарекомендовал себя как эффективное средство решения сложных задач, в том числе и неформализованных. Кроме того, важно то, что данное направление тесно связано с новыми информационными технологиями

- с искусственными нейронными сетями.

Исходные идеи распознавания: математическая логика (образование понятий и работа с ними), математическая статистика (множества состояний экономических

объектов и явлений в пространстве факторов), теория автоматов в искусственном интеллекте, теория и методы линейных неравенств как фундамент математических методов.

Изучение теоретических и эмпирических закономерностей в экономике - интересная и сложная задача для специалистов по экономико-математическим методам. Многие экономические задачи трудны и сами по себе. И трудны они также с той точки зрения, что трудно проверять адекватность построенных для них количественных моделей. Здесь как раз одно из наиболее перспективных направлений для методов распознавания. Дело в том, что прямая проверка моделей - это проведение экспериментов и сравнение их результатов с теми, которые прогнозируются в соответствии с моделями. Между тем сейчас существуют весьма совершенные методы, применение которых во многих случаях устраняет необходимость в проведении длительных и дорогостоящих экспериментов, которые к тому же могут быть и просто практически нереализуемыми. И можно еще заметить, что распознавание естественным образом вписывается в процедуры оптимального планирования экспериментов.

Приложение методов распознавания к экономическим задачам позволяет снять ряд действительно острых вопросов обоснованности экономико-статистических математических моделей прогнозирования, оценить их близость к реальным процессам и расширить сферу их применения.

Применение методов распознавания и искусственных нейронных сетей в комбинации с методами регрессионного и дисперсионного анализа, а также факторного анализа привело к широкому использованию (помимо обычных непрерывных и борее того - моделей с гладкими функциями) двух новых типов моделей - классификационных и кусочно-аффинных (в частности, кусочно-линейных). Все это очень важно для придания большей обоснованности ме-

тодам экономического и социального прогнозирования.

И действительно, в экономике существуют в основном сложные процессы и явления, будущей динамики которых мы не знаем, хотя она имеет большое значение для решений, принимаемых в текущий момент. Большинство таких решений принимаются в условиях неопределенности и неформа-лизованности. Обоснованное прогнозирование выступает как один из инструментов уменьшения этой неопределенности. И именно при моделировании и имитации закономерностей экономических процессов, объектов и явлений возникает возможность корректного прогнозирования. Это и определяет важность распознавания и нейронных сетей как методов обработки данных и знаний.

На задачу распознавания образов можно смотреть так, что это задача классификации объектов: надо разбить объекты на классы в соответствии с некоторой целью. Изменится цель разбиения (или принцип выделения классов) - изменятся и сами классы. В задачах распознавания важен принцип обучения на примерах: мы учим алгоритм распознавания классифицировать объекты (другими словами, ставить им диагноз) так, чтобы классификация была той же, которую мы даем для прецедентных объектов, для материала обучения. Таким образом, используется некоторая априорная информация о классовой принадлежности. Наученный на прецедентах алгоритм мы затем применяем к новым объектам для их диагностики.

С помощью математических методов распознавания решаются задачи классификации, диагностики и прогнозирования состояний самых разных объектов практически во всех областях науки, техники, социологии и экономики. При этом наибольший эффект эти методы достигают при решении особенно трудных - неформализованных -задач.

В этих случаях с помощью распознава-

Мазуров Вл.Д., Хачай М.Ю.

ния мы получаем эмпирические закономерности, которые затем используются при анализе задач выбора вариантов практических решений.

Распознавание образов представляет собой один из весьма эффективных способов моделирования зависимостей, недоступных для прямого описания, скрытых закономерностей, и этот способ использует прецедентные множества как материал обучения.

Методы обработки признаков (то есть параметров, измеряемых на объектах) - это методы, позволяющие:

- отобрать группу наиболее полезных для распознавания и в то же время доступных по стоимости признаков;

- преобразовать признаки в систему вторичных признаков, более удобных для формирования решающих правил распознавания;

- оценить важность отдельных признаков, а также их сочетаний.

Заметим, что, как правило, выявление оптимальных признаков описывается задачей математического программирования: выбираются оптимальные по некоторому критерию признаки, образующие допустимую подсистему признаков. Допустимость может оцениваться объемом ресурсов, расходуемых на их измерение и использование. Это весьма сложная нелинейная многоэкстремальная задача оптимизации, вычислительная сложность ее высока, и поэтому, как правило, используются приближенные методы ее решения, в частности, различные схемы частичного перебора. Наиболее эффективным оказался вероятностный принцип перебора признаков, причем вероятности все время пересчитываются в зависимости от удачности или не-удачности выбора подсистемы признаков. Развитие этого подхода дают генетические алгоритмы. Примеры применения современных информационных технологий см. [3-8].

Если некоторый объект должен функционировать при противоречивой системе

ограничений и при несогласованных критериях, то для него может быть выбран один из двух типов поведения: либо приближенно учитывать все ограничения (точное удовлетворение им невозможно в силу условия противоречивости), и тогда будем говорить о непрерывной аппроксимации несобственной модели, либо точно отражать в поведении одну группу требований, затем другую и т.д., принимая последовательность дискретных состояний. Во втором случае можно говорить о дискретной аппроксимации, понятие о которой формализуется, например, на пути использования р-комитетов [5]: р-комитет системы множеств {01,..., Бт) есть множество К-такое, что |Щ А К| >р|К| (для любого _]). Вообще можно рассмотреть, например, следующие способы преодоления несовместимости:

1) чебышевский - когда корректируются правые части ограничений;

2) комитетный - когда проводится анализ максимальных совместных подсистем;

3) технологический - когда меняются коэффициенты левых частей и наборы номеров неравенств. Отметим, что подход 2 есть частный случай подхода 3.

Рассмотрим далее понятие дискретной аппроксимации более подробно.

Комитет системы оптимальных множеств в многокритериальной задаче

Пусть некоторая экономическая ситуация характеризуется ее вектором состояния х=[х1, ..., хп], причем множество М допустимых ситуаций удовлетворяет неравенствам

3(х) < 0 ( ] = 1,.,т).

Максимизируемые критериальные функции: §1(х),...^(х).

Введем в рассмотрение множество, оптимальное по ]-му критерию.

Если бы существовала точка у, общая для этих оптимальных множеств, то ее естественно было бы выбрать в качестве решения этой задачи. Однако ясно, что, скорее всего, пресечение оптимальных множеств пусто. Можно, однако, использовать комитет системы оптимальных множеств в ка-

честве аналога решения для многокритериальной задачи.

Более подробно понятие дискретных аппроксимаций рассмотрим несколько позже.

КОМИТЕТЫ СИСТЕМ НЕРАВЕНСТВ

Определения

Пусть х = [х1,.,хп] представляет собой п-мерный вектор, заданы функции А(х),...,&(х) и числа Ь1,.,Ьт. Рассмотрим систему неравенств:

А(х) < Ь1,..., йп(х) < Ьт (5). Определение 6. Множество К=={х', ..., хд) называется р-комитетом системы (5) при рА[0, I], если каждому неравенству системы удовлетворяют более чем р-я часть множества К.

Отметим, что р-комитет системы (5) - это р-комитет системы таких множеств, каждое из которых является множеством решений одного неравенства. Ясно, что определение 6 можно распространить и на системы более общего вида, чем (5), т.е. на системы, включающие уравнения, строгие неравенства или какие-либо другие соотношения. Более того, понятие р-комитета можно распространить и на системы сопряженного вида, т.е. такие, где неизвестным является не элемент х пространства, а функция от п-мерного вектора. Например, р-комитетом системы

Дх)<0 ( х = х1,...х1,...) рассматриваемой относительно неизвестной функции Г выбираемой в классе функций Б, называется такое множество К= { П,...^},

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

что для любого х1 неравенству Г(х1) <0 удовлетворяет более чем р-я часть множества К.

Некоторые примеры Пусть х = [х1,х2] - вектор состояния объекта в пространстве двух косвенных признаков, по которым надо провести обучение классфикации. Рассмотрим систему относительно вектора х:

х1 < 0, х2 < 0, -х1 - х2 < -1.

Эта система несовместна, однако она обладает комитетом

{ х,У,2}

где х = [-1, -1]; у=[1, 0]; 2 =[0, I].

Рассмотрим теперь систему сопряженного вида:

Г(х)=1 (для всех х из множества X),

Г принадлежит функциональному классу: Б, где

Х={[1, 1]; [0, 1]; [1, 0]}, Б - класс всех линейных функций, т.е. функций вида Г (х)= а1 х1 + а2 х2. Записанная система не имеет решения, но обладает комитетом С = { А, Г2, Г3}, где

П(х) = х1 + х2, Г2(х) = х1, Г3(х) = х2.

В случае, если не делается никаких предположений о виде функций П,...,йт, можно использовать только самое общее условие существования комитета системы множеств. Для линейных неравенств имеется более сильное утверждение:

Для существования комитета системы (с],х) > 0 ( ] = 1, 2, ..., т), где х, С - элементы п - мерного вещественного векторного пространства, (,) - символ скалярного произведения, необходимо и достаточно, чтобы все векторы с были ненулевыми и никакие два вектора с и сі не были противоположно направленными.

КОМИТЕТЫ В ПРИНЯТИИ РЕШЕНИЙ

Перечислим некоторые приложения комитетов в задачах принятия решений.

1. Приложения в системном анализе:

- синтез систем, обеспечивающих выполнение нескольких функций;

- планирование динамики систем с противоречивыми ограничениями;

- стыковка и согласование противоречивых систем моделей;

- комитеты как обобщения вектора состояния;

- задача выбора групп экспертов;

- биокибернетические задачи.

Мазуров Вл.Д., Хачай М.Ю.

2. Теоретико-игровые приложения.

3. Приложения в задачах оптимизации:

- стохастические задачи;

- многокритериальная оптимизация;

- оптимизация на множествах дискретных аппроксимаций;

- несовместные балансовые модели (в том числе модели транспортного типа).

Рассмотрим некоторые из перечисленных задач.

Синтез систем, обеспечивающих выполнение ряда функций

Пусть х-модель (вектор состояния) устройства или процедуры заданного класса, х -элемент множества X. Затраты на устройство или процедуру х равны Дх). Требования, предъявляемые к устройству х (т.е. некоторые ограничения на ресурсы и желаемый выход продуктов):

)х) < 0 ( } = ^ ., т) (6).

может не существовать вектора х из множества X, удовлетворяющего этой системе. Тогда естественно искать систему представителей для совокупности Б множеств Щ={х : Г){х}<0} (/==1, ..., т), т.е. такое множество К, что К содержится в X и пересечение множества К с каждым Ц непусто. При этом можно учесть и критерий оптимальности, решая задачу минимизации (по всем К из некоторой их совокупности) суммы чисел Дх) по х из К.

Если неравенства системы (6) появляются стохастически в дискретном времени (т.е. в виде некоторого потока), то нужно применять более сложные комитетные конструкции. Для адаптации к потоку требований в случае, если система (6) состоит из однородных линейных неравенств, можно использовать метод линейной коррекции построения комитета.

Если целью планирования является нахождение последовательности, члены которой должны, в частности, удовлетворять ограничениям (6), то в случае несовместности этой системы элементы х могут выбираться как чередующиеся решения максимальных совместных подсистем.

При попытке создания комплексных моделей, состоящих из подмоделей различных классов, могут возникать несовместные системы соотношений. Одним из возможных подходов к анализу таких систем может быть применение комитетных конструкций.

Комитеты могут возникать в "стыковочных" моделях экономики.

Переключения с одного члена комитета на другой могут быть средством реагирования на изменение характера требований к некоторым частным критериям данного экономического объекта. Комитетное решение применимо, если выполнение каждого ограничения будет проверяться с одинаковой вероятностью.

Кроме того, решения максимальных совместных подсистем больших систем ограничений могут быть заготовлены заранее в порядке преадаптации к возможным изменениям условий (переключению на новые подсистемы ограничений).

К нахождению одной из максимальных совместных подсистем приводится задача минимизации числа неудовлетворенных неравенств.

Моделирование объектов с помощью несовместных систем линейных неравенств

Пусть вектор состояния того или иного объекта имеет вид х = [ х1,., хп] , где х1 -вещественное число, являющееся значением 1-го параметра, измеренного на объекте (1 =1, ... , р). Математическое моделирование самых различных ситуаций (жизненных, производственных, природных и т.д.) использует составление систем вида: Г)(х) > 0 ( ] = ^...М Б1(х) = 0 ( 1 = 1 ..., р) (7Х

где х - вектор состояния, а соотношения системы характеризуют некоторые требования, накладываемые на состояние моделируемого объекта. Например, если Г) (х) означает выход )-го вида продукта, получаемый при функционировании объекта в состоянии х, то Г}(х)> а означает, что мы пытаемся найти состояние х, обеспечивающее выход у-го вида продукта в количестве не менее а.

Во многих случаях приходится иметь

дело с системами неравенств вида (7), не обладающих решениями. Существуют различные подходы к анализу таких систем, причем выбор формального подхода диктуется содержательным смыслом модели (7), практическими целями ее анализа. Так, можно рассматривать чебышевское уклонение -наименьшее значение параметра, подставляемого в правую часть, при котором система совместна, и соответствующие чебышевские приближения, т.е. решения системы (7) при замене левых частей на этот параметр. Можно также рассматривать максимальные совместные подсистемы системы (7).

Несовместность системы (7) может указывать на большую размерность исследуемого объекта, чем размерность, учтенная в модели вектора состояния х, на наличие неучтенных существенных признаков объекта.

Системами неравенств можно моделировать поведение весьма сложных систем, в частности, биологических. В работе [17] высказывается мысль, что критерии функционирования живых систем (или сложных технико-экономических систем, перед которыми стоит цель выживания в конечном счете), как правило, являются противоречивыми, т.е. описывающие их системы неравенств могут оказаться несовместными. В этом случае возникает мысль находить решения максимальных совместных подсистем и использовать стратегию применения этих решений с такими вероятностями, чтобы каждое условие выполнялось с вероятностью большей, чем р.

Таким образом, мы приходим к понятию комитета системы линейных неравенств.

КОМИТЕТЫ В РАСПОЗНАВАНИИ ОБРАЗОВ

С помощью математических методов распознавания образов можно решать на ЭВМ задачи классификации, узнавания и диагностики объектов самой различной природы. Эту возможность широко используют при

исследовании ряда важных проблем экономики, техники, медицины, биологии, социологии и других областей.

Распознавание образов - метод систематизации материала наблюдений, метод диагностики и классификации.

Одна из основных идей, применяемых в математических методах распознавания образов, такова. Предположим, что нам нужно научиться распознавать два образа. Другими словами, надо научиться отличать объекты одного класса от объектов другого. Объекты представляют точками пространства большой размерности (фазового пространства), т.е. точками с большим числом координат. Мы не знаем заранее того правила, по которому отличаются объекты первого образа от объектов второго. Материал, на основе которого надо научиться распознаванию образов, представляет собой некоторое множество примеров объектов того и другого классов. Следовательно, в фазовом пространстве заданы два конечных множества точек. Строим поверхность, разделяющую эти множества, т.е. такую, что точки первого класса лежат по одну, положительную сторону поверхности, в точки второго - по другую, отрицательную. Теперь, для того чтобы классифицировать любой новый объект, надо только установить, по какую сторону от построенной поверхности находится соответствующая этому объекту точка фазового пространства.

Многие математические алгоритмы распознавания образов как раз сводятся к построению коэффициентов уравнения разделяющей поверхности. С помощью подобных алгоритмов решено большое число практических задач.

Однако оказалось, что ряд сложных задач не поддается решению с помощью описанной схемы: множества объектов двух классов так расположены в фазовом пространстве, что не существует достаточно простой поверхности, разделяющей эти множества. В этом случае пытаются построить более сложное правило классифика-

Мазуров Вл.Д., Хачай М.Ю.

ции. Пример такого более сложного правила дает метод комитетов. Сущность его состоит в том, что мы строим не одну, а несколько поверхностей (комитет поверхностей), и решение о принадлежности объекта тому или иному классу принимаем по следующему правилу. Если точка попала в положительную сторону для большинства поверхностей, то ее относят к первому классу. Если же она находится по отрицательную сторону более чем половины всех поверхностей, то считают, что она описывает объект второго класса.

Математические модели некоторых задач распознавания образов Модель объекта

Моделью объекта служит набор п вещественных чисел - параметров, характеризующих объект. Этот набор называется п -мерным вектором: х = [ х1,..., хп].

Здесь х - символ объекта, х1 - значение первого параметра, х2 - второго,..., хп - п-го параметра, число х1 называется 1-и координатой, или компонентой вектора х.

Пример. Объект - человек; х1 - возраст, х2,...х17 - некоторые параметры анализа крови. В этом случае модель конкретного объекта - конкретный 17-мерный вектор х = [ х1,...,хп].

Множество всех п-мерных векторов, в котором определены операции сложения, умножения вектора на число и скалярного произведения двух векторов, называют п -мерным пространством и обозначают символом Яп. Задача распознавания образов в общем виде сводится к целесообразному разбиению заданной совокупности объектов на группы, поэтому объекты, вошедшие в одну группу, должны быть похожи друг на друга или близки друг другу по некоторому критерию "похожести" или близости. Объекты, попавшие в разные группы, должны быть достаточно различными, далекими друг от друга. Группы, о которых здесь идет речь, называются классами (иногда "образами"). Следовательно, класс или образ - мно-

жество всех объектов, сходных друг с другом в каком-либо фиксированном отношении. Например, классами/образами являются следующие множества:

- совокупность всех клиник с данной специализацией;

- множество всех людей, болеющих гриппом;

- популяция данного вида растений или животных.

Распознать объект или образ объекта-значит, указать, к какому образу (классу похожих объектов) он относится.

Поскольку моделью объекта является п -мерный вектор-элемент пространства Яп, то математической моделью класса/образа является множество в пространстве Яп.

Модель дискриминантного анализа

Предположим, что заданы два конечных множества л-мерных векторов: М-множество векторов, изображающих объекты одного рода (первого образа), и К- множество векторов, изображающих объекты другого рода (второго образа). Множества М и N вместе составляют материал обучения. Это означает, что, проанализировав вид векторов множеств М и К, мы должны выработать правило, согласно которому каждый новый объект, представленный п-мерным вектором, будет отнесен либо к первому, либо ко второму образу. Правило можно построить так. Найдем поверхность из некоторого класса поверхностей, разделяющих множества М и N.

Пусть уравнение этой поверхности имеет вид

Г(х)=Г(х1,...,хп) = 0,

Г - функция от п неизвестных.

Множество М находится по одну сторону от поверхности, причем если х-вектор из множества М, то Г(х)>0, если же х-элемент множества К, то Г(х<0. Множество N находится по другую сторону поверхности.

Тогда правило распознавания состоит в следующем:

произвольный вектор х пространства Яп относится к первому образу, если Г(х)>0; х-элемент второго образа, если Г(х)<0.

Итак, задача дискриминантного анализа имеет следующий вид: требуется найти функцию Г, удовлетворяющую системе неравенств

Г(х)>0 (для всех х из М), Г{х)<0 (для всех х из К), {из Б (8).

Здесь множество Б - выделенный класс функций Г Функция Г решающая систему (8), называется разделяющей, или дискриминантной.

Рассмотрим практический пример (все числовые данные в нем условны). Обозначим через М конечное множество видов технологически допустимых способов лечения в некоторой клинике, через N - конечное множество видов технологически недопустимых способов лечения. Каждый вид лечения характеризуется двумя параметрами: х1 - процентное содержание первого компонента в фармакологической смеси лекарств, х2 - процентное содержание второго. Поэтому модель каждого вида сырья представляет собой 2-мерный вектор

х = [х1, х2].

Пусть множество М состоит из следующих 2-мерных векторов: [1,3]; [2,1]; [1,1], множество N - из векторов [5,1]; [5,2]; [2,7].

Это можно записать так: М={[1,3]; [2,1]; [1,1]);

N = {[5,1]; [5,2]; [2,7]). Пусть далее класс Б, которому должна принадлежать разделяющая функция Г есть класс аффинных функций, т.е. Дх) = а х1 + Ь х2+ с, где коэффициенты а,Ь,с пока неизвестны. Составляем систему (6.1) для нашего примера: а+3Ь+с>0, 2а+Ь+с>0, а+Ь+с>0, 5а+ Ь+с<0, 5а+2Ь+с<0, 2а+7Ь+с<0.

Можно изобразить множества М и N на плоскости и получить решение системы графически: Дх1,х2) = -6 х1 - 4 х2 +24, то есть а = -6, Ь = -4, с = 24.

Предположим теперь, что имеется некоторый новый вид лечения, характеризующийся вектором [3,3]. Так как Д3,3)=-6<0, то мы делаем прогноз, что это лечение технологически недопустимо.

Другим практическим примером задачи

дискриминантного анализа может служить задача медицинской диагностики. В этой задаче множество М состоит из векторов, характеризующих людей, страдающих каким-либо определенным заболеванием; N состоит из людей, у которых это заболевание отсутствует.

Мы рассмотрели задачу дискриминантного анализа, в которой надо разбить множество всех объектов на два образа. Естественно, могут возникать задачи, в которых число образов больше двух (например, в задаче медицинской диагностики, когда число видов заболеваний равно трем, четырем и т. д.). Однако такие задачи легко сводятся к случаю с двумя образами.

Действительно, пусть задано к конечных множеств в пространстве Яп: М1, М2, ... , Мк, причем в множество М1 входят векторы, изображающие объекты 1-го класса/ образа. Мы можем построить к-1 разделяющую функцию: А,..., Г к-1. При этом функция й должна отвечать такой поверхности, что множество М1 - по одну сторону от нее, а множества М1+1,. . ., Мк - по другую.

Правило распознавания в этом случае имеет вид 1-го образа, если Щх)>0, в противном случае 2-го образа, если Й(х)>0, в

противном случае х-элемент.............

(к-1)-го образа, если Г к-1(х)>0; в противном случае к-го образа.

Мы видим, что задача для к образов сводится к к - 1 задачам с двумя образами. Методы дискриминантного анализа Пусть в задаче дискриминантного анализа требуется найти линейную разделяющую функцию для множеств М и N. Множество М состоит из п-мерных векторов а1 = [ а11,...,а1п];

аБ = [аБ1,.,аБп].

Множество N состоит из векторов Ь1 = [Ь11,...,Ь1п],

Ы = [Ы1,...,Ып].

Предположим, что разделяющая функция имеет вид

Мазуров Вл.Д., Хачай М.Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Дх1,...,хп) = 21 х1 + ... + 2п хп. Коэффициенты 21 , ... , 2п должны быть такими, чтобы Г{х)>0, если х из МДх)<0, если х из N т. е. они должны удовлетворять системе неравенств

а)1 21 + ... + ар 2п > 0 0=1,.,б), Ь11 21 + ... + Ь1п 2п < 0 ( 1 =1,...,1;) (9).

Рассмотрим также систему а)1 21 +...+ а)п 2п >1 ( )=1,.,б), Ь11 21 +...+ Ь1п 2п < -1 (1=1,...Д) (10).

Очевидно, что если система (9) совместна, то обладает решением и система (10), причем решение системы (10) является решением системы (9). Имеется один из стандартных методов линейного программирования - симплекс-метод, которым и можно воспользоваться. Однако в более сложных случаях, когда рассматриваемые системы несовместны, приходится использовать более сложные методы, например, метод комитетов.

Рассмотрим задачу разделения двух конечных множеств М и N найти функцию Г из некоторого класса функций Б, такую, что Г(х)>0 (для всех х из М), Дх)< 0 (для всех х из Ю. Может случиться, что эта задача не имеет решения, т.е. в классе Б не найдется ни одной функции, разделяющей множества М и N.

В этом случае можно воспользоваться следующим понятием комитета. Комитетом функций класса Б, разделяющим множества М и N называется такая совокупность функций из Б: С = { П,...^), что для любого х из М неравенству Г(х)>0 удовлетворяет более половины из функций Г) (при х из N большинство их удовлетворяют противоположному неравенству). Следовательно, решение о принадлежности любого элемента к первому или второму образу принимается "большинством голосов" членов комитета.

Если большинство из чисел А(х),...,Гя(х)

положительны, то считаем, что х - вектор из первого образа; если большинство из них неположительны, то х - вектор второго образа. Если количество положительных значений Г)(х) равно числу неположитель-

ных, то решение о принадлежности х тому или иному классу не принимается.

КОМИТЕТЫ В РЕШЕНИИ ЗАДАЧ ОПТИМИЗАЦИИ

Роль модели математического программирования в последнее время становится все большей в самых различных областях приложений: в экономике, технике, физике, биологии и др. Однако в связи с расширением области приложений возникает необходимость в регулярном подходе к анализу несобственных (не обладающих решением в обычном смысле) задач оптимизации. Поскольку одним из подходов к анализу несовместных систем соотношений является изучение комитетных конструкций таких систем, то возникает вопрос о их содержательной интерпретации для различных конкретных областей приложений.

Речь идет об интерпретации таких конструкций, как минимальные несовместные подсистемы, максимальные совместные подсистемы, наборы решений этих подсистем, системы представителей, р-комитеты.

Хорошо апробированным аспектом использования таких конструкций в задачах оптимизации является применение к задачам идентификации модели математического программирования, к комбинированным процедурам оптимизации, включающим блоки распознавания образов. В этом случае комитетные конструкции применяются для систем соотношений, связывающих функции как элементы функциональных пространств.

Совсем другой смысл приобретают комитетные конструкции в применении к несовместным системам ограничений на вектор состояния х в задаче математического программирования. Так, например, если в системе ограничений мы попытались записать как можно больше естественно возникающих требований к объекту с вектором состояния х, который должен быть инструментом, обеспечивающим выполне-

ние некоторого набора действий, то можно считать набор минимальных несовместных подсистем каталогом минимально невозможного, а набор максимальных совместных подсистем - каталогом максимально возможного.

Задача математического программирования

Рассмотрим задачу математического программирования: найти наибольшее значение (supremum) функции

f(x)=f{x1,.. ,,xn) на множестве всех решений системы неравенств

fj(x) = fj(x1,.,xn) < bj ( j = 1,.,m) (11), где х= [x1,.,xn] принадлежит пространству Rn. Вектор х может интерпретироваться как вектор состояния проектируемого объекта, а его координата х1 - как значение i-го параметра состояния.

Введем обозначения:

M={x: (11)} - допустимое множество задачи;

М/ - множество векторов x из Rn , допустимых по j-му ограничению;

v = sup {f(x):x из М} - оптимальное значение задачи;

М~ - оптимальное множество, т.е. множество всех оптимальных векторов.

Если решение рассматриваемой задачи sup{f(x): (ll)} (12)

не существует, т.е. множество М пусто либо ввиду v=+°°, либо ввиду недостижимости на М оптимального значения, хотя оно и конечно, либо ввиду пустоты множества М, то в соответствии с содержательным смыслом задачи могут быть использованы различные варианты обобщения понятий допустимого и оптимального векторов. Задачи с указанными особенностями называются несобственными [3].

Для широкого круга практических задач естественными обобщениями понятия решения являются [3]: чебышевские уклонения

Е= 1пЦ 1 > 0: Г)(х) < Ь + 1 ( ) = 1,.,т) и приближения - элементы множества {х : Г)(х) < ^+ Е ( ] = 1,...,m)}, связанные с непрерывной аппроксимацией исходной задачи (12). Однако в ряде случаев практическая интерпретация несобственной задачи требует применения дискретных аппроксимаций типа "размытых" решений или комитетных конструкций [5], например, когда необходимо вовлекать в рассмотрение совокупности векторов, каждый из которых является допустимым лишь по некоторой подсистеме условий. Так, например, можно рассматривать комитеты для системы множеств. Такие конструкции применимы и к многокритериальным задачам принятия решений для ситуаций с повторяющимся выбором.

По-видимому, применение комитетных конструкций оправдано и в тех случаях, когда источником несобственности задачи выступает возможность одновременного доступа нескольких пользователей к большой базе данных. В таких ситуациях база данных (информационная составляющая) задачи (12) может содержать либо несовместные данные (ограничения на допустимость векторов состояний и др.), либо обладать каким-либо другим свойством несогласованности).

Отметим, что непрерывность или дискретность аппроксимации связаны с непрерывностью или разрывностью штрафной функции за невыполнение ограничений.

Разумеется, можно рассматривать понятие несобственной задачи в более широком смысле, поскольку такие задачи возникают не только в сфере оптимизации, но и во многих других областях: в распознавании образов, в моделях идентификации и т.д. Типичными примерами несобственных задач могут служить переопределенные задачи обработки результатов.

i Надоели баннеры? Вы всегда можете отключить рекламу.