Научная статья на тему 'Применение полиэдральных методов в прикладных математических задачах, сводящихся к анализу и решению систем линейных неравенств'

Применение полиэдральных методов в прикладных математических задачах, сводящихся к анализу и решению систем линейных неравенств Текст научной статьи по специальности «Математика»

CC BY
201
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Никонов В. Г., Рыбников К. К.

Рассматриваются возможности так называемого полиэдрального подхода к решению различных практических задач, связанных с анализом нейросетей, экономических проблем принятия решения и задач распознавания.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Никонов В. Г., Рыбников К. К.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLYING POLYHEDRAL METHODS TO PRACTICAL PROBLEMS

The authors present a survey of polyhedral methods as quantative approaches to neural network solutions, economic problems and decision making.

Текст научной работы на тему «Применение полиэдральных методов в прикладных математических задачах, сводящихся к анализу и решению систем линейных неравенств»

Одним из универсальных подходов к созданию математических моделей функционирования различных узлов электронных схем является построение системы булевых уравнений, решения которой описывают их основные параметры. Таким образом, задача построения методов решения системы булевых уравнений приобретает важное значение в прикладных исследованиях.

В представленных ниже пяти работах проводится анализ ряда вопросов развития одного из таких методов, получившего в литературе название метода разделяющих плоскостей. Суть этого метода состоит в погружении множества решений системы булевых уравнений в полиэдр, определяющий выпуклый многогранник.

Основные приложения этого подхода - анализ нейросетей и синтез нейрокомпьютеров, построение экономических моделей и решение задач распознавания образов - исследуются в статье В.Т. Никонова и К.К. Рыбникова, в следующей за ней статье К.К. Рыбникова изучаются алгоритмические схемы реализации этого метода, и приводятся оценки их сложности. В работах В.Б. Нетыкшо и П.В. Ролдугина исследуются вероятностные характеристики полиэдрального подхода и возможности исследования с помощью этого подхода ряда важных, с практической точки зрения, задач теории графов.

В работе О.Н. Журавлевой, Т.А. Ласковой и К.К. Рыбникова обсуждается вопрос, связанный с определением места метода разделяющих плоскостей в общем аппарате дискретного анализа. Основное значение этого метода заключается в связи непрерывного и дискретного подходов к изучению одной из важнейших практических задач - задачи решения системы булевых уравнений,

Рекомендуя эти работы для опубликования в «Вестнике государственного университета леса - Лесном вестнике», хотел бы выразить уверенность в том, что эти публикации привлекут внимание специалистов, занимающихся математическим моделированием, синтезом нейросистем, а также будут полезны для построения учебных курсов дискретной математики для студентов инженерных и экономических специальностей.

Действительный член РАЕН, доктор технических наук В.Г. Никонов.

ПРИМЕНЕНИЕ ПОЛИЭДРАЛЬНЫХ МЕТОДОВ В ПРИКЛАДНЫХ МАТЕМАТИЧЕСКИХ ЗАДАЧАХ, СВОДЯЩИХСЯ К АНАЛИЗУ И РЕШЕНИЮ СИСТЕМ ЛИНЕЙНЫХ НЕРАВЕНСТВ

В.Г. НИКОНОВ, действительный член РАЕН, К.К. РЫБНИКОВ, докторант МГУЛа, к. ф-м.

Можно указать значительное количество прикладных задач, сводящихся к решению систем линейных неравенств

а„д:,+... +а,Л >6,;

(1)

а .х, +... +а х >Ь .

ш I 1 ШЧ II III

Множество решений системы (1) образует некоторый многогранник, или поли-

>. т. н.;

эдр, в п-мерном пространстве (ограниченный или разомкнутый). Для ряда задач система неравенств (1) возникает естественно, являясь составной частью ее постановки [2, 5], в иных случаях система (1) может быть специально построена [1], Возможность задания с помощью системы неравенств широкого класса задач связана, прежде всего, с большими логическими возможностями ба-

зиса пороговых соотношений. Кроме того, оценка значений взвешенной суммы лежит в основе многих задач по распознаванию образов, анализу обстановки и принятию решений и, как следствие, различных экономических задач.

Несмотря на природу возникновения системы (1), общая проблема ее анализа и решения разбивается на следующие три близкие, но не тождественные, постановки:

1) проверка совместности системы (1);

2) нахождение в случае совместности хотя бы одного решения системы (1);

3) нахождение всех решений системы

(!)■

Если для хорошо изученной системы линейных уравнений задачи 1, 2, 3 имеют практически одинаковую сложность, эквивалентную сложности обращения матрицы, то для систем линейных неравенств эти задачи отличаются одна от другой принципиально.

Обнаружение несовместности системы (1) может носить локальный характер и сводится к выделению несовместной подсистемы. В действительной области задача нахождения хотя бы одного решения системы (1) имеет полиномиальную сложность, но при этом известные полиномиальные алгоритмы чрезвычайно трудоемки. Что же касается нахождения всех решений системы (1), то именно эта задача сводится к полному описанию строения многогранника решений в действительной области - полиэдра.

В случае дискретных или булевых неизвестных х алгоритмические проблемы, связанные с анализом и решением системы (1), усложняются. В частности, для этого случая не существует универсального полиномиального алгоритма распознавания совместности, аналогичного алгоритму Л.Г. Хачияна для действительной области.

Определение множества решений системы (1) в общем случае является задачей экспоненциальной относительно размеров системы по сложности.

В том случае, если матрица А = {г }^

является абсолютно унимодулярной (например, выполняются условия Хеллера - Томп-

кинса для случая а.. = ±1 или 0 [8]), нижняя

достижимая оценка сложности алгоритма определения всех решений системы (1), основанного на переборе вершин выпуклого многогранника, соответствующего (1), носит полиномиальный характер [6],[7].

В работе [6] определен вид этой оценки (т(п-1)+2)ь(т,п), где Ь(т,п) - полиномиальная оценка определения вершины многогранника {х \Ах > Ь, х> 0}.

Приведем примеры различных прикладных задач, сводящихся к анализу и решению систем (1).

1. Настройка порогового элемента на решение задачи распознавания

Под пороговым элементом (ПЭ) понимается устройство, реализующее пороговую функцию (рис.) с логикой

г = 1 <=> +... + ахп > Ь, (2)

где а., Ь, +, > - действительные; х. - дискретные (в частном случае - двоичные).

Как показали исследования, начатые в 40-е годы Мак Каллоком и Питтсом, ПЭ является простой и достаточно точной моделью нейрона живого организма, очень хорошо решающего задачи распознавания путем настройки [5].

Рассмотрим бионическую модель процесса настройки модели нейрона - ПЭ - для случая х, е {ОД}. Предположим, что во всем

множестве V входных сигналов, - п-мерных векторов, выделено два непересекающихся подмножества: X = {(х,01,..

( = Ц, ] = йг, Хсу,

У с V , X Г\У = 0. Будем говорить, что ПЭ

различает эти два множества, если при подстановке всех векторов одного из них нера-

венство (2) выполнено, а при подстановке всех векторов из другого - не выполнено, то есть

а|*1<1) + .. • + «, Х,(,° > Ь;

+. .. + а ,х^’>Ь-

а1у|(1)+.. . + а, у!° < Ъ\

аУ;г) + . .. + а У:2)<ь.

Получившаяся система (3) есть система линейных неравенств, где в качестве неизвестных выступают коэффициенты ПЭ ах,...,аи, а векторы из множеств X я У -известны. Если система (3) имеет решение относительно а,,..., а,, то существует ПЭ, различающий множества X и У . Коэффициенты а],..., аи - действительные, поэтому

задача распознавания совместности системы

(3) и нахождение хотя бы одного решения имеют полиномиальную сложность.

Задача распознавания является важной прикладной задачей, входит обязательной составной частью в различные критерии, используемые в алгоритмах, имеющих большое практическое значение [2, 5].

Среди важнейших задач такого типа можно указать задачи распознавания образов, анализа обстановки и принятия решений, автоматического управления и т. д.

Кроме того, пороговый элемент является базовым элементом принципиально новой вычислительной среды - нейросети, и его настройка представляет собой фрагмент настройки и обучения сети в целом. К нейросетям и построенным на их основе нейрокомпьютерам в настоящее время привлечено внимание ученых во всем мире, так как эти вычислители позволяют решать множество трудноформализуемых прикладных задач.

2. Системы линейных неравенств в экономических задачах

Для экономических задач линейные ограничения, задаваемые неравенствами, представляют собой строгое математическое выражение условий, в которых протекает коммерческая деятельность. Ограничения, налагаемые на закупку сырья, аренду поме-

щений, заработную плату, уровень рентабельности производства и т. д., в формализованном виде и составят систему неравенств (1), решение которой, например, может указывать на приемлемый вариант ассортиментной политики производства. Если сформированная таким образом система (1) окажется несовместной, то задуманный вариант экономического поведения не имеет коммерческого смысла. В случаях, когда система неравенств совместна, поиск ее решений соответствует нахождению допустимых вариантов ведения экономической политики. При этом в значительной части известных экономических задач выбор из допустимых вариантов оптимального осуществляется с помощью так называемой целевой функции.

Так или иначе, анализ совместности системы неравенств (1) является неотъемлемой частью данной проблематики, так же как и построение эффективных алгоритмов решения таких систем в действительной и дискретной областях.

3. Решение нелинейных систем булевых уравнений методом разделяющих плоскостей

Широкий класс прикладных задач дискретной математики сводится к анализу и решению нелинейных систем булевых (и &-значных) уравнений

/,(•*..■0 = У,»1’ = 1>К. (4)

Один из приемов решения системы

(4) основан на сведении (4) к равносильной системе линейных неравенств, или разделяющих плоскостей [1, 3]. В основе этого метода, получившего название метода разделяющих плоскостей, лежит замена каждого булевого уравнения системы (4) вида

/(х,,...,*)-/ (5)

на равносильную относительно 0-1 решений систему неравенств

апх[ + ... + а1пхп > Ь,;

(6)

акЛ+..ЛаЬ1х,1>Ьк.

Такая замена всегда возможна. В частности, всегда можно отсечь от п-мерного единичного куба У , любую вершину. Действительно, вершину (0,...,0) отсекает плоскость

дс,>1, (7)

то есть неравенство (7) выполнено во всех вершинах У , за исключением вершины (0,...,0). К любой другой вершине из вершины (0,...,0) можно перейти путем инвертирования некоторых х.. В аналитическом плане инвертированию х. отвечает замена х) в неравенстве (7) на (1 - х.), что позволяет, исходя из неравенства (7), легко получить неравенство, отсекающее любую другую вершину п-мерного единичного куба У . Следовательно, обращаясь к равенству (5) и выделяя все вершины У , в которых это уравнение не выполнено, можно построить систему неравенств, их отсекающую; эта система неравенств будет, очевидно, равносильна равенству (5) относительно 0-1 решений.

Принципиальное существование системы (6) для любого уравнения (5) тем самым доказано, хотя получившаяся в связи с вышеизложенным алгоритмом система не является оптимальной по числу неравенств. Система неравенств вида (6) с наименьшим «Ь> получила название минимальной системы разделяющих плоскостей (МСРП), для ее поиска разрабатываются специальные методы. С точки зрения пороговой логики, построению МСРП соответствует синтез простейшей однокаскадной сети ПЭ, реализующей функцию f(xl,...,xll) [3,4].

Доказанная таким образом возможность замены каждого нелинейного уравнения системы (4) на равносильную систему линейных неравенств позволяет построить итоговую систему линейных неравенств, равносильную (4):

Ап*, + >2>,;

(8)

ашхх + ... + ашхи >Ьи.

Главной особенностью системы (8), с алгоритмической точки зрения, является то, что для нее нужно искать обязательно 0-1 решения, а не произвольные действительные, как в предыдущем примере, для чего разрабатываются специальные алгоритмы.

К анализу систем уравнений (4) сводятся различные задачи, связанные с функционированием дискретных устройств переработки информации. Сведение систем нелинейных уравнений (4) к системам линейных неравенств (8) позволяет исследовать поведение дискретных устройств с помощью математического аппарата систем линейных неравенств.

Рассмотренные задачи показывают, что системы линейных неравенств занимают особое место в прикладной математике. Разработка методов проверки совместности таких систем и алгоритмов их решения имеет большое практическое значение.

Литература

1. Балакин Г.В., Никонов В.Г. Методы сведения булевых уравнений к системам пороговых соотношений / Обозрение прикладной и промышленной математики. Сер. «Дискретная математика», 1994, Т. 1. В. 3.-С. 389-401.

2. Галушкин А.й. Сфера применения нейрокомпьютеров расширяется / Приложение к журналу «Информационные технологии». - 2001. - № 10. - М.: Машиностроение, 2001.

3. Никонов В.Г. Пороговые представления булевых функций / Обозрение прикладной и промышленной математики. Сер. «Дискретная математика». Т. 1. Вып. 3. - 1994 - С. 402-457.

4. Никонов В.Г. Классификация минимальных базовых представлений всех булевых функций от четырех переменных / Обозрение прикладной и промышленной математики. Сер. «Дискретная математика». Т. 1. Вып. 3. - 1994 - С. 458-545.

5. Нейронные сети: история развития теории. Нейрокомпьютеры и их применение. Кн. 5 / Под общей ред. А.И. Галушкина, акад. Я.З. Цыпкина. -М.: Издательское предприятие редакции журнала «Радиотехника», 2001.

6. Рыбников К.К. Оценки сложности некоторых схем метода разделяющих плоскостей при решении систем булевых уравнений / Обозрение прикладной и промышленной математики. Т.9. Вып. 2. - М.,2002. - С. 442-443.

7. Рыбников К.К. Методы решения систем булевых уравнений, основанные на погружении множест-

ва решений в выпуклый многогранник // Науч. тр 8. Хеллер И., Томпкинс Ч. Обобщение одной тео-

/ Моск. гос. ун-т леса. - 1995. - Вып. 269. - С. 88- ремы Данцига. В сб. "Линейные неравенства и

91. смежные вопросы. - М.: ИЛ, 1959.

СХЕМЫ ФУНКЦИОНИРОВАНИЯ ФОРМАЛЬНЫХ НЕЙРОНОВ В НЕЙРОКОМПЬЮТЕРНЫХ СЕТЯХ КАК МОДЕЛИ АНАЛИЗА МНОЖЕСТВА РЕШЕНИЙ СИСТЕМЫ БУЛЕВЫХ УРАВНЕНИЙ

К.К. РЫБНИКОВ, докторант МГУЛа, к. ф-м. н.

Формальным нейроном называется элементарный процессор, используемый в узлах нейронной сети, определяющий схему работы нейрокомпьютера. Математическую модель формального нейрона можно представить уравнением

где >>- выходной сигнал нейрона; /^) -функция выходного блока нейрона; а. - постоянный коэффициент - вес і -го входа; х. - і-й входной сигнал; а0 - начальное состояние нейрона; і = 1,2,3,...,п - номер входа нейрона; п - число входов [1,2].

Иллюстрацией к определению формального нейрона может служить следующая структурная схема:

Функция выходного блока, получившая в литературе название функции активации, может, вообще говоря, иметь любой вид в зависимости от особенностей конкретной задачи. Наиболее известны линейные, ступенчатые, линейные с насыщением, многопороговые и сигмоидные функции. Одним из наиболее часто встречающихся типов

функций активации является простая пороговая, то есть функция /(#), имеющая следующий вид:

ГЬ, если g<0;

[с если g>0,

/(#) =

где Ь и с - некоторые постоянные. Как правило, выбираются случаи Ъ-~ 1; с = 1 или Ь = 0; с — 1.

В этом случае, очевидно, анализ схемы функционирования формального нейрона сводится к анализу структуры множества решений системы линейных неравенств вида

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

g <0 или # > 0,

где каждое неравенство порождается набором входных сигналов.

Построенный таким образом полиэдр, то есть множество решений системы линейных неравенств, дает полное представление о работе формального нейрона.

Полиэдральный подход к моделированию узлов электронных схем может быть использован также при анализе двоичного преобразователя, работа которого описывается уравнением

)= у, (1)

где у - входной двоичный сигнал преобразователя, а х. - г -й входной двоичный сигнал; г = 1,2- номер канала входа, х. =0 или 1; / - булева функция.

Общий вид подобного преобразователя иллюстрируется следующей схемой:

i Надоели баннеры? Вы всегда можете отключить рекламу.