Научная статья на тему 'Нейросетевой анализ раскрашенных графов'

Нейросетевой анализ раскрашенных графов Текст научной статьи по специальности «Математика»

CC BY
531
103
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИДЕНТИФИКАЦИЯ / ПРОСТАЯ ЦЕПЬ / СТАТИСТИКА / ПОИСК В ШИРИНУ / АНАЛИЗ АЛГОРИТМА / ОБУЧЕНИЕ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ / IDENTIFICATION / SIMPLE CHAIN / STATISTICS / BREADTH-FIRST SEARCH / ALGORITHM ANALYSIS / ARTIFICIAL NEURAL NETWORK TRAINING

Аннотация научной статьи по математике, автор научной работы — Гермашев Илья Васильевич, Дербишер Евгения Вячеславовна, Дербишер Вячеслав Евгеньевич, Маркушевская Елена Александровна

Рассмотрена проблема идентификации раскрашенного графа, возникающая при решении задач в предметной области, формализуемой в терминах теории графов, в том числе в связи с исследованием зависимости «химическая структура свойство». Предложена модель химической структуры в виде раскрашенного графа. Анализ графов основан на статистиках простых цепей, для получения которых описан алгоритм поиска в ширину, приведен анализ алгоритма. Получена верхняя оценка сложности алгоритма и показана ее достижимость. Показано, как с помощью выявленных простых цепей проводится обучение искусственной нейронной сети. Формально представлен результат ее обучения в виде формулы, позволяющей вычислять выходной сигнал по вектору входных сигналов. Показано использование искусственной нейронной сети для идентификации графов. Полученные результаты представляют собой математическое обеспечение, позволяющее обоснованно создавать решающие правила идентификации систем, формализуемых в терминах теории графов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гермашев Илья Васильевич, Дербишер Евгения Вячеславовна, Дербишер Вячеслав Евгеньевич, Маркушевская Елена Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE NEURAL NETWORK ANALYSIS OF COLORED GRAPHS

The article deals with the problem of colored graph identification. This problem arises when solving tasks in the subject area which is formalized in terms of graph theory including cases connected with the investigation of “chemical structure property” dependence. The authors propose the model of chemical structure in the form of a colored graph. The upper bound for the algorithm complexity is obtained, and its feasibility is shown. The learning samples are represented by graphs with a given property. The problem solved in the paper is the method development and analysis allowing to identify the property of graph that is not included in the learning samples. To solve the problem it is proposed to use the mechanism of artificial neural network of the original structure, the principles of which differ significantly from generally accepted, which is in the signals form and signals distribution ways across the network. The graph analysis is based on simple chains statistics for which the breadth-first search algorithm is described, and the algorithm analysis is given. The proposed algorithm allows also to handle disconnected graphs and thus to analyze multi-component systems. The article presents the formal result of its training as a formula allowing to calculate the output signal for input signals vector. The use of artificial neural network for graphs identification is demonstrated. The obtained results represent mathematical software which enables creating a reasonable decision rules for a systems identification formalized in graph theory terms.

Текст научной работы на тему «Нейросетевой анализ раскрашенных графов»

www.volsu.ru

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

DOI: http://dx.doi.Org/10.15688/jvolsu1.2016.2.3

УДК 519.174 ББК 22.176

НЕЙРОСЕТЕВОЙ АНАЛИЗ РАСКРАШЕННЫХ ГРАФОВ

Илья Васильевич Гермашев

Доктор технических наук,

профессор кафедры фундаментальной информатики и оптимального управления, Волгоградский государственный университет [email protected], [email protected]

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

Евгения Вячеславовна Дербишер

Кандидат технических наук,

доцент кафедры аналитической, физической химии и физико-химии полимеров, Волгоградский государственный технический университет [email protected]

просп. В. И. Ленина, 28, 400005 г. Волгоград, Российская Федерация

м

м

Вячеслав Евгеньевич Дербишер

Доктор химических наук,

профессор кафедры технологии высокомолекулярных и волокнистых материалов, д Волгоградский государственный технический университет

& [email protected]

| просп. В. И. Ленина, 28, 400005 г. Волгоград, Российская Федерация

ю а

Й

, Елена Александровна Маркушевская

И Кандидат педагогических наук,

& доцент кафедры педагогики и психологии начального образования,

Л Волгоградский государственный социально-педагогический университет

[email protected]

^ просп. В. И. Ленина, 27, 400005 г. Волгоград, Российская Федерация

т К

« Аннотация. Рассмотрена проблема идентификации раскрашенного графа, воз-

§ никающая при решении задач в предметной области, формализуемой в терминах тео-Цр рии графов, в том числе в связи с исследованием зависимости «химическая структура - свойство». Предложена модель химической структуры в виде раскрашенного графа.

Анализ графов основан на статистиках простых цепей, для получения которых описан алгоритм поиска в ширину, приведен анализ алгоритма. Получена верхняя оценка сложности алгоритма и показана ее достижимость. Показано, как с помощью выявленных простых цепей проводится обучение искусственной нейронной сети. Формально представлен результат ее обучения в виде формулы, позволяющей вычислять выходной сигнал по вектору входных сигналов. Показано использование искусственной нейронной сети для идентификации графов. Полученные результаты представляют собой математическое обеспечение, позволяющее обоснованно создавать решающие правила идентификации систем, формализуемых в терминах теории графов.

Ключевые слова: идентификация, простая цепь, статистика, поиск в ширину, анализ алгоритма, обучение искусственной нейронной сети.

Современные методы дискретной математики, в частности теория графов, находят широкое применение при исследованиях в самых разных областях науки и техники. Так, например, в области химии, применительно к тематике наших интересов [3; 5], структуры химических соединений моделируют с помощью графов, что позволяет применять указанные математические методы для анализа и синтеза виртуальных химических структур [1; 10], имеющих не только академическое, но и практическое значение, например, при выборе перспективных веществ для продвижения на технологический рынок. При этом решение ряда важных прикладных задач в данной области часто сводится к статистическому анализу различных дескрипторов химических структур. Учитывая это, математическое решение такого рода задач состоит из четырех этапов: формального представления исходных данных (в нашем случае химических структур), построения математической модели, анализа формализованной модели и синтеза решающих правил.

Формально описанную выше задачу можно представить следующим образом.

Пусть задан универсум G графов. Выделим в нем подмножество G+ с G графов, обладающих интересующим нас свойством. Соответственно множество G\G+ обозначим через G-. Будем считать, что, вообще говоря, элементы множества G+ не известны, но некоторые из них все же установлены и составляют множество G+ с G+. Аналогично G- с G-. Таким образом, множество G = G+ с G- составляет обучающую выборку.

Пусть задан граф G0 с G\G. Требуется определить, какому из двух множеств (0+ или G) он принадлежит. Иными словами, обладает ли граф G0 заданным свойством или нет.

Таким образом, основной задачей данной работы является создание теоретических предпосылок для получения статистик графов и формирования правил идентификации свойств графов согласно обучающей выборке. Для иллюстрации и интерпретации формальных выкладок будем использовать химические структуры.

Для решения поставленной задачи будем использовать основные положения теории графов [7].

В настоящей работе для анализа графа будем использовать статистику простых цепей и при моделировании химической структуры примем следующие положения:

- каждый атом (или группу атомов) будем представлять вершиной, окрашенной в цвет, соответствующий химическому элементу (или функциональной группе);

- количество цветов вершин обозначим через kv (^ может достигать нескольких тысяч: химические элементы плюс группы элементов);

- для идентификации атомов в молекуле пометим все вершины в графе: ..., V где п -количество вершин в графе;

- цвет вершины vj обозначим через с, г = 1, ..., п;

- химические связи между атомами в молекуле будем представлять ребрами, причем ребра будут раскрашены в цвета, соответствующие различным типам химических связей. Количество цветов ребер обозначим через ke (к может достигать нескольких единиц, в зависимости от учитываемых типов химической связи). Цвет ребра инцидентного вершинам V{ и V. обозначим с. (цвет 0 обозначает отсутствие ребра).

В результате получим простой (без петель и кратных ребер) помеченный граф G как с вершинной, так и с реберной раскраской. Причем, степень любой вершины не превышает максимальной валентности химического элемента - 8, то есть

А(С) < 8, (1)

где Д^) - максимальная степень вершины графа G [7].

Возможны и другие ограничения, определяемые исходя из задач анализа рассматриваемого конкретного класса химических соединений. Например, если в этом же контексте рассматривать предпочтения авторов - мономеры, предназначенные для синтеза или модификации высокомолекулярных соединений [2; 4; 9; 10], то количество вершин в графе можно ограничить несколькими десятками.

Следующая задача - это определение всех возможных простых цепей в графе G (далее, поскольку речь будет идти только о простых цепях, для краткости говорится «цепь» вместо «простая цепь»).

Для решения этой задачи воспользуемся поиском в ширину [7].

1. Определим множество Н = 0 цепей, множество V0 = 0 рассмотренных начальных вершин цепей и Vn = VG еще не рассмотренных начальных вершин.

2. Зафиксируем начальную вершину v0 е VG\V0 цепи, положим V0 = V0 и V}, Vn = Р"п\{ую}, множества Нк = 0 цепей длины к = 0, ..., п с начальной вершиной vj0.

3. Положим рассматриваемые цепь hc = vj0 и вершину vc = vj0, множество Vh = {у.0} вершин цепи h к = 1.

4. Определим множество Vc с VG\Vh вершин, смежных вершине V Если Vc = 0, то перейдем на шаг 6.

5. Положим Нк = Нки V е V} и Н=Ни V е V}, где «.» - операция конкатенации.

6. Если Нк-1 = 0, то перейдем на шаг 7, иначе возьмем hc е Нкл, в качестве vc последнюю вершину из цепи h а множества Vh все вершины цепи h положим Нк1 = Ны\{^} и перейдем на шаг 4.

7. Положим к = к + 1. Если к < п + 1, то переходим на шаг 6.

8. Если Vn = 0, то завершим алгоритм, иначе перейдем на шаг 2.

После завершения алгоритма множество Н будет содержать все цепи. Заметим также, что множество Н0 цепей нулевой длины всегда пусто, поскольку такие цепи нас не интересуют.

Как видно, раскраска никак не учитывалась в алгоритме. Поэтому алгоритм применим к более широкому классу графов (и к несвязным тоже). Раскраска же нам понадобится дальше, при статистическом анализе цепей.

Покажем теперь, что приведенный алгоритм действительно находит все цепи в графе.

Рассмотрим в графе G некоторую цепь уу ...V, , где 2 < т < п. Согласно шагам 2 и 8 вершина у обязательно станет начальной в цепи, а по шагу 3 вершина у станет рассматриваемой. Далее, поскольку у смежна у , то у на шаге 4 будет помещено в множество Vc и затем на шаге 5 цепь уу будет помещена в множества Н1 и Н. Затем по шагу 6 цепь уу и вершина у станут рассматриваемыми. Далее повторяем приведенные выше рассуждения для связки вершин у - у и цепь V.у¡убудет помещена во множество Н.

Продолжая таким образом, добьемся того, что цепь у.у...V . будет помещена во множество Н. Поскольку цепь у.у...V . выбрана произвольно, то это означает, что в результате работы алгоритма во множество Н будут помещены все цепи графа G.

Поскольку данный алгоритм решает поставленную задачу, рассмотрим теперь, насколько эффективно это решение.

Оценим сложность L алгоритма.

Шаг 1 выполняется всего один раз и его составляют инициализация пустых множеств Н, V (сложность константа с0), а также множества Vn (сложность с1п). Шаги со 2-го по 8-й выполня-

ются, пока в качестве начальной вершины цепи не поучаствует каждая из вершин графа G, то есть n раз:

L = c0 + c1n + nLv (2)

где Lj - сложность шагов 2-8.

В свою очередь L составляют шаг 8 (сложность c2) и шаги со 2-го по 7-й (сложность L2). Шаги со 2-го по 7-й повторяются, пока не рассмотрим все длины цепей k, то есть n раз. Получили, что L = c2 + nL2. Подставляя полученное равенство в (2), получим

L = c0 + (cj + c2)n + n2L2. (3)

Далее L2 составляют шаг 7 (сложность c3), шаг 2, на котором инициализируются H0, ..., H и проводятся несколько операций (сложность c4 + c5n), шаг 3, на котором строим множество Vh из k вершин, учитывая, что k < n, плюс еще несколько операций, получим сложность шага 3 не больше c6 + c7n, и шаги с 4-го по 6-й (сложность L3). Шаги с 4-го по 6-й повторяются, пока не рассмотрим все цепи из множества Hk (число таких цепей обозначим N). Получили, что L2 < c3 + + c4 + c6 + (c5 + c7)n + NL3, где N = max Nk. Подставляя полученное неравенство в (3), получим

k=1,...,n

L < c0 + (c1 + c2)n + (c3 + c4 + c6)n2 + (c5 + c7)n3 + n2NL3. (4)

На шаге 4 реализуется несколько операций и поиск смежных вершин. Все смежные вершины можно найти не более, чем за n операций. Поэтому сложность этого шага можно оценить, как не превосходящую величину c8 + c9n.

На шаге 5 добавляем в множества Нк и H новые цепи. Число этих цепей равно числу смежных вершин, а число смежных вершин не может быть больше 8 для рассматриваемого класса графов G, то есть сложность этого шага составляет константу c10.

На шаге 6 реализуется несколько операций и формирование множества Vh, на что может понадобиться до n операций. Следовательно, сложность этого шага можно оценить величиной

С11 + C12n.

Суммируя вышесказанное, получаем L3 < c8 + c10 + c11 + (c9 + c12)n и подставляем это неравенство в(4):

L < c0 + (c1 + c2)n + (c3 + c4 + c6)n2 + (c5 + c7)n3 + (c8 + c10 + c11)n2N +

+ (c9 + c12)n3N < c13n3N. (5)

Из этой оценки уже видно, что сложность алгоритма полиномиальна относительно числа вершин и числа цепей, что позволяет сделать заключение о достаточной эффективности алгоритма.

Теперь осталось оценить величину N.

Очевидно, что N1 < A(G). Далее, так как одна смежная вершина - это та, из которой мы попали в следующую, то смежных вершин, отсутствующих в цепи, будет не более A(G) - 1, и получаем Nk < A(G)(A(G) - 1)k-1. Откуда, учитывая (1),

N = maxNk < A(G)(A(G)- 1Г1 = -AG^r(A(G)- 1)n <cu7n. k=0,n A(G) -1

Подставляя эту оценку в (5), получим

L < cn37n.

Очевидно, что общее количество цепей в графе не превышает величину п(Д(О))и. Убедимся, что среди рассматриваемых графов действительно есть такие, у которых имеется экспоненциальное число цепей. Таким примером может служить, например, следующий граф порядка п на рисунке 1.

Пусть п будет кратно 7. Тогда возьмем ряд 7-клик (всего их будет п/7), последовательно соединим их ребрами (мостами) так, чтобы эти ребра не были смежными, и крайние клики со-

5

единим ребром аналогично. В каждой 7-й клике можно выделить ^ А цепей длины от 1 до 6,

к=0

начинающихся с вершины, инцидентной одному мосту, и заканчивающихся вершиной, инцидент-

ной другому мосту. Соединяя цепи из соседних клик, можно составить всего I ^ А | , причем мы

V к=о /

учли не все цепи, поэтому это нижняя оценка числа цепей графа. Учитываем также, что

5 7

^ А С'к (в этом можно убедиться путем непосредственного вычисления). Следовательно,

к=0 к=0

общее число цепей будет превосходить следующую величину

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

п п

- . 7 ( 7 Л 7 п

I4) >[! С7к| =( 27 )7 = 2п.

к =0

То есть в общем случае построить полиномиальный алгоритм для решения данной задачи, в принципе, невозможно, и предлагаемое решение является эффективным.

Таким образом, мы рассмотрели алгоритм поиска всех цепей в графе и теперь можно перейти собственно к решению задачи идентификации графа.

Пусть имеется два класса раскрашенных графов G+ и С-. Предъявлен некоторый граф G0 ^ G+ и С-. Требуется определить, к какому из двух классов следует отнести граф G0.

Собственно, решающее правило будем формировать на основе полученных цепей. Для анализа статистики цепей предлагаем воспользоваться ИНС. Основные идеи ИНС для анализа химических систем в литературе представлены для различных вариантов [6; 8]. Предлагаемый подход позволяет не просто учитывать появление тех или иных цепей, но и то, какие фрагменты включают эти цепи и в каком порядке расположены фрагменты. Остановимся на формальной стороне вопроса.

Пусть С+ = (О^,..., }, О- = (О~,..., О"} и пусть для каждого графа О¡, 1 = 1, ..., 5+, О~1 ,

1=1, ..., 5 и О0, получено соответственно множество НИ1 иН0 всех его цепей и Н+ = ЦН/

1=1

Н- = ЦН и Н = Н+ и н-.

I=1

к=0

Будем строить ИНС из m слоев, где m - максимальная длина из всех полученных цепей. Принцип работы ИНС следующий. На входные синапсы будем подавать цепи графа G0, а на выходе будем считывать сигналы. Если сумма этих сигналов положительна, то будем полагать, что G0 е G+, если же отрицательная, то G0 е G-.

Поскольку на входы ИНС будем подавать цепи, то примем, что нейрон соответствует вершине, а синапс - ребру. При этом число нейронов в каждом слое будет одинаковым и равно числу всех цветов вершин (плюс один для цвета ноль), встречающихся среди графов из G = G+ u G-. Все нейроны в одном слое окрашены в различные цвета (в том числе и в цвет ноль).

Пусть каждый из m слоев ИНС состоит из kv + 1 нейронов uJp, где p = 0, ..., kv (нейрон с номером p = 0 является фиктивным и служит для решения некоторых проблем при прохождении сигнала через ИНС) - цвет нейрона, j = 1, ..., m. Условимся также считать, что любая пара нейронов, расположенная в двух соседних слоях, соединена ke синапсами (каждый синапс соответствует ребру определенного цвета) с весом ш Jpqr - вес синапса (для ребра цвета r) между нейронами up и uJq+1 (рис. 2).

Вес шJpqr формируется при обучении ИНС следующим образом. В начале обучения шJpqr = 0 для всех p, q, r и j. Рассмотрим некоторую цепь h+ = (ult...ult ) е H+, где a - длина цепи; t - номер

1 ' 'an

цепи. Сигнал для h+ подается на вход нейрона uc (имеющего тот же цвет, что и первая вершина

^ 2

в цепи h+ ). Далее сигнал идет в следующий слой на нейрон ucjl по синапсу цвета и так далее от слоя к слою, пока не закончатся вершины в цепи h+t. При прохождении сигнала от нейрона u]p к нейрону uJj+1 по синапсу цвета r будем увеличивать его вес шp на 1.

Рис. 2. Принципиальная схема ИНС:

X - входной сигнал; У - выходной сигнал; и - нейрон; т - количество слоев ИНС; к - количество цветов вершины исходного графа

Так мы поступаем для каждой цепи из Н+. Далее повторим эту процедуру для каждого 1=1, ..., 5+.

Аналогично поступим и с цепями из множеств Н], I = 1, ..., 5-, только с тем отличием, что при прохождении сигнала будем вес ю ]рг синапса не увеличивать, а уменьшать на 1.

В результате получили решающее правило в виде нейронной сети, которое идентифицирует предъявляемый граф G0 следующим образом.

Подаем на входы ИНС все цепи из Н0. На входе каждый сигнал имеет величину 0. Сигнал для каждой цепи проходит через ИНС так, как это было описано выше при обучении сети, но теперь при прохождении сигнала по синапсу происходит не модификация его веса ю , а считывание. Считанное значение добавляется к величине сигнала.

Если длина а0( цепи оказывается меньше т, то вслед за последней вершиной этой цепи сигнал идет на фиктивный нейрон и00"+1 и далее сигнал идет через фиктивные нейроны вплоть до и0т. А поскольку веса синапсов между фиктивными нейронами нулевые, то сигнал до самого выхода не изменяется.

Обозначим через у получившуюся величину сигнала на выходе из сигнала X на входе

<1

ИНС для цепи К = (и,...и, ) еН0. Тогда

<1 <а>

y, =Z

a,-1

j

tct ctt

j

raJ

ctct ct„ 1 'j+1 './'/+1

Суммарный же сигнал Y на выходе ИНС будет следующим:

Y y, = Ц<

raj

' p Z_i t Z_i Z_i ctct ctt '

p=0 t=1 t=1 j=1 '-/+1 '-/'-/+1

где Ур - величина выходного сигнала.

В результате, если У > 0, то идентифицируем граф О0, как С+. Если же У < 0, то идентифицируем граф О0, как С-.

Предложенная здесь теория может быть реализована в нейрокомпьютерной технологии для решения задач проектирования путем проведения статистического анализа простых раскрашенных графов. Естественно, приведенные выше выкладки требуют определенной адаптации для решения конкретных задач. Сказанное выше следует рассматривать, как математическое обеспечение, на основе которого можно обоснованно синтезировать конкретные решающие правила, в том числе путем введения в ИНС активационных функций, персептронов или, быть может, других компонентов, которые позволят эффективно обучать ИНС для решения конкретных задач анализа и синтеза графовых структур.

СПИСОК ЛИТЕРА ТУРЫ

1. Батыршин, И. З. К анализу предпочтений в системах принятия решений / И. З. Батыршин // Тр. Моск. энергет. ин-та. - 1981. - Вып. 533. - C. 57-62.

2. Гермашев, И. В. Вычислительное прогнозирование и проектирование веществ / И. В. Гермашев, В. Е. Дер-бишер. - Saarbrucken (Germany) : LAP LAMBERT Academic Publishing GmbH & Co. KG, 2012. - 268 с.

3. Гермашев, И. В. Решение задач в химической технологии средствами нечетких множеств / И. В. Гермашев, В. Е. Дербишер. - Волгоград : Перемена, 2008. - 143 с.

4. Дербишер, Е. В. Прогнозирование класса опасности веществ на основе выборочных данных об их физико-химических и медико-биологических свойствах : дис. ... канд. техн. наук / Дербишер Евгения Вячеславовна. - Волгоград, 2005. - 127 с.

5. Диагностика возможной активности производных адамантана в полимерных композициях методами молекулярного дизайна / В. В. Орлов, В. Е. Дербишер, Ю. Л. Зотов, П. М. Васильев, И. В. Гермашев, Е. В. Дербишер, А. Ю. Колоскова // Химическая промышленность. - 2003. - Т. 80, №№ 2. - С. 46-55.

6. Круглов, В. В. Искусственные нейронные сети. Теория и практика / В. В. Круглов, В. В. Борисов. -М. : Горячая линия-Телеком, 2002. - 382 с.

7. Лекции по теории графов / В. А. Емеличев, О. И. Мельников, В. И. Сарванов, Р. И. Тышкевич. - М. : Наука, 1990. - 384 с.

8. Хайкин, С. Нейронные сети. Полный курс / С. Хайкин. - М. : Вильямс, 2006. - 1104 с.

9. Computer-aided design of chemical compounds with controlled properties / I. V. Germashev, V E. Derbisher, M. N. Tsapleva, E. V Derbisher // Theor. Found. of Chem. Eng. - 2004. - Vol. 38, №> 1. - P. 86-91.

10. Derbisher, V E. Fuzzy-Set-based Quantitative Estimates of the Efficiency of Thermo- and Photostabilizing Additives in Polymeric Compositions / V. E. Derbisher, I. V Germashev, G. G. Bodrova // Polymer Science. Ser. A. -1997. - Vol. 39, №№ 6. - P. 630-633.

REFERENCES

1. Batyrshin I.Z. K analizu predpochteniy v sistemakh prinyatiya resheniy [The Preferences Analysis of Decision Support Systems]. TrudyMoskovskogo energeticheskogo instituta, 1981, iss. 533, pp. 57-62.

2. Germashev I.V., Derbisher V.E. Vychislitelnoe prognozirovanie i proektirovanie veshchestv [The Computational Prediction and Design of Substances]. Saarbrucken (Germany), LAP LAMBERT Academic Publishing GmbH & Co. KG, 2012. 268 p.

3. Germashev I.V, Derbisher VE. Reshenie zadach v khimicheskoy tekhnologii sredstvami nechetkikh mnozhestv [The Solution of Problems in Chemical Engineering by Fuzzy Sets Tools]. Volgograd, Peremena Publ., 2008. 143 p.

4. Derbisher E.V. Prognozirovanie klassa opasnosti veshchestv na osnove vyborochnykh dannykh ob ikh fiziko-khimicheskikh i mediko-biologicheskikh svoystvakh : dis. ... kand. tekhn. nauk [The Prediction of Substances Hazard Classes Based on the Selective Data of Its Physicochemical and Biomedical Properties. Cand. tech. sci. diss.]. Volgograd, 2005. 127 p.

5. Orlov V.V, Derbisher V.E., Zotov Yu.L., Vasilyev P.M., Germashev I.V., Derbisher E.V., Koloskova A.Yu. Diagnostika vozmozhnoy aktivnosti proizvodnykh adamantana v polimernykh kompozitsiyakh metodami molekulyarnogo dizayna [The Diagnosis of Possible Activity of a Derivative Adamantane in Polymeric Compositions by Molecular Design Methods]. Khimicheskayapromyshlennost, 2003, vol. 80, no. 2, pp. 46-55.

6. Kruglov V.V., Borisov V.V. Iskusstvennye neyronnye seti. Teoriya ipraktika [Artificial Neural Networks. Theory and Practice]. Moscow, Goryachaya liniya-Telekom Publ., 2002. 382 p.

7. Emelichev V.A., Melnikov O.I., Sarvanov VI., Tyshkevich R.I. Lektsiipo teoriigrafov [Lectures on Graph Theory]. Moscow, Nauka Publ., 1990. 384 p.

8. Khaykin S. Neyronnye seti. Polnyy kurs [Neural Networks. Full Course]. Moscow, Williams Publ., 2006. 1104 p.

9. Germashev I.V., Derbisher V.E., Tsapleva M.N., Derbisher E.V. Computer-Aided Design of Chemical Compounds With Controlled Properties. Theoretical Foundations of Chemical Engineering, 2008, vol. 38, no. 1, pp. 86-91.

10. Derbisher VE., Germashev I.V., Bodrova G.G. Fuzzy-Set-Based Quantitative Estimates of the Efficiency of Thermo- and Photostabilizing Additives in Polymeric Compositions. Polymer Science, Ser. A., 1997, vol. 39, no. 6, pp. 630-633.

THE NEURAL NETWORK ANALYSIS OF COLORED GRAPHS Ilya Vasilyevich Germashev

Doctor of Technical Sciences,

Professor, Department of Fundamental Informatics and Optimal Control, Volgograd State University [email protected], [email protected]

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

Evgeniya Vyacheslavovna Derbisher

Candidate of Technical Sciences,

Associate Professor, Department of Analytical, Physical Chemistry and Physico-Chemistry of Polymers,

Volgograd State Technical University

[email protected]

Prosp. Lenina, 28, 400005 Volgograd, Russian Federation

Vyacheslav Evgenyevich Derbisher

Doctor of Chemical Sciences,

Professor, Department of High-Molecular and Fibrous Materials Technology, Volgograd State Technical University derbisher-28091945@yandex. ru

Prosp. Lenina, 28, 400005 Volgograd, Russian Federation

Elena Aleksandrovna Markushevskaya

Candidate of Pedagogical Sciences,

Associate Professor, Department of Pedagogy and Psychology of Primary Education, Volgograd State Social-Pedagogical University emarkushevskaya@mail. ru

Prosp. Lenina, 27, 400005 Volgograd, Russian Federation

Abstract. The article deals with the problem of colored graph identification. This problem arises when solving tasks in the subject area which is formalized in terms of graph theory including cases connected with the investigation of "chemical structure - property" dependence. The authors propose the model of chemical structure in the form of a colored graph. The upper bound for the algorithm complexity is obtained, and its feasibility is shown. The learning samples are represented by graphs with a given property. The problem solved in the paper is the method development and analysis allowing to identify the property of graph that is not included in the learning samples. To solve the problem it is proposed to use the mechanism of artificial neural network of the original structure, the principles of which differ significantly from generally accepted, which is in the signals form and signals distribution ways across the network. The graph analysis is based on simple chains statistics for which the breadth-first search algorithm is described, and the algorithm analysis is given. The proposed algorithm allows also to handle disconnected graphs and thus to analyze multi-component systems. The article presents the formal result of its training as a formula allowing to calculate the output signal for input signals vector. The use of artificial neural network for graphs identification is demonstrated. The obtained results represent mathematical software which enables creating a reasonable decision rules for a systems identification formalized in graph theory terms.

Key words: identification, simple chain, statistics, breadth-first search, algorithm analysis, artificial neural network training.

i Надоели баннеры? Вы всегда можете отключить рекламу.