ИНФОРМАТИКА
УДК 681.322
ПРИМЕНЕНИЕ МЕТОДА ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ОПРЕДЕЛЕНИЯ НЕКОТОРЫХ АМИНОКИСЛОТ В БИНАРНЫХ СМЕСЯХ
О.И. Аравин1, А.Ю. Новиков2, Е.И. Селифонова2, Р.К. Чернова3, С.П. Шевырев1
Саратовский государственный университет,
1 кафедра прикладной информатики,
2лаборатория наноаналитики,
3кафедра аналитической химии и химической экологии
E-mail: [email protected], [email protected], [email protected],
[email protected], [email protected]
Разработана методика применения метода искусственных нейронных сетей для обработки спектрофотометрических данных с целью определения фенилаланина и тирозина в неразделенных бинарных смесях указанных аминокислот на уровне микрограммовых концентраций. Рассчитаны погрешности определения: минимальная до 1%, максимальная не превышает 10%. Максимальная погрешность наблюдается для смесей, содержание компонентов в которых отличаются на порядок и более.
Ключевые слова: нейронные сети, спектрофотометрия, бинарные смеси, фенилаланин, тирозин.
The Application of Artificial Neural Networks to Identification of Some Amino Acids in Binary Mixtures
O.I. Aravin1, A.Yu. Novikov2, E.I. Selifonova2, R.K. Chernova3, S.P. Shevyrev1
Saratov State University,
1 Chair of Applied Informatics,
2 Laboratory of Nano Analytics,
3Chair of Analytical Chemistry and Chemical Ecology
E-mail: [email protected], [email protected], [email protected],
[email protected], [email protected]
The paper develops the technique of applying the method of artificial neural networks for processing of the spectrophotometric data in order to determine the phenylalanine and tyrosine in undivided binary mixtures of these amino acids at microgramm concentrations. Calculated error in the determination is: minimum of 1 %, the maximum does not exceed 10%. The maximum error is observed for mixtures in which the content components differ by an order or more.
Key words: neural network, spectrophotometry, binary mixtures, phenylalanine, tyrosine.
ВВЕДЕНИЕ
Определение химического состава сложных природных и промышленных объектов обычно сопряжено с предварительным разделением компонентов. Традиционно для этого привлекаются трудоемкие методы экстракции, сорбции, осаждения и др. Наиболее распространенные в настоящее время эффективные методы молекулярного анализа многокомпонентных смесей органических веществ, такие как хроматография, капиллярный электрофорез, также основаны на предварительном разделении компонентов и последующем их детектировании.
В последнее время возросло количество исследований, посвященных изучению возможности применения хемометрических алгорит-
мов для определения отдельных ингредиентов в многокомпонентных смесях без их разделения. Изучаются методы множественной линейной регрессии [1], многомерной градуировки [2], искусственных нейронных сетей [3]. Применение хемометрических алгоритмов способно расширить возможности многих методов анализа, например, спектрофотометрического, потенциометрического, пьезокварцево-го микровзвешивания и др., поскольку становится возможным анализ более сложных смесей (до 10 компонентов и более) без их разделения. Тем не менее заранее нельзя оценить точность создаваемых методик, особенно, когда получаемый аналитический сигнал не аддитивен, или когда содержания компонентов различаются на порядок и более. В связи с этим необходимо моделирование различных многокомпонентных систем и сравнительное изучение их с помощью хемометрических алгоритмов.
Применение последних перспективно при анализе смесей 20-ти основных альфа-аминокислот, из которых построены молекулы белков и которые образуют другие разнохарактерные аминокислоты уже в составе белковой молекулы (примером последнего служит образование дисульфидных «мостиков» при окислении двух остатков цистеина в составе уже сформированных пептидных цепей). Смеси самих аминокислот, а также их сочетание со многими биологически активными веществами, широко применяются в медицине для парэнтерального питания больных, в животноводстве — для обогащения кормов, в пищевой промышленности, при синтезе красителей и лекарственных веществ.
Цель настоящего исследования состояла в изучении возможности применения метода искусственных нейронных сетей для спектрофотометрического определения незаменимых аминокислот, фенил-аланина (РЬе) и тирозина (Туг), в их бинарных смесях как модельных системах. Выбор указанных аминокислот был обусловлен как их практической значимостью, так и спецификой электронных спектров поглощения.
Фенилаланин и тирозин — ароматические аминокислоты — важнейшие биологически активные вещества, извлечение которых из ферментационных растворов, культуральных жидкостей и белковых гидролизатов с последующим раздельным определением на уровне микроколичеств относится к актуальным биотехнологическим и аналитическим задачам. Указанные аминокислоты не синтезируются в организме человека и должны поступать с пищей. Они активно участвуют в разнообразных обменных процессах. Например, фенилаланин служит основным источником синтеза тирозина (рис. 1) — предшественника ряда биологически важных веществ (гормонов тироксина и адреналина, некоторых пигментов). Как следует из схемы метаболизма фенилаланина и тирозина, уровень концентрации каждого из этих веществ в крови, плазме крови, моче и спинномозговой жидкости характеризует обменные процессы в организме и служит важным диагностическим фактором [4]. Поэтому разработка экспрессных и надежных методов определения этих аминокислот в смеси с разными другими сопутствующими биологически активными веществами весьма актуальна.
Спецификой выбранных соединений являются характерные электронные спектры поглощения (рис. 2). Максимумы поглощения фенилаланина — 205 и 257 нм, тирозина — 222 и 275 нм, что позволяет выделить области индивидуального поглощения веществ. Соблюдается также фактор аддитивности, поскольку между фенилаланином и тирозином отсутствует химическое взаимодействие в водных растворах.
Все исследования проводились нами в водных растворах при физиологических значениях рН (6,57,1). В этих условиях фенилаланин и тирозин находятся в форме цвиттерионов (табл. 1).
Было приготовлено 10 растворов смесей фенилаланина и тирозина, причем интервал концентраций фенилаланина составлял 3,72 мг/мл - 9,08 ■ 10-3 мг/мл, интервал концентраций тирозина — от 0,16 мг/мл до 5, 5 ■ 10-2 мг/мл. Оптическая плотность растворов смесей варьировалась в интервале
ОН
ОН
Л8С
сн2
СН(КН2)
СООН Фенилаланин
, Тирозин
СН2 трансаминаза СН2
СН(КН2) СО
СООН СООН
Тирозин 4-гидроксифенил-
пировиноградная кислота
'/У"1
СН2 I
СООН
Гомогентизиновая кислота
Рис. 1. Схема метаболизма фенилаланина и тирозина
0,5-2,0, интервал длин волн составлял 190-280 нм. Частными задачами настоящего исследования являлись:
- оценка возможности применения метода искусственных нейронных сетей для определения фе-нилаланина и тирозина по спектрам поглощения в двухкомпонентной модельной смеси;
- оценка точности и оптимизация разработанной методики (выбор спектральных диапазонов, ограничение объема обучающего набора и др.);
- адаптация разработанной методики для определения фенилаланина и тирозина в многокомпонентных смесях с другими неароматическими аминокислотами.
б
Рис. 2. УФ-спектры светопоглощения водных растворов: фенила-ланина (а), тирозина (б)
Таблица 1
Ионные формы исследуемых аминокислот
Аминокислота Формы, существующие в растворе
Кислая среда Нейтральная среда Щелочная среда
0
Фенилаланин сн2 1 - CH2 1 2 Ш2
сн - кн+ 1 CH - NH+ 1 CH(NH2)
соон COO" COO"
он OH OH O"
л л iS л
Тирозин сн2 1 2 Y1 CH2 1 2 T CH2 V1 CH2
сн - кн+ 1 CH - NH+ 1 CH(NH) CH(NH2)
соон COO" COO" COO"
1. ИСПОЛЬЗОВАНИЕ НЕЙРОННОЙ СЕТИ
Для решения поставленной задачи была выбрана модель двухслойной нейронной сети прямого распространения. Нейронные сети, имеющие два и более слоя, имеют несколько отличительных факторов [3]:
- каждый нейрон сети имеет нелинейную функцию активации;
- сеть содержит один или несколько скрытых слоев нейронов, которые не являются частью входа или выхода сети;
- сеть обладает высокой степенью связности.
В качестве активационной функции для нейронов сети была выбрана наиболее распространенная в многослойных персептронах нелинейная логистическая функция активации (рис. 3). Наличие нелинейности играет очень важную роль, так как в противном случае отображание «вход - выход»
сети можно свести к обычному однослойному персептрону, который не способен решать нелинейные задачи [5].
Входной слой, выполняющий задачу передачи входных значений на скрытый слой, состоял из 51 нейрона, что соответствовало количеству значений рассматриваемого диапазона спектра двухкомпонентной смеси. Количество нейронов скрытого слоя обычно подбирается экспериментально [5]. На основании опыта [6] количество нейронов в скрытом слое подбиралось по формуле: £1 /2 « £2, где £1 — количество нейронов входного слоя, £2 — количество нейронов скрытого слоя.
В результате экспериментов был выбран скрытый слой, состоящий из 22 нейронов, при этом выходной слой состоял из 2 нейронов, которые соответствуют искомым концентрациям веществ в смеси. На рис. 4 представлена общая архитектура созданной нейронной сети.
OUT 5
1 !-
0 NET
Рис. 3. Логистическая функция активации
Л
51
22
Рис. 4. Архитектура нейронной сети
Исходные концентрации веществ в смесях
Обучение нейронной сети заключается в нахождении оптимальной комбинации весовых коэффициентов, соединяющих нейроны соседних слоев, при которой погрешность определения класса образа стремится к минимуму [7]. Считается, что если погрешность работы нейронной сети
Таблица 2 с данными, не участвующими в процессе обучения, находится в пределах установленной нормы, то сеть обладает хорошей обучающей способностью. Одним из факторов, определяющих способность нейронной сети к обобщению, является размер и представительность обучающей выборки. Обучающая выборка обычно формируется из примеров, каждый из которых представляет собой результат эксперимента предметной области с определенным ответом.
В качестве основы для формирования обучающей выборки были взяты 10 двухкомпонентных смесей тирозина и фенил-аланина с различной концентрацией каждого вещества в смеси (табл. 2). В результате эксперимента была получена серия спектров данных смесей, которая представлена на рис. 5. В данном случае спектр смеси выступал в качестве входного значения для нейронной сети, а концентрации веществ в смеси данного спектра выступали в качестве ожидаемого ответа. Прежде чем разделить множество спектров на обучающую и тестирующую выборки, было решено расширить имеющееся множество спектров, поскольку размер данного множества представлялся слишком небольшим для корректного обучения нейронной сети [3].
№ п/п Смеси
Phe, мг/мл Tyr, мг/мл
1 1,49 0
2 1,32 0,04
3 1,16 0,07
4 0.99 0,11
5 0,83 0,15
6 0,66 0,18
7 0,50 0,22
8 0,33 0,25
9 0,17 0,29
10 0 0,33
2
Спектры, которыми было дополнено множество, были получены в результате разбиения значений граничных спектров на равные участки. В результате итоговое множество состояло из 180 спектров. В качестве наиболее информативных значений спектра был выбран диапазон между 240 и 290 нанометрами.
■0.1235 245 255 265 275 285 295
Рис. 5. Спектры светопоглощения смесей из фенилаланина и тирозина различных концентраций
Итоговое множество спектров было разделено на обучающую и тестирующую выборки в пропорции 150:30 (рис. 6). В тестирующую выборку были добавлены спектры, выбранные генератором случайных чисел, имеющих нормальное распределение. Остальные спектры были добавлены в обучающую выборку.
б
Рис. 6. Спектры, используемые для тестирования (а) и обучения (б) нейронной сети
Обучение нейронной сети производилось одним из наиболее популярных алгоритмов для обучения многослойных нейронных сетей — алгоритмом обратного распространения ошибки. Этот алгоритм основывается на коррекции ошибок, в процессе чего синаптические веса настраиваются с целью максимального приближения выходного сигнала сети к желаемому в статистическом смысле [3]. Обучение продолжалось в течение 500 эпох, после чего уровень ошибки достиг минимального значения и обучение было остановлено (рис. 7).
Тестирование обученной нейронной сети проводилось на тестирующей выборке, состоящей из 30 элементов. Погрешность работы нейронной сети на тестирующих данных высчитывалась по формуле:
& =
\Угехр -
у-ехр
100%,
где — погрешность ¿-го результата, п — количество тестирующих данных, г — числа 1,п, У — результат работы нейронной сети, угехр — ожидаемый результат.
В результате тестирования были получены погрешности, представленные в табл. 3. Полученные данные показывают, что погрешность работы обученной нейронной сети над тестовыми данными, состоящими из дополненных и полученных в результате эксперимента спектров, находится в пределах 1%, и это означает, что нейронная сеть научилась обобщать информацию и способна эффективно определять концентрации веществ в двухкомпонентной смеси фенилаланина и тирозина.
Таблица 3 Погрешности работы нейронной сети на тестирующей выборке
Рис. 7. Кривая обучения нейронной сети
№ Погрешность, %
РЬе Туг
1 0,0277 0,0287
2 0,0253 0,0273
3 0,0062 0,0076
4 0,2174 0,2234
5 0,0740 0,0475
6 0,1303 0,1267
7 0,0108 0,0278
8 0,1470 0,1023
9 0,0587 0,0568
30 0,0091 0,0099
2. ПРАКТИЧЕСКОЕ ИССЛЕДОВАНИЕ И ВЫВОДЫ
Эксперимент по проверке работоспособности обученной искусственной нейронной сети проводился с использованием смесей, которые не присутствовали ни в обучающей, ни в тестирующей выборке. Были взяты 4 смеси с различными концентрациями фенилаланина и тирозина (табл. 4).
Таблица 4
Погрешности определения аминокислот в контрольных смесях
Номер смеси РЬе, мг/мл Туг, мг/мл
Взято Найдено Погрешность, % Взято Найдено Погрешность, %
1 2,23 2,20 1,3 0,16 0,15 6,2
2 7,43 ■ 10-3 8, 04 ■ 10-3 7,6 4, 1 ■ 10-2 3, 7 ■ 10-2 9,7
3 3,72 3,76 1,0 5, 4 ■ 10-2 5, 5 ■ 10-2 1,8
4 9, 08 ■ 10-3 9, 94 ■ 10-3 8,6 3, 2 ■ 10-2 2, 9 ■ 10-2 9,3
Из данных табл. 4 следует, что минимальная погрешность составляет 1%, максимальная не превышает 10 %. При этом следует заметить, что максимальная погрешность наблюдается для фенилаланина (смесь 4, табл. 4) в том случае, когда его концентрация в 3,5 раза меньше, чем тирозина, и
для тирозина, когда его концентрация в 3,5 раза превышает концентрацию фенилаланина. Полученные результаты доказывают работоспособность предложенной методики определения концентраций веществ в смеси с помощью метода нейронных сетей.
Дальнейшее развитие работы видится в формировании более емкой обучающей выборки, снижении концентрации определяемых аминокислот, расширении числа компонентов в исследуемой смеси и нахождении путей снижения погрешностей их определения с применением метода искусственных нейронных сетей.
Библиографический список
1. Дворкин, В.И. Метрология и обеспечение качества количественного химического анализа / В.И. Дворкин. М.: Химия, 2001. С. 261.
2. Эсбенсен, К. Анализ многомерных данных / К. Эс-бенсен. Черноголовка: ИПХФ РАН, 2005. С. 158.
3. Хайкин, С. Нейронные сети / С. Хайкин. М.; СПб; Киев: Вильямс, 2006. С. 219-221, 279.
4. Тиц, Н. Энциклопедия химических лабораторных тестов / Н. Тиц. М.: Лабинформ, 1997. С. 960.
5. Ясницкий, Л.Н. Введение в искусственный интеллект / Л.Н. Ясницкий. М.: Академия, 2005. С. 37-39.
УДК 519.6
О РЕШЕНИИ ШАХМАТНЫХ ПОЗИЦИЙ С ПОМОЩЬЮ ФОРМУЛ ЛОГИКИ ВЕТВЯЩЕГОСЯ ВРЕМЕНИ
Р.В. Хелемендик
Институт прикладной математики им. М.В. Келдыша РАН, Москва, отдел теоретической математики E-mail: [email protected]
В работе по произвольной шахматной позиции описано построение 4 формул логики ветвящегося времени. Как минимум, одна из этих формул выполнима, и по ее модели строится решение позиции: оценка позиции (ничья или победа одной из сторон), а также необходимая для ее достижения стратегия. Построение по позиции формул и получение модели и решения иллюстрировано примерами.
Ключевые слова: логика ветвящегося времени, выполнимость, модель.
6. Аравин, О.И. Применение нейронных сетей для распознания и классификации патологий в сосудах / О.И. Аравин, А.В. Малыгин // Методы компьютерной диагностики в биологии и медицине: материалы ежегодной науч. школы-семинара 2008 г.; под ред. проф. Д.А. Усанова. Саратов: Изд-во Сарат. ун-та, 2008. С. 51.
7. Астахова, И.Ф. Системы искусственного интеллекта / И.Ф. Астахова, А.С. Потапов, В.А. Чулюков. М.: Бином. Лаборатория знаний, 2008. С. 104.
On the Solution of Chess Positions Using Computational Tree Logic
R.V. Khelemendik
Keldysh Institute of Applied Mathematics RAS, Moscow, Department of Theoretical Mathematics E-mail: [email protected]
The paper describes a construction of four formulas of Computational tree logic corresponding to an arbitrary chess position. At least one of these formulas is satisfiable and leads to the solution of chess position: value of position (a draw or a victory of one of the sides) and necessary strategy for getting this value is constructed using the formula model.
Keywords: computational tree logic, satisfiability, model.
ВВЕДЕНИЕ
В настоящей работе представлено построение решения произвольной шахматной позиции. По заданной шахматной позиции строятся 4 формулы логики ветвящегося времени (л.в.в.), соответствующие следующим утверждениям: ©1 — белые могут выиграть, ©2 — белые могут сделать ничью, но не могут выиграть, ©з — черные могут выиграть, ©4 — черные могут сделать ничью, но не могут выиграть. При этом верны следующие утверждения: либо выполнима формула ©1, а остальные формулы невыполнимы; либо выполнимы формулы ©2 и ©4, а остальные формулы невыполнимы; либо выполнима формула ©3, а остальные формулы невыполнимы. В случае выполнимости формулы , где 1 < г < 4, по модели для нее получается стратегия белых либо черных, необходимая для достижения соответствующего результата.
Описываемый в настоящей статье логический подход позволяет теоретически решить любую по-