Однако в большинстве случаев для решения подобных задач в конкретной предметной области создается отдельная программная система, что является неэффективным и затратным.
Компонентный подход позволяет значительно повысить эффективность процесса разработки программных систем путем создания расширяемого и настраиваемого компонентного программного обеспечения. Система автоматизации исследований, разрабатываемая в соответствии с этим и содержащая описанный прецедентный компонент, позволит эффективно решать задачи планирования, диагностики, проектирования.
Компонент, реализующий прецедентный подход, использован при решении задачи идентификации технического состояния уникальных машин и конструкций в интеллектуальной системе поддержки принятия решений при определении причин отказов и аварий в нефтехимической промышленности [6].
Список литературы
1. Берман А.Ф. Деградация механических систем. - Новосибирск: Наука, 1998.
2. Берман А.Ф., Николайчук О.А., Павлов А.И., Юрин А.Ю. Моделирование свойств адаптивности программной системы. // Матер. Всерос. конф.: Инфокоммуникационные и вычислительные технологии и системы. - Улан-Удэ, 2003.
3. Павлов А.И. Подход к автоматизации исследования надежности механических систем. // Матер. V Междунар. науч.-технич. конф.: Информационно-вычислительные технологии и их приложения. - Пенза, 2007.
4. Aamodt A., Plaza E. Case-Based reasoning: Foundational issues, methodological variations, and system approaches. AI Communications, vol. 7, no. 1, 1994.
5. Bergmann R. Experience Management. Lecture notes on artificial intelligence, vol. 2432, 2002.
6. Берман А.Ф., Николайчук О.А., Павлов А.И., Юрин А.Ю. Интеллектуальная система поддержки принятия решений при определении причин отказов и аварий в нефтехимической промышленности. // Автоматизация в промышленности. - 2006. - № 6.
ПРОГРАММА С ЭЛЕМЕНТАМИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ОЦЕНКИ РЕАКЦИОННОЙ СПОСОБНОСТИ РАДИКАЛЬНЫХ РЕАКЦИЙ
(Работа выполнена при поддержке гранта РФФИ 07-07-00343а) В.Е. Туманов, к.х.н. (Институт проблем химической физики РАН, г. Черноголовка)
В результате научных исследований накоплены огромные массивы научных данных о характеристиках химических реакций (константах скорости, энергиях активации, энтальпиях реакции) и о свойствах реагентов (энтальпиях образования молекул и радикалов, потенциалах ионизации и т.д.). Эти данные размещаются в электронных коллекциях данных и часто публикуются в Интернете. Несмотря на доступность данных о реакционной способности реагентов в химических реакциях, при конструировании технологических процессов и моделировании явлений в экологии и медицине химики принимают решения о скорости протекания реакций по аналогии.
Интеллектуальный анализ накопленных электронных данных о характеристиках химических реакций позволяет во многих случаях находить эмпирические зависимости и строить на их основе классификацию реакций, которую можно использовать для предсказания скорости протекания химических реакций. Это даст возможность в ряде случаев получить надежные оценки констант скорости и энергий активации химических реакций.
Константа скорости радикальной элементарной реакции характеризует скорость взаимодействия реагентов (радикала и молекулы) в жидкой или газовой среде. Как правило, константа скорости реакции связана с экспериментальной энергией активации Е и предэкспоненциальным множителем Ло в расчете на одну эквиреакционную связь в молекуле соотношением Аррениуса [1]:
к=пхЛоехр(-Е/КТ), (1)
где п - число эквиреакционных связей в молекуле-реагенте; Т - температура в К; К - универсальная газовая постоянная.
Экспериментальное определение констант скорости является сложной экспериментальной задачей, и во многих практических случаях ее теоретическая оценка является актуальной.
Эмпирическая классификация радикальных реакций. В начале 90-х годов прошлого века профессор Е.Т. Денисов [2] эмпирически установил наличие параболического тренда между корнем квадратным из классического потенциального
барьера радикальной реакции (^Ее) и ее энтальпией (ДНе):
АНе = а(7Е7)2 + Ц/Е7+с, (2)
где а, Ь, с - некоторые эмпирические коэффициенты.
Интерпретация тренда (2) была дана Е.Т. Денисовым в предложенной им модели элементарной бимолекулярной реакции - модели пересекающихся парабол (МПП) [2]. В рамках этой эмпирической модели реакция радикального отрыва рассматривается как результат пересечения двух потенциальных кривых, одна из которых описывает потенциальную энергию колебания атома Н вдоль разрываемой связи в исходной молекуле, а другая - потенциальную энергию колебания того же атома вдоль образующейся связи в продукте
реакции. Валентные колебания атома Н в реагентах рассматриваются как гармонические и описываются параболическим уравнением.
В МПП радикальная реакция характеризуется следующими параметрами: 1) энтальпией ДНе, включающей разницу энергий нулевых колебаний рвущейся и образующейся связей; 2) классическим потенциальным барьером активации Ee, который включает в себя энергию нулевого колебания рвущейся связи; 3) параметром ге, который равен суммарному растяжению в переходном состоянии рвущейся и образующейся связей; 4) параметром Ь (2Ь2 - силовая постоянная рвущейся связи); 5) параметром а (а2 равен отношению силовых постоянных рвущейся и образующейся связей).
Перечисленные параметры связаны друг с другом соотношением:
Ьге= аТЕ-ДН^^л/Ё^ . (3)
Модель МПП позволяет построить эмпирическую классификацию радикальных реакций. Условием классификации радикальных реакций в рамках МПП (мерой сходства) является постоянство параметра Ьге для набора однотипных реакций. Набор числовых признаков (параметров), характеризующих реакцию, определяет для МПП метрическое пространство параметров. В этом пространстве реакция представляется точкой, класс реакций - кластером близко лежащих точек, а метрикой выступает параметр Ьге.
Классификация радикальных реакций отрыва была разработана путем статистической обработки данных из банка данных по константам скоростей радикальных жидкофазных реакций [3], базы данных №БТ [4] по термохимическим данным и по фрагменту базы данных по энергиям диссоциации связей органических молекул [5].
В основу классификации был положен принцип объединения в одну группу радикальных реакций со схожими реакционными центрами. Далее выделенная группа реакций исследовалась на основе МПП. Класс является набором однотипных реакций, значение кинетического параметра Ьге остается постоянным в пределах погрешности вычислений (± 0,5).
Представление знаний. МПП позволяет по экспериментальным данным разделить все многообразие радикальных реакций на классы, каждый из которых характеризуется одинаковым набором параметров: а, Ьге, 0.5Ь^я-Н и А0, а индивидуальная реакция внутри одного класса - энтальпией ДНе и энергией активации Ё.
Совокупность классов реакций и значений параметров каждого класса образует базу знаний (БЗ), которая может быть использована для прогноза (оценки) энергии активации и константы скорости радикальной реакции (1) по термохимическим данным.
Для представления знаний о радикальных реакциях в БЗ выбрана продукционная модель:
(1): д; Р; А^Б; N (4)
где 1 - имя продукции; д - сфера применения продукции; Р - условие применимости ядра продукции; А^Б - ядро продукции; N - постусловия продукции. В БЗ продукция представляется в виде таблицы правил и таблицы фактов. Таблица правил содержит ядра продукций в виде пары объектов <условие>-<вывод>. Например, ЕСЛИ ради-кал=алкильный И молекул парафин ТО класс=Кх+КхН. Таблицы фактов содержат описание параметров класса, параметров радикала и параметров молекулы (например, табл. 1).
Таблица 1
Фрагмент таблицы фактов базы знаний для радикальных реакций отрыва в рамках модели пересекающихся парабол
Реакция Ьге а Ао Нт1п Нтах 0.5ИЬ(У1 - Уг )
Н+^Н 14,50 0,901 1011 -114,5 71,3 -8,9
Н+К.2Н 15,80 0,901 1010 -149,8 98,8 -8,9
Н+ЯэН 15,00 0,901 1010 -127,6 81,5 -8,9
К^+^Н 17,30 1,000 109 -155,0 155,0 0,0
Я!0+К2Н 18,60 1,000 108 -190,8 190,8 0,0
К^+ЯэН 17,80 1,000 108 -168,3 168,3 0,0
К.20+К1Н 18,60 1,000 109 -190,8 190,8 0,0
К.2°+К.2Н 19,25 1,000 108 -210,0 210,0 0,0
К^+ЯэН 18,45 1,000 108 -186,5 186,5 0,0
Примечание: Н - атом водорода; Кх - алкильный радикал; К2 - алильный радикал; К3 - алкилароматический радикал.
Программа оценки реакционной способности с использованием базы знаний. По известной величине параметра Ьге можно корректно рассчитывать энергию активации любой индивидуальной реакции в пределах данного класса реакций.
Объединение разработанных в рамках МПП методов расчета и построенной БЗ позволило разработать программу с базой знаний для оценки энергии активации (константы скорости) радикальной реакции.
Программа в результате диалога с пользователем реализует вопрос-ответное отношение, заданное в виде предиката, истинность которого определяет возможность выполнения расчета. В процессе обработки предиката программа обращается к БЗ для отнесения реакции к соответствующему классу и извлечению параметров класса, а также к БД термохимических данных для определения энтальпии реакции. Обязательными входными числовыми параметрами являются температура и число одновременно атакуемых связей.
Если термохимических параметров в базе данных недостаточно для определения энтальпии реакции, то следует запрос пользователю, но оценка энергии активации при этом не считается достоверной с точки зрения программы.
Пример оценки энергии активации приведен в таблице 2.
Таблица 2
Энергия активации реакций нитрорадикалов с 0—^связью органических соединений R•+RiH^RH+Ri• при Т=333 К
RiH E (кДж/моль)
CH2NO2 MeCHNO2 Me2C4NO2 Me3CNO2
EtMeCH-H 60,2 66,7 70,6 59,3
Me3C-H 54,3 60,6 64,4 53,5
H rfH 63,4 70,1 74,1 62,5
CX 58,4 64,9 68,7 57,6
ó 58,6 65,1 68,9 57,8
ex 52,2 58,4 62,1 51,4
со 48,6 54,6 58,2 47,8
CH2=CHCH2-H 51,6 57,4 60,8 50,9
CH2=CHCH-HMe 43,9 49,4 52,6 43,2
CH2=CHC-HMe2 39,8 45,1 48,2 39,2
Z-MeCH=CHCH-HMe 41,6 46,9 50,1 40,9
Me2=CHCH-HMe 44,9 50,4 53,7 44,2
Me2C=CMeC-HMe2 33,4 38,4 41,3 32,8
CH,=CHCMe-HCH=CH, 27,8 32,4 35,2 27,2
Me2NH2C-H 44,9 50,8 54,3 44,2
(CH2=CHCH2)3N 30,9 36,0 39,1 30,2
В результате публикации в Интернете программы оценки реакционной способности радикальных реакций химики-исследователи, химики-технологи, студенты, аспиранты и преподаватели вузов получат возможность оценивать такие реакции в жидкой и газовой фазах в режиме он-лайн.
Список литературы
1. Кондратьев В.Н. Константы скорости газофазных реакций. - М.: Наука, 1970.
2. Денисов Е.Т. Новые эмпирические модели реакций радикального отрыва. // Успехи химии. - 1997. - Т. 66. - № 10. -С. 953.
3. Денисов Е.Т., Туманов В.Е., Денисова Т.Г., Дроздова Т.И., Покидова Т.С. Реализация банка кинетических констант радикальных жидкофазных реакций на IBM PC. - Черноголовка, 1992. (Препринт ИХФЧ РАН). - 38 с.
4. NIST Standard Reference Database 19A. Positive Ion Energetics. Ver. 2.02. 1994.
5. Туманов В.Е., Денисов Е.Т. База данных по энергиям диссоциации связей углеводородов и их производных. // Нефтехимия. - 2003. - Т. 43. - № 1. - С. 65-67.
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ В ГУМАНИТАРНЫХ ОБЛАСТЯХ
В.А. Дюк, д.т.н. (Санкт-Петербургский институт информатики и автоматизации РАН); В.В. Фомин, д.т.н. (Российский государственный педагогический университет им. А.И. Герцена, г. Санкт-Петербург)
Многие приложения современных методов анализа данных относятся к гуманитарным областям, имеющим сложную системную организацию. Попытаемся обобщить представления о специфике данных в таких областях.
«Будущее анализа данных может привести к большому прогрессу, к преодолению реальных трудностей, к оказанию большой помощи всем областям науки и техники. Будет ли это так? Это зависит от нас, от нашего желания встать на каменистый путь реальных проблем вместо гладкой дороги нереальных предпосылок, произвольных критериев и абстрактных результатов, не имеющих реалистической направленности...» - эти слова Дж. Тьюки [1], сказанные еще в 1962 году, остаются актуальными и в наши дни.
Согласно классификации статистических методов анализа данных, принятой в [2], выделяют четыре области: статистика (числовых) случайных величин, многомерный статистический анализ, статистика временных рядов и случайных процессов, статистика объектов нечисловой природы.
Современные специалисты в области анализа данных концентрируют свое внимание на исследовании объектов нечисловой природы, которые можно отнести к одному из важных классов так называемых НЕ-факторов.
Вместе с тем, акцент в прикладном статистическом анализе только на объектах нечисловой природы является далеко не полным. Когда мы имеем дело с предметными областями со сложной системной организацией (например в медицине), перед исследователем в первую очередь встает вопрос о том, какие признаки (атрибуты, показатели, переменные) следует включить в план статистического эксперимента. Доступных для измерения (фиксации) признаков может быть довольно много. Нередко в современных исследованиях их количество измеряется десятками, сотнями и даже тысячами, и заранее невозможно предугадать их потенциальную полезность. Таким образом, здесь мы имеем дело с еще одним мощным НЕ-фак-тором - высокой размерностью и неопределенностью исходного описания объектов.
Более того, часто при подготовке экспериментальных данных исследователь испытывает серьезные затруднения в формулировке целевых критериев статистического анализа (здесь мы не касаемся достаточно тривиальных постановок задач дескриптивной статистики). Например, известно много фактов значительного расхождения диагностических оценок различных специалистов в медицине и психологии, принадлежащих даже только одной научной школе. Этот НЕ-фактор,