УДК 519.688, 541.121
ПРОГРАММНЫЙ КОМПЛЕКС ДЛЯ ПРОГНОЗИРОВАНИЯ РАСТВОРИМОСТИ В СВЕРХКРИТИЧЕСКИХ ФЛЮИД АХ
Н.В. Меньшутина, д.т.н., профессор; С.Э. Батин, аспирант; П.А. Гуриков, к.т.н., доцент (Российский химико-технологический университет им. Д.И. Менделеева, Миусская пл., 9, г. Москва, 125047, Россия, chem.com@muctr.ru)
В статье представлен программный комплекс для прогнозирования растворимости в сверхкритических флюидах, позволяющий хранить, обрабатывать и проводить анализ данных в области химии и технологии сверхкритических флюидов. Для прогнозирования растворимости использованы методология QSPR, а также молекулярная динамика. Впервые в QSPR-модель включены температура и давление сверхкритических флюидов. В базе данных комплекса хранится информация о растворимости пятисот химических соединений в сверхкритическом диоксиде углерода (более двадцати тысяч экспериментальных точек). Возможны поиск соединения по CAS номеру, определение пространственной структуры. Программный комплекс может стать рабочим инструментом для ученых, работающих в области сверхкритических флюидов.
Ключевые слова: программный комплекс, QSPR, математическое моделирование, растворимость в сверхкритических флюидах.
PROGRAM COMPLEX TO PREDICT OF THE SOLUBILITY IN SUPERCRITICAL FLUIDS Menshutina N.V., Ph.D., Professor; Batin S.E., Postgraduate; Gurikov P.A, Ph.D., Associate Professor (D. Mendeleev University of Chemical Technology of Russia, 9, Miusskaya sq., Moscow, 125047, Russia, chemcom@muctr.ru)
Abstract. The article describes the program complex to predict of the solubility in supercritical fluids. Data analysis in chemistry and technology of supercritical fluids is allowed by program complex. To predict the solubility the methodology QSPR and molecular dynamics were used. For the first time ever in QSPR-model were included temperature and pressure of supercritical fluids. The program complex database stores information about solubility of five hundred chemical compounds in supercritical carbon dioxide (over twenty thousand data points). It is available to search compounds by CAS number and determine the spatial structure. The program complex can be a working tool for scientists working in the field of supercritical fluids.
Keywords: program complex, QSPR, mathematical modeling, solubility in supercritical fluids.
В настоящее время сверхкритические флюиды (СКФ) находят широкое применение в различных областях химии и химической технологии как растворители в процессах экстракции, сепарации и адсорбции. Прежде всего это связано с тем, что величина растворимости вещества в СКФ существенно зависит от температуры и давления: вещество, практически не растворимое в одних условиях, может хорошо растворяться в других. Поиск таких условий процесса, при которых будет достигнута максимальная степень извлечения целевого вещества, является важной задачей для технологов.
Для ее решения в первую очередь необходимы экспериментальные данные по растворимости веществ в сверхкритическом растворителе, однако для исследования их поведения при изменении условий процесса этих данных не всегда бывает достаточно. В таких случаях обычно прибегают к математическим моделям, способным прогнозировать растворимость определенного вещества или веществ в заданных условиях.
На сегодняшний день существует большое количество научных публикаций, содержащих как экспериментальные данные по растворимости различных веществ в СКФ (чаще всего это диок-
сид углерода), так и математические модели, позволяющие прогнозировать растворимость на имеющейся выборке соединений, однако единой информационной системы, позволяющей хранить, обрабатывать и проводить анализ данных в области химии и технологии СКФ, нет.
В данной статье представлен программный комплекс для прогнозирования растворимости в СКФ. Структура программного комплекса представлена на рисунке 1.
Графический пользовательский интерфейс
Модуль импорта/ экспорта
Информационно-поисковый модуль
Модуль прогнозирования растворимости
Ядро системы
Модуль молекулярной динамики
Интерфейс взаимодействия с БД
БД
Рис. 1. Общая структура системы
Основные компоненты системы - ядро, информационно-поисковый модуль, модуль прогнозирования растворимости и БД.
Ядро системы является связующим элементом для всех остальных компонентов и предоставляет внешним модулям базовый функционал по работе с химическими соединениями. На уровне ядра для внутреннего представления структур химических соединений используются молекулярные графы, где вершинам соответствуют атомы молекулы, а ребрам - химические связи между ними. Вершины и ребра молекулярного графа при необходимости могут быть дополнены информацией о трехмерных координатах атомов, длинах и полярности связей и т.п. Обработка и хранение молекулярных графов инкапсулированы внутри ядра, поэтому внешние модули работают с химическими соединениями как с цельными сущностями.
Модуль молекулярной динамики необходим для определения пространственной структуры химического соединения по его структурной формуле при помощи методов молекулярной динамики. Для молекулярно-динамических расчетов в программе используется специальная библиотека с открытым исходным кодом OpenBabel [1]. Информация о трехмерной структуре молекулы часто бывает необходима для расчета числовых значений некоторых молекулярных дескрипторов, используемых при прогнозировании растворимости.
Модуль импорта/экспорта позволяет обмениваться информацией о структуре и свойствах химических соединений со сторонними программными продуктами (например молекулярными редакторами). Для этого в модуле реализована поддержка наиболее распространенных и популярных форматов представления химических структур, таких как CML (Chemical Markup Language, язык химической разметки), SMILES (Simplified Molecular Input Line Entry Specification, спецификация упрощенного представления молекул в строке ввода), MDL, SDF и др. [2].
Модуль прогнозирования растворимости предназначен для получения численного значения растворимости целевого вещества в сверхкритическом растворителе при некоторых фиксированных внешних условиях (температура, давление, тип растворителя). Для расчета растворимости индивидуальных веществ в сверхкритических условиях используются полуэмпирические модели: модель Крастила (Chrastil), модель де Валле и Агилера (del Valle and Aguilera), модель Адачи и Лу (Adachi and Lu), модель Бартла (Bartle) и др. Параметры таких моделей подбираются на основе имеющихся данных по растворимости.
Для предсказания растворимости тех веществ, экспериментальных данных по которым нет или недостаточно для построения модели с высокой прогнозируемой точностью, используются мето-
дология QSPR (Quantitative Structure-Property Relationship), а также теория молекулярного подобия, позволяющие оценить некоторое свойство заданного вещества (в данном случае растворимость) по его структуре и свойствам похожих веществ. В таких моделях для выявления степени похожести молекулярных структур и прогнозирования свойств химических соединений используются количественные характеристики - молекулярные дескрипторы. Такими дескрипторами могут быть разнообразные физико-химические величины, значения которых можно получить экспериментально или рассчитать, а также математические конструкции - фрагментарные дескрипторы, топологические индексы [3]. На рисунке 2 показан пример QSPR-модели, использующей семь молекулярных дескрипторов: моменты инерции (MOMI-X, MOMI-Y), коэффициент распределения в системе октанол-вода (XlogP), индекс Винера (WPOL), индекс Кира и Холла третьего порядка (SP-3), индекс связности молекулярного графа третьего порядка (X3Av) и сумму атомных поляризуемостей (apol). Такая модель дает неплохие результаты расчета растворимости ароматических углеводородов в сверхкритическом диоксиде углерода.
Рис. 2. Прогнозирование растворимости ароматических углеводородов на основе методологии QSPR
Модуль прогнозирования растворимости позволяет использовать произвольные выборки соединений для построения подобных моделей, а также исследовать влияние на растворимость различных молекулярных дескрипторов.
Информационно-поисковый модуль дает возможность для каждого индивидуального вещества вывести в удобном графическом виде экспериментальные и расчетные данные по растворимости, а также информацию о математических моделях, наиболее точно описывающих растворимость этого вещества. Для большего удобства использования предусмотрен поиск по классу химического соединения, химическому названию, регистрационному номеру CAS (уникальный численный идентификатор веществ, внесенных в ре-
естр Chemical Abstract Service) или по SMILES-идентификатору (рис. 3).
Кроме этого, информационно-поисковый модуль содержит алгоритмы вычисления структурной схожести двух химических соединений путем анализа числа вхождений различных молекулярных подструктур в исходные структуры [2]. Подобные алгоритмы позволяют вывести все соединения, структурно идентичные исходному веществу, и сравнить растворимость найденных соединений при фиксированных внешних условиях.
БД программы содержит экспериментальные данные по растворимости различных веществ в сверхкритических растворителях, плотности сверхкритических растворителей в зависимости от температуры и давления, а также информацию о химической структуре веществ. На данный момент БД (реляционную модель см. на рис. 4) содержит информацию по растворимости более чем пятисот различных химических соединений (более двадцати тысяч экспериментальных точек) в сверхкритическом диоксиде углерода и других, наиболее часто применяемых растворителях.
Таблица Substances содержит основную информацию о веществах (название, молекулярная масса, регистрационный номер CAS, краткое описание, а также идентификатор SMILES). Каждое вещество может соответствовать одному или более классам соединений (например спирты, амины и т.п.); все возможные (для рассматриваемой в данной работе выборки соединений) классы веществ описаны в таблице Categories. Она содержит названия и описания по каждому классу соединений. Таблица CatDictionary содержит информацию о том, какие вещества относятся к тому или иному классу.
Таблица Descriptors содержит информацию обо всех дескрипторах, необходимых для работы рассмотренных выше моделей QSPR. Для каждого дескриптора в таблице имеются символьное сокращение (marker), название и краткое описание. Таблица DescriptorsDictionary содержит численные значения (value) каждого дескриптора для каждого химического соединения из таблицы Substances.
Информация об экспериментальных данных размещена в таблицах Experiments, ExperimetTy-pes, Publications, Points. Таблица Experiments агрегирует всю информацию о каждом проведенном эксперименте (какое вещество растворялось, растворитель, тип эксперимента, публикация и краткое описание эксперимента). Таблицы Experimet-Types и Publications содержат, соответственно, информацию о доступных типах экспериментов и публикациях-источниках. Таблица Points содержит информацию об экспериментальных точках. Для каждой точки известны давление (МПа), температура (К), растворимость и единицы измерения растворимости (чаще всего это мольные доли и молярность).
Таблица Density содержит экспериментальные данные по плотности различных растворителей в
зависимости от давления и температуры. Значение плотности сверхкритического растворителя необходимо для расчета растворимости. При отсутствии экспериментальной информации плотность растворителя при заданных внешних условиях вычисляется по уравнению состояния.
Информация о моделях, используемых для прогнозирования растворимости индивидуально для
Points
id PK
Experiments FK1
Value
Temperature
Pressure
Unit
Publications
id PK
Name Description
Experiments
id PK
SolventId FK1
SubstanceId FK2
Publications FK4
TypeId FK3
Description
ExperimentTypes
id PK
Name Description
Substances
id PK
Name
Mass
CAS
SMILES
Description
CatDictionary Categories
-& id PK
SubstanceId CategoryId Id FK2 FK1 Name Description
DescriptorsDictionary
SubstanceId DescriptorId Value Id FK2 FK1
Descriptors
id PK
Marker Name Description
Density k Models
id PK
SubstanceId FK1 SubstanceId FK1
Temperature Pressure Value Id Model Determination ARD Points Params
ModelsParams
ModelId Number Value Id FK1
Рис. 4. Реляционная модель данных
Рис. 3. Экспериментальные и расчетные данные по растворимости аспирина в сверхкритическом диоксиде углерода
каждого растворенного вещества, помещена в таблице Models, включающей тип модели, коэффициент детерминации, среднее относительное отклонение (ARD), количество точек и количество параметров по каждой модели. Информация о числовых значениях параметров (value) каждой модели содержится в таблице ModelsParams.
Разработанный программный комплекс имеет клиент-серверную архитектуру - СУБД (система управления БД), как и сама БД комплекса, находится на удаленном сервере, а небольшая программа-клиент имеет соответствующий интерфейс для взаимодействия с БД. Такой подход позволяет уменьшить объем программы до приемлемых размеров, упростить установку и использование программы, а также гарантировать безопасность данных и актуальность информации, хранящейся в
БД, за счет своевременного обновления и исправления.
Литература
1. Open Babel: The Open Source Chemistry Toolbox. URL: http://openbabel.org/wiki/Main_Page (дата обращения: 14.12.2011).
2. Daylight Theory Manual URL: http://www.daylight.com/ dayhtml/doc/theory/index.html (дата обращения: 14.12.2011).
3. Todeschini R., Consonni V., Handbook of Molecular Descriptors, Weinheim: Germany, WILEY-VCH Publ., 2000.
References
1. Open Babel: the Open Source Chemistry Toolbox, Available at: http://openbabel.org/wiki/Main_Page (accessed 14 Dec. 2011).
2. Daylight Theory Manual, Available at: http://www.day light.com/dayhtml/doc/theory/index.html (accessed 14 Dec. 2011).
3. Todeschini R., Consonni V., Handbook of Molecular Descriptors, Weinheim: Germany, WILEY-VCH Publ., 2000.
УДК 004.925.83
3Б-МОДЕЛИРОВАНИЕ В ГЕОИНФОРМАЦИОННОЙ СИСТЕМЕ
Л.А. Степанова, к.т.н.., доцент; И.И. Смирнова, магистрант (Тверской государственный технический университет, lusi_st@mail.ru, cry-angel88@mail.ru)
В статье рассмотрена технология построения в ГИС «Карта2011» 3D-модели небольшой территории с транспортной развязкой. SD-моделью является объемный вид цифровой модели местности, для построения которой в ГИС «Карта2011» существуют инструменты, основанные на различном представлении высотных характеристик. Матрица высот - трехмерная растровая модель местности - строится по семантическому описанию объектов (абсолютная или относительная высоты). TIN-модель строится по 3D-координатному описанию объектов.
Объемная модель приемлемого качества была построена на основе множества (тринадцати) растровых матриц высот объектов территории. Построение TIN-модели потребовало преобразования векторного описания объектов карты. Показана целесообразность сочетания инструментов: цифровая модель рельефа местности в виде матрицы высот, цифровая модель инженерных сооружений в виде TIN-модели.
Ключевые слова: векторная модель местности, растровая модель, TIN-модель, матрица высот, библиотека трехмерных изображений.
BUILDING OF THREE-DIMENSIONAL MODEL IN GEOINFORMATION SYSTEM Stepanova L.A., Ph.D., Associate Professor; Smirnova I.I., Undergraduate (Tver State Technical University, lusi_st@mail.ru, cry-angel88@mail.ru)
Abstract. The article describes a method of building of a three-dimensional (3D) model of a medium size area with a transport hub in GIS «MAP2011». 3D model is a volumetric model, which can be built in GIS «Map2011» by using instruments that are based on different presentation of the values of elevation in cells. The matrix of elevations - three-dimensional raster map of an area - contains the information about district relief in the raster form with values of elevation in cells (absolute or relative elevation). TIN-model is constructed on the basis of the three dimensional description of objects.
The volumetric model of acceptable quality has been constructed on the basis of multiple (13) raster elevation matrixes of the objects. Construction of a TIN-model required the use of vector maps. The article describes ways to combine use of various instruments, such as digital elevation model (DEM) in the form of an elevation matrix and digital model of engineering objects in the form of a TIN-model.
Keywords: vector data model, raster data model, TIN-model, the matrix of heights, library of three-dimensional kind of objects.
На традиционных картах все объекты реального мира описываются в плоской (2D) системе координат. Третья пространственная координата площадных объектов - высота Н - отображается цветом или изолиниями.
На векторных картах современных геоинформационных систем (ГИС) различного назначения (градостроительных, инженерных, кадастровых) возникает необходимость отображать плоские объекты объемными моделями, например участки