Научная статья на тему 'Хемоинформатика: приложения информатики в анализе химических структур (на примере сульфида кадмия)'

Хемоинформатика: приложения информатики в анализе химических структур (на примере сульфида кадмия) Текст научной статьи по специальности «Математика»

CC BY
188
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТОПОЛОГИЧЕСКИЙ ИНДЕКС / СУЛЬФИД КАДМИЯ / ХЕМОИНФОРМАТИКА / ТЕОРИЯ ГРАФОВ / МОЛЕКУЛЯРНЫЙ ДЕСКРИПТОР / ИНДЕКС РАНДИЧА / ЗАГРЕБСКИЙ ИНДЕКС / TOPOLOGICAL INDEX / CADMIUM SULFIDE / CHEMOINFORMATICS / GRAPH THEORY / MOLECULAR DESCRIPTOR / RANDIć INDEX / ZAGREB INDEX

Аннотация научной статьи по математике, автор научной работы — Максимов Анатолий Григорьевич, Завалишин Арсений Дмитриевич, Абрамов Максим Викторович, Тулупьев Александр Львович

Статья направлена на демонстрацию практического приложения теории графов как подраздела теоретических основ информатики в решении одной из междисциплинарных задач - описании структуры молекулы сульфида кадмия с применением методов и индексов хемиоинформатики. В статье представлены результаты вычислений atom-bond connectivity индекса (ABC), геометрического и арифметического индекса GA, обобщенного индекса Рандича, GA5 и ABC4, загребских индесов для химического графа сульфида кадмия (CdS). Топологические индексы для сульфида кадмия рассматриваются впервые, хотя сама по себе задача расчета данных индексов не нова. Актуальность результатов подчеркивается тем, что сульфид кадмия широко используют в различных областях, таких как оптоэлектроника, фотоприемники, фоторезисторы и т. д.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Максимов Анатолий Григорьевич, Завалишин Арсений Дмитриевич, Абрамов Максим Викторович, Тулупьев Александр Львович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CHEMOINFORMATICS: APPLICATIONS OF COMPUTER SCIENCE IN THE ANALYSIS OF CHEMICAL STRUCTURES (ON THE EXAMPLE OF CADMIUM SULFIDE)

The article is aimed at demonstrating the practical application of graph theory as a subsection of the theoretical foundations of computer science in solving one of the interdisciplinary problems -- describing the structure of the cadmium sulfide molecule using methods and indices of chemoinformatics. The article presents the results of calculations of the atom-bond connectivity index (ABC), of the geometric and arithmetic index GA, of the generalized Randic index, GA5 and ABC4, of the Zagreb indices for the chemical graph of cadmium sulfide (CdS). Topological indices for cadmium sulfide are considered for the first time, although the task of calculating these indices is not new in itself. The relevance of the results is emphasized by the fact that cadmium sulfide is widely used in various fields, such as optoelectronics, photodetectors, photoresistors, etc.

Текст научной работы на тему «Хемоинформатика: приложения информатики в анализе химических структур (на примере сульфида кадмия)»

Компьютерные инструменты в образовании, 2019 № 4: 44-54 УДК: 544.13 http://cte.eltech.ru

doi:10.32603/2071-2340-2019-4-44-54

ХЕМОИНФОРМАТИКА: ПРИЛОЖЕНИЯ ИНФОРМАТИКИ В АНАЛИЗЕ ХИМИЧЕСКИХ СТРУКТУР (на примере сульфида кадмия)*

Максимов А. Г.1,2, младший научный сотрудник, agm@dscs.pro Завалишин А. Д.1,2, младший научный сотрудник, adz@dscs.pro Абрамов М. В.1,2, кандидат технических наук, и mva@dscs.pro Тулупьев А. Л.2,1, доктор физико-математических наук, alt@dscs.pro

1 Санкт-Петербургский институт информатики и автоматизации Российской академии наук, 14 линия, 39,199178, Санкт-Петербург, Россия 2Санкт-Петербургский государственный университет, Университетская наб., 7-9,199034, Санкт-Петербург, Россия

Статья направлена на демонстрацию практического приложения теории графов как подраздела теоретических основ информатики в решении одной из междисциплинарных задач — описании структуры молекулы сульфида кадмия с применением методов и индексов хемиоинформатики. В статье представлены результаты вычислений atom-bond connectivity индекса (ABC), геометрического и арифметического индекса GA, обобщенного индекса Рандича, GA5 и ABC4, загребских индесов для химического графа сульфида кадмия (CdS). Топологические индексы для сульфида кадмия рассматриваются впервые, хотя сама по себе задача расчета данных индексов не нова. Актуальность результатов подчеркивается тем, что сульфид кадмия широко используют в различных областях, таких как оптоэлектроника, фотоприемники, фоторезисторы и т. д.

Ключевые слова: топологический индекс, сульфид кадмия, хемоинформатика, теория графов, молекулярный дескриптор, индекс рандича, загребский индекс.

Цитирование: Максимов А. Г., Завалишин А. Д., Абрамов М. В., Тулупьев А. Л. Хемоинформатика: приложения информатики в анализе химических структур (на примере сульфида кадмия) // Компьютерные инструменты в образовании. 2019. № 4. С. 44-54. doi:10.32603/2071-2340- 2019-4-44-54

Часто математика и информатика используются в приложении к исследованиям различных областей знаний [20-24]. Один из примеров таких приложений — хемиоинфор-матика — относительно недавно появившаяся область исследований. Среди прочих про-

* Работа выполнена в рамках проекта по государственному заданию СПИИРАН № 0073-2019-0003, при финансовой поддержке РФФИ — проект № 18-01-00626.

Аннотация

1. ВВЕДЕНИЕ

блема анализа структуры молекулы конкретного вещества может относиться к задачам хемиоинформатики. Представляется полезным рассмотреть на примере ещё нерешенных задач по анализу структуры молекулы конкретного вещества подходы, в этой области использующиеся, чтобы привлечь внимание студентов, аспирантов и исследователей в области информатики к целому пласту неисследованных проблем.

Итак, существует много соединений органической и неорганической химии, изучение свойств и структуры которых очень важно для промышленной, фармацевтической и лабораторной химии [1]. Изучение этих свойств и структуры видится перспективным для поиска и оценки вариантов использования вещества [2]. Важно, что между структурой молекулы некоторого вещества и его химическими свойствами существует прямая связь [3]. То есть изучение структуры молекулы вещества даёт информацию о его химических свойствах. Обозначенные молекулярные структуры можно представить в виде графов, у которых в вершинах будут находиться атомы, а ребра будут отображать связи между ними. Это позволит использовать для изучения структуры молекулы вещества методы теории графов.

Ключевая характеристика структуры молекулы вещества — её топологический индекс. Топологический индекс — это инвариант молекулярного графа, числовая величина, связанная с химическим строением, которая указывает на корреляцию химической структуры со многими физическими, химическими свойствами и биологической активностью [1]. Иными словами, зная топологический индекс вещества, мы имеем представление о его химических свойствах. Таким образом, актуальной видится задача расчёта топологических индексов различных химических веществ.

Научная цель данной статьи — описать структуру молекулы сульфида кадмия, применяя методы и индексы хемиоинформатики. Дидактическая цель материала заключается в том, чтобы на конкретном примере продемонстрировать практическое приложение теории графов как подраздела теоретических основ информатики в решении одной из междисциплинарных задач.

В статье рассмотрен пример расчета некоторых топологических индексов для молекулярного графа сульфида кадмия (CdS) с гексагональной решёткой [1, 6]. Топологические индексы для сульфида кадмия рассматриваются впервые, хотя сама по себе задача расчета данных индексов не нова, так, например, в работах [1, 4] были рассмотрены индексы оксидов меди. Сульфид кадмия широко используют в оптоэлектронике как в фотоприёмниках, так и в солнечных батареях [7, 8]. Это вещество применяют для изготовления фоторезисторов (приборов, электрическое сопротивление которых меняется в зависимости от освещенности) [8]. Красители на основе данного соединения обладают высокой термо- и светостойкостью [7, 8]. Также сульфид кадмия применяется для регистрации элементарных частиц и гамма-излучения и в качестве рабочего тела твердотельных лазеров [7, 8]. На основе сульфида кадмия создают наноструктурирован-ные материалы (квантовые точки, нанопроволоки, нанотрубки и т. д.), то есть обычные соединения, синтезированные в искусственно созданных границах «ограниченной геометрии» [6-8]. Такие материалы находят применение в медицине и биологии в качестве люминесцентных меток [8].

2. ПОСТАНОВКА ЗАДАЧИ

Одним из наиболее ранних и важных топологических индексов, базирующихся на степенях вершин, был индекс Рандича [11]:

V- 1

я-1(0) = £ _.

2 е \jdudy

В 1988 году был предложен двумя исследователями независимо обобщенный индекс Ран-дича [12,13]:

Я а (О) = )а.

е

Еще одним важным топологическим индексом является первый Загребский индекс [14]:

М1(0) = £(йи + йу).

е

Несколько позже был введен также и второй Загребский индекс [15]:

М2(0) = £ йийу .

е

Существенное значение также имеет индекс атомной связности [16]:

Е/ Ли Лу 2

Е V ЛиЛУ

Известна в том числе его версия, называемая АВС4 [17]:

АВС^(О) = 8и + - 2.

Е у

Наконец, геометрический арифметический индекс определяется следующим образом [18]:

ОА (О) = £ ^^,

Е Ли + Лу

где

= ^ Лу , = ^ Ли,

иуеЕ иуеЕ

а также его версия О А 5 [19]:

ОА5(0) = £ ^Т •

Е Ьи +

3. РАСЧЕТЫ ТОПОЛОГИЧЕСКИХ ИНДЕКСОВ

Молекулярный граф сульфида кадмия представляет собой пространственную шестиугольную решетку [9,10], как на рис. 1.

Рис. 1. Структура SdS (желтым цветом выделены атомы Б)

Для удобства дальнейших выкладок обозначим за т «высоту» решетки, то есть максимальное число шестиугольников в столбце, и обозначим за п число столбцов высоты т (столбцы высоты т и т - 1 чередуются, начиная и заканчивая высотой т). Сразу оговоримся, что общее число столбцов тогда 2п - 1. Посчитаем мощности вершин и ребер. | V| = (4т + 2) п = 4тп + 2п, |Е| = 4тп + (т + 1) п + т(п -1) = 6тп + п - т. Посчитаем также число вершин с конкретной степенью. Обозначим множество вершин степени п как Юп, под (1п будем понимать представителя этого множества. Тогда |Ю2| = 2п• 2 + 2т = 2т + 4п, Ю3| = |V| - |Ю21 = 4тп -2п -2т. В таблице 1 отражена информация о числе ребер с фиксированным числом соседей у каждого из концов.

Таблица 1. Распределение ребер графа CdS по степеням концевых вершин

du, dv Количество

2,2 4 + 2n

2,3 4n + 4m - 8

3,3 6mn-5n-5m + 4

Произведем проверку: £ = 6mn - 5n - 5m + 4 + 4n + 4m - 8 + 4 + 2n = 6mn + n - m = \E|. После выполненной предварительной подготовительной работы можно сформулировать ряд теорем.

Теорема 1. ABC индекс при G=CdS и m, n > 1 определяется следующим выражением: ABC(G) = 4mn + m(2 V2- 10) + n(3 V2- 130) + (| -2 V2).

Доказательство. Как было представлено выше, ABC индекс определяется следующей формулой [16]:

ABC (G) = £

du + dv 2

E V dudv

Из определения ABC индекса и данных из таблицы 1 имеем:

V2 V22 2

ABC(G) = (4 + 2n)— + (4n + 4m - 8) — + (6mn - 5n - 5m + 4)3. В результате упрощения и группировки имеем:

Г- 10 г- 10 8 г-

ABC(G) = 4mn + m(2 V2 - -3) + n(3 V2 - -3) + (3 - 2 V2). ■

Следующая теорема показывает значение геометрического арифметического индекса молекулярного графа CdS.

Теорема 2. Геометрический арифметический индекс для графа CdS равен GA(G) = 5mn + m(^ -5) + n(^ - 3) + (8 - 16^6).

Доказательство. Индекс GA по определению равен [18]

2\/ dudv

GA(G) = X

E

С помощью данных из таблицы 1 получаем

E du + dv

2\f6

GA(G) = (4 + 2n) + (4n + 4m - 8)-+ (6mn - 5n - 5m + 4).

5

В результате упрощения и группировки имеем:

8 76 8 76 16 76

ОА(О) = 5тп + т(--5) + п(--3) + (8--). ■

5 5 5

Следующая теорема показывает значение обобщенного индекса Рандича молекулярного графа CdS.

Теорема 3. Обобщенный индекс Рандича для графа CdS равен

Яа(О) =

54тп + 21т + 13п + 4 а = 1

3 тп + 9 т + 18 п + 9 а =-1

18тп + т(4 >/6 - 15) + п(4 >/6 - 11) + (20 - 8 76) а = 2

2тп + т(2у6 - |) + п(^ - |) + (130 - 4у6) а = -2

Доказательство. Индекс Яа по определению равен [12]

Яа(О) = £(йийу )а.

Е

При а = 1 с помощью данных из таблицы 1 получаем

Я1(О) = (4 + 2п)4 + (4п + 4т - 8)6 + (6тп - 5п - 5т + 4)9. В результате упрощения и группировки имеем:

Я1(О) = 54 тп + 21т + 13п + 4. При а = -1 с помощью данных из таблицы 1 получаем

Я-1(О) = (4 + 2п)- + (4п + 4т - 8)- + (6тп - 5п - 5т + 4)-.

4 6 9

В результате упрощения и группировки имеем:

„ 2 1 11 1

Я-1 (О) = — тп + — тл--п + -.

3 9 18 9

При а = 1 с помощью данных из таблицы 1 получаем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Я 1(О) = (4 + 2п)2 + (4п + 4т - 8) л/в + (6тп - 5п - 5т + 4)3.

2

В результате упрощения и группировки имеем:

Я1 (О) = 18тп + т(4 - 15) + п(4 - 11) + (20 - 8 76).

2

При а = -1 с помощью данных из таблицы 1 получаем

1 76 1

Я 1 (О) = (4 + 2п)- + (4п + 4т - 8)-+ (6тп - 5п - 5т + 4)-.

- 2 2 ^ 3

В результате упрощения и группировки имеем:

2 765 2 762 10 4 76

Я 1(О) = 2тп + т(—----) + п(—---) + (---—). ■

- 2 3 3 3 3 3 3

Следующая теорема показывает значения первого и второго Загребского индекса молекулярного графа CdS.

Теорема 4. Первый и второй Загребские индексы для графа CdS равны

М1(в) = 36тп - 10т - 2п,

М2(в) = 54тп + 21т + 13п + 4. Доказательство. Индекс М1 по определению равен[14]

М1&) = + ).

Е

С помощью данных из таблицы 1 получаем

М1(0 = (4 + 2п)4 + (4п + 4т - 8)5 + (6тп - 5п - 5т + 4)6. В результате упрощения и группировки имеем:

М1(в) = 36тп - 10т -2п. Индекс М1 по определению равен

М2(в) = X .

Е

Заметим, что он равен обобщенному индексу Рандича Яа с константой а = 1, вычисление которого уже было произведено ранее. Таким образом, второй Загребский индекс равен

М2(в) = Я1(в) = 54тп + 21т + 13п + 4. ■

Для дальнейшей работы понадобится следующее определение:

Определение: Би = £ йи.

ии еЕ

Таблицы 2, 3 содержат информацию о числе ребер, концы и, и которых имеют фиксированную величину Би, .

Таблица 2. Формулы для вычисления

, Оценка

4,4 0

4,5 4 ■ 2

5,5 2(п - 2)

5,7 4

5,8 4 + 2(п - 2)2

6,7 2 ■ 2(т - 2)

7,9 2(т -1)

8,8 (п -1)2

8,9 (п -1)4

9,9 (5(т - 1) + 1 - 6)(п -1) +

+ (п - 2)(т + 1 - 2)

Таблица 3. Распределение ребер графа CdS по Su, Sv концевых вершин

Su, Sv Количество

4,4 0

4,5 8

5,5 2n - 4

5,7 4

5,8 4n - 4

6,7 4m - 8

7,9 2m - 2

8,8 2n - 2

8,9 4n - 4

9,9 6mn - 11n - 7m + 12

На всякий случай сделаем проверку:

£ = 8+2n-4+4+4n -4+4m-8+2m-2+2n-2+4n-4+6mn-11n-7m+12 = 6mn+n-m = |E |.

Следующая теорема показывает значение четвертого индекса атомной связности молекулярного графа CdS.

Теорема 5. Четвертый индекс атомной связности для графа CdS равен

8 4 72 7П0 714 730 44 2 7462 2 72 29

ABC4(G) = - mn + (-+-+-+---)n + (-+---)m +

43 5 20 439 21 38

8 72 4 7Î4 7П0 3 7462 2 72 7i4 730 8

(--+-----------+ _ ).

5 7 5 21 3 4 3 9

Доказательство. Из определения ABC4 и из таблицы 3 получаем

ГТ Г8 /2 ДГ ДГ

ABC4(G) = а/ — • 8 + л/—• (2n-4) + л/ —4 + л/— • (4n-4) + л/—• (4m-8) + V 20 V 25 V 7 V 42

2 ГТ Г5 4

-• (2m - 2) + л/—• (2n - 2) + л/—• (4n - 4) + -• (6nm - 11n - 7m + 2). 9 32 24 9

В результате упрощения и группировки имеем:

8 4 72 7П0 714 730 44 2 7462 2 72 29

ABC4(G) = - mn + (-+-+-+---)n + (-+---)m +

43 5 20 439 21 38

8 72 4 714 7П0 3 7462 2 72 714 730 8 (--+-----------+ _ ). ■

5 7 5 21 3 4 3 9

Следующая теорема показывает значение пятого геометрического арифметического индекса молекулярного графа CdS.

Теорема 6. Пятый геометрический арифметический индекс для графа CdS равен

16 7Ю 48 73 8 742 3 77

GA5(G) = 6mn + (-+--7)n + (-+--7) m +

13 17 13 4

32 75 2 736 16 710 16 742 3 77 48 73 (-+---------).

9 3 13 13 8 17

Доказательство. Из определения GA5 и из таблицы 3 получаем

/80 /35 /160 /168

GA5(G) = а/ — • 8 + (2n -4) + л/ —• 4 + \--(4n -4) + \--(4т - 8) +

V 81 V 36 V 169 V 169

63 432

1 — • (2m - 2) + (2n - 2) + \--(4n - 4) + (6nm - 11n - 7m + 2).

64 289

В результате упрощения и группировки имеем:

Д6 V10 48 V3 Л 8 V42 3 V7 Л

GA5(G) = 6mn + (-+--7)n + (-+--7)m +

13 17 13 4

32 V5 2 V36 16 vT0 16 V42 3 48

(-+---------). ■

9 3 13 13 8 17

4. ЗАКЛЮЧЕНИЕ

Таким образом, в статье продемонстрировано практическое приложение теории графов как подраздела теоретических основ информатики в решении одной из междисциплинарных задач — описании структуры молекулы сульфида кадмия с применением методов и индексов хемиоинформатики. В статье представлены результаты вычислений atom-bond connectivity индекса (ABC), геометрического и арифметического индекса GA, обобщенного индекса Рандича, GA5 и ABC4, загребских индесов для химического графа сульфида кадмия (CdS). Сульфид кадмия широко используют в различных областях, связанных с оптоэлектроникой [7, 8], изготовлением фоторезисторов [8], производством красителей с высокой термо- и светостойкостью [7, 8], применением в наноструктуриро-ванных материалах (квантовые точки, нанопроволоки, нанотрубки и т. д.), медицине и биологии в качестве люминесцентных меток [8]. Иными словами, сульфид кадмия (CdS) активно используется в физических, биологических и химических исследованиях, в том числе и производственных исследованиях, поэтому его параметры видятся перспективными для включения в датасет для изучения свойств других соединений в самых разных областях. В дальнейшем описание структур молекул с использованием методов и индексов хемиоинформатики может помочь в нахождении новых химических, физических и биологических свойств соединений, которые считались уже изученными, а также в выборе направления развития исследований свойств других соединений.

Список литературы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Gao W., BaigA. Q., Khalid W., Farahani M. R. Molecular description of copper (II) oxide // Macedonian Journal of Chemistry and Chemical Engineering. 2017. P. 1-7.

2. Mohajeri A., Alipour M., Ahmadi M. B. A graph theory study on (ZnS)n(n = 3 - 10) nanoclusters // Chemical Physics Letters. 2011. P. 162-166.

3. Taherpour A. A. Quantitative structural relationship and theoretical study of electrochemical properties of C60@[SWCN(5,5) - Armchair - CnH20] complexes // Chemical Physics Letters. 2009. P. 1354. Gao W., Imran M., Siddiqui M. K., Naeem M., Jamil F. Molecular description of copper (I) oxide and

copper (II) oxide // Quimica Nova. 2018. P. 874-879.

5. DengF., Zhang X., Alaeiyan M, Mehboob A., Farahani M. R. Topological Indices of the Pent-Heptagonal Nanosheets VC5C7 and HC5C7 //Advances in Materials Science and Engineering. 2019. P. 1-12.

6. IARC Monograph: «Cadmium and Cadmium Compounds» Last access Nov. 2005

7. Чопра К., Дас С. Тонкопленочные солнечные элементы: Пер. с англ. с сокращениями // М.: Мир, 1986. 435 с.

8. Тонкие плёнки сульфида кадмия для фотольватики. Computational nanotechnology. 2014, 6873 c.

9. Paul K. Handbook of Infrared Optical Materials // CRC Press. 1991.

10. Mohammed B. K. Insight into the origin of magnetism in Iron-doped cadmium sulfide thin films from first principles calculations // Solid State Communications. 2017. Vol. 253. P. 10-13.

11. RandiC M. On characterization of molecular branching // J. Amer. Chem. Soc. 1975. Vol. 97 (23). P. 6609-6615.

12. Amic D., Beslo D., LuciC B., NikoliC S., TrinajstiC N. The vertex-connectivity index revisited // J. Chem. Inf. Comput. Sci. 1998. Vol. 38. P. 819-822.

13. Bollobas B., Erdos P. Graphs of extremal weights // Ars Combinatoria. 1998. № 50. P. 225-233.

14. Gutman I., Das K. C. The first Zagreb index 30 years after. MATCH Commun. Math. Comput. Chem, 2004. № 50. P. 83-92.

15. Gutman I., TrinajstiC N. Graph theory and molecular orbital's., Total ^-electron energy of alternant hydrocar-bons. Chemical Physics Letters. 1972. № 17. P. 535-538.

16. Estrada E., Torres L., Rodriguez L., Gutman I. An at-om-bond connectivity index: Modeling the enthalpy of formation of alkanes // Indian J. Chem. 1998. № 37A. P. 849-855.

17. Ghorbani A., Hosseinzadeh M. A. Computing ABC4 index of nanostar Dendrimers // Optoelectronics and Ad-vanced Materials-Rapid Communications, 2010. № 4. P. 1419-1422.

18. VukiCeviC D., Furtula B. Topological index based on the ratios of geometrical and arithmetical means of end-vertex degrees of edges //J. Math. Chem. 2009. № 46. P. 1369-1376.

19. GraovaC A., Ghorbani M., Hosseinzadeh M. A. Compu-ting fifth geometric-arithmetic index for nanostar Dendrimers // J. Math. Nanosci. 2011. № 1. P. 33-42.

20. Абрамов М. В., Тулупьева Т. В., Тулупьев А. Л. Социоинженерные атаки: социальные сети и оценки защищенности пользователей. СПб.: ГУАП, 2018. 266 с.

21. Азаров А. А., Тулупьева Т. В., Суворова А. В., Тулупьев А. Л., Абрамов М. В., Юсупов Р. М. Социоинженерные атаки. Проблемы анализа. СПб.: Наука, 2016. 352 с.

22. Хлобыстова А. О., Абрамов М. В., Тулупьев А. Л., Золотин А. А. Поиск кратчайшей траектории социоинженерной атаки между парой пользователей в графе с вероятностями переходов // Информационно-управляющие системы. 2018. № 6. C. 74-81. doi:10.31799/1684-8853-2018-6-74-81

23. СувороваА. В., Смирнова К. Р., БудинЕ. А., Тулупьева Т. В., Тулупьев А. Л., Абрамов М. В. Исследовательский проект как инструмент обучения методам анализа текста: предсказание класса поста в социальной сети // Компьютерные инструменты в образовании. 2018. № 3. С. 49-64.

24. Kharitonov N. A., Maximov A. G., Tulupyev A. L. Algebraic Bayesian Networks: Naive Frequentist Approach to Local Machine Learning Based on Imperfect Information from Social Media and Expert Estimates // Russian Conference on Artificial Intelligence. Springer, Cham, 2019. P. 234-244.

Поступила в редакцию 05.11.2019, окончательный вариант — 20.12.2019.

Максимов Анатолий Григорьевич, младший научный сотрудник лаборатории теоретических и междисциплинарных проблем информатики СПИИРАН; студент кафедры информатики СПбГУ, agm@dscs.pro

Завалишин Арсений Дмитриевич, младший научный сотрудник лаборатории теоретических и междисциплинарных проблем информатики СПИИРАН; студент кафедры информатики СПбГУ, adz@dscs.pro

Абрамов Максим Викторович, кандидат технических наук, заведующий лабораторией теоретических и междисциплинарных проблем информатики СПИИРАН; доцент кафедры информатики СПбГУ, Blmva@dscs.pro

Тулупьев Александр Львович, доктор физико-математических наук, профессор кафедры информатики, СПбГУ; главный научный сотрудник лаборатории теоретических и междисциплинарных проблем информатики СПИИРАН, alt@dscs.pro

Computer tools in education, 2019

№ 4: 44-54

http://cte.eltech.ru

doi:10.32603/2071-2340-2019-4-44-54

Chemoinformatics: Applications of Computer Science in the Analysis of Chemical Structures (on the Example of Cadmium Sulfide)

MaksimovA. G.1,2, junior researcher, agm@dscs.pro Zavalishin A. D.1,2, junior researcher, adz@dscs.pro Abramov M. V.1,2, PhD, senior researcher, El mva@dscs.pro TulupyevA. L.2,1, PhD, Dc. Sci., professor, alt@dscs.pro

1 Saint Petersburg Institute for Informatics and Automation of the Russian Academy of Sciences,

39,14 Line, 199178, Saint Petersburg, Russia 2Saint Petersburg State University, Universitetskaya nab., 7-9,199034, Saint Petersburg, Russia

Abstract

The article is aimed at demonstrating the practical application of graph theory as a subsection of the theoretical foundations of computer science in solving one of the interdisciplinary problems — describing the structure of the cadmium sulfide molecule using methods and indices of chemoinformatics. The article presents the results of calculations of the atom-bond connectivity index (ABC), of the geometric and arithmetic index GA, of the generalized Randic index, GA5 and ABC4, of the Zagreb indices for the chemical graph of cadmium sulfide (CdS). Topological indices for cadmium sulfide are considered for the first time, although the task of calculating these indices is not new in itself. The relevance of the results is emphasized by the fact that cadmium sulfide is widely used in various fields, such as optoelectronics, photodetectors, photoresistors, etc.

Keywords: topological index, cadmium sulfide, chemoinformatics, graph theory, molecular descriptor, randic index, zagreb index.

Citation: A. G. Maksimov, A. D. Zavalishin, M. V. Abramov, and A. L. Tulupyev, "Chemoinformatics: Applications of Computer Science in the Analysis of Chemical Structures (on the Example of Cadmium Sulfide)," Computer tools in education, no. 4, pp. 44-55, 2019 (in Russian); doi:10.32603/2071-2340-2019-4-44-54

References

1. W. Gao, A. Q. Baig , W. Khalid, and M. R. Farahani, "Molecular description of copper (II) oxide," Macedonian Journal of Chemistry and Chemical Engineering, vol. 36, no. 1, pp. 93-99, 2017; doi: 10.20450/mjcce.2017.1138

2. A. Mohajeri, M. Alipour, and M. B. Ahmadi, "A graph theory study on (ZnS)n (n = 3-10) nanoclusters," Chemical Physics Letters, vol. 503, no. 1-3, pp. 162-166, 2011; doi: 10.1016/j.cplett.2010.12.067

3. A. A. Taherpour, "Quantitative structural relationship and theoretical study of electrochemical properties of C60@[SWCN(5,5) - Armchair - CnH20] complexes," Chemical Physics Letters, vol. 469, no. 1-3, pp. 135-139, 2009; doi: 10.1016/j.cplett.2008.12.039

4. W. Gao, M. Imran, M. K. Siddiqui, M. Naeem, and F. Jamil, "Molecular description of copper (I) oxide and copper (II) oxide," QuimicaNova, vol. 41, no. 8, pp. 874-879, 2018; doi: 10.21577/0100-4042.20170257

5. F. Deng, X. Zhang, M. Alaeiyan, A. Mehboob, and M. R. Farahani, "Topological Indices of the Pent-Heptagonal Nanosheets VC5C7 and HC5C7," Advances inMaterials Science and Engineering, 2019; doi: 10.1155/2019/9594549

6. International Agency for Research on Cancer, "Cadmium and cadmium compounds,"Monographs on evaluation of carcinogenic risks to humans, vol. 58, pp. 119-237,1993.

7. K. L. Chopra and S. R. Das, Thin film solar cells, M. M. Koltun ed., Moscow.: Mir, 1986 (in Russian).

8. I. A. Petukhov, D. A. Zuev, A. V. Shorokhova, L. S. Parshina, O. A. Novodvorskii, O. D. Khramova, A. A. Lotin, F. N. Putilin, V. F. Kozlovskii, V. K. Ivanov, M. N. Rumyantseva, and A. M. Gaskov, "Cadmium sulphide thin films for photovoltaic applications," Comp. nanotechnol., no. 1, pp. 68-73, 2014 (in Russian).

9. K. Paul, Handbook of Infrared Optical Materials, Boca Raton, FL, USA: CRC Press, 1991.

10. B. K. Mohammed, "Insight into the origin of magnetism in Iron-doped cadmium sulfide thin films from first principles calculations," Solid State Communications, vol. 253, no. 10-13, 2017; doi: 10.1016/j.ssc.2017.01.021

11. M. Randic, "On characterization of molecular branching," J. Amer. Chem. Soc., vol. 97, no. 23, pp. 6609-6615, 1975; doi: 10.1021/ja00856a001

12. D. Amic, D. Beslo, B. Lucic, S. Nikolic, and N. Trinajstic "The vertex-connectivity index revisited," J. Chem. Inf. Comput. Sci., vol. 38, no. 5, pp. 819--822,1998; doi: 10.1021/ci980039b

13. B. Bollobas and P. Erdos, "Graphs of extremal weights," Ars Combinatoria, vol. 50, pp. 225--233,1998.

14. I. Gutman and K. C. Das, "The first Zagreb index 30 years after," MATCH Commun. Math. Comput. Chem, vol. 50, pp. 83--92, 2004.

15. I. Gutman and N. Trinajstic, "Graph theory and molecular orbitals. Total ^-electron energy of alternant hydrocarbons," Chemical Physics Letters, vol. 17, no. 4, pp. 535--538,1972; 10.1016/0009-2614(72)85099-1

16. E. Estrada, L. Torres, L. Rodriguez, and I. Gutman, "An at-om-bond connectivity index: Modeling the enthalpy of formation of alkanes," Indian J. Chem., vol. 37A, no. 10, pp. 849--855,1998.

17. A. Ghorbani and M. A. Hosseinzadeh, "Computing ABC4 index of nanostar Dendrimers," Optoelectronics and Ad-vancedMaterials-Rapid Communications, vol. 4, pp. 1419--1422, 2010.

18. D. Vukicevic and B. Furtula, "Topological index based on the ratios of geometrical and arithmetical means of end-vertex degrees of edges," J. Math. Chem., vol. 46, pp. 1369--1376, 2009; doi: 10.1007/s10910-009-9520-x

19. A. Graovac, M. Ghorbani, and M. A. Hosseinzadeh, "Computing fifth geometric-arithmetic index for nanostar Dendrimers," Journal of Mathematical Nanoscience, vol. 1, no. 1-2, pp. 33--42, 2011.

20. M. V. Abramov, T. V. Tulupyeva, and A. L. Tulupyev, "Sotsioinzhenernye ataki: sotsial'nye seti i otsenki zashchishchennosti pol'zovatelei"[Socioengineering attacks: social networks and user security ratings], Saint Petersburg, Russia: GUAP, 2018.

21. A. A. Azarov, T. V. Tulupyeva, A. V. Suvorova, A. L. Tulupyev, M. V. Abramov, and R. M. Yusupov, "Sotsi-oinzhenernye ataki. Problemy analiza"[Socioengineering attacks. Analysis of the problem], Saint Petersburg, Russia: Nauka, 2016.

22. A. O. Khlobystova, M. V. Abramov, A. L. Tulupyev, and A. A. Zolotin, "Search for the shortest trajectory of a social engineering attack between a pair of users in a graph with transition probabilities," Information and Control Systems, no. 6, pp. 74—81, 2018 (in Russian).

23. A. V. Suvorova, K. R. Smirnova, E. A. Budin, T. V. Tulupyeva, A. L. Tulupyev, and M. V. Abramov, "Research Project as a Tool for Teaching Text Analysis Methods: Predicting the Post Class in the Social Network," Computer tools in education, no. 3, pp. 49-64, 2018 (in Russian).

24. N. A. Kharitonov, A. G. Maximov, and A. L. Tulupyev, "Algebraic Bayesian Networks: Naïve Frequentist Approach to Local Machine Learning Based on Imperfect Information from Social Media and Expert Estimates," S. Kuznetsov, A. Panov, eds, in Proc. RCAI2019: Artificial Intelligence. Communications in Computer and Information Science, vol. 1093, 2019, pp. 234-244; doi: 10.1007/978-3-030-30763-9_20

Received 05.11.2019, The final version — 20.12.2019.

Anatolii G. Maksimov , junior researcher, Laboratory of Theoretical and Interdisciplinary Problems of Informatics, SPIIRAS; student, Computer Science Department, SPbU, agm@dscs.pro

Arsenii D. Zavalishin, junior researcher, Laboratory of Theoretical and Interdisciplinary Problems of Informatics, SPIIRAS; student, Computer Science Department, SPbU, adz@dscs.pro

Maxim V. Abramov, PhD, senior researcher, Laboratory of Theoretical and Interdisciplinary Problems of Informatics, SPIIRAS; Associate Professor, Computer Science Department, SPbU, Blmva@dscs.pro

Alexander L. Tulupyev, PhD, Dc. Sci., professor, Computer Science Department, SPbU; Principal Researcher, Laboratory of Theoretical and Interdisciplinary Problems of Informatics, SPIIRAS, alt@dscs.pro

i Надоели баннеры? Вы всегда можете отключить рекламу.