Приглашенная лекция
ИНФОРМАЦИОННАЯ СТРУКТУРА СОВРЕМЕННОГО НЕОРГАНИЧЕСКОГО МАТЕРИАЛОВЕДЕНИЯ
Киселева Надежда Николаевна
Институт металлургии и материаловедения им. А.А. Байкова Российской
академии наук, Москва
DOI: 10.24411/9999-004A-2019-10001
Ускорение поиска, исследования и внедрения новых материалов с заданными функциональными свойствами является критически важной задачей развития промышленности и всей экономики стран в целом. Одним из путей решения этой задачи является создание развитой инфраструктуры информационного обеспечения специалистов, в первую очередь, распределенной виртуально интегрированной сети баз данных, содержащих информацию о свойствах веществ и материалов и технологиях их получения и обработки, а также систем компьютерного конструирования и моделирования материалов, доступных из Интернет специалистам самого разного профиля: научным работникам, инженерам, технологам, бизнесменам, госслужащим, студентам и т.д. В последние годы в развитых странах были выдвинуты и поддержаны правительствами инициативы, направленные на организацию инфраструктуры доступа к экспериментальным и расчетным данным о материалах.
В 2011 г в США была начата разработка проекта, названного Инициативой Геном Материалов (Materials Genome Initiative (MGI)) [1]. Цель MGI - ускоренное создание новых материалов, обладающих заданными свойствами. Особое внимание уделяется поддержке прорывных исследований в теории, моделировании свойств материалов и data mining как средств достижения существенного прогресса в материаловедении. Учитывая важность материалов для достижения высокого уровня конкурентоспособности промышленности США, в июне 2014 г. национальный Консорциум сервисов данных (National Data Service (NDS)) объявил о пилотном проекте разработки средств для организации данных о материалах: The Materials Data Facility (MDF) [2]. MDF обеспечит материаловедов хранилищем экспериментальных и расчетных данных, в том числе и до их публикации, снабженных ссылками на соответствующие библиографические источники.
Программа Поиска Новых Материалов (Novel Materials Discovery Laboratory (NoMaD)) [3] была ответом Евросоюза на американскую стратегическую инициативу MGI. Проект стартовал в 2015 г. и направлен на
создание Европейских центров превосходства (European Centres of Excellence) и предполагает разработку сети баз данных (БД) (Materials Encyclopedia) по свойствам веществ и материалов (в первую очередь, содержащих результаты расчетов), а также средств анализа этих данных и расчета веществ.
В рамках программы ЕС «HORIZON2020» реализуются проекты EOSC-hub и OpenAIRE-Advance, начавшихся в январе 2018 года, которые будут способствовать реализации Европейского облака открытой науки.
Проект EOSC-Hub [4] позволит исследователям в Европе получить доступ к широкому спектру совместимых данных, вычислительных и сетевых ресурсов, открытых на национальном, региональном и европейском уровнях. Проект объединяет более 300 центров данных по всему миру и 18 панъевропейских инфраструктур, и в конечном итоге будет обслуживать 1,7 млн. европейских исследователей и 70 млн. специалистов в области науки и техники. Основные данные пока прямо не относятся к тематике неорганического материаловедения. Основной упор делается на информацию в области наук о жизни, о Земле, астрономию, энергетику, физику, социальные науки.
Второй проект OpenAIRE-Advance [5] объединяет более 50 партнеров и направлен на создание и консолидацию социально-технических сетей и инфраструктуры, поддерживающих открытое научное общение.
Инициатива исследования материалов путем интеграции информации («Materials research by Information Integration Initiative» (MI2I)) была предложена в 2015 г. японским правительством, которое создало на базе Национального института материаловедения (National Institute for Materials Science (NIMS)) Center for Materials Research by Information Integration [6]. Созданный центр ставит своей задачей не только широкое использование квантовомеханических расчетов, но и поддержку и развитие имеющихся в Японии БД по свойствам веществ и материалов, их интеграцию с зарубежными информационными системами и применение методов искусственного интеллекта для прогноза новых веществ.
В Китае при поддержке Министерства науки и технологий стартовал свой пятилетний проект MGI (2016-2020 г.г.) [7]. В Индии также начаты исследования в этом направлении [8].
На выполнение вышеуказанных проектов выделены сотни миллионов долларов. Однако ожидаемый экономический эффект от использования разрабатываемых информационных систем намного превысит вложенные средства за счет уменьшения дублирования исследований и предоставления химикам и материаловедам оперативной и достоверной информации о свойствах веществ и использования современных расчетных методов, которые дают возможность еще до экспериментов оценить параметры веществ, указать перспективные для применений составы и разработать технологию получения и обработки материалов. По мнению американских экономистов, проводивших анализ деятельности программы MGI [9], каждый доллар, вложенный в ее
выполнение приносит 4 доллара прибыли. По ряду причин (санкции против РФ, предполагаемая высокая цена доступа к разрабатываемым информационным системам, наличие в них информации о материалах и технологиях двойного назначения и т.д.) доступ российских специалистов к этим информационным ресурсам будет крайне ограничен. Это может иметь следствием серьезное отставание в темпах разработки и внедрения новых материалов, что приведет к резкому уменьшению конкурентоспособности российской продукции, особенно в наукоемких отраслях. Единственный путь решения этой проблемы - это создание собственной информационной инфраструктуры для материаловедения. Предпосылкой для успешного выполнения такого инфраструктурного проекта в России является опыт ИМЕТ РАН в разработке и интеграции БД по свойствам неорганических веществ и материалов, доступных из сети Интернет, также методов и программных средств для компьютерного конструирования новых веществ, и материалов, основанных на использовании технологий data mining, и, в первую очередь, методов обучения ЭВМ [10-12]. С помощью последних, проанализировав имеющуюся информацию об уже известных веществах, хранящуюся в БД, можно прогнозировать еще не синтезированные соединения и оценивать некоторые их свойства, зная только хорошо известные параметры компонентов (химических элементов или более простых соединений). Для решения задач конструирования новых неорганических соединений нами разработана специальная информационно-аналитическая система (ИАС) [11], включающая интегрированную систему БД по свойствам неорганических веществ и материалов (содержащую более 42 Гбайт информации о более 86 тыс. неорганических соединений (данные извлечены из 46 тыс. публикаций)) [12], подсистемы поиска закономерностей в данных, прогнозирования новых соединений и оценки их свойств, базу знаний, базу прогнозов и другие подсистемы. С использованием ИАС были получены прогнозы возможности образования тысяч новых неорганических соединений в двойных, тройных, четверных и более сложных химических системах и оценены некоторые их свойства (например, тип кристаллической структуры при нормальных условиях, критическая температура перехода в сверхпроводящее состояние, температура плавления, ширина запрещенной зоны, параметры кристаллической решетки и т.д.). Сотни предсказанных соединений были синтезированы, и сравнение прогнозов с экспериментальными данными, полученными позже, показали, что средняя достоверность прогнозирования выше 80 %.
ИАС является, своего рода, пилотным проектом информационной инфраструктуры для неорганического материаловедения, развитие которого подразумевает создание информационного центра, обеспечивающего специалистов информацией о свойствах веществ и материалов (например, БД ИМЕТ РАН, ОИВТ РАН, МГУ, NIMS, NIST, STN, Springer Materials, Materials Science International), технологиях их производства, а также расчетными данными (БД сети NoMaD, SGTE и т.д.), патентной информацией (БД
Роспатента, Questel, USPTO и т.д.), полными текстами публикаций (БД ведущих издательских корпораций - Наука, Elsevier, Springer, Wiley, American Chemical Society, American Institute of Physics, Science и т.д.), информацией о еще не опубликованных в открытой печати сообщениях (например, БД ВИНИТИ, ЦИТИС) и т.д. В связи со спецификой предметной области основу такого информационного центра коллективного пользования должна составлять распределенная виртуально интегрированная сеть отечественных и зарубежных баз данных и баз знаний по веществам и материалам. Создание центра будет способствовать резкому ускорению поиска, разработки и внедрения новых материалов, в сочетании со значительным сокращением затрат за счет уменьшения дублирования исследований и предоставления химикам и материаловедам оперативной и достоверной экспериментальной и расчетной информации о веществах и материалах.
Список литературы:
1. Materials Genome Initiative. https://www.mgi.gov/ - (visited on 19.09.2019).
2. The Materials Data Facility. https://materialsdatafacility.org/ - (visited on 19.09.2019).
3. The Novel Materials Discovery (NOMAD) Laboratory. http://nomad-lab.eu/ -(visited on 19.09.2019).
4. EOSC-Hub. https://www.eosc-hub.eu - (visited on 19.09.2019).
5. OpenAIRE-Advance. https://www.openaire.eu/advance/ - (visited on 19.09.2019).
6. Center for Materials Research by Information Integration. http://www.nims.go.jp/eng/research/Mn-I/index.html - (visited on 19.09.2019).
7. Lu X.-G. // Sci. Bull. 2015. V. 60. N. 22. P.1966.
8. First National Conference on Mapping the Materials Genome. Ed. V. Kumar, G. Roy, V.K. Jayaraman, S. Sukumar and N. Sukumar. New Delhi: Group Excel India, 2013. 68 p.
9. Economic Analysis of National Needs for Technology Infrastructure to Support the Materials Genome Initiative. https://www.nist.gov/mgi/mgi-reports - (visited on 19.09.2019).
10. Киселева Н.Н., Дударев В.А., Земсков В.С. // Успехи химии. 2010. Т.79. N.2. С. 162.
11. Киселева Н.Н., Дударев В.А., Столяренко А.В. // Теплофизика высоких температур. 2016. Т.54. N.2. С. 228.
12. Базы данных ИМЕТ РАН. http://www.imet-db.ru/ - (visited on 19.09.2019).
Работа выполнена при частичной финансовой поддержке РФФИ, проекты 1707-01362, 18-07-00080. Работа выполнялась по государственному заданию № 075-00746-19-00.