Научная статья на тему 'Информационная система по ресурсам неорганической химии и материаловедения'

Информационная система по ресурсам неорганической химии и материаловедения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
194
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕОРГАНИЧЕСКИЕ ВЕЩЕСТВА / INORGANIC SUBSTANCES / БАЗА ДАННЫХ / DATABASE / ИНФОРМАЦИОННАЯ СИСТЕМА / INFORMATION SYSTEM / КАТАЛОГ РЕСУРСОВ / RESOURCES CATALOG

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Киселева Н.Н., Дударев В.А.

Разработана информационная система (ИС) IRIC Information Resources of Inorganic Chemistry, содержащая сведения о компьютерных информационных ресурсах в области неорганической химии и материаловедения, которая доступна пользователям из глобальной сети Интернет (httр://iric.imet-db.ru). ИС содержит информацию об организациях-владельцах (название, страна, почтовый и электронный адреса, телефон и т.д.), ключевые слова, по которым возможен поиск, а также ссылки на публикации. Рассмотрена структура базы данных ИС и ее пользовательский интерфейс. ИС IRIC предназначена для навигации специалистов в море информационных ресурсов в вышеуказанных предметных областях. ИС IRIC имеет две версии русскоязычную и англоязычную.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Информационная система по ресурсам неорганической химии и материаловедения»

УДК 546:025.4.03

Н. Н. Киселева, В. А. Дударев ИНФОРМАЦИОННАЯ СИСТЕМА ПО РЕСУРСАМ НЕОРГАНИЧЕСКОЙ ХИМИИ

И МАТЕРИАЛОВЕДЕНИЯ

Ключевые слова: неорганические вещества, база данных, информационная система, каталог ресурсов.

Разработана информационная система (ИС) IRIC - Information Resources of Inorganic Chemistry, содержащая сведения о компьютерных информационных ресурсах в области неорганической химии и материаловедения, которая доступна пользователям из глобальной сети Интернет ^'^р^/шсяте^^^}. ИС содержит информацию об организациях-владельцах (название, страна, почтовый и электронный адреса, телефон и т.д.), ключевые слова, по которым возможен поиск, а также ссылки на публикации. Рассмотрена структура базы данных ИС и ее пользовательский интерфейс. ИС IRIC предназначена для навигации специалистов в море информационных ресурсов в вышеуказанных предметных областях. ИС IRIC имеет две версии - русскоязычную и англоязычную.

Keywords: inorganic substances, database, information system, resources catalog.

Information system (IS) IRIC - Information Resources of Inorganic Chemistry has been developed. The IS contains data on computer information resources in the field of inorganic chemistry and materials science. IRIC is available for users in internet at httр://iric.imet-db.ru. The IS contains information on owners (title, country, e-mail and post address, phone, etc), keywords for search and references. IS database structure and user interface are considered. IRIC is designed to provide specialist navigation in sea of information resources in given subject domains. The IS has two versions - Russian and English.

Введение

В современном мире наблюдается неуклонный рост потоков информации во всех отраслях человеческой деятельности. За последние десятилетия неорганическим материаловедением был накоплен колоссальный массив сведений по широкому спектру свойств современных материалов, а также технологиям их получения. По мере развития научно-технического прогресса наблюдалась естественная эволюция средств доставки информации до потребителей. В современном материаловедении за последние десятилетия был пройден путь от попыток систематизации накопленной информации в справочниках, статьях, монографиях до повсеместного использования специализированных баз данных. На текущий момент именно базы данных в наибольшей степени отвечают потребностям специалистов по неорганическому материаловедению, поскольку обеспечивают быстрый поиск информации, поддерживаемой, в отличие от бумажных носителей, в актуальном состоянии [1].

За последнее время в мире отмечается неуклонный рост числа материаловедческих баз данных (БД) и основанных на них информационных систем. Разработка информационных систем (ИС) по свойствам веществ и материалов (СНВМ), а также процессам их получения на основе БД ведется во всех промышленно развитых странах на многих языках. Среди крупнейших разработчиков БД по свойствам неорганических веществ стоит выделить NIST (National Institute of Standards and Technology - Национальный институт стандартов и технологий, США) и STN (The Scientific and Technical Information Network - Международная сеть научно-технической информации). Большинство разработанных систем являются фактографическими, хотя объем информации в области неорганических ве-

ществ и материалов, содержащейся в документальных БД (Science-direct (www.sciencedirect.com), Wiley (www.wiley.com), Springer

(www.springer.com), American Chemical Society (www.acs.org), Chemical Abstract Service (www.cas.org), STN (www.stn-international.de), ВИНИТИ (www2.viniti.ru), e-library (www.elibrary.ru) и т.д.), значительно превосходит суммарный объем данных фактографических систем [2].

Несмотря на увеличивающиеся объемы данных, содержащиеся в рамках БД, ни одна из них не содержит полного описания всех свойств веществ. Поэтому всестороннее изучение свойств того или иного материала требует анализа информации из целого ряда БД СНВМ. Такой анализ является необходимым, поскольку в современных многофункциональных устройствах только исчерпывающая характеристика материала позволяет материаловеду принять решение об его использовании. Таким образом, перед исследователем встает проблема поиска требуемой информации в разрозненных БД, что невозможно без систематизации самих БД по свойствам неорганических материалов. Именно задача систематизации наиболее значимых БД по свойствам неорганических веществ решалась на базе ИМЕТ РАН при разработке БД IRIC по информационным ресурсам в области неорганической химии (IRIC - Information Resources on Inorganic Chemistry). Отметим, что в настоящее время в мире, как это ни странно, не существует подобного каталога информационных ресурсов, посвященных неорганическому материаловедению.

Схема базы данных

Как известно, любая ИС состоит наполовину из данных, а наполовину - из программного кода. Схема данных является наиболее критичной частью для реализации любой ИС, поскольку основные

функции ИС разрабатываются именно на уровне схемы данных. Таким образом, если схема данных поддерживает некоторую функциональность, то программный код способен реализовать ее. Если нет, то, как бы хороша не была программная реализация, конечная ИС не сможет качественно поддерживать функции, изначально не заложенные в схему БД. Поэтому важно было выделить основные сущности для справочной системы IRIC и отношения между ними, которые позже легли в основу проектируемой БД.

Перечислим основные из сущностей, представленных на схеме данных: страны (CounrtiesInfo), организации-разработчики (OrganisationsInfo), БД (Databases), ключевые слова (KeywordsInfo), литературные публикации (LitReferences) и их авторы (AuthorsInfo), условия доступа к ИС (LicenseType). Перечисленные сущности, а также связи между ними представлены на диаграмме БД (рис. 1).

Рис. 1 - Сущности БД IRIC и связи между ними

Разработанная структура данных позволяет обработать все возможные запросы пользователей, упрощает взаимодействие с БД и гарантирует непротиворечивость хранящихся данных. Ссылочная целостность обеспечивается использованием первичных и внешних ключей в СУБД Microsoft SQL Server 2008.

Разработка информационной системы

Следует отметить, что при разработке схемы БД учитывалась возможность представления всей информации на двух языках: русском и английском. Это впоследствии открыло возможность для написания русскоязычного и англоязычного интерфейса к БД IRIC, что позволило широкому кругу материаловедов не только в нашей стране, но и за рубежом использовать данную ИС.

Интернет является средой обеспечивающей быстрый доступ к информации из любой точки мира. Именно поэтому для доступа к информации ИС IRIC было разработано Web-приложение, позво-

ляющее конечным пользователям получить мгновенный доступ к информации через любую программу-браузер. Web-приложение реализовано по классической трехзвенной архитектуре (на основе концепции "клиент-сервер"), включающей в себя три звена: браузер (клиент); Web-сервер (сервер приложений); сервер БД.

Информация предоставляется в открытом доступе (бесплатно) на двух языках (русскоязычный интерфейс доступен по адресу http://iric.imet-db.ru, полный англоязычный аналог - по адресу http://en.iric.imet-db.ru), что открывает возможность использования БД широким кругом специалистов не только в нашей стране, но и за рубежом.

ИС Ш1С поддерживает ряд поисковых запросов, которые отличаются количеством и типом критериев поиска:

• общий запрос - просмотр всей информации по выбранному разделу меню;

• простой запрос - поиск данных по одному критерию;

• сложный запрос - поиск данных по нескольким критериям.

Список БД по ключеым словам

Фильтр по ключевым словам: энтальпия, энтропия

№ Название (аббревиатура) Контакты Комментарий

1 БД термодинамических Сайт: http:// Теп лофизи ческие

свойств индивидуальных w w w. ch em .msu .su/ r us/ (рекомендованные) данные

веществ handbook/ ivtan для неорганических

(ИВТАНТЕРМО) Тел: +74954851000 веществ.

[подробнее...] Факс: +74954851000

в-Mai: ¡orish@ihed.ras.ru

2 БД по термодинамическим Сайт: http:// Теп лофизи ческие и

и транспортным свойствам www.nist.gov/srd/ транспортные свойства

чистых газов и жидкостей nist23.cfm чистым неорганичесюм и

(мэткипю) Тел; +13019752208 органических жидкостей и

[подробнее...] Факс: +13019260416 газов,

eMail:

Joan. Sauer wein@nist. gov

3 БД по термохимическим Сайт: http:// Теп лофизи ческие и

свойствам органических и kinetics.nist.gov/janaf/ химические свойства

неорганических веществ с Тел; неорганических веществ и

одним или двумя атомами Факс: органических веществ с

углерода e-Mail: одним-двумя атомами

углерода,

[подробнее,,,]

Всего найдено: 3. 1-3

Рис. 2 - Пример результатов запроса к ИС 1МС по ключевым словам

Примером сложного запроса является поиск материаловедческих БД, разработанных в определенной стране и организации. На рис. 2 представлены результаты поиска для двух ключевых слов "энтальпия" и "энтропия", как видно из снимка экрана, на сегодняшний день ИС Ш1С известно три БД, удовлетворяющих критерию поиска: отечественная разработка ИВТАНТЕРМО (ОИВТ РАН) и две системы, принадлежащие МКТ.

Анализ трендов в разработке ИС

Безусловно, основной задачей создания и эксплуатации ИС на основе БД по свойствам неорганических веществ является информационное обслуживание специалистов-химиков. Однако БД предоставляют значительно более широкие возможности манипулирования данными. Одной из таких возможностей является статистический анализ и выявление основных трендов развития информационных ресурсов в области неорганической химии и материаловедения [3].

Анализ тематики ключевых слов позволяет выделить наиболее распространенные параметры неорганических веществ и материалов, информация о которых содержится в БД СНВМ. Традиционное первое место по числу БД занимают фактографические информационные системы, аккумулирующие информацию по термодинамическим и теплофизиче-ским свойствам. Интенсивно разрабатываются и широко используются в фундаментальных и прикладных исследованиях и промышленности БД с кристаллографической и кристаллохимической информацией. В последние годы увеличилось число БД, содержащих сведения о механических свойствах (прочности, усталости, ползучести и т.д.) и электрических свойствах неорганических веществ и материалов.

Число компьютерных информационных ресурсов и их объем могут служить показателем научного и промышленного потенциала страны. Анализ информации БД Ш1С позволил выявить страны-лидеры в области разработки материаловедческих информационных ресурсов. Мировой лидер - США -занимает первое место в списке разработчиков БД СНВМ, главным образом за счет развития информационных систем МЕТ. В последнее десятилетие Япония неуклонно наращивает объем информационных ресурсов во многом благодаря ММЕ - основному провайдеру в области материаловедческих БД. В тройку лидеров входит пока и Россия, главным образом за счет БД СНВМ, разрабатываемых в академических институтах (ИМЕТ РАН, ОИВТ РАН и др.).

Анализ информации, содержащейся в ИС Ш1С, в том числе и предоставляемых ею полных текстов статей, позволил выявить и основные тенденции в области разработки и эксплуатации современных ИС СНВМ:

• доступ к информации из сети Интернет, который позволяет "доставить" необходимую и самую "свежую" информацию непосредственно на рабочее место химика или материаловеда;

• экспертная оценка хранящейся информации, для которой привлекаются высококвалифицированные специалисты, что дает в руки пользователя не просто "сырую" информацию, а рекомендуемые значения;

• оснащение БД СНВМ средствами анализа информации - от традиционных термодинамических расчетов и статистических процедур до современных средств поиска закономерностей в данных, позволяющих прогнозировать поведение объектов и обеспечивающих принятие решений [2];

• интеграция БД по веществам и материалам в целях предоставления пользователю наиболее пол-

ной информации о свойствах конкретного вещества, а также для последующего анализа совокупной информации о веществах и материалах.

Заключение

Разработанная ИС 1ЫС позволяет материаловедам не только получать информацию о существующих в мире БД по свойствам неорганических веществ на русском и английском языках, но и проводить поиск таких БД по многокритериальным запросам. В последние годы для обеспечения специалистов полной информацией наблюдается тенденция к интеграции уже созданных БД, как на национальном, так и на международном уровнях, в том числе в рамках СОБАТА и ЮНЕСКО. При этом наиболее многообещающим подходом является виртуальная интеграция ИС СНВМ, разработанных в рамках разных организаций [3] в противоположность использованию технологии хранилищ данных, более уместных для получения консолидированных данных в одной организации [4, 5].

Создание ИС Ш1С позволяет систематизировать имеющеюся информацию в материаловедче-ских БД на самом верхнем уровне и указать варианты наиболее разумной интеграции созданных информационных систем с целью минимизации времени затрачиваемого специалистами на поиск требуемой информации. А это, в свою очередь, является важным шагом на пути к созданию единой интегрированной материаловедческой информационной системы следующего поколения [6].

Работа выполнена при частичной финансовой поддержке РФФИ, проекты 12-07-00142 и 14-073103214.

Литература

1. Н.Н. Киселева, В.А. Дударев, Информационные технологии, 12, 63-66 (2010).

2. Н.Н. Киселева, Компьютерное конструирование неорганических соединений. Использование баз данных и методов искусственного интеллекта. Наука, Москва, 2005. 288 с.

3. В.А. Дударев, VI Российская ежегодная конференция молодых научных сотрудников и аспирантов (Москва, 17-19 ноября 2009) Тезисы. Москва, 2009. С. 127-129.

4. А.П. Кирпичников, А. Л. Осипова, И.С. Ризаев, Вестник Казанского технологического университета, 15, 3, 157160 (2012).

5. А.Л. Абдуллин, В.Г. Крюков, К.А. Березовская, Вестник Казанского технологического университета, 16, 10, 299-303 (2013).

6. В.В. Масютин, В.А. Дударев, Интеграл, 6, 30-31 (2010).

© Н. Н. Киселева - д.х.н., зав. лаб. полупроводниковых материалов Федерального государственного бюджетного учреждения науки Института металлургии и материаловедения им. А.А. Байкова РАН, kis@imet.ac.ru; В. А. Дударев - к.т.н., вед. науч. сотр. той же лаборатории, vic@imet.ac.ru;

© N. N. Kiselyova - doctor of chemical sciences, head of the Laboratory of semiconductor materials of the A.A. Baikov Institute of Metallurgy and Materials Science of RAS, kis@imet.ac.ru; V. A. Dudarev - candidate of technical sciences and leading researcher of the Laboratory of semiconductor materials of the A.A. Baikov Institute of Metallurgy and Materials Science of RAS, vic@imet.ac.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.