Научная статья на тему 'Язык запросов для рентгенофазовой идентификации многофазных поликристаллических материалов'

Язык запросов для рентгенофазовой идентификации многофазных поликристаллических материалов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
72
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕНТГЕНОФАЗОВЫЙ АНАЛИЗ / ФАЗОВАЯ ИДЕНТИФИКАЦИЯ / КОЛИЧЕСТВЕННЫЙ РЕНТГЕНОФАЗОВЫЙ АНАЛИЗ / МЕТОД ССЫЛОЧНЫХ ИНТЕНСИВНОСТЕЙ / X-RAY POWDER DIFFRACTION / QUALITATIVE PHASE ANALYSIS / XRD PHASE IDENTIFICATION / QUANTITATIVE PHASE ANALYSIS / REFERENCE INTENSITY RATIO METHOD

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Якимов И. С.

Информационно-поисковая система рентгенофазовой идентификации (ИПС ФИ) вещественного фазового состава сложных многокомпонентных поликристаллических материалов в ходе Интернет-конкурса Search-Match Round Robin 2002, проведенного комиссией CPD Международного союза кристаллографов, обеспечила точную идентификацию всех конкурсных материалов. Базисным элементом ИПС ФИ является проблемно-ориентированный операторный язык поисковых запросов, который обеспечивает высокую селективность фазовой идентификации и представляет альтернативу традиционным детерминированным алгоритмам и программам Search-Match.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Якимов И. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Query Language for X-Ray Powder Diffraction Phase Identification

The information storage and retrieval system of Х-ray powder diffraction phase identification (Retrieve) identified all Search-Match Round Robin-2002 samples exactly. A base element of the system is a problem-oriented operator language of search queries for phase identification. The query language is described in detail and its identification possibilities are discussed.

Текст научной работы на тему «Язык запросов для рентгенофазовой идентификации многофазных поликристаллических материалов»

Journal of Siberian Federal University. Chemistry 4 (2009 2) 377-384

УДК 543.442; 539.26; 546.06;

Язык запросов для рентгенофазовой идентификации многофазных поликристаллических материалов

И.С. Якимов*

Сибирский федеральный университет, Россия 660025, Красноярск, пр.Красноярский рабочий, 95 1

Received 16.11.2009, received in revised form 7.12.2009, accepted 15.12.2009

Информационно-поисковая система рентгенофазовой идентификации (ИПС ФИ) вещественного фазового состава сложных многокомпонентных поликристаллических материалов в ходе Интернет-конкурса Search-Match RoundRobin -2002, проведенного комиссией CPD Международного союза кристаллографов, обеспечила точную идентификацию всех конкурсных материалов. Базисным элементом ИПС ФИ является проблемно-ориентированный операторный язык поисковых запросов, который обеспечивает высокую селективность фазовой идентификации и представляет альтернативу традиционным детерминированным алгоритмам и программам Search-Match.

Ключевые слова: рентгенофазовый анализ, фазовая идентификация, количественный рентгенофазовый анализ, метод ссылочных интенсивностей.

Введение

Фазовая идентификация (ФИ) или качественный рентгенофазовый анализ [1], является распространенным методом анализа вещественного фазового состава поликристаллических материалов и основана на компьютерном сопоставлении (Search/Match) рентгеновского дифракционного спектра (дифрактограммы) с эталонными линейчатыми дифракционными спектрами (штрих-спектрами) стандартов чистых фаз, накапливаемыми в базах данных (БД). В наиболее распространенной БД PDF ICDD в 2009 г. накоплено около 700 тыс. рентгенофазовых стандартов неорганических и органических веществ (http://www.icdd.com). При повышении сложности фазового состава или большом ко-

личестве фаз эффективность идентификации существенно падает, что выражается в отборе идентификационной программой большого числа спектрально близких фаз-претендентов. В результате ФИ сводится к трудоемкому визуальному сопоставлению эталонных спектров фаз-претендентов с дифрактограммой на экране монитора. Ограниченные возможности программ ФИ при идентификации дифрактограмм образцов сложного фазового состава показал конкурс Search-Match Round Robin - 2002 [2], проведенный комиссией CPD Международного союза кристаллографов.

Задача ФИ по своей природе является поисковой. Автором развит подход, основанный на использовании проблемно-ориентированного языка запросов и реа-

* Corresponding author E-mail address: I-S-Yakimov@yandex.ru

1 © Siberian Federal University. All rights reserved

лизованной на его основе информационно-поисковой системе фазовой идентификации (ИПС ФИ), включающей интерпретатор запросов, графический интерфейс пользователя и бесстандартный количественный анализ по мультирефлексному регуляризи-рованному методу ссылочных интенсивно-стей (RRIR) [3]. ИПС ФИ обеспечивает автоматическое программирование скрытых от пользователя запросов на ФИ в результате оперирования мышью на графических окнах с дифрактограммой, эталонными спектрами, таблицей Менделеева и т.п., визуальный контроль спектров фаз-претендентов и построение из них модельного спектра дифракто-граммы в качестве критерия достоверности ФИ [4]. В настоящей работе представлено описание языка запросов ФИ и его аналитических возможностей. Применение языка запросов позволяет пользователю реализо-вывать различные стратегии идентификации вместо использования программ Search/ Match с детерминированными алгоритмами. Данный подход позволяет существенно сократить количество отбираемых фаз-претендентов и повысить эффективность анализа материалов со сложным составом, например, только ИПС ФИ дала возможность совершенно точно идентифицировать фазовый состав конкурсных заданий SMRR-2002 [5].

Язык запросов фазовой идентификации

Процесс фазовой идентификации рассматривается как последовательность идентификационных запросов, создающих выборки из базы данных эталонных спектров или из предыдущих выборок, в результате которого создается итоговая выборка, содержащая идентифицированные эталонные спектры фаз анализируемого материала.

Выборки сортируются по вероятностному спектральному критерию соответствия эталонных спектров с идентифицируемым спектром. Каждый запрос является интерпретируемой ИПС программой, состоящей из последовательности операторов языка ФИ. Программы-запросы позволяют описывать априори известную информацию о возможном фазовом составе в терминах задания допустимых комбинаций химического состава и формировать спектральные критерии соответствия эталонных и экспериментальных спектров для селективного поиска и отбора адекватных фазовых эталонов.

Для описания конструкций языка ФИ используется ряд мнемонических обозначений: «...» - скобки для содержательного описания элементов языка; [...] - скобки для необязательных языковых конструкций; {... | ...} - скобки для альтернативных языковых конструкций («или»). Другие мнемонические обозначения вводятся далее по тексту.

Формат запроса IN = « Идентификатор входного объекта или операция над объектами»;

[ «Последовательность операторов» ] OUT = « Идентификатор выходного объекта»;

где

«Объект» есть {«Спектр» | «Выборка номеров спектров»}.

«Спектр» есть {«Идентифицируемый» | «Эталонный» | «Модельный»} штрих-спектр в формате базы данных PDF ICDD.

Операторы отбора по хим. составу {YES | NOT} = IF {ONE | ALL} {(F<L) | (F#<L) | (L<F) | (L#<F)};

LIST = «список {«химических элементов» | "«фрагментов химических формул»"}»;

Мнемонические обозначения: YES | NOT - отбор или отбраковка спектра из IN, если выполнено условие IF; F - хим. состав химической формулы фазы спектра из IN; L - хим. состав из списка LIST; «<» - знак «содержится»; «#<» - знак «не содержится»; ONE | ALL - кванторы «содержится хотя бы один» или «содержатся все».

Операторы отбора по указанным линиям [{D2 © | Dd | DH} = { Д2© | Ad | ДН } ]; {YES|NOT}=IF{ONE|ALL} {(L<S)|(L#<S)|(S<L)|(S#<L)} [FOR{(I>=Imm)|(C*I>=Imm)}]; LIST = «список положения линий в шкале {2© | d | H}»;

где 2© - угол дифракции, d - межплоскостное расстояние, Н=целое(10000Щ Д2© | Ad | ДН - допустимая погрешность соответствия линий по 2© | d | Н; Мнемонические обозначения: S - очередной эталонный спектр из IN, сопоставляемый с идентифицируемым спектром IS; L - список позиций линий IS, указываемых в LIST для проверки соответствия им линий из S; FOR(I>=Imin) - проверка осуществляется только для линий S, имеющих интенсивность I>=Imin; FOR(C*I>=Imin) - проверка осуществляется только для линий S, имеющих интенсивность C*I>=Imin, где С - коэффициент приведения интенсивности линий спектра S к IS.

Операторы отбора по спектральным критериям {YES | NOT} = IF (Rs {>= | <} Ro) [FOR {(I>=Imin) | (C*I>=Imin)}];

Мнемонические обозначения: Rs - идентификатор вероятностного критерия парного соответствия спектров, рассчитываемого для очередного спектра из IN и

спектра IS; Ro - пороговое значение критерия Rs.

Вероятностные критерии парного соответствия спектров рассчитываются на основе аппроксимации распределения интенсивности линий штрих-спектров в виде отношения интеграла перекрытия эталонного спектра S и идентифицируемого спектра IS к интегралу спектра S:

Rs = í [Y( IS(Hj), АН, Н) П Y( IIS(Hj), АН, H)]dH / í [Y( Р(Н,), АН, H)]dH,

где Y(I(Hj), ДН, H) - функция распределения интенсивности линий j с центром Hj, интенсивностью в максимуме I(H¡) и условной шириной 2ДН, задающей погрешность совпадения эталонной и экспериментальной линий в целочисленной шкале обратных межплоскостных расстояний Н = целое[10000Щ При построении вероятностных критериев могут использоваться различные формы аппроксимации распределения интенсивности линий в задаваемом интервале соответствия 2ДН, например нормальное, треугольное, прямоугольное, дельта-функцией. При этом могут быть применены различные весовые схемы учета вклада интенсивности линий в интеграл. Следует уточнить, что аппроксимируется не профиль линии, а условное распределение интенсивности, зависящее от ширины интервала 2ДН и используемое только для вероятностной оценки степени соответствия спектров.

Свойства и правила взаимодействия операторов

Важнейшим свойством индивидуальных операторов является их двойственность: эквивалентность действия при замене входящих в оператор операций на противоположные. Например, эквивалентны пары операторов: YES = IF ONE (F<L) и NOT = IF ALL (F#<L);

YES = IF ALL (L<S) FOR (I>=50) и NOT = IF ONE (L#<S) FOR (I>=50); YES = IF (Rs >=20) FOR (C*I>=10) и NOT = IF (Rs <20) FOR (C*I>=10).

Двойственность позволяет ввести в язык ФИ следующие правила для конструирования запросов из последовательностей операторов:

1) объекты, содержащиеся в IN, обрабатываются операторами запроса последовательно;

2) объект из IN отбирается в OUT тогда и только тогда, когда одновременно: не выполняется ни один из операторов NOT и выполняется хотя бы один из операторов YES;

3) отсутствие оператора YES эквивалентно его выполнению.

Критерий достоверности ФИ Критерием достоверности ФИ является модельный спектр, интерпретирующий химический состав и все линии IS. Модельный спектр определяется как линейная комбинация из штрих-спектров адекватно идентифицированных рентгенофазовых эталонов БД PDF:

m

Iм(2©j) = £C ■ Is(2©y.), j=1,...,n,

i

где m - количество фаз, n - количество линий, Q - коэффициенты приведения спектров S¡ к IS, 2©¡j - позиции линий фазы Si, F(2©¡j) - интенсивности линий фазы S¡.

Коэффициенты приведения определяются и далее используются для бесстандартного количественного фазового анализа по методу RRIR в соответствии с [3].

Обсуждение идентификационных возможностей языка запросов

Для идентификации образцов сложного фазового состава разработана методика «кластерной фазовой идентификации»,

основанная на использовании нескольких стратегий ФИ, разбивающих множество фаз-претендентов на группы (кластеры) так, что в каждом кластере присутствует только одна подлежащая идентификации истинная фаза (или ни одной, при неадекватном запросе). Базовыми являются стратегии «Поиск по сильной неидентифицированной линии диф-рактограммы» и «Поиск по неидентифици-рованному химическому элементу образца». Соответственно, в первой стратегии в запрос, кроме операторов отбора по спектральным критериям, включаются операторы отбора по указанным линиям, а во второй - операторы отбора по указанным химическим элементам или фрагментам химических формул. В более сложных случаях применяется комбинация нескольких операторов отбора и отбраковки по линиям и элементам, например для проверки гипотез о принадлежности нескольких линий или (и) элементов к одной фазе.

Рассмотрим применение стратегий на примере идентификации на 2-м этапе конкурса SMRR-2002 одного из образцов (Sample 1) с указанным элементным составом (Fe, Ca, Al, Si, O, С, P, F, H), состоящим из четырех минеральных фаз (Siderite, Fluorapatite, Gormanite, Quartz), имеющих сильно искаженные диф-рактограммы. Идентификация выполняется с помощью пяти запросов, изображенных в левой части рис. 1-5. В правой части рисунков приведен отобранный по запросу кластер фаз (истинная фаза подчеркнута) и изображен фрагмент дифрактограммы (излучение CuKa) с модельным спектром, построенным из идентифицированных фаз. На рис. 1 приведен запрос на создание из БД генеральной выборки S1 по заданному элементному составу, включающей 4200 эталонных спектров фаз с указанным составом.

На рис. 2 отражен запрос на создание из S1 выборки S8, включающий операторы отбо-

¡N=88; «БД»

УЕ8=1Р ЛПП(Р<П);

П1КТ=Н,СЛРА1,К^Р,Са,Ре;

0иТ=81; «выходная выборка»

Рис. 1. Запрос на создашге генеральной выборки по элементному составу и дифрактограмма идентифицируемого оТ=азца 8атр1е1

ПТ=81; ЭН=4Л

ЖУРЧР

0(Е(П#<К)Р0К(1>=50); LIST=3601; «2©~32.2°» (ОТ=1Р ЛПП(П#<Р); 1КТ=Ке; УЕ8=1Р ЛПП(Р<П); ПIаT=Fe,H,C,0,F,Лl,аi)P,Ca;

оит=а8;

Рис. 2.ЗапррснасозданиеВыб орки по сильнейшей линии и основному элементу ^е), справа в рамке - состав выбо=ки оо запйосу,1фасные штрихи на дифрактограмме - идентифицированный спектр сидерита (№83-17(54=

П0=)31; БЫ=3В;

К04=1С]К11<1ВВ)С0Д(1>=5В); 1004=1С(К11<5В)С0Д(1>=й5); 1004=1С(КЫ С<15); N04=1]

00ТП(Ы<8) 5ЮД(Т>=34); 1КТ==009; пй©~йб.7Вс 01К4=88<

\ 78-1254;СС 327; Б! 02;

N ■ж 38- ЗБ0;БВ 0; Б! 02; МодапИе; БШсс

85-1054:СС 307; 02; диаг1г $БА;

82- 511 ;СС 303; Б! 02; 0иаг1г;; Ц=2

86-1628;СС 303; Б! 02; 0иа|1г 1он;

1) ] ц

Рис. 3. Запрос на создание выборки по сильнейшей неидентифицированной линии, справа в рамке - состав выборки по запросу, синие штрихи на фрагменте дифрактограммы - идентифицированный спектр кварца (№85-1054)

IN=S1; DH=30;

NOT=IF(RN<100)FOR(I>=50); NOT=IF(RN<50)FOR(I>=25); NOT=IF(RHC<15); NOT=IF ONE(L#<S) FOR(I>=70); LIST=3704; «20-33.1°» NOT=IF ALL(L#<F); LIST=P;

YES=IF ALL(F<L);

LIST=P,H,C,O,F,Al,Si,Ca,Fe;

OUT=S8;

31- 2G7;IB 0; Ca10 [ P 04 ]5 С 03 F1.5 [ □ H J0.5; Carbonatefluorapatite 83- 556;CC 114; Ca5.061 [ PZ.87 011.4Б ) FB.89; Fluoiapatile; ; R=134 79-1572;CC 115; Ca5.18 ( P 04.09 ]3 F1.01: Fluoiapatile. sjin; ; R=126 75- 915;CC 108; Ca5 F ( P 04 ]3; Fluoiapatile; ; R= 97 73-1727;CC 109; Ca5 ( P 04 )3 F; Fluoiapatile; ; R= 95

Рис. 4. Запрос на создание выборки по сильнейшей неидентифицированной линии и неидентифициро-ванному элементу (Р), в рамке - состав выборки, зеленые штрихи на фрагменте дифрактограммы - идентифицированный спектр фторапатита (№83-556)

TVTYPE=5; DH=40;

NOT=IF(RN<100)FOR(I>=50); NOT=IF(RN<50)FOR(I>=25); NOT=IF(RHC<15); NOT=IF ONE(L#<S) FOR(I>=100); LIST=1511; «20-13.3°» NOT=IF ONE(L#<S) FOR(I>=15); LIST=2119; «20-18.8°» OUT=S8;

Рис. 5. Запрос на создание выборки по двум сильнейшим неидентифицированным линиям, справа в рамке - состав выборки по запросу, коричневые штрихи на дифрактограмме - идентифицированный спектр горманита (№36-403)

-П-

• 36- 403;SI 0; Fe3 +2 АН ( P 04 ]4 ( □ H ]G !2 Н2 □; Gormanite;

« 2G- 330;SS 27; С4 H 4 Са DG !4 H 2 □; ; Calcium Tartrate Ну drat

г II L \ l J Шг lijib' Ifrfi 1 L Ц

1 и ъ

Таблица 1. Результат КРФА образца Samplel SMRR-2002

N PDF Formula Mineral Name % масс.

83-1764 Fe ( C O3 ) Siderite 46,6

85-1054 Si O2 Quartz 13,3

83- 556 Ca5.061 ( P2.87 O11.46 ) F0.89 Fluorapatite 29,7

36-403 Fe+2 Al4 (PO4)4 (OH)6 2H2O Gormanite 10,2

ра по спектральным критериям соответствия, сильнейшей линии и основному элементу образца ^е). В результате запроса создана выборка S8 из трех эталонных спектров фаз-претендентов, в которой первые два являются спектрами сидерита. Визуальное сравнение этих спектров с дифрактограммой идентифицировало сидерит Fe(COз). В то же время, при исключении из данного запроса оператора отбора по сильнейшей линии сидерит находится в выборке на 11-м месте, при исключении оператора отбора по основному элементу - на 17-м, а при исключении обоих операторов (т.е. при поиске только по спектральному критерию соответствия) - на 24-м.

Сложность идентификации сидерита в данном образце обусловлена дефектной структурой и сильной текстурой вдоль направления (112), отразившихся в сдвиге его линий на дифрактограмме на величину Д2©=0.15-0.20° и аномально высокой интенсивности сильнейшей линии относительно эталонных спектров. Использование в запросе вышеописанных операторов приводит к его однозначной идентификации.

На рис. 3 изображен запрос на создание выборки, включающий операторы отбора по спектральным критериям соответствия и сильнейшей неидентифицированной линии. В результате запроса создана выборка S8 из пяти эталонных спектров фаз-претендентов, в которой отобран кластер из эталонных спектров кварца.

На рис. 4 приведен запрос на создание из S1 выборки S8, включающий операторы отбора по спектральным критериям соответствия, сильнейшей неидентифицированной линии и неидентифицированному элементу (Р). В результате запроса создана выборка S8 из пяти эталонных спектров фаз-претендентов, в которой отобран кластер из эталонных спектров фторапатита.

На рис. 5 приведен запрос на создание из S1 выборки S8, включающий операторы отбора по спектральным критериям соответствия и двум оставшимся неидентифицированным линиям. В результате запроса создана выборка S8 из пяти эталонных спектров фаз-претендентов, в которой отобран кластер с эталонным спектром горманита на 1-м месте.

В табл. 1 представлены результат КРФА данного образца по методу RRIR. Язык запросов ФИ основан на элементах математической теории исчисления предикатов [6], в частности, на использовании кванторов «для всех» (ALL) и «существует» (ONE). Это обеспечивает его более высокие поисковые возможности по сравнению с традиционно применяемой в программах ФИ булевской логикой и создает возможность реализации селективных стратегий ФИ. Интерпретатор языка запросов, средства их графического автопрограммирования и ИПС ФИ разработаны в среде визуального программирования Дельфи. Аналоги языка запросов ФИ могут быть реализованы и на реляционно полных языках манипулирования базами данных с процедурными расширениями, типа SQL/PSM.

Заключение

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Стратегии поиска по выделенной линии и/или элементному составу приводят к кластеризации множества возможных фаз-претендентов. В кластер при подходящих значениях поисковых критериев попадает группа из нескольких спектрально и, как правило, кристаллохимически подобных фаз, среди которых находится одна истинная фаза, имеющая более высокое значение рейтингового критерия по сравнению с большинством фаз-претендентов. Кроме того, истинная фаза легко определяется в кластере визуально - по соответствию ее эталонного спектра с дифрактограммой образца.

Как следствие, повышается достоверность ФИ, экспрессность анализа (~1-5 мин/фаза) и устойчивость МНК при синтезе модельного спектра образца из идентифицированных эталонных спектров. Модельный спектр служит критерием достоверности ФИ и используется для автоматического КРФА по мультирефлексному регуляризированному методу ссылочных интенсивностей. Приме-

нение языка запросов и основанной на нем методики кластеризации, реализуемой интерактивно с помощью ИПС ФИ, существенно упрощает процедуру фазовой идентификации и КРФА материалов со сложным фазовым составом, а главное, создает у пользователя уверенность в том, что истинные фазы не были опущены в рассмотрении и действительно идентифицированы.

Список литературы

1. Васильев Е.К., Нахмансон М.С. Качественный рентгенофазовый анализ. - Новосибирск: Наука, 1986. - 192с.

2. J-M Le Meins, L.M.D. Granswick, A. Le Beil. Results and conclusions of the internet based «Search/match round robin 2002» // Powder Diffraction - June 2003 - Volume 18, Issue 2, pp. 106-113.

3. Якимов И.С., Дубинин П.С., Пиксина О.Е. Регуляризация метода ссылочных интенсивностей для количественного рентгенофазового анализа поликристаллов // Журнал Сибирского федерального университета. Серия «Химия». - 2009. - Т. 2, №1. - С.71-80.

4. Yakimov I. S. System of X-Ray Identification of Substantially Multiphase Materials // Inorganic Materials. - 2008, -Vol. 44, -No. 14, -p. 54-58.

5. Search-Match Round Robin - 2002 // http://sdpd.univ-lemans.fr/smrr/results/

6. Мендельсон Э. Введение в математическую логику. - М.: Наука, 1984. - 300 с.

Query Language for X-Ray Powder Diffraction Phase Identification

Igor S. Yakimov

Siberian Federal University, 95 Krasnoyarskii Rabochii, Krasnoyarsk, 660025 Russia

The information storage and retrieval system of X-ray powder diffraction phase identification (Retrieve) identified all Search-Match Round Robin-2002 samples exactly. A base element of the system is a problem-oriented operator language of search queries for phase identification. The query language is described in detail and its identification possibilities are discussed.

Keywords: X-ray powder diffraction, qualitative phase analysis, XRD phase identification, quantitative phase analysis, reference intensity ratio method.

i Надоели баннеры? Вы всегда можете отключить рекламу.