Научная статья на тему 'Обработка инфракрасных спектров и спектров комбинационного рассеяния с помощью программного комплекса, созданного в среде Wolfram Mathematica'

Обработка инфракрасных спектров и спектров комбинационного рассеяния с помощью программного комплекса, созданного в среде Wolfram Mathematica Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
779
82
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИК СПЕКТРОСКОПИЯ / КР СПЕКТРОСКОПИЯ / ОБРАБОТКА СПЕКТРОВ / WOLFRAM MATHEMATICA / IR SPECTROSCOPY / RAMAN SPECTROSCOPY / SIGNAL PROCESSING OF SPECTRA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зайцев Евгений Владимирович

Формы инфракрасных спектров и спектров комбинационного рассеяния часто имеют вид, затрудненный для непосредственной визуальной и количественной интерпретации: характеристические пики, находящиеся рядом, могут сливаться, образуя один или несколько уширенных асимметричных пиков, которые необходимо разделить; спектры могут содержать высокочастотные шумы, которые необходимо удалить; для правильной количественной интерпретации спектров (интегральная площадь пиков, полуширина на половине амплитуды и др.) необходимо вычитать из них базовую линию. Всё это удобным образом позволяет делать программа, работа которой описывается в данной работе.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Зайцев Евгений Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SIGNAL PROCESSING OF INFRARED AND RAMAN SPECTRA USING WOLFRAM MATHEMATICA SOFTWARE

Raw real forms of IR or Raman spectra are often difficult for immediate visual and quantitative interpretation: the characteristic adjacent peaks could merge, forming one or several broadened asymmetric peaks, which should be separated; spectra may contain high-frequency noise that should be removed; for a correct quantitative interpretation of the spectra (the integral area of the peaks, half-width at half-amplitude, etc.), it is necessary to subtract the baseline from them. All these possibilities are included in software described in this work.

Текст научной работы на тему «Обработка инфракрасных спектров и спектров комбинационного рассеяния с помощью программного комплекса, созданного в среде Wolfram Mathematica»

УДК 004.428.4; 544.08 Зайцев Е.В.

ОБРАБОТКА ИНФРАКРАСНЫХ СПЕКТРОВ И СПЕКТРОВ КОМБИНАЦИОННОГО РАССЕЯНИЯ С ПОМОЩЬЮ ПРОГРАММНОГО КОМПЛЕКСА, СОЗДАННОГО В СРЕДЕ WOLFRAM MATHEMATICA

Зайцев Евгений Владимирович, аспирант факультета информационных технологий и управления; e-mail: gliese3@gmail.com;

Российский химико-технологический университет им. Д.И. Менделеева, Москва, Россия 125480, Москва, ул. Героев Панфиловцев, д. 20

Формы инфракрасных спектров и спектров комбинационного рассеяния часто имеют вид, затрудненный для непосредственной визуальной и количественной интерпретации: характеристические пики, находящиеся рядом, могут сливаться, образуя один или несколько уширенных асимметричных пиков, которые необходимо разделить; спектры могут содержать высокочастотные шумы, которые необходимо удалить; для правильной количественной интерпретации спектров (интегральная площадь пиков, полуширина на половине амплитуды и др.) необходимо вычитать из них базовую линию. Всё это удобным образом позволяет делать программа, работа которой описывается в данной работе.

Ключевые слова: ИК спектроскопия, КР спектроскопия, обработка спектров, Wolfram Mathematica.

SIGNAL PROCESSING OF INFRARED AND RAMAN SPECTRA USING WOLFRAM MATHEMATICA SOFTWARE

Zaytsev E.V.

D. Mendeleev University of Chemical Technology of Russia, Moscow, Russia

Raw real forms of IR or Raman spectra are often difficult for immediate visual and quantitative interpretation: the characteristic adjacent peaks could merge, forming one or several broadened asymmetric peaks, which should be separated; spectra may contain high-frequency noise that should be removed; for a correct quantitative interpretation of the spectra (the integral area of the peaks, half-width at half-amplitude, etc.), it is necessary to subtract the baseline from them. All these possibilities are included in software described in this work.

Keywords: IR spectroscopy, Raman spectroscopy, signal processing of spectra, Wolfram Mathematica.

Введение

Взаимодействие вещества с электромагнитным излучением в спектроскопических измерениях (в частности, в ИК и КР спектроскопии) часто носит сложный комплексный характер, который осложняет разделение пиков, отвечающих за тот или иной характеристичный энергетический переход. Это вызвано как фундаментальными свойствами материи (особенности энергетических переходов в молекулах, тепловое движение молекул и др.), так и конструктивными особенностями приборов и условий снятия спектров (шумы, выбросы и т.д.). Благодаря этому для правильной качественной и количественной интерпретации спектров

необходима их постобработка. Для постобработки спектров была написана программа в среде Wolfram Mathematica.

Описание работы программы

Основные возможности программы включают в себя: импорт спектров (поддерживаются форматы XLS, XLSX, CSV, TSV, DAT и др.), выбор интересующего диапазона спектров (фильтрация по диапазону), частотная фильтрация спектров, построение и вычет базовой линии, аппроксимация спектров с помощью гауссиан или лоренциан и получение их спектров. Все эти возможности дополняются построением множества цветных информативных графиков. Далее кратко будет рассмотрена работа программы по перечисленным выше пунктам.

Импорт спектров. Программа написана в среде Wolfram Mathematica (язык Wolfram Language), однако таким образом, чтобы ей можно было пользоваться, не владея навыками

программирования в данной среде. Необходимо уметь только менять значения тех или иных параметров (как в любом языке программирования) и понять главный принцип вычислений в программе: вычисления ведутся с помощью интерпретатора (ядро) в отдельных блоках программы - ячейках. Чтобы вычислить выражения в ячейке необходимо перевести в неё курсор или выделить её и нажать комбинацию клавиш Shift-Enter. Соответственно, чтобы импортировать спектр достаточно вставить путь в функцию импорта и вычислить ячейку (рис.1).

Initialization

Manual functions Import raw .xlsx file

Basic plot (additional)

Filtration by range

Filtration by frequency (additional)

Baseline manipulation

Approximation

Рис.1. Общий вид программы

Фильтрация спектров. Если импортируемые спектры содержат ярко выраженный высокочастотный шум, то его можно попытаться удалить с помощью функции фильтрации спектров. В функцию заложены стандартные алгоритмы фильтрации: скользящее среднее и фильтры низких частот с различными окнами. Изменение формы спектров при изменении параметров методов можно интерактивно наблюдать в реальном времени.

Построение базовой линии. Для правильной количественной интерпретации спектров

необходимо из них вычесть "фон" - базовую линию. Для её построения в программе используется алгоритм SNIP (Statistics-sensitive Nonlinear Iterative Peak clipping) [1]. На рисунке 2 представлен пример его работы.

Рис.2. Примеры графиков исходного ИК спектра (1), базовой линии (2) и спектра за вычетом базовой линии (3); Б - оптическая плотность, V - волновое число

Аппроксимация спектров. В настоящий момент для аппроксимации спектров можно на выбор использовать базисный набор гауссиан в форме

a exp

f (x - b)2 ^

или лоренциан в форме

(x - b)2 + с

где a, b, с - параметры оптимизации.

Начальная размерность базиса, а также начальные значения параметров пиков для аппроксимации определяются автоматически по числу найденных пиков. В дальнейшем при необходимости его можно вручную расширить. После того как окончательно сформирован базисный набор функций для аппроксимации, решается задача оптимизации методом Левенберга-Марквардта или аналогичным (присутствует возможность выбора). Если результаты аппроксимации получаются удовлетворительными, то можно сохранить полученный набор гауссиан или лоренциан в удобном для чтения формате (DOC, DOCX, PDF, JPEG), а также получить графики их спектров по амплитуде. Далее по известным формулам легко определяются параметры пиков (интегральная площадь и полуширина на половине амплитуды),

которые коррелируют с химическими параметрами системы (свойства растворителя, концентрация и др.). Результаты примера аппроксимации приведены на рисунке 3.

Рис.3. Аппроксимация спектров: а - исходный ИК спектр (1) и результаты его аппроксимации суммой гауссиан (2); б - амплитудный спектр полученной суммы гауссиан; a -амплитуда гауссианы; b - параметр сдвига

Выводы

Программа использовалась для обработки ИК и КР спектров, однако нет существенных препятствий для её использования для обработки любых других спектров, пики которых нужно разделить. Основная проблема заключена в этом случае в построении базовой линии, которая правильно бы отражала реальный "фон" - физико-химические особенности получения спектров. Недостатком программы является невозможность её использования без платной среды Wolfram Mathematica (или Wolfram Cloud).

Автор благодарит Градову М.А. (ИХФ им. Н.Н. Семенова) за предоставленную консультацию, касающуюся особенностей получения и интерпретации ИК спектров.

Список литературы

1. Morhäc M., Matousek V. Peak clipping algorithms for background estimation in spectroscopic data // Appl. Spectrosc. 2008. V. 62. № 1. P. 91-106.

c

a

i Надоели баннеры? Вы всегда можете отключить рекламу.