ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
Сер. 4. 2010. Вып. 1
УДК 541.42
В. Б. Борисов, А. М. Киселёв, И. О. Конюшенко, В. М. Немец, Д. Д. Никеев
ИССЛЕДОВАНИЕ ОСОБЕННОСТЕЙ ФОРМИРОВАНИЯ И ВОЗМОЖНОСТЕЙ АНАЛИТИЧЕСКОГО ПРИМЕНЕНИЯ ОПТИЧЕСКИХ СПЕКТРАЛЬНЫХ ОБРАЗОВ ЖИДКИХ СМЕСЕЙ СЛОЖНЫХ СОЕДИНЕНИЙ
Введение. Применение методов распознавания образов во многих случаях позволяет существенно упростить задачу аналитического исследования жидких смесей сложных соединений (ЖССС), к которым, прежде всего, относятся такие важные во всех отношениях объекты как нефть и нефтепродукты. Именно для объектов этих классов входной аналитический контроль на технологических линиях их переработки, основанный на использовании классических физико-химических методов разделения и определения, связан с серьезными проблемами - он трудоёмок, сложен, длителен и дорогостоящий. Альтернативой может быть применение методов распознавания образов, которое позволяет заметно упростить решение задачи входного контроля таких объектов, поскольку не предполагает разделение объектов на компоненты или фракции и не требует покомпонентного измерения содержаний. В последние годы появились отдельные работы, посвящённые применению методов распознавания образов в решении аналитических задач, например [1, 2], однако в целом исследования и разработки в этом направлении пока ещё не приняли систематического характера.
Для успешного применения подобного подхода необходимы исследования оптимальных условий формирования спектроскопических образов объектов в каждом конкретном случае и возможных алгоритмов их математической обработки. В связи с этим задачей предлагаемой работы является проведение соответствующих исследований, обсуждение и иллюстрация возможностей применения их результатов на примере таких сложных ЖССС как моторные масла.
Сущность метода и основные представления. Основой группы методов распознавания образов во всех приложениях является понятие образа объекта исследования.
Понятие «образ объекта» имеет достаточно широкий смысл, что связано с обширным спектром направлений исследований, в которых применяются методы распознавания образов. В общем случае понятие «образ» характеризует совокупность информационных признаков настолько полную, что имеется возможность надёжно (с установленной вероятностью ошибки) различить между собой однородные объекты, составляющие класс. В аналитике под словом «класс» подразумевается группа объектов, как правило, однородных по составу (по крайней мере, по основным компонентам) или иным признакам, включающая в себя все объекты, идентичность контролируемого вещества одному из которых может быть установлена. Подчеркнём, что методы распознавания образов применяются для идентификации исследуемого объекта, т. е. установления идентичности его состава одному из известных веществ, составляющих класс.
При решении задачи идентификации того или иного объекта, т. е. установления его идентичности одному из объектов данного класса, построенного по некоторым их характерным признакам, в качестве последних могут фигурировать различные параметры. Например, класс могут образовать бензины одного производителя, но разных
© В. Б. Борисов, А. М. Киселёв, И. О. Конюшенко, В. М. Немец, Д. Д. Никеев, 2010
марок, или бензины одной марки, но разных производителей, конденсаты, моторные масла и др.
В случаях когда в качестве образа используется спектроскопическая информация, его информационными признаками могут быть значения интенсивности излучения на большом числе определённых длин волн, а также значения коэффициентов, характеризующих оптические свойства веществ (например, коэффициент поглощения). Следовательно, оптическим образом в данном случае может служить тот или иной спектр оптических характеристик объекта, зарегистрированный в достаточно широком диапазоне длин волн.
Безусловно, далеко не всякая оптико-спектральная характеристика объекта может являться его надёжным образом. Качество образа определяется, с одной стороны, его пригодностью к идентификации образа объекта внутри класса объектов, принятых за стандартные, а с другой стороны, минимальностью информационных признаков, составляющих образ. Так, при использовании в качестве образа нефтепродукта его спектральных характеристик требование минимальности числа признаков и надёжности идентификации приводят к необходимости выбора для формирования образа таких участков спектральной характеристики, различия в которых при переходе от образа к образу внутри класса объектов максимальны. Конкретный вид образа зависит не только от состава объекта, но и от условий формирования образа. Поэтому оптико-спектральный образ, т. е. сложный спектр, как единое целое, представляет собой образ объекта, взятого в конкретных условиях, сформированный в соответствии с конкретным методом, на конкретном приборном обеспечении. В процессе регистрации спектра должны контролироваться внешние и внутренние параметры объекта (температура, давление, влажность и др.). Кроме того, необходимым требованием к образу с аналитической точки зрения должна служить воспроизводимость образа в фиксированных условиях, а также его независимость (или известная зависимость) от времени. Итак, первым этапом аналитического процесса идентификации исследуемого объекта следует считать формирование оптико-спектрального образа одним из аналитических спектроскопических методов (эмиссия, поглощение, рефракция, флуоресценция и др.).
Говоря о методах математической обработки оптико-спектральных образов следует заметить, что при решении поставленной задачи формируемые образы объектов - веществ, составляющих класс, считаются реализациями многомерных случайных величин. Каждая из этих случайных величин отвечает одному из веществ класса и имеет собственные параметры распределения. В рамках используемой модели вид распределения для каждого из веществ класса считается нормальным.
Параметры нормального распределения (математическое ожидание и ковариационная матрица) могут быть оценены путём многократного формирования образа данного вещества, т. е. из нескольких реализаций одной случайной величины. На рис. 1 приведена иллюстрация для случая двух веществ и двумерного статистического пространства, т. е. образ
Рис. 1. Случай двух веществ и двумерного пространства
вещества представляет собой двумерный вектор вида (х1,Х2). По вертикальной оси отложена плотность распределения случайной величины. Сформированный образ идентифицируемого вещества в рамках метода является реализацией одной из случайных величин класса, т. е. относится к одному из известных веществ.
Задача процедуры математической обработки состоит в определении, к какой из случайных величин данная реализация относится с наибольшей вероятностью. Указанная процедура строится на понятии условной вероятности и формуле Байеса [3].
Введём следующие обозначения. Под X будем понимать образ неизвестного (идентифицируемого) вещества. Под событием ю* - событие идентичности неизвестного вещества г-му известному веществу - члену класса. Тогда определение конкретного значения г в вероятностном смысле строится на отыскании максимума условной вероятности р(ю^Х), что и решает задачу.
Согласно формуле Байеса
где р(Х|ю) - условная плотность вероятности, а р(Х) - плотность вероятности. Тогда указанная процедура сводится к поиску
Считая, что события юi равновероятны, а плотность вероятности р(Х) не зависит от г, можно ограничится поиском
Последним этапом является определение вероятности ошибки идентификации. Опустим ввиду значительного объёма детальное рассмотрение этого вопроса и ограничимся кратким изложением схемы. Процедура определения ошибки основана на вычислении границ областей условной вероятности в статистическом пространстве. Области определяются так, что попадание образа неизвестного вещества в г-ю область означает идентичность неизвестного образца г-му известному. Согласно теории математической статистики, ошибка идентификации составляет
Здесь п - количество членов класса (известных веществ). Выражение под знаком суммирования означает условную вероятность события «непопадания» образа неизвестного вещества в г-ю область при условии идентичности неизвестного г-му известному. Суммирование производится по всем членам класса.
Необходимым элементом метода распознавания образов является оптимизация размерности образа. С одной стороны, высокая размерность образа повышает его информативность и селективность, а следовательно, вероятность его надёжной идентификации. С другой стороны, чрезвычайно высокая размерность образа затрудняет построение систем математической обработки информации, увеличивает время работы обрабатывающих систем. Применительно к оптико-спектральному подходу образы объектов
Р(Ч1) =
шах{р(Х К)}.
могут иметь чрезвычайно высокую размерность, так как можно взять сколько угодно большое число точек на шкале длин волн (это число ограничивается разрешающей способностью и спектральным диапазоном). В таком случае для формирования образа априорно берётся избыточное число точек, а затем решается задача сокращения размерности образа до оптимальной. Оптимальной считается размерность, сведённая к минимуму, при условии, что при этом не произошло существенной потери информативности образа.
В данной работе для сокращения размерности оптико-спектральных образов применён известный метод главных компонент (МГК), представляющий собой способ выявления наибольших различий между объектами внутри класса. Смысл МГК может быть пояснен как поворот первоначального многомерного статистического пространства определённым образом. Первый орт нового базиса определяет направление, вдоль которого различия между образами максимальны из всех возможных. Второй орт определяет направление, вдоль которого различия максимальны из оставшихся после определения первого орта. Иными словами, первый орт новой системы наиболее информативен, второй - наиболее информативен после первого и т. д. Выбирая для дальнейшего рассмотрения определённое число ортов с последовательными номерами, можно сформировать пространство любой размерности, более низкой, чем первоначальная, и сохранить при этом наибольшее количество информации. Реально выбирается такое число ортов, при котором обеспечивается достаточно высокая вероятность взаимного соответствия различных образов, принадлежащих одному и тому же подклассу. И если такое достигнуто, то созданная аналитическая система и обеспечивающий её работу аппарат многофакторной математической статистики готовы для выполнения процесса идентификации объектов рассматриваемого класса.
В целом разработка аналитического подхода с использованием метода распознавания образов с целью идентификации веществ состоит в следующем.
1. С учётом особенностей решаемой конкретной задачи выбор способа формирования образов и варианта метода их распознавания.
2. Создание автоматизированной аналитической системы, способной формировать, хранить и сопоставлять образы различных веществ - объектов, принадлежащих к одному определённому классу, каждое из которых являет собой тот или иной подкласс.
3. Для выбранного класса объектов на основе установленной совокупности информационных признаков и их статистического разброса формируются образы каждого из объектов класса. Каждый из таких объектов условно определяется как стандартный, и его образ хранится в памяти аналитической системы.
4. В тех же условиях, на той же самой аналитической системе и по тому же методу формируется образ контролируемого объекта (неизвестного, но принадлежащего к данному классу в реальной аналитической задаче идентификации).
5. Образ контролируемого объекта сопоставляется с образами известных объектов - членов класса, хранящимися в памяти системы.
6. Формируется заключение в виде ответов на вопросы:
• какому объекту класса соответствует контролируемый;
• какова вероятная ошибка установленного соответствия.
Ниже иллюстрируется практическая применимость такого подхода для целей идентификации нефтепродуктов на примере моторных масел.
Создание методики идентификации моторных масел методом распознавания образов на основе абсорбционных оптико-спектральных измерений.
Применение изложенного выше подхода для идентификации образцов моторных масел
состоит, прежде всего, в исследовании оптико-спектральных особенностей отобранных условно стандартных объектов этого класса (класс - моторные масла). Затем следует разработка методики формирования абсорбционно-спектральных образов объектов этого класса, отработка процедуры оптимизации размерности образов, построение математического аппарата идентификации, создание действующего макета идентификационной аналитической системы и её испытания.
Реализация алгоритма включает:
1. Подборку максимально большого числа различных образцов моторных масел, являющихся условно стандартными объектами.
2. Абсорбционно-спектральные исследования отобранных образцов моторных масел с целью:
• определения областей спектра, обеспечивающих наиболее эффективные измерения;
• разработки методики формирования образов масел;
• оценки воспроизводимости формируемых образов;
3. Разработка на основе методов многомерной математической статистики (метод главных компонент) методики сокращения размерности образов с целью её оптимизации, обеспечивающей допустимое время работы систем, обрабатывающих результаты измерений.
4. Разработка математического аппарата идентификации образов с числом членов класса, равным числу отобранных «стандартных» образцов масел.
5. Создание аналитической автоматизированной идентификационной системы и её проверка на условно стандартных объектах.
6. Применение методики для идентификации моторных масел.
В исследованиях при реализации изложенного выше подхода в методе идентификации моторных масел использовался серийный прибор УВИ-спектрофотометр СФ-56 производства ЗАО «ОКБ СПЕКТР» (Санкт-Петербург). Спектры масел регистрировали с шагом 1 нм. Спектральная ширина щели спектрофотометра также 1 нм, динамический диапазон 100.
На рис. 2 приведены полученные спектры пропускания моторных масел в диапазоне длин волн от 300 до 1100 нм при использовании кювет различной толщины. Для сравнения был получен спектр подсолнечного масла (рис. 3).
Видно, что в ближней УФ-области наблюдается сильное поглощение. При увеличении длины волны отмечается монотонный рост прозрачности. Незначительные полосы поглощения наблюдаются в области от 850 до 1100 нм. С целью обеспечения максимальной информативности результатов исследования спектров они были сняты с использованием кювет различной толщины. Эксперимент показал, что поведение кривой пропускания у разных масел различный. Это, возможно, является отражением того, что они произведены по различным технологиям. Если сопоставить спектры пропускания моторных масел и спектр пропускания подсолнечного масла, можно отметить, что край полосы поглощения подсолнечного масла существенно смещён в УФ-область, а полосы поглощения, расположенные в ИК-области, находятся на разных длинах волн. Из этого можно сделать вывод о том, что спектральные полосы поглощения, расположенные в области 850-950 нм, характерны для нефтепродуктов.
Для оценки случайного разброса результатов эксперимента и последующей статистической обработки спектральных характеристик были измерены спектральные распределения коэффициента пропускания 12 образцов моторных масел. Для каждого
--- ТНК-супер моторное
— 5W-30 OilRight дизельное SAE 30
--- Shell моторное 15W-40
--- Lukoil моторное 15W-40
---Lukoil трансмиссионное TM-5
---Промывочное МПА-2
--- Luxoil моторное 15W-40
ТНК-супер моторное 5W-30 OilRight дизельное SAE 30
--- Shell моторное 15W-40
---Lukoil моторное 15W-40
Lukoil трансмиссионное TM-5 Промывочное МПА-2
--- Luxoil моторное 15W-40
ТНК-супер моторное 5W-30 OilRight дизельное SAE 30
--- Shell моторное 15W-40
--- Lukoil моторное 15W-40
Lukoil трансмиссионное TM-5 Промывочное МПА-2
Luxoil моторное 15W-40 ТНК-супер моторное 5W-30 OilRight дизельное SAE 30 Shell моторное 15W-40 Lukoil моторное 15W-40 Lukoil трансмиссионное TM-5 Промывочное МПА-2
Рис. 2. Спектр коэффициента пропускания в кювете:
10 мм (а); 4 мм (б); 2 мм (в), 0,2 мм (г); I — нормированная интенсивность
образца процедура измерения была повторена 10 раз, что в результате позволило получить 120 различных спектральных образов.
В полученном массиве из 120 распределений существуют два типа различий. Один из них обусловлен различиями в составе масел, и именно этот тип необходимо выделить при статистическом исследовании. Другой тип обусловлен экспериментальным разбросом результатов измерений. Наличие этого типа различия затрудняет статистический анализ распределения результатов в целом. Поэтому традиционное применение МГК ко всему массиву из 120 спектральных распределений приводит к смешению двух типов различий так, что отделить одно от другого невозможно.
Применённая в данном случае модификация МГК предполагает первоначальное усреднение спектральных распределений, относящихся к одному и тому же образцу. Система главных компонент выстраивается на усреднённых по каждому образцу данных (т. е. на 12 усреднённых образах), после чего проводится их отображение в результирующее пространство. Для иллюстрации работы описанной процедуры на рис. 4 приведён результат отображения в трёхмерное пространство образов трёх типов масел с учётом экспериментального разброса. Приведённая картина обладает наглядностью и позволяет сделать вывод о возможности разделения различных типов масел.
РС1
500
400 Ч
300
200 -
100 -
-100 -
200
300
400
500
О «£Р
X
■ Ладога дизель + Лукойл-стандарт минеральное ☆ Лукойл-супер 15W40 Ж Люксойл супер 15W40 Л Люксойл ТМ5 85W90 V ПТК-м5-10Г О ПТК^ЛЕ 20W30 <1 8Ье11-аопах-ТС-Т4 О She11-he1ix-p1us-10W40 ® She11-he1ix-super-10W40 18 She11-rimu1a-diese1 15W40 Я ТНК 10W30 X Условно неизвестный
Ж
<к^
-100
100
РС2
Рис. 5. Расположение образов известных масел и образа «неизвестного» масла на плоскости первых двух ГК
Результаты процедуры отображения образов всех 12 типов масел с учётом экспериментального разброса на плоскость первых двух главных компонент представлены на рис. 5.
Для тестирования описанного метода идентификации неизвестного образа были использованы образцы тех же масел, что и используемые для построения классификатора. Однако эти образцы были получены независимо и не входили в совокупность образцов, использовавшихся для построения системы МГК. На рисунке диагональным крестом отмечен образ условно неизвестного масла. В таблице приведены значения условной вероятности при соотнесении образа условно неизвестного образца с образами известных «стандартных» образцов.
Оценки условной вероятности
Номер образца Условная вероятность х10_|
1 106
2 5,1
3 19,7
4 9,1
5 53,1
6 103,7
7 56,7
8 42,0
9 14,9
10 7,0
11 27,6
12 31,5
0
Максимум значения условной вероятности наблюдается для образца № 1, что соответствует действительности. Ошибка идентификации в данном, достаточно простом случае составляет менее 1 %.
Полученные в целом результаты дают основание судить о возможности применения статистического метода распознавания образов в варианте МГК для решения задач идентификации нефтепродуктов. Описанный метод может быть применён для идентификации и других нефтепродуктов. В полной мере это относится к такому нефтепродукту как газовые конденсаты, для которых необходим быстрый, надёжный и автоматизированный входной контроль фракционного состава.
Литература
1. Доленко С. А., Гердова И. В. Лазерная флуориметрия смесей сложных соединений с использованием искусственных нейронных сетей // Квантовая электроника. 2001. T. 31. № 9.
C. 834-838.
2. Simon M. Scott, David James, Zulfegur Ali et al. Total luminescence spectroscopy with pattern recognition for classification of edible oils // Analyst. 2003. Vol. 128. P. 966-973.
3. Смирнов Н. В., Дудин-Барковский И. В. Курс теории вероятностей и математической статистики для технических приложений. М., 1969. 512 с.
Статья поступила в редакцию 9 октября 2009 г.