Информатика
УДК 681.5.01
Томакова Римма Александровна Rimma Tomakova
Филист Сергей Алексеевич Sergey Filist
МЕТОД ОБРАБОТКИ И АНАЛИЗА СЛОЖНОСТРУКТУРИРУЕМЫХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ ВСТРОЕННЫХ ФУНКЦИЙ СРЕДЫ MATLAB
METHOD AND ANALYSIS OF COMPLEX-STRUCTURED IMAGES PROCESSING ON THE BASIS OF BUILT IN FUNCTIONS OF ENVIRONMENT «MATLAB»
Приводятся алгоритмические решения, позволяющие обнаружить границу сегмента при минимальной априорной информации о структуре изображения и высоком уровне помех. Для сегментации и классификации форменных элементов крови используется синтез многоуровневых нейронных сетей.
Разработано программное обеспечение для интеллектуальной системы классификации форменных элементов крови
Ключевые слова: сегментация изображений, нейронные сети, ЯОБ-коды пикселей, спектральный анализ, алгоритмы, нечеткая логика, решающие правила
The work gives algorithmic decisions allowing detecting bounds of segment at minimal a priori information about image structure and high level of interferences. Synthesis of multilevel neuronic nets is being used for segmentation and classification of formed blood elements. There has been developed software for intelligent systems for classifi-cation of formed blood elements
Key words: segmentation of images, neuronic nets, RGB-codes of pixels, spectrum analysis, al-gorithms, indistinct logic, decisive rules
Работа выполнена в рамках реализации Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009 — 2013 годы (контракт № 424).
Решение задач в области цифровой обработки изображений требует большого объема экспериментальных исследований, в которых используются специализированные алгоритмы и многократное тестирование с привлечением большой базы изображений из предметной области исследования. По-
этому выбор гибкой и всеохватывающей среды для разработки конкретных приложений является ключевым фактором, который существенно влияет на цену и время разработки программного обеспечения.
Многие изображения не имеют четкого морфологического описания сегментов и относятся к классу сложноструктуриру-емых изображений. При этом сложности структурирования таких изображений обусловлены как природой самого изображения, так и зашумленностью изобра-
жений с четко выраженной структурой. Часто изображения получают в условиях различной освещенности, как всего изображения, так и его частей. Также возникают ситуации, когда сегменты, относящиеся к одному и тому же классу, на различных изображениях имеют различную цветовую окраску. Во многих случаях сложности при сегментации изображения обусловлены тем, что объемные изображения с явно выраженными сегментами проецируются на двумерную плоскость, проекции сегментов накладываются друг на друга, при этом образуются псевдосегменты или искаженные сегменты, что приводит к снижению качества априорных данных.
Наиболее типичным примером сегментации сложноструктурируемых изображений является задача определения межклеточных соотношений в мазках периферической крови. Автоматизация этого процесса затруднена как различным окрасом мазков крови, так и объемной струк-
турой форменных элементов крови, благодаря которой создаются специфические помехи сегментации при проецировании форменных элементов на плоскость изображения.
На рис.1 представлено изображение микроскопической фотографии мазка крови и две гистограммы. Первая гистограмма показывает распределение О-кодов пикселей изображения по всему изображению (рис.1, а), а вторая — по отдельным форменным элементам (Л — лейкоциты, Э -эритроциты) и плазме (п) (рис. 1, а; б). Если на второй гистограмме в диапазоне значения кодов 150...200 пиксели отсутствуют, то на первой гистограмме в этом диапазоне находится значительная часть пикселей. Учитывая, что такая же картина наблюдается и для кодов И и В, можно сказать, что в пространстве ИОВ-кодов наблюдается значительное пересечение классов форменных элементов.
а)
б)
в)
Рис. 1. Изображение микроскопической фотографии мазка периферической крови, окрашенного по Романовскому - Гимзе (а), гистограмма G-кодов пикселей изображения (б), гистограммы G-кодов пикселей для двух форменных элементов и
плазмы (в)
Таким образом, классифицирующие системы, построенные только на анализе ИОВ-кодов, не позволяют обеспечить приемлемую точность классификации форменных элементов. В связи с этим для классификации форменных элементов крови предложена двухканальная нейронная сеть со структурой блочной нейронной сети на
входе. Причем в одном канале осуществляется классификация форменных элементов на основе их геометрических признаков, а во втором канале выполняется анализ цветности. На рис. 2 представлена структура такой нейронной сети, предназначенная для бинарной классификации форменных элементов.
Рис. 2. Структурная схема соединения нейронных сетей для классификации форменных элементов крови
Программное обеспечение для интеллектуальной системы классификации форменных элементов крови выполнено в среде Matlab R2010a в виде модуля untitled и использует следующие пакеты этой программной среды: Image Processing Toolbox и Neural Network Toolbox [1].
Структурная схема функционального взаимодействия разработанных программных модулей представлена на рис. 3. В процессе работы программного модуля автоматически формируется база данных, состоящая из четырех блоков: первый представляет базу изображений (в формате *.bmp, *.jpg, *.tif), по которым проводится процесс обучения или классификации; второй — базу моделей нейронных сетей (МНС) (в формате *.mns), предназначенных для сегментации изображений; третий - базу моделей нейронных сетей (МНС) (в формате *.mns), предназначенных для классификации сегментов изображения; четвертый — базу обучающих выборок (в формате *.xls).
База изображений содержит изображения, которые необходимо либо анализировать (определить количество лейкоцитов и эритроцитов, присутствующих на них) , либо изображения, предназначенные для формирования обучающих выборок.
Изображения, представленные в этой базе (формат *.bmp, *.jpg, *.tif), являются цветными изображениями микроскопической фотографии мазков крови. Для анализа изображение выбирается из этой базы. Чтобы перейти к анализу форменных эле-
ментов крови, анализируемое изображение необходимо сегментировать, то есть обнаружить все форменные элементы крови на изображении и представить их пиксели «единицами», а пиксели сегментов изображения, не относящихся к форменным элементам крови, представить «нулями». Эта процедура соответствует маршруту «2», показанному на рис. 3. Если требуется препарирование анализируемого изображения, то выбирается маршрут «1». После выполнения процедур препарирования, обработка продолжается по маршруту «2».
После процедуры сегментации выбранного изображения осуществляется препарирование сегментированного бинарного изображения посредством модуля морфологической обработки. На выходе этого модуля получаем изображение границ выделенных сегментов, которое поступает на вход морфологического спектрального анализатора, где и формируются информативные признаки по каналу «геометрия». Кроме этих двух маршрутов обработки данных, предусмотрен маршрут «3», которым можно воспользоваться в случае, если обрабатываемое исходное изображение уже было сегментировано и в базе данных хранится файл с сегментированным изображением, который имеет то же имя, что и анализируемое изображение. В этом случае этот файл из базы изображений поступает непосредственно на морфологический спектральный анализатор, принцип работы и структура которого подробно рассмотрена [2].
исходное изображение *.Ьтр, *Ж
І. І
• V
Предварительная обработка изображений (пространственная, частотная фильтрация и т.д)
Программный модуль морфологической обработки изображений
обработанное
^ обработанное ^ изображение
бинарное
изображение
бинарное
изображение
Программный модуль сегментации изображений мазков крови
БАЗА ДАННЫХ
Мпш
База моделей нейронных сетей для сегментации
Программный модуль морфологического спектрального анализа
Спектральные
коэффициенты
Программный модуль классификации форменных элементов крови
^jpg, *.Ьтр,
База изображений
Мпш
База моделей нейронных сетей для классификации
“.хк
База обучающих выборок
Рис. 3. Структурная схема функционального взаимодействия разработанных программных модулей
Все три маршрута обработки данных заканчиваются модулем классификации форменных элементов крови, с выхода которого считываются межклеточные соотношения в мазке.
В случае обучения модулей сегментации и классификации выходными данными являются модели нейронной сети, которые поступают с соответствующих программных модулей в базы моделей нейронных сетей.
Процесс анализа мазка крови описывается алгоритмом, схема которого представлена на рис. 4.
Процесс анализа начинается с загрузки анализируемого изображения из базы изображений. Интерфейсное окно автоматизированной системы анализа после загрузки изображения из базы изображений показано на рис. 5, в системе раскрывающихся вертикальных меню выбирается маршрут анализа изображения (блок 3).
Если в базе изображений отсутствует сегментированное изображение для анализа, то необходимо перейти на блоки 6-9.
Если сегментированное изображение имеется, то переход на блок 10, в котором выполняется спектральный анализ границ сегментов анализируемого изображения.
Для сегментации изображения необходимо загрузить нейросетевую модель, выполняющую процедуру сегментации на основе анализа ИОБ-кодов пикселей. Модель выбирается на основе анализа цветового окраса микрофотографии путем сравнения его с окрасами, хранящимися в базе моделей (блок 7). После выполнения сегментации (блок 8) выделяются границы сегментов. Эту операцию реализует блок 9 морфологической обработки.
Анализ загруженного изображения производится по двум каналам согласно схеме, представленной на рис. 2. Для обеспечения входными данными канала «геометрии» выполняется морфологический спектральный анализ в блоке 10. Выбрав класс форменных элементов крови ( блок 11), осуществляем загрузку соответствующей нейросетевой модели из базы моделей. Критерием выбора модели служит класс форменных элементов крови и цветовой
окрас микрофотографии мазка крови.
В блоках 15-17 выполняется непосредственная классификация форменных элементов крови, причем основным блоком классификации является блок 17, а блоки 15 и 16 являются отладочными и служат для контроля и настойки каналов «геометрия» и «цвет».
На выходе системы (блок 16) присутствуют либо количество форменных элементов, либо межклеточные соотношения. Если необходимо вывести межклеточные соотношения, то процесс должен быть запущен дважды: для лейкоцитов и эритроцитов. Эта процедура реализуется посредством блока 20. Блоки 19 и 21 используются в режиме настройки.
Таким образом, алгоритм автоматизированного анализа изображения микроскопической фотографии мазка крови позволяет адаптировать классифицирующую модель к анализируемому изображению, по меньшей мере, по двум контурам управления, и позволяет определить количество форменных элементов крови заданного класса с точностью не менее 95 %.
Разработанное специализированное программное обеспечение предназначено для автоматизированного анализа микроскопических фотографий сложнострукту-рируемых изображений и реализовано в среде МаИаЬ 7.10. Оно отличается функциональной последовательностью включения каждого модуля в технологический процесс гематологического анализа и гибким управлением процессом интерактивного взаимодействия программного обеспечения, предназначенного для обучения решающих модулей с лицом, принимающим решение. Интерактивное взаимодействие осуществляется посредством интерфейсных окон и всплывающих меню. Оно позволяет реализовать процессы сегментации и классификации сложноструктурируемых изображений на основе полного технологического цикла синтеза многоуровневых моделей нейронных сетей, включающего процессы формирования обучающих выборок, вычисления параметров нейронных сетей и определения диагностической эффективности, полученных решающих правил.
Начало
Рис. 4. Схема алгоритма автоматизированного анализа мазка крови
TÜ ифровал обработка изображений в среде MATLAB
файл методы обработки изображений помощь
детектор краев ►
Рис. 5. Интерфейсное окно автоматизированной системы гематологического анализа
Литература
1. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB. — М.: Техносфера, 2006. — 616 с.
2. Филист С.А., Томакова Р.А., Горбатенко С.А., Швецова Н.А. Анализ гистологических изображений посредством морфологических операторов, синтезированных на основе преобразования Фурье и нейросетевого моделирования // Биотехносфера. — № 3 (10). — 2010. — С. 54-60.
Коротко об авторах_______________________________
Томакова Р. А., канд. техн. наук, доцент, докторант кафедры биомедицинской инженерии, ЮгоЗападный государственный университет 1ошакоуа@ rambler.ru
Научные интересы: распознавание образов, обработка изображений, принятие решений. Методы системного анализа, управления и обработки информации
Филист С.А., д-р техн. наук, профессор кафедры биомедицинской инженерии, Юго-Западный государственный университет [email protected]
Научные интересы: распознавание образов, обработка изображений, принятие решений
_____________________Briefly about the authors
R. Tomakova, Candidate of Technical Sciences, assistant professor, Biomedical Engi-neering department, South-West State University
Scientific interests: image recognition, processing of images, decisions making
S. Filist, Doctor of Technical Sciences, Biomedical Engineering department, South-West State University
Scientific interests: image recognition, processing of images, decisions making