УДК 004.93
СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ БИОЛОГИЧЕСКИХ ТКАНЕЙ: ПРОБЛЕМЫ ПОСТРОЕНИЯ ПРИЗНАКОВ
Г.М.Емельянов, С.Г.Середа*, М.Г.Даниловских
SEGMENTATION OF IMAGES OF BIOLOGICAL TISSUES: PROBLEMS OF FEATURES CONSTRUCTION
G.M.Emel'ianov, S.G.Sereda*, M.G.Danilovskikh
Институт электронных и информационных систем НовГУ, [email protected] *Северный филиал МГУТУ, Великий Новгород
Работа посвящена проблеме сегментации изображений по сложным условиям семантической однородности в задаче анализа воздействия электромагнитного излучения на биологические ткани. Обсуждается роль признаков в задаче сегментации изображений биологических тканей. Рассматривается задача построения оптимального решающего правила для сегментации текстурного изображения по заданному декларативному описанию требуемого результата. Описан ряд методов для снижения ее вычислительной сложности. Некоторые из них требуют получения априорных оценок величины выделяемых сегментов. Такая возможность характерна для потоков однотипных изображений. Описанный подход применим также для поиска на изображении объектов с заранее известной структурой.
Ключевые слова: сегментация изображения, семантическая однородность, решающее правило, декларативное описание, мера близости
The problem considered is image segmentation with respect to complex conditions of semantic homogeneity relatively to the analysis of impact of electromagnetic radiation on biological tissues. Here we discuss the role of features in the segmentation problem for images of biological tissues. The problem of constructing an optimal decision rule for segmentation of a texture image according to the declarative description of required result is considered. We present a number of methods for reducing its computational complexity. Some of them require a priori estimates of the size of isolated segments. This is typical for the streams of similar images. The presented approach can also be applied to the search of objects with prescribed structure on an image.
Keywords: image segmentation, semantic homogeneity, decision rule, declarative description, affinity measure
Введение
В настоящее время одни из самых трудоемких задач анализа экспериментальных данных связаны с переработкой визуальной информации в больших объемах. К числу таких задач относятся обработка, анализ и понимание изображений биологических тканей, полученных с микроскопа.
Как известно, регулярное воздействие электромагнитных (ЭМ) излучений оптического диапазона во многом определяет функциональное состояние организма и его физиологической адаптации. Значительный экспериментальный и теоретический материал, накопленный к настоящему времени, свидетельствует о том, что в биологических тканях под влиянием ЭМ-излучений реализуются многие эффекты, известные в физике и связанные с поляризацией, прямой и отрицательной проводимостью биологических структур, генерацией собственных ЭМ-колебаний, пьезоэффекта-ми, фотопроводимостью и др.
Биологический организм представляет собой сложную систему, состоящую из многих органов и подсистем, которые в течение жизни согласованно работают при изменениях внутренних и внешних условий, адекватно реагируя на них. Поэтому функционирование биосистемы возможно лишь при наличии развитых информационно-управляющих систем. В этих условиях сложная внутренняя структура выделяемой области на изображении не позволяет решить задачу сегментации с помощью какого-то одного известного алгоритма.
Обучение сегментации изображения по локальным данным
Сегментация представляет собой задачу разбиения изображения на семантически однородные области. Классические подходы к сегментации (по яркости, цвету, отчетливо выраженной границе) хорошо работают для естественных сцен. В случае тек-стурированных изображений, к числу которых относятся получаемые с микроскопа изображения клеток биологических тканей, подобные методы перестают срабатывать. Для текстур характерно наличие множества границ и перепадов в семантически однородной области. Поэтому сегментация таких изображений требует применения специальных методов.
Существует множество текстурных признаков и алгоритмов для их оценки. В работе [1] было показано, что надежное обучение в задаче сегментации текстур возможно лишь с привлечением априорной
информации о степени значимости различимых признаков. Такая информация может привлекаться неявно, в виде ограничений на тип обрабатываемого изображения, или явно (как элемент декларативного описания выделяемого сегмента).
В работе [2] была предложена модель такого описания в виде графа «сегментов-отношений», а также описаны методы построения на ее основе решающего правила. В ходе дальнейших исследований авторов модель была оптимизирована. Граф стал однодольным вместо двудольного, дуги нагружены информацией об отношениях между сегментами, а вершины — информацией о соответствии сегментов диапазонам признаков [3]. На рис.1 показан пример описания сегмента.
сегмент
7 S
состоит из состоит из
Рис.1. Пример описания сегмента
Рассмотрим теперь случай, когда сегментация проводится по локальным данным. Это означает, что решение о принадлежности точки к конкретному сегменту принимается на основании анализа некоторой фиксированной окрестности (опорного множества). На практике чаще всего используются прямоугольные окрестности. В такой постановке задача сегментации полностью идентична задаче распознавания образов. Традиционный способ обучения в распознавании образов — задать обучающую выборку. Рассмотрим возможности его применения в задаче сегментации изображений биологических тканей.
Назовем совокупность информации во всех точках окрестности информационным вектором. Если каждая точка изображения кодируется с помощью q бит, то этот вектор может принимать до 2q возможных значений, поскольку все биты, относящиеся к описанию точек окрестности, являются различимыми. Таким образом, даже для сравнительно
небольшой окрестности размером 7 на 7 точек мы можем получить 10354 различимых состояний.
С формальной точки зрения задача обучения сегментации будет эквивалентна построению функции, которая переводит множество значений информационного вектора во множество номеров сегмента (рис.2а). Естественно, что задать такую функцию методом прямого перечисления не представляется возможным.
Информационный вектор
№ сегмента
а)
Информационный Значение
вектор —1/ признака
№ сегмента
Рис.2. Задача обучения сегментации
Можно попытаться использовать обучающую выборку, когда пользователь проводит сегментацию одного или нескольких изображений вручную. Однако размер такого изображения составляет порядка 104 точек, что даже отдалённо не может сравниться с множеством допустимых значений.
С другой стороны, задача сегментации эквивалентна задаче распознавания образов, где обучающая выборка в 1000 объектов уже вполне достаточна. Множество же допустимых значений в пространстве признаков, строго говоря, вообще бесконечно. Однако в пространстве признаков существует метрика. Здесь близость двух образов можно оценить численно. Это позволяет по обучающей выборке провести разграничение всего пространства и определить диапазон значений для каждого класса образов.
«Естественные» меры близости для локальных окрестностей
В общем случае критерий однородности для выделяемого сегмента может быть произвольным. Простой пример на рис.3 показывает, что мера сходства двух участков изображения, будучи «естественной» в одних условиях, в других может и не работать.
Рис.3. Сходство участков изображений: контрпример для текстур
Чаще всего на роль естественной меры сходства претендует средняя яркость. В приведенном на рис.3 примере средняя яркость одинакова для фрагментов (б), (в) и (г), однако с точки зрения наблюдателя они явно различны. Другая «естественная» мера сходства — суммарная разность яркостей в одинаковых точках сравниваемых фрагментов. В нашем случае она составляет 100% от максимальной для фрагментов (а) и (б) и лишь 50% для фрагментов (в) и (г). Но фрагменты (а) и (б) кажутся наблюдателю почти одинаковыми, что противоречит его здравому смыслу. Можно привести еще много примеров иллюстрации невозможности найти универсальную меру близости для локальных окрестностей.
Роль признаков в задаче сегментации
Если на множестве значений информационного вектора мера близости априорно не задана, это делает невозможным применение стандартных методов машинного обучения.
Проблема заключается в том, что слишком велико число различимых способов, которыми можно задать подобную меру на множестве локальных окрестностей. Попытаемся оценить это для упрощенного случая — когда все элементы множества просто нумеруются. Получаем п! способов, которыми можно разместить элементы множества по ячейкам натурального ряда. А поскольку значение п для окрестности 7 на 7 точек составляет 10354, то оцениваемая величина будет не меньше, чем (10354)!.
Если оценивать число различимых признаков, которые возможны для такой окрестности, то оно будет еще больше. Признак — это функция, которая переводит исходный информационный вектор в некоторое множество значений. Отметим, что не каждая такая функция является признаком. Обычно используется следующая терминология:
— предикат — множество значений бинарное;
— атрибут — на множестве значений может не быть меры близости;
— признак — на множестве значений есть мера близости.
Причем множество значений признака может быть и многомерным (цвет, форма и т.д.). Отсюда видно, что главный эффект от использования промежуточного преобразования с помощью признака достигается за счет того, что в области значений признака можно задавать диапазоны, каждый из которых соответствует заданному сегменту (рис.2б).
Методы оптимизации решающего правила
В случае наличия в описании сегмента нескольких взаимосвязанных элементов и условий (рис.1) имеется свобода выбора последовательности, в которой эти условия будут проверяться. Рассмотрим основные идеи, положенные в основу алгоритмов оптимизации решающего правила.
б
а
г
в
Каждому из алгоритмических блоков можно приписать определенный коэффициент вычислительной сложности, т.е. число операций на проверяемый элемент изображения. Например, проверка для точки условия «красный цвет» оказывается намного проще, чем проверка условия «зернистая текстура». При отсутствии возможности оценить число элементов, отбрасываемых при каждой проверке, рациональнее сначала проверить то условие, которое требует меньших вычислительных затрат. Если обрабатывается поток однотипных изображений, подобная оценка может быть проведена. В этом случае из двух условий выбирается то, которое позволяет отбросить наибольшее число операций. Если W1 и — коэффициенты сложности для 1-го и 2-го алгоритмов, а N и N — число отбрасываемых ими точек, то для выбора первого алгоритма необходимо, чтобы
N»1 - < NW2 - N Щ, где N — начальное число точек. В любом случае по суммарной вычислительной сложности последовательная схема, где при второй проверке учитываются результаты предыдущей, оказывается более оптимальной, чем квазипараллельная, где каждое из условий проверяется независимо и затем выполняется поиск пересечения найденных сегментов.
Из рассмотренного правила есть одно любопытное следствие. Если алгоритм проверки некоторого условия достаточно трудоемок (»2), но существует другое условие, необходимое для его выполнения и проверяемое с меньшими вычислительными затратами (»1), то может оказаться выгодным добавить в решающее правило такую проверку перед проверкой основного условия. Для этого необходимо, чтобы
NW2 >N»1 -
В качестве «ослабленного условия» для оценки текстуры можно использовать допустимую палитру, для полного описания формы области — ее размер и т.д.
Немаловажную роль для оптимизации решающего правила играет и выбор стратегии перебора. Обычно проверяются все точки изображения. Такую стратегию можно назвать сплошной. Если же из декларативного описания известны геометрические размеры и форма элемента выделяемой текстуры, то можно применить стратегию разреженного поиска, т. е. провести предварительный поиск точек с допустимой палитрой в узлах некоторой сетки сканирования. Шаг для такой сетки определяется по размерам максимально вписанного в фигуру прямоугольника, если фигура имеет четкую ориентацию. Если заранее известной ориентации нет, то шаг определяется как квадратный корень из диаметра максимальной вписанной в фигуру окружности (рис.4).
Рис.4. Сведение к задаче поиска вписанной окружности максимального радиуса
Области с допустимой палитрой, которые не попали в узлы такой сетки, явно имеют слишком малый размер. А из точек, которые оказались выбранными, запускается алгоритм поиска по данному условию.
Иногда текстурный элемент сам имеет сложную внутреннюю структуру. Таковыми являются и клетки тканей на получаемых с микроскопа изображениях биологических препаратов. В таком случае можно говорить об иерархической текстуре. Для нее может быть проведено предварительное сканирование изображения сразу по нескольким условиям. Определив точки, где одновременно выполняются все необходимые условия, бесперспективные области можно отбросить. Описанный подход прост и эффективен для поиска на изображениях объектов с заранее известной структурой.
Экспериментальные исследования
В качестве объекта экспериментального исследования в настоящей работе была выбрана биологическая система цыплят-бройлеров, предметом изучения было энергоинформационное воздействие низкоинтенсивного сканирующего лазерного излучения (НИСЛИ). Выбор объекта исследования обусловлен тем, что цыплята-бройлеры являются удобной моделью для изучения механизмов действия факторов физической природы и позволяют с высокой степенью достоверности регистрировать биологическое действие оптического излучения. Проведенные эксперименты показали, что определив соответствующие параметры режима облучения, можно целенаправленно воздействовать на отдельные органы и системы биообъекта.
Рис.5. Структурная схема функционирования программного комплекса
Рис.6. Пример исходного изображения и результатов сегментации: а — исходное изображение; б — результат сегментации по средней яркости и цветовому тону
C:\2.imgMl лазмоцит.Ьшр
Инструмент Вид Сохранить
Ж5Ж
0
М*
ф
Инструмент Вид Сохранить
а
Ф
A o|o|fo cif
б
а
Было проведено исследование эффекта, проявляющегося в резком изменении термодинамических и релаксационных параметров внутриклеточных компонент тканей птицы. Более подробно результаты исследований отражены в работах [4-6]. При проведении экспериментов был задействован разработанный С.Г.Середой специализированный программный комплекс (рис.5) сегментации изображений по сложным условиям семантической однородности, более детально рассмотренный в [3].
На рис.6а приведено исходное изображение, на рис.6б — результат выделения на нем сегмента по совокупности условий - цветовому тону и средней яркости по окрестности 3 на 3 пикселя.
Результаты экспериментов подтвердили гипотезу об информационно-энергетическом характере воздействия НИСЛИ на биосистему цыплят-бройлеров. При этом величина ответной реакции биосистемы непропорциональна поглощенной дозе и определяется в основном длительностью светового воздействия.
В результате испытаний были экспериментально подтверждены два основных вывода:
— выделяемый сегмент не изменяется от применения к решающему правилу любого из предложенных оптимизационных методов;
— суммарное время выполнения оптимизированного решающего правила оказывается меньше времени выполнения исходного решающего правила.
Заключение
Главная проблема при обучении сегментации изображений по локальным данным — выбор меры близости для локальных окрестностей. При разработке реальных систем сложные условия сегментации обычно сводятся к комбинации простых, хорошо воспринимаемых и интерпретируемых пользователем признаков.
Тема отдельного рассмотрения — определение нечеткой функции принадлежности заданному диапазону признака. На текущем этапе исследований это не было сделано не столько из-за трудностей теоретического плана, сколько из-за сложностей создания визуального интерфейса для задания таких «нечетких» диапазонов.
Работа поддержана Минобрнауки РФ (базовая часть госзадания).
1. Sereda S.G., Guzeev S.A., Emeljanov G.M. Interactive Learning in Texture Segmentation // Pattern Recognition and Image Analysis. 1996. Vol.6. №1. P.67-68.
2. Sereda S.G., Guzeev S.A., Emeljanov G.M. Modeling of Hierarchical Textures and Synthesis of Algorithms for Their Segmentation // Pattern Recognition and Image Analysis. 1998. Vol.8. №2. P.254-255.
3. Sereda S.G., Emelyanov G.M. Image Segmentation Based on Complex Conditions of Semantic Uniformity // Pattern Recognition and Image Analysis. 2005. Vol.15. №2. P.435-438.
4. Даниловских М.Г., Винник Л.И. Энергоинформационное взаимодействие НИСЛИ с биологической системой [Электронный ресурс] // Сельское, лесное и водное хозяйство. 2012. №5. Режим доступа: http://agro.snauka.ru/2012/05/261 (дата обращения: 05.08.2014).
5. Даниловских М.Г., Винник Л.И. Обоснование стимуляции биологических систем оптическим излучателем нетепловой интенсивности в сельском хозяйстве [Электронный ресурс] // Сельское, лесное и водное хозяйство. 2012. №12. Режим доступа: http://agro.snauka.ru/2012/12/788 (дата обращения: 01.08.2014).
6. Даниловских М.Г., Винник Л.И. Обоснование применения электромагнитного излучения оптического диапазона в животноводстве // Вестник НовГУ. 2014. №76. С.28-30.
References
1. Sereda S.G., Guzeev S.A., Emeljanov G.M. Interactive learning in texture segmentation. Pattern Recognition and Image Analysis, 1996, vol. 6, no. 1, pp. 67-68.
2. Sereda S.G., Guzeev S.A., Emeljanov G.M. Modeling of hierarchical textures and synthesis of algorithms for their segmentation. Pattern Recognition and Image Analysis, 1998, vol. 8, no. 2, pp. 254-255.
3. Sereda S.G., Emelyanov G.M. Image Segmentation Based on Complex Conditions of Semantic Uniformity. Pattern Recognition and Image Analysis, 2005, vol.15, no. 2, pp. 435-438.
4. Danilovskikh M.G., Vinnik L.I. Energoinformatsionnoe vzaimodeistvie NISLI s biologicheskoi sistemoi [The interaction between low-intensive scanning laser radiation and biological system concerning both energy and information]. Sel'skoe, lesnoe i vodnoe khoziaistvo - Agriculture, forestry and water management, 2012, no. 5. Available at: http://agro.snauka.ru/2012/05/261 (accessed 05.08.2014).
5. Danilovskikh M.G., Vinnik L.I. Obosnovanie stimuliatsii biologicheskikh sistem opticheskim izluchatelem neteplovoi
intensivnosti v sel'skom khoziaistve [Justification of stimulation of biological systems by optical radiator of non-thermal intensity in agriculture]. Sel'skoe, lesnoe i vodnoe khoziaistvo - Agriculture, forestry and water management, 2012, no. 12. Available at: http://agro.snauka.ru/2012/12/788 (accessed 01.08.2014).
6. Danilovskikh M.G., Vinnik L.I. Obosnovanie primeneniia elektromagnitnogo izlucheniia opticheskogo diapazona v zhi-votnovodstve [Justification of using of optical-range electromagnetic radiation in animal husbandry]. Vestnik NovGU. Ser. Sel'skokhoziaistvennye nauki - Vestnik NovSU. Issue: Agricultural Sciences, 2014, no. 76, pp. 28-30