Цифровое описание цитоморфологических признаков
Майсеня Е.Н.1, Митюхин А.И.2
Минский городской клинический онкологический диспансер, Беларусь 2Белорусский государственный университет информатики и радиоэлектроники, Минск
Maisenia E.N.1, Mitsiukhin A.I.2
1City Clinical Oncological Dispensary, Minsk, Belarus 2Belarusian State University of Informatics аnd Radioelectronics, Minsk
Digital description of cytomorphological features
Резюме. Рассматривается эффективный алгоритм для описания цитоморфологических признаков на основе применение цифровых технологий. Уменьшение избыточности медицинских данных, количества анализируемых признаков достигается посредством применения де-коррелирующего преобразования. Такое описание диагностических признаков позволяет снизить размерность исследуемого пространства признаков, формализовать процесс принятия диагностического решения.
Ключевые слова: стандартизация цитологической диагностики, полиморфизм размеров и формы клеток, информационные технологии, контуры границ, области клетки, ядра, признаки распознавания, поиск онкологических признаков.
Медицинские новости. — 2014. — №3. — С. 80-82. Summary. The effective algorithm for the description of cytomorphological features on a basis application ofdigttal technologies is considered. Reduction of redundancy of medical data, quantity of analyzed signs is reached by means of application of decorrelating transformation. Such description of diagnostic signs allows to reduce dimension of studied space of signs, to formalize process of adoption of the diagnostic decision. Keywords: standardization of cytological diagnostics, polymorphism of the size and shape of cells, Information technologies, cells borders, nuclei, signs of recognition, cancer signs.
Meditsinskie novosti. - 2014. - N3. - P. 80-82.
Одной из проблем современной онкологии и практической медицины является стандартизация цитологической диагностики опухолей мягких тканей. Точная морфологическая верификация позволяет оптимизировать выбор адекватного лечения, объем хирургического вмешательства, а также оценить прогноз болезни. В цитологической диагностике, как бурно развивающейся области, применяются достижения современной биологии и медицины, используются молекулярные и молекулярно-генетические методы, а также реализуются возможности компьютерных технологий. При цитологической диагностике основное внимание обращают на структурные особенности отдельных клеток, такие как полиморфизм размеров и формы клеток, неравномерность восприятия окрасок, смещение ядерно-цитоплазматических отношений в пользу ядра, увеличения размеров и количества ядрышек и т.д. Признаки злокачественности клеток делят на общие, указывающие на злокачественность клетки вообще, и частные, которые обусловлены гистологической формой опухоли или принадлежностью опухолевой клетки к определенному органу или ткани. Зачастую микроскопические отличия минимальны и в значительной степени субъективны [1]. По данным различных авторов, точность цитологической диагностики сарком мягких тканей составляет 80-85% [1-3].
Возможный подход к решению проблемы стандартизации цитологической диагностики основывается на применении информационных технологий, в частности, на применении методов и техники распознавания образов объектов - контуров границ, областей, текстурных признаков ядра и пр. Представление границами подходит для тех случаев, когда в центре внимания находятся такие геометрические характеристики объекта, как длина границы, изгибы, очертания, число вогнутостей границы. Граница является полным и компактным представлением геометрии объекта. По границе можно выделить дополнительные параметры формы. Представление областями более уместно,
если акцент делается на внутренних характерных признаках, например, ядра клетки. В этом случае в качестве информативных диагностических признаков ядра используются форма, текстура, цвет, средняя площадь, отличительная особенность строения ядрышек. Цифровые алгоритмы обработки изображений позволяют осуществить эффективное обнаружение числовых изменений формы клетки, размера, площади ядра, в результате чего упрощается процесс формализации (стандартизации) диагностики опухолей.
Система распознавания включает в себя выбор признаков и создание классификатора образов признаков. Пространственные данные, описывающие границу или область, могут иметь высокую размерность. В этом случае на этапе получения признаков распознавания вычислительная и временная сложность обработки еще более возрастает. Эффективное решение задачи выбора признаков и упрощение задачи классификации требует уменьшения размерности обрабатываемых данных, описывающих признаки, понижения размерности входа. Один из приемов снижения вычислительной сложности - устранение пространственной избыточности данных, уменьшение количества анализируемых признаков посредством применения к морфологическим данным декоррелирующих преобразований. Среди всех таких преобразований, оптимальных по отношению к критерию наименьшего значения среднеквадратической ошибки при неполной размерности (неточном задании координат), является преобразование Хотеллинга [3]. Однако это преобразование не обладает быстрым алгоритмом вычисления, что затрудняет его практическое использование. При решении задач представления и распознавания в реальном времени необходимость вычисления ковариационных матриц типовых размеров микроскопических изображений приводит к чрезмерным вычислительным затратам [3].
В работе исследуется возможность использования для эффективного описания диагностических цитоморфологических
МЕДИЦИНСКИЕ НОВОСТИ
№3^ 2014
80
признаков (границы, области объекта и др.) спектральных дескрипторов линейного ортогонального дискретного преобразования Хартли (ДПХ).
Базис Хартли, заданный на интервале из N точек, выражается [5, 6] действительными числами вида:
В практических задачах распространено представление образов в виде векторов признаков X, где \ обозначает ]-й образ, принадлежащий классу ю1. Пусть образ ю1 описывается результатом двух измерений в пространстве в виде множества векторов признаков:
где значение N - число целочисленных пар декартова произведения Z2 или число точек (отсчетов) дискретной границы области объекта. Тогда вся граница представляется двумя ^точечными последовательностями с соответствующими отсчетами
*(«)={*1(РШ1).....
^(п) = {хг(0),хг(1).....хг(Ы - 1)), п е (ОД.....N - 1}.
Пара 1 -О ДПХ последовательности х (я) в матричном представлении определяется равенствами [5, 6]:
ХТ = Н„ХТ.
х
(2) (3)
где Н - ядро (матрица) ДПХ, а: - вектор значений преобразуемых данных, X - вектор спектральных коэффициентов ДПХ. Структурные свойства ядра Нь определяются формулой (1). С учетом представления (2) и (3) образ ю1 в области преобразования однозначно описывается множеством двумерных векторов признаков:
= = & *зГ.....= С*, *г)г). (4)
Векторы отображают образы границы объекта в спектральном базисе ДПХ. Запись (4) двумерной границы области позволяет уменьшить вычислительные затраты на ее описание на основе дисперсионного или порогового способов фильтрации коэффициентов ДПХ. Для осуществления понижения размерности поля признаков рассчитывается функция (вектор) распределения дисперсии коэффициентов преобразования. Коэффициенты вектора с минимальными значениями определяют зону фильтрации трансформант или зону сохранения /И-признаков. Для этого выделяются из векторов образов IV трансформанты с наибольшими дисперсиями. Усечение множества (4) приводит к понижению размерности входа классификатора, упрощению системы распознавания образов.
Пример эффективного представления контура ядра. На рис. 1 показана дискретная граница рЛ) клетки опухоли в виде «голого» ядра веретенообразной формы.
Контур границы описывают 32 пикселя N = 32). Извлечение элементов подмножества рЛ) на множестве Л в пространстве Z2 (цифрового микроскопического изображения) выполнено путем использования алгоритма морфологической обработки - операции эрозии множества Л по подходящему примитиву В, и затем получения разностного множества между Л и результатом его эрозии. Точки границы представляются
двумя матрицами. Матрица Х1 определяется лексикографической записью по строкам значений отсчетов последователь-
ности х1 (п):
=
1 I 2 4 6 7 9 10
12 14 17 19 21 24 27 32
37 38 36 32 29 27 25 22
19 15 12 11 8 7 6 4
Очевидно, с увеличением размера входа N (точек границы) вычислительная сложность описания границы в пространственной области возрастает. Последовательности (п) соответствует матрица значений координат:
Все числовое пространство матрицы нь размером NxN = 32x32 имеет только 32 различных зн ачения. По формуле (2) выполняются ДПХ массивов Х1 и Х2. Структура массива признаков у2, представляющая исходные координаты границы объекта наблюдения, имеет вид
Аналогично формируются признаки массива X1. Степень понижения размерности поля дескрипторов задается числом
Напримео, для М = 8 усе-
315 -23 -13-44 0,20
-3.+1 -2.25 -0,57 -1,75
1 -1 -0,26 1.16
1.17 —0.38 —2,22 -3.49
1 -1.24 1.79 -3.53
-0.59 -2.54 -1,92 -0,65
-1 1.23 -0.1 -5.74
6.83 -18.82 16.71 -194
сохраняемых коэффициентов ^ и ченные векторы спектральных дескрипторов 8 элементов (признаков) вида:
имеют только
м
315 -23 —13.44 -5,741 6.83 -1В.82 16.71 -19+]
Как видно, это математическое описание формы представляется значительно меньшим массивом значений. Кроме того, практически нет необходимости в записи адресной информации о зоне фильтрации дескрипторов, так как большинство трансформант в центре зоны исключаются. Восстановление изображения границы области произведем по М сохраненным коэффициентам. Применяя формулу (3) для усеченных последовательностей и опе-
№3^ 2014
МЕДИЦИНСКИЕ НОВОСТИ |в1
рацию округления к восстановленным данным round [X7], получаем следующие оценки:
' 1 1 2 4 6 8 9 10
п 14 17 19 21 24 27 32
37 3Q 36 32 29 27 25 22
.19 15 12 10 е 7 6 4
3 4 Ь 7 9 10 12 13'
15 16 17 18 19 20 20 19
1В 15 13 10 9 В 7 6
.5 4 3 3 2 2 2 2 .
Выделенные элементы массивов данных - это три ошибочных значения координат точек границы. Обратная лексикографическая запись по строкам значений и Хг соответствует восстановленным отсчетам последовательностей (п) и х, (п), описывающих границу образа.
Для оценки ошибки восстановления изображения границы определим последовательность х(п)=х1(п) ° х2(п) как результат операции конкатенации из последовательностей х1(п) и х2(п). Последовательность х(п) имеет длину 2Ы. Аналогично, выражение х - (п) в (и) есть конкатенация из последовательностей х^л.) и х2(п) . Среднеквадратичная ошибка восстановления изображения границы по объединенному массиву восстановленных данных составляет:
На рис. 2 показано восстановленное изображение границы ядра клетки. Пространство из 20 сохраняемых дескрипторов
ДПХ практически точно описывает кривую неправильной формы. В качестве признаков при распознавании образов достаточно выбрать только 20 значений из 64. Коэффициент, отражающий эффективность представления формы, равен:
Уменьшение числа признаков приводит к упрощению структуры дискриминантной функции классификатора, построенного на основе статистически достоверной обучающей выборки клеток (прошедших экспертную оценку по выбранным признакам). Кроме того, вычислительная сложность представления уменьшается за счет использования возможности факторизации ядра ДПХ и, следовательно, применения быстрого алгоритма выполнения операций (2), (3).
Рассмотренный подход позволяет эффективно описывать и область наблюдаемого объекта. В этом случае формируются двумерные векторы, координаты которых соответствуют всем пикселям (точкам) области. Выводы
Описание диагностических морфологических данных посредством цифрового эффективного алгоритма позволяет:
1) эффективно представлять характеристические особенности границы, области патологических объектов в компактной форме, точно выявлять закономерности опухолевой прогрессии;
2) упростить поиск цитологических онкологических признаков в базе клинических данных;
3) упрощать решение задач морфологического анализа, классификации, идентификации цитологических образов;
4) формализовать систему ранней диагностики злокачественных новообразований.
Л И Т Е Р А Т У Р А
1. Берченко, Г.Н. Трудности диагностики хондросарком кости различной степени злокачественности / Г.Н.Берченко, О.Б.Шугаева // Саркомы костей, мягких тканей и опухоли кожи. - 2011. - №4. - С. 21-29.
2. Клиника, дифференциальная диагностика и стадирование сарком мягких тканей / В.А. Кочнев // Практическая онкология. - 2004. - Т.5, №4. - С. 237-242.
3. Майсеня, Е.Н. Эффективное описание диагностирующих признаков / Е.Н.Майсеня, А.И. Митюхин // Современная медицина: актуальные вопросы: м-лы ХХ междунар. заочн. науч.-практ. конф., Новосибирск, 01 июля 2013 / Новосибирск: СибАК, 2013. - С. 131-137.
4. Тепляков, В.В. Ошибки в диагностике и лечении сарком мягких тканей / В.В.Тепляков, В.Ю.Карпенко [и др.] // Хирургия. - 2011. - №1. - С. 36-42.
5. Jähne, B. Digital Image Processing / B.Jähne. - Springer-Verlag, Berlin Heidelberg, 2005.
6. Mitsiukhin, A. Segmentation of Dynamical Images by Means of Discrete Hartley Transform / Proceedings 56. International Scientific Colloquium, DE, Ilmenau, 12-16 September 2011, Technische Universität Ilmenau. - TU Ilmenau, 2011. - P. 1-4.
Поступила 03.03.2014 г.
Ш£ В СЛЕДУЮЩЕМ НОМЕРЕ
ПРОБЛЕМНЫЕ СТАТЬИ И ОБЗОРЫ
Бродко В.Г., Соколовский О.А., Бродко Г.А. Врожденная косолапость: обзор проблемы
ПРОБЛЕМЫ ОБЩЕСТВЕННОГО ЗДОРОВЬЯ И РЕФОРМИРОВАНИЯ ЗДРАВООХРАНЕНИЯ I
Андросов В.Е. Медицинский туризм и экспорт медицинских услуг: перспективы для Беларуси
Лашкул З.В. Влияние системы здравоохранения на показатели смертности от заболеваний органов кровообращения:
от земства до национальной модели организации медицинской помощи в Украине
Судебно-медицинские данные о качестве медицинской помощи населению Республики Беларусь по результатам выполненных экспертиз
Здравоохранение Беларуси: взгляд из-за рубежа ДИСКУССИИ
Близнюк А.И. Здоровый образ жизни и здоровье: современное состояние проблемы