Федотов Н.Г. , Романов С.В., Крючкова Е.А., Мокшанина Д.А.
АВТОМАТИЧЕСКАЯ ГЕНЕРАЦИЯ ТРИПЛЕТНЫХ ПРИЗНАКОВ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ УЛЬТРАЗВУКОВЫХ ИССЛЕДОВАНИЙ
В статье рассматривается малораспространенный подход к формированию признаков распознавания -автоматическая генерация. Описываются преимущества данного метода и некоторые задачи, где его применение особенно эффективно. Значительное внимание уделено программной реализации процедуры. Показаны основные подходы к созданию эффективной системы.
Ультразвуковые исследования нашли широчайшее применение в медицинской диагностики. Популярность этого метода объясняется его безболезненностью для пациента, низкой стоимостью, высокой скоростью получения результатов. Небольшие габариты аппаратуры и отсутствие жестких требований к помещениям позволяют оснастить её не только любые медицинские учреждения, но, даже, создать мобильные диагностические системы.
Множество достоинств ультразвуковых исследований обеспечили их широчайшее применение, но для диагностики ряда заболеваний, например, опухолей щитовидной железы, необходимо повышение точности данного метода исследований.
Работы по повышению точности ультразвуковых исследований ведутся достаточно давно. Можно выделить основные направления этих улучшений:
увеличение разрешения получаемого изображения;
получение дополнительной информации, например, скорости кровотока, на основе эффекта Доплера;
представление результатов исследований в трехмерном виде.
Все перечисленные направления направлены на совершенствование аппаратной части системы. Повышение точности исследований возможно не только путем улучшения технических характеристик системы, но и благодаря более глубокому анализу, получаемых данных. Научное направление, занимающееся данной проблемой, получило название data mining или интеллектуальный анализ данных. Основной задачей интеллектуального анализа данных является изучение большого объема информации с целью выявления скрытых взаимосвязей. Опираясь на различные математические методы, решаются задачи классификации, кластеризации, сокращения описания и т.д.
На сегодняшний день основным источником информации на изображениях ультразвуковых исследований являются контуры объектов, на основании которых осуществляется вычисление размеров этих объектов и анализ их взаимного расположения. Таким образом, значительная часть изображения не рассматривается. Возможно, что из изображений ультразвуковых исследований можно получить дополнительную информацию, применив методы интеллектуального анализа данных. Возможно, обработка серии ультразвуковых исследований или их сравнение с результатами других методов диагностики, например, гистологических анализом, позволят выявить скрытые закономерности и новые информативные составляющие ультразвуковых изображений.
Интеллектуальные методы анализа данных применимы только в том случае, когда информация представлена в виде численных данных, которые являются количественной или качественной характеристикой объектов. Таким образом, необходимо преобразовать изображение ультразвукового исследования в форму, подходящую для дальнейшей обработки.
Получение численных характеристик объектов изображения основано на анализе изображения. Данные методы нашли широкое применение в распознавании образов и получили название вычисление признаков. Признак - некоторая устойчивая численная характеристика объекта на изображении, связанная с геометрической или иной особенностью объекта или всего изображения.
Необходимо отметить, что, в отличие от распознавания образов, в данной задаче нет конкретного объекта на изображении. Необходимо получить признаки всего изображения и всех доступных на нем объектов, что позволит провести всесторонний анализ результатов ультразвуковых исследований.
Лишь немногие из методов анализа изображений и распознавания образов позволяют получить действительно большое число признаков, которые могли бы достаточно полно охарактеризовать все особенности изображения и объектов на нем. В наибольшей степени данным требованиям соответствуют методы стохастической геометрии, использующие триплетные признаки.
Главной особенностью триплетных признаков является составная структура из трех функционалов Тг р и Q. Функционал f реализует некоторую функцию от изображения и сканирующей прямой. Данный подход опирается на понятие геометрической вероятности и после обработки позволяет охарактеризовать многие геометрические и иные особенности объектов. За обработку отвечают функционалы р и Q. Теоретически, количество возможных признаков не ограничено. Существующая база функционалов позволяет сконструировать более 60000 признаков и допускает расширение.
В зависимости от состава функционалов в признаке, его значение характеризует одну из особенностей объекта. Существуют два подхода к подбору признаков, характеризующих информативные особенности объектов. В распознавании изображений получил широкое распространение метод экстракции признаков. Суть данного метода заключается в выборе информативных особенностей объектов и последующем подборе или конструировании признаков, которые бы давали состоятельные оценки данным особенностям. Процесс экстракции признаков во многом зависит от характера объекта, его отображением после процедуры предварительной обработки и действиями экспертов, которые занимаются анализом объекта и составлением признаков из функционалов. Таким образом, признаки, полученные путем экстракции, не могут претендовать на полноту описания и объективность. Они во многом предопределены той информацией об объекте, которую используют эксперты.
Для применения интеллектуального анализа данных необходимо получить всестороннее описание объектов. Более того, должны быть получены оценки тех свойств объектов, которые ранее не считались значимыми или информативными, так как это позволит проверить данные гипотезы. Существует второй метод получения признаков - генерация. Данный метод не получил столь широкого распространения как экстракция, по причине крайне ограниченного типа признаков, которые позволяют его применить и большой вычислительной сложности. По современным оценкам, вычислительная сложность процедуры автоматической генерации признаков, позволяет реализовать её даже на персональном компьютере, а триплетные признаки как нельзя лучше подходят для её реализации. Суть автоматической генерации признаков распознавания достаточно проста: имея набор объектов или изображений вычислить для них все возможные (в рамках данной теории) признаков. Можно предположить, что и при экстракции возможно рассмотрение все признаков. Поэтому, для четкого разделения данных методов, необходимо отметить, что автоматическую генерацию отличают следующие свойства:
Используется очень большое количество признаков. (Значительно большее чем при экстракции.)
Автоматически осуществляется не только вычисление признаков, но и их конструирование.
Может полностью отсутствовать информация об объекте и его информативных характеристиках.
Использование генерации признаков предполагает последующую процедуру сокращения размерности признакового пространства.
Генерация признаков - процедура автоматического вычисления всех признаков объекта, направленная на получения его всестороннего описания без использования информации об информативных характеристиках объекта.
Автоматическая генерация триплетных признаков очень хорошо подходит для решения задачи анализа изображения или его распознавания. В литературе процедура автоматической генерации признаков распознавания не получила широкого распространения, поэтому хотелось бы подробнее остановиться на её реализации для анализа изображений ультразвуковых исследований.
Исходными данными в процедуре автоматической генерации признаков являются множество изображений и база функционалов. В данном случае база изображений может представлять собой несколько подмножеств изображений, полученных путем предварительной обработки исходных изображений. Можно рассмотреть исходные изображения с минимальными изменениями (увеличение контрастности), изображения преобразованные в бинарную форму, объекты с исходных изображений, полученные на основании выделения части исходного изображения и т.д. Независимо от количества таких подмножеств обработка их будет осуществляться независимо друг от друга, т.к. на данном этапе не ставится задачи непосредственного обнаружения зависимостей. Единственным условием является введение дополнительного признака, который характеризует тип обрабатываемого изображения. Эта информация впоследствии будет использована для анализа данных. Для простоты описания процедуры, ограничимся только одним множеством изображений - исходным, которое представляет собой непосредственно изображения ультразвукового исследования.
Кроме множества изображений, для процедуры автоматической генерации необходима база функционалов и алгоритм формирования признаков. В случае применения триплетных признаков распознавания алгоритм генерации представляет собой комбинаторный перебор всех возможных сочетаний функционалов. База функционалов представляет собой реализацию множества функций, каждая из которых соответствует одному из функционалов. С точки зрения теории триплетных признаков и стохастической геометрии, функционалы р и Q, абсолютно идентичны. Поэтому, достаточно реализовать вычисление только одной группы. Функционал f г связан непосредственно с обработкой изображений и отличен от р и Q, но работы, направленные на оптимизацию вычисления триплетных признаков распознавания показали, что функционал Т может быть представлен как два функционала: первый - связан с обработкой изображений и зависит только от его представления, второй полностью идентичен функционалам р и Q. Таким образом, если необходимо обрабатывать только бинарные изображения, то база должна обеспечивать реализацию одного функционала для работы непосредственно с изображениями и группу универсальных функционалов Используя правила комбинаторики, при наличии 4 0 универсальных функционалов и одного функционала обработки изображения, будет вычислено 64000 признаков. Если необходимо обрабатывать два типа изображений, например, бинарные и полутоновые, то в базу следует добавить всего один функционал - обработки полутоновых изображений.
Результат вычисления сохраняется в базе данных вместе с информацией о типе обрабатываемого изображения и идентификатором признака.
Рассмотрим программную реализацию процедуры автоматической генерации признаков распознавания. Можно выделить следующие требования, предъявляемые к программной реализации:
Высокая скорость работы.
Масштабируемость.
Простота внесения изменений и дополнений в программу.
Представление результатов в форме удобной для дальнейшей обработки.
Созданная программная реализация соответствует всем этим требованиям. На первом этапе, необходимо определить на каком языке программирования будет осуществляться написание программы. В данном случае, выбор был остановлен на C#. В литературе подробно описаны достоинства и недостатки данного языка программирования. В контексте предъявляемых требований, можно отметить, что программа, написанная на данном языке, отличается очень хорошим соотношением таких показателей как скорость выполнение и «читабельность». Данный язык является очень формализованным, что упрощает чтение и модификацию кода, и позволяет начинающим программистам, например студентам и аспирантам, модифицировать программу под свои требования. Разработка подобного программного обеспечения требует использования очень большого числа технологий программирования, например обработка изображений, взаимодействие с базами данных, XML, разработка пользовательского интерфейса и т.д. Самостоятельная разработка всех компонентов системы, заняла бы значительное время. В состав framework включены классы, реализующие огромное количество стандартных операций, требующих для применения написания минимального количество кода. Например, создание пользовательского интерфейса может осуществляться без написания кода. Пространство имен System.Drawing позволяет распаковывать изображения наиболее популярных форматов. ADO.NET значительно упрощает взаимодействие с СУБД и работу с данными в целом. Существуют классы, позволяющие реализовывать параллельную обработку данных, что особенно актуально, в связи с популярностью многоядерных процессоров. Дополнительно, следует отметить, что разработка с использованием net framework весьма популярна в научных кругах, поэтому для языка C# легко найти, как примеры алгоритмов, так и библиотеки с открытым кодом, использование которых также позволяет значительно сократить время разработки и сосредоточиться исключительно, на задачах предметной области, а не реализации давно известных математических алгоритмов.
База функционалов представлена отдельной библиотекой, подключение которой осуществляется с применением механизма позднего связывания. Данный подход позволяет в кратчайшие сроки добавить новые функционалы или изменить алгоритм вычисления уже созданных.
Важным требованием к данной программе является высокое быстродействие. Для оптимизации скорости выполнения был несколько изменен алгоритм вычисления триплетных признаков. Учитывая комбинаторный характер алгоритма построения признаков, возможно значительное ускорение вычислений путем кэширования части результатов. При расчете значения признака последовательно осуществляется вычисление трех, составляющих его функционалов, результат вычисления предыдущего является исходными данными для последующего. Для реализации оптимальной схемы вычисления необходимо запоминать результаты, полученные на предыдущих этапах. Вычислив значение функционала Т, на его основе вычисляется функционал р, а затем все функционалы Q. Применение подобной схемы позволяет сократить
время обработки в сотни раз, а небольшой размер изображений ультразвуковых исследований, не требует наличия большого объема оперативной памяти.
Следующим шагом оптимизации является применение параллельных вычислений. Очевидно, что обработка отдельных изображений из исходного множества, осуществляется полностью независимо друг от друга. Следовательно, реализация вычислений для изображений в отдельных потоках будет весьма эффективна. Благодаря наличию в составе framework классов для реализации параллельных вычислений, реализация многопоточной схемы обработки не требует внесения значительных изменений в программу.
Полученные результаты сохраняются в формате xml. Поддержка данного формата включена в состав стандартных библиотек и не представляет сложности. На сегодняшний день большинство математических пакетов поддерживают экспорт и импорт данных в формате xml (Mathcad, MatLab, Excell и т.д. ) Применение данного формата хранения данных, позволяет осуществлять обработку полученных результатов не только в своих программах, но и в программах сторонних производителей без каких-либо преобразований.
В заключении хотелось бы отметить, что процедура автоматической генерации признаков является очень эффективным инструментом для анализа изображений и разработки систем распознавания образов. В литературе, зачастую она представлена, как очень ресурсоемкая и сложно реализуемая программа. На сегодняшний момент, увеличившееся быстродействие вычислительной техники позволяет осуществить процедуру автоматической генерации признаков распознавания даже на персональном компьютере среднего уровня.
Работа выполнена при поддержке гранта РФФИ проект № 09-07-00089.