Научная статья на тему 'ОСОБЕННОСТИ СОЗДАНИЯ БАЗЫ ДАННЫХ НЕЙРООНКОЛОГИЧЕСКИХ 3D МРТ-ИЗОБРАЖЕНИЙ ДЛЯ ОБУЧЕНИЯ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА'

ОСОБЕННОСТИ СОЗДАНИЯ БАЗЫ ДАННЫХ НЕЙРООНКОЛОГИЧЕСКИХ 3D МРТ-ИЗОБРАЖЕНИЙ ДЛЯ ОБУЧЕНИЯ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
129
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МРТ / НЕЙРООНКОЛОГИЯ / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / СЕГМЕНТАЦИЯ ОПУХОЛИ / КЛАССИФИКАЦИЯ ОПУХОЛЕЙ ГОЛОВНОГО МОЗГА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Амелина Евгения Валерьевна, Летягин Андрей Юрьевич, Тучинов Баир Николаевич, Толстокулаков Николай Юрьевич, Амелин Михаил Евгеньевич

Исследование направлено на анализ современных подходов к организации и методологии проектирования базы данных визуализации, построенной на основе компьютерного зрения. Такие подходы необходимы для эффективной разработки диагностических систем с использованием искусственного интеллекта (ИИ). Обязательным условием для этого является качественный набор обучающих данных. Материал и методы. В статье представлена технология создания аннотированной базы данных (SBT Dataset), содержащей около 1000 клинических случаев на основе архивных данных ФГБУ «Федеральный нейрохирургический центр», Новосибирск, Россия, включая сведения о пациентах с астроцитомой, глиобластомой, менингиомой, невриномой и больных с метастазами соматических опухолей. Каждый случай представлен предоперационной МРТ. Результаты и их обсуждение. Построен набор данных (набор данных SBT), содержащий сегментированные 3D МРТ-изображения 5 типов опухолей головного мозга с общим количеством проверенных наблюдений 991. Использованы четыре последовательности МРТ - T1-WI, T1C (с Gd-контрастом), T2-WI и T2-FLAIR с гистологическим и гистохимическим послеоперационным подтверждением. Сегментация опухолей с проверкой границ элементов ядра опухоли и перифокального отека одобрена двумя аттестованными опытными нейрорадиологами. Вывод. База данных, построенная в ходе исследования, по своему объему и уровню качества (верификации) сравнима с современными наиболее популярными в мире базами данных. Предложенные в статье методологические подходы направлены на разработку высококачественных медицинских систем компьютерного зрения. База данных использовалась для создания систем искусственного интеллекта с функциями «помощника врача» по предоперационной МРТ-диагностике в нейрохирургии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Амелина Евгения Валерьевна, Летягин Андрей Юрьевич, Тучинов Баир Николаевич, Толстокулаков Николай Юрьевич, Амелин Михаил Евгеньевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SPECIFIC FEATURES OF DESIGNING A DATABASE FOR NEURO-ONCOLOGICAL 3D MRI IMAGES FOR ARTIFICIAL INTELLIGENCE TRAINING

The research was aimed at analyzing current approaches to the organization and design methodology of visualization database built on the basis of computer vision. Such approaches are necessary for effective development of diagnostic systems using artificial intelligence (AI). A training data set of high quality is a mandatory prerequisite for that. Material and methods. The paper presents the technology for designing an annotated database (SBT Dataset) that contains about 1000 clinical cases based on the archived data acquired by the Federal Neurosurgical Center, Novosibirsk, Russia including data on patients with astrocytoma, glioblastoma, meningioma, neurinoma, and patients with metastases of somatic tumors. Each case is represented by a preoperative MRI. The Results and Discussion. The dataset was built (SBT Dataset) containing segmented 3D MRI images of 5 types of brain tumors with 991 verified observations. Each case is represented by four MRI sequences T1-WI, T1C (with Gd-contrast), T2-WI and T2-FLAIR with histological and histochemical postoperative confirmation. Tumors segmentation with verification of the tumor core elements boundaries and perifocal edema was approved by two certified experienced neuroradiologists. Conclusion. The database built during the research is comparable in its volume and quality (verification level) with the state-of-the-art databases. The methodological approaches proposed in this paper were focused on designing the high-quality medical computer vision systems. The database was used to create artificial intelligence systems with the “physician assistant” functions for preoperative MRI diagnostics in neurosurgery.

Текст научной работы на тему «ОСОБЕННОСТИ СОЗДАНИЯ БАЗЫ ДАННЫХ НЕЙРООНКОЛОГИЧЕСКИХ 3D МРТ-ИЗОБРАЖЕНИЙ ДЛЯ ОБУЧЕНИЯ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА»

УДК 616.831-006:614.876:004 DOI: 10.18699/SSMJ20220606

Оригинальное исследование / Research article

Особенности создания базы данных нейроонкологических 3D МРТ-изображений для обучения искусственного интеллекта

Е.В. Амелина1, А.Ю. Летягин1, 3, Б.Н. Тучинов1, Н.Ю. Толстокулаков1, М.Е. Амелин1, 2, Е.Н. Павловский1, В.В. Гроза1, С.К. Голушко1

1 Новосибирский государственный университет 630090, г. Новосибирск, ул. Пирогова, 1

2 Федеральный нейрохирургический центр Минздрава России 630048, г. Новосибирск, ул. Немировича-Данченко, 132/1

3НИИ клинической и экспериментальной лимфологии -филиал ФИЦ Институт цитологии и генетики СО РАН 630060, г. Новосибирск, ул. Тимакова, 2

Резюме

Исследование направлено на анализ современных подходов к организации и методологии проектирования базы данных визуализации, построенной на основе компьютерного зрения. Такие подходы необходимы для эффективной разработки диагностических систем с использованием искусственного интеллекта (ИИ). Обязательным условием для этого является качественный набор обучающих данных. Материал и методы. В статье представлена технология создания аннотированной базы данных (SBT Dataset), содержащей около 1000 клинических случаев на основе архивных данных ФГБУ «Федеральный нейрохирургический центр», Новосибирск, Россия, включая сведения о пациентах с астроцитомой, глиобластомой, менингиомой, невриномой и больных с метастазами соматических опухолей. Каждый случай представлен предоперационной МРТ. Результаты и их обсуждение. Построен набор данных (набор данных SBT), содержащий сегментированные 3D МРТ-изображения пяти типов опухолей головного мозга с общим количеством проверенных наблюдений 991. Использованы четыре последовательности МРТ - T1-WI, T1C (с Gd-контрастом), T2-WI и T2-FLAIR с гистологическим и гистохимическим послеоперационным подтверждением. Сегментация опухолей с проверкой границ элементов ядра опухоли и перифокального отека одобрена двумя аттестованными опытными нейрорадиологами. Вывод. База данных, построенная в ходе исследования, по своему объему и уровню качества (верификации) сравнима с современными наиболее популярными в мире базами данных. Предложенные в статье методологические подходы направлены на разработку высококачественных медицинских систем компьютерного зрения. База данных использовалась для создания систем искусственного интеллекта с функциями «помощника врача» по предоперационной МРТ-диагностике в нейрохирургии.

Ключевые слова: МРТ, нейроонкология, искусственный интеллект, сегментация опухоли, классификация опухолей головного мозга.

Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.

Финансирование: Исследование проведено в рамках проекта РФФИ № 19-29-01103.

Автор для переписки: Летягин А.Ю., е-mail: letyagin-andrey@yandex.ru

Для цитирования: Амелина Е.В., Летягин А.Ю., Тучинов Б.Н., Толстокулаков Н.Ю., Амелин М.Е., Павловский Е.Н., Гроза В.В., Голушко С.К. Особенности создания базы данных нейроонкологических 3D МРТ-изображений для обучения искусственного интеллекта. Сибирский научный медицинский журнал. 2022;42(6):51-59. doi: 10.18699/SSMJ20220606

Specific features of designing a database for neuro-oncological 3D MRI images to be used in training artificial intelligence

E.V. Amelina1, A.Yu. Letyagin1' 3, B.N. Tuchinov1, N.Yu. Tolstokulakov1, M.E. Amelin1' 2, E.N. Pavlovsky1, V.V. Groza1, S.K. Golushko1

1 Novosibirsk State University 630090, Novosibirsk, Pirogov str., 1

2 Federal Neurosurgical Center of the Minzdrav of Russia 630048, Novosibirsk, Nemirovich-Danchenko str., 132/1

3 Research Institute of Clinical and Experimental Lymphology -Branch of the Institute of Cytology and Genetics of SB RAS 630060, Novosibirsk, Timakov str., 2

Abstract

The research was aimed at analyzing current approaches to the organization and design methodology of visualization database built on the basis of computer vision. Such approaches are necessary for effective development of diagnostic systems using artificial intelligence (AI). A training data set of high quality is a mandatory prerequisite for that. Material and methods. The paper presents the technology for designing an annotated database (SBT Dataset) that contains about 1000 clinical cases based on the archived data acquired by the Federal Neurosurgical Center, Novosibirsk, Russia including data on patients with astrocytoma, glioblastoma, meningioma, neurinoma, and patients with metastases of somatic tumors. Each case is represented by a preoperative MRI. The Results and discussion. The dataset was built (SBT Dataset) containing segmented 3D MRI images of 5 types of brain tumors with 991 verified observations. Each case is represented by four MRI sequences T1-WI, T1C (with Gd-contrast), T2-WI and T2-FLAIR with histological and histochemical postoperative confirmation. Tumors segmentation with verification of the tumor core elements boundaries and perifocal edema was approved by two certified experienced neuroradiologists. Conclusion. The database built during the research is comparable in its volume and quality (verification level) with the state-of-the-art databases. The methodological approaches proposed in this paper were focused on designing the high-quality medical computer vision systems. The database was used to create artificial intelligence systems with the "physician assistant" functions for preoperative MRI diagnostics in neurosurgery.

Key words: MRI, neuro-oncology, artificial intelligence, tumor segmentation, classification of brain tumors.

Conflict of interests. The authors declare no conflict of interest. Financing: The research was supported by RFBR project No. 19-29-01103. Correspondence author: Letyagin A.Yu., e-mail: letyagin-andrey@yandex.ru

Citation: Amelina E.V., Letyagin A.Yu., Tuchinov B.N., Tolstokulakov N.Yu., Amelin M.E., Pavlovsky E.N., Groza V.V., Golushko S.K. Specific features of designing a database for neuro-oncological 3D MRI images to be used in training artificial intelligence. Sibirskij nauchnyj medicinskij zhurnal = Siberian Scientific Medical Journal. 2022;42(6):51-59. [In Russian]. doi: 10.18699/SSMJ20220606

Введение

В рамках процесса ручного обнаружения патологии радиологи полагаются на перцептивные навыки для выявления возможных аномалий, а затем на когнитивные навыки для подтверждения или отклонения полученных результатов. Специалисты визуально «сканируют» пакеты изображений, периодически корректируя плоскость обзора, ширину окна, уровень яркости/контрастности, учитывая технические параметры настройки МРТ-сканирования. Опираясь на знания, опыт и понимание нормальной рентгеноанатомии, радиологи получают возможность выявления аномалий на основе системы биомаркеров (изменения

интенсивности визуализации, появления необычных паттернов и др.).

Исследования показывают, что квалифицированный радиолог должен успеть интерпретировать одно изображение за 3-4 секунды в течение 8-часового рабочего дня, чтобы выполнить требования по рабочей нагрузке [1]. Поскольку современные нейрорадиологические МРТ-протоколы включают до 800-1500 томограмм, и их необходимо оценить визуально, то принятие решений в условиях неопределенности приводит к неизбежным ошибкам. Ошибки в пределах 3,5 % эксперт-радиолог делает при темпе показа 1-2 кадра в минуту и, безусловно, выигрывает у машины, но

за 8 часов работы - это не более 1000 изображений (не более 8-10 пакетов томограмм среднего качества). При повышении темпа до 10 кадров в минуту у человека ослабевает реакция, нарастает утомляемость, что приводит к значительному браку в работе, который вполне может превышать «допустимые» 5 %.

Автоматизация и развитие технологий искусственного интеллекта (ИИ) смещают радиологию с субъективного восприятия в количественно вычисляемую область. Современная радиология зависит от количественной оценки параметров МРТ-изображений, они важны для выявления, характеристики или мониторинга заболеваний. С другой стороны, интегрированный компонент ИИ в процессе визуализации повысит эффективность, сократит ошибки и минимизирует ручной ввод данных, предоставляя врачам-радиологам предварительно отобранные изображения и идентифицированные объекты и функции в режиме «помощника врача».

Одним из наиболее критических и важных этапов при разработке приложений ИИ для анализа медицинских изображений является этап создания обучающей выборки - базы данных изображений с максимально точными разметками интересующих объектов. Качественно подготовленная база является необходимым условием получения корректного результата.

Цель работы - проанализировать организационно-методические подходы к формированию базы визуализационных данных, подготовленных авторами статьи в рамках выполнения проекта РФФИ № 19-29-01103 по разработке технологии персонализированной диагностики и выработки рекомендаций по хирургическому лечению ней-роонкологических заболеваний с применением методов нейровизуализации на основе систем искусственного интеллекта (глубокого машинного обучения).

Материал и методы

Перед формированием базы данных МРТ-изо-бражений выполнен анализ распространенности различных типов первичных опухолей. Выбраны четыре наиболее распространенных типа: астро-цитомы, глиобластомы, менингиомы и неврино-мы. Из рассмотрения исключены аденомы гипофиза в силу их специфической визуализации. На последнем этапе проекта в базу включены метастазы аденокарцином.

В ходе совместной работы радиологов и нейрохирургов определены ключевые характеристики пациента, диагноза, операционного вмешательства, необходимые для корректного

формирования базы. Требования к сопровождающей информации определялись вопросами, которые задавались в ходе исследования. Минимальный набор включал в себя возраст, пол пациента, результаты иммуногистохимического и патоги-стологического исследования. Тип опухоли фиксировали по 5-й редакции классификации ВОЗ первичных опухолей ЦНС [2] без разделения по генетическим типам, а для метастазов учитывался источник онкозаболевания по классификации TNM.

Первый этап формирования базы связан с отбором случаев из источников данных клинической базы исследования, в данной ситуации - Федерального центра нейрохирургии (г. Новосибирск), специализирующегося на нейрохирургических операциях, в том числе при онкологии головного мозга. Высокая квалификация нейрохирургов и наличие практики «с обратной связью» у радиологов, которые принимали активное участие в формировании базы, обеспечили ее разнообразное и качественное наполнение. Предварительная обработка базы пациентов помогла отобрать только интересующие случаи с гистологически подтвержденными диагнозами. Таким образом была сформирована текстовая часть базы.

Второй этап включал выгрузку томограмм в формате DICOM по интересующим пациентам по соответствующим датам из госпитальной базы. Обязательно проводился анализ каждой серии на предмет наличия всех необходимых МРТ-последовательностей и качества изображений. Перед выгрузкой важно установить требования к минимально допустимому количеству и качеству снимков. В случае наличия нескольких томографов нужно определиться, будет ли использоваться один конкретный томограф или нужно обеспечить наличие снимков с нескольких аппаратов. При этом важно, чтобы каждая нозология была «представлена» для всех видов аппаратов.

В рамках нашего исследования томограммы были получены с использованием магнитно-резонансного сканера 1,5 Тл (Magnetom Avanto, Siemens AG, Германия) и, в некоторых случаях, 3 Тл (Ingenia, Philips, Нидерланды).

МРТ-последовательности, включенные в стандартные пакеты исследований при планировании операции на головном мозге по поводу онкообразования, включали предконтрастное Т1-взвешенное изображение (Т1), постконтрастное Т1-взвешенное изображение (Т1С), T2-взвешенное изображение (T2), Т2-взвешенные изображения с технологией инверсии-восстановления с ослаблением сигнала от жидкости (FLAIR) и диффузионно-взвешенные изображения (DWI). Нами в рамках проекта для обучения

нейросети выбраны последовательности Т1, Т1С, T2 и FLAIR, а DWI использовался экспертами для разрешения спорных вопросов.

После формирования базы на третьем этапе происходит анонимизация данных. Поскольку термин «анонимизированные данные» понимается неоднозначно, то в контексте подобных проектов следует, скорее, говорить о псевдонимизации данных. Согласно параграфу 5 ст. 4 GDPR [3], «псевдонимизация» - это обработка персональных данных таким образом, что их больше невозможно отнести к конкретному субъекту данных без использования дополнительной информации, при условии, что такая дополнительная информация хранится отдельно, и в отношении нее приняты технические и организационные меры, предотвращающие ее отнесение идентифицированному или идентифицируемому физическому лицу.

В российском законодательстве используется понятие «обезличивания». В соответствии со ст. 3 ФЗ-152 «обезличивание персональных данных — действия, в результате которых становится невозможным без использования дополнительной информации определить принадлежность персональных данных конкретному субъекту персональных данных». Для выполнения данной процедуры применяются специальные программы/обработки, которые убирают всю персональную информацию из текста аннотаций снимков. Таблица соответствия при этом остается на клинической базе, где хранится с учетом требований по охране персональных данных. Однако при работе с 3D-массивами МРТ головы возможно восстановление личности по поверхностному рендеренгу («слепку») головы и лица пациента. Поэтому мы сочли необходимым внести еще один этап обезличивания, связанный уже с редактированием собственно томограмм, - убирание данных о рельефе лица (т.е. удаление всех вок-селов изображения, расположенных латеральнее костей мозгового черепа). В итоге сформирована база с анонимизированными данными, подготовленная к передаче исследователям для дальнейшей подготовки, схема которой представлена на рис.1.

Обработка данных на четвертом этапе включает устранение артефактов томограмм, это может быть как ручная корректировка снимков, так и различные обработки, включающие исключение неравномерности магнитного поля, артефактов от движения пациента во время съемки и т.д.

На пятом этапе происходит «регистрация изображений» - как одного пациента, так и, возможно, нескольких - к некоторому «эталонному» изображению. «Регистрация изображений» - это процесс наложения двух или более изображе-

DICOM

О

Устранение артефактов (неравномерность магнитного поля) ч ✓

f Регистрация серии (приведение в соответствие снимков - выравнивание + аппроксимация срезов для соответствия «главному снимку») N.

о

Разметка

о

Согласование с экспертами

о

ч. Итоговая серия + итоговая разметка у

База с разметками

Рис. 1. Подготовка базы (этапы)

Fig. 1. Base preparation (stages)

ний одной и той же сцены, сделанных в разное время, с разных точек съемки и/или разными датчиками, она геометрически выравнивает два изображения - неподвижное и движущееся. Для МРТ-последовательностей, полученных в рамках одной съемки, нужно исключить возможное смещение головы пациента (за счет дыхания, непроизвольных и произвольных движений). По нашему опыту, это необходимо делать для всех обследуемых, так как «на глаз» достаточно сложно оценить наличие смещения, а попиксельное совпадение объектов на серийных томограммах важно для корректного обнаружения и сегментации (очерчивания границ) патологии. Если в базе были томограммы с нескольких МРТ-сканеров, то выполнялась регистрация к «эталонному» изображению. Это обеспечивало одинаковое положение и сходные размеры объекта интереса. На рис. 2 представлена схема регистрации изображений, используемая в рамках нашего проекта.

Рис. 2. Схема регистрации изображений Fig. 2. Image registration scheme

При этом заранее был выбран «эталонный» пациент на основании критериев: высокое качество снимков, ровное расположение головы, отсутствие значимых искажений анатомии вследствие заболевания. Для регистрации к эталону выбрана последовательность Т1С из-за максимального качества снимков (минимальный размер воксела), максимальной контрастности всех маркеров, используемых для ориентировки алгоритмов регистрации. Разработанные процедуры регистрации изображений имеют достаточно много настроек по заданию функции отображения. Можно допустить «простой» поворот объекта как единого целого с возможностью сохранения размеров, так и разное масштабирование по различным осям (например, при наличии неизовоксельных пакетов томограмм). Могут быть использованы более сложные процедуры, которые допускают уже неравномерное изменение расстояний и углов для различных точек изображения. При регистрации к эталонному изображению у каждого пациента корректировалось только положение головы. При регистрации внутри серии акцент был сделан на максимально возможное совмещение снимков.

Шестой этап регистрации изображений -разметка (сегментация) - является самым сложным и трудоемким во всей процедуре подготовки данных. Он требует максимального вовлечения высококвалифицированных радиологов. Уже на этапе инициации проекта необходимо стандартизовать требования как к технической точности разметки, так и к параметрам выделения отдельных компонентов патологического очага, к сопутствующим перифокальным участкам с «переходными» изменениями, к параметрам анатомических структур, важных для решения задач исследования.

Для нашего проекта выделены следующие области интереса на основании важности для принятия решения о дальнейшей тактике нейрохирургического вмешательства:

- контрастированные опухолевые узлы - злокачественная ткань с высокой проницаемостью микрососудов - должны быть удалены как можно более тщательно во время операции;

- неконтрастируемые узлы - опухоль с еще не нарушенной проницаемостью микрососудов -должны быть удалены как можно более тщательно во время операции;

- кистозный компонент внутри злокачественных опухолей также требует удаления, так как стенки кист, как правило, содержат злокачественные клетки, а жидкий компонент может стать дополнительным источником прогрессирования опухоли, что усложняет хирургическую тактику;

- некротические локусы уже не представляют онкологической опасности, но также подлежат хирургическому удалению, насколько это технически возможно;

- область отека - хирургически не удаляется, как правило, это достаточно интактная ткань, которая при благоприятном течении полностью восстанавливается морфологически и функционально.

В силу сложности идентификации/дифферен-цировки кистозного компонента и некроза они были объединены в один класс (Necr). Таким образом, для ИИ-сегментации были выбраны следующие компоненты опухоли и связанного с ней отека: Necr - некроз и кистозный компонент (the necrotic tumor core), EnTu - поглощающая Gd-контраст опухолевая ткань (GD-enhancing tumor), NenTu - не поглощающая Gd-контраст опухолевая ткань (the non-enhancing tumor), Ed - периту-моральный отек (peritumoral edema).

Для разметки можно использовать различное программное обеспечение, предназначенное для сегментации изображений. Существует достаточно много платных приложений, которые совмещают функции просмотра изображений и функции системы управления базой данных с различными инструментами, в том числе на основе ИИ, настроенных для сегментации отдельных видов заболеваний. Среди бесплатных можно выделить два наиболее популярных продукта: ITK-snap [4] (http://www.itksnap.org) и 3D Slicer [5] (https://www.slicer.org/). В части случаев использовалась разработанная и специально обученная нами нейросеть для предварительной разметки нейроонкологических томограмм, с последующей валидацией результатов сегментации специалистами-радиологами. С ростом обучающей выборки автоматизированный подход позволяет экономить время. Комбинируя различные виды инструментов, можно достичь скорости разметки одного 3D пакета 5 мин, но в случаях, когда работать приходится с каждым срезом отдельно (2D пакет), время разметки может достичь 2-4 часов.

Седьмой этап включал согласование полученной разметки с экспертами. В нашем случае их было два: ведущий радиолог Федерального центра нейрохирургии г. Новосибирска и эксперт-радиолог с обширным опытом работы по анализу МРТ-изображений головного мозга в норме и в широком диапазоне неврологических, сосудистых, травматологических и онкологических патологий.

На восьмом этапе проводилась корректировка разметки по замечаниям экспертов. Два последних этапа повторялись до тех пор, пока оба

эксперта не приходили к единому мнению по поводу корректности разметки.

Девятый этап включал сохранение итоговой разметки и последовательностей в базу данных размеченных изображений. Для этого использовался формат NifTI, достаточно широко применяющийся для хранения данных подобного типа. Параллельно поддерживалась сопроводительная база с описанием случаев, диагнозами, примечаниями по разметке.

Результаты

В настоящее время получена, анонимизиро-вана и зарегистрирована (сведена в базу данных Siberian Brain Tumor Dataset, SBT Dataset) клиническая информация о 991 пациенте нейрохирургического профиля с полностью верифицированными постоперационными диагнозами (гистологически и иммуногистохимически); сегментированы (размечены границы компонентов опухолей) трехмерные МРТ-изображения головного мозга пациентов со следующими патологиями (до оперативного лечения): менингиома, не-вринома, глиобластома, астроцитома, метастазы (рака молочной железы, почек, аденокарциномы легких, меланомы, рака матки, предстательной железы и др.). В табл. 1 представлено количество размеченных случаев и данные по возрасту пациентов.

Таблица 1. База данных SBT - количество размеченных случаев и данные о возрасте пациентов

Table 1. SBT database - number of tagged cases and patient age data

Тип объекта n Размеченных опухолей (до операции) Возраст (лет), медиана (интерквар-тильный размах)

Астроцитома 119 65 37 (31; 56)

Глиобластома 225 105 57 (48; 63)

Менингиома 283 150 58 (50; 64)

Невринома 238 125 53 (40; 59)

Метастазы 126 85 60 (52; 67)

ВСЕГО 991 530

На рис. 3 приведены примеры ИИ-сегментации каждого типа опухоли с разметкой, согласованной с двумя экспертами. Аннотация контуров (масок): ткань опухоли, поглощающая Gd-контрастный препарат (красный), опухоль без контрастного усиления (синий), некротизирован-ное ядро опухоли (зеленый) и перитуморальный отек (желтый).

Обсуждение

В табл. 2 приведена информация о базах данных, сопоставимых по характеру материала и на-

Таблица 2. Доступные базы данных по схожей тематике

Table 2. Available databases on similar topics

База данных Опухоли, количество случаев Наличие разметки опухоли Примечание

Multimodal Brain Tumor Segmentation (BraTS) [6] Глиобластома высокой степени злокачественности (GBM/HGG), глиома низкой степени злокачественности (LGG) - 660 Оа-контрастируемая часть опухоли, перитуморальный отек, некротическое ядро опухоли, неконтрастируе-мое ядро опухоли Пакеты Т1-ВИ, Т2-ВИ, Т2-Flair и Т1С МР-томограмм по 155 срезов. База содержит данные по выживаемости

Multimodal Brain Tumor Segmentation (BraTS) [7, 8] Глиобластома и астроцитома (WHO Grade 4) без разбивки - 2000 Оа-контрастируемая часть опухоли, некротическое и неконтрастируемое ядро опухоли (1 класс), периту-моральный отек Пакеты Т1-ВИ, Т2-ВИ, Т2-Flair и Т1С МР-томограмм по 155 срезов. Дополнительные данные по метилированию промотора гена МОМТ

Brain Tumor Dataset [9] 233 случая. Количество срезов: 708 менингиом, 1426 глиом и 930 аденом гипофиза Нет Пакеты Т1-ВИ и Т1С (Оа-усиленных) МР-томограмм

The Cancer Imaging Archive collection (TCIA) [10] 11 наборов данных: от 19 до 262 случаев high-grade glioblastoma & lower-grade glioma Нет Дополнительно есть геномные данные и снимки КТ для некоторых коллекций

Рис. 3. Примеры ИИ-сегментации астроцитомы (а), глиобластомы с развившимся в противоположном

полушарии ядром неконтрастируемой опухоли (б), менингиомы (в), невриномы (г) и множественных метастазов аденокарциномы (д) (слева направо: Т1С, FLAIR, T1, T2, 3D-реконструкция) Fig. 3. Examples ofAI segmentation of an astrocytoma (а), of glioblastoma with a non-contrastable tumor nucleus

developed in the opposite hemisphere (б), of a meningioma (в), of a neurinoma (г), of multiple adenocarcinoma metastases (д) (from left to right: T1C, FLAIR, T1, T2, 3D-reconstruction)

бранным объемам информации. Представленный в работе SBT Dataset является достаточно уникальным в силу большого объема случаев и разнообразия представленных типов образований, полностью верифицированными диагнозами и тщательно выполненной разметкой (маской) опухоли и ее компонентов.

Заключение

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Создан набор данных (SBT Dataset) сегментированных 3D МРТ-изображений 5 видов опухолей головного мозга около 1000 верифицированных наблюдений (с послеоперационным гистологическим подтверждением), сопоставимый по объему и характеру материалов с известными мировыми аналогами. Использованные методические подходы инициализации, планирования и реализации базы данных выбраны с позиции принципов «компьютерного зрения», поэтому SBT Dataset может быть использован при обучении ИИ с функциями помощника врача для дооперацион-ной МРТ-диагностики в нейрохирургии [11-14].

Список литературы / References

1. McDonald R.J., Schwartz K.M., Eckel L.J., Diehn F.E., Hunt C.H., Bartholmai B.J., Erickson B.J., Kallmes D.F. The effects of changes in utilization and technological advancements of cross-sectional imaging on radiologist workload. AcadRadiol. 2015;22(9):1191-1198. doi: 10.1016/j.acra.2015.05.007

2. Зрелов А.А., Нечаева А.С., Воинов Н.Е. Обновленная классификация первичных опухолей центральной нервной системы как основа персонализированного подхода к терапии пациентов. Рос. ж. персонализ. мед. 2022;2(4):6-13. doi: 10.18705/2782-3806-2022-2-4-6-13

Zrelov A.A., Nechaeva A.S., Voinov N.E. Updated classification of tumors of the central nervous system as the basis for individual patient therapy. Rossiys-kiy zhurnal personalizirovannoy meditsiny = Russian Journal for Personalized Medicine. 2022;2(4):6-13. [In Russian]. doi: 10.18705/2782-3806-2022-2-4-6-13

3. Общий регламент защиты персональных данных (GDPR) Европейского союза. Режим доступа: https://gdpr-text.com/ru/

General Data Protection Regulation (GDPR) of the European Union. Available at: https://gdpr-text.com/en/

4. Yushkevich P.A., Piven J., Hazlett H.C., Smith R.G., Ho S., Gee J.C., Gerig G. User-guided 3D active contour segmentation of anatomical structures: Significantly improved efficiency and reliability. Neu-

roimage. 2006;31(3):1116-1128. doi: 10.1016/j.neuro-image.2006.01.015

5. Fedorov A., Beichel R., Kalpathy-Cramer J., Finet J., Fillion-Robin J.-C., Pujol S., Bauer C., Jennings D., Fennessy F.M., Sonka M., ... Kikinis R. 3d slicer as an image computing platform for the quantitative imaging network. Magn. Reson. Imaging. 2012;30(9):1323-1341. doi: 10.1016/j.mri.2012.05.001

6. Menze B.H., Jakab A., Bauer S., Kalpathy-Cramer J., Farahani K., Kirby J., Burren Y,. Porz N., Slot-boomy J., Wiest R. ... van Leemput K. The multimodal brain tumor image segmentation benchmark (BRATS). IEEE Trans. Med. Imaging. 2015;34(10):1993-2024. doi: 10.1109/TMI.2014.2377694

7. Bakas S., Akbari H., Sotiras A., Bilello M., Rozycki M., Kirby J.S., Freymann J.B., Farahani K., Davatzikos C. Advancing the cancer genome atlas gli-oma MRI collections with expert segmentation labels and radiomic features. Sci. Data: 2017;4:170117. doi: 10.1038/sdata.2017.117

8. Baid U., Ghodasara S., Mohan S., Bilello M., Ca-labrese E., Colak E., Farahani K., Kalpathy-Cramer J., Kitamura F.C., Pati S., Prevedello L.M. ... Bakas S. The RSNA-ASNR-MICCAI BraTS 2021 Benchmark on Brain tumor segmentation and radiogenomic classification. Computer Vision and Pattern Recognition. 2021;2107.02314. doi: 10.48550/arXiv.2107.02314

9. Cheng Jun. Brain tumor dataset. figshare. Dataset. Available at: https://doi.org/10.6084/m9. figshare.1512427.v5

10. The Cancer Imaging Archive. The cancer imaging archive collection (TCIA). Available at: https:// www.cancerimagingarchive.net/collections/

11. Groza V., Tuchinov B., Pavlovskiy E., Amelina E., Amelin M., Golushko S., Letyagin A. Data preprocessing via multi-sequences MRI mixture to improve brain tumor segmentation. Bioinformatics and Biomedical Engineering. 2020;12108:695-704. doi: 10.1007/978-3-030-45385-5_62

12. Futreg M., Miles, A., Marcinkiewicz M., Rib-alta P. Optimized U-net for brain tumor segmentation. In: Brainlesion: glioma, multiple sclerosis, stroke and traumatic brain injuries. 2022;12963:15-29. doi: 10.1007/978-3-031-09002-8_2

13. Zhang W., Wu Y., Yang B., Hu S., Wu L., Dhe-limd S. Overview of multi-modal brain tumor MR image segmentation. Healthcare (Basel). 2021;9(8):1051. doi: 10.3390/healthcare9081051

14. Liu Z., Tong L., Chen L., Jiang Z., Zhou F., Zhang Q., Zhang X., Jin Y., Zhou H. Deep learning based brain tumor segmentation: a survey. Complex Intell. Syst. 2022. Available at: doi.org/10.1007/s40747-022-00815-5

Сведения об авторах:

Евгения Валерьевна Амелина, к.ф.-м.н., ORCID: 0000-0001-7537-3846, e-mail: amelina.evgenia@gmail.com Андрей Юрьевич Летягин, д.м.н., проф., ORCID: 0000-0002-9293-4083; e-mail: letyagin-andrey@yandex.ru Баир Николаевич Тучинов, ORCID: 0000-0002-8931-9848, e-mail: bairt@nsu.ru Николай Юрьевич Толстокулаков, ORCID: 0000-0002-4547-2699

Михаил Евгеньевич Амелин, к.м.н., ORCID: 0000-0002-5933-6479, e-mail: amelin81@gmail.com Евгений Николаевич Павловский, к.ф.-м.н., ORCID: 0000-0001-6976-1885, e-mail: pavlovskiy@post.nsu.ru Владимир Валерьевич Гроза, PhD, e-mail: vladimir.groza@gmail.com

Сергей Кузьмич Голушко, д.ф.-м.н., проф., ORCID: 0000-0002-0207-7648, e-mail: s.k.golushko@gmail.com Information about the authors:

Evgenia V. Amelina, candidate of physical and mathematical sciences, ORCID: 0000-0001-7537-3846,

e-mail: amelina.evgenia@gmail.com Andrey Yu. Letyagin, doctor of medical sciences, professor, ORCID: 0000-0002-9293-4083,

e-mail: letyagin-andrey@yandex.ru Bair N. Tuchinov, ORCID: 0000-0002-8931-9848, e-mail: bairt@nsu.ru Nikolai Yu. Tolstokulakov, ORCID: 0000-0002-4547-2699

Mikhail E. Amelin, candidate of medical sciences, ORCID: 0000-0002-5933-6479, e-mail: amelin81@gmail.com Evgeny N. Pavlovsky, candidate of physical and mathematical sciences, ORCID: 0000-0001-6976-1885,

e-mail: pavlovskiy@post.nsu.ru Vladimir V. Groza, PhD, e-mail: vladimir.groza@gmail.com

Sergey K. Golushko, doctor of physical and mathematical sciences, professor, ORCID: 0000-0002-0207-7648, e-mail: s.k.golushko@gmail.com

Поступила в редакцию 01.11.2022 После доработки 17.11.2022 Принята к публикации 22.11.2022

Received 01.11.2022 Revision received 17.11.2022 Accepted 22.11.2022

i Надоели баннеры? Вы всегда можете отключить рекламу.