Научная статья на тему 'СТРАТИФИКАЦИЯ УЗЛОВЫХ ОБРАЗОВАНИЙ ЩИТОВИДНОЙ ЖЕЛЕЗЫ ПО КАТЕГОРИЯМ EU-TIRADS С ИСПОЛЬЗОВАНИЕМ ТРАНСФЕРНОГО ОБУЧЕНИЯ СВЁРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ'

СТРАТИФИКАЦИЯ УЗЛОВЫХ ОБРАЗОВАНИЙ ЩИТОВИДНОЙ ЖЕЛЕЗЫ ПО КАТЕГОРИЯМ EU-TIRADS С ИСПОЛЬЗОВАНИЕМ ТРАНСФЕРНОГО ОБУЧЕНИЯ СВЁРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
229
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЩИТОВИДНАЯ ЖЕЛЕЗА / УЛЬТРАЗВУКОВАЯ ДИАГНОСТИКА / МАШИННОЕ ОБУЧЕНИЕ / ГЛУБОКОЕ ОБУЧЕНИЕ / НЕЙРОННАЯ СЕТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Фартушный Э. Н., Сыч Ю. П., Фартушный И. Э., Кошечкин К. А., Лебедев Г. С.

В статье описан метод оценки потенциала злокачественности узловых образований щитовидной железы и их стратификации по шкале European Thyroid Imaging And Reporting Data System - Европейской системы описания и оценки образований щитовидной железы (Eu-TIRADS) по данным изображений ультразвуковой диагностики c использованием системы искусственного интеллекта. Метод основан на применении технологии трансферного обучения многопараметрических моделей сверточных нейронных сетей и последующей их тонкой настройки. Показано, что даже на основании небольшого набора данных, состоящего из 1129 ультразвуковых изображений узловых образований щитовидной железы, классифицированных по 5 категориям Eu-TIRADS, применение метода обеспечивает высокие показатели точности обучения (Accuracy: 0.8, AUC: 0.92). Это позволяет внедрить и использовать данную технологию в клинической практике как дополнительное средство («второе мнение») объективной оценки риска злокачественности в узлах щитовидной железы с целью дальнейшего их отбора для тонкоигольной биопсии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Фартушный Э. Н., Сыч Ю. П., Фартушный И. Э., Кошечкин К. А., Лебедев Г. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STRATIFICATION OF THYROID NODULES BY EU-TIRADS CATEGORIES USING TRANSFER LEARNING OF CONVOLUTIONAL NEURAL NETWORKS

The article describes a method for assessing the malignancy potential of thyroid nodules and their stratification according to the European Thyroid Imaging And Reporting Data System (Eu-TIRADS) scale based on ultrasound diagnostic images using an artificial intelligence system. The method is based on the use of transfer learning technology for multi-parameter models of convolutional neural networks and their subsequent fine tuning. It was shown that even on a small dataset consisting of 1129 thyroid ultrasound images classified by 5 Eu-TIRADS categories, the application of the method provides high training accuracy (Accuracy: 0.8, AUC: 0.92). This makes it possible to introduce and use this technology in clinical practice as an additional tool (‘second opinion’) for an objective assessment of the risk of malignancy in thyroid nodules for the purpose of their further selection for fine needle biopsy.

Текст научной работы на тему «СТРАТИФИКАЦИЯ УЗЛОВЫХ ОБРАЗОВАНИЙ ЩИТОВИДНОЙ ЖЕЛЕЗЫ ПО КАТЕГОРИЯМ EU-TIRADS С ИСПОЛЬЗОВАНИЕМ ТРАНСФЕРНОГО ОБУЧЕНИЯ СВЁРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ»

СТРАТИФИКАЦИЯ УЗЛОВЫХ ОБРАЗОВАНИЙ ЩИТОВИДНОЙ ЖЕЛЕЗЫ ПО КАТЕГОРИЯМ EU-TIRADS С ИСПОЛЬЗОВАНИЕМ ТРАНСФЕРНОГО ОБУЧЕНИЯ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ

© Э.Н. Фартушный, Ю.П. Сыч*, И.Э. Фартушный, К.А. Кошечкин, Г.С. Лебедев

Первый МГМУ им. И.М. Сеченова (Сеченовский Университет), Москва, Россия

В статье описан метод оценки потенциала злокачественности узловых образований щитовидной железы и их стратификации по шкале European Thyroid Imaging And Reporting Data System — Европейской системы описания и оценки образований щитовидной железы (Eu-TIRADS) по данным изображений ультразвуковой диагностики c использованием системы искусственного интеллекта. Метод основан на применении технологии трансферного обучения многопараметрических моделей сверточных нейронных сетей и последующей их тонкой настройки. Показано, что даже на основании небольшого набора данных, состоящего из 1129 ультразвуковых изображений узловых образований щитовидной железы, классифицированных по 5 категориям Eu-TIRADS, применение метода обеспечивает высокие показатели точности обучения (Accuracy: 0.8, AUC: 0.92). Это позволяет внедрить и использовать данную технологию в клинической практике как дополнительное средство («второе мнение») объективной оценки риска злокачественности в узлах щитовидной железы с целью дальнейшего их отбора для тонкоигольной биопсии.

КЛЮЧЕВЫЕ СЛОВА: щитовидная железа; ультразвуковая диагностика; машинное обучение; глубокое обучение; нейронная сеть.

STRATIFICATION OF THYROID NODULES BY EU-TIRADS CATEGORIES USING TRANSFER LEARNING OF CONVOLUTIONAL NEURAL NETWORKS

© Eduard N. Fartushnyi, Yulia P. Sytch*, Igor E. Fartushnyi, Konstantin A. Koshechkin, Georgy S. Lebedev I.M. Sechenov First Moscow State Medical University

The article describes a method for assessing the malignancy potential of thyroid nodules and their stratification according to the European Thyroid Imaging And Reporting Data System (Eu-TIRADS) scale based on ultrasound diagnostic images using an artificial intelligence system. The method is based on the use of transfer learning technology for multi-parameter models of convolutional neural networks and their subsequent fine tuning. It was shown that even on a small dataset consisting of 1129 thyroid ultrasound images classified by 5 Eu-TIRADS categories, the application of the method provides high training accuracy (Accuracy: 0.8, AUC: 0.92). This makes it possible to introduce and use this technology in clinical practice as an additional tool ('second opinion') for an objective assessment of the risk of malignancy in thyroid nodules for the purpose of their further selection for fine needle biopsy.

KEYWORDS: thyroid gland; ultrasound diagnostics; machine learning; deep learning; neural network.

ВВЕДЕНИЕ

Узловой зоб — чрезвычайно распространенное явление. По данным эпидемиологических исследований, каждый третий-четвертый взрослый житель России имеет то или иное образование в щитовидной железе (ЩЖ), большая часть из которых оказываются доброкачественными и не требуют активного лечения [1]. Главная цель обследования пациента с узловым зобом заключается в выявлении агрессивных форм рака ЩЖ. Основным методом визуализации узлов ЩЖ служит ультразвуковое исследование (УЗИ), в задачи которого входят выявление узлов, оценка риска их злокачественности и отбор для дальнейшей биопсии. Известно, что метод УЗИ в значительной степени является субъективным, зависит от знаний и опыта врача, что часто приводит к необходимости обращения за экспертным мнением.

С целью объективизировать оценку ультразвуковых признаков узлов ЩЖ были предложены системы TIRADS

(Thyroid Imaging And Reporting Data System — система описания и оценки образований щитовидной железы), из которых в нашей стране получила наибольшее распространение европейская версия (Eu-TIRADS) [2]. В этой системе узловые образования распределяются по пяти категориям в зависимости от наличия/отсутствия ультразвуковых признаков злокачественности. По мере увеличения категории увеличивается риск злокачественности и усиливаются показания к биопсии узла. Тем не менее воспроизводимость TIRADS в реальной практике оказалась различной среди врачей с разным опытом работы [3].

Развитие технологий искусственного интеллекта [4] и создание компьютерных диагностических систем для интеллектуальной оценки медицинских изображений (an image-based computer-aided diagnosis system (CAD)) могут использоваться в качестве средств поддержки принятия решений, оказывающих помощь клиницисту при сложностях в диагностике серьезных заболеваний, в том числе рака ЩЖ [5].

*Автор, ответственный за переписку / Corresponding author.

© Endocrinology Research Centre, 2022_Received: 08.07.2022. Accepted: 03.10.2022.

Мы провели пилотное исследование по трансфер-ному обучению нейронной сети как метода искусственного интеллекта для распознавания и классификации ультразвуковых изображений узлов ЩЖ в соответствии с категориями Eu-TIRADS.

МАТЕРИАЛЫ И МЕТОДЫ

В последние годы в задачах распознавания и классификации изображений удалось добиться качественных результатов именно за счет использования методов глубокого обучения. Однако время обучения и объем данных, необходимых для построения качественных систем, намного больше, чем у традиционных систем машинного обучения.

Архитектура современных нейронных сетей, используемых в задачах компьютерного зрения и обработки изображений, представляется сотнями слоев с сотнями миллионов обучаемых параметров. Качественное обучение нейронных сетей для обработки медицинских изображений, помимо подготовки и разметки данных, требует значительных временных затрат и создания дорогой вычислительной инфраструктуры. Вместе с тем модели, обученные на других задачах, доступны, опубликованы, разрешено их использование. Такие предварительно обученные нейронные сети и модели составляют основу трансферного обучения (рис. 1). Эти модели глубокого обучения представляют собой многоуровневые архитектуры, которые способны на разных слоях выделять ключевые признаки, выполнять

Model Size (MB) Top-1 Accuracy Top-5 Accuracy Parameters Depth Time (ms) per inference step (CPU) Time (ms) per inference step (GPU)

Xcepcion ss 79.0% 94.5% 22.9M 81 109.4 8.1

VGG16 528 71.3% 90.1% 138.4M 16 69.5 4.2

VGG19 549 71.3% 90.0% 143.7M 19 84.8 4.4

ResNet50 98 74.9% 92.1% 25.6M 107 58.2 4.6

ResNet50V2 98 76.0% 93.0% 25.6M 103 45.6 4.4

ResNet101 171 76.4% 92.8% 44.7M 209 89.6 5.2

ResNet101 V2 171 77.2% 93.8% 44.7 M 205 72.7 5.4

ResNet152 232 76.6% 93.1% 60.4M 311 127.4 6.5

ResNetl 52V2 232 78.0% 94.2% 60.4M 307 107.5 6.6

lnceptionV3 92 77.9% 93.7% 23.9M 189 42.2 6.9

lnceptionResNe-V2 215 80.3% 95.3% 55.9M 449 130.2 10.0

MobileNet 16 70.4% 89.5% 4.3 M 55 22.6 3.4

MobileNecV2 14 71.3% 90.1% 3.5M 105 25.9 3.8

DenseNetl 21 33 75.0% 92.3% 8.1 M 242 77.1 5.4

DenseNetl 69 57 76.2% 93.2% 14.3M 338 96.4 6.3

DenseNet201 80 77.3% 93.6% 20.2M 402 127.2 6.7

NASNetMobile 23 74.4% 91.9% 5.3M 389 27.0 6.7

NASNetLarge 343 82.5% 96.0% 8S.9M 533 344.5 20.0

EfficientNetBO 29 77.1% 93.3% 5.3M 132 46.0 4.9

EfficiencNecBI 31 79.1% 94.4% 7.9M 186 60.2 5.6

EfficientNetB2 36 80.1% 94.9% 9.2M 186 80.8 6.5

EfficientNet33 48 81.6% 95.7% 12.3M 210 140.0 8.8

EfficientNetB4 75 82.9% 96.4% 19.5M 258 308.3 15.1

EfficientNetBS 118 83.6% 96.7% 30.6M 312 579.2 25.3

EfficientNetB6 166 84.0% 96.8% 43.3M 360 958.1 40.4

EfficientNetB7 256 84.3% 97.0% 66.7M 438 1578.9 61.6

EfficientNetV2B0 29 78.7% 94.3% 7.2M - - -

EfficientNetV2B1 34 79.8% 95.0% 8.2M - - -

EfficientNetV2B2 42 80.5% 95.1% 10.2M - - -

EfficientNetV2B3 59 82.0% 95.8% 14.5M - - -

EfficientNetV2S 88 83.9% 96.7% 21.6M - - -

EfficientNetV2M 220 85.3% 97.4% 54.4M - - -

EfficientNetV2L 479 85.7% 97.5% 119.0M - - -

Рис. 1. Обученные модели сверточных нейронных сетей в репозитории TensorFlow и их характеристики (https://www.tensorflow.org/) [6].

иерархические многоуровневые представления функций. А на последнем слое осуществляется вероятностная классификация и формируется окончательный результат. Такая многоуровневая архитектура позволяет нам использовать предварительно обученную сеть без ее входных и выходных слоев в качестве средства извлечения фиксированных признаков для решения нашей задачи.

Для распределения ультразвуковых изображений узловых образований ЩЖ по категориям Eu-TIRADS мы замораживали сверточные слои ранее обученной нейронной сети с известной архитектурой и добавляли свои слои в начало и конец модели. Мы использовали модель Xception — 22,9 млн параметров, 81 слой нейронов, предварительно обученную на наборе данных Imagenet (https://image-net.org/), содержащем более 10 млн аннотированных изображений.

Главная идея метода заключается в том, что сверточные слои обученной модели извлекают общие, низкоуровневые функции, которые будут применимы к изображениям ультразвуковой диагностики ЩЖ, такие как границы патологии, узоры, паттерны и градиенты, а в более поздних слоях мы определим функции для классификации изображений по категориям Eu-TIRADS.

В начало модели мы добавляли слои для изменения размеров входных изображений, снимаемых с УЗИ, и согласования нашего выходного слоя с параметрами входного слоя ранее обученной модели нейронной сети.

В среднюю часть создаваемой модели мы переносили ранее обученную модель и замораживали ее веса на период обучения новой модели. Для обработки снимаемых при УЗИ изображений мы использовали архитектуру сверточных нейронных сетей.

Разработка и обучение модели велись с использованием программной библиотеки машинного обучения TensorFlow [6], в связи с чем дальнейшие названия слоев и функций представлены в ее транскрипциях.

В выходные слои создаваемой модели мы последовательно добавляли:

• слой пуллинга — GlobalAveragePooling2D (GAP);

• слой регуляризации Dropout для предотвращения переобучения модели;

• слой Dense c 5 выходными нейронами по числу категорий Eu-TIRADS и softmax-функцией для оценки вероятности отнесения, подаваемого на вход нейронной сети УЗ-изображения к тому или иному классу Eu-TIRADS.

1. После последнего сверточного слоя модели Xception мы ввели слой пуллинга, чтобы заменить полносвязанный слой на GlobalAveragePooling. Делая это, мы исходили из следующих соображений: во-первых, слой пуллинга является более простым и естественным для преобразования между картой объектов и окончательной классификацией, а во-вторых, в отличие от полносвязанного слоя, который требует большого количества параметров обучения и настройки, уменьшение пространственных параметров сделает модель более устойчивой к переобучению.

2. Слой Dropout мы добавляли с параметром отсева 0.3 после слоя пуллинга, чтобы включить дополнительную регуляризацию. По сути, добавление Dropout-слоев — это эффективный метод регуляризации при обучении нейронных сетей. Его можно применять отдельно как к входным слоям, так и к скрытым. В нашем случае Dropout-слой случайным образом маскировал выходные значения с нейронов слоя пуллинга, устанавливая их вывод равным нулю, — это 30% слоя GlobalAveragePooling.

3. На последнем слое Dense, для конечной классификации УЗИ узловых образований ЩЖ по 5 классам EU-TIRADS, мы использовали мультиклассовую функцию softmax.

4. Таким образом, общее количество добавленных слоев в модели трансферного обучения составило 4: один — для входной нормализации изображений и 3 выходных слоя.

Для эксперимента с трансферным обучением мы выбрали модель Xception, так как при сравнительно небольшом количестве обученных параметров (22,9 млн) и размере самой модели (88 Мб) она обеспечивала достаточно высокую точность классификации при обучении на немедицинском датасете.

Архитектура создаваемой модели для трансферного обучения представлена на рисунке 2.

В результате создаваемая модель нейронной сети включала 86 слоев, общее количество параметров построенной модели составило 20 871 725, из которых только 10 245 были обучаемыми.

В результате технологический конвейер трансферного обучения нейронной сети для решения задач классификации ультразвуковых изображений образований ЩЖ по категориям Eu-TIRADS был реализован в несколько этапов.

Рис. 2. Архитектура модели трансферного обучения для классификации по Eu-TIRADS c обученными слоями модели Xœption.

Распределение УЗИ по размерам в пикселях

Частичный срез

1200 1000

¡S 800

о у

" 600 400 200

200 300

400 500 600 ширина

700 800

800 700 600 500

о

Z400

m

300 200

лз

100

100 200 300 400 500 600 700 800 ширина

Рис. 3. Распределение исходных размеров ультразвуковых изображений в размеченном датасете.

Специалистами клиники эндокринологии Сеченовского Университета с опытом ультразвуковой диагностики более 15 лет был подготовлен и распределен по категориям Eu-TIRADS набор УЗ-изображений (да-тасет) ЩЖ. Размеченный датасет содержал 1129 изображений в формате jpg.

Для размеченного датасета оценивалась его сбалансированность по классам.

4.

Оценивался разброс размеров ширина/высота размеров УЗ-изображений для определения необходимых параметров нормализации. После чего изображения в размеченном датасете нормировались по средним значениям (рис. 3). Для каждого УЗ-изображения проводилась предварительная обработка по 2 показателям — нормализация размеров (рис. 4) и сглаживание по показателям в каналах

0 50 100 150 200 250

0 50 100 150 200 250

0 50 100 150 200 250

0 50 100 150 200 250

0 50 100 150 200 250 0 50 100 150 200 250

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 4. Нормализованные изображения (пример 1, 4, 5 классов).

5

1

4

(491, 413,3)

100

200

300

400

0 100 200 300 400

g

100

200

300

400

100

200

300

400

0-

100

200

300-

400

100 200 300 400 0 100 200 300 400 0 100 Рис. 5. RGB-профиль ультразвукового изображения в выборке.

200 300 400

цвета RGB («Red» (красный), «Green» (зеленый), «Blue» (синий)) (рис. 5). Нормализация цветовых каналов осуществлялась по минимаксному методу. Вычислялась разница между максимальным и минимальным значениями для проецирования в диапазон [0; 1]. После чего исходные значения всех пикселей, деленные на максимальное значение всех исходных значений пикселей, принимались за нормализованные значения. Такая нормализация изображений приводила их к единому размеру с цветовыми нормализованными диапазонами, что было необходимо для передачи на входной слой нейронной сети.

5. После этого каждое изображение загружалось в тензор с параметрами «высота», «ширина», «канал».

6. Проводилась аугментация изображений для повышения качества обучения (рис. 6.) Аугментация выполнялась для снижения вероятности переобучения модели. Причина возможного переобучения модели заключалась в том, что мы использовали ограниченный набор данных для обучения, и модель продолжала «видеть» и обучаться на одних и тех же экземплярах с течением времени в каждую эпоху. Для борьбы с этим использовалась стратегия увеличения/уменьшения

0 50 100 150 200 250

original

0 50 100 150 200 250

augmented

0 50 100 150 200 250 0 50 100 150 200 250

Рис. 6. Оригинальное и аугментированное ультразвуковое изображение

0

b

r

0

0

0

Классы TI-RADS

50

100

150

200

250

Рис. 7. Распределение по категориям Eu-TIRADS в размеченном датасете.

изображения и его развороты, чтобы дополнить наши существующие обучающие данные изображениями, которые являются небольшими вариациями существующих изображений. При аугментации использовались параметры для разворота изображений в пределах 20 градусов и сжатия/увеличения с коэффициентом 10%.

7. Выбиралась одна из моделей в репозитории обученных моделей, для нее замораживались имеющиеся веса на всех слоях. После чего добавлялись входные слои для масштабирования изображения к параметрам входного слоя и выходные слои с регуляризацией для предотвращения переобучения и выходной слой предсказания класса softmax.

8. Проводилось обучение модели и оценивались метрики качества обучения: точность (Accuracy) — доля правильных ответов модели, где 1 — 100% правильно распознанная категория, а 0 — категория не опознана;

матрица ошибок (неопознанная или неправильно опознанная категория); а также площадь под характеристической кривой (ROC AUC, Area Under Receiver Operating Characteristic Curve). Также оценивались чувствительность (TRP), специфичность (TNR), точность (PPV) и отрицательная прогностическая ценность (NPV).

9. Проводилась тонкая настройка обученной новой модели, для чего размораживались слои во встроенной модели и проводилось ее полное переобучение с очень низкими параметрами скорости/шага обучения. По тонко настроенной модели оценивалось качество на тестовой выборке.

10. Машинное обучение созданной нейронной сети проводилось с использованием пакетов TensorFlow 2.0 и Keras. Размер «batchx-пакета при обучении составил 32 изображения, что ограничивалось имеющимися вычислительными мощностями.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Распределение 1129 эхографических изображений узлов ЩЖ в наборе для трансферного обучения нейронной сети по категориям Eu-TIRADS представлено на рисунке 7: 187 изображений без узловых образований отнесены к 1-й категории Eu-TIRADS, из 942 изображений с узлами 267 распределены во 2-ю категорию Eu-TIRADS, 220 — в 3-ю категорию, 233 изображения — в 4-ю категорию и 222 — в 5-ю категорию Eu-TIRADS. Распределение изображений в датасете по категориям Eu-TIRADS представлено на рисунке 7. Классы датасета оказались достаточно сбалансированы между собой, т.е. содержали примерно одинаковое количество изображений. Примеры первых пяти эхограмм, распределенных по категориям Eu-TIRADS, представлены на рисунке 8.

5

0 50 100 150 200 250

100

200

300

0 100 200 300 400

0 100 200 300 400

аамийшк!

" ^^^^

4P

03

0 50 100 150 200 250

0-, 50] 100\ 150\

200J

250J 300]

350^

SIS

— A

A

- 1) * ►

i* tft.7 алпзо 30 t»

0 100 200 300 400 0 100 200 300 400 0 50 100 150 200 0 Рис. 8. Примеры распределения эхограмм щитовидной железы по категориям Eu-TIRADS.

100 200

300

2

5

0

0

1

1

4

Training

Epochs

Рис. 9. Показатели обучения. Диагностическая точность модели (accuracy) (голубой график) быстро увеличивается с каждой эпохой обучения.

Для обучения нейронной сети ранее подготовленную выборку 1129 изображений разделили следующим образом: 840 изображений для обучения, 200 — валида-ционная выборка, 89 — тестовая выборка для оценки качества модели. Каждое изображение помещалось в тензор («batchx-пакет, высота, ширина, канал). На каждой эпохе обучения оценивались точность модели (accuracy) и функция потерь (loss) по валидационной выборке для предотвращения переобучения. В результате уже на 8-й эпохе достигались приемлемые показатели качества обучения, когда точность диагностики (accuracy) превысила 0,9 (рис. 9).

Далее веса модели размораживались и проводилась тонкая настройка параметров на малом шаге обучения.

Результаты обучения оценивались на тестовой выборке из 89 УЗ-изображений посредством формирова-

ния матрицы ошибок статистической классификации по группам Eu-TIRADS (рис. 10). Матрица ошибок включает фактическое (Fact) и прогнозируемое моделью (Predict) распределение по классам Eu-TIRADS. Весьма положительным фактом является ее заметная асимметрия в сторону ложноположительных (FalsePositive) прогнозов, что не позволит пропустить имеющуюся патологию у пациента.

Параметры чувствительности и специфичности обученной нейронной сети для каждой категории Eu-TIRADS приведены в таблице 1.

Наименьшая чувствительность модели (33%) была зафиксирована для 4-й категории Eu-TIRADS: 3 из 9 изображений этой категории система распознала правильно, а 6 остальных изображений отнесла к «более злокачественной» 5-й категории Eu-TIRADS. Если расценить этот результат

Tirads Predictions Confusion matrix

0

1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ct 2 a

2

Predict

3

4

0

1

3

4

Рис. 10. Матрица ошибок. Классы модели (оси «Fact» и «Predict») соответствуют следующим категориям Eu-TIRADS: класс «0» — Eu-TIRADS 1, класс «1» — Eu-TIRADS 2, класс «2» — Eu-TIRADS 3, класс «3» — Eu-TIRADS 4, класс «4» — Eu-TIRADS 5.

Таблица 1. Чувствительность и специфичность нейронной сети для каждой категории Eu-TIRADS

Eu-TIRADS Чувствительность, % Специфичность, % Положительная прогностическая ценность, % Отрицательная прогностическая ценность (%)

1 74 100 100 86

2 100 96 84 100

3 80 97 33 87

4 33 89 25 92

5 78 77 78 87

как «не хуже, чем истинный» и не меняющий клиническую тактику, то чувствительность и специфичность модели для

4-й категории Eu-TIRADS будут составлять 89 и 95% соответственно. При этом для распознавания 1-й и 2-й категорий чувствительность модели оказалось близка к 100%. Специфичность (TNR) составила 89-96%. Худшее положительное прогностическое значение (PPV=78%) было получено для

5-й категории, при этом отрицательная прогностическая ценность (NPV) была не хуже 87%.

Наиболее важной метрикой оценки предсказательной силы нейронной сети для решения задачи классификации является площадь под характеристической кривой ROC AUC. Нижней границей допустимости AUC для искусственного интеллекта в медицинской диагностике принято считать 0,8. Применение нейросети в клинической практике имеет смысл только при достижении этого минимального значения.

На полученных нами графиках ROC-кривых для каждого класса видно, что показатели AUC — площади, ограниченной ROC-кривой и осью доли ложных положительных классификаций, находятся в пределах 0,8-0,99 (рис. 11).

Полученные результаты являются удовлетворительными и свидетельствуют о возможности применения описанного метода в клинической практике.

ЗАКЛЮЧЕНИЕ

В практике построения эффективных нейронных сетей для задач классификации изображений трансферное обучение находит активное применение. Это особенно важно в условиях ограничения имеющихся вычислительных мощностей и ресурсов.

Особую актуальность такой подход приобретает в задачах анализа медицинских изображений, когда трудоемкость разметки данных весьма значительна и может выполняться только специально подготовленным медицинским специалистом.

В основу теории трансферного обучения заложена гипотеза о том, что модель и параметры нейронной сети, обученной на большом наборе данных, причем не обязательно медицинских, можно перенести в новую модель. Таким образом, ранее накопленные знания при обуче-

Receiver operating characteristic

0.4 0.6

False Positive Rate

Рис. 11. ROC-кривая (кривая ошибок построенной модели). В «легенде» цифрами обозначены классы модели, которые соответствуют следующим категориям Eu-TIRADS: класс «0» — Eu-TIRADS 1, класс «1» — Eu-TIRADS 2, класс «2» — Eu-TIRADS 3, класс «3» — Eu-TIRADS 4, класс «4» —

Eu-TIRADS 5.

нии нейронных сетей переносятся для решения новой задачи, в нашем случае — для распределения ультразвуковых изображений ЩЖ по категориям Eu-TIRADS. Кроме этого, можно рассматривать трансферное обучение как весьма эффективное, когда в размеченном наборе данных (как в нашем случае) слишком мало данных для обучения полномасштабной модели с нуля.

В нашем пилотном исследовании мы провели трансферное обучение существующей нейронной сети по классификации УЗ-изображений ЩЖ в соответствии с риском злокачественности (риски оценивались по системе Eu-TIRADS). Результаты трансферного обучения модели, построенной c использованием предобу-ченных слоев Xception, показали, что такое обучение обеспечивает приемлемую диагностическую точность на уровне 90-99% для доброкачественных образований ЩЖ (1 и 2-я категории Eu-TIRADS), не требующих проведения биопсии, и 78-86% для узлов с высоким риском злокачественности (4 и 5-я категории Eu-TIRADS). Недостаточно однородные диагностические свойства модели, с наименьшим положительным прогностическим значением (PPV=78%) для Eu-TIRADS 5 и наибольшим (100%) для Eu-TIRADS 1, с отрицательной прогностической ценностью (NPV) не хуже 87% можно объяснить неравномерностью распределения тестовой выборки изображений по категориям Eu-TIRADS, ввиду ограниченного набора размеченных данных. Мы полагаем, что разметка дополнительных данных и расширение коллекции обучающего набора могут привести к повыше-

нию точности прогнозирования. При этом трансферное обучение может использоваться как эффективный метод построения моделей глубокого обучения нейронных сетей для классификации ультразвуковых изображений ЩЖ в соответствии с риском злокачественности по системе Eu-TIRADS.

Таким образом, предложенная нами модель может рассматриваться как основа для разработки программного обеспечения с перспективой применения в реальной клинической практике, в качестве инструмента отбора узлов ЩЖ для биопсии или динамического наблюдения. С этой целью мы планируем работу по дальнейшему расширению набора размеченных данных, обучению модели и ее тестированию в клинических исследованиях.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Источники финансирования. Не указан.

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с содержанием настоящей статьи.

Участие авторов. Авторы декларируют соответствие своего авторства международным критериям ICMJE. Все авторы в равной степени участвовали в подготовке публикации: разработка концепции статьи, получение и анализ фактических данных, написание и редактирование текста статьи, проверка и утверждение текста статьи.

СПИСОК ЛИТЕРАТУРЫ | REFERENCES

1. Черников Р.А., Воробьев С.Л., Слепцов И.В., и др. Узловой зоб (эпидемиология, методы выявления, диагностическая тактика) // Клиническая и экспериментальная тиреоидология. — 2013. — Т. 9. — №2. — С. 29-35. [Chernikov RA, Vorobjov SL, Slepzov IV, et al. Nodular goiter (epidemiology and diagnostics). Clinical and experimental thyroidology. 2013;9(2):29-35. (In Russ.)].

doi: https://doi.org/10.14341/ket20139229-35

2. Russ G, Bonnema SJ, Erdogan MF, et al. European Thyroid Association guidelines for ultrasound malignancy risk stratification of thyroid nodules in adults: The EU-TIRADS. Eur Thyroid J. 2017;6(5):225-237. doi: https://doi.org/10.1159/000478927

3. Sych YP, Fadeev VV, Fisenko EP, Kalashnikova M. Reproducibility and interobserver agreement of different Thyroid Imaging and Reporting Data Systems (TIRADS). Eur Thyroid J. 2021;10(2):161-167. doi: https://doi.org/10.1159/000508959

4. Tran B, Vu G, Ha G, et al. Global evolution of research in artificial intelligence in health and medicine: A bibliometric study. J Clin Med. 2019;8(3):360. doi: https://doi.org/10.3390/jcm8030360

5. Song J, Chai YJ, Masuoka H, et al. Ultrasound image analysis using deep learning algorithm for the diagnosis of thyroid nodules. Medicine (Baltimore). 2019;98(15):e15133. doi: https://doi.org/10.1097/MD.0000000000015133

6. Платформа машинного обучения TensorFlow [Интернет]. [Platforma mashinnogo obuchenija TensorFlow (In Russ.)]. Доступно по: https://www.tensorflow.org/

ИНФОРМАЦИЯ ОБ АВТОРАХ [AUTHORS INFO]

*Сыч Юлия Петровна, к.м.н. [Yulia P. Sytch, MD, PhD], адрес: 119991, Москва, ул. Трубецкая, д. 8, стр. 2 [address: 8-2 Trubetskaya str., Moscow 119991, Russia]; ORCID: https://orcid.org/0000-0002-7000-0095; eLibrary SPIN: 3406-0978; e-mail: juliasytch@mail.ru

Фартушный Эдуард Николаевич [Eduard N. Fartushnyi]; ORCID: https://orcid.org/0000-0003-4278-3077; eLibrary SPIN: 9763-4896; e-mail: fartushnyy_e_n@staff.sechenov.ru

Фартушный Игорь Эдуардович [Igor E. Fartushnyi]; ORCID: https://orcid.org/0000-0002-5563-9026; e-mail: igorfartushnyywork@mail.ru

Кошечкин Константин Александрович [Konstantin A. Koshechkin, PhD];

ORCID: https://orcid.org/0000-0001-7309-2215; eLibrary SPIN: 1709-1219; e-mail: koshechkin_k_a@staff.sechenov.ru Лебедев Георгий Станиславович [Georgy S. Lebedev, PhD]; ORCID: https://orcid.org/0000-0002-4289-2102; eLibrary SPIN: 2297-6877; e-mail: lebedev_g_s@staff.sechenov.ru

ИНФОРМАЦИЯ

Рукопись получена: 08.07.2022. Рукопись одобрена: 03.10.2022 Received: 08.07.2022. Accepted: 03.10.2022

ЦИТИРОВАТЬ:

Фартушный Э.Н., Сыч Ю.П., Фартушный И.Э., Кошечкин К.А., Лебедев Г.С. Стратификация узловых образований щитовидной железы по категориям Eu-TIRADS с использованием трансферного обучения сверточных нейронных сетей // Клиническая и экспериментальная тиреоидология. — 2022. — Т. 18. — № 2. — С. 17-26. doi: https://doi.org/10.14341/ket12724

TO CITE THIS ARTICLE:

Fartushnyi EN, Sytch YuP, Fartushnyi IE, Koshechkin KA, Lebedev GS. Stratification of thyroid nodules by Eu-TIRADS categories using transfer learning of convolutional neural networks. Clinical and experimental thyroidology. 2022;18(2):17-26. doi: https://doi.org/10.14341/ket12724

i Надоели баннеры? Вы всегда можете отключить рекламу.