ПЕРЕДОВАЯ СТАТЬЯ
ТЕОРИЯ В ПОСТРОЕНИИ АВТОМАТИЗИРОВАННЫХ ДИАГНОСТИЧЕСКИХ ОПРОСНИКОВ
П.А. Воробьев
Первый Московский государственный медицинский университет им. И.М. Сеченова
THE THEORY OF CONSTRUCTION OF THE AUTOMATED DIAGNOSTIC QUESTIONNAIRE
P.A. Vorobiev
First Moscow State Medical University named after I.M. Sechenov
«Порядок создается жизнью, но сам он жизни не создает» «Истина — не то, что доказуемо, истина — это простота» «Логически можно доказать все, что угодно»
Антуан де Сент-Экзюпери
Можно ли автоматизировать постановку диагноза? Вокруг этого простого вопроса вот уже много десятилетий ломаются копья. А.И. Берг, один из основоположников кибернетики, еще в конце 60-х годов мечтал о возможности составить алгоритм умственной деятельности, переложить мысли человека на математический язык, записать мысль с помощью формул.
Врач чаще всего не задумывается, ставя диагноз о том, как он это делает. Вместе с тем точность определения болезни опытным клиницистом, точность прогноза последующего течения заболевания нередко впечатляет пациентов. Известны врачи, ставящие диагноз за то время, пока пациент проходит расстояние от двери до рабочего стола терапевта. Но известны и другие врачи, тратящие часы и дни на постановку диагноза, тщательно перебирающие, оценивающие, взвешивающие признаки заболевания, обсуждающие разные, иногда взаимоисключающие диагностические гипотезы. Впрочем, чаще всего
речь идет о разных болезнях: одни «написаны на лице», другие требуют проникновения глубоко в организм пациента, его клетки и молекулы. Так что не следует противопоставлять одних диагностов другим — они заняты разным делом.
Если на прием приходит сухощавый немолодой человек с красным лицом и видимыми прожилками сосудов на лице, остается определить — он алкоголик или болен эритремией (хотя может быть и гипертоник, но — сомнительно). Эти две гипотезы созревают сразу, а потом к ним добавляются результаты опроса, измерения АД, осмотр кожи и прощупывания печени. Диагностическая гипотеза эритремии подтверждается общим анализом крови и, при необходимости, морфологическим исследованием препарата костного мозга. Но ведь очевидно, что на первом и на втором этапе использовались разные механизмы постановки диагноза. Вначале врач не перебирал никаких сведений о пациенте, он посмотрел на него и... «догадался». Врачи чаще всего
именно догадываются о диагнозе, а не ставят его на основе точных результатов, полученных в ходе диагностических процедур и манипуляций.
Но что такое: «догадался». Процесс озарения носит название «эвристических» методов принятия решений при решении задач в условиях высокой неопределенности. Эвристические подходы обычно противопоставляются формальным методам решения, опирающимся на алгоритмы, модели и формулы различной степени точности. Нередко эвристические методы описываются как методы, направленные на сокращение перебора вероятностей, или как индуктивные методы решения задач. Индуктивные потому, что обнаруженный факт, как катушка индуктивности, запускает действие огромной, несоразмерной с первичным индуктором величины с существенными результатами.
Первичная диагностическая гипотеза, пришедшая в голову врачу, сразу обрастает огромным количеством лабораторных и инструментальных исследований, дополнительных консультаций. Это является следующим этапом диагностического поиска по эвристической или индуктивной методологии: идет подбор аргументов, которые подтверждают гипотезу. Делается это на интуитивном уровне, почти неосознанно: врач ищет аргументы в пользу своей мысли «за», упорствует и отбрасывает все аргументы «против» как несущественное, мешающее правильному решению. Не говоря уже о «несущественных» признаках, не укладывающихся в обсуждаемую диагностическую гипотезу или не релевантные ей.
Вот что пишет Г.С. Альтшуллер: «...эвристика за 17 веков ее существования не создала эффективных методов решения изобретательских задач... потому, что... с самого начала ставила слишком общую цель: найти универсальные правила, позволяющие решать любые творческие задачи во всех отраслях человеческой деятельности. ...Ограничиваясь рассмотрением только... универсальных (и в значительной мере внешних) признаков, трудно продвинуться дальше самых первоначальных представлений».
Использование эвристического подхода сокращает время решения диагностической задачи по сравнению с полным перебором возможных альтернатив, но получаемые решения никогда не являются наилучшими. Применение эвристических (индуктивных) методов не всегда обеспечи-
вает достижение поставленной цели. Именно здесь, по-видимому, кроется суть спора между «физиками и лириками» от медицины — наука медицина или искусство. Если искусство, то тогда эвристические подходы в ней оправданы, поскольку требует наименьших затрат времени, являясь рабочим инструментом клинического мышления, соединяющего в единый процесс мысль и действия. Если наука — то озарению места немного.
Эвристические методы наиболее перспективны в условиях часто повторяющихся ситуаций, когда врач воспроизводит модели уже виденного им ранее. Это особенно справедливо, если речь идет о частых заболеваниях, с которыми врач сталкивается ежедневно по несколько раз. Например, респираторные инфекции или артериальная гипертония. Или, вариант, модель некой болезни синтезирована врачом по результатам изучения литературы, при обучении. Поскольку ситуация частая, то и диагностическая гипотеза будет часто правильной. Но, заметим, не всегда некий процент «диагностических ошибок» есть всегда, даже у великих диагностов. Врач прогнозирует именно ту ситуацию, которая наиболее вероятна. Например, в зимне-весенний период молодой человек, пришедший на прием (не важно с какими симптомами) с очень высокой вероятностью болен вирусной респираторной инфекцией и ему необходим больничный лист. Его даже смотреть не надо, особенно если обратить внимание на красный кончик носа и сморкание. Но очень редко, может быть 1 на 5—10 тыс. пациентов, к врачу с такими же жалобами придет больной острым лейкозом. И врач, используя эвристические подходы в диагностике, обязательно пропустит диагноз, что, скорее всего, закончится смертью больного. Но ведь в остальных тысячах и тысячах случаев он будет прав!
Эвристические подходы используются и в принятии коллективных решений, что получило название сократические беседы. Методология состоит в задавании уточняющих вопросов, приведении аргументов и контраргументов. При этом заранее определено, что все самые неожиданные предлагаемые решения равноценны. Коллективный метод решения трудных проблем известен как «мозговой штурм» и, на самом деле, используется при проведении консилиума или на профессорских обходах.
Дедукцию подробно и красочно описал известный всему миру как писатель, врач сэр Артур Игнатий Конан Дойль. Дедуктивная модель принятия решения основана на тщательном изучении деталей, особенно тех, которые не вписываются в формируемую модель. Врач, знающий, понимающий необходимость дедуктивной проверки диагностической гипотезы, становится блестящим диагностом. Понимание этого основано, и это очень печально, не на научных данных о правилах принятия решений, а на интуитивных вещах, часто имеющих отношение к характерологическим особенностям врача, склонности его к тщательности и аккуратности.
Дедукция — это метод решения задач, основанный на переборе всех имеющихся факторов с последующим их сведением на основе правил в диагностическую гипотезу. Дедукция — метод научного поиска, основанный на выведении заключений из гипотезы других предпосылок, истинное значение которых неизвестно (учет факторов, а не примеривание их к конечному результату). Дедукция обусловлена истолкованием эмпирического материала, его систематизацией и созданием формул на основе причинно-следственных связей.
Иначе говоря: эвристические, индуктивные методы отталкиваются от симптома и развивают древо решений от «главной жалобы», тогда как дедуктивные способы решения начинаются с результата (предполагаемого или имеющегося), перебирают максимально возможное число признаков с использованием формул решения, формируя набор версий, отбрасывая нежизнеспособные.
Дедукция и индукция неразрывно связаны между собой. Тем не менее, поскольку машина не умеет «озарятся», нам для формирования решающих правил необходимы дедуктивные подходы.
Модель организации дедуктивной диагностической системы включает:
1. Для описания объекта используют алфавит (не обязательно буквенный), идентифицирующий объекты и правила построения формул. Алфавитом является список элементарных символов (слова, цифры), которые необходимы для составления формулы.
2. Правила построения формул подразумевают алгоритм построения из символов алфавита формул.
3. Совокупность утверждений (заключений, диагностических гипотез), получаемых из идентифицированных объектов путем применения формул.
При построении логической цепочки дедуктивной диагностической системы можно использовать иерархию гипотез, степень абстрактности и общности которых увеличивается по мере удаления от окончательного диагноза. При этом на вершине такой пирамиды будут располагаться гипотезы, имеющие наиболее общий характер и обладающие наибольшей логической силой. Из них как из предпосылок будут выводится гипотезы более низкого — 2- и 3-го уровней. В основании пирамиды будут находиться гипотезы, которые можно сопоставить с эмпирическими данными или, в нашем случае, — с верифицированными диагнозами. Логическая диагностическая последовательность при этом будет носить название «древо решения»: от общего (вершина пирамиды) через перебор вероятностей тех или иных вариантов к частному (ее основание).
Моделирование диагностической гипотезы. Врач обычно формирует диагностическую гипотезу дискретно, не единовременно выстраивая окончательный диагноз. Правильно было бы с позиции логики формировать несколько возможных диагностических гипотез, несколько моделей пациентов, выстраивая их в последовательность от наиболее вероятной к наименее вероятной. В этом случае врач использует навыки вероятностного прогнозирования. Очень важно для построения первичной диагностической гипотезы выявлять признаки как самых частых заболеваний, так и самых опасных, даже если они весьма редкие.
Итак, на первом этапе общения с пациентом, в короткие временные интервалы — по утверждениям западных специалистов — в среднем за 15—20 с врач формирует первичную диагностическую гипотезу. Или — модель пациента, которая вначале имеет смутные очертания. По мере появления новой информации эта модель приобретает все более четкие контуры.
Некоторые диагносты советуют выделить «главную жалобу» или «главный признак» и строить диагностический алгоритм, отталкиваясь от него. Например, лихорадка — дальше все, что с ней связано. Или — боль в области сердца — и дальше по известной последовательности. Это идеальная индуктивная модель.
Но возникает вопрос: а как выделить «главную жалобу»? Она что, наиболее значима, с точки зрения больного, как боль в пояснице? Или наиболее потенциально опасна, как боль в области сердца? Не очень ясно, хотя интуитивно главной жалобой, судя по скорости принятия диагностического решения, становится то, на что больной собственно пожалуется первым. И вот тут нужно не упустить «малого признака», помня, что мал золотник, да дорог. Именно малые симптомы, на которые больной не обращает внимания, могут быть ключевыми. Потому что больного, как и врача, жизнь учит выделять «главные» жалобы, вызывающие тревогу не своими проявлениями, а некими представлениями пациента. Ну, кто не знает, что боль в груди опасна.
Диагностика — это складывание пазла или создание модели заболевания у пациента из отдельных элементов, характеристик и сравнение полученного с существующей в представлениях врача картиной болезни. Отдельные признаки, не связанные между собой в единую картину, не укладывающиеся в модель болезни, которые не имеют, по мнению врача, существенного диагностического значения им отбрасываются. Вместе с тем отдельные признаки, даже не укладывающиеся в первичную диагностическую модель, могут быть настолько важными, что должны быть основой, стержнем для сборки диагноза.
Моделирование является способом представления действительности, отличным от реальности, диагноз — это лишь определенная степень приближения к существующей у пациента проблеме. Врачи думают, они уверены, что строят диагностические модели исключительно математическим способом на основе научных знаний. Но откуда черпают они те знания, которые позволяют построить модель заболевания, а точнее — модель пациента? Из учебников, статей, на занятиях по повышению квалификации, из собственного опыта? Конечно, все источники задействованы. На самом деле наши модели — интуитивные, основанные на домысливании, достраивании реальной картины с помощью представлениях «об этиологии и патогенезе». Там, где нужны точные знания (например — редкие болезни), обычное блестящее диагностическое моделирование не работает! Иными словами, моделирование подразумевает подгонку того, что существует под то, что должно существо-
вать, и отбрасывание признаков, мешающих построению модели.
Принятие жизненно важных решений основано на «распознавании принципа», т.е. выделении существенного диагностического элемента известной модели. Врач неосознанно формирует модель болезни у пациента, бессознательно осмысливает место симптома или признака в структуре известных ему моделей болезней и специфичность симптома для данной модели.
В нашем скорбном листе — бланке истории болезни, амбулаторной карте (листок уточненного диагноза) — есть место только одному диагнозу — основному, все остальное — не учитывается. Почему бы не писать, перечисляя, предположительные диагнозы. Ведь именно так нередко пишут консультанты после осмотра неясного больного. А ведь это — целая система мышления и принятия клинических решений врачом — один диагноз или несколько возможных альтернатив. План ведения больного должен включать рассмотрение разных диагностических гипотез, а не подгонку под одну модель.
Композиция и декомпозиция в диагностике — две взаимоисключающие, противоположно направленные тенденции в моделировании, существующие в неразрывной связи. Всякое явление можно разложить на отдельные элементы, как вещество на молекулы, а молекулы на атомы. Это — декомпозиция. С философской точки зрения, нельзя достигнуть полной декомпозиции, так как каждая структура состоит из элементов, которые на определенном этапе развития науки непостижимы. Вспомним, что атомы состоят из электронов и протонов, при углубленном изучении появились позитроны, нейтроны, мюзо-ны и т.д. до бесконечности. Нельзя познать бесконечность.
Для медицины особенно характерно направление декомпозиции: еще несколько сотен лет назад выделяли как болезни только головную боль, жар и подагру, относя остальные заболевания к разряду неопределенного «насморка» — недомогания. Не так давно научились измерять артериальное давление — и ста лет не прошло — а уже появилась гипертоническая болезнь, из нее выделились многочисленные симптоматические виды гипертонии. Лейкемию — белокровие, разделили на острую и хроническую, а подвидов лейкозов в этих группах за последние 10—20 лет трудно перечислить. Эта тенденция в научных
знаниях — декомпозиция, детализация, «копание в мелочах» — преобладающее направление развития медицинской науки.
Второе направление: отдельные элементы объединяются в более сложные конструкции — происходит композиция. Композиционный процесс, процесс объединения, обобщения — процесс не менее сложный и увлекательный.
Врач, встречаясь с больным, одновременно проводит декомпозицию, разбивая картину болезни на фрагменты — симптомы и признаки, и композицию, создавая целостный образ болезни из полученных отдельных сведений. В результате всегда есть элемент допущения, вероятности, неопределенности в точном образе болезни. Чем меньше неопределенность, тем лучше, но абсолютной истины нет, как нет модели, абсолютно похожей на объект моделирования — больной всегда «индивидуален».
Основной принцип моделирования: прозрачность. Модель должна быть ясно и понятно описана, включая предпосылки, допущения и вали-дацию, для того чтобы ее можно было воспроизвести. Важным этапом моделирования является анализ ее чувствительности — рассмотрение стабильности модели в условиях изменения предпосылок. Самый простой пример анализа чувствительности состоит в том, чтобы рассмотреть правильность выставленного диагноза в условиях убранного одного диагностического признака: если диагноз остается не вызывающим сомнения, то вероятно вся диагностическая гипотеза верна. Желательно последовательно отбрасывать несколько диагностических признаков — от этого диагностическая концепция только станет сильнее.
Если подходить к процессу моделирования диагноза с научной точки зрения, то основными этапами моделирования являются:
• общий анализ характеристик объекта или системы;
• идентификация и определение достаточности релевантной информации для моделирования;
• выбор критериев оценки точности моделирования;
• синтез и построение модели;
• валидация модели (подгонка, исправление), уточнение параметров системы и модели (подгонка модели многократна!);
• анализ результатов моделирования с целью
достижения заданной точности моделирования.
Для принятия решений используется предложенное нами правило квадрата. Суть его в том, что лицо, принимающее решение, оказывается как бы в туннеле квадратного сечения, через который оно должно пройти, приняв решение. Сверху на него оказывает давление информационная грань туннеля, вся совокупность информации, из которой необходимо отобрать ту информацию, которая имеет отношение к делу, — релевантную информацию. Здесь очень важно не ошибиться и не отбросить как ненужную информацию, которая является, на самом деле, ключевой для диагноза. Собрать нужную, отбросив всю не нужную для решения информацию, является важнейшей и сложнейшей задачей врача на этапе диагностики.
Вторая грань этого туннеля представлена анализом и моделированием. Анализ может носить как научный, так и интуитивный характер, основываясь как на проверенных научных фактах, так и на эмпирических знаниях, полученных из собственного опыта или иных источников. В результате анализа лицом, принимающим решение, всегда выстраивается первичная модель решения, в нашем случае — первичная диагностическая гипотеза.
Третья грань — грань неспецифических воздействий, вмешивающихся факторов, которые существенно могут повлиять на ход диагностики, но на первый взгляд не являются существенными и не учитываются в процессе принятия решения. Вмешательство неспецифических факторов может быть настолько существенным, что предопределит все наперекор научным и логическим умозаключениям. Данные лабораторного исследования, например обнаружение большого числа бластных клеток в крови, перечеркивают простейший и очевидный диагноз ангины, меняя радикально и всю диагностическую концепцию, и план дальнейшего ведения пациента.
И, наконец, четвертая грань — субъект-объектных взаимодействий. Лицо, субъект, принимающий решение, воздействует на объект этого решения, а объект всегда сопротивляется новшествам. Это сопротивление часто недоучитывается и даже правильное решение оказывается нереализованным. Так, например, если больному «в лоб» сказать, что он болен раком, то с высокой степенью
вероятности он просто встанет и уйдет, не просто не поверив врачу, но и затаив на него обиду.
В том или ином виде правило квадрата принятия решения можно учесть в процессе составления диагностических алгоритмов. Более того, нужно обязательно иметь в виду, что пациенты могут утаивать ту или иную информацию (де-загравировать, например) и, наоборот, выдавать желаемое за действительное (агравировать). Для выявления этих моментов необходимо вводить в вопросник специальные дистракторы — вопросы, отвлекающие внимание отвечающего, вводящие отвечающего в некоторое заблуждение, позволяющие понять, насколько правдиво и полно отвечает респондент. Хороший врач всегда задает такие вопросы, если сомневается в правдивости и точности ответов.
На принятие клинических решений врачом может оказывать влияние огромное число внешних (вмешивающихся) факторов или внешних эффектов, которые не улавливаются отношениями врач-пациент, но могут существенно влиять на результаты их взаимодействия. Это третья грань туннеля решения, которое приходится преодолевать лицу, принимающему решение. Такими вмешивающимися факторами могут быть эмоциональные, физические, финансовые, административные проблемы.
Среди прочих есть и глобальные вмешивающиеся факторы. Сегодняшняя ситуация характеризуется переходом общества из одного состояния в другое. Так, эпидемиологический переход характеризуется сменой основных причин болезней и смерти людей от преимущественно инфекционной патологии к хроническим неинфекционным заболеваниям, что связано как с медицинскими технологиями (вакцинация, применение антибиотиков), так и с улучшением благосостояния, урбанизацией, уменьшением рождаемости, увеличением продолжительности жизни и старением населения. Одновременно претерпевают изменения и инфекционные заболевания — одни исчезают, иногда по неизвестной причине. В 80-е годы XX века практически исчез штамм стрептококка, вызывающий ревматизм, но уже в начале века нового он опять стал регистрироваться при массовых вспышках этой инфекции. Появились такие массовые инфекции, как вирусные гепатиты (здесь свою роль, по-видимому, сыграли гемотрансфузии), ВИЧ-инфекция, связанная со шприцевой наркоманией и распро-
странением гемосексуальных связей. Знание тенденций эпидемиологического перехода (как глобальных, так и локальных, например спектра возбудителей ОРВИ в конкретный год) важно для правильной диагностики.
Переход питания связан со снижение частоты недостаточного питания, ростом частоты переедания, причем и недостаточное питание, и переедание могут иметь место в одной и той же семье, исчезновением из диеты традиционных продуктов. Разорваны пищевые цепочки от грядки до желудка: еще недавно продукты были натуральными, а сейчас человек питается не молоком, а молочным порошковым напитком, не мясом, а соевым белковым продуктом, не натуральным маслом, а пальмовым. Пока не ясно, как переход питания ассоциирован с конкретными болезнями, но глобально можно ожидать исчезновения одних заболеваний и появление иных.
Диагностический поиск многогранен и мало изучен с точки зрения современных научных правил принятия решений. Но одно дело — диагностический поиск у пациента, активно пришедшего на прием с какими-либо жалобами, совсем другое — у пациента на профилактическом приеме, когда он не обращается за медицинской помощью. В последнем случае люди могут вообще никаких жалоб не предъявлять, более того — их скрывать, или, наоборот, выдавать большое число жалоб, не имеющих отношение к диагностике и обусловленные, например, ипохондрическим состоянием.
В случае если диагностический поиск осуществляется с применением кибернетических технологий, многие вопросы, обсужденные в предыдущих главах, видятся принципиально иными. Например, компьютер лишен эмоциональной составляющей, являющейся важным неспецифическим фактором для врача.
Для составления автоматизированного вопросника возможно использовать как дедуктивный, так и индуктивный подходы. Индуктивный подход используется при создании так называемых экспертных диагностических систем, когда происходит постепенно «обучение» диагностической системы врачом-экспертом. Постепенное уточнение диагностических признаков и критериев приводит к все более точным диагностическим заключениям.
Существуют 2 основных направления в создании кибернетических интеллектуальных сис-
тем принятия решений: (I) разработка программ на основе математических алгоритмов с использованием методов интеллектуального анализа данных (data mining, knowledge discovery — извлечение не известных закономерностей из больших массивов данных — BigData, нейросе-ти) и (II) создание систем на основе распознавания и представления знаний врачей-экспертов.
Основная трудность первого пути — получение репрезентативной базы данных, содержащей не только часто встречающиеся, но и редкие случаи заболеваний. При этом эти системы имеют свойство закрытости (кибернетичность), а неясность внутренней структуры вызывает понятные сомнения и неуверенность в правильности работы системы. Эти факторы оказываются препятствиями для широкого применения математических алгоритмов распознавания и принятия решений. Кроме того, подобные системы не учитывают массы неспецифических факторов, создающих высокую степень неопределенности в знаниях о патогенезе, многообразии клинических проявлений заболеваний, наследственных, социальных и других факторов, влияющих на состояние пациента, делают создание таких систем трудоемким и дорогостоящим.
Экспертные системы (системы, основанные на знаниях) — это интеллектуальные системы, ориентированные на тиражирование опыта высококвалифицированных специалистов (экспертов) в слабоформализованных областях, где качество принятия решений зависит от уровня экспертизы.
Экспертные системы появились в начале 1970-х годов на смену поискам универсального алгоритма мышления как идея моделирования конкретных знаний специалистов-экспертов. Эта идея, воплощенная в систему, стала первой коммерчески успешной областью искусственного интеллекта. Известная система MYCIN произвела, по некоторым данным, фурор, и ни один специалист-эксперт в данных областях не смог сравниться с ней ни в скорости, ни в качественности решения (http://www.rae.ru/ forum2012/pdf/0719.pdf). Система MYCIN была разработана для идентификации возбудителя при тяжелых инфекциях, таких как сепсис и менингит, а также для выбора необходимого антибиотика, расчета его дозы в зависимости от массы тела пациента. Отметим, попутно, что проблема выбора антибиотика при данной патологии до
сих пор носит эмпирический характер и в подавляющем большинстве случаев никакие решающие системы не используются, а несмотря на столь большие достижения искусственного интеллекта, система MYCIN никогда не использовалась на практике!
Экспертная система — это компьютерная программа, способная частично заменить врача в разрешении узкоспециализированной задачи, где большую роль играют знания высококвалифицированных экспертов. Это основное отличие экспертных систем от других систем искусственного интеллекта. Экспертные системы включают 2 элемента: (I) процедуру логического вывода, принятия решений и (II) базы знаний. Последняя отличается от обычной базы данных тем, что она является активной, то есть она содержит не только и не столько формализованные знания, но и опыт экспертов. И здесь выявляется основное требование при создании экспертной системы: правильно выбранный эксперт (sic!), передающий свои знания. Это камень преткновения: является ли эксперт выразителем общего мнения врачебного сообщества по данному вопросу, каков критерий «выбора» эксперта?
Проблемы, решаемые экспертной системой, по определению всегда могут быть решены специалистом-экспертом, наполняющим эту систему знаниями. Экспертная система обладает следующими теоретическими преимуществами перед экспертом:
1. Постоянство. Человеческая компетенция ослабевает со временем, база знаний и аппарат принятия решений, наоборот, со временем развивается. Впрочем, появление новых знаний может изменить подходы эксперта к решениям, но требуются специальные подходы, чтобы перенастроить экспертную систему на «новую волну».
2. Легкость передачи. Передача информации от одного эксперта к другому всегда является тяжелым процессом. Передача компьютерной информации — простой процесс копирования данных.
3. Устойчивость. Человек легко поддается влиянию внешних неспецифических факторов, которые непосредственно не связаны с решаемой задачей. Система — нет. Но неспецифические факторы могут играть существенную роль в правильности принимаемых решений, если их внести в формулы решений.
4. Затраты. Высококвалифицированные эксперты обходятся очень дорого. Системы, наоборот, сравнительно недороги. Их разработка дорога, но они дешевы в эксплуатации.
Поиск решения в экспертной системе может осуществляться с помощью различных подходов:
— логическими методами (направленными на создание экспертных систем с логическими моделями баз знаний);
— математическими методами (имитационным и аналитическим);
— эвристическими (не имеющими строгого обоснования) методами;
— гибридными методами.
Экспертные диагностические системы применяются для решения неформализованных проблем, обладающих следующими характеристиками:
— задачи и решающие правила не могут быть представлены в числовой форме;
— исходные данные и знания о предметной области неоднозначны, неточны или противоречивы;
— не существует однозначного алгоритмического решения задачи.
Развитие направления экспертных систем в медицине базируется на представлении, что медицинские задачи в большинстве случаев представлены большим объемом многомерных, запутанных, а порой и противоречивых клинических данных. Само по себе такое представление весьма спорно, как и утверждение, что экспертные системы позволяют решать задачи диагностики, дифференциальной диагностики, прогнозирования, выбора стратегии и тактики лечения и др. Во всяком случае за более чем тридцатилетнюю историю своего существования экспертные системы не нашли широкого применения в медицине.
Многие десятилетия обсуждаются самообучающиеся интеллектуальные системы, основанные на методах автоматической классификации ситуаций из реальной практики или на методах обучения на примерах. Наиболее яркий пример — искусственные нейронные сети (artificial neural networks), которые являются нелинейной системой, позволяющей классифицировать данные гораздо лучше, чем линейные методы. В основе нейронных сетей заложено представление о моделировании функций мозга. Сразу надо заметить, что представления эти в значительной ме-
ре схоластичны. Основу каждой искусственной нейронной сети составляют относительно простые элементы (ячейки), как бы имитирующие работу нейронов мозга. В этой примитивной модели подразумевается, что каждый нейрон характеризуется двумя текущими состояниями — по аналогии с нервными клетками головного мозга, которые могут быть либо возбуждены, либо заторможены. Впрочем, даже это представление не точно, так как каждая клетка после состояния возбуждения имеет некий рефрактерный период, когда она не восприимчива к электрическим сигналам соседней клетки. И лишь после окончания рефрактерного периода, когда в ней происходит определенная биохимическая перестройка, она вновь может стать возбуждаемой. Искусственный нейрон обладает группой синапсов — однонаправленных входных связей, соединенных с выходами других нейронов, а также имеет аксон — выходную связь данного нейрона, с которой сигнал (возбуждения или торможения) поступает на синапсы следующих нейронов. Считается, что такая структура позволит проводить обработку когнитивной информации, так как она основана на моделировании функций мозга. Положительное отличие нейронных сетей состоит в том, что они не программируются, не используют никаких заранее сформулированных правил для постановки диагноза, а обучаются делать это на примерах. Нейронные сети нашли применение во многих областях техники, где они используются для решения многочисленных прикладных задач. Натренированная на ограниченном множестве обучающих выборок она обобщает накопленную информацию и вырабатывает ожидаемую реакцию применительно к данным, не обрабатывавшимся в процессе обучения.
Казалось бы — вот оно простое решение проблем в медицине. Обучил машину, и она стала вместо врача решать задачи. Однако, есть тут несколько подводных камней. Машина может быть обучена решать только одну задачу. А именно — ставить один диагноз, назначать терапию только при одном заболевании. Она лишена аналоговых, ассоциативных представлений, присущих врачу. И поэтому соседнюю, очень похожую задачу решить не сможет. Без нового обучения. А обучение — это время, новые пациенты (обычно — сотни), разработка специальных карт для получения и введения информации. Аналогично
требуется переобучение системы в случае если изменились условия диагностики или лечения: появилась новая методика, например. Поэтому сфера применения в медицине искусственных нейронных сетей весьма ограничена и узка. Например, система прогнозирования риска развития желчнокаменной болезни у людей с избыточной массой тела. Наиболее важными факторами оказались повышенное диастолическое артериальное давление, преморбидный фон, нарушение метаболизма глюкозы и повышение уровня холестерина крови. Правда, все это опытный врач отметит одним взглядом на тучного больного. А машина без анализов оказывается бессильной.
Чувствительность нейронной сети составила более 80%, прогнозирующая ценность — 92—96% для оценки наличия или отсутствия признаков продолжающегося кровотечения и потребности в лечебной эндоскопии при кровотечениях, не связанных с расширением вен пищевода.
При анализе прогностических критериев 5-летней выживаемости пациентов, перенесших радикальную цистэктомию по поводу рака мочевого пузыря, оказалось, что единственными статистически достоверными предсказателями являются лишь стадия опухоли и наличие или отсутствие прорастания в соседние органы. Чувствительность и специфичность составили 68,4 и 82,8%. Откровенно говоря, для этого вывода, вероятно, не нужна подобная система.
Использование нейросети для выявления группы риска рака предстательной железы продемонстрировало более точные прогностические возможности, чем другие математические подходы. В трансплантологии применили нейросете-вые технологии в прогнозировании отсроченного снижения креатинина сыворотки крови у детей после трансплантации почки. Чувствительность и специфичность нейронной сети составили 87%, тогда как метод логистической регрессии продемонстрировал худшие результаты — 37 и 94% соответственно. В неврологии применили нейро-сеть для прогнозирования эпилептических приступов на основе анализа электроэнцефалограмм. Прогностическая точность метода составила 98—100%. Впрочем, хотелось бы сравнить с решениями врача.
Таким образом, медицинская нейроинформа-тика как наука находится пока на стадии накоп-
ления фактического материала и рассчитывать на прорыв в этой области пока не приходится. Взгляд автора скорее пессимистичен.
Инженерия знаний — откуда у врача знания?
Уже говорилось не раз, что врач, действуя в основном эвристически-индукционными методами, не знает, как правило, откуда у него появились знания и сформировались правила. Точнее — не задумывается об этом, действуя интуитивно. Автор теории фреймов М. Минский считает, что «только как исключение, а не как правило, человек может объяснить то, что он знает». Однако, в основе интуиции врача лежат именно знания. Их источников и форм не так много:
1. Знания об этиологии заболевания — поиск этиологического фактора иногда становится самоцелью, но может увести в сторону от правильного диагноза.
2. Знания патогенеза — это обычно красивые врачебные рассуждения, крайне редко имеющие под собой практическую основу. Однако при целом ряде состояний именно патогенетические особенности являются определяющими в выборе тактики лечения (например — воспаление, синдром диссеминированного внутрисосудистого свертывания крови).
3. Знания о клинической — анамнестически-физикальной — картине заболевания. Именно это, чаще всего, служит основанием для формирования первичной диагностической гипотезы и формирования плана исследования.
4. Знания лабораторно-инструментальной картины заболевания — здесь трактовка даже простейших исследований — ЭКГ, общего анализа крови и мочи — все чаще «буксует», особенно на уровне первичного звена, выявляются либо очень грубые изменения, либо — указанные консультантом (специалист по ЭКГ) или автоматом (выделение патологии в анализах). Связи между изменениями, как правило, врачу не доступны, и поэтому анализ нескольких параметров во взаимосвязи он обычно провести не может.
5. Личный опыт переоценивается врачом, более того, на него влияют многие окружающие, часто неспецифические факторы, такие как мнения коллег, услышанное от больных или с экрана телевизора, прочитанное в газетах, индивиду-
альные предпочтения, религиозные и культурные особенности и т.д.
Помпезное название «инженерия знаний», введенное Е. Фейгенбаумом и МакКордак в 1983 г., характеризует область исследований, посвященную формализации способов представления знаний и построению экспертных систем и подразумевает «привнесение принципов и средств из области искусственного интеллекта в решение трудных прикладных проблем, требующих знаний экспертов». Очень важные слова «знания экспертов», ибо, как мы уже указывали ранее, формализация знаний экспертов — вопрос не однозначный. В более узком смысле инженерия знаний — раздел инженерии, направленный на внедрение знаний в компьютерные системы для решения сложных задач, обычно требующих богатого человеческого опыта. Инженерия знаний предполагает создание и обслуживание подобных систем, тесно соприкасается с разработкой программного обеспечения и используется во многих информационных исследованиях, например, таких как исследования искусственного интеллекта, включая базы данных, сбор данных, экспертные системы, системы поддержки принятия решений.
Методов выявления знаний экспертов много. Ключевые понятия здесь — инженер знаний, эксперт и сеанс выявления знаний. Инженер знаний — лицо, выявляющее знания эксперта — носителя знаний. Сеанс выявления знаний — эпизод общения инженера и эксперта, заканчивающийся выявлением, передачей от эксперта инженеру и формализацией определенного объема знаний. Ниже представлена характеристика основных методов выявления знаний.
1. Текстологические методы:
— анализ учебников и руководств;
— анализ научной литературы;
— анализ документов.
2. Коммуникативные методы:
— пассивные (наблюдение, протоколирование «мыслей вслух», лекции);
— активные (индивидуальные анкетирование, интервью, диалог и групповые — мозговой штурм, круглый стол, ролевые игры, экспертные игры).
3. Кибернетические методы:
— искусственные нейронные сети;
— добыча сведений из баз данных (Big Data).
Про искусственные нейронные сети речь уже шла. Для выявления знаний можно использовать технологию, обработки информации баз данных, с целью обнаружения в них новых интерпретаций знаний для решения задач прогнозирования и классификации — Data Mining. Data Mining — это процесс обнаружения в исходных данных ранее неизвестных интерпретаций знаний и скрытых закономерностей и позволяют выявлять несколько типов закономерностей:
• классификация — выявление признаков, которые характеризуют группу, к которой можно отнести рассматриваемый объект на основе анализа уже классифицированных объектов;
• кластеризация — классификация на группы анализируемых объектов, которые не являются заданными и выделяются непосредственно с помощью средств Data Mining;
' ассоциация — определяется как несколько событий, связанных друг с другом;
• последовательность определяется в том случае, если есть цепочка событий, связанных друг с другом;
• прогнозирование на основе информации, которая хранится в базах данных: математические модели позволяют предсказывать поведение системы в будущем.
В основе Data Mining лежат различные методы и алгоритмы: методика древа решений, Марковский анализ, байесовские сети, линейная регрессия, корреляционный, регрессионный и кластерный анализы, методы поиска ассоциативных правил, генетические алгоритмы, метод опорных векторов и др.
Из всего множества инженерии знаний рассмотрим подробно способы, получившие название игр с экспертами. Эта технология была подробно разработана группой И.М. Гельфанда в 70-х годах XX века, автор застал уже окончание этой увлекательной работы. Под деловой игрой понимают сеанс выявления знаний, где инженером знаний предлагается эксперту задача, решаемая на основе знаний эксперта, его представлений, интуиции и жизненного опыта принятия решений.
Большинство работ в медицине характеризуются стандартным переоценивающим взглядом на использование математических методов распознавания и обработки информации. Но уже более 30 лет назад на смену доминирующему
«математическому началу» при решении медицинских проблем было предложено равноправное содружество математического и медицинского аппаратов. Один из путей достижения этого содружества — перенесение центра тяжести в задачах медицинского прогнозирования и диагностики на содержательный анализ данных, выявление внутренней структуры системы.
Диагностические игры, описанные в работах И.М. Гельфанда, Б.И. Розенфельда и М.А. Шифрина (в частности «Очерки о совместной работе математиков и врачей») — это деловые игры, применяемые для выявления методов принятия решения в медицине (диагностика методов диагностики, что делать — такая уж схоластика). Эти игры возникли при изучении способов передачи опыта от опытных врачей новичкам. Предпосылкой для их появления служила гипотеза, что врач-эксперт накопил достаточно знаний, чтобы сделать определенное заключение с высокой степенью вероятности. Однако он сам — об этом говорилось уже не раз — не знает, каким образом он это делает. Следовательно, перед инженером знаний вставал вопрос: выявить правила принятия решений врачом. Такой подход исключает накопление статистической информации по болезни, что необходимо, например, для создания правил в искусственных нейронных сетях.
В настоящее время нет развитой теоретической концепции деловых игр. Тем не менее на практике эти игры широко используются. Решения анализируются, вскрываются закономерности мышления участников экспериментов. Именно эта анализирующая часть деловой игры полезна для получения знаний и формулировании правил принятия решений.
Рассмотрим диагностические игры на примерах — так проще будет выявить и объяснить некоторые закономерности. Инженер знания берет
на себя роль врача, который хорошо знает реального больного (он заполнил ответами длинный опросник, созданный ранее экспертом), а эксперт играет роль консультанта. Эксперт задает вопросы и делает прогноз о целесообразности применения того или иного вида лечения (в описанной И.М. Гельфандом и коллегами игре это был прогноз целесообразности электроимпульсной терапии при пароксизмальной аритмии). Игра позволила выявить, что эксперту понадобилось всего 30 вопросов для успешного прогноза (краткий опросник), в то время как первоначальный вариант вопросника (длинный опросник), составленный тем же врачом для той же цели, содержал 170 вопросов. Следует отметить, что опрос проводится дважды на основании одних и тех же историй болезни и в краткий вопросник заносились все вопросы, послужившие основанием для принятия решений врачом. В случае появления новых вопросов, не включенных в длинный опросник, они с очевидностью вносятся в краткий опросник. Так, в диагностической игре по прогнозу язвенного кровотечения, оказалось, что первоначальные знания и представления были неполными. В результате дополнений были выявлены скрытые для самого эксперта знания. Значимыми для прогноза рецидива язвенного кровотечения являются всего 3 правила, 2 правила входили в краткий опросник, а 3 — было сформулировано лишь во время игры.
Таким образом, предпосылок для создания диагностического вопросника достаточно много. Выбор вопросов, формулировок, формул и даже решений — не столь очевидны, как это кажется непрофессионалу. Вероятно, постепенно будет формироваться теория создания диагностических вопросников, которая позволит сделать их более релевантными, простыми и, в конечном счете — полезными для поставленных целей.
Сведения об авторе
Воробьев Павел Андреевич — д-р мед. наук, профессор, зав. кафедрой гематологии и гериатрии ИПО Первый МГМУ им. И.М. Сеченова. 119991, Москва, ул. Трубецкая, д. 8, стр. 2. Тел.: 8 (495) 225-83-74. E-mail: mtpndm@dol.ru.
About the author
Vorobiev Pavel Andreevich — MD, PhD, professor, Head. the Department of Hematology and Geriatrics IPO first MGMU named after I.M. Sechenov. 119991, Moscow, 8/2 Trubetskaya St. Tel.: 8 (495) 225-83-74. E-mail: mtpndm@dol.ru.