Научная статья на тему 'Интуитивное и логическое в задачах распознавания и принятия решений'

Интуитивное и логическое в задачах распознавания и принятия решений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
678
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Интуитивное и логическое в задачах распознавания и принятия решений»

ЧУИТИВНОЕ И ЛОГИЧЕСКОЕ В ЗАДА ЧАХ РА ОПОЗНАВАНИЯ И ПРИНЯТИЯ РЕШЕНИЙ

В. П. КАРП. А. П. НИКИТИН

X

о

СС

Ф

С

и

и

X

ф

л

X

о.

го

X

X

с;

с

X

U

X

Процесс решения задачи распознавания рассматривается с позиций наличия в нем принципиально интуитивных моментов. Показано, что при разработке компьютерных диагностических (распознающих) систем требуется формализация как интуитивных знаний эксперта проблемной области, так и интуитивных представлений аналитика (когнитолога) в выборе методов и алгоритмов построения решающих правил классификации. Перечислены основные критерии, требующие формализации для решения задач распознавания. Сделан вывод, что для оценки нового знания может потребоваться модификация существующих или формирование новых критериев.

Ключевые слова: распознавание, интуиция, решающие правила классификации, критерии, извлечение знаний эксперта.

Введение

Область своих профессиональных интересов авторы определяют как «интеллектуальный анализ данных» (Data Mining) - обнаружение в исходных («сырых» или «грязных») данных ранее

неизвестных, нетривиальных, практически полезных и доступных для интерпретации знаний, необходимых для принятия решений в тех или иных сферах человеческой деятельности. Исследование прикладных аспектов системного анализа, обработки информации, вопросов про- ЛИ ектирования и внедрения интеллектуальных компьютерных систем, ориентированных на различные предметные области, послужило отправной точкой для теоретического обобщения накопленного опыта по формализации экспертных знаний. Ранее нами уже предпринималась попытка подойти к проблеме логического и интуитивного распознавания с позиций синергетики и проведения аналогий между мышлением, распознаванием и нейрокомпьютингом1. Эта проблема носит фундаментальный характер и вызывает интерес у представителей самых разных областей науки.

Развитие вычислительной техники и методов логического анализа данных послужило предпосылкой для создания так называемых «интеллектуальных» компьютерных систем, которые призваны помочь их пользователю в прикладных и исследовательских задачах, связанных с принятием решений в ситуациях с неполной информацией. Особую важность при этом приобретает вопрос о роли интуиции специалиста-эксперта в процессах распознавания и принятия решений и в конечном итоге связанный с ним вопрос о возможности или невозможности интеграции интуитивных знаний в компьютерных системах поддержки принятия решений.

В повседневной жизни человек ориентируется на прецеденты, собственный неформализованный опыт, т. е. интуицию. При этом он учитывает сложившиеся в обществе (социуме) критерии и правила Ц

поведения, которые во многих случаях допускают различные вариан- Я

ты решений. Считается, что интуитивные прогнозы реализуются с ®

достаточно высокой, но отнюдь не стопроцентной вероятностью. По- Ц[

строение убедительного интуитивного вывода рассматривается как

Ш с;

искусство, как пример гак называемого «прямого усмотрения исти- М

ны». При этом интуитивное мышление индивидуально, и передача х

другому человеку своей способности мыслить интуитивно - весьма ф

непростая задача. Сказанное относится и к роли интуиции в профес- 2

сиональной деятельности. ^

Одно из определений интуитивного мышления - это вынесение и

:уждения на основе ассоциаций, аналогий, прецедентов и т. п. К нему фибегают, когда формализованный алгоритм принятия решения от- *5

:утствует или неполон (описывает не все возможные ситуации), либо §[

согда исходной информации недостаточно для принятия решения. ЕТ

Эднако часто понятие «интуиция» употребляется в нескольких, вооб- х

це говоря, различных смыслах. Из этой неоднозначности следует и 3

X

—;— ф

См.: Чернавский Д. С., Карп В. П., Родштат И. В., Никитин А. П., ернавская Н. М. Распознавание. Аутодиагностика. Мышление. М., 2004.

▼ еждисциплинарные исследований

.■ ;■ различная степень потенциальной возможности формализовать эти

; . «интуитивные знания».

Процесс получения знаний для системы принятия решений рас-сматривается нами в двух аспектах. Во-первых, как эксперт в пред-

Шметной области использует свою интуицию для распознавания и принятия решения, и, во-вторых, как аналитик-когнитолог использует | свою интуицию для формализации знаний эксперта и построения ре-

| шающих правил в задачах компьютерного распознавания.

I;;' В настоящей статье авторы хотели бы в рамках междисциплинар-

s ных исследований представить свой взгляд на эти проблемы, проил-

люстрировав его примерами из практики творческого взаимодействия ¡Ж с экспертами и, прежде всего, врачами.

й || Но предварительно потребуется обсудить несколько важных для

дальнейшего изложения понятий, таких как «распознавание», «целе-ill сообразная логика», «критерий целесообразности», «горизонт прогно-

Ijlil зирования» и др.

Интуиция и целесообразность

Фундаментом теории распознавания служит утверждение: «Если наблюдаемый объект «похож» на ранее известный, то его поведение будет сходно с поведением прототипа». Что такое «похож» и какова мера «похожести» - предмет исследования этой теории. Одним из подходов к решению этих вопросов является машинное обучение на примерах (machine learning) и тестирование полученных знаний - решающих правил распознавания.

Необходимое условие решения любой задачи (в том числе и задачи распознавания) - это ее постановка. Роль интуиции здесь заключается в оценке целесообразности решения задачи (нужно ли ее решать), определении общей стратегии решения (хотим знать, как ее решать) и предсказании применимости полученных результатов (будут ли они востребованы и каковы потенциальные границы их применимости).

Решение задачи, вообще говоря, ограничено «экономическими» соображениями, т. е. совокупные материальные и интеллектуальные расходы должны быть заведомо ниже наиболее вероятного возможного выигрыша, и временными соображениями, т. е. решение должно быть получено именно в тот интервал времени, пока задача остается актуальной.

Уже здесь мы сталкиваемся с необходимостью априорного формулирования критериев качества будущего решения. Такие критерии могут строиться, в том числе с использованием знаний о семантических связях объектов и явлений предметной области. Существуют и формальные правила оценки полученных закономерностей: «слепой контроль», «двойной слепой контроль» и др. В таких случаях для корректной проверки качества построенных на материале обучения решающих правил необходимо выделение независимой от обучения выборки объектов - материала контроля.

В ряде публикаций" был представлен вариант «целесообразной» логики. В ее рамках любое утверждение может быть верным, неверным и бессмысленным в зависимости от условий задачи и целей решения. Так, утверждение А = В верно или неверно в зависимости от того, сколь велика разница между А и В, и препятствует ли это отличие достижению цели, с какой делается утверждение. Справедливость утверждения определяется не возможностью измерить отличие, а целесообразностью принимать (или не принимать) это отличие во внимание. Если отличие в принципе пренебрежимо мало, то принимать его во внимание заведомо нецелесообразно.

Критерий целесообразности - это мера соответствия выбранного решения заявленной цели (в какой мере выбранное решение позволит достичь заявленной цели). Здесь обнаруживаются две неоднозначности: во-первых, кем и как объявляется цель, и, во-вторых, может ли мера соответствия быть выражена в количественной форме в виде некоего функционала, чтобы реализовать затем оптимизационные процедуры нахождения его экстремума.

Проблема субъекта, формулирующего цель, очевидна - цели, выдвигаемые в одном и том же случае разными субъектами, могут не совпадать. Так, и при медицинской диагностике, вообще говоря, тождественность целей (и, прежде всего, тактических целей) врача и пациента не может быть принята за аксиому.

Развитые методы линейного программирования, оптимизации, генетические алгоритмы поиска и т. п. в принципе представляют собой математические процедуры, ставящие целью поиск экстремума (желательно глобального экстремума) оценочной функции, описывающей качество вариантов решения. Для некоторых задач такие функции просты и очевидны, но, например, при переводе с одного языка на другой или при медицинской диагностике конструирование адекватной оценочной функции - процесс нетривиальный и многоаспектный.

Обсудим еще одно важное понятие - «перемешивающий слой», описывающий интервалы времени существования системы, когда ее поведение становится неустойчивым и появляется возможность случайного выбора3. События, происходящие после выхода из перемешивающего слоя, зависят от выбранного варианта.

Понятие «перемешивающий слой» связано с другим - «горизонт прогнозирования». Во многих ситуациях из-за наличия перемешивающего слоя невозможно сделать точный прогноз состояния далее горизонта прогнозирования. Вместе с тем, может оказаться реальным указать перечень возможных (вероятных) и маловероятных исходов. В таком случае при данном горизонте прогнозирования можно про-

“ См.: Чернавский Д. С. Синергетика и информация. М., 2001; Чер-навский Д. С., Намиот В. Л. О логико-методологических аспектах явления неустойчивости // Философия науки. М., 2002, № 8.

3 См.: Чернавский Д. С. Указ. соч.

Междисциплинарные исследований

Междисциплинарные исследований

вести классификацию решений на «потенциально полезные» и «бесполезные».

Рассмотрим для иллюстрации «бытовой» пример ситуации с перемешивающим слоем - автомобильное движение - и поставим задачу «быстро добраться из пункта А в пункт В».

Движение хаотично в том смысле, что хотя каждый участник и поставлен в некоторые рамки возможностями движения (технические характеристики машины, пункт назначения и как критерий желание

I избежать аварии), но вариантов для изменения движения очень много,

г Корректное исследование подразумевало бы постановку эксперимен-

{. тов (в зависимости от конкретной дороги, сезона и времени суток,

||| погодных условий и т. п.) и анализ их результатов. Если даже не учи-

|Шр тывать экономическую нецелесообразность таких экспериментов,

очевидно («интуитивно понятно»), что итоговый результат будет ве-<• роятностным (нечетким): «При выполнении таких-то условий, скорее

, всего правильный выбор такой-тс».

Фактически единственного решения нет - оно неустойчиво, так как из-за наличия перемешивающего слоя любая неточность в исходных данных способна привести к изменению решения. Можно построить модель движения и получить общие количественные характеристики, описывающие, например, наиболее перегруженные маршруты, но спрогнозировать время в пути для конкретного автомобиля (точнее, попадание этого времени в некоторый интервал) можно лишь с определенной вероятностью (коридором прогнозирования). Кроме того, так как ситуация не статическая, а динамическая (увеличение количества машин, перераспределение транспортных потоков, изменения в организации движения и т. д.), результат решения задачи может оказаться «не вполне актуальным» и будет требоваться постоянное, тоже динамическое дообучение.

Как же практически принимается решение?

Первый шаг - формирование критерия его приемлемости. Критерий может быть сформулирован как «добраться за пять минут», и в таком случае задача решения иметь не будет. При критерии «добраться сегодня» вариантов будет очень много, и в таком случае даже наличие перемешивающего слоя не скажется на результате.

Второй шаг - формулировка дополнительных критериев «хорошего» и «плохого» маршрута. Эти критерии могут быть количественными (разной степени четкости - например, длина маршрута, количество светофоров, интенсивность движения и т. д.) и качественными (тоже разной степени формализуемости - по безопасности, «нравится/ не нравится»).

Третий шаг (почти логический) - выделение из всех возможных маршрутов набора приемлемых (классификация на «хорошие» и «плохие»). Предполагается, что пропуск нескольких «хороших» вариантов менее значим, чем включение «плохих». То есть еще один критерий - «штраф за то, что плохие принимаются за хорошие». Ото-

бранные по комплексу критериев варианты считаются равноправными - из них может быть выбран любой.

Подчеркнем, что подобные решения принимаются множеством людей (в данном случае водителей) практически каждый день. Проявляется ли в этом их «искусство», родственное профессиональной интуиции эксперта? Вопрос риторический.

Следующим стоит вопрос: выбирать ли один вариант из потенциально полезных или, не выбирая ничего (отказ от диагноза), надеяться на получение дополнительной информации? Можно соотнести этот выбор с неким гипотетическим вариантом «рулетки», когда можно сделать ставку на «красное» или на «черное», а можно не выбирать ничего, но это будет автоматически считаться ставкой на «зеро». В таком случае ставка на «зеро» однозначно проигрышная, а, значит, нецелесообразная. При другом выборе («красное» или «черное») правильное решение не гарантировано, но его вероятность не мала.

Проведем аналогию с медицинской проблемой. Примером ситуации с перемешивающим слоем может служить состояние больного с острым инфарктом миокарда в первые часы от начала заболевания, когда практически невозможно дать устойчивый прогноз его состояния на период, превышающий первую неделю. Целесообразный подход может заключаться в выборе лечения, не ухудшающего ситуацию, с последующим динамическим наблюдением (мониторингом) и коррекцией принятого решения.

Принятие решений экспертом. Интуитивные и логические составляющие

Сделаем несколько замечаний по поводу понятия «диагноз».

1. Если под диагнозом понимать определение, какая болезнь обнаружена у пациента, то такой диагноз является «условной информацией»4, т. е., вообще говоря, результатом соглашения определенного <руга специалистов, и может корректироваться и изменяться со временем (пример такого соглашения - международная классификация юлезней десятого пересмотра ICD-10).

2. С точки зрения самого больного, конкретный диагноз не столь ¡ажен, первостепенным является вопрос «как меня будут лечить?». 1рогноз течения заболевания хотя и зависит от диагноза, но в боль-гей степени определяется адекватностью выбранного лечения. Потому под диагнозом можно понимать не столько конкретную меди-инскую формулировку, сколько выбор множества потенциально ус-ешных терапевтических воздействий из всего их многообразия шенно в этом заключается ценная информация). Тогда диагноз яв-яется отражением и пояснением выбранной тактики лечения, т. е.

4 См.: Чернавский Д. С. Указ. соч.

Междисциплинарные исследовани

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

играет преимущественно коммуникативную роль, обеспечивая взаимодействие между специалистами.

3. Если под результатом диагноза понимать выбранные формы лечебного воздействия, то здесь могут быть два критерия его правильности: улучшение состояния больного или, к сожалению, патологоанатомическое заключение.

4. Диагноз, вообще говоря, не является статичным, т. е. нецелесообразно требовать от эксперта, ставящего диагноз, его фиксацию и отказ от коррекции в случае поступления дополнительной информации о больном или изменения состояния больного.

Итак, врач ставит пациенту диагноз. Чисто логический подход не исключен — можно ставить диагноз по учебникам. Однако опытный врач этим не ограничивается, а использует признаки уже из своего опыта, в учебниках часто не оговоренные. Принято считать, что врач в этом случае ставит диагноз интуитивно на своем внутреннем коде, отражая свои представления о связях между личностью, характером больного, множеством трудно описываемых симптомов болезни и т. п., т. е. используя некий «образ болезни»5. Он обычно опирается на критерии, принятые им, с одной стороны, как часть профессионального образования, и, с другой, как результат жизненного опыта. Использование опыта, прежде всего, подразумевает неявную вероятностную оценку тех или иных возможных комбинаций симптомов и соответствующих диагнозов («часто/редко/никогда»). Можно ли формализовать такую вероятностную оценку? Вообще говоря, да, хотя утвердительный ответ не означает, что сделать это просто (хотя бы из-за проблемы репрезентативности выборок и т. п.).

Здесь требуется сделать еще одно уточнение относительно понятия «диагноз». Допустим, к больному с высокой температурой пришел врач-терапевт из районной поликлиники и направил его в инфекцион-(5 ную больницу, заподозрив, например, дифтерию. При этом точный

ЕС диагноз может и не заноситься в историю болезни или фиксироваться

как «подозрение на...». Далее врач передает пациента другим специа-и листам, более компетентным в данной области.

Таким образом, постановка интуитивного диагноза включает оценку границ собственной компетентности («имею ли я право поставить тот диагноз, который я считаю правильным»). Кроме того, врач и формально не может ставить определенные диагнозы, если не провело* дены необходимые (по медицинским стандартам) исследования. Во-

прос о том, является ли диагнозом формулировка «направить в больницу», схоластичен. С организационной точки зрения: «Да, является диагнозом, так как по нему возможно принять решение (вызвать ма-шину «скорой помощи» и перевезти больного в профильную больни-

и

х -----------------

5 См., например: Кобринский Б.А. К вопросу о формальном отражении образного мышления и интуиции специалиста слабо структурированной предметной области // Новости искусственного интеллекта. 1998. № 3. С. 64-76.

Ф

2

цу, где есть свободные места)». Можно определить точность такого интуитивного диагноза, но целесообразна будет только совокупная статистическая оценка работы этого врача (только она прагматически значима - вынести врачу выговор или выплатить премию) - сколько из тех, кому была нужна госпитализация, было пропущено (учтем в первую очередь) и сколько было госпитализировано ошибочно (во вторую очередь).

Таким образом, здесь наблюдается картина, близкая к организации решающих правил в компьютерных системах распознавания. В них часто используются иерархические схемы классификации, когда обобщенное решающее правило представляет собой многоуровневую, иерархически организованную совокупность частных правил. На верхних уровнях определяется принадлежность объекта той или иной области компетентности, а на нижних - вступает в силу правило, компетентность которого максимальна в данной области. Для компьютерных систем центральным моментом при таком подходе является синтез функции, обобщающей частные решения.

В сложных случаях в медицинской практике собирается консилиум опытных врачей, которые, посовещавшись, приходят к одному выводу (ставят одинаковый диагноз). При попытке объяснить, как они пришли к нему, может оказаться, что каждый шел своим путем и принимал во внимание разные симптомы. Но гораздо чаще диагноз ставится коллективно (по крайней мере, следующий специалист изучает заключение предыдущего), а эксперимент по слепому контролю постановки диагноза разными экспертами является крайне трудно реализуемым на практике, в том числе и по понимаемым определенным образом нормам корпоративной этики. Отказ пояснить процесс постановки диагноза не означает, что у врача нет алгоритма построения решающего правила. Напротив, он есть, но сформулирован на внутреннем (индивидуальном) «коде» врача. Перевести его на общепринятый язык (т. е. перекодировать) - отдельная и далеко непростая задача. Ее сложность вызвана и тем, что эксперт далеко не всегда заинтересован в расшифровке этого внутреннего «кода», в частности, и по конкурентным соображениям сохранения своего статуса, и из опасения быть уличенным в алогизме/нечеткости своих решающих правил.

Попытаемся конкретизировать смысловые значения понятия «интуиция» применительно к врачебной деятельности.

1. В большинстве медицинских ситуаций известно, какие действия нужно предпринять для уточнения диагноза.

Тем не менее даже если алгоритм постановки диагноза существу-;т, то для его последовательной реализации может не быть достаточ-ю времени (например, из-за тяжести состояния пациента). Так, при тличии гнойно-воспалительных инфекций проводятся специальные шкробиологические анализы, позволяющие выбрать наилучший ан-ибакгериальный препарат из имеющихся. Однако характерное время ыполнения такого анализа слишком велико (трое суток), и поэтому ще до готовности результата анализа применяются определенные

еждисциплинарные исследований

М еждисциплинарные исследований

антибиотики широкого спектра действия. Конечно, их выбор регламентируется инструкциями (т. е. логикой), но и в этом случае элемент интуиции может присутствовать.

Другой случай - принятие решения о проведении операции. Здесь фактически применяется подход минимизации возможных потерь. Ш,;; Если по определенным сочетаниям симптомов считается, что опера-

ция показана (ситуация экстренная), то операция проводится. По ее результатам диагноз уточняется (например, в ходе гистологического ;;;й исследования), и в большинстве случаев, даже если оказывается, что

|Ш:; операция была необязательной, это не рассматривается как ошибка (т.

е. «штраф» за такую гипердиагностику оказывается существенно ни-||| же, чем за гиподиагностику— когда операция была объективно необ-

ходима, но не проведена).

2. В задачах медицинской диагностики важно не столько стати-

рш стическое распределение выборки пациентов по возможным решени-

11.| ям (классам), сколько конкретное решение для конкретного пациента.

Поэтому в подобных ситуациях следует считать целесообразным принятие любого варианта, отвечающего заданным критериям.

Так, при определенных видах косметологического воздействия на кожу пациента долговременный эффект получается статистически одинаковым (с учетом, в том числе, и частоты побочных эффектов) в достаточно широком диапазоне параметров воздействия (но крайней мере, в пределах разброса до 20-30% по энергии воздействия и до двух-трех раз по его длительности), которые интуитивно подбирали врачи. Таким образом, в данном случае интуиция фактически сводится к выбору любого варианта из широкого «коридора» допустимых. Судя по всему, то же самое происходит и при выборе режима в случае многих типов лазерного терапевтического воздействия на биоткани. При неполноте или отсутствии методических рекомендаций врач осуществляет свой выбор интуитивно, основываясь на собственном опыте, но при этом принципиально важным является объективное наличие широкого диапазона «допустимых воздействий».

3. Появляется ли при медицинской диагностике новое знание? Обычно только экстенсиональное - т. е. знание, которое характеризует конкретные объекты, значения их параметров в пространстве и во времени. Иными словами, происходит рецепция информации о состоянии пациента. Интенсиональные знания (знания о закономерностях связей между признаками объектов данной предметной области) появляются только, если у пациента будет обнаружено новое, доселе не включенное в классификацию заболевание, или известное заболевание будет сопровождаться комплексом совершенно нехарактерных (нигде ранее не описанных) симптомов. Часто ли рядовым врачам удается сделать такое открытие?

Поиск новых знаний подразумевает «дообучение» не только за счет расширения пространства признаков, но и за счет расширения научного (творческого) кругозора. Это может происходить в результате объединения нескольких обучающих множеств в одно. Здесь

<

идет речь об интеграции информаций, содержащихся в разных науках, на более высоком уровне, а именно на уровне аналогий и синтеза решающих правил (более детально эта тема развита в монографии6).

Происходит ли при постановке медицинского диагноза интеграция информаций (т. е. перестройка решающего правила) и/или ревизия аксиоматики? По нашему мнению - в очень редких случаях. В основном врач использует для диагностики имеющееся у него «готовое» решающее правило, не перестраивая его. После постановки диагноз (правильный или неправильный) пополняет опыт эксперта и может быть элементом при перестройке интуитивного решающего правила, когда таковая потребуется.

Таким образом, применительно к задачам медицинской диагностики (как задачи распознавания) обнаруживается, по крайней мере, три смысловых значения, вкладываемых в понятие «интуиция».

Во-первых, способы ускорения процедуры распознавания (при невозможности следовать логическому алгоритму) с последующей верификацией результатов.

Во-вторых, способы выбора конкретного решения из множества равноправных (хотя бы в плане назначаемого лечения), удовлетворяющих определенным критериям.

В-третьих, способность эксперта формировать априорно отсутствующие критерии нового знания.

Для первых двух ситуаций формализация таких интуитивных знаний и интеграция их в компьютерные системы поддержки принятия решений представляется хотя и сложной, но принципиально реализуемой. Однако задача алгоритмизации способности формирования принципиально новых критериев (ревизия аксиоматики) пока представляется нерешаемой. Поэтому, по нашему мнению, главное при формализации экспертных знаний - избежать ненужной «мифологизации» интуиции экспертов, при которой она рассматривается как нечто не поддающееся анализу и, соответственно, воспроизведению. Так, например, издавна считалось, что врачебная интуиция демонстрирует свои преимущества в распознавании заболевания только при непосредственном контакте с больным. Однако развитие телемедицины уже позволяет рассматривать это требование как несущественное.

Из сказанного следует, ключевая побудительная причина разработки медицинских компьютерных систем - предоставить врачу до-юлнительную информацию, которая может оказаться полезной при ¡остановке диагноза и назначении лечения. Очевидно, что сейчас та-:ие системы не могут достичь уровня гениального врача. Их прагма-ическая ценность определяется тем, насколько они способствуют иражированию формализованного опыта и знаний такого врача-ксперта, и насколько они окажутся востребованными в широких кру-ах врачей-практиков.

6 См.: Чернавский Д. С., Карп В. П., Родштат И. В., Никитин А. П., ернавская Н. М. Указ. соч.

!ак. 1550

113

/Междисциплинарные исследований

Сказанное, естественно, не является исключительной особенностью медицины, а распространяется и на многие другие виды практической деятельности человека.

Интуиция и компьютерное распознавание

|

В общем случае решение задачи распознавания состоит из нескольких этапов, представленных в виде схемы на рис. 1. Рассмотрим блоки схемы в плане наличия в них принципиально интуитивных моментов.

В соответствии с поставленной задачей формируется исходное пространство признаков описания объектов и создается проблемно-ориентированная база данных (ПОБД), в которой выделяются обучающее и экзаменуемое множества (блок № 1).

Предварительный отбор материала обучения (отбор полезных примеров из ПОБД) может быть описан как формирование экспертом групп объектов, для которых степень принадлежности к некоторому классу не ниже пороговой. Такой процесс позволяет отобрать ярко выраженные примеры и учесть распределение «пограничных» объектов, которые могут быть отнесены к разным классам. Это особенно важно при необходимости решать задачи иерархической классификации, когда на одном уровне объект может принадлежать конкретному классу, а на другом - содержательному объединению нескольких.

Фактически выполняется интуитивная классификация - не безусловное отнесение конкретного объекта к одному классу (такое требование содержало бы определенный элемент «насилия» над экспер-

15 том), а указание перечня классов, к которым объект может быть отне-ш О

сен. Поэтому целесообразно использовать несколько классифика-ционных признаков и разрешать указывать любые осмысленные ком-

Ф С

бинации из них («экспертный диагноз»). После завершения формиро-и вания материала обучения можно проанализировать представленность X Ф А

объектов по этим признакам (убедиться, что количество объектов не ниже заданного критерием «порог достоверности») и вернуться к экспертному диагнозу каждого объекта - подтвердить или скорректиро-ЗС вать его. Важное следствие для аналитика - необходимость учета веда роятности наличия в обучающем множестве ошибочно классифици-

рованных объектов, щ В этом же блоке производится и конструирование исходного про-

странства признаков, подразумевающее отбор экспертом признаков, “f «перспективных» в плане решения задачи. Однако в большей части

^ практических задач выбор признаков описания объектов принципи-

Ч ально существенно ограничен. При планировании сбора данных эти

ограничения связаны с возможностями проведения тех или иных исследований. При использовании для анализа существующих баз данных (KDD - knowledge discovery in databases) аналитик обычно ис-

X

пользует только те признаки, которые фактически были зарегистрированы и сохранены. В итоге исходное пространство признаков часто не обеспечивает необходимого уровня решения задачи.

1

ПОБД

Обучающее множество Экзаменуемое множество

Система коррекции «Внимание»

12

Преобразование признаков регистрация, оценка, сортировка, свертка, разбиение на градации, построение производных характеристик А В 7.

13

Использование

решающего

правила

14

(Отказ от

диагноза Р" Ж |

Предварительный диагноз

I

Т

с учителем

Организация обучения

---------------1

5 без учителя

_! 4

Класте-

ризация

Направ- Универ-ленное сальное

дообучение обучение

±1______________І

Построение решающего правила

Модель Вероятн. методы Г еометр. методы Перебор конъюнкций

Язык (Кодовое условное множество)

V V I / . о

С Решающее правило }

положительная

г

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и

Оценка решающего правила

отрицательная

і ц > їй.і

«В

ю

О

е£

Ф

с;

и

и

X

ф

2

X

а

п

X

X

в:

с

X

яг

и

X

ЕС

X

ф

Рис. 1

Суть преобразования признаков (блок № 2) заключается в том, чтобы выбрать или сконструировать из имеющихся сравнительно небольшое число информативных (полезных) признаков. Критерий 1Ц «сравнительно небольшое число» возникает по двум причинам: для обеспечения интерпретируемости решающих правил и для повыше-ния устойчивости (а, значит, и ценности) полученных закономерностей. Иначе, в случае, когда число признаков сопоставимо с числом объектов или, тем более, превышает его, решающее правило будет искажено случайными и недостоверными совпадениями. Простой отбор признаков может быть осуществлен чисто логическим путем -перебором их комбинаций и сравнением результатов классификации.

Конструирование «новых» признаков на базе имеющихся принято называть «построением производных характеристик». Здесь интуиция аналитика крайне важна при выборе функций для построения производных характеристик, а также при формировании критериев «полезности» признака.

В большинстве случаев имеет место узкое понимание полезности признака — его релевантность в плане решения конкретной задачи. «Полезность» в расширенном смысле - не только релевантность для комплекса поставленных (фактически и потенциально) задач, но и необходимость признака для интерпретации построенных решающих правил, проверки границ их применимости, а также восприятия правил экспертами в предметной области («учтен ли этот показатель?»). Так, ФИО пациента или номер истории болезни, скорее всего, будут формально иррелевантны при медицинской диагностике, но полезны в расширенном смысле.

Поэтому, кстати, на современном этапе, когда проблема ограни-X' ченности объема носителей информации отошла на второй план,

представляется целесообразным хранение всей доступной информа-Ш ции по проблеме исследования, с тем чтобы потом иметь возможность

отбирать те или иные сегменты ПОБД для решения частных задач.

Ф Итак, формирование пространства информативных признаков

С представляет собой в большой мере творческий акт. Тем не менее

и существуют очевидные эвристические подходы.

* Первый - создание избыточного пространства «производных ха-

Ф рактеристик» с последующей отбраковкой на этапе обучения, т. е.

Л метод проб и ошибок. Отметим, что даже избыточное пространство

р не может охватить всех возможных вариантов. Поэтому уже на стадии

10 «проб» необходим интуитивный выбор признаков.

Щ Второй подход основан на модели процесса, если таковая по-

Ц строена. Однако и здесь неизбежен элемент интуиции, поскольку бук-

2 вальный перенос модели на реальный процесс не может быть обосно-

ЕГ ван строго логически.

5^ Блоки М» 3-8 (принципы их работы детально изложены в моно-

Ц; графии7) определяют тактику проведения обучения для построения

X----------------

Д 7 См.: Чернявский Д. С., Карп В. П., Родштат И. В., Никитин А. П.,

Чернавская Н. М. Указ. соч.

решающих правил. Универсальный вариант обучения (№ 6) предусматривает построение решающего правила классификации, «наилучшего» в смысле общего результата его использования на контрольном материале. Направленное обучение (№ 7) ориентировано на построение правила, «наилучшего» для конкретного объекта, и производится, опираясь только на те значения признаков, которые у него имеются. Наиболее часто этот подход используется для уточнения диагноза и называется направленным дообучением.

Выбор способа решения задачи классификации (блок № 8) определяется, прежде всего, тем, какими методами владеет аналитик, а уже затем его выбор может быть произведен интуитивно. Если окажется, что в арсенале существующих методик не нашлось адекватного способа решения, то в этом случае аналитику-программисту потребуется разработать новый алгоритм, т. е. совершить акт творчества.

Построенное решающее правило должно быть сформулировано на |||

доступном (хотя бы определенному кругу людей) языке. Иными словами, необходимо присутствие дополнительного блока «Кодовое условное множество» (блок № 9), который играет коммуникативную роль. Так как обычный язык избыточен, неоднозначен и размыт, то для обеспечения максимально возможной однозначности и четкости используется специальная терминология. Отметим, что «условное кодовое множество» выполняет и обратную функцию: ограничивает круг людей, владеющих соответствующей терминологией, и тем самым ограничивает возможности для интерпретации решающих правил неспециалистами.

В простейшем случае решающее правило формулируется вер- Ц

бально - в виде продукционных правил «ЕСЛИ П, ТО С». Примени- Щ

тельно к медицине именно так построены учебники диагностики, по §

которым проводится обучение студентов. Е£

Основная сложность здесь состоит в том, что как каждое продукционное правило, так и их совокупность имеют свои характеристики точности и полноты. Это приводит к тому, что правило должно фор- X

аудироваться в виде «ЕСЛИ П, ТО с вероятностью X следует С, при- ф

1ем правило работает в доле У из всех обнаруживаемых случаев С». М

Вербальное представление решающего правила имеет очевидные ^

1едостатки. Поэтому сейчас, как и 10-20 лет назад, остается актуаль- Ш

юй проблема формализации знаний эксперта на строгом математиче- х

ком языке для их использования в компьютерных системах. Щ

Результат распознавания конкретного объекта (диагноз) может X

редставляться в дизъюнктивной форме - либо £>], либо В2, либо от- 2"

аз; и в недизъюнктивной форме - «П\ с большей вероятностью, чем X

'2». Причем во втором случае неизбежно «подключение» семантиче- 5?

сих соотношений между различными классами-диагнозами. Кроме ф

)го, перечень машинных диагнозов {О,} может не совпадать с задан- ¿Я

лми экспертом классами обучающего множества. Поэтому и в про- '

«

С

и

и

/Междисциплинарные исследовани й

цессе пос'фоения решающего правила участие эксперта крайне желательно.

Проверка результата распознавания (блок № 11) на материале обучения и контрольных объектах (экзаменуемом множестве) - процедура логическая. Но для нее требуется сформулированный порог приемлемости решения, а точнее - несколько порогов.

Распознавание на основе готового решающего правила (левая часть схемы, блоки №№ 13-16) также является логической процедурой.

Где же проходит граница между интуитивным и логическим распознаванием, т. е. когда и как интуиция переходит в логику?

Построение решающих правил - процесс итерационный, включающий в себя по мере продвижения к цели обмен результатами работы этапов, составляющих логическую часть, и генерацию гипотез (интуитивная часть).

Таким образом, построение решающего правила происходит путем чередования логических операций и их интуитивной коррекции. Во многих практических задачах такая итерационная процедура достаточно быстро сходится. Можно сказать, что наиболее важные события происходят на «нейтральной полосе» между логическим и интуитивным распознаванием, когда переход в область то одного из них, то другого происходит поочередно.

В процессе переработки информации выстраивается следующая цепочка: интуитивное (на внутреннем языке) представление эксперта —> вербальное описание —> поиск методов построения решающих правил и формализация правил на внутреннем языке алгоритма —> представление формализованного решающего правила в терминах, принятых в данной группе специалистов.

Вопрос об окончательной форме представления решающих правил, т. е. «перевод» его с внутреннего математического (вычислительного) языка на общепринятый профессиональный язык, конечно, тоже чрезвычайно важен.

С математической точки зрения интуитивное суждение эксперта о диагнозе можно рассматривать как некоторую нулевую гипотезу (Н°), которую можно проверить, используя адекватные математические методы: модели, вероятностно-статистические, эвристические вычислительные методы и т. п. - т. е., по существу, логические способы анализа. Результат каждого такого анализа, подтверждающего или опровергающего Д°, расширяет имеющийся у исследователя опыт и является источником новой интуитивной идеи, например, о формировании нового или модификации существующего критерия. Причем новая идея может иметь отношение и к составу обучающего множества, и к пространству признаков, и к оценке важности признаков (блок № 12).

В описанной схеме, на которой базируется построение алгоритмов классификации, можно указать следующие требующиеся критерии:

критерии отбора полезных примеров; отбора полезных признаков: выбора алгоритмов построения решающего правила; оценки решающего правила; критерии перехода к дообучению (расширению обу- || чающего множества и/или пространства признаков) и т. д.

Возникает фундаментальный вопрос: можно ли в принципе во всех случаях заменить интуитивную коррекцию логической оптимизацией? Если ответ на него положителен, то роль интуиции в распознавании образа фактически сводится к нулю.

На наш взгляд, такая универсальная замена невозможна. Иными словами, всегда найдутся актуальные задачи, в которых формальный алгоритм оптимизации столкнется с непреодолимыми вычислительными трудностями. Но дело не только в вычислительной сложности.

Для аналогии рассмотрим ситуацию с криптоанализом. На настоящий момент существуют вполне определенные длины ключей (например, 256 бит), при шифровании которыми невозможно за обо- |.|||

зримое время раскодировать сообщение даже при использовании всех |||||

современных вычислительных мощностей. Однако встречаются ут- 11|

верждения, что для квантовых компьютеров эта проблема окажется | ||

чуть ли нетривиальной. Оставляя в стороне вопрос о реализуемости таких компьютеров, отметим, что задача дешифровки поставлена корректно в том смысле, что существует по сути однозначный критерий ее оптимального решения - возможность прочесть исходное сообщение.

При построении решающего правила медицинской диагностики часть критериев формулируется априорно (например, процент совпадений компьютерного диагноза с экспертным), однако набор этих критериев заведомо неполон.

Допустим, на определенном этапе анализа оказалось, что исходный класс разделяется на два кластера, или, наоборот, два класса имеют достаточно много схожих черт. Невозможно заложить в компьютерную программу исчерпывающий набор количественных и качественных критериев для таких ситуаций, потому что заранее неизвестно, какие именно прежде неизвестные и нетривиальные знания обнаружатся и какие из них окажутся практически полезными и доступными для интерпретации.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из изложенного следует, что интуитивное распознавание шире аогического в том смысле, что ограничения (типа теоремы Геделя) та первое не распространяются. Главное его преимущество - в возможности расширения или модернизации аксиоматики путем прив-1ечения новых критериев. При переходе к логическому распознава-шю часть информации теряется. Ценность потерянной информации ависит от целей, для которых она могла бы использоваться. Соглас-ю теореме Геделя найдется ситуация, в которой окажется, что по-ерянная информация является ценной и логический алгоритм не сра-отает.

Однако логическое распознавание тоже имеет преимущества -режде всего, социального характера.

/Междисциплинарные исследований

/Междисциплинарные исследований

1. Знания в форме логических алгоритмов можно эффективно тиражировать. После этого любой может использовать эти знания, минуя стадии создания алгоритма. Иными словами, знания в виде логического алгоритма становятся достоянием общества, а не отдельного человека, создавшего эти знания интуитивно.

2. Логический алгоритм может записываться, перезаписываться и сохраняться. Знания на интуитивном уровне исчезают вместе с их носителем.

3. Обучение логическому распознаванию существенно отличается от обучения интуитивному и требует значительно меньше времени, сил и памяти. По существу, речь идет о запоминании логического алгоритма и приемов его использования. При этом не требуется работа с обучающим множеством. Решающее правило (система аксиом и алгоритмы операций с ними) уже сформировано (учителем), в нем уже не только дана оценка, верно суждение или нет, но и раскрывается путь вывода этого суждения. При логическом обучении ученик должен иметь доступ к решающему правилу, затребовать указанные в нем исходные данные и после этого поставить диагноз.

Можно сказать, что человек, овладевший логическим распознаванием, становится профессионалом в определенной (ограниченной) области знаний. Конечно, в вузах преобладает именно логическое обучение, цель которого - воспитать профессионала, а специальный предмет «интуитивное мышление» отсутствует. Однако учебный процесс и в рамках стандартных дисциплин может быть организован таким образом, чтобы стимулировать развитие интуитивных способностей студентов путем демонстрации методологии, эвристических приемов и подходов к решению одних задач и затем путем применения полученных навыков для решения других задач.

Заключение

Постепенное, поэтапное возникновение нового знания в ходе компьютерного моделирования или интеллектуального анализа данных не вызывает сомнений. Однако компьютерные программы используют заданные человеком количественные критерии и, вообще говоря, не могут их произвольно изменять.

Для оценки нового интенсионального знания необходима модификация существующих или формирование новых критериев. Именно здесь и проявляется интуиция аналитика. Это означает, что математические и алгоритмические приемы построения решающих правил сами по себе не позволяют в полной мере решать многие задачи распознавания без привлечения интуиции. Без осознания этого факта современные компьютеры останутся устройствами, способными воспроизводить лишь рутинную часть мыслительных способностей человека.

Работа выполнена при поддержке грантов РГНФ№04-03-00069а и НШ-2071.2003.4

i Надоели баннеры? Вы всегда можете отключить рекламу.