Лингвистическая трансляция семантических запросов пользователя в автоматизированной консультативной системе судебно-медицинской травматологии
С.А. Горбатенко, Воронежский институт МВД России, начальник кафедры, [email protected];
Н. В. Даценко, Воронежский институт МВД России, доцент, [email protected]
Рассмотрены вопросы лингвистической трансляции семантических запросов пользователя с описанием результатов осмотра места происшествия, вещественных доказательств и симптомов на проблемно-ориентированном подмножестве естественного языка в автоматизированной консультативной системе судебно-медицинской травматологии, позволяющей на основе указанных данных оперативно формировать достоверные экспертные заключения по делам о расстройстве здоровья и смерти от воздействия внешних факторов
Введение
К одной из основных задач судебно-медицинской травматологии (СМТ) относится установление взаимосвязи между наступившим расстройством здоровья и телесным повреждением, причиненным каким -либо фактором внешней среды (физическим, химическим, биологическим, психическим) [1]. Формирование судебно-медицинского диагноза осуществляется специалистом в условиях неполноты, неточности, противоречивости исходной информации, вследствие чего увеличивается вероятность совершения ошибок и снижается оперативность экспертизы [2]. Указанные проблемы экспертной практики могут быть решены путем использования современной вычислительной техники и соответствующего программного обеспечения - автоматизированной консультативной системы (АКС), позволяющей уменьшить влияние субъективных факторов на процесс вывода заключения, увеличить скорость поиска и обработки данных, и, тем самым, повысить достоверность получаемых решений и оперативность экспертизы [3]. При разработке АКС возникает задача организации процесса общения эксперта с системой на проблемно-ориентированном подмножестве естественного языка (ЕЯ), так как использование для этой цели регламентированных языков требует от пользователя специальных знаний о форматах данных, возмож-
ностях системы и т.д. Для обеспечения возможности автоматизированной обработки запросов на ЕЯ необходимо реализовать их лингвистическую трансляцию на язык системы. Учитывая сложный характер предметной области, в частности, наличие многочисленных взаимосвязей между объектами и процессами, трансляция должна осуществляться с учетом семантических отношений между фрагментами запроса.
Постановка задачи и описание метода лингвистической трансляции семантических запросов пользователя в автоматизированной консультативной системе
Постановку задачи лингвистической трансляции семантических запросов пользователя в АКС судебно-медицинской травматологии сформулируем следующим образом. Пусть заданы проблемно -ориентированное подмножество естественного языка, используемое экспертом при описании обстоятельств происшествия, и язык АКС, на котором описываются объекты и процессы предметной области (ПО), а также отношения между ними, другими словами, знания ПО. Требуется
преобразовать некоторый семантический запрос 1кеТ, к=1,К, где Т -множество всех запросов на проблемно-ориентированном ЕЯ, в формализованный запрос zseZ, 8=1,Б, где Ъ - множество запросов на языке АКС.
Задача поиска наиболее достоверного диагноза на основе данных, введенных пользователем, решается с использованием процедурных знаний АКС, содержащих опыт формирования заключений в области судебно-медицинской травматологии. Для формализации процедурных знаний в системе используется продукционная модель, которая обеспечивает возможность модификации одних знаний независимо от других (например, в связи с непрерывным расширением номенклатуры химических веществ, развитием методов исследований и т.д.), а также позволяет сократить время поиска информации для повышения оперативности формирования экспертных заключений. Продукционные правила хранятся в базе знаний АКС в следующем виде [4]:
<пит; Ь; ЕСЛИ а! и/или ... ап, ТО МД; МНД>, (1)
где пит - имя продукции (в его качестве используется порядковый номер продукции в базе знаний); Ь - область применения продукции («химический фактор», «физический фактор» и т.д.); апеЛ, п=1,М - посылки, описывающие некоторую ситуацию, ^еИ, -1 = 1J - гипотеза, которая рассматривается в процессе вывода заключения, если посылки примут истинное значение; МД и МНД - соответственно мера доверия и
мера недоверия гипотезы для получения значений МД и МНД используется метод направленного опроса специалистов.
Например, из продукции «103; химический фактор; ЕСЛИ имеется деструкция гепатоцитов ТО отравление серной кислотой; 0,8; 0,2» следует, что, по мнению специалистов, при наличии данного симптома мера доверия гипотезы «причиной отравления является серная кислота», составляет величину, равную 0,8, а мера недоверия - величину, равную 0,2.
Таким образом, для решения задачи лингвистической трансляции необходимо осуществить преобразование исходного текста запроса 1к в формализованный запрос на языке представления процедурных знаний (ЯППЗ) системы, что позволит выделить из некоторое множество
фактов Р={:Ть}, Ь=1,Б, сопоставить его с множеством А посылок продукционных правил и принять в качестве рабочих соответствующие гипотезы ^еИ.
Задача лингвистической трансляции запроса ^ может быть эффективно решена с помощью метода контекстного фрагментирования, учитывающего не только синтаксическую характеристику предложения, но и семантические связи между его фрагментами [5,6]. Основу метода составляют лингвистическая модель, содержащая информацию о морфологии и синтаксисе проблемно-ориентированного подмножества ЕЯ, и базовые механизмы обработки предложений, реализующие следующие этапы:
• Грамматический анализ, задачей которого является построение синтаксической структуры предложения пт, т=1,М, лте1к.
• Семантическая интерпретация предложения пт, т.е. формирование фрагментов на ЯППЗ автоматизированной консультативной системы, соответствующих описанию обстоятельств происшествия.
• Проблемный анализ, позволяющий структурировать множество фрагментов, полученных на предыдущем этапе, в соответствии с синтаксисом и семантикой ЯППЗ.
Лингвистическая модель, в свою очередь, состоит из трех компонентов: грамматической модели проблемно-ориентированного подмножества естественного языка (ГМ1), грамматической модели ЯППЗ автоматизированной консультативной системы (ГМ2), задающих словарь и грамматику соответствующих языков, и интерпретационной модели, на основе которой осуществляется отображение слов, словосочетаний и фрагментов подмножества ЕЯ в понятия, отношения и фрагменты ЯППЗ.
Грамматическая модель ГМ1 является объединением морфологической и синтаксической частей ^ ^ '1 и^ь которые представляют собой соответственно следующие фрагменты:
1) ориентированные графы
1 _
°1=1Х, д=1,С>, (2)
¡=1
где Xq - множество элементов ГМ1, включающее слова (например, «травма», «кровоизлияние», «глагол» и т.п.) и морфологические признаки (род, число, падеж и т.п.); - множество морфологических, родовидовых и структурных отношений (например, «имеет», «является» и т.п.);
2) грамматические контексты, которые задаются множеством графов:
, що^^ь), (3)
j=l
где ^^ - множество синтаксических отношений (например, принадлежности, следования и т.п.).
Грамматическая модель ГМ2 задается аналогично ГМ1, причем вершинам и ребрам графов соответствуют понятия и отношения ЯППЗ автоматизированной консультативной системы судебно-медицинской травматологии.
Интерпретационную модель, позволяющую установить соответствие грамматических контекстов ГМ1 и ГМ2, представим с помощью системы продукций вида:
ЕСЛИ , ТО Та , (4)
где §21 - грамматический контекст ГМ1, Та - грамматический контекст ГМ2, соответствующий §21 .
Грамматический анализ запросов пользователя
в автоматизированной консультативной системе
судебно-медицинской травматологии
Задачей грамматического анализа предложений тст, лте!к, т=1,М, является построение их синтаксической структуры на основе морфологической информации и синтаксических правил объединения слов. На
первом этапе осуществляется распознавание слов и еят, и = предложения и их поиск в тезаурусе системы, содержащем лексемы проблемно-ориентированного подмножества ЕЯ с указанием вида части
речи, который приписывается каждому слову < и еят. Затем полученная цепочка слов представляется системой в виде графа Ут (аи ) путем сопоставления с грамматической моделью ГМ1, и производится фраг-
ментирование У ти ) , причем у-м фрагментом графа
У т (а и ) называется его подграф 6Уш(<1), изоморфный графу контекста g2j е02 [5]. Предложение ят считается полностью фрагменти-рованным, если каждое слово < и еят принадлежит, по крайней мере,
одному фрагменту
Например, пусть на вход автоматизированной консультативной системы поступило предложение ят=«наблюдается деструкция гепатоци-тов». После приписывания информации из тезауруса о виде части речи
< и , и = 1,3 , осуществляется сопоставление с фрагментом ГМ1, приведенным на рис. 1.
Рис. 1. Фрагмент грамматической модели проблемно-ориентированного подмножества естественного языка: Глаг - глагол; Сущ - имя существительное; 82 6 О1 - графы, задающие морфологические отношения типа «имеет» между понятиями ЕЯ; 813 6 °1, 84 6 °1, 815 6 ° - графы, задающие родовидовые отношения типа «является»;
'-°2 . 82, 6 О2
грамматические контексты
Результатом сопоставления является формирование системой графа Уm (аu ) , состоящего из двух фрагментов frm frm , изоморфных графам контекстов и соответственно (рис. 2).
Рис. 2. Представление предложения на проблемно-ориентированном подмножестве ЕЯ в виде фрагментированного графа
Семантическая интерпретация и проблемный анализ фрагментированного запроса
Как указано выше, на этапе семантической интерпретации осуществляется формирование фрагментов на ЯППЗ, соответствующих фрагментам, полученным в результате грамматического анализа. В рассматриваемом примере выполняется отображение в соответствии со следующими продукциями интерпретационной модели:
ЕСЛИ g2, , ТО Yi:
(5)
ЕСЛИ g22, ТО Y2,
где Yi и Y2 - грамматические контексты ГМ2, показанные на рис. 3.
Рис. 3. Фрагмент грамматической модели языка представления процедурных знаний автоматизированной консультативной системы: Verb - глагол; Noun - имя существительное
Результат семантической интерпретации фрагментированного предложения пт показан на рис. 4.
Рис. 4. Пример представления фрагментированного предложения на ЯППЗ в автоматизированной консультативной системе судебно-медицинской травматологии
Последним этапом лингвистической трансляции семантического запроса пользователя в АКС является проблемный анализ, позволяющий
*
на основе фрагментов на ЯППЗ сформировать высказывания пm ezs, удовлетворяющие синтаксису языка представления процедурных знаний и обладающие семантикой исходных предложений ^metk. Поскольку программная реализация АКС осуществлена в среде программирования Delphi, что обусловлено возможностью использования «стандартного» технического и программного обеспечения и требованиями сравнительно небольших объемов оперативной памяти и жесткого диска для
*
функционирования системы, высказывания nm ezs должны быть построены в соответствии с правилами языка Object Pascal. В связи с этим
для рассматриваемого примера системой формируется следующее вы* *
сказывание nm =«destruction_of_hepatocytes=true». Сопоставление пm с множеством A посылок продукций приводит к рассмотрению в процессе вывода заключения следующего правила из базы знаний автоматизированной консультативной системы:
IF destruction of hepatocytes=true THEN Begin
Diagnosis=DoTpaBneHMe серной кислотой^; MD:=0.8; MND:=0.2; End.
Таким образом, на основании предложения nm, введенного пользователем на проблемно-зависимом ЕЯ, система принимает в качестве рабочей гипотезу 1^=«отравление серной кислотой».
Заключение
Предлагаемые процедуры обработки запросов пользователя в автоматизированной консультативной системе судебно-медицинской травматологии позволяют осуществить лингвистическую трансляцию пред-
ложений на проблемно-ориентированном естественном языке с учетом синтаксических и семантических отношений между фрагментами и, тем самым, организовать общение с пользователями, не обладающими специальными знаниями о системе.
Литература
1. Судебная медицина: Руководство для врачей / Под ред. А.А. Матышева. -3-е изд., перераб. и доп.- СПб.:Гиппократ, 1998. - 544 с.
2. Прасолов, Б.Н. Логический вывод в автоматизированной консультативной системе медико-криминалистической экспертизы отравлений / Б.Н. Прасолов, Н.В. Даценко // Информационные технологии. - № 6. - 2005. - С. 68-71.
3. Горбатенко, С.А. Формирование экспертных заключений в автоматизированной консультативной системе судебно-медицинской травматологии на основе неопределенной априорной информации / С.А. Горбатенко, Н.В. Даценко // IV Международная научно-практическая конференция «Современные информационные технологии и ИТ-образование». - М.: МГУ, 2009. URL: http://www.2009.it-edu.ru/pages/Conference-works (дата обращения: 14.10.2010)
4. Искусственный интеллект. - В 3-х кн. Кн. 2. Модели и методы / под ред. Д.А. Поспелова. - М.: Радио и связь, 1990. - 304 с.
5. Кузин, Е.С. Интеллектуализация ЭВМ / Е.С. Кузин, А.И. Ройтман, И.Б. Фоминых и др. - М.: Высш. шк., 1989. - 159 с.
6. Горбатенко, С.А. Использование метода контекстного фрагментирования для анализа предложений ограниченного естественного языка в автоматизированной системе обучения гуманитарным дисциплинам / С.А. Горбатенко, Н.В. Даценко // Всероссийская научно-практическая конференция «Охрана, безопасность и связь - 2009». - Воронеж: Воронежский институт МВД России, 2009. - С. 28-32.