Научная статья на тему 'Лингвистическая трансляция семантических запросов пользователя в автоматизированной консультативной системе судебно-медицинской травматологии'

Лингвистическая трансляция семантических запросов пользователя в автоматизированной консультативной системе судебно-медицинской травматологии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
56
26
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горбатенко Светлана Александровна, Даценко Наталия Валерьевна

Рассмотрены вопросы лингвистической трансляции семантических запросов пользователя с описанием результатов осмотра места происшествия, вещественных доказательств и симптомов на проблемно-ориентированном подмножестве естественного языка в автоматизированной консультативной системе судебно-медицинской травматологии, позволяющей на основе указанных данных оперативно формировать достоверные экспертные заключения по делам о расстройстве здоровья и смерти от воздействия внешних факторов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Горбатенко Светлана Александровна, Даценко Наталия Валерьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Лингвистическая трансляция семантических запросов пользователя в автоматизированной консультативной системе судебно-медицинской травматологии»

Лингвистическая трансляция семантических запросов пользователя в автоматизированной консультативной системе судебно-медицинской травматологии

С.А. Горбатенко, Воронежский институт МВД России, начальник кафедры, [email protected];

Н. В. Даценко, Воронежский институт МВД России, доцент, [email protected]

Рассмотрены вопросы лингвистической трансляции семантических запросов пользователя с описанием результатов осмотра места происшествия, вещественных доказательств и симптомов на проблемно-ориентированном подмножестве естественного языка в автоматизированной консультативной системе судебно-медицинской травматологии, позволяющей на основе указанных данных оперативно формировать достоверные экспертные заключения по делам о расстройстве здоровья и смерти от воздействия внешних факторов

Введение

К одной из основных задач судебно-медицинской травматологии (СМТ) относится установление взаимосвязи между наступившим расстройством здоровья и телесным повреждением, причиненным каким -либо фактором внешней среды (физическим, химическим, биологическим, психическим) [1]. Формирование судебно-медицинского диагноза осуществляется специалистом в условиях неполноты, неточности, противоречивости исходной информации, вследствие чего увеличивается вероятность совершения ошибок и снижается оперативность экспертизы [2]. Указанные проблемы экспертной практики могут быть решены путем использования современной вычислительной техники и соответствующего программного обеспечения - автоматизированной консультативной системы (АКС), позволяющей уменьшить влияние субъективных факторов на процесс вывода заключения, увеличить скорость поиска и обработки данных, и, тем самым, повысить достоверность получаемых решений и оперативность экспертизы [3]. При разработке АКС возникает задача организации процесса общения эксперта с системой на проблемно-ориентированном подмножестве естественного языка (ЕЯ), так как использование для этой цели регламентированных языков требует от пользователя специальных знаний о форматах данных, возмож-

ностях системы и т.д. Для обеспечения возможности автоматизированной обработки запросов на ЕЯ необходимо реализовать их лингвистическую трансляцию на язык системы. Учитывая сложный характер предметной области, в частности, наличие многочисленных взаимосвязей между объектами и процессами, трансляция должна осуществляться с учетом семантических отношений между фрагментами запроса.

Постановка задачи и описание метода лингвистической трансляции семантических запросов пользователя в автоматизированной консультативной системе

Постановку задачи лингвистической трансляции семантических запросов пользователя в АКС судебно-медицинской травматологии сформулируем следующим образом. Пусть заданы проблемно -ориентированное подмножество естественного языка, используемое экспертом при описании обстоятельств происшествия, и язык АКС, на котором описываются объекты и процессы предметной области (ПО), а также отношения между ними, другими словами, знания ПО. Требуется

преобразовать некоторый семантический запрос 1кеТ, к=1,К, где Т -множество всех запросов на проблемно-ориентированном ЕЯ, в формализованный запрос zseZ, 8=1,Б, где Ъ - множество запросов на языке АКС.

Задача поиска наиболее достоверного диагноза на основе данных, введенных пользователем, решается с использованием процедурных знаний АКС, содержащих опыт формирования заключений в области судебно-медицинской травматологии. Для формализации процедурных знаний в системе используется продукционная модель, которая обеспечивает возможность модификации одних знаний независимо от других (например, в связи с непрерывным расширением номенклатуры химических веществ, развитием методов исследований и т.д.), а также позволяет сократить время поиска информации для повышения оперативности формирования экспертных заключений. Продукционные правила хранятся в базе знаний АКС в следующем виде [4]:

<пит; Ь; ЕСЛИ а! и/или ... ап, ТО МД; МНД>, (1)

где пит - имя продукции (в его качестве используется порядковый номер продукции в базе знаний); Ь - область применения продукции («химический фактор», «физический фактор» и т.д.); апеЛ, п=1,М - посылки, описывающие некоторую ситуацию, ^еИ, -1 = 1J - гипотеза, которая рассматривается в процессе вывода заключения, если посылки примут истинное значение; МД и МНД - соответственно мера доверия и

мера недоверия гипотезы для получения значений МД и МНД используется метод направленного опроса специалистов.

Например, из продукции «103; химический фактор; ЕСЛИ имеется деструкция гепатоцитов ТО отравление серной кислотой; 0,8; 0,2» следует, что, по мнению специалистов, при наличии данного симптома мера доверия гипотезы «причиной отравления является серная кислота», составляет величину, равную 0,8, а мера недоверия - величину, равную 0,2.

Таким образом, для решения задачи лингвистической трансляции необходимо осуществить преобразование исходного текста запроса 1к в формализованный запрос на языке представления процедурных знаний (ЯППЗ) системы, что позволит выделить из некоторое множество

фактов Р={:Ть}, Ь=1,Б, сопоставить его с множеством А посылок продукционных правил и принять в качестве рабочих соответствующие гипотезы ^еИ.

Задача лингвистической трансляции запроса ^ может быть эффективно решена с помощью метода контекстного фрагментирования, учитывающего не только синтаксическую характеристику предложения, но и семантические связи между его фрагментами [5,6]. Основу метода составляют лингвистическая модель, содержащая информацию о морфологии и синтаксисе проблемно-ориентированного подмножества ЕЯ, и базовые механизмы обработки предложений, реализующие следующие этапы:

• Грамматический анализ, задачей которого является построение синтаксической структуры предложения пт, т=1,М, лте1к.

• Семантическая интерпретация предложения пт, т.е. формирование фрагментов на ЯППЗ автоматизированной консультативной системы, соответствующих описанию обстоятельств происшествия.

• Проблемный анализ, позволяющий структурировать множество фрагментов, полученных на предыдущем этапе, в соответствии с синтаксисом и семантикой ЯППЗ.

Лингвистическая модель, в свою очередь, состоит из трех компонентов: грамматической модели проблемно-ориентированного подмножества естественного языка (ГМ1), грамматической модели ЯППЗ автоматизированной консультативной системы (ГМ2), задающих словарь и грамматику соответствующих языков, и интерпретационной модели, на основе которой осуществляется отображение слов, словосочетаний и фрагментов подмножества ЕЯ в понятия, отношения и фрагменты ЯППЗ.

Грамматическая модель ГМ1 является объединением морфологической и синтаксической частей ^ ^ '1 и^ь которые представляют собой соответственно следующие фрагменты:

1) ориентированные графы

1 _

°1=1Х, д=1,С>, (2)

¡=1

где Xq - множество элементов ГМ1, включающее слова (например, «травма», «кровоизлияние», «глагол» и т.п.) и морфологические признаки (род, число, падеж и т.п.); - множество морфологических, родовидовых и структурных отношений (например, «имеет», «является» и т.п.);

2) грамматические контексты, которые задаются множеством графов:

, що^^ь), (3)

j=l

где ^^ - множество синтаксических отношений (например, принадлежности, следования и т.п.).

Грамматическая модель ГМ2 задается аналогично ГМ1, причем вершинам и ребрам графов соответствуют понятия и отношения ЯППЗ автоматизированной консультативной системы судебно-медицинской травматологии.

Интерпретационную модель, позволяющую установить соответствие грамматических контекстов ГМ1 и ГМ2, представим с помощью системы продукций вида:

ЕСЛИ , ТО Та , (4)

где §21 - грамматический контекст ГМ1, Та - грамматический контекст ГМ2, соответствующий §21 .

Грамматический анализ запросов пользователя

в автоматизированной консультативной системе

судебно-медицинской травматологии

Задачей грамматического анализа предложений тст, лте!к, т=1,М, является построение их синтаксической структуры на основе морфологической информации и синтаксических правил объединения слов. На

первом этапе осуществляется распознавание слов и еят, и = предложения и их поиск в тезаурусе системы, содержащем лексемы проблемно-ориентированного подмножества ЕЯ с указанием вида части

речи, который приписывается каждому слову < и еят. Затем полученная цепочка слов представляется системой в виде графа Ут (аи ) путем сопоставления с грамматической моделью ГМ1, и производится фраг-

ментирование У ти ) , причем у-м фрагментом графа

У т (а и ) называется его подграф 6Уш(<1), изоморфный графу контекста g2j е02 [5]. Предложение ят считается полностью фрагменти-рованным, если каждое слово < и еят принадлежит, по крайней мере,

одному фрагменту

Например, пусть на вход автоматизированной консультативной системы поступило предложение ят=«наблюдается деструкция гепатоци-тов». После приписывания информации из тезауруса о виде части речи

< и , и = 1,3 , осуществляется сопоставление с фрагментом ГМ1, приведенным на рис. 1.

Рис. 1. Фрагмент грамматической модели проблемно-ориентированного подмножества естественного языка: Глаг - глагол; Сущ - имя существительное; 82 6 О1 - графы, задающие морфологические отношения типа «имеет» между понятиями ЕЯ; 813 6 °1, 84 6 °1, 815 6 ° - графы, задающие родовидовые отношения типа «является»;

'-°2 . 82, 6 О2

грамматические контексты

Результатом сопоставления является формирование системой графа Уm (аu ) , состоящего из двух фрагментов frm frm , изоморфных графам контекстов и соответственно (рис. 2).

Рис. 2. Представление предложения на проблемно-ориентированном подмножестве ЕЯ в виде фрагментированного графа

Семантическая интерпретация и проблемный анализ фрагментированного запроса

Как указано выше, на этапе семантической интерпретации осуществляется формирование фрагментов на ЯППЗ, соответствующих фрагментам, полученным в результате грамматического анализа. В рассматриваемом примере выполняется отображение в соответствии со следующими продукциями интерпретационной модели:

ЕСЛИ g2, , ТО Yi:

(5)

ЕСЛИ g22, ТО Y2,

где Yi и Y2 - грамматические контексты ГМ2, показанные на рис. 3.

Рис. 3. Фрагмент грамматической модели языка представления процедурных знаний автоматизированной консультативной системы: Verb - глагол; Noun - имя существительное

Результат семантической интерпретации фрагментированного предложения пт показан на рис. 4.

Рис. 4. Пример представления фрагментированного предложения на ЯППЗ в автоматизированной консультативной системе судебно-медицинской травматологии

Последним этапом лингвистической трансляции семантического запроса пользователя в АКС является проблемный анализ, позволяющий

*

на основе фрагментов на ЯППЗ сформировать высказывания пm ezs, удовлетворяющие синтаксису языка представления процедурных знаний и обладающие семантикой исходных предложений ^metk. Поскольку программная реализация АКС осуществлена в среде программирования Delphi, что обусловлено возможностью использования «стандартного» технического и программного обеспечения и требованиями сравнительно небольших объемов оперативной памяти и жесткого диска для

*

функционирования системы, высказывания nm ezs должны быть построены в соответствии с правилами языка Object Pascal. В связи с этим

для рассматриваемого примера системой формируется следующее вы* *

сказывание nm =«destruction_of_hepatocytes=true». Сопоставление пm с множеством A посылок продукций приводит к рассмотрению в процессе вывода заключения следующего правила из базы знаний автоматизированной консультативной системы:

IF destruction of hepatocytes=true THEN Begin

Diagnosis=DoTpaBneHMe серной кислотой^; MD:=0.8; MND:=0.2; End.

Таким образом, на основании предложения nm, введенного пользователем на проблемно-зависимом ЕЯ, система принимает в качестве рабочей гипотезу 1^=«отравление серной кислотой».

Заключение

Предлагаемые процедуры обработки запросов пользователя в автоматизированной консультативной системе судебно-медицинской травматологии позволяют осуществить лингвистическую трансляцию пред-

ложений на проблемно-ориентированном естественном языке с учетом синтаксических и семантических отношений между фрагментами и, тем самым, организовать общение с пользователями, не обладающими специальными знаниями о системе.

Литература

1. Судебная медицина: Руководство для врачей / Под ред. А.А. Матышева. -3-е изд., перераб. и доп.- СПб.:Гиппократ, 1998. - 544 с.

2. Прасолов, Б.Н. Логический вывод в автоматизированной консультативной системе медико-криминалистической экспертизы отравлений / Б.Н. Прасолов, Н.В. Даценко // Информационные технологии. - № 6. - 2005. - С. 68-71.

3. Горбатенко, С.А. Формирование экспертных заключений в автоматизированной консультативной системе судебно-медицинской травматологии на основе неопределенной априорной информации / С.А. Горбатенко, Н.В. Даценко // IV Международная научно-практическая конференция «Современные информационные технологии и ИТ-образование». - М.: МГУ, 2009. URL: http://www.2009.it-edu.ru/pages/Conference-works (дата обращения: 14.10.2010)

4. Искусственный интеллект. - В 3-х кн. Кн. 2. Модели и методы / под ред. Д.А. Поспелова. - М.: Радио и связь, 1990. - 304 с.

5. Кузин, Е.С. Интеллектуализация ЭВМ / Е.С. Кузин, А.И. Ройтман, И.Б. Фоминых и др. - М.: Высш. шк., 1989. - 159 с.

6. Горбатенко, С.А. Использование метода контекстного фрагментирования для анализа предложений ограниченного естественного языка в автоматизированной системе обучения гуманитарным дисциплинам / С.А. Горбатенко, Н.В. Даценко // Всероссийская научно-практическая конференция «Охрана, безопасность и связь - 2009». - Воронеж: Воронежский институт МВД России, 2009. - С. 28-32.

i Надоели баннеры? Вы всегда можете отключить рекламу.