Научная статья на тему 'Лингвистическая трансляция семантической информации в автоматизированной консультативной системе судебно-медицинской травматологии'

Лингвистическая трансляция семантической информации в автоматизированной консультативной системе судебно-медицинской травматологии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
182
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНГВИСТИЧЕСКАЯ ТРАНСЛЯЦИЯ / ЛИНГВИСТИЧЕСКАЯ МОДЕЛЬ / ГРАММАТИЧЕСКИЙ АНАЛИЗ СЕМАНТИЧЕСКОЙ ИНФОРМАЦИИ / СЕМАНТИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ / ПРОБЛЕМНЫЙ АНАЛИЗ ФРАГМЕНТИРОВАННОГО ЗАПРОСА / LINGUISTIC TRANSLATION / LINGUISTIC MODEL / SEMANTIC INFORMATION GRAMMATICAL ANALYSIS / SEMANTIC INTERPRETATION / FRAGMENTED REQUEST PROBLEM ANALYSIS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горбатенко Светлана Александровна, Даценко Наталия Валерьевна

Рассмотрены вопросы лингвистической трансляции семантической информации, содержащей описание результатов осмотра места происшествия, вещественных доказательств и симптомов на проблемно-ориентированном подмножестве естественного языка в автоматизированной консультативной системе судебно-медицинской травматологии, позволяющей на основе указанных данных оперативно формировать достоверные экспертные заключения по делам о расстройстве здоровья и смерти от воздействия внешних факторов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Горбатенко Светлана Александровна, Даценко Наталия Валерьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SEMANTIC INFORMATION LINGUISTIC TRANSLATION IN COMPUTER-BASED CONSULTATIVE SYSTEM OF FORENSIC MEDICAL TRAUMATOLOGY

The paper is dedicated to the questions of linguistic translation of semantic information that contain the description of accident location examination results, real evidence and symptoms in problem-oriented subset of natural language in computer-based consultative system of forensic medical traumatology that permit to form rapidly truthful expert conclusions for cases of health disorder because of external factors effect on the base of these data.

Текст научной работы на тему «Лингвистическая трансляция семантической информации в автоматизированной консультативной системе судебно-медицинской травматологии»

С.А Горбатенко,

доктор технических наук, профессор

Н.В. Даценко,

кандидат технических наук, доцент

ЛИНГВИСТИЧЕСКАЯ ТРАНСЛЯЦИЯ СЕМАНТИЧЕСКОЙ ИНФОРМАЦИИ В АВТОМАТИЗИРОВАННОЙ КОНСУЛЬТАТИВНОЙ СИСТЕМЕ СУДЕБНО-МЕДИЦИНСКОЙ

ТРАВМАТОЛОГИИ

SEMANTIC INFORMATION LINGUISTIC TRANSLATION IN COMPUTER-BASED CONSULTATIVE SYSTEM OF FORENSIC

MEDICAL TRAUMATOLOGY

Рассмотрены вопросы лингвистической трансляции семантической информа-ции, содержащей описание результатов осмотра места происшествия, вещественных доказательств и симптомов на проблемно-ориентированном подмножестве естественного языка в автоматизированной консультативной системе судебно-медицинской травматологии, позволяющей на основе указанных данных оперативно формировать достоверные экспертные заключения по делам о расстройстве здоровья и смерти от воздействия внешних факторов.

The paper is dedicated to the questions of linguistic translation of semantic information that contain the description of accident location examination results, real evidence and symptoms in problem-oriented subset of natural language in computer-based consultativ e system of forensic medical traumatology that permit to form rapidly truthful expert conclusions for cases of health disorder because of externalfactors effect on the base of these data.

К одной из основных задач судебно-медицинской травматологии (СМТ) относится установление взаимосвязи между наступившим расстройством здоровья и телесным повреждением, причиненным каким-либо фактором внешней среды (физическим, химическим, биологическим, психическим) [1]. Формирование судебно-медицинского диагноза осуществляется специалистом в условиях неполноты, неточности, противоречивости исходной информации, вследствие чего увеличивается вероятность совершения ошибок и снижается оперативность экспертизы [2].

Указанные проблемы экспертной практики могут быть решены путем использования современной вычислительной техники и соответствующего программного обеспечения — автоматизированной консультативной системы (АКС), позволяющей уменьшить влияние субъективных факторов на процесс вывода заключения, увеличить скорость поиска и обработки данных и, тем самым, повысить достоверность получаемых решений и оперативность экспертизы [3].

При разработке АКС возникает задача организации процесса общения эксперта с системой на проблемно-ориентированном подмножестве естественного языка (ЕЯ), так как использование для этой цели регламентированных языков требует от пользователя специальных знаний о форматах данных, возможностях системы и т.д. Для обеспечения возможности автоматизированной обработки информации на естественном языке необходимо реализовать ее лингвистическую трансляцию на язык системы. Из-за сложного характера предметной области, в частности наличия многочисленных взаимосвязей между объектами и процессами, трансляция должна осуществляться с учетом семантических отношений между фрагментами запроса пользователя.

Введение

1. Постановка задачи и описание метода лингвистической трансляции семантической информации в автоматизированной консультативной системе

Постановку задачи лингвистической трансляции семантической информации в АКС судебно-медицинской травматологии сформулируем следующим образом. Пусть заданы проблемно-ориентированное подмножество естественного языка, используемое экспертом при описании обстоятельств происшествия, и язык АКС, на котором описываются объекты и процессы предметной области (ПО), а также отношения между ними, другими словами, знания ПО. Требуется преобразовать некоторый семантический запрос ^ е Т, k = 1,К, где T — множество всех запросов на проблемно-ориентированном ЕЯ, в формализованный запрос zs е Z, 8 = 1^ , где Z — множество запросов на языке АКС.

Задача поиска наиболее достоверного диагноза на основе данных, введенных пользователем, решается с использованием процедурных знаний АКС, содержащих опыт формирования заключений в области судебно-медицинской травматологии. Для формализации процедурных знаний в системе используется продукционная модель, которая обеспечивает возможность модификации одних знаний независимо от других (например, в связи с непрерывным расширением номенклатуры химических веществ, развитием методов исследований и т.д.), а также позволяет сократить время поиска информации для повышения оперативности формирования экспертных заключений. Продукционные правила хранятся в базе знаний АКС в следующем виде [4]:

< пиш;Ь;ЕСЛИ А1 и/или..Ап, ТО МД;МНД > , (1)

где пит — имя продукции (в его качестве используется порядковый номер продукции в базе знаний); Ь — область применения продукции («химический фактор», «физический

фактор» и т.д.); Ап е А, п = 1,К — посылки, описывающие некоторую ситуацию; ^ е Н, } = 1,1 — гипотеза, которая рассматривается в процессе вывода заключения, если посылки примут истинное значение; МД и МНД — соответственно мера доверия и мера недоверия гипотезы ^; для получения значений МД и МНД используется метод

направленного опроса специалистов.

Например, из продукции «73; химический фактор; ЕСЛИ имеется запах миндаля, ТО отравление синильной кислотой; 0,9; 0,1» следует, что, по мнению специалистов, при наличии данного симптома мера доверия гипотезы «причиной отравления является синильная кислота», составляет величину, равную 0,9, а мера недоверия — величину, равную 0,1.

Таким образом, для решения задачи лингвистической трансляции необходимо осуществить преобразование исходного текста запроса tk в формализованный запрос 2 на языке представления процедурных знаний (ЯППЗ) системы, что позволит выделить из 2

некоторое множество фактов Б={1Ь}, Ь = 1,В, сопоставить его с множеством А посылок

продукционных правил и принять в качестве рабочих соответствующие гипотезы ^ е Н.

Задача лингвистической трансляции запроса 1к может быть эффективно решена с помощью метода контекстного фрагментирования, учитывающего не только синтаксическую характеристику предложения, но и семантические связи между его фрагментами [5,6]. Основу метода составляют лингвистическая модель, содержащая информацию о морфологии и синтаксисе проблемно-ориентированного подмножества ЕЯ, и базовые механизмы обработки предложений, реализующие следующие этапы:

1) грамматический анализ, задачей которого является построение синтаксической структуры предложения р ш, ш = 1, М, р ше 1к;

2) семантическая интерпретация предложения рш, т.е. формирование фрагментов на ЯППЗ автоматизированной консультативной системы, соответствующих описанию обстоятельств происшествия;

3) проблемный анализ, позволяющий структурировать множество фрагментов, полученных на предыдущем этапе, в соответствии с синтаксисом и семантикой ЯППЗ.

Лингвистическая модель, в свою очередь, состоит из трех компонентов: грамматической модели проблемно-ориентированного подмножества естественного языка (ГМ1), грамматической модели ЯППЗ автоматизированной консультативной системы (ГМ2), задающих словарь и грамматику соответствующих языков, и интерпретационной модели, на основе которой осуществляется отображение слов, словосочетаний и фрагментов подмножества ЕЯ в понятия, отношения и фрагменты ЯППЗ.

Грамматическая модель ГМ1 является объединением морфологической и синтаксической частей О = С1 иС2, которые представляют собой соответственно следующие фрагменты:

1) ориентированные графы

I ___

01 = и&,,&,(Хч,К1ч),д = 1,0, (2)

1=1

где Хч — множество элементов ГМ1, включающее слова (например, «травма», «кровоизлияние», «глагол» и т.п.) и морфологические признаки (род, число, падеж и т.п.); Я1 — множество морфологических, родовидовых и структурных отношений (например, «имеет», «является» и т.п.);

2) грамматические контексты, которые задаются множеством графов:

02 = и 82,,82,(Х,,К2,), (3)

,=1

где Я, — множество синтаксических отношений (например, принадлежности, следования и т.п.).

Грамматическая модель ГМ2 задается аналогично ГМ1, причем вершинам и ребрам графов соответствуют понятия и отношения ЯППЗ автоматизированной консультативной системы судебно-медицинской травматологии.

Интерпретационную модель, позволяющую установить соответствие грамматических контекстов ГМ1 и ГМ2, представим с помощью системы продукций вида:

ЕСЛИ в2,, ТО уа, (4)

где §2 — грамматический контекст ГМ1; уй — грамматический контекст ГМ2, соответствующий §2 .

2. Грамматический анализ семантической информации в автоматизиро-ванной консультативной системе судебно-медицинской травматологии

Задачей грамматического анализа предложений рш, лшеtk, ш = 1,М, является построение их синтаксической структуры на основе морфологической информации и синтаксических правил объединения слов. На первом этапе осуществляется распознавание слов аи ерш, и = 1,и предложения и их поиск в тезаурусе системы, содержащем лексемы проблемно-ориентированного подмножества ЕЯ с указанием вида части речи, который приписывается каждому слову аи ерш. Затем полученная цепочка слов представляется системой в виде графа уш(си) путем сопоставления с грамматической моделью ГМ1, и производится фрагментирование уш(аи), причем у-м фрагментом &ш,

V = 1,У графа уш(ои) называется его подграф тш е Уш(^и), изоморфный графу контекста еО2 [5]. Предложение рш считается полностью фрагментированным, если каж-

дое слово аи єїїщ принадлежит, по крайней мере, одному фрагменту іг^ .

Например, пусть на вход автоматизированной консультативной системы поступило предложение рт=«ощущается запах миндаля». После приписывания информации

из тезауруса о виде части речи си, и = 1,3, осуществляется сопоставление с фрагментом ГМ1, приведенным на рис. 1.

а1 =Имеется (Глаг)

§11 время Глаг ■ число род лицо §21 Глаг 1^ —уг Сущ

находится справа согл. в роде и числе

р°д Сущ 2 Сущ

Сущ число падеж > согл. в падеже

а3 =миндаль (Сущ)

Рис. 1. Фрагмент грамматической модели проблемно-ориентированного подмножества

естественного языка

На рис. 1 Глаг — глагол; Сущ — имя существительное; §1; е 01, е 01 — гра-

фы, задающие морфологические отношения типа «имеет» между понятиями ЕЯ; §1 е 01, е 01, §1 е 01 — графы, задающие родовидовые отношения типа «является»; §2 е 02, §2з е 02 — грамматические контексты.

Результатом сопоставления является формирование системой графа ут(си), состоящего из двух фрагментов &т и &т, изоморфных графам контекстов §2 и соответственно (рис. 2).

Рис. 2. Представление предложения на проблемно-ориентированном подмножестве ЕЯ

в виде фрагментированного графа

3. Семантическая интерпретация и проблемный анализ фрагментированно -го запроса

Как указано выше, на этапе семантической интерпретации осуществляется формирование фрагментов на ЯППЗ, соответствующих фрагментам, полученным в резуль-

тате грамматического анализа. В рассматриваемом примере выполняется отображение в соответствии со следующими продукциями интерпретационной модели:

ЕСЛИ §21, ТО У1; (5)

ЕСЛИ §22, ТО 72, где 7; и 72 — грамматические контексты ГМ2, показанные на рис. 3.

Рис. 3. Фрагмент грамматической модели языка представления процедурных знаний автоматизированной консультативной системы: Verb — глагол;

Noun — имя существительное

Результат семантической интерпретации фрагментированного предложения pm представлен на рис. 4.

Рис. 4. Пример представления фрагментированного предложения на ЯППЗ в автоматизированной консультативной системе судебно-медицинской травматологии

Последним этапом лингвистической трансляции семантического запроса пользователя в АКС является проблемный анализ, позволяющий на основе фрагментов на ЯППЗ сформировать высказывания pm е zs, удовлетворяющие синтаксису языка представления процедурных знаний и обладающие семантикой исходных предложений pmetk. Поскольку программная реализация АКС осуществлена в среде программирования Delphi, что обусловлено возможностью использования «стандартного» технического и программного обеспечения и требованиями сравнительно небольших объемов оперативной памяти и жесткого диска для функционирования системы, высказывания pm е zs должны быть построены в соответствии с правилами языка Object Pascal. В связи с этим для рассматриваемого примера системой формируется следующее высказывание: pm=«smell_of_almond=true». Сопоставление pm с множеством A посылок продукций приводит к рассмотрению в процессе вывода заключения следующего правила из базы знаний автоматизированной консультативной системы:

IF smell_of_almond=true THEN Begin

Diagnosis=/отравление синильной кислотой';

MD:=0.9;

MND:=0.1;

End.

Таким образом, на основании предложения pm, введенного пользователем на проблемно-зависимом ЕЯ, система принимает в качестве рабочей гипотезу ^=«отравление синильной кислотой».

Заключение

Предлагаемые процедуры обработки семантической информации в автоматизированной консультативной системе судебно-медицинской травматологии позволяют осуществить лингвистическую трансляцию запросов на проблемно-ориентированном естественном языке с учетом синтаксических и семантических отношений между фрагментами предложений и, тем самым, организовать общение с пользователями, не обладающими специальными знаниями о системе.

ЛИТЕРАТУРА

1. Судебная медицина: Руководство для врачей / под ред. А. А. Матышева. — 3-е изд., перераб. и доп. — СПб.: Гиппократ, 1998. — 544 с.

2. Прасолов Б.Н., Даценко Н.В. Логический вывод в автоматизированной консультативной системе медико-криминалистической экспертизы отравлений // Информационные технологии. — № 6. — 2005. — С. 68—71.

3. Горбатенко С.А., Даценко Н.В. Формирование экспертных заключений в автоматизированной консультативной системе судебно-медицинской травматологии на основе неопределенной априорной информации // Современные информационные технологии и ИТ-образование: IV Международная научно-практическая конференция. — М.: МГУ, 2009. — URL: http://2009.it-edu.ru/pages/Conference-works (дата обращения: 03.07.2012).

4. Искусственный интеллект: в 3 кн. Кн. 2. Модели и методы / под ред. Д.А. Поспелова. — М.: Радио и связь, 1990. — 304 с.

5. Кузин Е.С., Ройтман А.И. Интеллектуализация ЭВМ. — М.: Высш. шк., 1989. — 159 с.

6. Горбатенко С.А., Даценко Н.В. Использование метода контекстного фрагментирования для анализа предложений ограниченного естественного языка в автоматизированной системе обучения гуманитарным дисциплинам // Охрана, безопасность и связь — 2009: сб. материалов Всероссийской научно-практической конференции. — Воронеж: Воронежский институт МВД России, 2009. — С. 28—32.

i Надоели баннеры? Вы всегда можете отключить рекламу.