Научная статья на тему 'Проблемы синтеза интеллектуального трансляционного модуля мультитранслятора для обработки речевых сообщений'

Проблемы синтеза интеллектуального трансляционного модуля мультитранслятора для обработки речевых сообщений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
203
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Проблемы синтеза интеллектуального трансляционного модуля мультитранслятора для обработки речевых сообщений»

Рис.б. Редактор квантовых схем

Результат вычисления представляется последним из серии значений последовательности пси-функций, получаемых в ходе работы моделирующей подсистемы. Амплитуды выходной пси-функции могут быть использованы для построения гистограммы выходной вероятности.

Данная модель реализует общепринятый математический подход к описанию квантовых вычислительных процессов и может служить универсальным инструментом синтеза и проверки квантовых алгоритмов.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Квантовый компьютер и квантовые вычисления // Регулярная и хаотическая динамика / Под ред. Садовн ичего В А. - Ижевск: Регулярная и хаотическая динамика, 1999. - 262 с.

2. Риффель Э., Полак В. Основы квантовых вычислений // Квантовый компьютер и квантовые вычисления. - Москва: Квантовый компьютер и квантовые вычисления, 2000. т. 1, № 1.

3. Гузик В.Ф., Гушанский СМ., Погорелое РА. Моделирование работы квантового кода коррекции с многократным использованием кодирующей ансциллы // УСиМ, №5(205).

- С. 3-7.

4. Гузик В.Ф., Гушанский С.М. Моделирование квантовых схем // Известия ТРТУ. - Таган-

: - , 2005, 9(53). - . 66.

Ю.В. Чернухин, М.В. Крамарь

ПРОБЛЕМЫ СИНТЕЗА ИНТЕЛЛЕКТУАЛЬНОГО ТРАНСЛЯЦИОННОГО МОДУЛЯ МУЛЬТИТРАНСЛЯТОРА ДЛЯ ОБРАБОТКИ РЕЧЕВЫХ

СООБЩЕНИЙ

В науке и технике повсеместно используются различные формальные языки и прежде всего языки программирования. Все они построены по образу и подобию естественных языков со значительным упрощением, а именно с помощью формальных грамматик. Большинство используемых грамматик - контекстнонезависимые (контекстно-свободные). Это означает, что правило для такой грамматики имеет вид: <символ1> -> <символ2> <символ3>, где в левой части находится всего один символ. Такие грамматики достаточно просты, однако они не

предназначены для работы с контекстом любого рода, что существенно снижает область их применения. Данное обстоятельство приводит к появлению множества проблемно-ориентированных языков программирования, применяющихся в различных специализированных областях. Это означает, что для каждого из них (при классическом подходе к построению транслятора) требуется свой транслятор. Если же комплексная система использует несколько языков программирования, это приводит к усложнению системы и понижению универсальности.

На кафедре ВТ ТТИ ЮФУ была разработана среда «Мультитранслятор» [1] -гибкая и универсальная система продукционного типа, использующая идею многоязыковой трансляции. Суть ее в том, что система имеет инвариантное ядро разбора и с помощью различных трансляционных модулей Т может осуществлять трансляцию программы на одном языке в текст программы на других языках. Структура системы представлена на рис.1.

Формальный язык ^ Ядро Формальный язык^

мультитранслятора

1 1

Трансляционный модуль Ті і є (1..ы)

Рис.1. Структура мультитранслятора

«»

. .

При этом для описания языков используются контекстно-свободные грамматики.

В то же время во всем мире ведутся исследования, направленные на построе-, . Большинство подобных систем используют формальные грамматики, чтобы наподобие формальных языков построить модель естественного языка. Но эти грамма- - ,

.

В связи с этим в данной работе поставлена задача исследования возможности построения с помощью среды «Мультитранслятор» системы трансляции речевых , .

Возьмем задачу голосового управления манипуляторным роботом: робот получает голосовые команды (взять, передвинуть и т.д.) в виде сложных предложений и выполняет их. Для такой системы необходима подсистема, которая будет транслировать речевые сообщения на естественном языке в предложения на каком-то формальном языке. При использовании «Мультитранслятора» данная подсистема будет представлять собой специализированный интеллектуальный трансляци-( .2).

, , несколько уровней, т.к. и высказывания на естественном языке обладают синтаксисом, лексикой и семантикой. Если первые два уровня можно представить в виде автомата наподобие формальных языков и реализовать для них трансляционные « », -ной зависимости необходима система, способная обучаться, обобщать и распозна-

вать данные. Для этой цели можно использовать искусственные нейросети, т.к. именно они обладают необходимыми свойствами для решения данной задачи.

Естественный язык^ Ядро Формальный язык ^

мультитранслятора t -

Интеллектуальный трансляционный модуль Ti Ті = Ти

Рис. 2. Система многоязыковой трансляции речевых сообщений

, , обрабатывающего синтаксис высказывания, и нейросети, используемой для обработки контекста различных уровней.

Синтаксический

Лексический

уровень

Нейросеть

Рис. 3. Интеллектуальный трансляционный модуль Ти

Одна из простейших (и наиболее успешных) систем обработки естественного языка является программа SHRDLU, разработанная в 70х годах Терри Виноградом [2]. Она представляет собой виртуальный мир кубиков, в котором робот выполнял команды и отвечал на вопросы, задаваемые пользователем на естественном языке. Так как понимание естественного языка во многом зависит от контекста, то использовать контекстно-свободные грамматики было нецелесообразно, поэтому использовался компромиссный вариант - использование системной грамматики, реализованной в виде программ на языке PROGRAMMAR. Данная система успешно справлялась с некоторыми сложностями естественного языка, но во многом благодаря ограниченной предметной области.

В работе [3] было показано, что систему, подобную SHRDLU можно реализовать в виде грамматических модулей среды «Мультитранслятор».

В данной работе рассматриваются возможности построения синтаксической части системы трансляции речевых сообщений из области робототехники.

Так как на вход будут поступать команды, то речевые сообщения будут представлять собой предложения императивного характера. Это позволяет уже при анализе задачи упростить синтаксис сообщений.

В системе SHRDLU предложения (CLAUSE) могли быть повествовательны, ( ), обладает своими особенностями и признаками, которые надо выделять и использовать при обработке.

В разрабатываемой системе нет необходимости в такой сложной структуре, команды подаются в виде повелительных предложений в настоящем времени. Упрощенную структуру синтаксиса можно представить следующим образом:

<Clause> = <VG> <NG>

<VG> = <Vb>

<NG> = <det> <num> <adj> <noun>

Рис.4. Упрощенная структура предложения

где Clause - предложение, VG - глагольная группа, NG - группа существительного, Vb - глагол, а в группу существительного могут входить определитель det, числительное num, прилагательное adj и существительное noun.

Данную структуру можно выразить в форме БНФ, а следовательно реализовать на языке описания грамматик:

Рис. 5. Синтаксическая диаграмма реализации Clause

I "Noun7*-! I "NourVH I "Adi" I I "NourV1-! I "Adj" I

"Pron'H

"Adj”

••white" .-м*.-.

Рис.б. Синтаксическая диаграмма реализации группы существительного

SHRDLU - , -

ное/множественное число, тип предложения и т.д., которые используются на лексическом и семантическом уровне. Для данного модуля понадобятся операции работы со строками. Это можно реализовать с помощью языка описания действий « »,

.

Возьмем простое предложение «Take big red block» (Возьми большой крас).

грамматического модуля показан на рис.7.

Take big red block CLAUSE VG NG VB IMPER ADJ ADJ NOUN TAKE (VB IMPER)

BIG (ADJ SIZE)

RED (ADJ COLOR)

BLOCK (NOUN)

Рис.7. Результат трансляции предложения

Как видно из рисунка (см. рис.7) «Мультитранслятор» построил дерево разбора и выделил определенные признаки, которые необходимы при дальнейшем семантическом анализе предложения. Так, глагол обозначен как повелительный (IMPER), а прилагательные big и red как прилагательные размера и цвета соответ-.

Использование возможностей среды «Мультитранслятор» вместе с нейросе-тевым подходом для обучения системы и преодоления неоднозначностей естественного языка позволяет расширить возможности применения «Мультитранслято-

»,

.

БИБЛИОГРДФИЧЕСКИЙ СПИСОК

1. Чернухин Ю.В., В.Ф. Гузик, Р.В. Фадеев. Исследование продукционных систем искусственного интеллекта на программном комплексе «Мультитранслятор». - Таганрог. 2005.

- 145 с.

2. Виноград Т. Программа, понимающая естественный язык. - М.: Мир, 1976. - 294 с.

3. . ., . .

контекстно-зависимых языко вых средах - Таганрог. 2007.

АЛ. Шабельников, В.А. Шабельников

НЕЙРОСЕТЕВЫЕ И НЕЧЕТКО- ЛОГИЧЕСКИЕ МОДЕЛИ ВРЕМЕННЫХ

ПРОЦЕССОВ*

Искусственные нейронные сети (ИНС) являются одним из наиболее успеш-

( ). -

нованием для использования нейросетевых моделей в области анализа временных рядов служит фундаментальная теорема Такенса [1], которая, основываясь на принципе повторяемости наблюдений, позволила дать утвердительный ответ о принципиальной возможности прогнозирования будущих значений ВР на основе конечного числа его предшествующих значений.

Теорема Такенса предполагает использование в качестве прогнозирующей математической модели авторегрессионную модель общего вида, представленную в форме нелинейной авторегрессии:

x(t + d) = ys(x(t),x(t -1),...,x(t -1),П,%, . ,%, (1)

* Работа выполнена при поддержке РФФИ, проекты № 07-01-00075 и № 07-07-00010 170

i Надоели баннеры? Вы всегда можете отключить рекламу.