Научная статья на тему 'О функции плановых языков на современном этапе и их применении в качестве языков нетерминальных символов порождающих грамматик'

О функции плановых языков на современном этапе и их применении в качестве языков нетерминальных символов порождающих грамматик Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
401
105
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕРЛИНГВИСТИКА / ПЛАНОВЫЕ ЯЗЫКИ / ФИЛОСОФСКИЕ ЯЗЫКИ / МОДЕЛИРОВАНИЕ ЕСТЕСТВЕННЫХ ЯЗЫКОВ / INTERLINGUISTICS / PLANNED LANGUAGES / PHILOSOPHICAL LANGUAGES / NATURAL LANGUAGES MODELING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Личаргин Дмитрий Викторович, Сафонов Константин Владимирович, Ладе Александра Вадимовна, Мищенко Дарья Дмитриевна, Гордеева Александра Толгатовна

Рассмотрен вопрос о перспективах использования плановых языков в различных целях в качестве языка-посредника между различными народами и, в первую очередь, в качестве языка моделирования естественных языков. Описывается эксперимент по использованию конлангов как языка нетерминальных символов порождающих грамматик Хомского. Приведен анализ плановых языков на основе интерлингвистического подхода, связанного с изучением международных искусственных языков как средства преодоления языкового барьера. Делается вывод о том, что плановые языки межнационального общения могут найти свое применение не только в искусстве в качестве хобби, средства моделирования и анализа естественных языков, но и, в частности, для генерации осмысленной речи, осуществления языковых трансформаций и как языка нетерминальных символов порождающих грамматик.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Личаргин Дмитрий Викторович, Сафонов Константин Владимирович, Ладе Александра Вадимовна, Мищенко Дарья Дмитриевна, Гордеева Александра Толгатовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

About the function of planned languages at the present time and their application as the languages of non-terminal symbols of generative grammars

In the article the task is set to consider the issue of the prospects of using planned languages for different purposes as interlinguas between different nationalities and, first of all, as the natural language modeling languages. An experiment about the usage of conlangs as languages of non-terminal symbols of Chomsky’s generative grammars is described. The analysis is offered on the topic of planned languages based on interlinguistic approach, referred to studying international artificial languages as means of overcoming language barrier. A conclusion is made that the international communication with the help of planned languages can be applied not only as an art form, hobby and tools for modeling and analy-ing natural languages, but also particularly for natural language generation, executing linguistic transformations and as a generative grammar non-terminal symbols language.

Текст научной работы на тему «О функции плановых языков на современном этапе и их применении в качестве языков нетерминальных символов порождающих грамматик»

УДК 811.92

0 ФУНКЦИИ ПЛАНОВЫХ ЯЗЫКОВ НА СОВРЕМЕННОМ ЭТАПЕ

И ИХ ПРИМЕНЕНИИ В КАЧЕСТВЕ ЯЗЫКОВ НЕТЕРМИНАЛЬНЫХ СИМВОЛОВ

ПОРОЖДАЮЩИХ ГРАММАТИК

Д. В. Личаргин1, К. В. Сафонов2, А. В. Ладе1, Д. Д. Мищенко1, А. Т. Гордеева1

1 Сибирский федеральный университет Российская Федерация, 660074, г. Красноярск, ул. Академика Киренского, 28 2Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: lichdv@hotmail.ru

Рассмотрен вопрос о перспективах использования плановых языков в различных целях в качестве языка-посредника между различными народами и, в первую очередь, в качестве языка моделирования естественных языков. Описывается эксперимент по использованию конлангов как языка нетерминальных символов порождающих грамматик Хомского. Приведен анализ плановых языков на основе интерлингвистического подхода, связанного с изучением международных искусственных языков как средства преодоления языкового барьера. Делается вывод о том, что плановые языки межнационального общения могут найти свое применение не только в искусстве в качестве хобби, средства моделирования и анализа естественных языков, но и, в частности, для генерации осмысленной речи, осуществления языковых трансформаций и как языка нетерминальных символов порождающих грамматик.

Ключевые слова: интерлингвистика, плановые языки, философские языки, моделирование естественных языков.

ABOUT THE FUNCTION OF PLANNED LANGUAGES AT THE

PRESENT TIME AND THEIR APPLICATION AS THE LANGUAGES OF NON-TERMINAL SYMBOLS OF GENERATIVE GRAMMARS

D. V. Lichargin1, K. V. Safonov2, A. V. Lade1, D. D. Mishchenko1, A. T. Gordeyeva1

1 Siberian Federal University 28, Kirenskiy str., Krasnoyarsk, 660074, Russian Federation

1 Siberian State Airspace University named after academician M. F. Reshetnev

31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660014, Russian Federation E-mail: lichdv@hotmail.ru

In the article the task is set to consider the issue of the prospects of using planned languages for different purposes as interlinguas between different nationalities and, first of all, as the natural language modeling languages. An experiment about the usage of conlangs as languages of non-terminal symbols of Chomsky's generative grammars is described. The analysis is offered on the topic of planned languages based on interlinguistic approach, referred to studying international artificial languages as means of overcoming language barrier. A conclusion is made that the international communication with the help of planned languages can be applied not only as an art form, hobby and tools for modeling and analyzing natural languages, but also particularly for natural language generation, executing linguistic transformations and as a generative grammar non-terminal symbols language.

Keywords: interlinguistics, planned languages, philosophical languages, natural languages modeling.

В работе рассматривается проблема создания и применения различных конлангов, в частности, в целях обеспечения генерации естественных языков, их моделирования и анализа. На сегодняшний день широко распространены и разрабатываются разнообразные системы, в частности, программы-переводчики, экспертные системы, системы поддержки диалога с пользователем, системы автоматического реферирования текстов и извлечения информации из текстов на

естественном языке. Проблема выбора и создания искусственного языка описания естественных языков является актуальной в связи с необходимостью развития машинного перевода, взаимодействия с компьютерными системами на основе естественно-языкового интерфейса.

Проблема построения и применения конлангов решается на стыке таких наук, как лингвистика, интерлингвистика, компьютерная лингвистика, логика,

философия и психология [1-5]. Проблема построения и применения конлангов давно и широко исследуется различными авторами. Однако вопрос о применении более эффективных плановых языков, в частности для моделирования естественных языков, требует дополнительных исследований в рамках теории классификаций, векторизации классов классификации и применения закона исключенного третьего при построении семантической классификации.

Цель данной работы состоит в сравнительном описании некоторых плановых языков, описании преимуществ и сфер применения некоторых языков, их применимости для решения проблемы порождения осмысленных подмножеств естественного языка.

Основная идея работы состоит в рассмотрении некоторых классов плановых языков и построении модели их применения в качестве инструмента генерации осмысленных подмножеств естественных языков, английского, русского и др. Новизна работы состоит в использовании модели, представленной в работе [1] в качестве принципа построения конланга, однозначно задающего семантическую классификацию слов, с возможностью их успешного применения в качестве нетерминальных символов порождающей грамматики Хомского.

О проблеме создания и применения конлангов.

Конланги первоначально имели цель упрощения общения между людьми на планете, преодоления различных межнациональных барьеров (языковых, культурных и т. п.). На сегодняшний день широко распространены и разрабатываются разнообразные модели языков. Огромное множество конлангеров (создателей искусственных языков) работают над самыми разнообразными проектами плановых языков. Кон-лангеры отражают в своих языках особенную индивидуальную философию, взгляды, идеи, логику или эстетику. В работе учитываются, возможно, самые известные и значимые из плановых (искусственных) языков, таких как Эсперанто, Токи Пона, Пандуния, Интерлингва и Ложбан. Процесс создания искусственных языков исследуется различными авторами, в частности, Жеффом Бурке, Салли Кавесом, Джоном Е. Клиффордом и А. Вежбицкой, а также Д. Тарту.

В последнее время в области систем машинного перевода господствует идея о необходимости создания систем Интерлингва - промежуточных языков машинного перевода. То есть существующие естественные языки должны переводиться на Интерлингва и обратно с Интерлингва. Таким образом, можно получать перевод с любого языка A на язык B, применяя цепочку A-I-B, где I - это язык Интерлингва. Наиболее известная interlingua-система разрабатывалась в Голландии под названием Distributed Language Translation (с 1979 по 1992 гг.). Вскоре после этого запустился интерлингва-проект UNL (Universal Network Language). Возникновение этого проекта японских разработчиков определялось потребностью перевода документов в Интернете. Этот проект состоит в идее сопоставления слов и неких атрибутов,

отличающих их различные лексико-семантические варианты.

Часто ставится вопрос о применении какого-либо простого и ясного по структуре искусственного языка в качестве языка моделирования естественных языков: английского, немецкого, французского, русского, китайского и др. Эта идея всегда привлекала лингвистов, специализирующихся на формальных моделях естественных языков.

Вопрос о международном искусственном языке без полисемии и конфигуральных условностей особенно активно разрабатывался в конце XIX в. Всего в мире насчитывается более 1000 проектов таких языков. Единственный язык такого рода, получивший относительно широкое распространение среди энтузиастов, - язык Эсперанто. Он на сегодняшний день содержит около 1900 корней (в основном романского происхождения). Эсперанто был основан на схожести многих европейских языков и содержит, таким образом, много схожих с другими языками слов. Грамматика Эсперанто отличается логичностью и простотой. В языке Эсперанто широко представлено словообразование. Существуют другие искусственные языки, такие как Basic English, содержащий 1000 слов (изначально в нем было 850 слов) и описывающий весь вокабуляр словосочетаниями видоизмененного английского языка. Сегодня на нем написана одна из Ви-кипедий.

О. Н. Селиверстова, говоря о языке в широком смысле, пишет следующее: «Словарь семантического языка в идеале, который пока никем не был достигнут, должен удовлетворять следующему условию: каждое его слово должно выражать ровно одно, по возможности, элементарное значение, а все элементарные значения должны выражаться ровно одним словом семантического языка, совершенно независимо от того, в составе какого толкования оно встречается», т. е. такой язык должен удовлетворять требованиям детерминированности и однозначности.

Языки описания естественных языков. В таблице в качестве иллюстрации приведен пример базовых компонентов сем-морфем - основных языковых единиц на одном из искусственных философских языков, в целях пояснения принципа описания естественного языка на основе конлангов. Так, слово Gi означает передачу идеи кем-то кому-то; Di - создание идеи; PiL - позитивное свойство идеи; GiL - передачу позитивной идеи; GiLuuu - передачу позитивной идеи о реципиенте. Таким образом, кодируются слова «сообщать», «думать», «разумный», «восхищаться» и «хвалить». Таким образом, слова некоторых конлан-гов являются полным или кратким определением слова, составленным из первоэлементов - сем («атомов смысла»).

Некоторые конланги могут быть использованы в качестве средства моделирования естественных языков, с их помощью может осуществлять успешную работу язык генерации абстрактных текстов к урокам иностранного языка, решая таким образом проблему построения программ генераторов учебных заданий.

Эксперимент. Трансформируя данный подход в терминах порождающих грамматик, семантический конланг можно использовать для обозначения нетерминальных символов порождающей грамматики, в частности, авторская программа «Генератор классификаций» показывает принцип такого порождения (рис. 1).

Как известно, стандартные порождающие грамматики над строками имеют вид четверки: в<8, Т, N Я>, где 8 - начальный символ порождающей грамматики, Т - множество терминальных символов, N -множество нетерминальных символов и Я - множество правил трансформации одной строки в другую [3].

Таким образом, множество нетерминальных символов языка {сп} с Т, тогда как множество терминальных символов ^т} с N.

Рис. 1. Работа порождающей грамматики на основе промежуточного языка - конланга oGir'o

Общеизвестно, что порождающие грамматики, они же формальные грамматики, находят самое широкое применение при создании лингвистического программного обеспечения, в частности, программ-переводчиков, экспертных систем, систем поддержки диалога с пользователем, систем автоматического реферирования текстов.

Ниже приведен фрагмент порождающей грамматики с использованием языка oGir'o в качестве нетерминальных символов:

"Start" > 'a'ee' + a'ooD' + 'a'i' + 'a'ooT' + 'a'e'

'a'ee' > in principle

'a'ee' > as far as I know

'a'ooD' > I

'a'ooD' > you

'a'ooD' > 'y'a' + 'A'aa' + 'A'o'

'a'i' + 'a'ooT' > 'E'i' + 'nA'ooT'

'a'i' + 'a'ooT' > odd'i' + 'nA'ooT'

'a'i' + 'a'ooT' > 'E'i' + 'y'a' + 'E'aa' + 'E'o'

'a'i' + 'a'ooT' > 'odd'i' + 'y'a' + odd'aa' + 'odd'o'

'nA'ooT' > it

'nA'ooT' > this

'a'ooT' > 'y'a' + 'A'aa' + 'A'o'

'y'a' > the

'y'a' > this

'A'aa' + 'A'o' > 'Alll'aa' + 'Alll'o'

'A'aa' + 'A'o' > 'Annn'aa' + 'Annn'o' 'A'aa' + 'A'o' > 'Arrr'aa' + 'Alll'o' 'A'aa' + 'A'o' > 'Arrr'aa' + 'Annn'o' 'Arrr'aa' > young 'Alll'aa' > beautiful 'Annn'aa' > handsome 'Arrr'aa' > kind 'Alll'o' > girl 'Alll'o' > lady 'Annn'o' > boy 'Annn'o' > gentleman 'E'i' > 'E'itttaaa' 'E'itttaaa' > reads 'E'itttaaa' > writes 'E'itttaaa' > copies 'E'itttaaa' > scans 'E'aa' > interesting 'E'aa' > published Ellll'o' > file Ellll'o' > image Ellll'o' > icon 'Emmmm'o' > magazine 'Emmmm'o' > document odd'aa' > tasty odd'aa' > appetizing 'odd'o' > food 'odd'o' > cutlet

В скобочках вида '...' приведены термины семантического языка oGir'o, возможно применение в этой связи и других конлангов, однако конланг oGir'o специально разрабатывался для применения в сфере генерации, анализа и синтеза естественных языков и был создан с учетом критериев осмысленности и анализа порождающих особенностей естественных языков и их моделей.

«7Л7 ~ •JJ-J

>№v Trees "О.'вг Strings Boolean?« Cbemairy* Words* a as far as 1 know м far as 1 know e* fwaaikno « far ев 1 luvn + you + * V*' * tody ♦ warmly + you + appreciate + * "Aitfo" * warmly ♦ you ♦ care of * "y'a" + 'АГо' • wamVy + you + cm of +■ iha * "Wo' + wernVy + you + core of *■ this -f 'Alfa' warmly J

E-Cour»* a* far as I tarn * you * care of + thai + Alfo' * wamty

m far оэ 1h> ™ * you + сига of +■ the * prl * watrrty

¿1 a* far as I kn ow » you * cart of * the * g*1 * wenrty

"FAWV ¡»car* of "nyV > now as far as 1 krtn ев far а» 1 know + 4 you * с era of *■ "y'a" + lady * wanrty you ♦ tova + Ya" * "AITo* + FAL'a"

ocWuo > nppnicrirra ю fere* 1 fcnow + you + Bppfnoste ♦ * LA*o' + 'FAL'a'

'odd'o' > food as far as 1 know + you + car« oi * "y'a' + 'AITo' * "FAL'a'

'odd'o' 1 cutlel aa *ar at 1 know ♦ you * love ♦ АГооГ

ai iw ei [ know • ou * Bppraceta » 'AWQQT'

aa for аз 1 knew + you + care of * AMooT1 J1

—■ U

Рис. 2. Дополнительный пример работы порождающей грамматики на основе конланга

Так, на рис. 1 показан процесс порождения фраз вида «in general this young girl eats it with pleasure», «in general this young girl cooks this thoughtfully», «in general this young girl chews it emotionally» и т. д. С другой стороны, на рис. 2 показан процесс генерации фраз вида «as far as I know you love the beautiful girl very much», «as far as I know you appreciate the beautiful girl emotionally», «as far as I know you adore the beautiful girl sincerely» и др.

Семы одного из конлангов (ойг'о)

'' - { = ее = появление с = 1 = идея ЬЬ = тело = все 1 = глагол I = предикат (1)ъ = настоящее

использовать импликация, причина сущность

- делать 8 = и, конъюнкция аа = продолжать I = аспект е = место рр = часть 1 = много и = глагол требующий инфинитива / герундия II = модальность, комплимент = будущее

ш = X = оо = исчезать Р = свойство о = объект И = еда г = достаточно е = наречие Е = обстоятельство (1)Ч = прошлое

делатель посылка, результат

еее = с = и = Е = связь а = абстракция й = начинка т = мало ее = вводное слово ЕЕ = вводная (1)1 = совершен-

реципиент процесс существовать фраза ное

ааа = V = ии = не сущест- Б = и = отноше- gg = одежда п = минимум, о = существительное И = место пред- (1)с = длительное

объект будущее вовать действие ние, действие нисколько лога, связь

ООО = ъ = уу = избегать Т = О = сознание кк = Ш = отличный ОО = местоимение ОБ = субъект № =

инструмент настоящее получение, принятие покрытие, крышка неопределенное

иии = себя Ч = ЕЕ = возможно г = А = существо vv = группа Ь = хороший а = притяжательное ОТ = объект (1)р = длительное

прошлое соединение существ, < ГО местоимение, порядко- совершенное

организация вое числительное

УУУ = ] = время ОО = О = переда- Е = 11 = кипа, Я = о к о о оа = количественное О = именная (^ = инфинитив

процесс необходимо ча кому-либо информация куча, нормальный существительное группа

коллекция

III - Ь = часть, II = К = получе- I = интеллект ъъ = здание, М = плохой аа = прилагательное АА = атрибут, = будущее

управление включаться в не возможно ние от кого-либо дом, помещение СМ о н определение совершенное

ЕЕЕ - (1 = быть, ИИ = без необ- X = обмен и = = N = ужасный Щ и - союз, предлог меж- А = определитель (о)1 = единствен-

цепочка тождество ходимости, произвольно непонятное контейнер, тара ду частями речи ное

АЛЛ - g = УУ = Q = запрос У = иррацио- ЧЧ = сидение = твердый, ии - союз, предлог (о)Ь =

взаимно целое, включать отложить нальное жесткий между предложениями множественное

ООО - 1 = АА = У = хх = опора 11 = мягкий УУ - слово предложе- (о)1с = парное

параллельно объединение, сложение возобновить конкретное, данное, понятное ние, междометие, слова вежливости

иии - Р = И = гг = жидкий ? - частица (аа)г = просто

цикл меньше устройство

УУУ - 1 = равно 4и = тт = ?? - наречие степени (аа)1 = более

иерархия устройство газообразный

??? - к = сс = пп = огонь, у - вопросительное (аа^ = самый

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

одиночное больше инструмент плазма слово

1;с = 1сс = ШШ = ю - отглагольное (аа)т = менее

отлично от инструмент совершенный существительное

Использование планового языка в качестве промежуточного языка машинного перевода, языка векторного компонентного представления значения слов, языка описания валентностей слов, языка семантической классификации, языка нетерминальных символов порождающих грамматик можно считать перспективной и актуальной задачей. Она связана с решением проблемы моделирования, анализа, синтеза и потенциальной генерации естественного языка. Вероятно, будущее межнационального общения связано с работой эффективных систем машинного перевода с поддержкой голоса, а не с внедрением конлангов в качестве основных языков. При этом, по сравнению с изучением и исследованием конлангов в их применении в искусстве и в качестве хобби, использование конструируемых языков как средства моделирования и анализа естественных языков, использование языка описания нетерминальных символов порождающих грамматик является научной и технической задачей, требующей дальнейшего исследования.

Библиографические ссылки

1. Личаргин Д. В. Методы и средства порождения семантических конструкций естественно языкового интерфейса программных систем: дис. ... канд. техн. наук : 05.13.17. Красноярск, 2004. 154 с.

2. Сафонов К. В., Личаргин Д. В. Разработка векторизованной семантической классификации над словами и понятиями естественного языка // Вестник СибГАУ. 2010. № 4 (30). С. 33-37.

3. Сафонов К. В. О возможности вычислительного распознавания контекстно-свободных грамматик // Вычислительные технологии. 2005. Т. 10, № 4. С. 91-98.

4. Тарту Д. Общая интерлингвистика и плановые языки. М. : Русский язык, 1989.

5. Исаев М. И. Проблемы международного вспомогательного языка. М. : Наука, 1991.

References

1. Lichargin D. V. Metody i sredstva porozhdeniya semanticheskikh konstruktsiy yestestvenno yazykovogo interfeysa programmnykh sistem. Diss. kand. tekhn. nauk [Methods and Means of Semantic Constructions Generation for Software Natural Language Interface. Diss. PhD of Technical Sciences]. Krasnoyarsk, 2004. 154 p.

2. Safonov K. V., Lichargin D. V. Vestnik SibGAU, 2010, № 4 (30), p. 33-37.

3. Safonov K. V. Vychislitelnye Tekhnologii, 2005, vol. 10, № 4, p. 91-98.

4. Tartu D. Obshchaya interlingvistika i planovyye yazyki (General Interlinguistics and Planned Languages). Moscow, Russkii yazyk, 1989.

5. Isaev M. I. Problemy mezhdunarodnogo vspomogatel'nogo yazyka (Problems of the International Auxiliary Language). Moscow, Nauka, 1991.

© Личаргин Д. В., Сафонов К. В., Ладе А. В., Мищенко Д. Д., Гордеева А. Т., 2014

УДК 629.195.2, 65.011.56

МЕТОДЫ УНИФИКАЦИИ СОВРЕМЕННЫХ СРЕДСТВ ОБРАБОТКИ ТЕЛЕМЕТРИЧЕСКОЙ ИНФОРМАЦИИ В ЦЕНТРАХ УПРАВЛЕНИЯ ПОЛЁТАМИ

КОСМИЧЕСКИХ АППАРАТОВ

М. В. Некрасов1, Д. Н. Пакман1, А. Н. Антамошкин2

:ОАО «Информационные спутниковые системы имени академика М. Ф. Решетнёва» Российская Федерация, 662972, г. Железногорск Красноярского края, ул. Ленина, 52 E-mail: diamond@iss-reshetnev.ru; packman@iss-reshetnev.ru 3Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: oleslav@mail.ru

Рассматривается циркуляция потоков телеметрической информации в структуре автоматизированной системы управления космическим аппаратом. Исторически сложившееся разнообразие программных средств обработки телеметрии, решающих схожие задачи, затрудняет дальнейшее их развитие, что приводит к неспособности удовлетворить возрастающие требования к скорости и качеству обработки информации современных космических аппаратов. Решением описанной проблемы может являться применение методов системного анализа для определения общих принципов идеологии построения унифицированных средств обработки телеметрической информации. Предлагаются пути развития методов обработки телеметрии и создания унифицированной системы обработки телеметрической информации для центра управления полётом космических аппаратов. Рассматриваются результаты практической реализации принципов унификации средств обработки телеметрии на примере системы ГЛОНАСС.

Ключевые слова: космический аппарат, центр управления, телеметрия.

i Надоели баннеры? Вы всегда можете отключить рекламу.