Левшунов Н.Д. Фоноэстетика как один из основополагающих признаков при создании вымышленных языков художественной действительности (на материале сопоставления клингонского языка и языка квенья) // Филологические науки. Вопросы теории и практики. -2016. - № 3-2 (57). - С. 100-103.
Салахова А.Н., Мартинович Е.А. Искусственные языки компьютерных игр // Гуманистическое наследие в культуре и образовании: материалы. - 2018. -С. 374-376.
Селивейстрова Е.О. Фонетические и грамматические особенности эль-фийских языков Джона Рональда Руэлла Толкина // Научная палитра / Краснодарский государственный институт культуры. - 2019. - № 2 (24). - [Электронный ресурс]. - URL: https://eHbrary.ru/item.asp?id=39965384
Ludic linguistics: A revisited taxonomy of fictional constructed language design approach for Video games / Purnomo S. F. L. A., Nababan M., Santosa R., Diah K. // GEMA Online® Journal of Language Studies. - 2017. - T. 17, №. 4. - С. 45-60. -DOI: 10.17576/gema-2017-1704-04.
2020.03.030. АЛБЕРТС Л. ВСТРЕТИМ ИХ НА ПОЛПУТИ : Изменение стандартов языка для упрощения взаимодействия человека и робота.
ALBERTS L. Meeting them halfway : Altering language conventions to facilitate human-robot interaction // Stellenbosch Papers in Linguistics Plus (SPiL Plus). - 2019. - Vol. 56. - P. 97-122.
Ключевые слова: обработка естественного языка; искусственный интеллект; компьютерная лингвистика; искусственный язык.
Еще с момента появления идеи о создании интеллектуальных агентов, то есть компьютерных программ, самостоятельно выполняющих задачи пользователя, разработчики искусственного интеллекта, политики, экономисты и даже писатели-фантасты задались вопросом об изменениях, ожидающих человеческое общество с их развитием. Сейчас, когда подобные программы окружают нас повсюду, Л. Албертс предлагает обратить внимание на менее обсуждаемую, но вместе с тем актуальную сферу, которую затрагивают современные технологии: использование естественного языка. По мнению автора статьи, те ограничения, которые имеют ныне используемые системы обработки естественного языка, могут значительно повлиять на то, как (и какой) язык мы будем использовать в будущем.
Работа Л. Албертс состоит из шести частей: вступления, истории возникновения основных вопросов в сфере общения «человек - компьютер», обзора современных способов обработки естественного языка, обзора возможностей дальнейшего применения естественных и искусственных языков при контакте с искусственным интеллектом и заключения.
С момента появления первых компьютеров более 70 лет назад исследователи предпринимали попытки научить компьютеры взаимодействовать с человеком на естественном языке. Кинематографисты и писатели-фантасты рисовали зрителям и читателям волшебную реальность, в которой человек мог беседовать с роботами с той же легкостью, что и с соседом, а пионеры разработки искусственного интеллекта собирались претворить это «волшебство» в жизнь к началу XXI в. Однако сейчас стало уже ясно, что проблема использования естественного языка при взаимодействии с компьютером имеет куда больше «подводных камней», чем предполагалось ранее. В то время как человек при общении с легкостью использует методы невербальной коммуникации, контекст и базовые знания о мире, обучить этому машину, даже только на материалах английского языка, до сих пор чрезвычайно сложно. Если при этом еще учитывать огромное количество других языков, на материале которых предстоит обучить этому компьютер, задача кажется практически нерешаемой.
В настоящее время в основе большинства систем обработки естественного языка лежат статистические языковые модели. Самая базовая из них, ^граммы, предсказывает вероятность некой последовательности языковых единиц длиной п. Подобные модели используются для крайне ограниченного круга задач: определение языка, проверка орфографии, классификация текстов, выявление именованных сущностей. Главный недостаток подобных моделей состоит в том, что им требуются очень большие по объему корпусы: так, для обработки языка с объемом словаря в 100 000 слов не хватит корпуса, состоящего даже из 1 трлн слов. В более комплексных статистических моделях учитываются также лексические и синтаксические категории, строятся деревья вероятностей. Популярная модель подобного типа, вероятностная контекстно-свободная грамматика, позволяет генерировать достаточно корректные с позиции грамматики предложения. Однако такие систе-
мы часто не распознают предложение как грамматически верное, если в нем встречается форма слова, которую программа не встречала ранее (например, she и her). Кроме того, системы такого типа не учитывают семантические категории, из-за чего возникают абсурдные с позиции смысла словосочетания.
Наибольшую сложность для систем обработки естественного языка вызывает неоднозначность человеческого языка на всех его уровнях. Решить подобную проблему сложно, даже отсылая компьютер к неким правилам, позволяющим найти необходимую для определения контекста информацию в базе знаний. В последнее время популярность обрели нейросети и машинное обучение, показавшие сравнительную эффективность в решении задач обработки естественного языка. Однако и здесь разработчики сталкиваются с рядом препятствий, среди которых необходимость большого количества особым образом размеченных корпусов.
Одной из наиболее развитых сфер обработки естественного языка является машинный перевод. Под машинным переводом понимается автоматический перевод с одного естественного языка на другой. Попытки создания систем, осуществляющих автоматический перевод, предпринимались с момента появления первых компьютеров, однако только в последнее время удалось достичь качественных результатов. В машинном переводе применяются все вышеназванные способы обработки естественного языка. Обобщая, в машинном переводе можно выделить четыре следующих подхода: (1) перевод на основе правил, (2) перевод на основе корпусов, использующий статистические методы, (3) гибридный, сочетающий в себе два предыдущих подхода, (4) машинное обучение. Внутри каждого из подходов в свою очередь также можно выделить различные способы реализации основной идеи подхода. Несмотря на то что перевод, полученный посредством компьютера, с каждым годом становится все точнее, он все еще содержит большое количество ошибок и неточностей, особенно когда перевод осуществляется между языками, отличными от английского.
Автор статьи предлагает интересное решение проблемы общения человека с компьютером: «Давайте встретимся на полпути». Автор считает, что мы могли бы сами изменить свой язык, чтобы он стал более удобен для обработки компьютерами. Так, например, английский язык, став языком мирового общения, обрел
более упрощенную форму, известную как глобиш (Globish -«Global English»). Глобиш состоит из 1500 базовых слов, базового синтаксиса, только активного залога. Для него характерно отсутствие идиом, метафор и переносных значений, он максимально однозначен, а успех коммуникации часто обеспечивается при помощи жестов и мимики. Наблюдается некое сходство между человеком, для которого английский не является родным, и роботом: и тот, и другой испытывают трудности при распознании контекстуальной и культурно-специфической информации. Поэтому упрощение языка могло бы облегчить его обработку и сделать общение человека с компьютером на естественном языке более доступным.
Современные технологии уже оказали большое влияние на все сферы человеческой жизни, включая язык. Развитие цифровой коммуникации и общение через социальные сети, мессенджеры вынуждают людей использовать упрощенные формулировки, избегать сложных синтаксических конструкций, меньше полагаться на невербальный контекст. Технологии привели к такому явлению, как нетспик (netspeak) - неформальной, упрощенной разновидности письменного английского языка, содержащей множество характеристик устной речи. И хотя ожидается, что в будущем общение между человеком и роботом будет происходить в более привычной и естественной для нас устной форме, опыт упрощения и подстройки языка может в значительной мере ускорить процесс создания качественных систем обработки естественного языка.
Другой возможный путь для человека - использование для общения с компьютером искусственных языков, конлангов, изначально созданных на основе более стройных логических правил. Так, язык эсперанто имеет удобное для машинного распознавания соответствие «одна буква - один звук», а его «последователь», язык идо, кроме стройной системы правил и отсутствия неоднозначности, эстетичен и удобен в использовании.
Наиболее же подходящим для общения с компьютером, по мнению автора, является язык ложбан. У него простая морфология, которая позволяет формировать миллионы слов, сочетая существующие в языке 1350 корней. Данный язык культурно нейтрален, в основе его письменности лежит стандартная латиница. В языке почти не используются заглавные буквы, а все знаки препинания вербализируются. Язык лишен омонимов, многознач-
ных слов и идиом, однако возможность соблюдения или частичного отхода от грамматических правил позволяет человеку проявить определенное языковое творчество.
Использование искусственных языков для общения с компьютером, с одной стороны, позволит разработчикам искусственного интеллекта сосредоточиться на других задачах кроме систем обработки естественного языка. Тот же искусственный язык впоследствии сможет заменить английский на посту языка международного общения и науки, так как его упрощенная и логичная структура окажется проще для изучения. С другой стороны, это может привести к снижению роли других языков и потере уникальной культурной информации, содержащейся в них. К тому же, введение искусственного языка на общемировом уровне почти наверняка столкнется с политическими и экономическими препятствиями.
Подводя итог, автор подчеркивает, что в своей работе основывается на сегодняшнем уровне развития технологий. Их развитие в будущем может уменьшить необходимость каких-либо изменений в использовании языка человеком.
Майорова Е.В.