Научная статья на тему 'Особенности английской терминологии компьютерной лингвистики как лексико-семантической группы подъязыка искусственного интеллекта'

Особенности английской терминологии компьютерной лингвистики как лексико-семантической группы подъязыка искусственного интеллекта Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
1164
204
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕРМИНОЛОГИЯ / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА / ЛЕКСИКО-СЕМАНТИЧЕСКАЯ ГРУППА / TERMINOLOGY / ARTIFICIAL INTELLIGENCE / COMPUTATIONAL LINGUISTICS / LEXICO-SEMANTIC GROUP

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Винокурова Татьяна Николаевна

В данной статье представлены результаты исследования терминологии искусственного интеллекта в английском языке на примере одного из направлений рассматриваемой науки компьютерной лингвистики. Необходимость исследования терминологии указанных наук вызвана, в первую очередь, актуальностью искусственного интеллекта и компьютерной лингвистики на современном этапе развития научной мысли не только в рамках отдельно взятой страны, но и в мировом масштабе. Автором предпринята попытка показать особенности терминологии лексико-семантической группы «компьютерная лингвистика» и проследить закономерность между развитием терминологии искусственного интеллекта и компьютерной лингвистики. Необходимость исследования понятийного аппарата искусственного интеллекта и, в частности, компьютерной лингвистики объясняется отсутствием исследований такого плана.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The peculiarities of terminology of computational linguistics as a lexico-semantic group of the sublanguage of artificial intelligence in the English language

The paper is devoted to the terminology of computational linguistics as one of the branches of artificial intelligence and its peculiarities in the English language. The necessity of investigation of the terminology of the mentioned sciences is proved by the rapid development of artificial intelligence and computational linguistics at the present-day scientific evolution. The author tries to reveal the peculiarities of the terminology of lexico-semantic group «computational linguistics)) and trace the similarities and main principles of artificial intelligence and computational linguistics terminology. The absence of research in the field of terminology of artificial intelligence and computational linguistics in particular explains the singularity of the following scientific investigation.

Текст научной работы на тему «Особенности английской терминологии компьютерной лингвистики как лексико-семантической группы подъязыка искусственного интеллекта»

1. Одинцова, М. П. Вместо введения: к теории образа человека в языковой картине мира [Текст] / М. П. Одинцова. // Язык. Человек. Картина мира. Лингвоантропологические и философские очерки (на материале русского языка) .4.1. — Омск, 2000. — С. 8-11.

2. Никитина, Л. Б. Антропоцентристская семантика: образ homo sapiens по данным русского языка [Текст]: учеб. пособие / Л. Б. Никитина. — Омск, 2007. — 256 с.

3. Седова, Н. А. Соотношение образов частичного (частей) и целостного человека в языковой картине мира (на материале

семантико-функционального макрополя «часть человека» в современном русском языке) [Текст]: автореф. дис.... канд. филол. наук / Н. А. Седова. — Барнаул, 2000. — 21 с.

САЛИМЬЯНОВА Ирина Викторовна, ассистент кафедры русского языка как иностранного.

Адрес для переписки: e-mail: irinbogatyreva@yan-dex.ru

Статья поступила в редакцию 17.11.2010 г.

© И. В. Салимьянова

УДК 004.8:811.111 Т. Н. ВИНОКУРОВА

Омский государственный университет им. Ф. М. Достоевского

ОСОБЕННОСТИ

АНГЛИЙСКОЙ ТЕРМИНОЛОГИИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ КАК ЛЕКСИКО-СЕМАНТИЧЕСКОЙ ГРУППЫ ПОДЪЯЗЫКА ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

В данной статье представлены результаты исследования терминологии искусственного интеллекта в английском языке на примере одного из направлений рассматриваемой науки — компьютерной лингвистики. Необходимость исследования терминологии указанных наук вызвана, в первую очередь, актуальностью искусственного интеллекта и компьютерной лингвистики на современном этапе развития научной мысли не только в рамках отдельно взятой страны, но и в мировом масштабе. Автором предпринята попытка показать особенности терминологии лексико-семантической группы «компьютерная лингвистика» и проследить закономерность между развитием терминологии искусственного интеллекта и компьютерной лингвистики. Необходимость исследования понятийного аппарата искусственного интеллекта и, в частности, компьютерной лингвистики объясняется отсутствием исследований такого плана.

Ключевые слова: терминология, искусственный интеллект, компьютерная лингвистика, лексико-семантическая группа.

Современный человек живет в огромной информационной среде — телевидение, радио, газеты, Интернет. Объемы информации ежегодно возрастают на порядок. Современные информационные технологии включают растущее число автоматизированных информационных систем, средств массовой коммуникации, систем информационного поиска, систем машинного перевода. Общение с компьютером развивается в сторону использования удобного для человека языка. Компьютер — это сложная техническая система, в которой все должно быть жестко формализовано и запрограммировано, но естественный язык — это слишком сложная структура, поэтому работа с информацией на естественном языке в современных компьютерных средах ограничивается недостатком знаний о языке. Проблемы языковой коммуникации «человек —компьютер— человек» и моделирования языка лежат в области исследований такой молодой науки, как компьютерная лингвистика, которая образовалась на стыке информатики и лингвистики [1, с. 18].

Компьютерная лингвистика, будучи одним из направлений прикладной лингвистики, изучает лингвистические основы информатики и все аспекты связи языка и мышления, моделирования языка и мышления в компьютерной среде с помощью компьютерных программ. По мнению Л. Н. Ясницкого, компьютерная лингвистика является одной из наиболее популярных тем исследования искусственного интеллекта [2, с. 27].

Как особое научное направление компьютерная лингвистика оформилась в 1950-е годы в Соединенных Штатах Америки (в СССР интерес к компьютерной лингвистике возник десятилетие спустя). С изобретением транзистора и появлением нового поколения компьютеров, а также первых языков программирования, начались эксперименты с машинным переводом, особенно русских научных журналов. Однако качество машинного перевода до сих пор сильно уступает качеству перевода, произведённого человеком. Были созданы первые системы искусственного интеллекта, такие как ЗНСБЬ. Они, правда, устарели,

ФИЛОЛОГИЧЕСКИЕ НАУ

но пользуются популярностью у студентов и научных сотрудников Академий наук, занимающихся компьютерной лингвистикой [1, с. 20].

Русский термин «компьютерная лингвистика» является калькой с английского computational linguistics. Поскольку прилагательное computational на русский может переводиться и как «вычислительный», в литературе встречается также термин «вычислительная лингвистика». Поток публикаций в этой области очень велик. Кроме тематических сборников, в США ежеквартально выходит журнал «Компьютерная лингвистика» (Computational Linguistics). Большую организационную и научную работу проводит Ассоциация по компьютерной лингвистике (The Association for Computational Linguistics), которая имеет региональные структуры (в частности, европейское отделение). Каждые два года проходят международные конференции по компьютерной лингвистике — COLING. Соответствующая проблематика обычно бывает широко представлена также на различных конференциях по искусственному интеллекту.

Компьютерная лингвистика как особая прикладная дисциплина выделяется, прежде всего, по инструменту, т.е. по использованию компьютерных средств обработки языковых данных. Поскольку компьютерные программы, моделирующие те или иные аспекты функционирования языка, могут использовать самые различные средства программирования, то об общем понятийном аппарате компьютерной лингвистики говорить вроде бы не приходится. Однако это не так. Существуют общие принципы компьютерного моделирования мышления, которые, так или иначе, реализуются в любой компьютерной модели. В их основе лежит теория знаний, первоначально разрабатывавшаяся в области искусственного интеллекта, а в дальнейшем ставшая одним из разделов когнитивной науки. Важнейшими понятийными категориями компьютерной лингвистики являются такие структуры знаний, как frame — фрейм (понятийные, или, как принято говорить, концептуальные структуры для декларативного представления знаний о типизированной тематически единой ситуации), script — сценарий (концептуальные структуры для процедурного представления знаний о стереотипной ситуации или стереотипном поведении), plan — план (структуры знаний, фиксирующие представления о возможных действиях, ведущих к достижению определенной цели).

Как отмечалось выше, в круг проблем, на которые компьютерная лингвистика пытается найти решения, лежит в области машинного перевода и в разработке естественно-языкового интерфейса между человеком и машиной. Представляется возможным выделить следующие направления компьютерной лингвистики:

— машинный перевод;

— создание электронных словарей, тезаурусов, онтологий;

— обработка естественного языка (синтаксический, морфологический, семантический анализы текста; англ. (parsing);

— автоматическое извлечение фактов из текста (извлечение информации) (fact extraction, text mining),

— автореферирование (автоматическое реферирование текстов);

— построение систем управления знаниями;

— оптическое распознавание символов (OCR);

— автоматическое распознавание речи (ASR);

— корпусная лингвистика, создание и использование электронных корпусов текстов [3, с. 645].

Рассмотрим особенности терминологических единиц, составляющих лексико-семантическую группу (ЛСГ) «компьютерная лингвистика» внутри подъязыка искусственного интеллекта в английском языке.

Анализ терминологических единиц подъязыка искусственного интеллекта в английском языке проводится на основе выборки, составленной путем сплошного просмотра монографии С. Рассела и П. Норвига «Искусственный интеллект. Современный подход», а также статей из научных журналов и докладов на международных конференциях по искусственному интеллекту. Выборка терминологических единиц с оставляет 2180 единиц, 101 из которых образует ЛСГ «компьютерная лингвистика». Подавляющее большинство терминологических единиц представляют собой двухкомпонентные терминосоче-тания, общее число которых составляет 60 единиц. На примере данной ЛСГ четко прослеживается тенденция, характерная для большинства англоязычных терминологий, образование двухкомпонентных терминологических сочетаний по модели «прилагательное + существительное». Подтвердить данное утверждение можно следующими примерами: в declarative language — декларативный язык, declarative semantics — декларативная семантика, deep case — глубинный падеж, formal grammar — формальная грамматика, semantic space — семантическое пространство.

Если мы говорим о наличие терминологических сочетаний, состоящих из двух и более компонентов, то это позволяет выделить ядерные термины, т.е. те термины, которые образуют то или иное терминологическое сочетание. Самым продуктивным ядер-ным термином внутри данной ЛСГ стала лексическая единица language — язык, с помощью которого было образовано 26 терминологических сочетаний: machine language — машинный язык, production system language — язык продукционной системы, programming language — язык программирования, query language — язык запросов, formal language — формальный язык [4, с. 66 — 70].

Анализ терминологических единиц, составляющих ЛСГ «компьютерная лингвистика» подъязыка искусственного интеллекта в английском языке показал, что рассматриваемые термины были заимствованы из области лингвистики без изменения своего лексического значения. Это можно объяснить следующим образом: ученые, работающие в направлении искусственного интеллекта, ставят своей задачей доказать возможность машин действовать подобно человеку, а также выполнять интеллектуальные действия, традиционно приписываемые людям. Именно поэтому ученые искусственного интеллекта заимствуют термины других наук без изменения их лексического значения.

Рассмотрим это на примере термина language — язык, который, как правило, ассоциируется с системой устного или письменного общения, используемой людьми определенной страны или территории.. Longman Dictionary of Contemporary English дает следующее определение лексической единицы: language — 1. а system of communication by written or spoken words, which is used by the people of the particular country or territory; 2. the ability to use words to communicate; 3. a system of instruction and commands for operating a computer. [5, c. 789]. Из приведенного выше определения термина явно следует, что первоначальное значение лексемы «language» лежит в области лингвистики, как одной из наук о языке, и только потом было заимствовано компьютерными

науками, в частности, искусственным интеллектом, для обозначения «общения» между человеком и компьютером.

Слово «language» было заимствовано из французского языка в конце XIII века, в то время, когда человечество начинает анализировать и осмыслять особенности взаимоотношений между людьми. Оксфордский этимологический словарь английского языка дает следующую справку о происхождении лексической единицы «language»: language — late 13с., from O.Fr. langage (12c.), from V.L. *linguaticum, from L. lingua “tongue," also “speech, language [6, c. 658].

Компьютерная лингвистика, являясь одним из направлений искусственного интеллекта, отражает все те закономерности и особенности, присущие для терминологии той науки, в рамках которой она бурно развивается на протяжении последних шестидесяти лет. Учитывая возрастающую необходимость профессионального владения иностранным языком в современных условиях развития науки, бизнеса, коммуникации и международного сотрудничества специалистов различных отраслей деятельности, машинный перевод как одно из направлений компьютерной лингвистики приобретают все большую значимость. В Омском государственном университете им. Ф. М. Достоевского ведется специальный курс обучения машинному переводу для подготовки специалистов, владеющих навыком работы с текстом с помощью использования программ искусственного интеллекта. Это имеет особую значимость для динамично развивающегося региона, коим является Омская область.

1. Будущее искусственного интеллекта: сборник статей / Под. ред. К. Е. Левитина, Д. А. Поспелова. — М.: Наука, 1991. — 302 с.

2. Ясницкий, Л. Н. Введение в искусственный интеллект: учеб. пособие для студ. высш. учеб. заведений/Л. Н. Ясницкий. — М. : Издательский центр «Академия», 2005. — 176 с.

3. Рассел, С. Искусственный интеллект. Современный подход/ С. Рассел, П. Норвиг. — 2-е изд. — М.: 2007. — 1407 с.

4. Винокурова, Т. Н. О необходимости исследования терминологии / Т. Н. Винокурова // Актуальные проблемы лингвистики и методики преподавания иностранных языков: материалы Всероссийской научно-практической конференции. В 3 ч. Ч. 1. — Уфа : Риц БашГУ, 2010. — 246 с.

5. Longman Dictionary of Contemporary English. — Longman Group Ltd, third edition, 1995. — 1668 c.

6. Little W, Flower H.W., Coulson J. The Shorter Oxford English Dictionary on Historical Principles. — Oxford University Press., 3rd ed. - 1973, vol. 2 - 343 c.

ВИНОКУРОВА Татьяна Николаевна, преподаватель кафедры иностранных языков Омского государственного университета им. Ф. М. Достоевского, аспирантка кафедры иностранных языков Омского государственного технического университета. Адрес для переписки: e-mail: vintan26@mail.ru

Статья поступила в редакцию 25.11.2010 г.

© Т. Н. Винокурова

УДК 811.112.2:007:574.6 Т> Н. ШАРАПОВА

Омский государственный технический университет

ОСОБЕННОСТИ ПРОЦЕССА МЕТАФОРИЗАЦИИ НЕМЕЦКОЙ ТЕРМИНОЛОГИИ БИОНИКИ

В статье проводится анализ процесса метафоризации немецкой терминологии бионики согласно классификации ведущих отечественных и зарубежных лингвистов. Рассматриваются наиболее продуктивные виды метафор, участвующие в процессе терминологизации общеупотребительной лексики, что подтверждается большим количеством примеров.

Ключевые слова: терминология, бионика, метафоризация.

В классическом языкознании метафора рассматривается как явление языка, суть которого заключается в образовании наименований путем переосмысления дескриптивной лексики. В частности, А. А. Реформатский писал: «Метафора, т.е. «перенос» является самым типичным случаем переносного значения. Перенос наименования при метафоре основывается на сходстве реалий по внешнему виду, форме, цвету, ценности, положению, характеру движений» [1].

А. М. Алексеева отмечает, что метафора свойственна не только художественной, но и научной

речи, поскольку посредством метафоры реализуется «потребность человеческого мышления, оперирующего одновременно абстракциями и образами». При этом важно, что метафора в функции терминологической единицы является не конечным продуктом речевой деятельности или неким эффективным экспрессивным средством, а составляет основу процесса индивидуального научного творчества, целью которого является представление новизны открываемого знания и его оязыковление [2].

Наиболее актуальной проблемой в изучении теории метафоры является проблема ее классификации,

i Надоели баннеры? Вы всегда можете отключить рекламу.