Научная статья на тему 'ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ ПАРАЛЛЕЛЬНЫХ КОРПУСОВ В ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ'

ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ ПАРАЛЛЕЛЬНЫХ КОРПУСОВ В ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
258
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
корпусная лингвистика / корпус / языковые корпуса / параллельные корпуса / лингвистические исследования / corpus linguistics / corpus / language corpora / parallel corpora / linguistic researches

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Трофимов С.В.

В данной статье освещается некоторая информация о корпусной лингвистике, а также об использовании параллельных корпусов в рамках лингвистического исследования. Проведенный анализ показал, что использование параллельных корпусов позволяет не только рассмотреть значение языковых единиц, но и отразить их особенности в языке и культуре.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

POTENTIAL USING OF PARALLEL CORPORA IN LINGUISTIC RESEARCHES

This article is devoted to some information on corpus linguistics and the potential to use parallel corpora in linguistic researches as well. It is reported that parallel corpora allow to consider the significance of language units and to detect their features in language and culture.

Текст научной работы на тему «ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ ПАРАЛЛЕЛЬНЫХ КОРПУСОВ В ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ»

УДК 81

Трофимов С.В. студент магистрант кафедра языкознания и переводоведения Институт иностранных языков Московский городской педагогический институт научный руководитель: Гулиянц А.Б., к.пед.н.

доцент

ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ ПАРАЛЛЕЛЬНЫХ

КОРПУСОВ В ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ

Аннотация:

В данной статье освещается некоторая информация о корпусной лингвистике, а также об использовании параллельных корпусов в рамках лингвистического исследования. Проведенный анализ показал, что использование параллельных корпусов позволяет не только рассмотреть значение языковых единиц, но и отразить их особенности в языке и культуре.

Ключевые слова: корпусная лингвистика, корпус, языковые корпуса, параллельные корпуса, лингвистические исследования

Trofimov S.V.

Graduate student of the Chair of Linguistics and Translation Studies

Institute of Foreign Languages Moscow City University Scientific Adviser: Guliyants A.B. Ass. Professor, candidate of pedagogical sciences

POTENTIAL USING OF PARALLEL CORPORA IN LINGUISTIC

RESEARCHES

Abstract:

This article is devoted to some information on corpus linguistics and the potential to use parallel corpora in linguistic researches as well. It is reported that parallel corpora allow to consider the significance of language units and to detect their features in language and culture.

Keywords: corpus linguistics, corpus, language corpora, parallel corpora, linguistic researches

Язык является неотъемлемой частью современного общества. Он находится в постоянном развитии, и будучи основополагающим звеном коммуникации людей, отражает особенности того общества, в котором используется. Профессия переводчика по своей сути очень интересна и является необходимой в современном мире. Интересна такая профессия тем, что переводчик занимается не только переводом языковых данных, но и отражением национального характера, культуры и её особенностей.

В настоящее время с развитием языка возрастает необходимость в его

анализе, систематизации и категоризации. Существует большое количество учебников для изучения иностранного языка и переводоведения, методик преподавания иностранного языка и перевода, однако они отражают языковые особенности, как правило, на уровне определенного заданного стандарта. Из-за постоянного развития языка появляется необходимость в разработке новых методик и учебников — такое явление происходит ежегодно. Однако, существуют и область лингвистики, которая отвечает за наблюдение за развитием языка и его особенностей. Данное направление называется корпусной лингвистикой.

Проблемой корпусной лингвистики занимались такие ученые, как М.В. Копотев, В.П. Захаров, А.Н. Баранов, В.П. Сысоев, А.Б. Кутузов, Е.В. Рахилина и др.

Существует большое количество определений корпусной лингвистики. Например, В.П. Сысоев рассматривает корпусную лингвистику как раздел языкознания, занимающийся анализом и изучением закономерностей работы языка с помощью языкового корпуса. Автор определяет понимание языкового корпуса как большого объема текстов, отобранных в целостную систему по определенным категориям. В такие категории может входить язык текста, стиль письма, временной отрезок, жанр текста и др. Организация корпуса может быть представлена по-разному, в зависимости от цели создания нового корпуса. Языковой корпус примечателен тем, что полностью систематизирован. [6, с.100]

A.Б. Кутузов определяет корпус как набор текстов, который может быть полезным только при использовании специального программного обеспечения для поиска какой-либо информации и проведения вычислений. [4, с.3]

B.П. Захаров в своем учебно-методическом пособии по изучению корпусной лингвистики дает следующие определения:

«Корпусная лингвистика - направление в компьютерной лингвистике, которое занимается работой над общими принципами создания и использования текстовых корпусов, используя современные технологии».

«Языковой корпус - это источник языковых данных для решения лингвистических задач. Такой электронный источник, как правило, имеет большой объем данных, имеет конкретную структуру, содержит разметку, не нарушает норм и правил языка, на базе которого создан». [3, с.7]

Исходя из указанных выше определений, можно сказать, что корпусная лингвистика — это раздел лингвистики, которое отвечает за анализ закономерностей, особенностей и развития языка с помощью языковых корпусов. Языковые корпуса — это большие,

систематизированные наборы текстов или отрывков текста, которые можно использовать для различных лингвистических научных исследований. С помощью корпусов можно отслеживать закономерность языковых явлений, диахроничность, изменчивость языка или любого языкового элемента, частотность и стилистику искомого элемента языка.

А.Н. Баранов отметил, что большое количество современных лингвистических исследований и работ в области переводоведения направлены на использование текстовых языковых корпусов. Существуют такие корпуса, как исследовательские и иллюстративные. Автор приводит несколько предположений о видах корпусов данных. Так, например, автор классифицирует корпуса на два вида — исследовательские корпуса и иллюстративные корпуса. Исследовательские корпуса

ориентированы на широкий спектр задач в лингвистике, а иллюстративные корпуса — часть корпусов, главной задачей которых является подтверждение и обоснование полученных результатов.

Иллюстративные корпуса могут включать только то, что является достаточным для описания конкретного феномена. [1, с.111-114]

Говоря об особенностях корпусной лингвистики, важно отметить, что существует ряд преимуществ применения в работе корпусного метода для поиска особенностей одного языка или особенностей перевода.

Так, Е.В. Рахилина отмечает, что одной из главных особенностей корпуса, при всей его величине, является его конечность. Благодаря корпусам, абстрактные механизмы языка приобретают материальность, следовательно, их можно анализировать посредством подсчета, измерения или оценки. Корпусный подход к языку существует с целью трансформации виртуальной сущности языка в набор закрепленных текстов. [5, с.499]. Использование языковых корпусов позволяет проанализировать диахронические данные, частотность употребления отдельных лексических или грамматических единиц, стилистические аспекты текстов и другие изменения языка. Такие изменения зачастую недостаточно заметны для носителей языка, однако с позиции научного подхода к языку данные преобразования могут быть достаточно важными. [5, с.501]

Что касается репрезентации особенностей перевода в рамках корпуса, наиболее необходимым для такой задачи является параллельный корпус.

Д.О. Добровольский отмечает, что использование параллельных корпусов дает возможность обнаружить большее количество переводимых эквивалентов искомой единицы перевода, в отличие от анализа словарей или интроспекции. Использование в работе корпусов параллельного текста позволяет расширить представление о том, как устроена языковая система сравниваемых языков, о влиянии контекста на выбор наиболее подходящего перевода и на выявление специфических особенностей искомых лексических единиц. [2, с.18]

Наиболее известный в России параллельный языковой корпус — англо-русский параллельный подкорпус Национального корпуса русского языка (НКРЯ). В данном корпусе содержится 1608376 отдельных предложений с переводами, однако, можно воспользоваться корпус-менеджером для поиска английских текстов, переведенных на русский язык, что существенно упрощает работу. Параллельный корпус НКРЯ представлен как выровненная таблица, где каждому участку английского текста (или

отрезка текста) соответствует перевод на русский язык. Кроме того, корпус может работать и в обратном направлении — поиск может производиться от русского оригинального текста к переводу на английский язык.

Преимущество данного корпуса состоит, в первую очередь, в том, что именно он является в настоящее время наиболее часто используемым российскими учёными-лингвистами для выявления различных феноменов и закономерностей на уровне перевода с русского языка на английский. Кроме того, данный корпус имеет удобный корпус-менеджер (поисковый сервис), позволяющий производить поиск запрашиваемого материала достаточно быстро. Еще одним преимуществом данного корпуса является факт того, что весь представленный материал собран из официальных источников — художественной литературы (в том числе, классической) и их официальные переводы, указанные в самом корпусе.

Указывая на недостатки НКРЯ важно отметить, что материала для проведения некоторых исследований может быть недостаточно. Еще одним недостатком данного корпуса является и его указанное выше преимущество — поскольку материал взят из художественной литературы, рассмотреть особенности употребления и перевода аспектов современной лексики в других дискурсах не представляется возможным.

Существует и другой параллельный англо-русский языковой корпус — Параллельный англо-русский корпус от компании Яндекс. Он представлен в виде архивного файла, в котором содержатся два отдельных текстовых файла: в первом файле представлены предложения на английском языке, а во втором — их перевод на русский. Суммарно в Яндекс-корпусе представлен 1000000 примеров перевода предложений с английского языка на русский. Выбор данного корпуса может быть обусловлен тем, что в отличие от параллельного корпуса Российского национального корпуса, предложения в Яндекс корпусе выбраны в автоматическом режиме из экспериментальных корпусов, собранных в 2011-2013 годах из параллельно составленных документов, находящихся в Интернете. Такая выборка может отразить современный уровень развития английского и русского языков.

Указывая на преимущества данного корпуса от Яндекс, важно указать, что в нем содержатся не только предложения из художественной литературы, но и предложения из других дискурсов (например, новостного). К недостаткам данного корпуса можно отнести то, что в данном корпусе не представлено корпус-менеджера (поискового сервиса), что существенно затрудняет работу, поскольку поиск предложений производится вручную. Еще одним недостатком является ряд ошибок в тексте корпуса (в т.ч. переводческих), поэтому большое количество примеров из данного корпуса может быть отклонено на подготовительном этапе практического исследования, а может быть рассмотрено как особенность машинного перевода при описании языковых феноменов.

Рассмотрев определения корпусной лингвистики, особенностей использования корпусов в лингвистических исследованиях, а также осветив

некоторую информацию по использованию параллельных корпусов можно выделить, что корпусная лингвистика охватывает большое количество информации для выявления особенностей в других аспектах лингвистике.

Корпусная лингвистика позволяет отразить не только словарное значение слов в переводе, в нем учитываются языковые, культурные и стилистические особенности языка. Использование языковых корпусов может быть полезно как переводчикам, так и людям других профессий, связанных с языком и культурой общества.

Использованные источники:

1. Баранов А.Н. Введение в прикладную лингвистику: Учебное пособие. — М.: Эдиториал УРСС, 2001. — 360 с.

2. Добровольский Д.О., Кретов А.А., Шаров С.А. Корпус параллельных текстов // Научная и техническая информация, сер. 2. Информационные процессы и системы, 2005, № 6, 16—27.

3. Захаров В.П. Корпусная лингвистика: Учебно-метод. пособие. - СПб., 2005. - 48 с.

4. Кутузов А.Б. Корпусная лингвистика: курс лекций. Лекция № 2 [Электронный ресурс]. - Режим доступа: http://tc.utmn.ru/files/corpus_2.pdf.

5. Рахилина Е.В, Марушкина Е.С. Корпусные исследования особенностей речи нестандартных говорящих («эритажный» русский). Acta Linguistica Petropolitana - Труды ИЛИ РАН. 2015, т. XI, вып. 1, С. 621-639.

6. Сысоев П. В. Лингвистический корпус в методике обучения иностранным языкам // Язык и культура. 2010. №1 — С. 99-111.

7. Инструкция по пользованию Национальным корпусом русского языка [Электронный ресурс]. - Режим доступа: http://www.ruscorpora.ru/instruction-main.pdf

8. Лицензионное соглашение на использование Англо-русского параллельного корпуса компании Яндекс [Электронный ресурс]. - Режим доступа: https: //yandex.ru/legal/corpus/?lang=ru

i Надоели баннеры? Вы всегда можете отключить рекламу.