Научная статья на тему 'Инновационные технологии в современной неологии: от картотеки к лингвистическому корпусу'

Инновационные технологии в современной неологии: от картотеки к лингвистическому корпусу Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
471
145
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕОГРАФИЯ / СЛОВАРИ НОВЫХ СЛОВ / КАРТОТЕКА / КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ / ИНТЕРНЕТ / ЛИНГВИСТИЧЕСКИЙ КОРПУС / ВЕБСАЙТ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Авдеева Юлия Анатольевна

Данная статья освещает современные компьютерные и Интернет-технологии, которые могут быть широко использованы для проведения исследований в области неологии. Рассматриваются вопросы интенсификации традиционных способов сбора и хранения языкового материала. Анализ различных лингвистических корпусов показал, что они являются необходимым инструментарием для наблюдения и синхронной регистрации новых слов в языке.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Инновационные технологии в современной неологии: от картотеки к лингвистическому корпусу»

УДК 81’33

ББК 81.12

А 18

Авдеева Ю.А.

Инновационные технологии в современной неологии: от картотеки к лингвистическому корпусу

Аннотация:

Данная статья освещает современные компьютерные и Интернет-технологии, которые могут быть широко использованы для проведения исследований в области неологии. Рассматриваются вопросы интенсификации традиционных способов сбора и хранения языкового материала. Анализ различных лингвистических корпусов показал, что они являются необходимым инструментарием для наблюдения и синхронной регистрации новых слов в языке.

Ключевые слова:

Неография, словари новых слов, картотека, компьютерные технологии, Интернет, лингвистический корпус, вебсайт.

На сегодняшний день в неологии действуют два основных направления: исследование специфики обновления словарного состава и проблемы лексикографирования неологизмов. Указанные направления имеют взаимопроникающий характер. Для систематизации и описания новых слов в России в 60-е годы прошлого столетия Н.З. Котелова разработала и издала несколько выпусков словарей «Новое в русской лексике». Она предложила выделить четыре типа словарей новых слов и значений:

• Ежегодники.

• Десятилетние словари.

• Банк русских неологизмов.

• Словарь новых слов русского языка 50-80-х гг., выборочно дополненный и

нормативный, охватывающий неологизмы всего послевоенного времени [1: 48 - 50].

В дальнейшем работа в этой области значительно продвинулись вперед. Так, А.А.

Брагина предложила классифицировать словники новых слов, так чтобы в них отражался процесс появления, употребления и закрепления нового слова в языке [2: 112]. Соответственно этому выделено три типа словарей:

• ежегодные словари, включающие все слова как новые. Примером такого издания как раз и являются выпуски «Новое в русской лексике. Словарные материалы», охватывающие материалы за 3-4 месяца одного года;

• словари-справочники, охватывающие 10-летний период, такие как «Новые слова и значения»;

• словари неологические, толковые, охватывающие несколько десятилетий. Они включают лексику, не зафиксированную академическими словарями, но уже закрепленную в узусе.

В основу данной типологизации словарей новых слов были положены такие принципы, как целевые установки словаря и временной промежуток, охватывающий период наблюдения. Эти работы заложили основу для появления и развития словарей авторских новообразований, словарей детских новообразований, деривационных словарей неологизмов и других.

Однако нужно отметить, что проблема фиксации и описания неологизмов в синхронном аспекте является в России мало разработанной, что обусловлено, в основном, тем, что новые слова выделяются post factum, то есть только после появления слова в речи, а именно - в текстах газет, или в живой речи телевизионных программ. Проходит достаточно большой промежуток времени, прежде чем новые слова фиксируются и описываются в

одном из вышеуказанных словарей.

В.В. Мамонтова в своей статье, посвященной месту корпусной лингвистики в современной науке о языке, подчеркивает, что использование компьютерных технологий в качестве технологического инструмента оказывает непосредственное воздействие на традиционные способы сбора и хранения языкового материала - ручную обработку письменных текстов, словарные картотеки и другие формы. Всем известны недостатки традиционных способов, к которым относятся большие временные затраты, ограниченность объёма, сложность обновления, громоздкость статистической обработки, невозможность дистанционного доступа. Использование компьютерных технологий для сбора и хранения материала лингвистического исследования позволяет в полной мере задействовать преимущества этого способа. В этом случае ускоряется процесс получения языкового материала, использование Интернета в качестве средства дистанционного доступа нивелирует расстояния, объём информации увеличивается многократно, компьютерные программы хранения и обработки данных позволяют быстро получать доступ к необходимой информации и также быстро её обрабатывать [3: 277].

Сегодня развитие новых информационных технологий и систем мультимедиа, которые позволяют многократно увеличить скорость сбора и анализа фактического языкового материала, способно стать настоящем прорывом в методике исследования неологизмов. В электронном виде стали практически повсеместно доступны массивы текстов ведущих газет и журналов. В информационном пространстве Интернета существуют библиотеки и энциклопедии, которые содержат как тексты художественной, так и научной литературы. Как отмечает А.Н. Баранов, многие издательства используют для составления словарей специально подготовленные корпусы текстов. Таков, например, Бирмингемский корпус английского языка и соответствующая ему база данных, созданные как источники для подготовки англоязычных словарей издательства COLLINS. Среди других ученый приводит следующую типологию корпусов:

• фундаментальные, отражающие состояние языка в целом. Примером такого корпуса текстов является Брауновский корпус американского варианта английского языка, созданный в Брауновском университете США в 1962-63гг. под руководством Нельсона Фрэнсиса;

• динамические или мониторные корпусы текстов, в которых происходит динамическое обновление и/или дополнение множества текстов;

• авторские [4: 476-478].

Появление корпусов текстов позволяет значительно изменить подход к методам исследования, описания и осмысления языковых явлений. Для развития лексикографии в неологии актуальной необходимостью сегодняшнего дня является изучение и работа с динамическими корпусами, отдельными примерами которых могут служить такие иностранные Интернет-ресурсы, как HighBeam Library Research (система поиска по базе в 35 млн. научных документов из 3000 источников с ежедневным обновлением и архивом за последние 20 лет), The British National Corpus Project, WebCorp LSE linguist’ search engine и др.

Такие лингвистические Интернет-ресурсы, как New Oxford American Dictionary, Macmillan English dictionary [5], ведут синхронную фиксацию новых слов, предоставляя сразу и контекстное употребление, и толкование. При этом вновь появившиеся за год в языке слова сначала включаются в онлайн-версию New Oxford American Dictionary, а затем входят и в бумажные переиздания словаря

В качестве примера лингвистического корпуса рассмотрим описание Macmillan English dictionary, которое предлагает С.И. Красса в статье «Лингвистические метакорпусы».

Macmillan English dictionary создан с опорой на World English Corpus. Объём данного корпуса составляет более 200 млн. словоупотреблений. В WEC входят письменный и устный корпусы (соотношение 9:1). Компоненты корпуса следующие: 1. Британский английский. 2. Американский английский. 3. Международный английский. 4. Корпус

учебных текстов (написанных изучающими английский), материалы английского как иностранного, включая учебники и книги для чтения. Корпус включает жанры: 1) научный дискурс, 2) новости печатных и электронных СМИ, 3) записи бесед, включая телефонные разговоры, 4) записи деловых бесед, 5) документальная проза, 6) сообщения автоответчика, 7) электронные письма, 8) правовые документы, 9) университетские семинары, 10) культурологические тексты, 11) радиодокументалистика, 12) интервью в электронных СМИ, 13) учебники английского как иностранного, 14) тексты, написанные изучающими английский, в том числе сочинения и экзаменационные работы. Обзор корпуса даёт все основания полагать, что он отражает английский язык в его различных, в том числе современных, проявлениях.

Интеллектуальный поиск SmartSearch позволяет работать с грамматической разметкой корпуса словаря, которая включает: части речи, грамматические категории, наиболее и наименее характерное употребление в грамматической конструкции. Поиск указывает региональные варианты слов. Пользователю доступны также:

1. Функционально-стилистические группы слов.

2. Частотная шкала.

3. Моно- и полисемия с градацией по количеству значений.

4. Дополнительная информация: 1) лингвистическая (синонимы, этимология, лексикосемантические группы, коллокации, особенности употребления, различия американского и британского вариантов, когнитивные метафоры, оскорбительные слова и выражения); 2) лингводидактическая (выбор более точного слова, типичные ошибки, обучение научному стилю); 3) энциклопедическая (культурологический комментарий) [6: 272-273].

Еженедельная синхронная регистрация новых слов на вебсайте Macmillan Dictionaries, проводимая с 2003 года, предоставляет обширный лексический материал для проведения структурно-семантического, когнитивного и количественного анализа, а также позволяет разрешить давнюю проблему, какое слово считать новым, поскольку одновременно регистрируются слова, имеющие смысл, «который не был воплощен ранее в словесной форме» (по И.С. Торопцеву) и слова, непосредственно имеющие новую форму. На сегодняшний день издательством зарегистрировано более 250 новых слов.

В России также существует и разрабатывается несколько проектов по созданию корпусов текстов. Подробнее о них можно узнать на сайте «Национальный корпус русского языка» [7]. Создание и исследование корпусов текстов позволяет наблюдать, синхронно регистрировать и выявлять актуальные изменения в сфере языка и в сфере сознания, что, в свою очередь, помогает понять, как происходит переосмысление окружающей действительности. Как отмечают Т.И. Резникова, М.В. Копотев: «В этом смысле всякий языковой корпус в силу необходимости тотального описания материала кристаллизует проблемные области в описании того или иного языка. Он оказывается не только инструментом для быстрого поиска примеров, но и источником совершенствования и теоретических, и чисто дескриптивных подходов к языку» [8: 47]. Привлечение лингвистических корпусов и современных компьютерных программ является качественно новым шагом в развитии неографии, так как их использование позволяет нам отследить и описать процесс появления, употребления и закрепления нового слова в языке.

Примечания:

• Котелова Н.З. Теоретические аспекты лексикографического описания неологизмов //

Советская лексикография. М., 1988. С. 46-63.

• Брагина А.А. Рецензия // НДВТТТ. Филологические науки. М., 1997. № 2. С. 111-115.

Рец. на кн.: Новое в русской лексике. Словарные материалы 1988 / под ред. Е.А.

Левашова; РАН, Ин-т лингв. исслед. СПб.: Дмитрий Буланин, 1996. 420 с.

• Мамонтова В.В. Корпусная лингвистика и лингвистические корпусы // Язык. Текст.

Дискурс: науч. альманах Ставропольского отделения РАЛК / под ред. проф. Г.Н.

Манаенко. Ставрополь: Изд-во ПГЛУ, 2007. Вып. 5. С. 275-283.

• Баранов А.Н. Лингвистическая экспертиза текста: теория и практика: учеб. пособие. 2-е изд. М.: Флинта: Наука, 2009. 592 с.

• Macmillan English Dictionary. URL: http://www.macmillandictionaries.com.

• Красса С.И. Лингвистические метакорпусы // Язык. Текст. Дискурс: науч. альманах Ставропольского отделения РАЛК / под ред. проф. Г.Н. Манаенко. Ставрополь: Изд-во ПГЛУ, 2007. Вып. 5. С. 269-274.

• Национальный корпус русского языка. URL: http://www.ruscorpora.ru

• Резникова Т.И., Копотев М.В. Лингвистически аннотированные корпуса русского языка (обзор общедоступных ресурсов) // Национальный корпус русского языка: 20032005. М.: Индрик, 2005. С. 31-59.

i Надоели баннеры? Вы всегда можете отключить рекламу.