Научная статья на тему 'Проект электронного словаря лингвокультурологического типа: общая концепция и специфика технического воплощения'

Проект электронного словаря лингвокультурологического типа: общая концепция и специфика технического воплощения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
544
101
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРПУСНАЯ ЛИНГВИСТИКА / НАРОДНАЯ ПРИМЕТА / ЛИНГВОКУЛЬТУРО-ЛОГИЯ / ЭЛЕКТРОННЫЙ СЛОВАРЬ / КОНСТРУКТОР / ТЕХНИЧЕСКОЕ ЗАДАНИЕ / COMPUTATIONAL LEXICOGRAPHY / DICTIONARY PROJECT / INTERNET-RESOURCE / DICTIONARY BUILDER / TERMS OF REFERENCE / TEST DOMAIN / UNIFIED SOFTWARE DEVELOPMENT PROCESS / CORPUS LINGUISTICS / LINGUOCULTUROGRAPHY / NATIONAL SIGN / LINGUOCULTUROLOGICAL COMMENTARY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Агапова Нина Александровна, Картофелева Наталья Федоровна

В статье сделан краткий обзор существующих лингвокультурологических и этнолингвистических словарей, представляющих собой примеры взаимодействия теоретических разработок и практических результатов. Дана общая концепция электронного лингвокультурологического словаря примет; обосновано его принципиальное отличие от существующих в данный момент интернет-ресурсов, содержащих аналогичную информацию; охарактеризованы базовые особенности и основные разновидности интернет-сайтов подобного типа. Введено понятие «конструктор словаря»; очерчен круг свойств и функциональных требований, актуальных для создаваемого электронного словаря; произведен обзор существующих программ, используемых для создания электронных словарей, и обоснована необходимость разработки собственно электронного приложения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The electronic dictionary of a linguoculturological type project: general conception and the specifics of technical realization

During the work over a dictionary theory and practice are inseparably connected; lin-guoculturology is no exception. Linguoculturological and ethnolinguistic dictionaries are the product of theoretical research, summarizing and concluding on the one hand, and a dictionary itself can become a valuable database for analysis and new researches on the other. Dictionaries of such a type require a more complicated way of data organization: this is due to the fact that in the sight of a lexicographer there are extralinguistic phenomena (customs, rites, gestures, suits.) along with linguistic ones, they require a particular approach to the possibility of their representation within a dictionary entry limits. However, the real specifics of the material representing in a dictionary of a linguoculturological type, united with navigational and technical possibilities of the modern computational lexicography, can produce some impressive results. The analysis of current linguoculturological and ethnolinguistic dictionaries allows to come to a conclusion that despite active growth of corpus linguistics and computational lexicography in recent years domestic science has not created any electronic dictionaries. The authors of this paper aim at solving the task of development of an electronic dictionary of the linguoculturological type; as an illustration of such a dictionary it was decided to develop and implement an electronic dictionary of national signs. The realization of this project proposes the elaboration of the general concept of the dictionary, the structure (model) of a dictionary entry, the principles of organisation of the material presented in the dictionary and the development of software which is supposed to ensure the most convenient dictionary usage. The dictionary to be created must be the utility for the researchers who work with national signs as well as for common language speakers who are interested in national signs and superstitions. Thus, any potential reader (user) of the dictionary interested in national signs and superstitions can get access to a large amount of national signs (about 1500 units at the moment) united into one electronic lexicographical material. At the same time, the project does not include the national signs corpus creation only; according to the authors'' concept, it serves to join the material (national signs) with its lin-guoculturological commentary. This, in its turn, is the essential distinguishing feature of the dictionary. The work on the dictionary creation goes in two directions simultaneously. The first direction includes the preparatory work (the material collection), its classification according to different arguments, and the linguoculturological analysis of the national signs. The second direction applies to the technical realization of the dictionary. In the context of this direction, in its turn, it is possible to define two steps of realization: the first step implies the creation of a builder for making dictionaries of a linguoculturological type; the second step implies the creation of a linguoculturological dictionary of national signs using the dictionary builder. In this case the electronic dictionary of national signs serves as the test domain for the builder project. The authors of this paper found out that there are no unified software products among the ways of electronic dictionary creation; in other words, there are no universal software programmes for making electronic dictionaries; almost all relevant software is developed for particular proprietary dictionaries and cannot be used by other lexicographers this illustrates the topicality and utility value of the announced dictionary project.

Текст научной работы на тему «Проект электронного словаря лингвокультурологического типа: общая концепция и специфика технического воплощения»

СЛОВАРНЫЕ ПРОЕКТЫ И ТРУДЫ

УДК 81*374.2, 81'374.7

Н.А. Агапова, Н.Ф. Картофелева

ПРОЕКТ ЭЛЕКТРОННОГО СЛОВАРЯ ЛИНГВОКУЛЬТУРОЛОГИЧЕСКОГО ТИПА: ОБЩАЯ КОНЦЕПЦИЯ И СПЕЦИФИКА ТЕХНИЧЕСКОГО ВОПЛОЩЕНИЯ1

В статье сделан краткий обзор существующих лингвокультурологических и этнолингвистических словарей, представляющих собой примеры взаимодействия теоретических разработок и практических результатов. Дана общая концепция электронного лингвокультурологического словаря примет; обосновано его принципиальное отличие от существующих в данный момент интернет-ресурсов, содержащих аналогичную информацию; охарактеризованы базовые особенности и основные разновидности интернет-сайтов подобного типа. Введено понятие «конструктор словаря»; очерчен круг свойств и функциональных требований, актуальных для создаваемого электронного словаря; произведен обзор существующих программ, используемых для создания электронных словарей, и обоснована необходимость разработки собственно электронного приложения.

Ключевые слова: корпусная лингвистика; народная примета; лингвокультуро-логия; электронный словарь; конструктор; техническое задание.

еория и практика в процессе работы над словарем связаны

неразрывно - действительно, «история мирового языкознания полна свидетельств связи и взаимосвязи теоретических разработок и их лексикографического воплощения» [1. С. 6]. Лингвокульту-рология не является исключением из этого правила: лингвокульту-рологические и этнолингвистические словари, с одной стороны, являются плодом теоретических изысканий, обобщений и выводов; с другой - сам словарь может стать ценной базой данных, используемой для анализа и проведения новых исследований. В качестве примера такого словаря можно привести этнолингвистический словарь «Славянские древности» под ред. Н.И. Толстого [2]. Данный лексикографический объект создавался на протяжении длительного вре-

1 Исследование выполнено в рамках государственного задания на выполнение НИР «Изучение историко-культурного наследия России (сибирский аспект)» (код проекта 2059).

мени (1995-2009 гг.) и стал ценным источником информации для исследователей различных направлений - этнографов, этнолингви-стов, лингвокультурологов, лингвогеографов и многих других. Еще один пример - лингвокультурологический словарь «Русское культурное пространство» [3]: этот источник представляет особую ценность для исследователей, анализирующих зооморфные образы с лингвокультурологической и этнолингвистической точек зрения, поскольку содержит подробный лингвокультурный комментарий к лексемам, номинирующим представителей животного мира. Особого внимания заслуживает иллюстративный материал словаря: составители привлекают широкий круг фольклорных и авторских произведений, демонстрируя таким образом процесс реализации культурного кода, закрепленного за лексикографируемыми зоонимами. Неоспоримой практической и теоретической ценностью обладают и терминологические словари лингвокультурологического и этнолингвистического типов - в качестве примера можно привести «Этнолингвистический словарь свадебной терминологии Северного Прикамья» [4].

Отдельными учеными предлагается объединять словари лингво-культурологического и этнолингвистического типов одним понятием - «лингвокультурография». В толковании этого термина мы идем вслед за О.К. Ансимовой, говорящей о том, что «объектом лингво-культурографии являются языковые и неязыковые (например, мимика, жесты) единицы, содержащие культурную информацию, знание которой необходимо для успешной коммуникации в рамках определенного лингвокультурного сообщества; предметом - параметры описания данных единиц в соответствующих словарях, т. е. их лексикографическая интерпретация» [5].

Логичным выглядит предположение о том, что словари подобного типа диктуют более сложную по сравнению с другими типами словарей форму организации материала: связано это, прежде всего, с тем, что в поле зрения лексикографа наряду с собственно языковыми попадают неязыковые явления (обычаи, обряды, жесты, костюмы...), требующие особого подхода к возможности их представления в словарной статье.

Безусловно, более прихотливый и специфичный материал ставит перед лексикографом довольно сложную задачу: его нужно классифицировать, подать и проиллюстрировать наиболее приемлемым и

наглядным способом, что само по себе достаточно сложно. Вместе с тем именно специфика материала, отображаемого в словаре лингвокультурологического типа, соединившись с навигационными и техническими возможностями современной компьютерной лексикографии, способна дать впечатляющие результаты в виде не только удобно выстроенной навигации: использование медиаприложений (видео-, аудиозаписей, анимированных приложений) служит эффективным инструментом для иллюстрирования статей лингвокультурологического характера.

Компьютерная лексикография, ставшая особенно актуальной в последнее время, является важной составляющей прикладной лингвистики. Как справедливо отмечает Е.Ю. Чепик, «лингвистами и программистами сегодня обсуждаются такие вопросы, как структура и объем электронных словарей, принципы системной организации лексики, методы лингвистического программного обеспечения, параметры систематизации информационного материала. <...> Один из важных аспектов в научных дискуссиях - возможности использования компьютерных технологий при создании и применении словарей. Специальные программы (базы данных, программы обработки текста) позволяют формировать словарные статьи, хранить информацию и обрабатывать ее в автоматическом режиме» [6].

Анализ существующих словарей лингвокультурологического и этнолингвистического характера позволил сделать вывод о том, что, несмотря на активное развитие корпусной лингвистики и электронной лексикографии, происходящее в последние годы, в рамках отечественной лингвокультурографии пока не создано электронных словарей.

Авторами статьи была поставлена задача разработать электронный словарь именно лингвокультурологического типа: в качестве примера такового было принято решение создать электронный словарь народных примет, призванный в компьютерном формате объединить корпус народных примет и лингвокультурологический комментарий, сопровождающий собранный материал.

Практическая ценность заявленного лексикографического проекта заключается в том, что создание электронного словаря лингво-культурологического типа позволит выработать и апробировать ряд универсальных принципов лексикографической работы с материалом, обладающим лингвокультурологической ценностью, прежде

всего - в области репрезентации такого материала в формате компьютерного словаря. Актуальность и научная ценность исследования заключается в наполнении содержательной части словаря. Это связано с тем, что содержательное наполнение заявленного лексикографического продукта базируется на уникальном материале - корпусе народных примет, фиксируемых в процессе работы с разнообразными источниками, который обладает несомненной культурологической ценностью, он создавался в течение нескольких лет и пополняется до сих пор.

Авторы видят своей целью создание словаря, обладающего практической ценностью как для исследователей, в чье поле зрения попадают народные приметы в качестве материала или объекта изучения: паремиологов, паремиографов, фольклористов, лингвокуль-турологов, этнолингвистов, лингвогеографов, - так и для рядовых носителей языка, интересующихся народными приметами и суевериями. Таким образом, любой потенциальный читатель (пользователь) словаря сможет получить доступ одновременно к большому количеству примет (в настоящий момент корпус насчитывает около 1500 единиц), объединенных рамками одного электронного лексикографического продукта.

Разрабатываемый словарь подразумевает не только создание базы данных примет; согласно авторской концепции он призван объединить материал (сами приметы) и лингвокультурологический комментарий, его сопровождающий. Это является принципиально важной отличительной чертой создаваемого словаря.

Воплощение этого проекта в жизнь предполагает разработку общей концепции словаря, структуры (модели) словарной статьи и принципов организации представленного в словаре материала, а также разработку компьютерного приложения, посредством которого создаваемым словарем можно будет эффективно пользоваться как составителям словаря, так и читателям.

Сегодня в сети Интернет представлено большое количество ресурсов, содержащих списки народных примет в различных видах и вариациях [7]. Считаем справедливым замечание о том, что подавляющее большинство интернет-сайтов, содержащих материал народных примет, как правило, предлагает пользователю только списки примет; при этом довольно часто представленный материал репрезентирован по тематическому принципу [8], [9], [10]. Тематиче-

ский принцип организации материала реализуется в том, что приметы разбиты на разделы: «быт», «погода», «семья», «свадьба», «дети», «деньги» и др. Возможно выделение других рубрик или редуцирование некоторых из перечисленных - в зависимости от того, для каких целей предполагается использовать конкретный информационный ресурс. Так, например, достаточно большое количество интернет-ресурсов содержит только свадебные приметы [11], приметы, посвященные исключительно беременности и родам [12]; «бизнес-приметы» или «денежные» приметы [13]; существовать такой специализированный тематический каталог примет может как отдельно (в виде самостоятельного Интернет-сайта), так и будучи интегрированным в другой ресурс, выступая в качестве его органичной части, объединенной с ним основной темой [14].

Отдельную категорию представляют интернет-ресурсы, в рамках которых приметы представлены не в виде списков, организованных по тематическому принципу, а соотносятся с календарными датами: пользователь, таким образом, получает возможность ознакомиться со всеми суевериями, «закрепленными» за определенным днем календаря (например, за сегодняшним днем или за любой другой конкретной датой [15]): как правило, это погодные и календарные приметы. Наконец, особого внимания заслуживает разновидность интернет-ресурсов, отличительной чертой которых является наличие определенного рода комментария, сопровождающего представленный материал. В основном это попытки интерпретации примет, поиски рационального их объяснения [16]; однако нигде представленный материал не сопровождается лингвокультурологическим комментарием.

Можно указать ряд других недостатков, которыми обладают перечисленные интернет-источники народных примет. В первую очередь речь идет об отсутствии метаданных представленных примет: пользователь не может получить информацию о том, насколько старой или новой является примета, на какой географической территории она распространена - этот недостаток усугубляется тем, что большинство сайтов предоставляют разнородный материал, буквально «смешивая» (а иногда даже компилируя) приметы, бытующие у разных народов, а также приметы, которые могут быть оценены как традиционные и приметы современные, и никак это не обозначают. В создаваемом электронном словаре примет данный недос-

таток устраняется путем использования ссылок на источник (словари, энциклопедии, записи живой разговорной речи), из которого взята та или иная примета.

Концепция создаваемого словаря подразумевает особый способ организации материала, поскольку перед лексикографами стоит довольно сложная задача, заключающаяся в органичном и закономерном соединении лексикографируемых единиц - примет - и культурологического комментария, их сопровождающего.

Поскольку заявленный проект словаря подразумевает отличную от традиционной - бумажной - электронную форму существования, работа над его созданием ведется одновременно в двух направлениях. Первое направление включает в себя подготовительную работу (сбор материала); его классификацию, производимую по различным основаниям, и лингвокультурологический анализ содержащихся в словаре примет. Реализация поставленной задачи стала возможной благодаря созданному и апробированному Н.А. Агаповой и Т.Б. Банковой алгоритму выделения ключевого слова народной приметы [17]. Именно выработанный алгоритм - частично скорректированный и обновленный - решено было использовать при создании электронного словаря. Наконец, в качестве неотъемлемой задачи собственно лингвистического направления работы над словарем необходимо обозначить создание лингвокультурологического комментария, сопровождающего выделенные ключевые слова.

Неотъемлемой частью работы над заявленным лексикографическим объектом является техническое воплощение словаря. В нем представляется возможным выделить два этапа реализации: первый этап подразумевает создание конструктора словаря лингвокультуро-логического типа. Под «конструктором словаря» в рамках настоящей работы понимается компьютерная программа, с помощью которой создается электронный словарь. В процессе второго этапа работы с помощью написанного ранее конструктора создается сам словарь. В настоящий момент авторы работают над созданием рабочей версии электронного словаря.

Логичным выглядит предположение о том, что у словаря лин-гвокультурологического типа есть ряд спецификаций - признаков, свойств и особенностей, объединяющих все лексикографические объекты подобного рода. В частности, конструктор электронного словаря лингвокультурологического типа должен обладать следую-

щими свойствами и возможностями: наличие информации от составителя словаря (для рабочей версии: введение, содержащее информацию о принципах выделения ключевого слова, описание алгоритма его выделения); списка источников и использование элементов этого списка для цитирования в словарных статьях (для рабочей версии: цитирование источников в лингвокультурологических комментариях ключевых слов); определение ключевого объекта словаря (в лексикографической терминологии - объект лексикографирования: для рабочей версии в качестве такового выступает народная примета); создание иерархии объектов словаря (для рабочей версии: темы примет ^ приметы); создание гиперссылок (для рабочей версии: ключевые слова народных примет выделяются как гиперссылки); создание словарных статей (для рабочей версии: лингвокультуроло-гический комментарий ключевого слова приметы); автоматически создаваемая и настраиваемая навигация по элементам словаря; настраиваемый поиск по словарю (возможность поиска по одной и нескольким лексемам; поиск исключающего типа1; поиск по шаблону2). Представленный список свойств и навигационных возможностей создаваемого словаря является неполным, его корректировка и конкретизация будут произведены в процессе работы над приложением (на этапе конкретизации требований к компьютерному приложению). Именно на начальном этапе разработки приложения скорректированные и уточненные требования будут задокументированы программистом-разработчиком.

Таким образом, функционал конструктора словаря должен удовлетворять потребностям трех ролей. На первом месте, безусловно, стоит роль составителя - лингвиста, разрабатывающего общую концепцию словаря, собирающего и классифицирующего материал, ставящего цели для программиста (рис. 1). В качестве второй базовой выступает роль человека, создающего и настраивающего новый словарь при помощи конструктора - программиста: как выглядит создаваемый словарь для него, представлено на втором скриншоте

1 Поиск такого типа подразумевает возможность исключения из поиска определенного элемента (слова). Например, читателю нужно найти все приметы, в которых есть слово «кошка», но при этом среди них не должно быть примет, в которых одновременно с этим словом есть еще и «собака».

2 Так, например, поиск по шаблону жен * позволит найти все лексемы, начинающиеся с элемента «жен»: жена, жениться, женщина и т.д.

(рис. 2). Наконец, словарь должен удовлетворять потребностям читателя, пользующегося словарем как источником информации (рис. 3).

Рис. 1. Интерфейс составителя словаря: вид электронного словаря с точки зрения лингвиста, работающего со словарем и наполняющего его материалом: приметами, лин-гвокультурологическим комментарием, любой другой информацией, например данными

об источниках

Рис. 2. Интерфейс конструктора словаря: вид электронного словаря с точки зрения программиста, создающего и настраивающего новый словарь при помощи заявленной программы

Рис. 3. Интерфейс читателя словаря: вид электронного словаря с точки зрения читателя, пользующегося словарем как источником информации

Заявленный перечень свойств создаваемого словаря может быть реализован только при условиях оптимального выбора электронных средств создания. Авторами был произведен анализ существующих и используемых сейчас способов создания электронных словарей различных типов, который позволил сделать ряд выводов. Прежде всего, представляется справедливым утверждение о том, что среди способов создания электронных словарей не представлено готовых унифицированных решений. Иначе говоря, пока не существует универсальных программных продуктов, разработанных специально для создания электронных словарей. Практически все специализированные технические средства созданы для конкретных словарных продуктов (таких, например, как словари компании ЛББУУ [18] или «Оксфордский словарь английского языка» [19]) и не могут быть использованы другими лексикографами что, в свою очередь, иллюстрирует практическую ценность заявленного словарного проекта. Отдельные создатели электронных словарей используют уже существующие технические средства, изначально создававшиеся для других целей: по сути, они лишь адаптируются для решения задач электронной лексикографии. Средства подобного типа способны обеспе-

чивать минимальный необходимый функционал электронного словаря, прежде всего расширяемость (возможность пополнять существующую базу данных) и поиск; в качестве примеров таких средств можно назвать редакторы пакетов MS Office и Open Office, шаблоны на основе wiki-технологий). Безусловно, являясь инструментами, изначально создаваемыми для других целей, эти решения априори не могут обеспечивать полный функционал, необходимый по техническому заданию анонсируемого словаря, а их доработка является достаточно трудоемкой. Именно по этой причине авторами создаваемого словаря было принято решение разработать приложение, предназначенное для конструирования электронного лексикографического объекта и оптимальным образом подходящее для того, чтобы в дальнейшем использовать его для создания словарей похожих типов.

На осуществляемом этапе работы авторам предстоит произвести анализ уже созданных электронных словарей различных типов. Это позволит получить необходимую информацию об используемых в рамках работы над другими электронными словарями технических средствах и возможностях осуществить выбор собственных средств разработки (язык программирования, среда разработки, система управления базами данных) согласно заявленным требованиям. В процессе проводимого анализа авторам предстоит решить следующие вопросы: на каких платформах должно работать приложение? Предполагается ли создание on-line-версии словаря, в том числе как единственной?

Разработку конструктора словаря планируется вести по модели унифицированного процесса разработки, подробно описанной А. Якобсоном, Г. Бучем и Дж. Рамбо. Такой процесс характеризуется многими составляющими (более подробно они будут охарактеризованы в дальнейших работах авторов), однако в качестве наиболее актуальной для процесса создания заявленного словаря (как и любого междисциплинарного исследовательского продукта) можно отметить следующую: «Унифицированный процесс разработки программного обеспечения может использоваться любым человеком, вовлеченным в процесс разработки...» [20. С. 19], что позволит максимально эффективно реализовать потенциал всех участников проекта, включенных в работу над технической составляющей словаря.

Литература

1. Блинова О.И. Теория ^ словарь ^ теория ^ словарь... // Вопр. лексикографии. - 2012. - № 1. - С. 6-26.

2. Славянские древности: этнолингвистический словарь: в 5 т. / под общ. ред. Н.И. Толстого. - М.: Междунар. отношения, 1995. - 2009.

3. Русское культурное пространство: Лингвокультурологический словарь: Вып. 1 / И.С. Брилева [и др.]. - М.: Гнозис, 2004. - 318 с.

4. Подюков И.А., Хоробрых С.В., Антипов Д.А. Этнолингвистический словарь свадебной терминологии Северного Прикамья. - Усолье; Соликамск; Березники; Пермь: Перм. кн. изд-во, 2004. - 360 с.; ил.

5. Ансимова О.К. Лингвокультурография как отдельная филиация общей лексикографии [Электронный ресурс]. - URL: http://sociosphera.com/publication/conference/ 2012/119/lingvokulturografiya_kak_otdelnaya_filiaciya_obwej_leksikografii/

6. Чепик Е.Ю. Опыт создания электронного словаря политической лексики [Электронный ресурс]. - URL: http://el.crimea.edu/arcthesis.html

7. Народные приметы - Google [Электронный ресурс] URL: https:// www. google.ru/search?q=%D0%9D%D0%B0%D1%80%D0%BE%D0%B4%D0%BD%D1%8 B%D0%B5+%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%82%D1%8B

8. Народные приметы [Электронный ресурс]. - URL: http://primetka.ru/

9. Народные приметы.ру: Народные приметы и суеверия, поверия [Электронный ресурс]. - URL: http://narodnye-primety.ru/primeti/

10. Народные приметы [Электронный ресурс]. - URL: http://www. ekstrasensy. su/narodnyie-primetyi

11. Свадебные приметы [Электронный ресурс]. - URL: http://tili-testo.com/vse-o-svadbe/8-svadebnie-primeti.htm

12. Страна детства [Электронный ресурс]. - URL: http://stranadetstva.ru/ beremennost-i-primety

13. Миллион долларов [Электронный ресурс]. - URL: http://mlndollarov.ru/ denezhnye-primety

14. БудуМамой.ру [Электронный ресурс] URL: http://www.budumamoi.ru/

15. Народный календарь народных примет [Электронный ресурс] URL: [Электронный ресурс]. - URL: http:// astroscope.ru/map/Php/Primeti/

16. Суеверия и приметы [Электронный ресурс]. - URL: http://sueveriya.ru/

17. Агапова Н.А. Лингвокультурологический потенциал ключевого слова народной приметы: дис. ... канд. филол. наук. - Томск, 2013. - 184 с.

18. Ассоциация лексикографов Lingvo [Электронный ресурс]. - URL: http://www. lingvoda.ru/dictionaries/create.asp#p2

19. Оксфордский словарь английского языка [Электронный ресурс]. - URL: http://www. oxforddictionaries.com/

20. Якобсон А., Буч Г., Рамбо Дж. Унифицированный процесс разработки программного обеспечения. - СПб.: Питер, 2002. - 496 с.: ил.

28

Н.А. Агапоeа, Н. 0. Kapmo^ernea

THE ELECTRONIC DICTIONARY OF A LINGUOCULTUROLOGICAL TYPE PROJECT: GENERAL CONCEPTION AND THE SPECIFICS OF TECHNICAL REALIZATION.

Journal of Lexicography, 2014, 2 (6), pp. 17-30.

Agapova Nina A., Kartofeleva Natalia F., Tomsk State University (Tomsk, Russian Federation). E-mail: [email protected] / [email protected] Keywords: computational lexicography, corpus linguistics, linguoculturography, national sign, linguoculturological commentary; dictionary project; Internet-resource; dictionary builder; terms of reference; test domain; Unified Software Development Process.

During the work over a dictionary theory and practice are inseparably connected; lin-guoculturology is no exception. Linguoculturological and ethnolinguistic dictionaries are the product of theoretical research, summarizing and concluding on the one hand, and a dictionary itself can become a valuable database for analysis and new researches on the other. Dictionaries of such a type require a more complicated way of data organization: this is due to the fact that in the sight of a lexicographer there are extralinguistic phenomena (customs, rites, gestures, suits...) along with linguistic ones, they require a particular approach to the possibility of their representation within a dictionary entry limits. However, the real specifics of the material representing in a dictionary of a linguoculturological type, united with navigational and technical possibilities of the modern computational lexicography, can produce some impressive results.

The analysis of current linguoculturological and ethnolinguistic dictionaries allows to come to a conclusion that despite active growth of corpus linguistics and computational lexicography in recent years domestic science has not created any electronic dictionaries. The authors of this paper aim at solving the task of development of an electronic dictionary of the linguoculturological type; as an illustration of such a dictionary it was decided to develop and implement an electronic dictionary of national signs. The realization of this project proposes the elaboration of the general concept of the dictionary, the structure (model) of a dictionary entry, the principles of organisation of the material presented in the dictionary and the development of software which is supposed to ensure the most convenient dictionary usage.

The dictionary to be created must be the utility for the researchers who work with national signs as well as for common language speakers who are interested in national signs and superstitions. Thus, any potential reader (user) of the dictionary interested in national signs and superstitions can get access to a large amount of national signs (about 1500 units at the moment) united into one electronic lexicographical material.

At the same time, the project does not include the national signs corpus creation only; according to the authors' concept, it serves to join the material (national signs) with its lin-guoculturological commentary. This, in its turn, is the essential distinguishing feature of the dictionary.

The work on the dictionary creation goes in two directions simultaneously. The first direction includes the preparatory work (the material collection), its classification according to different arguments, and the linguoculturological analysis of the national signs. The second direction applies to the technical realization of the dictionary. In the context of this direction, in its turn, it is possible to define two steps of realization: the first step implies the creation of a builder for making dictionaries of a linguoculturological type; the second step implies the creation of a linguoculturological dictionary of national signs using

the dictionary builder. In this case the electronic dictionary of national signs serves as the test domain for the builder project.

The authors of this paper found out that there are no unified software products among the ways of electronic dictionary creation; in other words, there are no universal software programmes for making electronic dictionaries; almost all relevant software is developed for particular proprietary dictionaries and cannot be used by other lexicographers - this illustrates the topicality and utility value of the announced dictionary project.

References

1. Blinova O.I. Theory ^ Dictionary ^ Theory ^ Dictionary. Voprosy leksikografii - Journal of Lexicography, 2012, no. 1, pp. 6-26.

2. Tolstoy N.I. (ed.) Slavyanskie drevnosti: Etnolingvisticheskiy slovar' v 5 tomakh [Slavic Antiquities: Ethnolinguistic Dictionary in 5 volumes]. Moscow: Mezhdunarodnye otnosheniya Publ., 1995 - 2009.

3. Brileva I.S. et al. Russkoe kul'turnoe prostranstvo: Lingvokul'turologicheskiy slovar' [Russian Cultural Space: a Linguoculturological Dictionary]. Moscow: Gnozis Publ., 2004. Issue 1, 318 p.

4. Podyukov I.A., Khorobrykh S.V., Antipov D.A. Etnolingvisticheskiy slovar' svadebnoy terminologii Severnogo Prikam'ya [Ethnolinguistic Wedding Terminology Dictionary of Northern Kama region]. Usolye, Solikamsk, Berezniki, Perm: Permskoe knizhnoe izdatel'stvo Publ., 2004. 360 p.

5. Ansimova O.K. Lingvokul'turografiya kak otdel'naya filiatsiya obshchey leksikografii [Linguoculturography as a filiation of general lexicography]. Available at: http://sociosphera.com/publication/conference/2012/119/lingvokulturografiya_kak_otdelna ya_filiaciya_obwej_leksikografii/.

6. Chepik E.Yu. Opyt sozdaniya elektronnogo slovarya politicheskoy leksiki [Experience of creating an electronic dictionary of political lexicon]. Available at: http://el.crimea.edu/arcthesis.html.

7. Narodnye primety - Google [Folk signs - Google]. Available at: https:// www.google.ru/search?q=%D0%9D%D0%B0%D1%80%D0%BE%D0%B4%D0%BD%D 1%8B%D0%B5+%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%82%D1%8B.

8. Narodnye primety [Folk signs]. Available at: http://primetka.ru/.

9. Narodnye primety.ru: Narodnye primety i sueveriya, poveriya [Narodnye-primety.ru: Folk signs and superstitions, beliefs]. Available at: http://narodnye-primety.ru/ primeti/.

10. Narodnye primety [Folk signs]. Available at: http://www. ekstrasensy. su/ narodnyie-primetyi.

11. Svadebnye primety [Wedding signs]. Available at: http://tili-testo.com/vse-o-svadbe/8-svadebnie-primeti.htm.

12. Strana detstva [The country of childhood]. Available at: http://stranadetstva. ru/ beremennost-i-primety.

13. Million dollarov [A million dollars]. Available at: http://mlndollarov.ru/ denezhnye-primety.

14. BuduMamoy.ru [budumamoi.ru]. Available at: http://www.budumamoi.ru/

15. Narodnyy kalendar' narodnykhprimet [Folk calendar of folk signs]. Available at: [Elektronnyy resurs]. Available at: http://astroscope.ru/map.php/Primeti/.

16. Sueveriya iprimety [Superstitions and signs]. Available at: http://sueveriya.ru/.

17. Agapova N.A. Lingvokul'turologicheskiy potentsial klyuchevogo slova narodnoy primety: dis. kand. filol. nauk [Linguoculturological potential of the keyword in a folk sign. Philology Cand. Diss.]. Tomsk, 2013. 184 p.

18. Assotsiatsiya leksikografov Lingvo [Lingvo Lexicographers Association]. Available at: http://www.lingvoda.ru/dictionaries/create.asptfp2.

19. The Oxford English Dictionary. Available at: http://www.oxforddictionaries.com/.

20. Jacobson I., Booch G., Rumbaugh J. Unifitsirovannyy protsess razrabotki programmnogo obespecheniya [The unified software development process]. Translated from English. St. Petersburg: Piter Publ., 2002. 496 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.