Научная статья на тему 'Словарь констант народной речи: выбор платформы представления'

Словарь констант народной речи: выбор платформы представления Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
142
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛОВАРНАЯ СТАТЬЯ / ВЫБОР ПРОГРАММНОЙ ПЛАТФОРМЫ / МЕТОД АНАЛИЗА ИЕРАРХИЙ / DICTIONARY ENTRY / CHOICE OF SOFTWARE PLATFORM / ANALYTIC HIERARCHY PROCESS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Лавров Д. Н., Харламова М. А.

Представлена структура словарной статьи нового диалектного словаря активного типа и обоснован выбор программной платформы. В результате проведенного исследования оказалось, что наиболее адекватной платформой для реализации электронного словаря является платформа Mediawiki.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Dictionary of popular speech constants: choice of software platform

The structure of the entry of a new dialect dictionary of active type and justified the choice of software platform was presented. As a result of the study it was found that the most appropriate platform for the implementation of electronic dictionary is Mediawiki.

Текст научной работы на тему «Словарь констант народной речи: выбор платформы представления»

ФИЛОЛОГИЯ

Вестн. Ом. ун-та. 2015. № 1. С. 213-215.

УДК 801.81:81-2+004.5 Д.Н. Лавров, М.А. Харламова

СЛОВАРЬ КОНСТАНТ НАРОДНОЙ РЕЧИ:

ВЫБОР ПЛАТФОРМЫ ПРЕДСТАВЛЕНИЯ

Представлена структура словарной статьи нового диалектного словаря активного типа и обоснован выбор программной платформы. В результате проведенного исследования оказалось, что наиболее адекватной платформой для реализации электронного словаря является платформа Mediawiki.

Ключевые слова: словарная статья, выбор программной платформы, метод анализа иерархий.

«Лексикографический бум» - одна из примет нашего времени. Работа над диалектными словарями, проводимая различными региональными центрами, находится в русле современных лексикографических исследований. Словари народной речи представляют интерес для специалистов разных направлений, поскольку репрезентируют результаты познания мира рядовыми носителями языка во всём многообразии.

Коллектив диалектологов ОмГУ им. Ф.М. Достоевского в рамках проекта Российского гуманитарного научного фонда (2012-2014 гг.) предпринял попытку разработать словарь активного типа, манифестирующий картину мира современных сельских жителей полиэтнического региона Среднего Прииртышья. Теоретические принципы словаря, проблемы и трудности, вызванные как собственно лингвистическими, так и экстралингвистическими факторами, структура словаря проанализированы в монографии [1]. Для реализации основной установки словаря - нацеленности на реконструкцию национально специфической картины мира - и в результате семантико-когнитивного исследования языковой ситуации в Омском Прииртышье коллектив диалектологов предложил полевую структуру словарной статьи. Во главе словарной статьи стоят слова, репрезентирующие культурно значимое константы: Дом, Жизнь, Отец, Семья и т. п. У каждого такого слова определены основные значения, их, как правило, не более четырёх (если возможно в диалектной речи больше, то обязательно репрезентировано в словаре). В электронной версии предусмотрены поля (или зоны): (А) - синонимы, (Б) - диалектные варианты, (В) -дериваты. У слов, перечисленных в этих полях и употребляющихся в переносном значении, делаем помету (*) и помещаем их в зону (Г) - переносные значения - с указанием новой семантики. В иллюстративном поле (Е) в соответствии с названными зонами размещаем контексты, маркируя зону и актуализируемую семантику соответствующей лексемы. Отдельно в поле (Д) вынесены устойчивые сочетания, фразеологизмы и сочетаемость (Ж), часто объективирующие образ и символ как составные части концепта (В.В. Колесов), что важно при реконструкции фрагментов народной концептосферы. Представляется значимым выделить в особую зону прецедентные высказывания (З), проясняющие особенности народного мировосприятия. Специфика народной «речемысли» (А.А. Потебня) Среднего Прииртышья отражается в зоне (И), где даётся лингвокультурологический комментарий репрезентантов базовых констант. Так, словарная статья о растениях наполнена большим количеством синонимов и диалектных вариантов тех или иных номинаций. Различия их в сфере употребления и распространения, помещенные в поле (И), позволят осмыслить сложные процессы номинации, определить синонимические и словообразовательные связи лексем-репрезентантов, что в конечном счё-

© Д.Н. Лавров, М.А. Харламова, 2015

214

Д.Н. Лавров, М.А. Харламова

те ведёт к адекватному представлению семантики означенных единиц и идентификации наименований растений в картине мира современного сельского жителя. Кроме того, для растений активно поле по-латински, позволяющее многообразие народных номинаций растений в результате идентификации по возможности свести к одному наименованию. Грамматические и стилистические характеристики появляются по мере актуальности рядом с единицами описания, они могут быть в зонах (А), (Б), (В), (Г). Составите-лям-лингвистам хотелось для этой объёмной структуры словарной статьи получить удобную и легкодоступную электронную форму, которая бы удовлетворяла ряду требований.

Выбор программной платформы для создания словаря является задачей с неструктурированными требованиями. Процесс принятия решения осложняется разным видением проблемы группой разработчиков и группой пользователей (прежде всего лингвистов). В таких случаях для принятия решения традиционно используют метод анализа иерархий (МАИ) [2; 3]. МАИ позволяет посредством согласования мнений о значимости показателей-требований (критериев по терминологии МАИ) и доли их важности по отношению к нескольким альтернативам (возможно более двух альтернатив) обосновать выбор.

Для принятия решения построим трехуровневую иерархию (см. рис.).

Цель (С 1) - построить удобную для использования, поддержки и расширения информационную систему (ИС) для электронного словаря народной речи Среднего Прииртышья.

Выбор критериев осуществлялся группой экспертов проекта, выбранных из группы разработчиков и группы пользователей альтернативных систем.

K1. Легкость переноса текста с форматированием из текстовых процессоров в ИС. Требование выдвинуто группой пользователей. Позволяет из уже подготовленных документов со словарными статьями легко переносить данные в электронный словарь.

K2. Использование фонетических знаков. Требование группы пользователей необходимо для отображения особенностей говоров.

K3. Работа с иллюстрациями. Это требование позволяет сопровождать словарные статьи иллюстративными материалами в особой форме - фонетической орфографии.

K4. Отделение модели от представления. Требование выдвинуто группой разработчиков. Необходимо для упрощения поддержки и расширения ИС.

K5. Легкость поддержки. Требование разработчиков. Позволяет легко исправлять ошибки и осуществлять реализацию новых требований.

K6. Простой поиск. Подразумевает наличие его в системе или простоту реализации поиска по названию словарной статьи.

K7. Расширенный поиск. Подразумевает наличие его в системе или простоту реализации поиска по всем полям статьи.

K8. Легкость освоения системы. Сложность освоения отпугивает пользователей, следовательно, необходимо обеспечить приложение минимальных усилий при освоении системы.

Выбор альтернатив. В качестве альтернатив были выбраны три решения:

A1. PHP + MongoDB + детализированная объектная модель.

A2. Mediawiki + MySQL.

A3. Ruby on Rails + MongoDB + упрощённая объектная модель.

Первая альтернатива (A1) представляет собой веб-приложение, написанное на языке PHP. В качестве хранилища данных использовалась документно-ориентированная система управления базами данных MongoDB. Была разработана подробная объектная модель структуры базы данных.

Вторая альтернатива (A2) - использование платформы Mediawiki, которая широко применяется для создания справочников и словарей, в частности, на этой программной платформе работает Википедия. Страницы словаря создаются на wiki-языке и хранятся в базе данных MySQL.

Третья альтернатива (A3) - приложение, созданное на Ruby-on-Rails на основе MongoDB, но с сильно упрощённой объектной моделью, что должно было добавить дополнительной гибкости веб-приложению.

Для определения значимости критериев по отношению к цели составлена матрица парных сравнений:

С1 К1 К2 КЗ К4 К5 К6 К7 К8

К1 1,0 4,0 9,0 5,0 1,0 1,0 7,0 1,0

К2 0,3 1,0 6,0 2,0 4,0 3,0 2,0 1,0

КЗ 0,1 0,2 1,0 2,0 1,0 0,3 1,0 0,3

К4 0,2 0,5 0,5 1,0 0,3 0,3 1,0 0,1

К5 1,0 0,3 1,0 4,0 1,0 0,3 1,0 1,0

К6 1,0 0,3 3,0 3,0 3,0 1,0 0,5 1,0

К7 0,1 0,5 1,0 1,0 1,0 2,0 1,0 0,3

К8 1,0 1,0 3,0 7,0 1,0 1,0 3,0 1,0

Словарь констант народной речи: выбор платформы представления

215

Степенным методом вычислен собственный вектор в 21-норме, представляющий значимость критериев: 0,27; 0,18; 0,05; 0,04; 0,10; 0,13; 0,07; 0,16. Компоненты вектора округлены до сотых. Индекс согласованности равен 0,195. По данному индексу проведён расчёт общей согласованности суждений экспертов о значимости критериев: 0,138. Данное значение немного выше рекомендованного в [2] порога 0,1. Тем не менее принято решение не улучшать согласованность суждений.

Доля вклада критериев в альтернативы определяется по восьми матрицам парных сравнений альтернатив по отношению к критерию:

К1 A1 A2 A3

A1 1 0,2 1

A2 5 1 5

A3 1 0,2 1

К2 A1 A2 A3

A1 1 0,2 1

A2 5 1 3

A3 1 0,3 1

К3 A1 A2 A3

A1 1 0,14 0,5

A2 7 1 3

A3 2 0,3 1

К4 A1 A2 A3

A1 1 3 0,5

A2 0,3 1 0,5

A3 2 2 1

К5 A1 A2 A3

A1 1 2 0,5

A2 0,5 1 0,3

A3 2 3 1

К6 A1 A2 A3

A1 1 1 3

A2 1 1 3

A3 0,33 0,33 1

К7 A1 A2 A3

A1 1 2 1

A2 0,5 1 0,5

A3 1 2 1

К8 A1 A2 A3

A1 1 0,3 1

A2 3 1 3

A3 1 0,3 1

Для каждой матрицы в 21-норме степенным методом вычисляются собственные векторы, которые и дают доли присутствие критерия (требования) в альтернативе:

A1 A2 A3

(0,14; 0,71; 0,14) K1 (0,16; 0,66; 0,19) K2 (0,10; 0,68; 0,22) K3 (0,35; 0,17; 0,49) K4 (0,30; 0,16; 0,54) K5 (0,43; 0,43; 0,14) K6 (0,40; 0,20; 0,40) K7 (0,20; 0,60; 0,20) K8

Все индексы общей согласованности не превышают рекомендованного автором метода анализа иерархий порога в 0,1.

Последний этап метода анализа иерархий - синтез. На этом этапе осуществляется суммирование долей критериев (требований), умноженных на значимости критериев для каждой альтернативы. Таким образом, вычисляется удельный вес каждой альтернативы:

A1 = 0,23; A2 = 0,53; A3 = 0,23.

Вывод. Наиболее подходящей платформой для реализации электронного словаря является альтернатива A2 - Mediawiki.

Система Mediawiki развёрнута на сервере Apache под управлением операционной системы Linux. Было выполнено конфигурирование платформы под требования электронного словаря. Проведено обучение пользователей по автоматизации конвертации текстов, набранных в текстовых редакторах типа Word, в язык wiki-разметки. На вебсайте размещены словарные статьи.

Таким образом, создана рабочая версия словаря, которая позволяет составителям-диалектологам в постоянном режиме совершенствовать словарные статьи (вносить исправления, уточнения, дополнять новыми материалами) и разрабатывать и составлять новые словарные статьи. С рабочей версией словаря можно ознакомиться по адресу: http://dict.univer.omsk.su.

ЛИТЕРАТУРА

[1] Харламова М. А. Константы народной речемысли и их лексикографическая интерпретация : монография / [науч. ред. Н. В. Орлова]. Омск : Изд-во Ом. гос. ун-та, 2014. 290 с.

[2] Саати Т., Кернс К. Аналитическое планирование. Организация систем. М. : Радио и связь, 1991. 224 с.

[3] Саати Т. Принятие решений. Метод анализа иерархий. М. : Радио и связь, 1993. 278 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.