Научная статья на тему 'ПРОБЛЕМЫ ФОРМАЛИЗАЦИИ СТРУКТУРЫ СЛОВАРНОЙ СТАТЬИ «СЛОВАРЯ РУССКОГО ЯЗЫКА XVIII ВЕКА» ПРИ ПОДГОТОВКЕ ЭЛЕКТРОННОГО ИЗДАНИЯ'

ПРОБЛЕМЫ ФОРМАЛИЗАЦИИ СТРУКТУРЫ СЛОВАРНОЙ СТАТЬИ «СЛОВАРЯ РУССКОГО ЯЗЫКА XVIII ВЕКА» ПРИ ПОДГОТОВКЕ ЭЛЕКТРОННОГО ИЗДАНИЯ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
14
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Terra Linguistica
ВАК
Ключевые слова
электронная лексикография / нормальная модель данных / база данных / формализация / Словарь русского языка XVIII века / electronic lexicography / normal data model / database / formalization / Dictionary of the Russian language of the 18th century

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Егоров Игорь Михайлович, Мольков Георгий Анатольевич

В статье рассмотрены результаты ручной обработки и классификации структурных элементов «Словаря русского языка XVIII века» на материале выпущенных на сегодняшний день 22 выпусков. Цель этой работы – адаптация к нормальной структуре данных всего разнообразия приемов и особенностей оформления статей данного словаря и в дальнейшем – подготовка электронной версии словаря, основанной на базе данных. Основной сложностью, выявленной в ходе анализа структурных особенностей словаря, стал вопрос о допустимой степени отклонений от бумажного канона при адаптации к электронному формату данных. При классификации было выделено два типа структур – типовые и единичные. Предлагается их формализация с помощью трехуровневой системы компонентов: базовых, подчиненных базовому и простых элементов двух типов – сложной типовой структуры (блоки компонентов) и первичных. Типовые структуры передаются при такой системе полностью, а относительно единичных принимается дополнительное решение. Сохраняются особенности бумажной версии словаря, которые не влияют на структуру данных – в тех случаях, когда определенный элемент меняет (сужает или расширяет) сферу применения в пределах одного блока компонентов. Если же нетипичное (редкое) использование элемента выходит за пределы блока, в структуру базы данных необходимо добавлять новый компонент, который в перспективе не будет востребован. В такой ситуации невостребованный элемент словарных статей предполагается устранять из оригинального текста и приводить его в соответствие с общим для словаря метаязыковым узусом.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROBLEMS OF ARTICLE STRUCTURE FORMALIZATION OF THE “DICTIONARY OF THE RUSSIAN LANGUAGE OF THE 18TH CENTURY” PRIOR TO ELECTRONIC EDITION

This article discusses the results of manual processing and classification of the structural elements of the “Dictionary of the Russian language of the 18th century” obtained from its 22 issues published so far. The purpose of this work is to accommodate the manifold repertory of metalinguistic techniques and design features characteristic of the aforementioned dictionary to a unified data structure frame, which could significantly facilitate the preparation of its database-driven digital version. The core difficulty of the task discovered during our analysis of the dictionary structure is the fact that there is no obvious way to determine the limit of deviations from the printed version acceptable for the digital edition. In our taxonomy we distinguish two types of structures, namely generic and unique ones. They can be formally represented by a three-level system of components: (1) the basic ones, (2) those subordinate to the basic ones, and (3) simple items of two types: (3.1) primary elements or (3.2) complex typical structures (component blocks). In this system, the generic structures are preserved entirely and without exception, whereas the unique ones can be included or left out by an additional decision. The particular features of the paper version which do not affect the data structure are preserved in cases where the scope of a certain element is narrowed or expanded within one component block. In fact, if any atypical or rare use of an element exceeded the boundaries of a block and it were nevertheless decided to preserve this element, it would be necessary to expand the data structure with a new component useless outside this idiosyncratic case. In such situations, we propose to eliminate the unclaimed elements of dictionary entries from the original text in order to adjust it to the standard metalanguage of the dictionary.

Текст научной работы на тему «ПРОБЛЕМЫ ФОРМАЛИЗАЦИИ СТРУКТУРЫ СЛОВАРНОЙ СТАТЬИ «СЛОВАРЯ РУССКОГО ЯЗЫКА XVIII ВЕКА» ПРИ ПОДГОТОВКЕ ЭЛЕКТРОННОГО ИЗДАНИЯ»

Terra Lingüistica. 2023, Том 14, № 3. С. 19-27. Terra Lingüistica. 2023, Vol. 14, No. 3. Pp. 19-27.

Научная статья

УДК 81'33 I-

DOI: https://doi.org/10.18721/JHSS.14302

ПРОБЛЕМЫ ФОРМАЛИЗАЦИИ СТРУКТУРЫ СЛОВАРНОЙ СТАТЬИ «СЛОВАРЯ РУССКОГО ЯЗЫКА XVIII ВЕКА» ПРИ ПОДГОТОВКЕ ЭЛЕКТРОННОГО ИЗДАНИЯ

Аннотация. В статье рассмотрены результаты ручной обработки и классификации структурных элементов «Словаря русского языка XVIII века» на материале выпущенных на сегодняшний день 22 выпусков. Цель этой работы — адаптация к нормальной структуре данных всего разнообразия приемов и особенностей оформления статей данного словаря и в дальнейшем — подготовка электронной версии словаря, основанной на базе данных. Основной сложностью, выявленной в ходе анализа структурных особенностей словаря, стал вопрос о допустимой степени отклонений от бумажного канона при адаптации к электронному формату данных. При классификации было выделено два типа структур — типовые и единичные. Предлагается их формализация с помощью трехуровневой системы компонентов: базовых, подчиненных базовому и простых элементов двух типов — сложной типовой структуры (блоки компонентов) и первичных. Типовые структуры передаются при такой системе полностью, а относительно единичных принимается дополнительное решение. Сохраняются особенности бумажной версии словаря, которые не влияют на структуру данных — в тех случаях, когда определенный элемент меняет (сужает или расширяет) сферу применения в пределах одного блока компонентов. Если же нетипичное (редкое) использование элемента выходит за пределы блока, в структуру базы данных необходимо добавлять новый компонент, который в перспективе не будет востребован. В такой ситуации невостребованный элемент словарных статей предполагается устранять из оригинального текста и приводить его в соответствие с общим для словаря метаязыковым узусом.

Ключевые слова: электронная лексикография, нормальная модель данных, база данных, формализация, Словарь русского языка XVIII века.

Для цитирования: Егоров И.М., Мольков Г. А. Проблемы формализации структуры словарной статьи «Словаря русского языка XVIII века» при подготовке электронного издания // Terra Lingüistica. 2023. Т. 14. № 3. С. 19-27. DOI: 10.18721/JHSS.14302

И.М. Егоров, Г.А. Мольков н

Институт лингвистических исследований РАН, Санкт-Петербург, Российская Федерация

н georgiymolkov@gmail.com

© Егоров И.М., Мольков Г.А., 2023. Издатель: Санкт-Петербургский политехнический университет Петра Великого

*-

Research article

DOI: https://doi.org/10.18721/JHSS.14302

PROBLEMS OF ARTICLE STRUCTURE FORMALIZATION OF THE "DICTIONARY OF THE RUSSIAN LANGUAGE OF THE 18th CENTURY" PRIOR TO ELECTRONIC EDITION

I.M. Egorov, G.A. Molkov H

The Institute for Linguistic Studies of the Russian Academy of Sciences,

St. Petersburg, Russian Federation

H georgiymolkov@gmail.com

Abstract. This article discusses the results of manual processing and classification of the structural elements of the "Dictionary of the Russian language of the 18th century" obtained from its 22 issues published so far. The purpose of this work is to accommodate the manifold repertory of metalinguistic techniques and design features characteristic of the aforementioned dictionary to a unified data structure frame, which could significantly facilitate the preparation of its database-driven digital version. The core difficulty of the task discovered during our analysis of the dictionary structure is the fact that there is no obvious way to determine the limit of deviations from the printed version acceptable for the digital edition. In our taxonomy we distinguish two types of structures, namely generic and unique ones. They can be formally represented by a three-level system of components: (1) the basic ones, (2) those subordinate to the basic ones, and (3) simple items of two types: (3.1) primary elements or (3.2) complex typical structures (component blocks). In this system, the generic structures are preserved entirely and without exception, whereas the unique ones can be included or left out by an additional decision. The particular features of the paper version which do not affect the data structure are preserved in cases where the scope of a certain element is narrowed or expanded within one component block. In fact, if any atypical or rare use of an element exceeded the boundaries of a block and it were nevertheless decided to preserve this element, it would be necessary to expand the data structure with a new component useless outside this idiosyncratic case. In such situations, we propose to eliminate the unclaimed elements of dictionary entries from the original text in order to adjust it to the standard metalanguage of the dictionary.

Keywords: electronic lexicography, normal data model, database, formalization, Dictionary of the Russian language of the 18 th century.

Citation: Egorov I.M., Molkov G.A., Problems of article structure formalization of the "Dictionary of the Russian language of the 18th century" prior to electronic edition, Terra Linguistica, 14 (3) (2023) 19—27. DOI: 10.18721/JHSS.14302

Постановка проблемы

Создание современной электронной версии изначально печатного словарного издания требует тщательного анализа всех особенностей принятой в издании структуры словарной статьи, что является необходимым условием при проектировании нормальной модели данных, редакторского интерфейса, а также — интерфейса конечного пользователя. С точки зрения анализа данных интерес представляют: структурные элементы словарной статьи и их отношения; инструментарий лексикографического метаописания. В части представления данных для конечного пользователя должен быть решен вопрос о допустимой степени отклонений от бумажного канона в целях большего удобства (вариативности, компактности) использования.

Однако применительно к многотомному словарному изданию, выходящему в течение длительного периода, анализ структуры сопряжен со специфическими сложностями, вызванными недостаточной стандартизацией в описании материала. Не во всех случаях лексикографам на протяжении всего периода выпуска словаря удается последовательно применять сложный лексикографический инструментарий — описывать однотипные лексические особенности по единой

© I.M. Egorov, G.A. Molkov, 2023. Published by Peter the Great St. Petersburg Polytechnic University

4-*

схеме и с одинаковой степенью подробности. Причина этого (помимо человеческого фактора) может заключаться в недостаточной регламентации в проекте словаря представления отдельных языковых особенностей (в частности, в инструкции могут упоминаться факультативные элементы описания) или в избыточности заявленного инструментария, при которой несколько способов оформления считаются допустимыми. При участии в подготовке крупного словаря большого коллектива авторов слабые места словарного проекта оставляют отдельным авторам-составителям свободу выбора инструмента описания, что создает разнобой в оформлении.

Для русской исторической лексикографии, представленной целой серией масштабных по замыслу словарей, обычной является ситуация, когда за время публикации словарного издания пересматриваются и видоизменяются частные особенности оформления словарных статей. Такие видоизменения могут быть регламентированы в том или ином формате — в новой редакции словарной инструкции, в предисловии к очередному тому словаря, в форме научной статьи одного из авторов-составителей словаря; но они также могут накапливаться кумулятивно в ходе практической реализации изначального замысла и передаваться в устной форме в коллективе словаря.

Причины таких естественных изменений в структуре словаря в интересующей нас отрасли лексикографии связаны со сложностью исторического языкового материала и постепенным его расширением в процессе выхода словаря. Все существующие исторические словари полного типа (описывающие всю лексику определенного периода) при наличии стартовой картотеки продолжали ее пополнять параллельно с выходом томов, и по этой причине первые несколько томов готовились с учетом меньшего количества источников, чем последующие. Ни один из исторических многотомников на сегодняшний день не завершен, т.е. описанный процесс увеличения материала продолжается и за последнее десятилетие с широким распространением электронных копий исторических текстов только усугубился.

Наряду с этой общей причиной корректировки изначальной концепции словаря могут быть и индивидуальные особенности издания. Словари, начавшие выходить в советский период (Словарь русского языка XI—XVII вв., Словарь русского языка XVIII века, Словарь древнерусского языка (Х1—Х1У вв.) [1—3]), на начальном этапе затруднялись в выборе общей концепции в связи с неоднократным пересмотром решений об их объеме перед началом публикации [4, с. 110; 5, с. 14; 6, с. 166]. Первый по дате начала выхода Словарь русского языка Х1—ХУ11 вв. был вынужден пересмотреть ряд ключевых особенностей (отбор источников, подача материала переводных текстов и др.) под давлением критики [5, с. 15—16]. Выявленные недостатки концепции Словаря древнерусского языка активно обсуждались в 1990-е гг. на заседаниях словарного коллектива и редколлегии — с VI тома было решено внести существенные коррективы в принципы словаря [4, с. 113].

В других случаях коррективы заставляет внести языковой материал на определенном словарном отрезке — особенно часто вызывает затруднение оформление коррелирующих приставок. Например, в Словаре обиходного языка Московской Руси ХУТ—ХУП вв. было принято специальное решение для приставок из-/изо- [7 VIII, с. 3]; в Словаре русского языка XVIII века на фоне расширения круга источников потребовалось дополнительно оговаривать разработку слов с приставками пере-/пре- [8]. Мелкие уточнения такого рода почти неизбежно появляются в любом крупном словаре «вслед за постепенно накапливающимися в практике составления Словаря сложными случаями» [9, с. 56].

В полной мере все описанные особенности характерны и для Словаря русского языка XVIII века. При точечном обращении читателя словаря к конкретным статьям отдельного выпуска структурная неоднородность неощутима. Но при последовательном полном просмотре материала выпусков хорошо вычленяются вновь появляющиеся в процессе написания словаря структурные элементы, которые необходимо принимать во внимание при разработке базы данных.

-4-■

Методология исследования

В настоящее время в ИЛИ РАН началась разработка универсального программного средства структурной разметки словарной статьи, которое бы сделало возможным: адаптацию к нормальной структуре данных всего разнообразия приемов и особенностей ретроспективного оформления1; представление данных в различных форматах (JSON, XML и XML-подобных, например, TEI); а в перспективе — работу над новыми редакциями (при подготовке второго издания).

Основной сложностью при разработке описанного представления материала было установление набора первичных элементов словарной статьи и иерархических отношений между ними. С этой целью был просмотрен весь массив выпущенных на сегодняшний день томов словаря — 22 выпуска, вышедшие с 1984 по 2019 гг., а также материалы подготовленного к печати 23 выпуска (планируется публикация в 2023 г.); произведен анализ структуры статей, ее сравнение с предписаниями проекта словаря; методом сплошной выборки проведено выявление типичных структур и редких в использовании элементов.

Результаты исследования

В результате анализа стабильных элементов структуры словарных статей была сформирована трехуровневая система компонентов:

— Базовый составной элемент: заголовок (единственный обязательный).

— Подчиненные составные элементы: тело статьи (значения), идиоматика, гнездовая часть и справочная зона.

— Простые элементы двух типов:

— Имеющие сложную типовую структуру; таких элементов было выделено около 30, они получили условное обозначение в соответствии с функцией в составе статьи: «оттенок значения», «сведения об ударении», «устойчивая сочетаемость», «варианты» и др.; эти компоненты имеют разную степень сложности: например, компонент «оттенок значения» включает 11 более простых элементов, а «сведения об ударении» — 2 простых элемента;

— Первичные элементы, используемые в составе составных элементов как напрямую по отдельности, так и внутри объединений.

Одни и те же первичные элементы могут встречаться как компоненты разных элементов высших уровней (например, шифр источника словаря может входить в состав любого из составных элементов — базового и подчиненных), но при этом каждый из высших компонентов призван передавать специфические словарные приемы и характерный порядок следования простейших составных частей, что обуславливает их необходимость. Из пяти названных типов заголовочный тип является базовым — единственным обязательным для словарной статьи. Например, многочисленные краткие отсылочные статьи (типа «АББЕ. См. Аббат») регистрируются в базе данных только с использованием заголовочного типа. Остальные четыре типа данных являются подчиненными заголовочному и присоединяются к заголовочной части при необходимости.

Внутри каждого из типов материал словарной статьи вводится с разделением на минимальные составляющие. Так, статья авалл имеет следующий вид:

<1 АВАЛЛ 1768, а, м. Ит. avallo < араб. Юр. Вексельное поручительство; аваль. Авалл есть, когда поручитель в векселе подписавшийся вступается в главное обязательство. Векс. право 51 [10, с. 12].

В этой статье тип данных «значение» (подчеркнуто) организован просто. В него входят: 1) Тематическая помета; 2) Дефиниция; 3) Текст цитаты; 4) Шифр источника; 5) Номер страницы источника. При этом компоненты, тесно связанные друг с другом, объединяются в структуре БД в блоки. В приведенном примере такой блок составляют шифр источника и номер страницы, которые в свою очередь входят в более крупный трехкомпонентный кластер — «цитата + шифр + + № страницы», который добавляется в базу данных общей командой. Из трех составляющих

1 В том числе приемов и особенностей единичных и вышедших из употребления. Перечень таких изменений см. в [6: 172-176].

4--

только «шифр» является обязательным компонентом, т.к. разных местах статьи может фигурировать указание на шифр и номер страницы без контекста из источника, а также может давать только указание на шифр. Тем не менее трехкомпонентный вариант является наиболее частотной реализацией, поэтому был оформлен отдельной структурной единицей (блоком) базы данных.

Таким образом, общая схема зависимостей структурных элементов базы данных словаря может быть представлена в следующем виде: базовый тип данных (заголовок) > подчиненные типы данных > блоки > отдельные компоненты.

Элементарные компоненты словарной структуры при всем их разнообразии с точки зрения формализации в базе данных делятся на два вида: задаваемые списком и единичные. Списком задается вся регулярно повторяющаяся в словаре метаязыковая информация. В эту категорию входят как формальные (нумерация значений, типы разделителей, включая знаки препинания), так и содержательные метакомментарии словарной статьи — разные группы помет (см. [11, с. 35—39]), шифры источников словаря, список дат: как таксономические единицы списка введены все годы с 1695 по 1810 (в соответствии с заявленными хронологическими рамками словаря), а также более широкие периоды в пределах XVIII века (десятилетия, указания типа "нач. XVIII в."), которые применяются при отсутствии точной датировки источника. Таким образом, метаинформация базы данных не ограничивается собственно словарными пометами и охватывает весь спектр метакомментариев словаря. Наконец, сама реестровая часть также представляет собой список, который автоматически пополняется при добавлении нового заголовка — благодаря этому при повторном упоминании лексемы в словаре (при отсылках разного рода из других статей) можно выбрать из списка ранее введенную лексическую единицу и связать две статьи гиперссылкой. Единичными и уникальными являются словарные дефиниции, тексты цитат, части слов (в строке вариантов и в поле флексий в заголовочной зоне статье), а также вводятся номера страниц.

Промежуточный случай представляет собой формализация словарных дефиниций в базе данных, т.к. они делятся на два вида — имеющие свободную и типовую структуру. Дефиниции типовой структуры передают регулярные семантические и словопроизводственные связи между словами и имеют хорошо формализуемую часть, число разновидностей которой ограничено. Такие дефиниции могут передавать синонимические отношения между словами (типа То же, что ...), указывать на словообразовательную производность (типа Отн. к ...; Действ. по гл. ... и др.). Один и тот же с точки зрения словарной техники элемент может иметь принципиально разную для формализации структуру. Дефиниции типовой структуры в базе данных должны ссылаться на соответствующую словарную статью и в связи с этим оформляются специально разработанными блоками.

Элементы словарных статей, применяемые неоднородно на протяжении выхода словаря, в том числе ушедшие из практики, как говорилось во вводной части статьи, представляют дополнительную сложность при формализации. Наименее влияют на структуру данных ситуации, когда определенный элемент меняет (сужает или расширяет) сферу применения в пределах одного блока компонентов. Рассмотрим ситуацию на примере динамических помет словаря, передаваемых графическими символами — в частности черными (◄ знак выхода из употребления) и белыми (< знак входа) треугольниками. В практике первых томов эти пометы употреблялись шире, в том числе предполагалось «показывать не только выход слова из употребления, но распространить это и на его варианты, кроме того, показывать уход слова из языка более детально (например, с указанием десятилетия или конкретного года)» [6, с. 172] (см. ниже статью ВИЗЖАТЬ). Устранение этого приема из зоны вариантов при заголовке не влияет на структуру базы данных: блок для передачи вариантов содержит элемент, отвечающий за динамическую помету, т.к. знак <1 (и некоторые другие этого типа) продолжает употребляться при вариантах, т.е. элемент структуры сохраняется.

Та же группа помет в первых шести томах словаря использовалась также в синонимических отсылках, сопровождающих группу цитат в словарной статье:

-■

ВИЗЖАТЬ (-жж-, ◄ сч-), зжу, зжит, несов.; Визжащий, прич. Издавать визг. Свиния висчит. Притчи Э. 1712 37. <...> — Ср. ◄ скучать [12, с. 159]; встречается этот прием даже в составе дефиниции:

ВОСКУРЕНИЕ (воз-), я, ср. Слав. 1. обычномн. Дым; ◄ влажный пар. ... [13: 81]. Блок для отсылки типа «Ср. ...» содержит в нормальном случае только элементы для выбора из списка реестровых вокабул, для оформления гиперссылки на соответствующую статью. Чтобы передать в базе данных эту раннюю особенность лексикографирования, необходимо добавить в блок компонент, отвечающий за добавление динамических помет, который однако в большинстве словарных статей и в перспективе не будет востребован. В настоящее время, на финальных стадиях разработки структуры электронной словарной статьи, идет обсуждение целесообразности таких избыточных элементов в составе блоков.

Несколько иной случай с точки зрения структуры данных представляет оставшаяся невостребованной в словаре система шифров, обозначенных знаком * в списке источников. Как указывается в «Правилах пользования словарем XVIII века», этот знак «отмечает источники, где возможны факультативы. Факультативная часть располагается впереди шифра и может состоять из имени автора, даты, краткого названия произведения (документа)» [11, с. 56]. Например, таким знаком снабжен шифр «Поэты XVIII в.», и это значит, что к этому сокращению может быть предпослано сокращение фамилии конкретного поэта: «Трд. Поэты XVIII в.» указывает, что цитата по этой антологии была дана из произведения В. К. Тредиаковско-го. Однако на практике эта система шифров с факультативной частью плохо прижилась и применялась очень редко. Между тем, для того чтобы в блоке цитаты можно было ссылаться на такой комбинированный шифр, необходимо создавать новый тип компонента (а не добавлять уже существующий, как в случае с треугольными пометами). Кроме этой позиции (в комбинированном шифре) добавлять сокращения фамилий авторов больше нигде не требуется. В такой ситуации «неформатный» и невостребованный элемент словарных статей лучше устранять из оригинального текста и приводить его в соответствие с актуальным лексикографическим узусом.

Еще один вид нестандартных элементов в структуре словарной статьи Словаря русского языка XVIII века связан не с общей эволюцией лексикографической техники, а с разовыми решениями для сложных случаев, которые принимали отдельные составители. В отдельную категорию выделяются разного рода комментарии в свободной форме, данные автором статьи не в составе дефиниции. Например, в статье АНГЕЛ такой комментарий дан при заголовке: АНГЕЛ (простонар. анд-), а, м. В церк.-слав. орфографии аггл и аггел [10, с. 67]; в статье ЗАМАТЬ комментарий другой тематики — тоже в заголовочной зоне: ЗАМАТЬ (-ти-), аю, ает, несов и сов. кого-что. (Обычно с отриц. "не" в раздельном и слитном написании; чаще повел.) [14, с. 13] (см. также статьи АНИМОЗИТЕ, АТТАШЕМЕНТ, МЛАТ и др.).

Комментарий энциклопедического характера, не предусмотренный обычным формуляром, может быть дан при указании на этимологию слова:

<1 МЕРКАТОРСКИЙ 1715, ая, ое. От Mercator — латинизированное имя гол. математика Г. Кремера [15, с. 138].

Комментарий может быть дан внутри ряда однородных устойчивых выражений: ПЕЧАТНЫЙ (-ой), ая, ое <...> 0 П. приказ (в России до 1722 г.), п. контора (1722-1762 гг.). Учреждения, в ведении которых находилась государственная печать [16, с. 194] и др.

Для таких случаев — разнородных содержательно и позиционно, но однотипных по форматированию — было предложено единое решение. В список элементов системы была добавлена возможность свободного ввода текста, с выбором нужного форматирования (прямой, курсивный, разреженный текст). Это поле можно привлекать только в отдельных статьях, использующих свободные комментарии.

4-*

Встречаются и другие элементы в нетипичных условиях — расширенно по сравнению с обычной техникой оформления. Вот нестандартные примеры указания даты вхождения:

< МЕ БЕЛИ 1717 (мё- 1789, мебли 1760), ◄ МОБИЛИ 1719, ей и ль и <► МОБИЛИИ 1704, ев, мн.; ед. собир. мобилия 1700, мебель 1784, и, ж. и мебель 1766, я, м. [15, с. 103];

< МЕТЕОРОЛОГИЯ 1746, и, ж. <...> Метеорологический 1737, ая, ое [15, с. 157].

В первом случае даты указаны при морфологических вариантах, во втором — при гнездовом слове. Типологически эти случаи похожи на рассмотренные выше — вышедшие из употребления приемы. Разработанный инструментарий позволяет их передавать; достаточно добавить недостающее поле в соответствующий блок. Но в большинстве статей (точнее — во всех статьях, кроме нескольких, составляющих исключение) это поле будет оставаться незаполненным, поэтому для формализации оптимальным решением будет устранение этих разовых элементов.

В гнездовой зоне встречаются и другие «посторонние» элементы, характерные для других зон словарной статьи. Из заголовочной зоны (видимо, ошибочно) взят знак белого квадрата (особые морфологические формы):

ПОВЪВАТЬ, аю, ает, несов.<...> < Пов'Ьвание (-ье), я, ср. □ им. мн. -ньи [17, с. 91];

из зоны значения перешло указание на употребление после одиночной вертикальной черты:

НАИТИ2 <...> Нахаживал, ла, ло, многокр.; Нахаживан, кратк. прич. (1). <...> | Нахаживано, безл. При одной рЪкЬ ВитимЪ всегда довольно нахаживано <слюды>. ЕС 1756 355 [18, с. 207].

Последний пример содержит значимую информацию о лексеме — ее способности выступать в качестве безличного предиката, которая системно фиксируется в словаре. В данном случае замеченный недочет — повод перенести данные из гнездовой зоны статьи в зону соответствующего значения, в целях сохранения информации.

Особняком стоят примеры, связанные с исключительным характером самой описываемой языковой единицы. Например, необычными морфологическими свойствами обладает слово аминь, способное употребляться как наречие, как существительное и как междометие, по данным словаря. Для передачи в одной статье всех этих морфологических ипостасей пришлось прибегнуть к нестандартному решению и привести элемент, идентичный заголовочному, внутри зоны соответствующего значения: ... 2. Аминь, я, м. Прост. Конец. Подождите до аминя. ФРЛ1 I 49 [10, с. 60]. Элемента для указания флексии в типе данных значения не предполагается, поэтому, возможно, проблема отражения такой статьи в базе данных будет решена с использованием возможности добавить произвольный текст с нужным форматированием.

Заключение

Таким образом, структурный анализ и системная формализация данных опубликованных выпусков Словаря русского языка XVIII века в некоторых случаях оказываются сопряжены с устранением отдельных выбивающихся из общего употребления случаев. По умолчанию это касается и замеченных в ходе анализа явных недостатков в вычитке итогового печатного варианта словаря: разного рода ошибки оформления, разнобой в видах кавычек, скобок, опечатки и т.п. устраняются в новой электронной публикации.

Рассмотренные в статье принципы формализации, разработанные на материале Словаря русского языка XVIII века могут быть положены в основу электронных версий других словарных изданий историко-лингвистического типа. Сложности с формализацией, с которыми пришлось столкнуться, имеют несколько типовых рабочих решений независимо от природы их появления. Надежность найденных решений будет проверена на финальном этапе перевода словарных данных в электронный формат разработанной базы данных.

■4-■

СПИСОК ИСТОЧНИКОВ

1. Словарь русского языка XI—XVII вв. / Рос. акад. наук, Ин-т рус. языка им. В.В. Виноградова. Вып. 1-31. М.; СПб., 1975-2019.

2. Словарь русского языка XVIII века / Рос. акад. наук, Ин-т лингв. исслед. Вып. 1-22. Л.; СПб.: Наука, 1984-2019.

3. Словарь древнерусского языка (XI—XIV вв.) / Рос. акад. наук, Ин-т рус. языка им. В.В. Виноградова. Т. 1-12. М., 1988-2019.

4. Крысько В.Б. Русская историческая лексикография (XI—XVII вв.) проблемы и перспективы // Вопросы языкознания. 2007. № 1. С. 103-118.

5. Чернышева М.И. Итоги 45-летнего издания «Словаря русского языка XI—XVII вв.» // Сту-дще и расправе. 2020. Ка. 76, св. 1. С. 9-40.

6. Малышева И.А. «Словарь русского языка XVIII века»: поиски и решения // История, теория и практика академической лексикографии: юбилейный сборник научных статей / отв. ред. М.Н. Приемышева. СПб.: ИЛИ РАН, 2022. С. 163-179.

7. Словарь обиходного русского языка Московской Руси XVI—XVII веков. Вып. 1-9. СПб., 2004-2020.

8. Малышева И.А., Захарова Е.А. Глаголы с пере-/пре- в историческом словаре: практические решения // Славянская историческая лексикология и лексикография. 2022. Вып. 3. С. 161-173.

9. Мжельская О.С., Зиновьева Е.И., Генералова Е.В. Историческая лексикография: Вопросы и ответы (Некоторые итоги обсуждения первого выпуска «Словаря обиходного русского языка Московской Руси XVI—XVII вв.») // Вестник Санкт-Петербургского университета. Сер. 9. 2006. Вып. 4. С. 52-56.

10. Словарь русского языка XVIII века. Вып. 1. Л.: Наука, 1984.

11. Словарь русского языка XVIII века. Правила пользования словарем. Указатель источников / отв. ред. Ю. С. Сорокин. Л.: Наука, 1984.

12. Словарь русского языка XVIII века. Вып. 3. Л.: Наука, 1987.

13. Словарь русского языка XVIII века. Вып. 4. Л.: Наука, 1988.

14. Словарь русского языка XVIII века. Вып. 8. СПб.: Наука, 1995.

15. Словарь русского языка XVIII века. Вып. 12. СПб.: Наука, 2001.

16. Словарь русского языка XVIII века. Вып. 19. СПб.: Наука, 2011.

17. Словарь русского языка XVIII века. Вып. 20. СПб.: Наука, 2013.

18. Словарь русского языка XVIII века. Вып. 13. СПб.: Наука, 2003.

REFERENCES

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[1] Slovar russkogo yazyka XI—XVII vv. [Dictionary of the Russian language of the XI—XVII centuries], Ros. akad. nauk, In-t rus. yazyka im. V.V Vinogradova [Russian Academy of Sciences, VV. Vinogradov Institute of Russian Language] Vol. 1-31. M.; SPb., 1975-2019.

[2] Slovar russkogo yazyka XVIII veka [Dictionary of the Russian language of the XVIII century], Ros. akad. nauk, In-t lingv. issled [Russian Academy of Sciences, in-T lingv. research.] Vol. 1-22. L.; SPb.: Nauka, 1984-2019.

[3] Slovar drevnerusskogo yazyka (XI-XIV vv.) [Dictionary of the old Russian language (XI-XIV centuries.)], Ros. akad. nauk, In-t rus. yazyka im. VV. Vinogradova [Rus. akad. Nauk, in-T Rus. their language. V.V. Vinogradova.] T. 1-12. M., 1988-2019.

[4] V.B. Krysko, Russkaya istoricheskaya leksikografiya (XI-XVII vv.) problemy i perspektivy [Russian historical lexicography (XI-XVII centuries.) problems and prospects], Voprosy yazykoznaniya [Questions of linguistics], 1 (2007) 103-118.

[5] M.I. Chernysheva, Itogi 45-letnego izdaniya «Slovarya russkogo yazyka XI-XVII vv.» [Results of the 45-year edition of the "Dictionary of the Russian language of the XI-XVII centuries"], Studije i rasprave, 1 (76) (2020) 9-40.

[6] I.A. Malysheva, «Slovar russkogo yazyka XVIII veka»: poiski i resheniya ["Dictionary of the Russian language of the XVIII century": searches and solutions], Istoriya, teoriya i praktika akademicheskoy leksikografii: yubileynyy sbornik nauchnykh statey / otv. red. M.N. Priyemysheva [History, theory and

4--

practice of academic lexicography: jubilee collection of scientific articles / ed. by M.N. Priemyshev]. SPb.: ILI RAN, 2022. Pp. 163-179.

[7] Slovar obikhodnogo russkogo yazyka Moskovskoy Rusi XVI-XVII vekov [Dictionary of everyday Russian of Moscow Rus of the XVI-XVII centuries]. Vol. 1-9. SPb., 2004-2020.

[8] I.A. Malysheva, Ye.A. Zakharova, Glagoly s pere-/pre- v istoricheskom slovare: prakticheskiye re-sheniya [Verbs with pre-/pre- in the historical dictionary: practical solutions], Slavyanskaya istoricheskaya leksikologiya i leksikografiya [Slavic Historical Lexicology and Lexicography], 3 (2022) 161-173.

[9] O.S. Mzhelskaya, Ye.I. Zinovyeva, Ye.V. Generalova, Istoricheskaya leksikografiya: Voprosy i otvety (Nekotoryye itogi obsuzhdeniya pervogo vypuska «Slovarya obikhodnogo russkogo yazyka Moskovskoy Rusi XVI-XVII vv.») [Historical lexicography: Questions and answers (Some results of the discussion of the first issue of the "Dictionary of everyday Russian of Moscow Rus of the XVI-XVII centuries")], Vestnik Sankt-Peterburgskogo universiteta [Bulletin of St. Petersburg University]. Ser. 9. 4 (2006) 52-56.

[10] Slovar russkogo yazyka XVIII veka [Dictionary of the Russian language of the XVIII century]. Vol. 1. L.: Nauka, 1984.

[11] Slovar russkogo yazyka XVIII veka. Pravila polzovaniya slovarem. Ukazatel istochnikov, otv. red. Yu.S. Sorokin [Dictionary of the Russian language of the XVIII century. Rules for using the dictionary. Index of sources, ed. by Yu.S. Sorokin]. L.: Nauka, 1984.

[12] Slovar russkogo yazyka XVIII veka [Dictionary of the Russian language of the XVIII century]

Vol. 3. L.: Nauka, 1987.

[13] Slovar russkogo yazyka XVIII veka [Dictionary of the Russian language of the XVIII century]

Vol. 4. L.: Nauka, 1988.

[14] Slovar russkogo yazyka XVIII veka [Dictionary of the Russian language of the XVIII century]

Vol. 8. SPb.: Nauka, 1995.

[15] Slovar russkogo yazyka XVIII veka [Dictionary of the Russian language of the XVIII century]

Vol. 12. SPb.: Nauka, 2001.

[16] Slovar russkogo yazyka XVIII veka [Dictionary of the Russian language of the XVIII century]

Vol. 19. SPb.: Nauka, 2011.

[17] Slovar russkogo yazyka XVIII veka [Dictionary of the Russian language of the XVIII century]

Vol. 20. SPb.: Nauka, 2013.

[18] Slovar russkogo yazyka XVIII veka [Dictionary of the Russian language of the XVIII century]

Vol. 13. SPb.: Nauka, 2003.

СВЕДЕНИЯ ОБ АВТОРАХ / INFORMATION ABOUT AUTHORS

Егоров Игорь Михайлович Igor M. Egorov

E-mail: agricola.piger@yandex.ru

Мольков Георгий Анатольевич Georgiy A. Molkov

E-mail: georgiymolkov@gmail.com

Поступила: 14.08.2023; Одобрена: 22.09.2023; Принята: 27.09.2023. Submitted: 14.08.2023; Approved: 22.09.2023; Accepted: 27.09.2023.

i Надоели баннеры? Вы всегда можете отключить рекламу.