Научная статья на тему 'Архаизмы и компьютерная проверка правописания (на материале антологии "Поэзия Московского университета: от Ломоносова и до. . . ")'

Архаизмы и компьютерная проверка правописания (на материале антологии "Поэзия Московского университета: от Ломоносова и до. . . ") Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
171
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
MICROSOFT WORD / ТЕКСТОВЫЙ РЕДАКТОР / УСТАРЕВШАЯ ЛЕКСИКА / АРХАИЗМЫ / ОРФОГРАФИЧЕСКИЕ ОШИБКИ / НОРМАТИВНОЕ НАПИСАНИЕ / СТАРАЯ ОРФОГРАФИЯ / СТИХОТВОРНЫЕ ТЕКСТЫ / TEXT EDITOR / OBSOLETE VOCABULARY / ARCHAISMS / SPELLING MISTAKES / NORMATIVE SPELLING / OLD SPELLING / POETIC TEXTS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Лавошникова Элина Константиновна

Исследуется реакция текстового редактора Microsoft Word 2016 (модификация 2017 г.) на некоторые лексические и грамматические особенности русской поэзии XVIII и начала XIX в Примеры архаизмов взяты из 1-й и 7-й книг антологии «Поэзия Московского университета: от Ломоносова и до...». Приводятся цитаты (некоторые в старой орфографии) из стихотворных произведений императрицы Елизаветы Петровны (в переложениях), Ломоносова, Державина, Радищева, Жуковского и Пимена Арапова. При этом анализируется выдача программой Корректор (новая версия программы-«подсказки») рекомендаций по исправлению слов, отсутствующих во внутренних (системных) словарях, в том числе устаревшей лексики. Делается попытка объяснить реакцию спеллера на отклонения в стихотворных строчках от норм современного русского языка. На конкретных примерах показано, что включение в системные компьютерные словари устаревших и низкочастотных слов во многих случаях не только не способствует улучшению работы спеллера, но приводит к пропуску ошибок и опечаток.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Archaisms and computer spell check (on the material of the anthology Poetry of Moscow University: From Lomonosov to... )

The response of the text editor Microsoft Word 2016 (2017 modification) to some lexical and grammatical peculiarities of Russian poetry of the 18th-19th centuries is shown in the article on numerous examples. The examples of archaisms have been taken from the poetry of the authors who worked or studied at the Imperial University of Moscow. On March 14, 2017, the series Poetry of Moscow University: From Lomonosov to..., published in the MSU Research Computing Centre, Laboratory for Computational Lexicography (Lomonosov Moscow State University) was awarded with the National Award "BEST BOOKS AND PUBLISHERS 2016" in the nomination "Poetry" (http://www.whoiswho.ru/yearbook/yearbooks2016/). Examples from Books 1 and 7 of this anthology have been used. This article analyzes the recommendations of the spell checker ("suggestion") on the correction of obsolete vocabulary. Furthermore, an attempt is made to identify and explain the response of Word Spell Check (which is not always appropriate) to deviations from modern Russian grammar in verses, even if they have been marked in academic dictionaries and handbooks. It is shown that the inclusion of some obsolete and low-frequency words into the internal (system) computer dictionaries sometimes not only does nothing to improve the work of the speller, but leads to skipping of errors and typos. The operation of MS Word 2016 text editor (2017 edition) has been tested on quotes from poems by empress Elizabeth Petrovna Romanova (1709-1762), M.V. Lomonosov (1711-1765), G.R. Derzhavin (1743-1816), A.N. Radishchev (17491802), V.A. Zhukovsky (1783-1852) and P.M. Arapov (1796-1861). In the anthology Poetry of Moscow University: From Lomonosov to..., many poetical works starting with Book 5 are given in their original form, i.e. in old spelling and without the changes made by the Decree of 1918. The Spell Checker suggests possible correction variants of the words underlined and unidentified by the system (no more than three options in the 2017 edition), or revision of the phrase. The suggestion is not always able to propose the normative spelling of the word, especially if it differs from the underlined one by several letters. In the list of options, words are often split by a space, without taking into account the coherence of the two resulting words. As seen in the examples listed in the article, Word 2016 (just like the previous versions of the automatic spell checker) does not always consider the peculiarities of spelling in poetry, and does not always follow the recommendations of reputable dictionaries and reference books. Some archaic words may coincide with more common but misspelt words in the modern Russian language. In that case, Word sometimes cannot detect an error. When considering Word's spell checker correction options, low-frequency words and proper names included into the system dictionaries are found, which sometimes only hinders the identification of errors and typos. For justice's sake, it should be noted that many of the flaws described by the author of the article and by other Internet users, have recently been eliminated from the MS Word text editor, but the content of its Russian system dictionary and the recommendations of the Spell Checker suggesting program leave a lot of questions.

Текст научной работы на тему «Архаизмы и компьютерная проверка правописания (на материале антологии "Поэзия Московского университета: от Ломоносова и до. . . ")»

УДК 808.1

DOI: 10.17223/23062061/17/9 Э.К. Лавошникова

АРХАИЗМЫ И КОМПЬЮТЕРНАЯ ПРОВЕРКА ПРАВОПИСАНИЯ (НА МАТЕРИАЛЕ АНТОЛОГИИ «ПОЭЗИЯ МОСКОВСКОГО УНИВЕРСИТЕТА: ОТ ЛОМОНОСОВА И ДО...»)

Аннотация Исследуется реакция текстового редактора Microsoft Word 2016 (модификация 2017 г.) на некоторые лексические и грамматические особенности русской поэзии XVIII и начала XIX в Примеры архаизмов взяты из 1-й и 7-й книг антологии «Поэзия Московского университета: от Ломоносова и до...». Приводятся цитаты (некоторые - в старой орфографии) из стихотворных произведений императрицы Елизаветы Петровны (в переложениях), Ломоносова, Державина, Радищева, Жуковского и Пимена Арапова. При этом анализируется выдача программой Корректор (новая версия программы-«подсказки») рекомендаций по исправлению слов, отсутствующих во внутренних (системных) словарях, в том числе устаревшей лексики. Делается попытка объяснить реакцию спеллера на отклонения в стихотворных строчках от норм современного русского языка. На конкретных примерах показано, что включение в системные компьютерные словари устаревших и низкочастотных слов во многих случаях не только не способствует улучшению работы спеллера, но приводит к пропуску ошибок и опечаток.

Ключевые слова: Microsoft Word, текстовый редактор, устаревшая лексика, архаизмы, орфографические ошибки, нормативное написание, старая орфография, стихотворные тексты.

Задавшись целью протестировать новую версию (модификацию 2017 г.) текстового редактора Microsoft Word 2016 на архаизмах и грамматических особенностях, свойственных поэтической практике XVIII и начала XIX в., мы выбрали стихотворные произведения из 1-й [1] и 7-й [2] книг антологии «Поэзия Московского университета: от Ломоносова и до...», издаваемой коллективом лаборатории автоматизированных лексикографических систем Научно-исследовательского вычислительного центра МГУ им. М.В. Ломоносова. 14 марта 2017 г. серия «Поэзия Московского университета от Ломоносова и до...» (книги 7-я и 8-я) была награждена Нацио-

нальной премией «ЛУЧШИЕ КНИГИ И ИЗДАТЕЛЬСТВА - 2016» в номинации «Поэзия» (http://www.who-iswho.ru/yearbook/ yearbooks2016/).

Из статьи А.В. Рафаевой: «Проект "Поэзия Московского университета: от Ломоносова и до..." был начат в 2000 г. Инициатором и первым руководителем проекта стала сотрудница Научно-исследовательского вычислительного центра МГУ имени М.В. Ломоносова (НИВЦ МГУ) Галина Антоновна Воропаева (1947-2008)» [3. С. 224]. И далее: «Под руководством Н.Н. Перцовой (1945-2015), с 2008 по 2015 г., проект получил дальнейшее развитие. На сайте появились новые разделы, включая раздел "О старой орфографии", с этого момента стихи стали публиковаться в аутентичной орфографии» [Там же. С. 224].

Н.В. Перцов заключает свое исследование о старинной орфографии такими словами: «Вывод из сказанного ясен: аутентичная передача текста предполагает сохранение его графики и правописания - в частности в изданиях академического типа. Серьезное академическое издание классического литературного текста должно быть ориентировано на читателя-специалиста, во всяком случае, на такого читателя, который заинтересован в постижении не только «плана содержания», но и «плана выражения» текста. В таком издании не текст нужно приближать к читателю, а читателя к тексту - к его языку, его графике и правописанию» [4. С. 54].

Написание приводимых в качестве примеров слов мы будем сверять с «Русским орфографическим словарём» (РОС) [5], с «Орфографическим словарём русского языка» Б.З. Букчиной, И.К. Сазоновой и Л.К. Чельцовой (БСЧ) [6], а также (в некоторых случаях) с 6-м изданием «Грамматического словаря русского языка» А.А. Зализняка [7] и словарём Ушакова (Уш.) [8]. Словарь БСЧ и одно из предыдущих изданий словаря Зализняка входят в список четырёх словарей, грамматик и справочников, рекомендованных в 2009 г. Межведомственной комиссией по русскому языку при Минобрнауки и содержащих нормы современного русского литературного языка.

При компьютерной проверке правописания спеллер текстового редактора MS Word красной волнистой линией подчёркивает

словоформы (или иногда даже часть слова, обычно при написании через дефис), отсутствующие в его системных словарях. Тем самым пользователю предлагается обратить внимание на набранное им слово - нет ли в нём ошибки или опечатки. Синими линиями в текстовом редакторе Word 2016, а также в Word 2013 (или зелеными в предыдущих версиях, разработанных на основе системы «Орфо») подчёркиваются вероятные синтаксические огрехи -ошибки в пунктуации и согласовании словоформ.

Подчёркиваемые системой Word 2016 (в модифицированной версии 2017 г.) слова и словосочетания из наших примеров мы тоже будем подчёркивать. Если словоформа нами не подчёркнута, это означает, что она содержится во внутреннем системном словаре спеллера.

Некоторые отрывки из стихов приводятся в старой орфографии (написание слов во всех цитатах берётся из антологии). Если подчёркнутое красной волнистой линией слово в случае удаления твёрдого знака на конце спеллером пропускается, то в стихотворных строчках нами будет подчёркнут только «ъ».

Word'овская программа-подсказка при её вызове пользователем выдаёт список возможных вариантов исправления слова, подчёркнутого красной волнистой линией. Текстовый редактор Word 2016 после обновлений 2017 г. в своей «подсказке» (программа Корректор) стал предлагать не больше трёх вместо пяти вариантов исправления, но при этом иногда добавляются пояснения в форме синонимов или похожих слов. Нередко среди предлагаемого подсказкой вылезают «подводные камни» - ошибочно включённые или необоснованно порождённые в системе слова и словоформы.

Далее приводятся некоторые строки с выделенными (полужирным курсивом) архаизмами и грамматическими особенностями, отличающимися от современной нормы, из стихотворных произведений авторов, живших в XVIII-XIX вв. и имевших непосредственное отношение к Московскому университету. Здесь, как и в самой антологии, авторы располагаются по году рождения.

Императрица ЕЛИЗАВЕТА ПЕТРОВНА (1709-1762). «Своим указом основала Императорский Московский университет» [2. С. 7]. «В годы своей опалы она и ее "малый двор" проводили много времени в загородном дворце в подмосковном селе Покровском-Рубцове близ Яузы. Там царевна часто устраивала праздники с песнями и плясками, на которых дамы надевали народную одежду и веселились вместе с крестьянскими девушками. Две песни, написанные ею самой, получили в дальнейшем широкое хождение и часто публиковались как народные» [Там же. С. 12].

<Начало акростиха>

...А анъ стала тая еще глупей быти... Программа Корректор (модификация-2017) предлагает для анъ «исправления»: анн, бань, дань. Слово анна со строчной буквы в цитируемых нами словарях отсутствует, но оно включено во внутренний системный словарь Word'а и склоняется как нарицательное существительное женского рода. Словоформа стала подчёркивается синим цветом, поскольку за ней следует тая, воспринимаемое системой как деепричастие, перед которым требуется запятая. Для быти программа Корректор предлагает быте, бытие, бытия, но не быть. Подсказ-ка-2016, которая выдавала не до трёх (как Корректор-2017), а до пяти вариантов, для быти рекомендовала ещё и быто как краткую форму страдательного причастия бытый, которое вряд ли правомерно порождено в системе. Поэтому случайное появление пробела в слове забытый («за бытый») будет пропущено спеллером без какого-либо подчёркивания.

ПЪсня. <Вариант Державина>

Тише жъ нынт, тише протекайте, / Чисты струйки по песку, / И слтдовъ съ моихъ глазъ не смывайте... Одно из «исправлений» для жъ - императив ёжь (!) от глагола ёжить (РОС), отсутствующего в словарях БСЧ и Ушакова. Таким образом, случайное разбиение пробелом слова молодежь спеллер Word^ не заметит и не подчеркнёт: «Это наша молод ежь». При пока ещё несовершенном синтаксическом контроле в системе Word 2016 многие такие случаи несогласованности пропускаются без синего подчёркивания,

см. [9. С. 206]. Для слтдовь одним из вариантов предлагается сла-дов (РОС: «слад: сладу нет», но Word склоняет слад).

<Вариант «Нового песенника»>

Ахь! сколько щастливы... Один из трёх вариантов «исправления» ахъ - архи (как отдельное полноценное слово в цитируемых нами словарях отсутствует). Из-за присутствия в системном словаре этого «слова» фраза «Это архи важно!» с ошибочно вставленным пробелом пропускается без каких-либо подчёркиваний. Для щастливы подсказка Корректор выдаёт единственный вариант растлив.

ПЬсня

Пртзжаль ко мнт дттинка /Изь Санкть-Питера сюда... Для первого слова Корректор предлагает только один вариант - императив изжаль от изжалить. Далее выдаётся: мне, мну и мню (от мнить). Для формы детинка без ятя предлагается тоже три (максимально возможное число) варианта: детина, детинца и разбиение на два слова «дет инка». Таким образом, ошибочные словосочетания «вый дет», «при дет», «заве дет» и др. могут при пока ещё слабом синтаксическом контроле пропускаться без синего подчёркивания - по причине нахождения во внутреннем системном словаре краткой формы страдательного причастия от деть. Пример: «Ничего не вый дет».

Михаил Васильевич ЛОМОНОСОВ (1711-1765) [1. С. 19], по инициативе которого в 1755 г. был основан университет в Москве и имя которого носит МГУ.

* Из биографического очерка Н.Н. Перцовой и А.В. Улановой: «Песня "Во селе, селе Покровском..." - это, как полагают исследователи, отклик Елизаветы на попытку Анны Леопольдовны выдать ее замуж за немецкого принца Людовика. Она тоже вошла во многие песенники, а также исполнялась 11 февраля 1796 г. в Эрмитажном театре, где актриса Елизавета Уранова (Сандунова) включила ее в оперу Екатерины II "Федул с детьми". Первый намек на авторство императрицы был сделан в 1820 г. в песеннике М. Маклакова» [2. С. 13].

Вечернее размышление о Божием Величестве при случае великого северного сияния

Лице свое скрывает день... В современном написании и произношении лице - форма предложного падежа, но спеллер отсутствие перед этим словом предлога не отмечает.

О вы, которых быстрый зрак /Пронзает в книгу вечных прав... «О вы» подчёркивается синими линиями. Корректор (программа-«подсказка» с 2017 г.) выдаёт единственный вариант «исправления» - «О вас». Архаизм зрак (Уш.: «церк.-книжн., поэт. устар.») включён в системный словарь спеллера. Таким образом, ошибочное появление пробела в некоторых формах слова призрак не будет отмечено. Пример: «В этом при зраке что-то есть».

...Иль в море дуть престал зефир... В наше время слово зефир чаще употребляется в значении 'кондитерское изделие'. Здесь мы также видим словоформу престал от престать. Словари БСЧ и РОС этот глагол не содержат. В современных текстах формы глагола престать с гораздо большей вероятностью могут появиться в результате пропуска буквы (например, при слишком слабом нажатии клавиши при наборе перестать или предстать) или при ошибке в формах от пристать (например, преставший). По отсутствию какого-либо подчёркивания делаем вывод, что глагол престать [7] включён во внутренний словарь спеллера. Причина - в основу лексической базы «Орфо» (а затем Word^) были положены первые издания «Грамматического словаря» А.А. Зализняка. О перегруженности системных словарей текстового редактора MS Word малоупотребительными словами и словоформами, затрудняющими выявление ошибок и опечаток, мы писали в нескольких работах, например в статье [10].

Преложение псалма 143

Системный Корректор выдаёт для отсутствующего в Word^ слова преложение (РОС) три варианта: приложение, предложение и переложение. В данном случае при проверке современных текстов это можно только приветствовать.

...Скрывают в сердце злобный ков. В системном словаре Word'а содержатся словоформы ковах, ковами и т.д. (в РОС только мн. число: ковы, ков). Формы кова, ковом (ед. ч.) подчёркиваются. По отсутствию не только красного, но и синего подчёркивания в приведённой строчке мы видим, что автокорректор не замечает несогласованности прилагательного (злобный) и род. падежа мн. числа (в современном языке) ков. Слово ковы ('коварные действия') - архаизм, «книжн., устар.» (Уш.). Вряд ли его присутствие в системном словаре выглядит целесообразным. Буквосочетание «ков» встречается в конце многих словоформ. Нечаянную вставку пред ним пробела текстовый редактор может не заметить (примеры: «много отрыв ков», «нет отрез ков», «пар ков», «потом ков», «стан ков»).

Знакомясь с поэтическими произведениями М.В. Ломоносова, одного из основоположников силлабо-тонического стихосложения и научной грамматики русского языка, следует учитывать следующее обстоятельство: «Одна из особенностей поэтических текстов Ломоносова заключается в том, что, придавая исключительно важное значение их фонетической стороне, он отступал порою от обычных для него норм правописания» [11. С. 6].

Гаврила (Гавриил) Романович ДЕРЖАВИН (1743-1816). «Учился в Казанской Императорской гимназии при Московском университете; почетный член Общества любителей российской словесности при Московском университете» [2. С. 38].

На смерть князя Мещерскаго

Ничто отъ роковыхъ когтей, / Никая тварь... Подсказка для отъ третьим вариантом выдаёт лексему с твёрдым знаком на конце объ (!), по непонятной причине включённую в системный словарь. На слово никая со строчной буквы Корректор предлагает три варианта: некая, никоя и нукая (от нукать). Что означает внесённое в системный словарь «никоя» - нам неизвестно. Есть топоним Никоя (полуостров), но его следует писать с прописной буквы.

Подите, счастья*, прочь, возможны! В рамках современного русского языка мы бы употребили полную форму прилагательного - «возможные». Словосочетание «подите прочь» не такое уж редкое, но Корректор-подсказка предлагает варианты «исправления»: падите, плодите и подайте.

Властителямъ и суд1ямъ

Покрыты мздою очеса... РОС: «устар. книжн. к очи». Устаревшая форма мн. числа от слова око пропускается без замечаний, так как воспринимается спеллером как форма слова очёс.

Фелица

Такъ кормщикъ, черезъ понтъ плывущт... Слово понт без твёрдого знака (РОС: «сниж.», но в другом значении) тоже подчёркивается красным. Программа Корректор предлагает первым вариантом Понт с прописной буквы. Весьма употребительное в наше время слово понты (отдельная словарная статья в РОС) в системном словаре текстового редактора Word тоже отсутствует.

Богъ

Твое созданье я, Создатель! Некоторые слова с окончанием «-ье» (если это варианты существительных на «-ие») в системный словарь Word^ не включены. В словарях БСЧ и РОС довольно употребительный вариант созданье тоже не представлен. Обратный случай: отсутствующий в цитируемых в настоящей статье словарях, но пропускаемый Word'ом без замечаний вариант веселие.

Водопадъ

...И слышенъ стонъ - что Турокъ мнитъ? Для слышенъ Кор-ректор-2017 предлагает два варианта: слышен (от слышный) и слышан (от слышанный). Для стонъ первым вариантом выдаётся стань со странным пояснением: «замерзни, начни, обойдись». Слово стон идёт лишь вторым вариантом исправления. Национальность когда-то писалась с прописной буквы (в наше время это тоже можно встретить в текстах пользователей Интернета), однако в цитируемой строчке подразумевается не конкретное лицо. Словосочетания с лишним пробелом «нужно по мнить» и «не надо те

* Весьма вероятно, что в оригинале это слово начиналось с буквы «щ».

мнить» спеллер может не отметить (синим не подчеркнуть). Пропуск гласной «е» в словах меню и меня в некоторых случаях тоже может пройти незамеченным (при несовершенном синтаксическом контроле): «Это мню слишком короткое, мня оно не устраивает».

Вельможа

...Не истуканы за кристаломь... В словаре Ушакова [8] есть статья КРИСТАЛ(Л) - т.е. в первой половине ХХ в. допускалось написание этого слова с одной «л».

Безсмерт1е души

Какь тма есть свтта отлученье, / Такь отлученье жизни -смерть... Для Какъ с прописной буквы вторым вариантом предлагается имя собственное Кук. Исправление тьма не выдаётся (варианты: там, тмя и тема). Словоформа тмя - деепричастие от тмить. Словарная статья тмить(ся) есть в РОС, но отсутствует в БСЧ (т.е. этот глагол - малоупотребительный). В разных формах более частотного глагола томить нечаянный пропуск буквы «о» спеллером не будет отмечен («тмившиеся в заключении», например).

Урна

О, сколько юношей тобою / Познашя пр1яли свтть! Открываем РОС: «приять... (устар. к принять)». Пропуск буквы «н» в словоформах приняли, принявший и др. текстовый редактор Word не отметит.

Утро

...Багряны возжи напряглися / По конскимь блещущимь хребтамь... Варианты «исправления»: визжи, вози, визжу. Таким образом, подсказка Корректор слово вожжи, отличающееся только одной буквой, не предлагает (в модификации 2017 г. больше трёх вариантов не выдаётся). Для напряглися третий вариант - пара словоформ «напряг лися». В систему включён глагол лисить (РОС), отсутствующий в словаре БСЧ как малоупотребительный.

Евгешю. Жизнь Званская

...Вдали тетеревей глухое токованье... Подсказка-2017 словоформу тетеревов не предлагает.

...Ревь кравь, громь желнъ и коней ржанье. Спеллер форму крав (т.е. коров) пропускает как деепричастие от красть. Словоформы коров нет в вордовской парадигме лексемы корова (по не-

известной причине). В системном словаре есть желна, но подчёркивается желн и жёлн, так как «мн. не употр.» (БСЧ), что редко встречается у такого класса существительных (названия птиц).

Стеклъ заревомъ горитъ мой храмовидный домъ... Даже для стекл без твёрдого знака варианты стёкол или стекол не выдаются. Для храмовидный даны два варианта: «храм видный» и почему-то ромбовидный.

Но скучитъ какъ сы забава сельска намъ... Глагол скучить (в другом значении, от куча) имеется в словарях. Фразу «Это может на скучить» с лишним пробелом Word пропускает без синего подчёркивания. Для сгя исправления сия не предложено.

На отъЪздъ Императора Декабря 7 дня 1812 г.

...Но м1ръ кто умиритъ - тотъ болте душой! Выдаётся: марь, мерь, мер. Только для миръ (а это написание - слово в другом значении) Корректор выдаёт мир. Низкочастотный глагол уми-рить(ся) (РОС) в БСЧ отсутствует. Пропуск буквы «с» в различных образованиях от глагола усмирить в Word' е не будет отмечен.

Александр Николаевич РАДИЩЕВ (1749-1802). «С 1756 жил в Москве у дальнего родственника и учился у профессоров и учителей Московского университета» [1. С. 119].

Вольность (Ода)

В средине злачныя долины, / Среди тягченных жатвой нив, / Где нежны процветают крины, / Средь мирных под сеньми олив... В словаре БСЧ вариант средина (РОС) отсутствует (может получиться при нечаянном пропуске буквы). Глагола тягчить (РОС) нет в словаре БСЧ, отягчённый - более употребительное в современном языке причастие. Глагол процветать в наше время имеет другое значение. В системный словарь Word^, как можно убедиться, включено низкочастотное крин 'лилия', «книжн. поэт. устар.» (Уш.). Для сеньми первый выдаваемый программой Корректор вариант «исправления» - сенами. В РОС имеется словарная статья сен с толкованием 'монета'.

Оливной ветвию венчанно, / На твердом камени седяй... Программа Корректор предлагает: камене, камены, камену. В словаре Зализняка [7] есть слово камена 'муза'. Спеллер форму тв. падежа каменой пропускает без подчёркивания, но это написание с гораздо большей вероятностью может получиться по ошибке: «Дом находился за каменой оградой». Для седяй третьим вариантом предлагается «исправление» седи (РОС: «ден. ед.»), а словосочетание «со седи» или «седи» вместо «сиди» пропускаются без подчёркиваний. Пример: «Это мои со седи, седи тихо!»

И нощи се завесу лживой / Со треском мощно разодрав... Подчёркиваний нет. При сходстве букв «ш» и «щ» и их соседстве на клавиатуре вполне вероятна опечатка в более употребительной словоформе ноши.

...Дабы, упившися, в Афинах: «Ирой!» - зевав, могли сказать. Исправления упившись подсказка Корректор не предлагает, хотя здесь достаточно поменять одну букву. Ирой (герой) воспринимается системой как гипокористическое имя Ира в тв. падеже. Разбиение «про зевав» может пропускаться без синего подчёркивания.

Воззри на беспредельно поле, /Где стерша зверство рать стоит... Третий вариант подсказки - стера от существительного стер [7], отсутствующего даже в наиболее объёмном из цитируемых нами словарей (РОС). Таким образом, например, разбиения пробелом «ми стером», «по стерам» и «то стеров» могут быть пропущены спеллером без подчёркиваний.

...Лестей облек в взор миловидный... Подсказка Корректор-2017 для лестей первым вариантом выдаёт листей с пояснением «лист, листок, листик» (находим плей-листей в Интернете).

...Прикрыл хоть зверство добротою, / Вождаем мягкою душою... Словоформа добротой красной волнистой линией не подчёркивается - в отличие от добротою. В системном словаре Word'а нет некоторых вариантов форм существительных на «-ою/ -ею (ёю)»: враждою, листвою, судьбою, тоскою, а также пищею, струею (струёю) и др. В грамматическом словаре Зализняка, положенном в основу внутреннего словаря текстового редактора, читаем: «В данном подразделе все формы Т. ед. с окончанием -ой,

-ей или -ей имеют параллельный вариант с окончанием -ою, -ею, -ею <...> В целях сокращения этот вариант в парадигмах не выписывается. В современном языке, в отличие от языка XIX в., вариант на -ою, -ею, -ею употребляется очень редко (преимущественно в поэзии)» [7. С. 45]. Однако в системе MS Word это пояснение учитывается не во всех случаях.

...Да юноша, взалкавый славы, /Пришед на гроб мой обветша-вый, / Дабы со чувствием вещал... Подсказка-2017 не предлагает словоформ придя или пришедши. Смотрим РОС: «чувствие, -я (устар. к чувство)». Кроме того, мы видим, что ошибочное разбиение пробелом словоформы сочувствием спеллер пропустит без замечаний.

...Не совершилися судьбы... Подсказка Корректор выдаёт странные формы совёршийся и совершийся вместо совершились.

Упруга власть, собрав все мочи, / Вскатясь горе, потщится пасть... Формы мн. числа от существительного мочь в системном словаре правомерно отсутствуют, но есть родительный падеж ед. числа, а также императив мочи. Корректор-подсказка форму вска-тившись не выдаёт, так как при преобразованиях неопознанного слова для поиска похожего замена буквосочетания «ясь» на «ив-шись» в Word^ пока ещё не предусмотрена. Наречие горе: «церк.-книжн. устар.» (Уш.). Глагола потщиться (РОС) в словаре БСЧ нет. Намного более употребителен глагол потащиться, ошибочный пропуск буквы «а» в котором для пользователя может пройти незамеченным.

Василий Андреевич ЖУКОВСКИЙ (1783-1852). «С 1797 по 1800 учился в Московском благородном университетском пансионе, окончил его с серебряной медалью» [1. С. 323]. Впоследствии был избран почётным членом Общества любителей российской словесности при Императорском Московском университете.

Путешественник (песня)

...Вижу зыблемый струёю / Подле берега челнок. Ошибочное разбиение «не зыблемый» подчёркнуто не будет. Для струёю Корректор выдаёт три варианта «исправления»: струю (с пояснением: «испускаю, излучаю»), струёй и струей.

Невыразимое

Но льзя ли мёртвое в живое передать? Практически не употребляемое в наше время льзя и даже разбиение пробелом «не льзя» пропускаются спеллером без замечаний.

...Сей внемлемый одной душою / Обворожающего глас... Страдательное причастие внемлемый (от внимать) в текстовом редакторе MS Word отсутствует. В цитируемых здесь словарях этого слова тоже нет. Однако спеллер подчёркивает красным и более употребительное похожее слово влекомый (РОС), хотя в словаре Зализняка [7], положенном в основу системы, это страдательное причастие входит в состав словарной статьи влечь. Для словоформы обворожающего подсказка Корректор выдаёт единственный вариант - обваривающего.

Кубок

...Иволны спирались, и пена кипела... Глагол спирать(ся) (РОС) в словаре БСЧ отсутствует как низкочастотный.

...И хочет схватить, и разинулся рот... Возвратного глагола разинуться (РОС) в словаре БСЧ, как и в Word^, нет. Подсказка-2017 выдаёт, в частности, разонялся. Странный глагол разоняться в цитируемых в настоящей статье словарях отсутствует. Очевидно, допущена опечатка в системном словаре (но разгоняться в нём присутствует, так как не подчёркивается).

...И тайны все дна перескажешь морскова... Варианты «исправления»: «мор скова», марсова и имя собственное Москова (но Москов подчёркивается красным). Отсутствующий в словаре БСЧ

* В книге 1 (в стихотворных произведениях, в частности) используется буква «ё», но только в случаях, не противоречащих особенностям старинного произношения. Обратный пример из стихотворения Гнедича - с отсутствием «ё»: «Узреть мне дай твой лик священный, / Хоть тень свою мне дай обнять, / Чтоб, в мир духов переселенный, / Я мог и там тебя узнать!» [1. С. 350].

термин сков в РОС имеет помету «(тех.)». Разбиения «случайно» появившимся пробелом «пои сков», «спи сков», «ку сков», «но сков» или «розы сков» здесь никак не подчёркиваются.

И если уж должно быть опыту снова, / То рыцаря вышли, не пажа младова... Программа Корректор предлагает среди трёх вариантов словоформу млатов, которая в современных текстах скорее может получиться при пропуске буквы «у» в слове мулатов. Архаизма млат (т.е. молот) нет даже в весьма объёмном РОС.

Утихнула бездна... и снова шумит... Вторым вариантом выдаётся разбиение «утихнул а», но в текстах спеллер подчеркнёт в нём первое слово синим, так как перед союзом «а» он предлагает ставить запятую. Смотрим РОС: «прош. утих, утихла». Однако форма утихнул в Word'е пропускается без замечаний.

Пимен Николаевич АРАПОВ (1796-1861). «Драматург, историк театра, переводчик. Окончил Московский университетский благородный пансион, обучался на словесном отделении Московского университета, действительный член Общества любителей российской словесности при Московском университете» [2. С. 273].

Моя жертва Наполеону (Кривой коршунъ)

Случилося у совъ /Произведение чинов... Программа-подсказка, как правило, неопознанную словоформу пытается разбить на два слова. Иногда результат получается довольно забавным. Здесь второй вариант - Случилось, но третьим вариантом выдаётся «Случи лося». В слове Произведение подчёркивается только «¡» с выдачей I, ¡/, ¡п. Предложений по исправлению слова произведение со строчной буквы тоже нет.

...Кукушекъ, снигирей, воронъ и журавлевъ... Корректор-2017 первым вариантом для воронъ выдаёт императив воронь от воронить (РОС: «чернить металл, подвергаться воронению»). Таким образом, нечаянная вставка пробела в форму глагола проворонить или отсутствие последней гласной в слове вороньё могут пройти необнаруженными. Пример: «Он про воронил свой шанс, поэтому

слетелось воронь». Для словоформы журавлев без «ъ» выдаётся фамилия с прописной буквы и журавле (хотя для предложного падежа требуется какой-либо из соответствующих предлогов).

...Мнт выколятъ послтднт глазъ... Среди трёх выданных вариантов словоформы выколют нет. Для следующего слова (буква «й» после «1» здесь спеллером не подчёркивается) первым предлагается вылезший из системного словаря «подводный камень» -странная словоформа полдн (!), которая в Word'е не склоняется.

...На чемъ же пров1антъ возить? В слове пров1антъ отдельно проверяются его части: «пров» (предлагаются имя Пров, прав и деепричастие прев), «1», «антъ», для которого выдаётся: антье (отсутствующий в упоминаемых здесь словарях математический термин) и анта, анте от существительного ант, снабжённого в РОС пометой «архит.». Разбиения пробелом «практик ант», «вари ант», «диплом ант» и др. никаким цветом не подчёркиваются.

Пойдемъ къ Орлину царству! Третьим вариантом выдаётся словоформа подием от существительного подий. РОС: «подиум, устар.». Кроме того, в системном словаре есть имя собственное Орлин.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Орлы молчатъ, / Терппше хранятъ. Буква «е» после «1» здесь не подчёркивается. Получаем варианты «исправления»: Терпен (терпены - класс углеводородов), Терпни, Терпну. В системном словаре Word'а имеется глагол терпнуть (РОС), отсутствующий в нормативном словаре БСЧ. В парадигме этого глагола порождается, например, форма терпла. Отсюда следует, что опечатки в более употребительных словоформах терпела и трепла при компьютерной проверке правописания не будут отмечены.

Другие примеры из антологии «Поэзия Московского университета: от Ломоносова и до...», но не столько на архаизмы, сколько на «поэтические вольности» (лексические и грамматические особенности поэтических произведений, во многих случаях диктуемые практикой стихосложения) см. в статье [12]. Об одной из особенностей практики стихосложения было сказано следующее: «Стиховедами давно замечено, что стих фонетически плотнее, чем проза: в нем слова короче, и в равный слоговой объем их помещается больше» [13. С. 42].

На материале процитированных в настоящей работе стихотворных строчек можно также лишний раз убедиться в том, что устаревание слов не всегда связано с экстралингвистическими (историческими и пр.) причинами.

Приведём мнение известного лексиколога и лексикографа Л.П. Крысина об изъятии ряда лексем из словарей: «Устранение устаревших и периферийных для литературного языка (узкоспециальных, диалектных и т.п.) лексических значений, так же как и исключение из словаря такого рода слов, должн<о> осуществляться с осторожностью, поскольку многие несомненные для современного состояния русского языка архаизмы и раритеты встречаются в русской классической литературе XIX - первой половины ХХ в., и, следовательно, словарь может служить важным подспорьем для читателя в понимании таких единиц. Тем не менее некоторые лексемы могут быть, кажется, устранены из МАСа (Малый академический словарь. - Э.Л.) без ущерба как для правильного представления о современном состоянии русской лексики, так и для интересов читателя» [14. С. 5].

Даже авторитетные академические словари, по нашим наблюдениям, не во всех случаях снабжают устаревшие слова соответствующими пометами. Но компьютерные системы проверки правописания MS Word характеризуются полным отсутствием разделения на употребительную и низкочастотную (в современном русском языке) лексику. Нередко включение малоупотребительных устаревших слов во внутренние компьютерные словари спеллера не только не способствует, но фактически во многих случаях препятствует выполнению задачи проверки правописания для текстов пользователей.

Мы предлагаем снабжать архаизмы специальными пометами и подчёркивать не красной волнистой линией (как неопознанные цепочки букв), а каким-либо другим цветом - с выдачей программой-подсказкой этих помет и пояснений. При этом нам представляется, что на первых порах хотя бы только короткие устаревшие, узкоспециальные или просто низкочастотные слова, которые могут мешать выявлению ошибок и опечаток, было бы целесооб-

разно временно заблокировать или исключить из внутренних словарей спеллера, тем более что ошибки в коротких словах визуально легче обнаруживаются, чем в длинных.

Справедливости ради следует заметить, что многие недочёты

системы MS Word, о которых мы и другие пользователи Интерне*

та писали, в последнее время уже устранены , но к наполнению внутреннего русского системного словаря, а также к рекомендациям программы Корректор (модификация 2017 года программы-подсказки) по-прежнему остаётся много вопросов.

Автор выражает благодарность руководителю проекта «Поэзия Московского университета от Ломоносова и до...» А.В. Рафаевой за ценные замечания.

Литература

1. Поэзия Московского университета: от Ломоносова и до... Книга 1: от Михаила Ломоносова (род. 1711) до Николая Цертелева (род. 1790), включая Михаила Хераскова, Ипполита Богдановича, Дениса Фонвизина, Александра Радищева, Михаила Муравьёва, Николая Карамзина, Василия Жуковского, Николая Гнедича. М. : Водолей Publishers, 2005. 432 с.

2. Поэзия Московского университета: от Ломоносова и до. Кн. 7: от Гаврилы Державина до Виссариона Белинского, включая императрицу Елизавету, Григория Потемкина, Антона Прокоповича-Антонского, митрополита Филарета (Дроздова), Ивана Снегирева, Владимира Одоевского, Николая Гоголя, Ивана Гончарова. М. : НИВЦ МГУим. М.В. Ломоносовва - Бослен, 2016. 448 с.

3. Рафаева А.В. Концепция и перспективы сайта «Поэзия Московского университета: от Ломоносова и до...» // Информатика: проблемы, методология, технологии : материалы XVI Междунар. метод. конф. Воронеж, 2016. С. 224-227.

4. Перцов Н.В. О соотношении письменной и устной форм поэтического языка: (К вопросу о функциональной нагруженности старого русского правописания) // Вопросы языкознания. 2008. № 2. С. 30-56.

* В последних версиях Word'а из системного словаря наконец убраны некоторые низкочастотные слова, которые мешают находить ошибки. Уже нет в Word^ слова рожество (в РОС есть только Рождество). Слово поленица (РОС: толкование «богатырь») без удвоения буквы «н» тоже теперь уже подчёркивается красным (есть поленница от слова полено). При этом во внутреннем словаре спеллера остаются, например, такие слова: картеж или картёж - 'игра в карты', хотя можно сделать ошибку в слове кортеж; мыслете (РОС: «название буквы»), однако при довольно несовершенном синтаксическом контроле система может не заметить ошибки в глагольной форме мыслите.

5. Русский орфографический словарь: ок. 200 000 слов / под ред. В.В. Лопатина, О.Е. Ивановой. 4-е изд., испр. и доп. М. : АСТ-Пресс книга, 2015. 896 с.

6. Букчина Б.З., Сазонова И.К., Чельцова Л.К. Орфографический словарь русского языка. 4-е изд., испр. М. : АСТ-Пресс книга, 2008. 1296 с.

7. Зализняк А. А. Грамматический словарь русского языка: Словоизменение: ок. 110 000 слов. 6-е изд., стер. М.: АСТ-Пресс книга, 2010. 800 с.

8. Уш. - Толковый словарь русского языка (под ред. Д.Н. Ушакова) : в 4 т. М., 1935. Т. 1.

9. Лавошникова Э.К. Microsoft Word 2016 и синтаксический контроль // Современные информационные технологии и ИТ-образование. 2016. Т. 12, № 2. С. 205-210.

10. Лавошникова Э. К. «Проблемные» слова как причина пропуска ошибок при компьютерной проверке орфографии // Текст. Книга. Книгоиздание. 2017. № 15. С. 113-129.

11. Барахнин В.Б., Кожемякина О.Ю. К проблеме аутентичности фонетического анализа в связи с возможными особенностями авторской орфографии (на примере чередования окончаний -ой/-ый в лирике А. С. Пушкина) // Вестник Томского государственного университета. Филология. 2016. № 2 (40). С. 5-28.

12. Лавошникова Э. К. Вариативность в грамматике стихотворных текстов и их компьютерная коррекция (на материале антологии «Поэзия Московского уни -верситета: от Ломоносова и до...») // Текст. Книга. Книгоиздание. 2017. № 14. С. 108-122.

13. Гаспаров М.Л., Скулачёва Т.В. Односложные слова в стихе: ритм и части речи // Русский язык в научном освещении. 2003. № 1 (5). С. 35-51.

14. Крысин Л. П. Проблема обновления толковых словарей современного русского языка // Известия РАН. Серия литературы и языка. 2011. Т. 70, № 1. С. 3-9.

ARCHAISMS AND COMPUTER SPELL CHECK (ON THE MATERIAL OF THE ANTHOLOGY POETRY OF MOSCOW UNIVERSITY: FROM LOMONOSOV TO.. .)

Tekst. Kniga. Knigoizdanie - Text. Book. Publishing, 2018, 17, pp. 113-132 DOI: 10.17223/23062061/17/9

Elina K. Lavoshnikova, Lomonosov Moscow State University (Moscow, Russian Federation). E-mail: el.lavoshnikova@yandex.ru

Keywords: Microsoft Word, text editor, obsolete vocabulary, archaisms, spelling mistakes, normative spelling, old spelling, poetic texts.

The response of the text editor Microsoft Word 2016 (2017 modification) to some lexical and grammatical peculiarities of Russian poetry of the 18th-19th centuries is shown in the article on numerous examples. The examples of archaisms have been taken from the poetry of the authors who worked or studied at the Imperial University of Moscow. On March 14, 2017, the series Poetry of Moscow University: From Lomonosov to.. ., published in the MSU Research Computing Centre, Laboratory for Computational Lexicography (Lomonosov Moscow State University) was awarded

with the National Award "BEST BOOKS AND PUBLISHERS - 2016" in the nomination "Poetry" (http://www.whoiswho.ru/yearbook/yearbooks2016/). Examples from Books 1 and 7 of this anthology have been used.

This article analyzes the recommendations of the spell checker ("suggestion") on the correction of obsolete vocabulary. Furthermore, an attempt is made to identify and explain the response of Word Spell Check (which is not always appropriate) to deviations from modern Russian grammar in verses, even if they have been marked in academic dictionaries and handbooks. It is shown that the inclusion of some obsolete and low-frequency words into the internal (system) computer dictionaries sometimes not only does nothing to improve the work of the speller, but leads to skipping of errors and typos.

The operation of MS Word 2016 text editor (2017 edition) has been tested on quotes from poems by empress Elizabeth Petrovna Romanova (1709-1762), M.V. Lomonosov (1711-1765), G.R. Derzhavin (1743-1816), A.N. Radishchev (17491802), V.A. Zhukovsky (1783-1852) and P.M. Arapov (1796-1861). In the anthology Poetry of Moscow University: From Lomonosov to. . ., many poetical works starting with Book 5 are given in their original form, i.e. in old spelling and without the changes made by the Decree of 1918.

The Spell Checker suggests possible correction variants of the words underlined and unidentified by the system (no more than three options in the 2017 edition), or revision of the phrase. The suggestion is not always able to propose the normative spelling of the word, especially if it differs from the underlined one by several letters. In the list of options, words are often split by a space, without taking into account the coherence of the two resulting words.

As seen in the examples listed in the article, Word 2016 (just like the previous versions of the automatic spell checker) does not always consider the peculiarities of spelling in poetry, and does not always follow the recommendations of reputable dictionaries and reference books. Some archaic words may coincide with more common but misspelt words in the modern Russian language. In that case, Word sometimes cannot detect an error.

When considering Word's spell checker correction options, low-frequency words and proper names included into the system dictionaries are found, which sometimes only hinders the identification of errors and typos.

For justice's sake, it should be noted that many of the flaws described by the author of the article and by other Internet users, have recently been eliminated from the MS Word text editor, but the content of its Russian system dictionary and the recommendations of the Spell Checker suggesting program leave a lot of questions.

References

1. Voropaeva, G. (ed.) (2005) Poeziya Moskovskogo universiteta: ot Lomonosova i do... [Poetry of the Moscow University: from Lomonosov to ...]. Book 1. Moscow: Vodoley.

2. Pertsova, N.N. (ed.) (2016) Poeziya Moskovskogo universiteta: ot Lomonosova i do... [Poetry of the Moscow University: from Lomonosov to ...]. Book 7. Moscow: Moscow State University - Boslen.

132

3.K. flaBOWHUKOBa

3. Rafaeva, A.V. (2016) [The concept and perspectives of the site "Poetry of Moscow University: from Lomonosov to ..."]. Informatika: problemy, metodologiya, tekhnologii [Computer science: problems, methodology, technologies]. Proc. of the 16th International Conference. pp. 224-227. (In Russian).

4. Pertsov, N.V. (2008) O sootnoshenii pis'mennoy i ustnoy form poeticheskogo yazyka (K voprosu o funktsional'noy nagruzhennosti starogo russkogo pravopisaniya) [On the relations between written and oral forms of poetic language (On the question of the functional loading of the old Russian spelling)]. Voprosyyazykoznaniya. 2. pp. 30-56.

5. Lopatin, V.V. & Ivanova, O.E. (eds) (2015) Russkiy orfograficheskiy slovar' [Russian Orthographic Dictionary]. 4th ed. Moscow: AST-Press kniga.

6. Bukchina, B.Z., Sazonova, I.K. & Cheltsova, L.K. (2008) Orfograficheskiy slovar' russkogo yazyka [Orthographic Dictionary of the Russian language]. 4th ed. Moscow: AST-Press kniga.

7. Zaliznyak, A. A. (2010) Grammaticheskiy slovar' russkogo yazyka: Slovoizmenenie [Grammatical Dictionary of the Russian Language: Inflexions]. 6th ed. Moscow: AST-Press kniga.

8. Ushakov, D.N. (1935) Tolkovyy slovar' russkogo yazyka [Explanatory Dictionary of the Russian Language]. In 4 vols. Vol. 1. Moscow: OGIZ, Sovetskaya entsiklopediya.

9. Lavoshnikova, E.K. (2016) Microsoft Word 2016 i sintaksicheskiy kontrol' [Microsoft Word 2016 and syntactic control]. Sovremennye informatsionnye tekhnologii i IT-obrazovanie - Modern Information Technology and IT-education. 12(2). pp. 205-210.

10. Lavoshnikova, E.K. (2017a) Specific words as a reason for not detecting errors by computerised spell check. Tekst. Kniga. Knigoizdanie - Text. Book. Publishing. 15. pp. 113-129. (In Russian). DOI: 10.17223/23062061/15/8

11. Barakhnin, V.B. & Kozhemyakina, O.Yu. (2016) On the authenticity of the phonetic analysis in connection with the possible features of author's spelling (on the example of the alternation between the endings -oy/-yy in the lyrics of A.S. Pushkin). Vestnik Tomskogo gosudarstvennogo universiteta. Filologiya - Tomsk State University Journal of Philology. 2(40). pp. 5-28. (In Russian). DOI: 10.17223/19986645/40/1

12. Lavoshnikova, E.K. (2017b) Variability in grammar of poetic texts and their computer correction (on the material of the anthology "Poetry of Moscow University: from Lomonosov to.."). Tekst. Kniga. Knigoizdanie - Text. Book. Publishing. 14. pp. 108-122. (In Russian). DOI: 10.17223/23062061/14/7

13. Gasparov, M.L. & Skulacheva, T.V. (2003) Odnoslozhnye slova v stikhe: ritm i chasti rechi [Monosyllabic words in verse: rhythm and parts of speech]. Russkiy yazyk v nauchnom osveshchenii - Russian Language and Linguistic Theory. 1(5). pp. 35-51.

14. Krysin, L.P. (2011) Problema obnovleniya tolkovykh slovarey sovremennogo russkogo yazyka [The problem of updating explanatory dictionaries of the modern Russian language]. Izvestiya RAN. Seriya literatury iyazyka. 70(1). pp. 3-9.

i Надоели баннеры? Вы всегда можете отключить рекламу.