УДК 81'322.2
DOI: 10.17223/23062061/21/8
Э.К. Лавошникова
ИМЕНА СОБСТВЕННЫЕ: АНТРОПОНИМЫ И ТЕКСТОВЫЙ РЕДАКТОР MS WORD
Аннотация. Рассматриваются особенности правописания и компьютерной проверки и коррекции личных имен собственных для текстов, написанных на русском языке. Тестируется с выявлением слабых мест работа наиболее актуального на данный момент автокорректора (спеллера), встроенного в текстовый редактор Microsoft Word (версии 2016-2018 гг.). Приводятся многочисленные примеры пропуска спеллером ошибок в результате включения в системные словари текстового редактора Word некоторых имен (в том числе уменьшительных) при несовершенном синтаксическом контроле. Предлагаются меры, которые должны способствовать более эффективной работе компьютерных систем проверки правописания.
Ключевые слова: Microsoft Word, имена собственные, спеллер, компьютерная проверка правописания, грамматическая омонимия.
Введение. Рассматривается проблематика компьютерной проверки словосочетаний и фраз на русском языке, включающих антропонимы. Автор тестирует на многочисленных примерах работу с личными именами наиболее актуального автокорректора (спеллера), встроенного в текстовый редактор Microsoft Word (версии 2016-2018 гг.). Эта компьютерная система постепенно пополнялась списками имен собственных с их парадигмами . В результате многие не только полные (паспортные) имена, отчества и фамилии, но даже гипокористиче-ские (уменьшительные) имена, а также многие иностранные имена собственные, набранные кириллицей, в последних версиях Word'а при проверке правописания стали пропускаться без замечаний, т.е. без подчеркивания в качестве не опознанных системой слов.
В последнее время наметились две противоположные тенденции в употреблении прописных (заглавных) букв. Первая тенденция (более
* К примеру, несколько лет назад в системных ШоМ'овских словарях имен собственных не было имени Виссарион и даже отчества Виссарионович.
ранняя) - излишнее их использование в деловых документах. Вторая тенденция - отказ пользователей интернета, тексты которых являются материалом для наших исследований, от употребления прописных букв не только при наборе имен собственных, но иногда и в начале фразы, а также небрежное отношение к употреблению знаков препинания. Очевидные причины - нежелание пользоваться клавишей Shift (экономия времени и усилий) или просто мода. О том, как реагирует на такого рода отклонения от норм русского литературного языка (в частности, на написание имен собственных со строчной буквы) текстовый редактор MS Word, в представленной статье будет продемонстрировано на многочисленных примерах фраз с ошибками. Приводятся примеры пропуска спеллером и других разновидностей ошибок и опечаток.
Во многих случаях причиной отсутствия реакции спеллера на фразы с написанием личных имен без заглавной буквы является грамматическая омонимия. Далее будут показаны разные формы нарицательных существительных и даже формы глаголов, совпадающие с ошибочным написанием личных имен со строчной буквы, особенно гипокористических.
Последние издания (начиная с четвертого) Грамматического словаря А.А. Зализняка дополнены приложением «Имена собственные». Мы будем ссылаться на шестое издание словаря (около 110 тыс. слов) [1], в котором это приложение содержит информацию о словоизменении более 8 тысяч имен собственных. Во всех изданиях Грамматического словаря Зализняка словарные статьи расположены в инверсионном (обратном) алфавитном порядке (последнее слово основной части словаря - несовершеннолетняя). Каждое слово снабжено формализованной пометой, отсылающей к грамматическим таблицам.
Следует отметить, что словарь Зализняка (далее - ГрС) входит в список четырех словарей, грамматик и справочников, рекомендованных в 2009 г. Межведомственной комиссией по русскому языку. Кроме того, его первое издание (1977 г.) было взято за основу при разра-
* Например, все глаголы на «-ть» в словаре А.А. Зализняка собраны вместе (это предоставляет разные возможности для лингвистов-исследователей), хотя и перемежаются некоторыми вкраплениями: пять, кровать и т.п.
ботке одного из первых русских спеллеров «Орфо», «преемником» которого можно назвать текстовый редактор Microsoft Word.
Имена собственные включены далеко не в каждый орфографический словарь, но мы будем наши примеры сверять также и с довольно объемным (около 200 000 слов) 4-м изданием Русского орфографического словаря [2] (далее - РОС). Это издание имеет приложение «Список личных имен». Цитируем сноску: «В список включены в основном русские имена, наиболее распространенные в быту и встречающиеся в художественной литературе или имеющие орфографические трудности» [2. С. 873]. В приложении отдельно даны полные (паспортные) мужские имена с образуемыми от них отчествами и женские имена.
Кроме того, будем сверяться со «Словарем русских личных имен» Н.А. Петровского [3] (далее - РЛИ), содержащим не только полные личные имена и отчества, но и обширный список производных гипо-користических (уменьшительных) имен.
Красной волнистой линией при проверке правописания спеллер текстового редактора MS Word в режиме реального времени подчеркивает отдельные слова (иногда части слов при дефисном написании), отсутствующие в его системных словарях, чтобы пользователь проверил, нет ли в них ошибки или опечатки. Программа-подсказка Корректор после удаления, вставок, замен и перестановок некоторых букв в подчеркнутом слове ищет во внутренних системных словарях полученные «похожие» слова. Если находит, то выдает пользователю найденные словоформы (в последних версиях Word'а не более трех) как возможные варианты исправления неопознанного слова.
Примеры слов, подчеркиваемые системой красным, мы в настоящей статье будем тоже подчеркивать.
Синие линии в версиях Word 2016 с его модификациями 2018 г. (в версиях до Word 2013, базирующихся на основе «Орфо», - зеленые линии) отмечают предположительные погрешности синтаксического
* В словаре РЛИ много низкочастотных имен: например, в нем присутствует имя Вечеслав, которое снабжено пояснением «Стар. форма имени Вячеслав». Система Word написание Вечеслав подчеркивает красным, поскольку в ГрС (и в РОС) этого имени нет. Но такое написание с большей вероятностью может появиться в результате ошибки.
характера - пунктуационные ошибки или несогласованность словоформ в словосочетаниях. Качество проверки синтаксиса и стилистики автокорректором MS Word, к сожалению, оставляет желать лучшего, что мы увидим далее и что на многочисленных примерах показано, например, в статье [4].
Личные имена из словаря РЛИ и работа системы MS Word. В наше время некоторые вполне взрослые соотечественники стали представляться в СМИ не только полными именами без отчества, паспортными или взятыми в качестве псевдонимов, но и гипокори-стическими именами, иногда даже без фамилии. Пример: певица Ню-ша (Анна Шурочкина).
В Word'овском системном словаре имен собственных содержится большое количество «неполных» имен. Система требует их написания только с прописной буквы. Примеры: Алексашка, Алька, Гарик, Ка-тюшка, Левушка и Левушка, Луша, Марусенька, Микитка, Петруха, Санька, Стасик, Степашка, Тимоша, Шурочка. Включены имеющиеся в приложении к ГрС имена героев повести Аркадия Гайдара Чук (в РЛИ отсутствует) и Гек (РЛИ: «от имени Герасим»). Можно привести примеры пропуска опечаток из-за внесения во внутренний (системный) словарь некоторых гипокористических имен. Если пропущена буква «и» в полных именах Ксения или Лилия, то спеллер этого не заметит.
Приведем примеры фраз с опечатками, которые Word не отмечает. Левушка-красавица вышла замуж. Луша в квартире нет. Литеры Л и Д схожи между собой и расположены рядом на клавиатуре. Гек тор был известной личностью. В этой фразе - «незапланированный» пробел в имени Гектор (РЛИ: «заимств».). Чуки и носки на этой фабрике не изготавливают. Луше мы остановимся на других вопросах. В последних двух фразах - пропуск буквы.
Просторечные звательные формы Ань, Зин, Кать, Люсь система может воспринимать как родительный падеж мн. числа (ср.: «нет никаких Вовок», «у всех Зоек и Людок», «двое Витек», но Витек подчеркивается). Система пропускает без замечаний явно звательные Во-лодь, Вовк (вероятно, последнее воспринимается ею как фамилия), а звательные формы Ваньк, Зойк, Людк подчеркиваются красным. Нам представляется, что множественное число личных имен целесообразно было бы исключить из системного словаря, поскольку в текстах такие формы встречаются редко.
Иногда спеллер системы MS Word не замечает ошибочного написания имен со строчной буквы. Во многих случаях причиной отсутствия реакции (подчеркивания) со стороны текстового редактора является грамматическая омонимия.
Примерами омоформ в именительном падеже могут служить не только нарицательные вера, надежда, любовь, но и аська (в ГрС отсутствует; РОС: «сниж.»), вика, виктория, воля, гай (имя Гай есть в РЛИ), гала (как отдельное слово в ГрС и РОС не включено), галка, галька, гелий (Гелий - имя во всех трех словарях), гора, горка (Горка в РЛИ - от Егор, Георгий, Игорь и др.), горушка, груша, гулька, гуля ('голубь'), дина, домна, карп, катюша, кирка, кузька ('жук'), лавр, лада, лев, лилия, липа, лука ('изгиб'), люба (существительное в ГрС и РОС), любушка, лялька, маечка, майка, майя, максим ('пулемет'), милка, матрешка и матрешка (РЛИ: Матрешка), мишка, муза, мура, наточка, нора (РЛИ: Нора от заимств. Элеонора), норка, олимпиада , павлин, параша, паша, петрушка, рада, роза, роман, сема (но не сема), сережка (сережка), слава, славка ('птица'), соня, софа, тата (включено в ГрС, но отсутствует в РОС), татка (РОС; ГрС: «женск. к тат»), тема (ср. Тема; но тема подчеркивается), тина, тоня ('улов'), феня, филя (есть в ГрС, но отсутствует в РОС), фомка, юра (РОС; ГрС: 'юрский период' или 'косяк рыбы'), эмка ('автомобиль').
Приведем примеры фраз с ненормативным написанием имен, омонимичных нарицательным в именительном падеже (из перечисленных выше), со строчной буквы. Наш любимый сережка приехал. Умный тема промолчал. Спеллер не замечает, что нарицательные существительные в этих фразах - женского рода. Однако при совпадениях рода и одушев-
* Word подчеркивает красным слово Параолимпиада (РОС: «офиц.») и предлагает в своей «подсказке» разделение пробелом или, как и другой вариант этого слова в РОС, написание Паралимпиада без буквы «о». Цитата из статьи В.В. Лопатина: «Год назад <в 2011 г. - Э.Л.> в принятом Госдумой законе утверждены написания паралимпийский и сурдлимпийский (притом что до этого в русском языке слова эти установились в нормальном написании - параолимпийский и сурдо-олимпийский). Олимпиада превратилась таким образом в Лимпиаду, что недопустимо по всем законам словообразования, по крайней мере русского. Авторы закона (во главе с г. Грызловым) ссылаются на английские написания этих слов, принятые Международным Олимпийским комитетом и, в общем-то, вызывающие не меньшее удивление» [5. С. 142].
ленности (а также других грамматических характеристик) даже более совершенный синтаксический контроль без учета семантики не сможет выявить в пользовательских текстах ненормативное написание омонимичных нарицательным существительным имен со строчной буквы.
Расширим список примеров возможного в текстах пользователей написания имен со строчной буквы без реакции спеллера. В следующий перечень включены результаты совпадения именительного падежа антропонима, содержащегося в РЛИ, с хотя бы одним косвенным падежом или со множественным числом нарицательного существительного: агата (от агат; Агата есть в РЛИ, но с пометой «заимств.»), ада, боба (от боб; в РЛИ есть Боба, но нет иностранного Боб), валька (от валек), варвара, геля (от гель), гена, гурий, ефимка (есть существительное ефимок), жора, злата, корней, лева (ср. Лева; одно из значений слова лев - «денежная единица»), ленка (от слова ленок), лика, лора (от лор, в РОС 'врач'), люда, люка, мавра, марта, ника (в РЛИ есть уменьшительное Ника, но нет заимствованного Ник; нарицательное ник отсутствует в ГрС, но уже включено в РОС), оленька (от оленек; нет в ГрС, но имеется в РОС), поля, полюшка, райка (от раек), рая, рома, света, сева, толик (РОС: «малая толика»), толя, тома, эллина (в ГрС и РОС имя Эллина с удвоенной «л» отсутствует; в РЛИ - с пометой «редк.»), эля (от эль).
Приведем примеры фраз с неправильным синтаксисом в результате ненормативного написания имен со строчной буквы. Наша валька отличилась сегодня. Этот гена ничего не понял. Вчера дежурила люда. Ее сменила райка. Потом пришел сева. Умная поля обошла всех. Эту сказку корней Иванович Чуковский написал. Он доволен нашим герой. Она восхищается борей, колей и саней. В последней фразе получились слова борей ('северный ветер'), формы слов колея и сани. Известно, что предложный падеж требует наличия предлога. Однако в следующих фразах с нарицательными бор, вар, наст и лик спеллер не находит ошибок. Это мы предложим боре или варе. Работу дадут насте и лике.
Вместе с тем, система подчеркивает красным отсутствующее в ГрС нарицательное дуся (РОС) и ванька (есть в РОС и ГрС: «извозчик; валять ваньку»), при этом дефисное ванька-встанька пропускается без замечаний.
Примеры гипокористических имен, набираемых по небрежности пользователей со строчной буквы, совпадающих с деепричастиями
несовершенного вида и другими глагольными формами (кроме тех имен, которые омонимичны существительным): боря, борю, бори (РОС: бороть(ся); но в ГрС малоупотребительного глагола бороть нет), валя, валю, вали (валить), варя, варю, вари (варить), женя, женю, жени (женить), катя, кати (катить), коля, колю (колоть), костя (костить), лия (деепричастие от глагола лить), маня, маню (от манить; англицизм мани в ГрС и РОС отсутствует), маша, машу, маши (махать), роди (родить), таи (от таить), тая, таю (от таить и таять), тони (тонуть), юля, юлю, юли (юлить).
Приведем на эти примеры имен фразы, в которых Word пропускает без замечаний наличие предлога перед глагольной формой, получившееся при «непроизвольном» появлении пробела. Не об вали рынок! Про колю дырочку иголкой. За вари чай! Предлог перед сравнительной формой прилагательного системой Word тоже допускается. Нужно съездить к тише.
Пропуск буквы - довольно распространенная опечатка. Шурки развяжи! Шурку норки нужно тщательно осмотреть. Даш мне твою сумку? Текстовый редактор Word эти фразы пропускает без замечаний - «благодаря» включению в системный словарь гипокори-стических имен Шурка и Даша (с полной парадигмой).
Еще один пример. Прош, Кеш, прош у, не забывайте про кеш! В этой фразе специально нами вставлен пробел в слово «прошу», поэтому «прош» со строчной буквы подчеркивается красной волнистой линией - в отличие от форм имен Проша и Кеша. Написание «кеш» со строчной буквы спеллер Word^ объявляет ошибочным - вопреки рекомендациям академических словарей. В этом конкретном случае составители Word'овских системных словарей выбрали написание «кэш», более часто встречающееся в текстах пользователей интернета.
В названиях рассказа жены Льва Толстого Софьи Андреевны «Ваничка» и романа Эдуарда Лимонова «Это я, Эдичка» (написан в 1976 г.) уменьшительные имена текстовый редактор MS Word подчеркивает красной волнистой линией. Подсказка «Корректор» предлагает (наряду с Венечка и отсутствующим в РЛИ устаревшим вари-
* Написать просто «Софья Андреевна Толстая» было бы не вполне корректно. Так звали не только супругу Льва Николаевича, но и жену А.К. Толстого, а также последнюю жену Сергея Есенина - внучку Л.Н. Толстого.
антом Веничка, который спеллером воспринимается как родительный падеж нарицательного веничек) написание по современным правилам русского языка - Ванечка, но для варианта «Эдичка», как и для Эдеч-ка (последнее написание включено в РЛИ), выдает список «исправлений»: «Эдика, Удочка, Дичка».
В системных словарях Word'а имеется даже имя Лев (так себя называл Л.Н. Толстой). В РОС и в словаре РЛИ такого имени нет, а в ГрС Лев приводится как устаревший вариант имени Лев [1. С. 748].
Еще о паспортных именах. В наше время можно встретить обладательниц не только имени Ярослава (форма Ярославой не подчеркивается - значит, этот женский вариант имени Ярослав включен во внутренний словарь Word'а), но и Ярославна, которое на самом деле представляет собой стяженную форму отчества. Наверное, их родители «проходили» в школе «Слово о полку Игореве» и решили, что Ярославна - женское имя. Из статьи С.Г. Тер-Минасовой: «Приведем пример того, как ярко раскрывают имена собственные и культурную картину мира, и ее изменения. Как много говорит о социокультурном положении женщины на патриархальной Руси тот факт, что женщину называли по отчеству, а не по имени: Ярославна, жена князя Игоря. Князь был Игорь, а жена его - дочь Ярослава» [6. С. 11].
Новомодное имя Снежана отсутствует в ГрС и РЛИ, но уже имеется во внутреннем словаре Word^, а также в приложении к РОС [2. С. 880]. В системный словарь включено непопулярное мужское имя Ульян (форма Ульяном спеллером пропускается), но модного в наше время женского имени Ульяна нет - форма Ульяной подчеркивается красным.
Если имя Элина по ошибке набрать с похожей на глаз буквы З, то Word последних версий слово «Злина» не подчеркнет, поскольку в его системный словарь включен топоним Злин - название чешского города (в приложении к ГрС отсутствует). При этом гораздо более известным у нас городам Ростов-на-Дону и Ростов Великий не так повезло. Их названия Word'овским спеллером не опознаются, хотя форма ростов со строчной буквы от нарицательного рост пропускается без подчеркивания. Но наберем нарицательную форму ростов в
* Имя Элина, как и некоторые другие имена, не так давно было включено во внутренний словарь имен собственных системы MS Word.
начале фразы. Ростов больших в продаже нет. Здесь Ростов с прописной буквы по неизвестной причине подчеркивается как неопознанное слово.
Наряду с именем Дарья в новых поколениях стало встречаться написание Дария (РОС; РЛИ: «стар. форма имени Дарья»; в приложении к ГрС имени Дария нет). Существуют также проблемы с написанием имен Наталия и Наталья, София и Софья. Не все чиновники, к сожалению, признают варианты таких имен тождественными, что доставляет немало хлопот их обладательницам.
В приложении к словарю Зализняка имя Никита - не только мужское, но и женское [1. С. 747] . Читаем интервью «Золотой век был недолгим» с доктором физико-математических наук Никитой Введенской (журнал «Огонек» № 40 от 10.10.2016): «... - Никита Дмитриевна, а откуда у вас такое имя интересное? - Папа придумал. Он ждал, что родится мальчик, а поскольку умел выкидывать фортели, то назвал меня так. Это на самом деле очень мешает, так как зря привлекает внимание». Но при рождении, по нашим сведениям, будущий ученый-математик была записана в документах под именем «Наталья». В последние десятилетия некоторые родители стали давать детям по два имени, внося это в документы.
О некоторых иностранных именах. Иностранными личными именами мы будем называть только те антропонимы, которые отсутствуют как в РОС (в «Списке личных имен»), так и в словаре РЛИ [3].
В системном словаре текстового редактора содержится имя Мишель, но только со склонением в мужском роде (форма Мишелью подчеркивается красным). Однако у нас все чаще этим именем стали называть девочек. В приложении к словарю Зализняка имя Мишель склоняется не только как слово мужского, но и женского рода [1. С. 782].
Пример фразы с ошибкой в иностранном имени. Польский кинорежиссер ежи Гофман достаточно известен в нашей стране. Спеллер «не замечает», что имя Ежи (в ГрС отсутствует) набрано со строчной буквы.
Пополнение внутренних словарей системы MS Word иностранными именами и фамилиями (в написании кириллицей) иногда может
* Здесь можно вспомнить название французского фильма «Ее звали Никита» (1990).
приводить к пропуску ошибок или опечаток. Например, включение иностранного имени и фамилии Филип препятствует обнаружению ошибки в написании русского варианта Филипп. Другие примеры написания русских имен с опечатками - пропусками букв, которые спеллером не выявляются: Андре, Валери, Дени, Катрина (возможна также ошибочная перестановка букв в нарицательном существительном картина), Мари, Натали, Николя (ср. со словоформой Николая), Розали, Софи, Эмили, а также Мелани (имя Мелания в последнее время стало в РФ все чаще встречаться).
Имя Мэри может получиться при «обрезании» по невнимательности слова Мэрия, если оно набрано с прописной буквы (может находиться не только в начале фразы). А имя Мери (ГрС: «персонаж "Героя нашего времени" М. Лермонтова» [1. С. 757]) не подчеркивается, как и форма мери от нарицательного меря, мерей (РОС: «народ»).
Приведем примеры фраз с пропуском буквы. Нужно позвонить нашему дорогому Федру. Даная публикация вызвала широкий отклик. В приложении к словарю Зализняка (ГрС) содержатся имена Федра и Федр. В Word'овский системный словарь включено имя Федр, но женского имени Федра нет. Это мы можем утверждать на основании того, что форма Федрой подчеркивается, а форма Федром (может возникнуть как опечатка) пропускается без замечаний. Имя Даная (ГрС) содержится и в РЛИ тоже, но с пометой «заимств.». Целесообразность включения в лексическую базу текстового редактора этих редко встречающихся имен вызывает сомнения, так как в текстах пользователей они с большей вероятностью могут появиться в результате опечатки.
Слово неоапартеид Word 2016 подчеркивает красным, а программа-подсказка Корректор первым вариантом рекомендуемого исправления выдает разбиение «Нео апартеид». Слово «нео» со строчной буквы тоже подчеркивается как неопознанное. Из этих двух обстоятельств можно заключить, что Нео содержится в системном словаре имен собственных. Оказывается, как написано в Википедии, Нео (англ. Neo) - главный герой фильма «Матрица».
Цитата из статьи А.Д. Шмелева: «Если мы имеем дело не с общеизвестным именем собственным, то обычно используется метод практической транскрипции иноязычного имени; но существует много различных систем практической транскрипции, и разные ведомственные инструкции бывают ориентированы на разные системы. Иногда
это приводит к неразберихе, имеющей юридические последствия» [7. С. 468]. К примеру, имя Вильям в ГрС снабжено пояснением «офиц. Уильям» [1. С. 765].
В.А. Успенский задался интересным вопросом: «Когда современный принц Уэльский, наследник британской королевы Елизаветы II, да продлятся годы ее счастливого царствования, сделается королем, станет ли он Карлом III или так и останется Чарльзом?» [8. С. 488].
Заключение. К сожалению, «богатство» Word'овских системных словарей в некоторых случаях препятствует выявлению слов и фраз с ошибками и опечатками; подробнее - в наших публикациях [9, 10].
Возможно, подчеркивание правильно набранных слов может раздражать пользователей компьютерных систем или вызывать в них сомнения по поводу своей грамотности. Но самой важной задачей компьютерной коррекции правописания нам представляется обнаружение ошибок и опечаток. Лучше лишний раз подчеркнуть правильно написанное, чем пропустить без замечаний неправильное.
Включение во внутренние системные словари текстового редактора некоторых имен собственных иногда приводит к пропуску разного рода орфографических ошибок и опечаток. Кроме того, как показано выше на примерах специально построенных фраз, при недостаточно разработанном синтаксическом контроле система может не замечать ненормативного написания имен со строчной буквы.
Желательно, чтобы в системных словарях выявлялись имена собственные, которые редко встречаются в современных текстах на русском языке и которые могут совпасть с искажениями в результате достаточно вероятных ошибок и опечаток более употребительных имен или словоформ, набранных с прописной буквы. Такие «подводные камни», которые при пока еще слабо разработанной проверке сочетаний слов во фразе препятствуют эффективному исправлению ошибок и опечаток, можно либо заблокировать в системных словарях текстовых редакторов, либо снабжать особыми пометами, выдаваемыми в качестве предупреждений для пользователя.
Автор планирует продолжить работу по исследованию проблематики компьютерной проверки правописания словосочетаний и фраз с именами собственными. Теперь уже - с патронимами (отчествами и фамилиями) и с топонимами.
Литература
1. Зализняк А.А. Грамматический словарь русского языка: Словоизменение. Ок. 110 000 слов. 6-е изд., стереотип. М. : АКТ-ПРЕСС КНИГА, 2010. 800 с. (Фундаментальные словари).
2. Русский орфографический словарь: около 200 000 слов / под ред.
B.В. Лопатина, О.Е. Ивановой. 4-е изд., испр. и доп. М. : АСТ-ПРЕСС КНИГА, 2015. 896 с.
3. Петровский Н.А. Словарь русских личных имен. М. : Советская энциклопедия, 1966. 384 с.
4. Лавошникова Э.К. Microsoft Word и синтаксический контроль // Современные информационные технологии и ИТ-образование. 2016. Т. 12, № 2. С. 205-210.
5. Лопатин В.В. Проблемы информативности орфографического словаря // Вопросы культуры речи / ред. А.Д. Шмелев ; Ин-т русского языка РАН. М., 2012. С. 139-143.
6. Тер-Минасова С.Г. Имена собственные в двуязычном словаре: культурно-языковая картина мира нормы // Вестник Московского университета. Сер. 19. Лингвистика и межкультурная коммуникация. 2010. № 1. С. 9-16.
7. Шмелев А. Д. Имя собственное в речевой коммуникации: проблемы нормы // Русский язык сегодня. X Шмелевские чтения / Ин-т русского языка РАН. М., 2012. С. 462-473.
8. Успенский В.А. Труды по НЕматематике. 2-е изд., испр. и доп. : в 5 кн. Кн. 3: Языкознание. М. : ОГИ. Фонд «Математические этюды», 2013. 711 с.
9. Лавошникова Э.К. «Проблемные» слова как причина пропуска ошибок при компьютерной проверке орфографии // Текст. Книга. Книгоиздание. 2017. № 15.
C. 113-129. DOI: 10.17223/23062061/15/8
10. Лавошникова Э.К. WORD и малоупотребительная лексика в словарях текстового редактора // Вестник Томского государственного университета. 2018. № 435. С. 40-47. DOI: 10.17223/15617793/435/5
Proper Nouns: Anthroponyms and MS Word Text Editor
Tekst. Kniga. Knigoizdanie - Text. Book. Publishing, 2019, 21, pp. 143-156 DOI: 10.17223/23062061/21/8
Elina K Lavoshnikova, Lomonosov Moscow State University (Moscow, Russian Federation). E-mail: [email protected]
Keywords: Microsoft Word, proper names, proper nouns, computerized spell checking, grammatical homonymy.
The article analyzes the problem of computerized checking of Russian-language sentences written by Internet users and containing proper nouns. The author has tested the operation of a spell checker built in the Microsoft Word text editor (versions 20162018) with such texts. It is worth mentioning that this inbuilt spell-checking program uses multiple custom dictionaries that include proper names as well as their paradigms.
As seen in the examples listed in the article, some of the names added to custom dictionary (and hypocoristic forms of nouns among them) have caused omission of mistakes, especially by inadequate syntax checking. The examples have been crosschecked with two voluminous dictionaries issued by the Russian Academy of Sciences as well as with the Dictionary of Russian Personal Names. Some Internet users tend to ignore capitalization of initial letters by typing proper names, even at the beginning of sentences. Most likely, this is a result of a wish to save some time and efforts by trying to use the Shift key more rarely. Microsoft Word's reaction to these deviations from literary norms of the Russian language is not always adequate (also on some other mistake types), which is exemplified by the article. Often the reason why the spell checker does not notice a proper noun written in small case is grammatical homonymy. The article presents an extensive list of appellatives (common names) and even verbs, in different word forms, that coincide with non-capitalized anthroponyms and their diminutive (hypocoristic) forms. The author has intentionally constructed some phrases with spelling mistakes in the first word, and the spell checker did not detect them. Why? Just because the first word appeared to be one of the proper nouns from the custom dictionary. The analysis of these and other examples shows that Microsoft Word's semantic-syntactic analysis needs improvement. Addition of foreign names (written in Cyrillic alphabet) sometimes also leads to mistakes not detected by the spell checker. For example, the last name 'Philip' that is part of the built-in dictionary does not allow detecting a spelling mistake in the Russian name 'Philipp'. Other examples of writing Russian names with omitting letters: 'Valeri', 'Mari', 'Natali', 'Nicola', 'Sophi'. The article contains recommendations on how to increase the efficiency of computerized spell checking systems. The spell checker does not also detect mistakes in texts written by Internet users due to the addition of some words to the built-in dictionary. Such an-throponyms should be blocked in the built-in dictionary even if they rarely occur in contemporary texts.
References
1. Zaliznyak, A.A. (2010) Grammaticheskiy slovar' russkogo yazyka: Slovoiz-menenie [Grammar Dictionary of the Russian Language: Word Inflection]. 6th ed. Moscow: AST-Press kniga.
2. Lopatin, V.V. & Ivanova, O.E. (eds) (2015) Russkiy orfograficheskiy slovar' [Russian Orthographic Dictionary]. 4th ed. Moscow: AST-Press kniga.
3. Petrovsky, N.A. (1966) Slovar' russkikh lichnykh imen [Dictionary of Russian Proper Names]. Moscow: Sovetskaya entsiklopediya.
4. Lavoshnikova, E.K. (2016) Microsoft Word 2016 i sintaksicheskiy kontrol' [Microsoft Word 2016 and syntax verification]. Sovremennye informatsionnye tekhnologii i IT-obrazovanie - Modern Information Technologies and IT-Education. 12(2). pp. 205210.
5. Lopatin, V.V. (2012) Problemy informativnosti orfograficheskogo slovarya [Problems of informativeness of the spelling dictionary]. In: Shmelev, A.D. (ed.)
156
3.K. flaBOMHUKOBa
Voprosy kul 'tury rechi [Culture of Speech]. Moscow: Institute of the Russian Language, RAS. pp. 139-143.
6. Ter-Minasova, S.G. (2010) Imena sobstvennye v dvuyazychnom slovare: kul'turno-yazykovaya kartina mira normy [Proper names in a bilingual dictionary: Cultural and linguistic picture of the world of norms]. Vestnik Moskovskogo universiteta. Ser. 19. Lingvistika i mezhkul'turnaya kommunikatsiya - Moscow State University Bulletin. Series 19. Linguistics and intercultural communication. 1. pp. 9-16.
7. Shmelev, A.D. (2012) Imya sobstvennoe v rechevoy kommunikatsii: problemy normy [Proper names in speech communication: Problems of the norm]. In: Russkiy yazyk segodnya. X Shmelevskie chteniya [Russian language today. The Tenth Shmelev Readings]. Moscow: Institute of the Russian Language, RAS. pp. 462-473.
8. Uspensky, V.A. (2013) Trudy po NEmatematike. V 5 knigakh [Works on Non-mathematics. In 5 Books]. Book 3. Moscow: Matematicheskie etyudy.
9. Lavoshnikova, E.K. (2017) Specific words as a reason for not detecting errors by computerized spell check. Tekst. Kniga. Knigoizdanie - Text. Book. Publishing. 15. pp. 113-129. (In Russian). DOI: 10.17223/23062061/15/8
10. Lavoshnikova, E.K. (2018) Word and low frequency vocabulary in dictionaries of the text editor. Vestnik Tomskogo gosudarstvennogo universiteta - Tomsk State University Journal. 435. pp. 40-47. (In Russian). DOI: 10.17223/15617793/435/5