SCIENCE TIME
ПСИХОЛОГИЯ «ПОПУЛЯРНЫХ» ОРФОГРАФИЧЕСКИХ ОШИБОК И ИХ КОМПЬЮТЕРНАЯ КОРРЕКЦИЯ
Лавошникова Элина Константиновна, Московский государственный университет им. М.В. Ломоносова, Научно-исследовательский вычислительный центр, г. Москва
E-mail: el.lavoshnikova@yandex. ru
Аннотация. Обсуждается проблематика компьютерных систем проверки правописания и психологические причины возникновения орфографических ошибок. Даются примеры типичных и «популярных» ошибок, встречающихся не _ только у детей, но даже у достаточно образованных взрослых. Работа автокорректора (спеллера) разбирается на примере встроенного в текстовый редактор MICROSOFT WORD (версии 2003 и 2013 гг.). Даются рекомендации для разработчиков новых версий автокорректоров. Предлагается дополнять внутренние системные словари списками перечисленных в статье и подобных им слов с наиболее «популярными» ошибками и информацией об их правильном написании.
Ключевые слова: психология ошибок; компьютерная коррекция орфографии; проверка правописания; орфографические ошибки; автокорректор; спеллер; программа-подсказка; MS Word 2003; Word 2013.
Ошибки могут быть намеренными - передача неграмотной речи, дефектов произношения, а также «словесная игра», - и непроизвольными (см. работы [3; 6]). Программа-подсказка Word,овского текстового редактора (Word’ 2013, Word’ 2003 и другие версии Word’ а) часто предлагает длинный перечень вариантов исправления (особенно для коротких слов), не всегда упорядоченный по их вероятности. Можно было бы в первую очередь выдавать уже проверенные спеллером словоформы, имеющиеся в этом тексте, а также создавать и использовать списки «популярных» искажений, хотя все опечатки в нем вряд ли можно предусмотреть. Более подробно наши предложения о совершенствовании компьютерной коррекции ошибок и опечаток приведены в статьях [4; 5].
В процессе Word’ овской проверки правописания автокорректор в текстах
168
о
Щ SCIENCE TIME Щ
пользователей подчеркивает красной волнистой линией слова,
отсутствующие в его внутренних системных словарях, предполагая в них орфографические ошибки; зеленым подчеркиваются фрагменты с подозрением на неправильный синтаксис и огрехи пунктуации. Иногда зеленой волнистой линией подчеркиваются слова, употребленные не в той грамматической форме, которая требуется, или слова со стилистическими особенностями.
Далее в тексте статьи мы тоже будем подчеркивать подчеркнутые спеллером текстового редактора Word’2013 примеры.
Ниже приводятся списки слов с орфографическими ошибками, встречающимися даже у грамотных людей. Думается, что множество типичных ошибок (не опечаток) вполне обозримо.
Иногда в речи и на письме появляется лишний слог: * разбухнувший (Word’2013 предлагает вставить пробел: раз бухнувший вместо нормативного разбухший), *увянул, «нет никаких *препонов» (среди выданных программой-подсказкой нет словоформ увял, препон).
Встречается ошибочное удвоение согласной в словах: апелляция (не *аппеляция, но если жалоба озаглавлена словом «Эпиляция», что встречается в практике ЕГЭ, то спеллер в данном случае не поможет), атрибут (несмотря на англ. attribute; знание языков иногда даже «мешает»), ветреный (день, человек), гостиная, гостиница, грамотный (под влиянием слова грамматика), директриса (пишут *директрисса - как поэтесса или стюардесса), комиссариат (*коммисариат или *коммиссариат по аналогии со словом коммунизм), мороженое (но с двойным «н» следует писать в сочетаниях наподобие «мясо, долго мороженное»), мученик, оперетка (обратный случай -пишут *програмка вместо программка), поликлиника, путаница, расчетливый, расчет (часто пишут *рассчет - под влиянием написания глагола рассчитать), свежемороженый, свояченица, стела (*стелла - под влиянием слова стеллаж или имени Стелла!'), труженик.
Довольно часто в речи и на письме возникает лишняя согласная «н»: в словах дерматин, желатин, компрометировать, конкурентоспособный (в речи и на письме очень часто встречается * конкурентноспособный), констатировать (от «лат. constat известно» [1], *константировать производят от слова константа!), прецедент, пфенниг: говорят и пишут *пфеннинг или *пфенинг. Последние два варианта звучат привычнее: заметим, что слов на «-ниг» в словаре академика РАН Андрея Анатольевича Зализняка [2] с обратным алфавитным порядком (последнее слово - несовершеннолетняя) больше нет, а на «-нинг» достаточно много.
В речи и на письме может выпадать гласная, находящаяся в слабой позиции: заведующий, канцерогенный, папоротник, притолока, проволока, следующий, судорога, сутолока и др.
169
о
Щ SCIENCE TIME Щ
Можно предположить психологические причины возникновения наиболее типичных ошибок (здесь мы не говорим об опечатках). Есть стремление осмыслить и «подправить» не очень привычную морфологию слова, сделать его более понятным. Например, встречается написание * нервопатолог (пишущие и говорящие опираются на привычное слово нерв, а не neuron). При этом, однако, существует не только слово невроз (болезнь), но и нервоз (‘нервозное состояние’) [2; 7].
В искажении некоторых слов из нижеследующего перечня повинна так называемая народная этимология; другие слова искажаются по другим психологическим причинам (по аналогии и т.п.).
Примеры слов с «популярными» искажениями:
агентство, бессребреник, джентльмен, мужеложство, презумпция, пригоршня, сумасшедший учреждение (говорят и пишут *агенство, * бессеребреник или *бессеребренник, * джентельмен, *мужеложество,
*презумция, *пригорошня, *сумашедший, *учереждение: труднопроизносимые скопления согласных, особенно в речи детей и подростков, редуцируются, а в отдельных случаях для удобства произношения вопреки норме в них включается гласная);
ажитация (франц. agitation; но происходит контаминация со словом ажиотаж - и получается несуществующее слово *ажиотация),
апробировать (‘проверив, одобрить’; часто неправильное *опробировать употребляется в значении ‘опробовать’);
военачальник, солдафон (пишут и говорят * военоначальник или *военноначальник, *солдатофон: так «понятнее»);
времечко, темечко, семечко, стремечко (иногда пишут через «я», так как эти уменьшительно-ласкательные слова образованы от существительных среднего рода с окончанием «-я»; с другой стороны, *времепровождение и *времепрепровождение вместо нормативных времяпровождение и
времяпрепровождение тоже можно встретить: здесь используют
соединительную гласную «е»);
двуглавый, двугорбый (*двухглавый, *двухгорбый, - подобные слова чаще начинаются с «двух-»);
дивиденды («лат. dividendus подлежащий разделу» [1]; однако
отсутствующий в [2; 7] вариант *дивиденты встречается едва ли не чаще -звучит привычнее, так как слов на «-ент» намного больше, чем на «-енд», подтверждением может служить словарь Зализняка с обратным алфавитным порядком [2]);
дикобраз (*дикообраз - не только дети могут интерпретировать это слово как «дикий образ»);
170
о
Щ SCIENCE TIME Щ
импресарио (от итал. impresario; * импрессарио - по аналогии со словом импрессионизм),
интроверт (лат. intro - внутрь, vertere - обращать, но вспоминают слово экстраверт, вместо префикса «экс-» подставляют «ин-», и получается неправильное * интраверт; однако, с другой стороны, существуют термины интрамолекулярный, интразональный: они образованы с присоединением префикса, восходящего к латинскому intra - внутри [1]);
кондоминиум (от лат. con ‘с, вместе’ и dominium ‘владение’ [1]; искаженное *кондоминимум - «кондовый минимум»?);
меблировка (*мебелировка - образуют непосредственно от слова мебель); междоусобица (пишут неправильное *междуусобица: с приставкой «между -» звучит привычнее);
млекопитающее (‘питающее молоком’, но иногда добавляют «-ся»: говорят и пишут *млекопитающееся - по аналогии со словом из того же ряда пресмыкающееся);
нянчиться (пишут *няньчиться - исходя из написания с мягким знаком слова нянька);
перспектива, пертурбация (в этих словах труднопроизносимые скопления согласных; в ненормативных *переспектива, *перетурбация предполагается приставка «пере-»);
перфекционизм [7] (спеллер текстового редактора Word’2013 этого слова не знает, выдает «нет вариантов»; *перфектционизм - пишущие нередко вставляют «т», образуя от слова перфект);
печёнка (от сущ. печень, но собачонка пишется через букву «о»; написание таких слов может влиять друг на друга);
поскользнуться (произносят и пишут отсутствующее в словарях [2; 7] *подскользнуться, приставка «под-» с ее значением ‘внизу’ кажется здесь более подходящей);
сногсшибательный (* сногосшибательный - прилагательное содержит труднопроизносимое «гсш»; кроме того, в сложных словах предполагают присутствие соединительной гласной);
содержанка (вставляют «т», образуя от встречающегося в Интернете неологизма содержант?);
фальстарт (англ. false start; неправильное *фальшстарт, конечно, понятнее);
чрезвычайный (пишут и произносят *черезвычайный, так как полногласная приставка «через-» звучит более привычно);
электрификация, газификация (по аналогии со словами «электрочайник» и т.п. используют соединительную гласную «о»: * электрофикация, * газофикация); эликсир (пишут ошибочное *элексир под влиянием более привычных слов
171
о
Щ SCIENCE TIME Щ
элемент, электричество и т.п.);
эстрогены (*экстрагены - неоднобуквенное искажение в результате «народной этимологии»);
юрисконсульт (происходит от «лат. juris consultus правовед» [1]; но встречается ненормативное *юристконсульт или даже юрист-консульт);
яства (*явства_ - под влиянием прилагательного явственный).
Мы видим, что нередко ошибки происходят от уподобления более понятным или употребительным словам. К примеру, в одной телепередаче пожилая деревенская жительница произнесла такую фразу: «Раньше я выписывала газету "Агрументы и факты"». Можно предположить, что она привыкла к словам агроном, агротехнический и т.п.
Говорящие и пишущие иногда пытаются образовывать словоформы по более употребительным моделям, стремятся к единообразию и упрощению парадигм - совокупностей форм лексемы. Приведем пример из песни Высоцкого: «Ему ведь вовсе не нужна была чужая заграница, он пройтиться хотел по нейтральной земле» (яркий пример стилизованной авторской речи). Просторечное «пройтиться» (вместо нормативного инфинитива пройтись, которого, разумеется, нет в списке выдаваемых Word’2013 вариантов исправления) образовано по регулярной схеме: глаголов на «-иться» гораздо больше, чем на «-ись» (см. словарь [2]).
Инфинитив в парадигме глагола стоит немного «особняком». В устной речи и в текстах нередко встречается неправильно построенный инфинитив. Очень «популярны» ненормативные *бдитъ, * запечатлить, *зрить, *кишить,
*свербить, *скорбить, *смердить вместо бдеть, запечатлеть, зреть, кишеть, свербеть (малопонятное «я сверблю» автокорректор Word’2013 пропускает без подчеркиваний), скорбеть, смердеть. В этих случаях говорящие и пишущие образуют инфинитив под влиянием более частотных форм бдит, зри («Зри в корень!»), кишит, скорбим и т.п. В современном русском языке считается ненормативным написание придти (Word’2013, в отличие от Word’2003, этот вариант инфинитива прийти уже подчеркивает - красной волнистой линией). Пишут *удасться вместо удаться (здесь прослеживается влияние более употребительной формы: «если нам это удастся»).
Спряжение глагола молоть вызывает трудности. Можно встретить примерно такую фразу: «Я молю кофе в кофемолке, а она не молет» (правильно: мелю, мелет).
Исключительно популярны формы *найм и *займ при нормативных наём и заём (госзаём). Мы видим влияние косвенных (более употребительных) падежей и «выравнивание» парадигмы. Слова «найм» и «займ» настолько часто в наше время встречаются даже в речи достаточно образованных людей, что уже почти
172
о
Щ SCIENCE TIME Щ
превращаются в норму.
Заключение. Орфографические ошибки чаще всего совершаются по аналогии с более употребительными словами или в результате порождения словоформ по более регулярным моделям. Иногда в процессе освоения новой для кого-то лексики слова искажают, пытаясь сделать их «более понятными».
При разработке очередных версий автокорректоров (спеллеров) было бы целесообразным учитывать статистику употребления словоформ в текстах, в том числе и статистику ошибочного их написания, а также причины, технические и психологические, происхождения опечаток и ошибок - для их прогнозирования. Мы предлагаем дополнять компьютерные системные словари списками наиболее вероятных искажений с их исправлениями. Такие списки типичных и «популярных» ошибок будут способствовать более эффективной работе автокорректора и минимизации числа отказов в выдаче вариантов исправления при компьютерной коррекции текстов.
Литература:
1. Большой иллюстрированный словарь иностранных слов: 17 000 слов. - М.: АСТ; Астрель; Русские словари, 2002. - 960 с.
2. Зализняк А.А. Грамматический словарь русского языка: Словоизменение. Ок. 110 000 слов. - 4-е изд., испр. и доп. - М.: «Русские словари», 2003. - 800 с.
3. Лавошникова Э.К. Компьютерная коррекция орфографии и разночтения в словарях: Возможны варианты? // Фило^ОБ. - 2015. - № 24 (1). - С. 49-54.
4. Лавошникова Э.К. О «подводных камнях» в компьютерных системах проверки правописания // Вестник Московского ун-та. Серия 9: Филология. - 2002. - № 6. - С. 151-163.
5. Лавошникова Э.К. О компьютерной коррекции «популярных» ошибок в текстах на русском языке // Научно-техническая информация. Серия 2: Информационные процессы и системы. - 2003. - № 9. - С. 28-34.
6. Митрофанова О.В. Продуктивная модель текстообразования детской речи // Фило^ОБ. - 2015. - № 24 (1). - С. 60-65.
7. Русский орфографический словарь (РОС): ок. 200 000 слов / Ин-т русского языка им. В.В. Виноградова РАН; под ред. В.В. Лопатина, О.Е. Ивановой. М.: АСТ-ПРЕСС КНИГА, 2013. - 896 с.
8. Турко У.И. О вариантах новых заимствованных слов // Фило^ОБ. - 2014. - № 22 (3). - С. 66-70.
а
173