Научная статья на тему 'Психология «Популярных» орфографических ошибок и их компьютерная коррекция'

Психология «Популярных» орфографических ошибок и их компьютерная коррекция Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
674
71
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПСИХОЛОГИЯ ОШИБОК / КОМПЬЮТЕРНАЯ КОРРЕКЦИЯ ОРФОГРАФИИ / ПРОВЕРКА ПРАВОПИСАНИЯ / ОРФОГРАФИЧЕСКИЕ ОШИБКИ / АВТОКОРРЕКТОР / СПЕЛЛЕР / ПРОГРАММА-ПОДСКАЗКА / MS WORD 2003 / WORD 2013

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Лавошникова Элина Константиновна

Обсуждается проблематика компьютерных систем проверки правописания и психологические причины возникновения орфографических ошибок. Даются примеры типичных и «популярных» ошибок, встречающихся не только у детей, но даже у достаточно образованных взрослых. Работа автокорректора (спеллера) разбирается на примере встроенного в текстовый редактор MICROSOFT WORD (версии 2003 и 2013 гг.). Даются рекомендации для разработчиков новых версий автокорректоров. Предлагается дополнять внутренние системные словари списками перечисленных в статье и подобных им слов с наиболее «популярными» ошибками и информацией об их правильном написании.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Психология «Популярных» орфографических ошибок и их компьютерная коррекция»

SCIENCE TIME

ПСИХОЛОГИЯ «ПОПУЛЯРНЫХ» ОРФОГРАФИЧЕСКИХ ОШИБОК И ИХ КОМПЬЮТЕРНАЯ КОРРЕКЦИЯ

Лавошникова Элина Константиновна, Московский государственный университет им. М.В. Ломоносова, Научно-исследовательский вычислительный центр, г. Москва

E-mail: el.lavoshnikova@yandex. ru

Аннотация. Обсуждается проблематика компьютерных систем проверки правописания и психологические причины возникновения орфографических ошибок. Даются примеры типичных и «популярных» ошибок, встречающихся не _ только у детей, но даже у достаточно образованных взрослых. Работа автокорректора (спеллера) разбирается на примере встроенного в текстовый редактор MICROSOFT WORD (версии 2003 и 2013 гг.). Даются рекомендации для разработчиков новых версий автокорректоров. Предлагается дополнять внутренние системные словари списками перечисленных в статье и подобных им слов с наиболее «популярными» ошибками и информацией об их правильном написании.

Ключевые слова: психология ошибок; компьютерная коррекция орфографии; проверка правописания; орфографические ошибки; автокорректор; спеллер; программа-подсказка; MS Word 2003; Word 2013.

Ошибки могут быть намеренными - передача неграмотной речи, дефектов произношения, а также «словесная игра», - и непроизвольными (см. работы [3; 6]). Программа-подсказка Word,овского текстового редактора (Word’ 2013, Word’ 2003 и другие версии Word’ а) часто предлагает длинный перечень вариантов исправления (особенно для коротких слов), не всегда упорядоченный по их вероятности. Можно было бы в первую очередь выдавать уже проверенные спеллером словоформы, имеющиеся в этом тексте, а также создавать и использовать списки «популярных» искажений, хотя все опечатки в нем вряд ли можно предусмотреть. Более подробно наши предложения о совершенствовании компьютерной коррекции ошибок и опечаток приведены в статьях [4; 5].

В процессе Word’ овской проверки правописания автокорректор в текстах

168

о

Щ SCIENCE TIME Щ

пользователей подчеркивает красной волнистой линией слова,

отсутствующие в его внутренних системных словарях, предполагая в них орфографические ошибки; зеленым подчеркиваются фрагменты с подозрением на неправильный синтаксис и огрехи пунктуации. Иногда зеленой волнистой линией подчеркиваются слова, употребленные не в той грамматической форме, которая требуется, или слова со стилистическими особенностями.

Далее в тексте статьи мы тоже будем подчеркивать подчеркнутые спеллером текстового редактора Word’2013 примеры.

Ниже приводятся списки слов с орфографическими ошибками, встречающимися даже у грамотных людей. Думается, что множество типичных ошибок (не опечаток) вполне обозримо.

Иногда в речи и на письме появляется лишний слог: * разбухнувший (Word’2013 предлагает вставить пробел: раз бухнувший вместо нормативного разбухший), *увянул, «нет никаких *препонов» (среди выданных программой-подсказкой нет словоформ увял, препон).

Встречается ошибочное удвоение согласной в словах: апелляция (не *аппеляция, но если жалоба озаглавлена словом «Эпиляция», что встречается в практике ЕГЭ, то спеллер в данном случае не поможет), атрибут (несмотря на англ. attribute; знание языков иногда даже «мешает»), ветреный (день, человек), гостиная, гостиница, грамотный (под влиянием слова грамматика), директриса (пишут *директрисса - как поэтесса или стюардесса), комиссариат (*коммисариат или *коммиссариат по аналогии со словом коммунизм), мороженое (но с двойным «н» следует писать в сочетаниях наподобие «мясо, долго мороженное»), мученик, оперетка (обратный случай -пишут *програмка вместо программка), поликлиника, путаница, расчетливый, расчет (часто пишут *рассчет - под влиянием написания глагола рассчитать), свежемороженый, свояченица, стела (*стелла - под влиянием слова стеллаж или имени Стелла!'), труженик.

Довольно часто в речи и на письме возникает лишняя согласная «н»: в словах дерматин, желатин, компрометировать, конкурентоспособный (в речи и на письме очень часто встречается * конкурентноспособный), констатировать (от «лат. constat известно» [1], *константировать производят от слова константа!), прецедент, пфенниг: говорят и пишут *пфеннинг или *пфенинг. Последние два варианта звучат привычнее: заметим, что слов на «-ниг» в словаре академика РАН Андрея Анатольевича Зализняка [2] с обратным алфавитным порядком (последнее слово - несовершеннолетняя) больше нет, а на «-нинг» достаточно много.

В речи и на письме может выпадать гласная, находящаяся в слабой позиции: заведующий, канцерогенный, папоротник, притолока, проволока, следующий, судорога, сутолока и др.

169

о

Щ SCIENCE TIME Щ

Можно предположить психологические причины возникновения наиболее типичных ошибок (здесь мы не говорим об опечатках). Есть стремление осмыслить и «подправить» не очень привычную морфологию слова, сделать его более понятным. Например, встречается написание * нервопатолог (пишущие и говорящие опираются на привычное слово нерв, а не neuron). При этом, однако, существует не только слово невроз (болезнь), но и нервоз (‘нервозное состояние’) [2; 7].

В искажении некоторых слов из нижеследующего перечня повинна так называемая народная этимология; другие слова искажаются по другим психологическим причинам (по аналогии и т.п.).

Примеры слов с «популярными» искажениями:

агентство, бессребреник, джентльмен, мужеложство, презумпция, пригоршня, сумасшедший учреждение (говорят и пишут *агенство, * бессеребреник или *бессеребренник, * джентельмен, *мужеложество,

*презумция, *пригорошня, *сумашедший, *учереждение: труднопроизносимые скопления согласных, особенно в речи детей и подростков, редуцируются, а в отдельных случаях для удобства произношения вопреки норме в них включается гласная);

ажитация (франц. agitation; но происходит контаминация со словом ажиотаж - и получается несуществующее слово *ажиотация),

апробировать (‘проверив, одобрить’; часто неправильное *опробировать употребляется в значении ‘опробовать’);

военачальник, солдафон (пишут и говорят * военоначальник или *военноначальник, *солдатофон: так «понятнее»);

времечко, темечко, семечко, стремечко (иногда пишут через «я», так как эти уменьшительно-ласкательные слова образованы от существительных среднего рода с окончанием «-я»; с другой стороны, *времепровождение и *времепрепровождение вместо нормативных времяпровождение и

времяпрепровождение тоже можно встретить: здесь используют

соединительную гласную «е»);

двуглавый, двугорбый (*двухглавый, *двухгорбый, - подобные слова чаще начинаются с «двух-»);

дивиденды («лат. dividendus подлежащий разделу» [1]; однако

отсутствующий в [2; 7] вариант *дивиденты встречается едва ли не чаще -звучит привычнее, так как слов на «-ент» намного больше, чем на «-енд», подтверждением может служить словарь Зализняка с обратным алфавитным порядком [2]);

дикобраз (*дикообраз - не только дети могут интерпретировать это слово как «дикий образ»);

170

о

Щ SCIENCE TIME Щ

импресарио (от итал. impresario; * импрессарио - по аналогии со словом импрессионизм),

интроверт (лат. intro - внутрь, vertere - обращать, но вспоминают слово экстраверт, вместо префикса «экс-» подставляют «ин-», и получается неправильное * интраверт; однако, с другой стороны, существуют термины интрамолекулярный, интразональный: они образованы с присоединением префикса, восходящего к латинскому intra - внутри [1]);

кондоминиум (от лат. con ‘с, вместе’ и dominium ‘владение’ [1]; искаженное *кондоминимум - «кондовый минимум»?);

меблировка (*мебелировка - образуют непосредственно от слова мебель); междоусобица (пишут неправильное *междуусобица: с приставкой «между -» звучит привычнее);

млекопитающее (‘питающее молоком’, но иногда добавляют «-ся»: говорят и пишут *млекопитающееся - по аналогии со словом из того же ряда пресмыкающееся);

нянчиться (пишут *няньчиться - исходя из написания с мягким знаком слова нянька);

перспектива, пертурбация (в этих словах труднопроизносимые скопления согласных; в ненормативных *переспектива, *перетурбация предполагается приставка «пере-»);

перфекционизм [7] (спеллер текстового редактора Word’2013 этого слова не знает, выдает «нет вариантов»; *перфектционизм - пишущие нередко вставляют «т», образуя от слова перфект);

печёнка (от сущ. печень, но собачонка пишется через букву «о»; написание таких слов может влиять друг на друга);

поскользнуться (произносят и пишут отсутствующее в словарях [2; 7] *подскользнуться, приставка «под-» с ее значением ‘внизу’ кажется здесь более подходящей);

сногсшибательный (* сногосшибательный - прилагательное содержит труднопроизносимое «гсш»; кроме того, в сложных словах предполагают присутствие соединительной гласной);

содержанка (вставляют «т», образуя от встречающегося в Интернете неологизма содержант?);

фальстарт (англ. false start; неправильное *фальшстарт, конечно, понятнее);

чрезвычайный (пишут и произносят *черезвычайный, так как полногласная приставка «через-» звучит более привычно);

электрификация, газификация (по аналогии со словами «электрочайник» и т.п. используют соединительную гласную «о»: * электрофикация, * газофикация); эликсир (пишут ошибочное *элексир под влиянием более привычных слов

171

о

Щ SCIENCE TIME Щ

элемент, электричество и т.п.);

эстрогены (*экстрагены - неоднобуквенное искажение в результате «народной этимологии»);

юрисконсульт (происходит от «лат. juris consultus правовед» [1]; но встречается ненормативное *юристконсульт или даже юрист-консульт);

яства (*явства_ - под влиянием прилагательного явственный).

Мы видим, что нередко ошибки происходят от уподобления более понятным или употребительным словам. К примеру, в одной телепередаче пожилая деревенская жительница произнесла такую фразу: «Раньше я выписывала газету "Агрументы и факты"». Можно предположить, что она привыкла к словам агроном, агротехнический и т.п.

Говорящие и пишущие иногда пытаются образовывать словоформы по более употребительным моделям, стремятся к единообразию и упрощению парадигм - совокупностей форм лексемы. Приведем пример из песни Высоцкого: «Ему ведь вовсе не нужна была чужая заграница, он пройтиться хотел по нейтральной земле» (яркий пример стилизованной авторской речи). Просторечное «пройтиться» (вместо нормативного инфинитива пройтись, которого, разумеется, нет в списке выдаваемых Word’2013 вариантов исправления) образовано по регулярной схеме: глаголов на «-иться» гораздо больше, чем на «-ись» (см. словарь [2]).

Инфинитив в парадигме глагола стоит немного «особняком». В устной речи и в текстах нередко встречается неправильно построенный инфинитив. Очень «популярны» ненормативные *бдитъ, * запечатлить, *зрить, *кишить,

*свербить, *скорбить, *смердить вместо бдеть, запечатлеть, зреть, кишеть, свербеть (малопонятное «я сверблю» автокорректор Word’2013 пропускает без подчеркиваний), скорбеть, смердеть. В этих случаях говорящие и пишущие образуют инфинитив под влиянием более частотных форм бдит, зри («Зри в корень!»), кишит, скорбим и т.п. В современном русском языке считается ненормативным написание придти (Word’2013, в отличие от Word’2003, этот вариант инфинитива прийти уже подчеркивает - красной волнистой линией). Пишут *удасться вместо удаться (здесь прослеживается влияние более употребительной формы: «если нам это удастся»).

Спряжение глагола молоть вызывает трудности. Можно встретить примерно такую фразу: «Я молю кофе в кофемолке, а она не молет» (правильно: мелю, мелет).

Исключительно популярны формы *найм и *займ при нормативных наём и заём (госзаём). Мы видим влияние косвенных (более употребительных) падежей и «выравнивание» парадигмы. Слова «найм» и «займ» настолько часто в наше время встречаются даже в речи достаточно образованных людей, что уже почти

172

о

Щ SCIENCE TIME Щ

превращаются в норму.

Заключение. Орфографические ошибки чаще всего совершаются по аналогии с более употребительными словами или в результате порождения словоформ по более регулярным моделям. Иногда в процессе освоения новой для кого-то лексики слова искажают, пытаясь сделать их «более понятными».

При разработке очередных версий автокорректоров (спеллеров) было бы целесообразным учитывать статистику употребления словоформ в текстах, в том числе и статистику ошибочного их написания, а также причины, технические и психологические, происхождения опечаток и ошибок - для их прогнозирования. Мы предлагаем дополнять компьютерные системные словари списками наиболее вероятных искажений с их исправлениями. Такие списки типичных и «популярных» ошибок будут способствовать более эффективной работе автокорректора и минимизации числа отказов в выдаче вариантов исправления при компьютерной коррекции текстов.

Литература:

1. Большой иллюстрированный словарь иностранных слов: 17 000 слов. - М.: АСТ; Астрель; Русские словари, 2002. - 960 с.

2. Зализняк А.А. Грамматический словарь русского языка: Словоизменение. Ок. 110 000 слов. - 4-е изд., испр. и доп. - М.: «Русские словари», 2003. - 800 с.

3. Лавошникова Э.К. Компьютерная коррекция орфографии и разночтения в словарях: Возможны варианты? // Фило^ОБ. - 2015. - № 24 (1). - С. 49-54.

4. Лавошникова Э.К. О «подводных камнях» в компьютерных системах проверки правописания // Вестник Московского ун-та. Серия 9: Филология. - 2002. - № 6. - С. 151-163.

5. Лавошникова Э.К. О компьютерной коррекции «популярных» ошибок в текстах на русском языке // Научно-техническая информация. Серия 2: Информационные процессы и системы. - 2003. - № 9. - С. 28-34.

6. Митрофанова О.В. Продуктивная модель текстообразования детской речи // Фило^ОБ. - 2015. - № 24 (1). - С. 60-65.

7. Русский орфографический словарь (РОС): ок. 200 000 слов / Ин-т русского языка им. В.В. Виноградова РАН; под ред. В.В. Лопатина, О.Е. Ивановой. М.: АСТ-ПРЕСС КНИГА, 2013. - 896 с.

8. Турко У.И. О вариантах новых заимствованных слов // Фило^ОБ. - 2014. - № 22 (3). - С. 66-70.

а

173

i Надоели баннеры? Вы всегда можете отключить рекламу.