Научная статья на тему 'К вопросу о механизмах распознавания кириллических букв при чтении: роль типа шрифта'

К вопросу о механизмах распознавания кириллических букв при чтении: роль типа шрифта Текст научной статьи по специальности «Психологические науки»

CC BY
694
139
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЧТЕНИЕ / РАСПОЗНАВАНИЕ БУКВ / РАЗБОРЧИВОСТЬ ШРИФТА / РЕГИСТРАЦИЯ ДВИЖЕНИЙ ГЛАЗ / МЕТОДИКА НЕВИДИМОЙ ГРАНИЦЫ / READING / LETTER RECOGNITION / FONT LEGIBILITY / EYE MOVEMENTS / INVISIBLE BOUNDARY / RUSSIAN

Аннотация научной статьи по психологическим наукам, автор научной работы — Алексеева Светлана Владимировна, Добрего Александра Сергеевна, Конина Алена Артемовна, Чернова Дарья Алексеевна

Рассматривается процесс парафовеальной обработки букв кириллического алфавита с учетом типа шрифта: моноширинного и пропорционального. Исследование выявляет, что а) точность распознавания букв в изоляции значительно выше, чем в составе последовательности, независимо от типа шрифта; б) тип шрифта влияет на точность распознавания буквы в составе последовательности, но не в изоляции: пропорциональный шрифт Georgia более разборчив, чем моноширинный шрифт Courier New.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On Cyrillic Letters Recognition Mechanisms in Reading: The Role of Font Type

This article investigates processing of Cyrillic letters with regard to the font type: monospaced (Courier New) or proportional (Georgia). The aim of the experiment was to describe letter recognition mechanisms during reading by testing whether the font type influences the accuracy of letter identification. Given that visual object recognition during reading begins at the step of parafoveal processing (that is, before the eyes actually move to it), the experiment focused on identifying a letter in the parafovea. Thirty-three lowercase letters of the Russian alphabet were used in the study. We had two versions of the experiment. In the first case, these letters were crowded, that is, each of them was surrounded by asterisks "*" (for example, "*ф*"), and in the second case they were isolated (for example, "ф"). Usage of the asterisks "*" imitates a letter within a word, and therefore allows us to bring the experimental conditions closer to real reading. Forty-eight people took part in the experiment. They were asked to name the letter on the screen. The experimental design included the invisible boundary paradigm: that is, hidden lines (boundaries) are placed between a screen-centered fixation cross and a target letter, presented to the left or to the right. As soon as the subject's gaze crosses the boundary, the letter disappears. Thus, the subject does not have time to focus on the stimulus, and it is always processed in the parafovea. This parafoveal region is considered to be 2-5° of visual angle to the right and to the left of gaze fixation point. Based on previous studies, the authors have decided to show the stimuli at 5° of visual angle to the right and to the left of the fixation cross. They found that both the presentation type and the font have a significant effect on recognition accuracy (p = 0.002 and p = 0.001 respectively). It turned out that identification of crowded letters is more difficult than that of isolated ones (a well-known crowding effect), and Courier New is a much less legible font than Georgia. This can be explained by the fact that proportional letters differ from each other greater than the ones of a monospaced font. Another explanation might refer to Georgia (but not Courier New) being originally developed for reading from screen. The result shows that probably proportional fonts have more grounds to be used in experimental studies of reading, for they are more readable. More importantly, significant interaction between factors "font" and "type of presentation" was found (p = 0.002): recognition accuracy depends on font when the letter is a part of a sequence, but not when isolated. As font influences letter recognition only when this letter is masked and we know that different fonts highlight different letter features, then it can be concluded that feature-based letter recognition mechanism prevails when letter is a part of a word during reading. In contrast, isolated letters are recognized as a whole.

Текст научной работы на тему «К вопросу о механизмах распознавания кириллических букв при чтении: роль типа шрифта»

Вестник Томского государственного университета. 2019. № 438. С. 11-18. DOI: 10.17223/15617793/438/2

УДК 81'23

С.В. Алексеева, А.С. Добрего, А.А. Конина, Д.А. Чернова

К ВОПРОСУ О МЕХАНИЗМАХ РАСПОЗНАВАНИЯ КИРИЛЛИЧЕСКИХ БУКВ ПРИ ЧТЕНИИ: РОЛЬ ТИПА ШРИФТА

Исследование выполнено при поддержке гранта РНФ № 14-18-02135 «Психофизиологические и нейролингвистические аспекты процесса распознавания вербальных и невербальных паттернов».

Рассматривается процесс парафовеальной обработки букв кириллического алфавита с учетом типа шрифта: моноширинного и пропорционального. Исследование выявляет, что а) точность распознавания букв в изоляции значительно выше, чем в составе последовательности, независимо от типа шрифта; б) тип шрифта влияет на точность распознавания буквы в составе последовательности, но не в изоляции: пропорциональный шрифт Georgia более разборчив, чем моноширинный шрифт Courier New.

Ключевые слова: чтение; распознавание букв; разборчивость шрифта; регистрация движений глаз; методика невидимой границы.

Влияние шрифта на восприятие текста: история изучения

Вопрос о том, как воспринимаются при чтении типографские характеристики текста, начал исследоваться еще в первой трети XX в.: в 1929 г. Д.Г. Патерсоном и М.А. Тинкером [1] была предпринята первая попытка определить, как на скорость чтения влияет тип шрифта и размер кегля.

Что касается размера, то, по данным Патерсона и Тинкера, быстрее всего читался текст, набранный 10-м кеглем. Это касалось особенностей чтения распечатанного на бумаге текста: исследования чтения с экрана [2] выявляют, что более читаемым является кегль 12. Для детей и людей старшего возраста шрифт должен быть крупнее (14-18-й кегль) [3].

Выделяется два ключевых показателя, характеризующих шрифт: разборчивость (legibility) и читаемость (readability). Разборчивость отражает то, насколько легко или трудно распознать отдельную букву, а читаемость - насколько легко или трудно прочитать набранный данным шрифтом текст.

Степень разборчивости, например, можно оценить, фиксируя, в какой момент при постепенном ухудшении освещения или размера кегля букву станет невозможно распознать. Шрифт неразборчив, если буквы похожи друг на друга и их трудно различить. Так, для латинского алфавита показано, что нижний регистр разборчивее верхнего, потому что в нем буквы сильнее отличаются друг от друга, по этой же причине курсив несколько снижает скорость чтения по сравнению с прямым шрифтом [4]. Степень читаемости же оценивают, измеряя скорость чтения и / или качество понимания текста, набранного данным шрифтом.

Еще одним показателем может выступать субъективная оценка читающего - насколько удобным или неудобным для восприятия ему кажется шрифт. Например, в исследовании [2] шрифты Arial, Courier и Georgia были признаны самыми удобными для восприятия (по сравнению с Comic Sans, Verdana, Century Schoolbook, Tahoma) с точки зрения субъективной оценки читающих, при этом различий в скорости чте-

ния текстов, набранных этими шрифтами, не наблюдалось.

Итак, в исследованиях XX в. использовался метод субъективной оценки, замера скорости и качества понимания прочитанного. Новая эпоха в исследованиях чтения началась с появлением технологии регистрации движений глаз (айтрекинга), которая позволяет следить за тем, как люди читают в режиме реального времени. В целом движения глаз - важнейший физиологический параметр, отражающий степень когнитивной нагрузки наряду с частотой сердечных сокращений, дыханием и состоянием мозга [5].

Известен ряд базовых параметров движений глаз, таких как средняя длительность фиксации или средняя величина саккады, доля пропусков и доля возвратных движений глаз. На эти параметры оказывают влияние как лингвистические, так и типографские характеристики текста. Так, объем единовременно воспринимаемой информации (perceptual span) при чтении слева направо (например, в европейских языках) составляет 3-4 символа до точки фиксации и 14-15 символов после, а при чтении справа налево (например, в иврите), соответственно, наоборот. При этом в языках с иероглифической письменностью (например, в китайском) этот объем значительно меньше; кроме того, данный показатель сильно варьируется в зависимости от навыка чтения. Длина саккады обусловлена как лингвистическими, так и окуломоторными факторами. В частности, она зависит от средней длины слова в языке (7-9 символов в английском, 2-3 символа в китайском), - таким образом, при увеличении ширины букв окуломоторная система подстраивается под новые параметры и длина саккады в угловых градусах увеличивается [6]. Тем не менее размер и тип шрифта могут оказывать существенное влияние на эти параметры.

При регистрации движений глаз также возможен и учтен и такой параметр, как количество морганий: увеличение количества морганий в минуту может свидетельствовать об усталости читающего, и c этой точки зрения также является важным показателем для оценки удобочитаемости шрифта [7]. При чтении мелким шрифтом человек более внимательно фокусируется на тексте, в то время как текст, набранный

крупным шрифтом, бегло просматривается; при этом, поскольку за одну фиксацию захватывается меньше символов, когнитивная нагрузка на читающего с увеличением шрифта возрастает [8].

Одним из ключевых является вопрос влияния типа шрифта на особенности его восприятия. В целом различные виды шрифтов разделяются на группы по таким признакам, как наличие засечек и ширина букв. Шрифты с засечками (serif), как, например, Times New Roman или Georgia, имеют короткие перпендикулярные штрихи в конце каждого элемента буквы, а шрифты без засечек (sans serif), или так называемые гротескные шрифты, как, например, Arial или Verdana, таких штрихов не имеют. С точки зрения ширины букв шрифты подразделяются на моноширинные, как Courier или Lucida, все буквы которых имеют одинаковую ширину, и пропорциональные, как Arial или Times New Roman, в которых ширина буквы зависит от ее геометрической формы.

Большая часть исследований в области удобочитаемости шрифтов ставит задачей определить, какая из групп легче для восприятия. В большинстве работ значимой разницы в скорости между засечковыми и гротескными шрифтами обнаружить не удается: [9-11]. В исследовании [12] отличия в скорости чтения обнаружены не были, но была выявлена разница в качестве понимания прочитанного (Georgia оказался удобнее, чем Verdana). Ряд исследований обнаруживают разницу в восприятии засечковых и гротескных шрифтов при чтении в затрудненных условиях. Так, по данным [13], при низкой освещенности текст, набранный гротескным Swiss, читается значительно быстрее, чем текст, набранный шрифтом с засечками Dutch, в то время как в условиях высокой освещенности такой разницы не выявлено. В исследовании [9] показано, что засечки улучшают распознавание при обычном размере кегля, но при уменьшении размера кегля, напротив, затрудняют его. В исследовании [14] продемонстрировано, что гротескные шрифты повышают удобочитаемость текста для людей с нарушениями чтения.

Моноширинность традиционно считается фактором, ухудшающим распознаваемость шрифта, рекомендации дизайнерам [15] призывают избегать моноширинных шрифтов, хотя ряд исследований показывает, что в некоторых случаях они могут облегчить восприятие текста людям с нарушениями чтения [14]. Кроме того, моноширинный Courier традиционно используется в программировании и считается более удобным для восприятия программного кода.

Большая часть исследований чтения, проводимых с помощью метода регистрации движения глаз, ставит задачей описать влияние лингвистических (а не типографских) характеристик на особенности восприятия текста. Чаще всего в исследованиях чтения используют Courier как наиболее распространенный моноширинный шрифт, это дает возможность контролировать и число символов, и длину слова в пикселях одновременно [16-19]. Главным образом это облегчает проведение экспериментов с методикой невидимой границы [20], поскольку при подмене одного слова другим в момент пересечения взором невидимой границы не меняется длина строки.

Тем не менее влияние типа шрифта на окуломо-торные характеристики также представляет значительный интерес. Так, в исследовании [21] сравнивались показатели движений глаз при чтении текста, набранного моноширинным шрифтом Consolas и пропорциональным шрифтом Georgia. Выяснилось, что при чтении текста, набранного шрифтом Georgia, участники исследования делают более длительные фиксации, в то время как при чтении текста, набранного более «плотным» Consolas, длительность фиксаций меньше, но их количество больше. Таким образом, о преимуществе в скорости чтения говорить нельзя, однако в окуломоторном поведении читающего проявляется существенная разница.

Масштабное исследование, направленное на изучение восприятия изолированных символов для разного типа шрифтов, описано в [22]: участникам исследования предъявлялись отдельные символы разных шрифтов на две секунды с инструкцией нажать на кнопку, когда буква будет распознана. Рассматривалось три шрифта с засечками (Times, Georgia, Courier) и три шрифта без засечек (Arial, Tahoma, Verdana), регистрировались такие параметры, как диаметр зрачка, количество фиксаций, средняя длительность фиксаций, общая длительность просмотра буквы. Выяснилось, что различные типы шрифтов имеют разное влияние на окуломоторные параметры. Так, минимальный диаметр зрачка наблюдался при восприятии букв шрифта Verdana, а максимальный -Times New Roman, т.е. Verdana требует меньшей аккомодации глаза. Количество фиксаций было минимальным для шрифта Verdana и максимальным для шрифта Tahoma, т. е. наличие и отсутствие засечек не оказывает влияние на этот параметр. Средняя длительность фиксаций была минимальной для шрифта Verdana и максимальной для шрифтов Georgia и Courier - это дает основания предполагать, что символы шрифта с засечками требуют более длительных фиксаций. При этом общая длительность просмотра минимальна для Georgia и Verdana и максимальна для Times - это может объясняться тем фактом, что шрифты типа Times и Arial были изначально разработаны для чтения текста на бумаге, в то время как Georgia и Verdana разработаны специально для чтения с экрана. Исследование, предпринятое в [23], сопоставляет восприятие именно этих четырех шрифтов уже не на материале изолированных символов, а на материале текстов, и приходит к выводу, что гротескный шрифт Verdana способствует более высокой скорости чтения и меньшему количеству регрессий по сравнению с другими шрифтами и, соответственно, может быть признан наиболее удобочитаемым для латинского алфавита.

Восприятие кириллических шрифтов

В последние годы ведутся и исследования восприятия шрифтов на материале кириллического алфавита. Предпринимаются попытки оценить удобочитаемость около 20 существующих шрифтов на основе целого ряда геометрических параметров, таких как наличие и ширина засечки, контрастность, пропорци-

ональность, внутрибуквенный просвет [24, 25]. Исследуются психофизиологические особенности восприятия шрифтов различных типов (Times New Roman, Arial, Book Antiqua, Comic Sans MS) с применением методик электроэнцефалографии и регистрации движений глаз при чтении [26].

Однако исследования на материале кириллического алфавита немногочисленны, а их результаты противоречивы: часть экспериментов показала, что шрифты без засечек имеют преимущество над шрифтами с засечками в части удобства распознавания [25], в то время как другие настаивают на большей удобочитаемости шрифтов с засечками [24, 26] или не выявляют разницы в восприятии шрифтов того и другого типа [27].

Комплексное исследование, в ходе которого проверялась не только скорость, но также качество понимания и запоминания прочитанного, а также психофизиологические параметры чтения, выявило, что шрифт Times New Roman за счет наибольшей распространенности наиболее удобен для запоминания текста, а шрифт Arial наиболее удобен для смысловой передачи информации, однако вызывает утомление при длительном чтении. Наиболее подходящим для длительного чтения оказался шрифт Book Antiqua, читающийся с наибольшей скоростью и имеющий высокие показатели понимания текста. Результаты электрофизиологического исследования показали, что наиболее предпочтительной для концентрации внимания является гарнитура Times New Roman. Наихудшие значения по всем параметрам были выявлены у гарнитуры Comic Sans [26].

Таким образом, на материале кириллического алфавита проведены некоторые исследования читаемости шрифтов разных типов, но не проводилось исследование разборчивости этих шрифтов, т.е. особенностей распознавания и идентификации букв, набранных соответствующим шрифтом.

В задачу настоящего исследования входит сопоставление разборчивости моноширинного шрифта Courier New и пропорционального шрифта Georgia. Мы выбрали эти два шрифта по следующим причинам. Как сказано выше, Courier New - это самый распространенный шрифт, который используется в оку-ломоторных исследованиях чтения. Шрифт Georgia относится, как и Courier New, к шрифтам с засечками, но при этом он специально разработан для чтения с экрана [23].

Экспериментальное исследование

В рамках данного исследования был проведен эксперимент с задачей идентифицировать букву, предъявленную в парафовеальной области.

Четкость воспринимаемого изображения является максимальной лишь в небольшой области сетчатки -ее называют центральной ямкой или фовеей, - где сконцентрировано наибольшее количество светочувствительных рецепторов [28]. Фовеа соответствует области изображения размером до 2 угловых градусов зрительного поля (до 2° визуального угла) относительно точки фиксации (3-4 символа). На расстоянии

от 2 до 5° визуального угла справа и слева от точки фиксации взгляда (до 15-20 символов с каждой стороны) находится область парафовеи с менее четкой разрешающей способностью. Таким образом, в целом границы области фовеи и парафовеи составляют 10° визуального угла. За пределами этих областей начинается область периферии, где человек практически ничего не воспринимает [29, 30]. Процесс распознавания символов при чтении начинается еще на этапе парафовеальной обработки [31], следовательно, изучение распознавания букв именно в парафовеальной области может представлять существенный интерес.

В задачу эксперимента входило описание механизмов распознавания буквы, в том числе проверка гипотезы о влиянии типа шрифта на точность распознавания символа. В случае, если буква распознается как целое, шрифт не будет оказывать влияния на точность распознавания. Если же буква распознается по своим отличительным чертам, то шрифт окажется важным критерием при идентификации букв. Такой результат ожидается на основании того, что разные шрифты подчеркивают разные элементы букв: в частности, в шрифте Georgia больший акцент сделан на вертикальных элементах [32].

Кроме того, планировалось сопоставить, насколько распознавание букв в окружении (имитации слова) отличается от простой идентификации визуального объекта, т.е. является ли распознавание букв в составе символьной последовательности более сложным процессом, чем распознавание букв в изоляции.

Материал исследования

Материалом исследования были 33 строчные буквы русского алфавита. В первом случае эти буквы были предъявлены в окружении, т. е. каждая из них была окружена знаками «*» с обеих сторон (например, «*ф*», «*б*»), а во втором случае - в изоляции (например, «ф», «б»). Использование символов «*» по бокам буквы помогает получить эффект «буквы внутри слова», т. е. приблизить задачу эксперимента к обычному чтению.

Дизайн эксперимента

Одной из методик исследования идентификации букв и символов в парафовеальной области является методика невидимой границы [20]. Она состоит в следующем: по обеим сторонам от фиксационного креста, располагающегося в центре экрана, находятся невидимые линии (границы); при этом слева или справа от креста (левее или правее невидимой границы) показываются стимулы; как только взгляд участника эксперимента пересекает эту левую или правую границу, стимул исчезает. Таким образом, участник не успевает сфокусировать взгляд на стимуле, и стимул всегда обрабатывается в парафовеальной области. Считается, что эта область составляет от 2 до 5° визуального угла справа и слева от точки фиксации взгляда [30]. На основании предыдущих исследований [33] было принято решение показывать стимулы на расстоянии 5° визуального угла (справа или слева) от точки фиксации

взора. Каждая буква русского алфавита предъявлялась 10 раз, из них 5 раз по правую сторону от точки фиксации и 5 раз по левую сторону. Каждый участник исследования видел все 33 буквы русского алфавита по 10 раз, т.е. всего было 330 предъявлений.

Были созданы четыре версии эксперимента в зависимости от шрифта и условия предъявления буквы. В первой версии участники эксперимента идентифицировали буквы Georgia при показе в изоляции. Во второй версии использовался тот же шрифт, но буквы были предъявлены в окружении звездочек. Третья и четвертая версии эксперимента повторяли первую и вторую соответственно, только при этом буквы были набраны шрифтом Courier New.

Оборудование

Для проведения эксперимента использовался аппарат для регистрации движений глаз SR Research Eyelink 1 000 plus с камерой, расположенной под монитором. Участник эксперимента находился в расслабленном состоянии, голова фиксировалась специальной рамкой, позволяющей максимально точно регистрировать параметры движений глаз. Запись движений глаз шла в монокулярном режиме и чередовалась так, чтобы каждый глаз был записан по 5 раз. Положения глаз регистрировались каждые 1 мс (1/1 000 Гц). Для показа стимулов использовался монитор на базе электронно-лучевой трубки ViewSonic Graphics Series G90fB с частотой обновления картинки 120 Гц и разрешением 800*600 пикселей. Буквы были набраны 18-м кеглем черным цветом на белом фоне. Размер буквы составлял 0,65° визуального угла. Участники исследования находились на расстоянии 81 см от монитора.

Эксперимент был создан при помощи программного обеспечения Experiment Builder, разработанного в компании SR Research и поставляемого вместе с регистратором движения глаз. Исчезновение буквы происходило, когда глаза пересекали невидимую границу. Левая и правая невидимая граница располагались на расстоянии 483 и 615 пикселей от левой границы экрана соответственно. После называния появившейся буквы тем или иным участником исследования треккер создавал аудиофайл для конкретной буквы.

Участники

В эксперименте приняли участие 48 человек (10 мужчин) - по 12 в каждой из четырех групп: буквы были предъявлены либо шрифтом Georgia, либо Courier New, либо в изоляции, либо в окружении. Возраст участников исследования составлял 18-26 лет, у всех было нормальное или скорректированное до нормального зрение и высшее гуманитарное образование. Все участники были носителями русского языка, не имели заболеваний, связанных с нарушениями чтения, и не знали о цели проводимого эксперимента.

Процедура эксперимента

Перед участником эксперимента ставилась задача назвать букву, которую он увидит на экране. После

прохождения процедур калибровки регистратора движения глаз и валидации (проверки качества калибровки) участнику предлагалось пройти тренировочную сессию, в которой ему предъявлялось шесть букв для тренировки, далее начиналась основная часть эксперимента.

Участник смотрел на фиксационный крест, после чего предъявлялся стимул справа или слева от креста на расстоянии 5° визуального угла. Дизайн эксперимента предполагал наличие невидимой границы по соответственно, правой или левой границам креста, и как только участник переводил взгляд на появившийся стимул, тот исчезал и появлялась надпись «Назовите букву».

Эксперимент состоял из 10 блоков, чередующих запись правого и левого глаза. Перед каждым блоком проводились калибровка и валидация соответствующего глаза участника. В каждом блоке участнику предъявлялись 33 буквы русского алфавита, причем порядок и сторона предъявления варьировались в случайном порядке. Как только участник называл букву в микрофон, его ответ записывался и предъявлялся следующий стимул. Длительность эксперимента составляла около 40 мин.

Анализ результатов эксперимента

Для проверки ранее сформулированных гипотез о влиянии шрифта и типа предъявления на точность распознавания буквы был проведен статистический анализ с использованием смешанной логистической регрессии (GLMM), в котором зависимой переменной была точность ответа (правильно / неправильно), а независимыми переменными - способ предъявления буквы, шрифт, сторона предъявления и взаимодействие между способом предъявления и шрифтом (фиксированные эффекты). Все фиксированные эффекты были введены в модель в виде «скользящего контраста» (sliding contrast). Это было сделано для того, чтобы интерсепт (intercept) полученной модели представлял собой среднее по всем включенным в модель фиксированным эффектам. При этом в качестве исходных уровней для наших эффектов выступали: Georgia (шрифт), предъявление в окружении (способ предъявления буквы), предъявление слева (сторона предъявления).

Что касается случайных эффектов, мы начали с базовой модели, которая содержала только случайные эффекты для среднего (intercept) по каждому участнику и предъявленной букве. Далее для определения оптимальной модели мы пошли по пути «снизу вверх»: мы добавляли новый случайный эффект и сравнивали модели с разным количеством случайных эффектов при помощи отношения правдоподобия (likelihood ratio test) [34]. В итоге в нашу оптимальную модель вошли случайные эффекты для среднего (intercept) по каждому участнику и предъявленной букве, а также случайный наклон для каждого участника по стороне предъявления буквы и случайный наклон для каждой предъявленной буквы по способу предъявления и шрифту предъявления буквы.

Мы использовали язык программирования R для статистической обработки данных. Смешанные логи-

стические регрессии были построены при помощи библиотеки lmer4 [35]. Сравнение моделей проводилось при помощи функции anova.

На рис. 1 показана разница в точности идентификации изолированных букв и букв в окружении.

График был построен при помощи библиотеки ggplot2 для среды R на основе частичных эффектов (partial effects). Под частичными эффектами подра-

зумеваются результаты моделей без дисперсии, связанной со случайными факторами, а также факторами и взаимодействиями, которые были введены в модели в качестве контроля. В нашем случае таким контрольным фиксированным эффектом была сторона предъявления буквы. Выделение частичных эффектов было осуществлено при помощи функции keepef [36].

ы "ы*

Способ предъявления

Шрифт Courier New -Jt Georgia Рис. 1. Точность идентификации букв в зависимости от шрифта и способа предъявления

Было обнаружено, что и способ предъявления, и шрифт оказывают значимое влияние на точность ответа (р = 0,002 и p < 0,001 соответственно). Получается, что в окружении (средняя точность идентификации букв 65%) распознавание букв идет хуже, чем в изоляции (средняя точность идентификации букв 94%), а шрифт Courier New (средняя точность идентификации букв 69%) значительно менее разборчив, чем шрифт Georgia (средняя точность идентификации букв 87%).

Кроме того, найдено значимое взаимодействие между факторами «шрифт» и «способ предъявления» (p = 0,002). При исследовании этого взаимодействия обнаружилось, что в изоляции шрифты не отличаются в точности распознавания, в то время как в окружении ситуация обратная.

Обсуждение и выводы

Таким образом, в ходе эксперимента продемонстрировано влияние типа шрифта на распознавание букв кириллического алфавита: выявлено, что пропорциональный шрифт Georgia является более разборчивым при обработке буквенных последовательностей по сравнению с моноширинным шрифтом Courier New. Это соотносится с данными, полученными на материале латинского алфавита: так, в [22] показано, что для идентификации букв, набранных этим шрифтом, затрачивается минимальное количество времени по сравнению с другими шрифтами, а в [21] - что при чтении текста, набранного пропорциональным шрифтом Georgia, про-

изводится меньше фиксаций, чем при чтении текста, набранного моноширинным шрифтом Consolas. В данном же исследовании демонстрируется повышение не скорости, а точности распознавания букв. Указанные преимущества могут объясняться тем, что геометрически литеры пропорционального шрифта отличаются друг от друга сильнее по сравнению с моноширинным, а также тем обстоятельством, что шрифт Georgia разработан специально для чтения с электронного, а не бумажного носителя. В дальнейшем представляется целесообразным сопоставить на материале кириллического алфавита точность распознавания засечковых и гротескных пропорциональных шрифтов между собой. Кроме того, можно выдвинуть предположение о целесообразности использования пропорциональных, а не моноширинных шрифтов в экспериментальных исследованиях чтения (за исключением экспериментов с использованием методики невидимой границы) ввиду большей разборчивости пропорциональных шрифтов.

Помимо особенностей конкретных шрифтов, в эксперименте также выявлены некоторые общие закономерности визуальной обработки графем. В частности, показано, что идентификация букв в изоляции идет значительно точнее, чем в окружении, независимо от типа шрифта: это широко известный краудинг-эффект (crowding) [37]. Поскольку роль шрифта была выявлена именно при предъявлении символа в окружении, что имитирует распознавание буквы в составе слова, то можно говорить о том, что шрифт влияет на то, как буквы распознаются при чтении слов.

Результаты смешанной логистической регрессии для точности идентификации буквы

Модель

glmer(accuracy + (1 + font + exp_type

side + exp_type + font + exp_type:font. + letter) + (1 + side | s_id), data, family-binomial')

Estimate SE Z-value p

Интерсепт 1,809 0,243 7,440 <0,001

Сторона Предъявленияслева (side) 0,377 0,090 4,186 <0,001

Способ предъявленияокруж. (exp type) 2,397 0,277 8,661 <0,001

Шрифта-о^а (font) -0,932 0,307 -3,037 0,002

Способ предъявления (exp type): Шрифт (font) 1,144 0,367 3,114 0,002

Случайные эффекты:

Тип Var SD Corr

Участники (s id) (Интерсепт) 0,382 0,617

Сторона Предъявления (наклон) 0,271 0,520 0,18

Буквы (letter) Интерсепт 0,644 0,282

Шрифт (наклон) 0,619 0,272 -0,42

Способ предъявления (наклон) 0,354 0,164 0,21; -0,54

Примечание. Значимые эффекты выделены полужирным шрифтом.

Ранее при изучении точности идентификации букв латинского алфавита были получены свидетельства как в пользу того, что буквы распознаются по определенным чертам [37], так и в пользу того, что они воспринимаются как единое целое - инвариант - вне зависимости от регистра и шрифта [38]. Полученные нами на

материале кириллического алфавита данные - влияние шрифта на точность распознавания буквы в окружении, но не в изоляции - свидетельствуют о том, что при предъявлении в составе последовательности происходит анализ отдельных черт буквы, а в изоляции буква распознается как единый зрительный образ.

ЛИТЕРАТУРА

1. Paterson D.G., Tinker M.A. Studies of typographical factors influencing speed of reading. II. Size of type // Journal of Applied Psychology. 1929.

Vol. 13. P. 120-130.

2. Bernard M., Lida B., Riley S., Hackler T., Janzen K. A comparison of popular online fonts: Which size and type is best? // Usability News. 2002.

Vol. 4. P. 1-11.

3. Bernard M., Liao C., Mills M. Determining the best online font for older adults // Usability News. 2001. Vol. 3 (1).

4. Tinker M.A. Influence of simultaneous variation in size of type, width of line, and leading for newspaper type // Journal of Applied Psychology.

1963. Vol. 47 (6). P. 380-382. URL: http://dx.doi.org/10.1037/h0043573

5. Kramer A.F. Physiological metrics of mental workload: A review of recent progress // D.L. Damos (Ed.). Multiple-task performance. London :

Taylor & Francis, 1991. P. 279-328.

6. Rayner K. Eye Movements and Attention in Reading, Scene Perception, and Visual Search // Quarterly Journal of Experimental Psychology. 2009.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Vol. 62. P. 1457-1506. URL: http://dx.doi.org/10.1080/17470210902816461

7. Slattery T.J., Rayner K. The influence of text legibility on eye movements during reading // Applied Cognitive Psychology. 2010. V. 24 (8).

P. 1129-1148. URL: http://dx.doi.org/10.1002/acp.1623

8. Chu S., Paul N., Ruel L. Using eye tracking technology to examine the effectiveness of design elements on news websites // Information Design

Journal. 2009. Vol. 17 (1). P. 31-43.

9. Arditi A., Cho J. Serifs and font legibility // Vision Research. 2005. Vol. 45, is. 23. P. 2926-2933.

10. Beymer D., Russell D., Orton P. An eye tracking study of how font size and type influence online reading // People and Computers XXII: Culture, Creativity, Interaction. Proceedings of HCI 2008 : the 22nd British HCI Group annual conference. 2008. Vol. 2.

11. Perea M. Why does the APA recommend the use of serif fonts? // Psicothema. 2013. Vol. 25, № 1. P. 13-17. DOI: 10.7334/psicothema2012.141.

12. Boyarski D., Neuwirth C., Forlizzi J., Regli S.H. A study of fonts designed for screen display // CHI'98 Conference Proceedings. 1998. P. 87-94.

13. Yager D., Aquilante K., Plass R. High and low luminance letters, acuity reserve, and font effects on reading speed // Vision Research. 1998. Vol. 38. P. 2527-2531.

14. Lidwell W., Holden K., Butler J. Universal Principles of Design, Revised and Updated: 125 Ways to Enhance Usability, Influence Perception, Increase Appeal, Make Better Design Decisions, and Teach through Design. Rockport Publishers, 2010. 272 p.

15. Rello L., Baeza-Yates R. Good fonts for dyslexia. In Proceedings of the 15th International ACM SIGACCESS Conference on Computers and Accessibility (ASSETS '13). ACM, New York, 2013. DOI: 10.1145/2513383.2513447 URL: http://0-doi.acm.org. wncln.wncln. org/10.1145/2513383.2513447

16. Hautala J., Hytsnd J., Aro M. Dissociating spatial and letter-based word length effects observed in readers' eye movement patterns // Vision Research. 2011. Vol. 51 (15). P. 1719-1727. URL: https://doi.org/10.1016/j.visres.2011.05.015

17. Inhoff A.W., Eiter B., Radach R., Juhasz B. Distinct subsystems for the parafoveal processing of spatial and linguistic information during eye fixations in reading // The Quarterly Journal of Experimental Psychology. Section A. 2003. Vol. 56 (5). P. 803-827. URL: https://doi.org/10.1080/02724980244000639

18. Kliegl R., Grabner E., Rolfs M., Engbert R. Length, frequency, and predictability effects of words on eye movements in reading. European Journal of Cognitive Psychology. 2004. Vol. 16 (1-2). P. 262-284. URL: https://doi.org/10.1080/09541440340000213

19. Reingold E.M., Reichle E.D., Glaholt M.G., Sheridan H. Direct lexical control of eye movements in reading: Evidence from a survival analysis of fixation durations // Cognitive Psychology. 2012. Vol. 65 (2). P. 177-206. URL: https://doi.org/10.1016/j.cogpsych.2012.03.001

20. Rayner K. The perceptual span and peripheral cues in reading // Cognitive Psychology. 1975. Vol. 7 (1). P. 65-81. URL: https://doi.org/10.1016/0010-0285(75)90005-5

21. Rayner K., Slattery T.J., Belanger N.N. Eye movements, the perceptual span, and reading speed // Psychonomic Bulletin & Review. 2010. Vol. 17 (6). P. 834-839. DOI: 10.3758/PBR.17.6.834.

22. Banerjee J., Majumdar D., Pal M.S., Majumdar D. An eye movement study for identification of suitable font characters for presentation on a computer screen // Journal of Human Ergology. 2010. Vol. 39. P. 15-21. URL: https://doi.org/10.11183/jhe.40.47

23. Josephson S. Keeping Your Readers' Eyes on the Screen: An Eye-Tracking Study Comparing Sans Serif and Serif Typefaces // Visual Communication Quarterly. 2011. Vol. 15. P. 67-79. DOI: 10.1080/15551390801914595

24. Токарь О.В., Зильберглейт М.А., Литунов С.Н. Оценка удобочитаемости шрифта на материале официального документа // Омский научный вестник. 2009. № 2 (80). C. 246-249.

25. Васюта С.П., Хамула О.Г. Влияние скорости чтения шрифта на удобство восприятия текста в электронных изданиях // Интернет-журнал «Науковедение». 2013. Вып. 3 (16). С. 56-61.

26. Морозова Л.В., Мурин И.Н. Психофизиологическая специфика восприятия печатного шрифта // Arctic Evironmental Research. 2013. № 3. С. 76-85.

27. Akhmadeeva L., Tukhvatullin I., Veytsman B. Do serifs help in comprehension of printed text? An experiment with Cyrillic readers // Vision research. 2012. Vol. 65. P. 21-24. DOI: 10.1016/j.visres.2012.05.013.

28. Барабанщиков В.А., Жегалло А.В. Айтрекинг: Методы регистрации движений глаз в психологических исследованиях и практике. М. : Когито-центр, 2014. 128 c.

29. Rayner K. Eye movements in reading and information processing: 20 years of research // Psychological bulletin. 1998. 124 (3). P. 372-422.

30. Schotter E.R., Angele B., Rayner K. Parafoveal processing in reading // Attention, Perception, & Psychophysics. 2012. Vol. 74. P. 5-35. DOI: 10.3758/s13414-011-0219-2.

31. Rayner K., Bertera J.H. Reading without a fovea // Science. 1979. Vol. 206. P. 468-469.

32. Friedl F., Ott N., Stein B. Typography: when, who, how. Konemann, Cologne, 1998.

33. Bouma H. Visual Recognition of Isolated Lower-Case Letters. Vision Research. 1971. Vol. 11, is. 5. P. 459-474.

34. Yan M., Zhou W., Shu H., Yusupu R., Miao D., Kibgel A., Kliegl R. Eye movements guided by morphological structure: Evidence from the Uighur language // Cognition. 2014. Vol. 132 ( 2). P. 181-215.

35. Bates D., Machler M., Bolker B., Walker S. Fitting Linear Mixed-Effects Models Using lme4 // Journal of Statistical Software. 2015. Vol. 67 (1). P. 1-48. DOI: http://dx.doi.org/10.18637/jss.v067.i01.

36. Hohenstein S., Kliegl R. Semantic preview benefit during reading // Journal of Experimental Psychology: Learning, Memory, and Cognition. 2014. Vol. 40. P. 166-190.

37. Bouma H. Visual interference in the parafoveal recognition of initial and final letters of words // Vision Research. 1973. Vol. 13 (4). P. 767-782.

38. Polk T.A., Farah M.J. A simple common contexts explanation for the development of abstract letter identities // Neural Computation. 1997. Vol. 9 (6). P. 1277-1289.

Статья представлена научной редакцией «Филология» 19 сентября 2018 г.

On Cyrillic Letters Recognition Mechanisms in Reading: The Role of Font Type

Vestnik Tomskogo gosudarstvennogo universiteta - Tomsk State University Journal, 2019, 438, 11-18. DOI: 10.17223/15617793/438/2

Svetlana V. Alexeeva, Saint Petersburg State University (Saint Petersburg, Russian Federation). E-mail: [email protected] Aleksandra S. Dobrego, Saint Petersburg State University (Saint Petersburg, Russian Federation). E-mail: [email protected] Alena A. Konina, Saint Petersburg State University (Saint Petersburg, Russian Federation). E-mail: [email protected] Daria A. Chernova, Saint Petersburg State University (Saint Petersburg, Russian Federation). E-mail: [email protected] Keywords: reading; letter recognition; font legibility; eye movements; invisible boundary; Russian.

This article investigates processing of Cyrillic letters with regard to the font type: monospaced (Courier New) or proportional (Georgia). The aim of the experiment was to describe letter recognition mechanisms during reading by testing whether the font type influences the accuracy of letter identification. Given that visual object recognition during reading begins at the step of parafoveal processing (that is, before the eyes actually move to it), the experiment focused on identifying a letter in the parafovea. Thirty-three lowercase letters of the Russian alphabet were used in the study. We had two versions of the experiment. In the first case, these letters were crowded, that is, each of them was surrounded by asterisks "*" (for example, "*ф*"), and in the second case they were isolated (for example, "ф"). Usage of the asterisks "*" imitates a letter within a word, and therefore allows us to bring the experimental conditions closer to real reading. Forty-eight people took part in the experiment. They were asked to name the letter on the screen. The experimental design included the invisible boundary paradigm: that is, hidden lines (boundaries) are placed between a screen-centered fixation cross and a target letter, presented to the left or to the right. As soon as the subject's gaze crosses the boundary, the letter disappears. Thus, the subject does not have time to focus on the stimulus, and it is always processed in the parafovea. This parafoveal region is considered to be 2-5° of visual angle to the right and to the left of gaze fixation point. Based on previous studies, the authors have decided to show the stimuli at 5° of visual angle to the right and to the left of the fixation cross. They found that both the presentation type and the font have a significant effect on recognition accuracy (p = 0.002 and p = 0.001 respectively). It turned out that identification of crowded letters is more difficult than that of isolated ones (a well-known crowding effect), and Courier New is a much less legible font than Georgia. This can be explained by the fact that proportional letters differ from each other greater than the ones of a monospaced font. Another explanation might refer to Georgia (but not Courier New) being originally developed for reading from screen. The result shows that probably proportional fonts have more grounds to be used in experimental studies of reading, for they are more readable. More importantly, significant interaction between factors "font" and "type of presentation" was found (p = 0.002): recognition accuracy depends on font when the letter is a part of a sequence, but not when isolated. As font influences letter recognition only when this letter is masked and we know that different fonts highlight different letter features, then it can be concluded that feature-based letter recognition mechanism prevails when letter is a part of a word during reading. In contrast, isolated letters are recognized as a whole.

REFERENCES

1. Paterson, D.G. & Tinker, M.A. (1929) Studies of typographical factors influencing speed of reading. II. Size of type. Journal of Applied Psycholo-

gy. 13. pp. 120-130.

2. Bernard, M. et al. (2002) A comparison of popular online fonts: Which size and type is best? Usability News. 4. pp. 1-11.

3. Bernard, M., Liao, C. & Mills, M. (2001) Determining the best online font for older adults. Usability News. 3 (1).

4. Tinker, M.A. (1963) Influence of simultaneous variation in size of type, width of line, and leading for newspaper type. Journal of Applied Psychol-

ogy. 47 (6). pp. 380-382. DOI: 10.1037/h0043573

5. Kramer, A.F. (1991) Physiological metrics of mental workload: A review of recent progress. In: Damos, D.L. (ed.). Multiple-task performance.

London: Taylor & Francis.

6. Rayner, K. (2009) Eye Movements and Attention in Reading, Scene Perception, and Visual Search. Quarterly Journal of Experimental Psychology.

62. pp. 1457-1506. DOI: 10.1080/17470210902816461

7. Slattery, T.J. & Rayner, K. (2010) The influence of text legibility on eye movements during reading. Applied Cognitive Psychology. 24 (8).

pp. 1129-1148. DOI: 10.1002/acp.1623

8. Chu, S., Paul, N. & Ruel, L. (2009) Using eye tracking technology to examine the effectiveness of design elements on news websites. Information

Design Journal. 17 (1). pp. 31-43.

9. Arditi, A. & Cho, J. (2005) Serifs and font legibility. Vision Research. 45(23). pp. 2926-2933.

10. Beymer, D., Russell, D. & Orton, P. (2008) An eye tracking study of how font size and type influence online reading. People and Computers XXII: Culture, Creativity, Interaction. Proceedings of HCI 2008: the 22nd British HCI Group annual conference. Vol. 2. Swindon: British Computer Society.

11. Perea, M. (2013) Why does the APA recommend the use of serif fonts? Psicothema. 25(1). pp. 13-17. DOI: 10.7334/psicothema2012.141

12. Boyarski, D., Neuwirth, C., Forlizzi, J. & Regli, S.H. (1998) A study of fonts designed for screen display. Human Factors in Computing Systems: CHI'98 Conference Proceedings. Longman Pub. Group. pp. 87-94.

13. Yager, D., Aquilante, K. & Plass, R. (1998) High and low luminance letters, acuity reserve, and font effects on reading speed. Vision Research. 38. pp. 2527-2531.

14. Lidwell, W., Holden, K. & Butler, J. (2010) Universal Principles of Design, Revised and Updated: 125 Ways to Enhance Usability, Influence Perception, Increase Appeal, Make Better Design Decisions, and Teach through Design. Rockport Publishers.

15. Rello, L. & Baeza-Yates, R. (2013) Good fonts for dyslexia. Proceedings of the 15th International ACM SIGACCESS Conference on Computers and Accessibility (ASSETS '13). New York: ACM. [Online] Available from: http://0-doi.acm.org.wncln.wncln.0rg/10.1145/2513383.2513447. DOI: 10.1145/2513383.2513447

16. Hautala, J., Hytsnd, J. & Aro, M. (2011) Dissociating spatial and letter-based word length effects observed in readers' eye movement patterns. Vision Research. 51 (15). pp. 1719-1727. DOI: 10.1016/j.visres.2011.05.015

17. Inhoff, A.W., Eiter, B., Radach, R. & Juhasz, B. (2003) Distinct subsystems for the parafoveal processing of spatial and linguistic information during eye fixations in reading. The Quarterly Journal of Experimental Psychology. Section A. 56 (5). pp. 803-827. DOI: 10.1080/02724980244000639

18. Kliegl, R., Grabner, E., Rolfs, M. & Engbert, R. (2004) Length, frequency, and predictability effects of words on eye movements in reading. European Journal of Cognitive Psychology. 16 (1-2). pp. 262-284. DOI: 10.1080/09541440340000213

19. Reingold, E.M., Reichle, E.D., Glaholt, M.G. & Sheridan, H. (2012) Direct lexical control of eye movements in reading: Evidence from a survival analysis of fixation durations. Cognitive Psychology. 65 (2). pp. 177-206. DOI: 10.1016/j.cogpsych.2012.03.001

20. Rayner, K. (1975) The perceptual span and peripheral cues in reading. Cognitive Psychology. 7 (1). pp. 65-81. DOI: 10.1016/0010-0285(75)90005-5

21. Rayner, K., Slattery, T.J. & Belanger, N.N. (2010) Eye movements, the perceptual span, and reading speed. Psychonomic Bulletin & Review. 17 (6). pp. 834-839. DOI: 10.3758/PBR.17.6.834.

22. Banerjee, J., Majumdar, D., Pal, M.S. & Majumdar, D. (2010) An eye movement study for identification of suitable font characters for presentation on a computer screen. Journal of Human Ergology. 39. pp. 15-21. DOI: 10.11183/jhe.40.47

23. Josephson, S. (2011) Keeping Your Readers' Eyes on the Screen: An Eye-Tracking Study Comparing Sans Serif and Serif Typefaces. Visual Communication Quarterly. 15. pp. 67-79. DOI: 10.1080/15551390801914595

24. Tokar', O.V., Zil'bergleyt, M.A. & Litunov, S.N. (2009) Otsenka udobochitaemosti shrifta na materiale ofitsial'nogo dokumenta [Assessment of font readability on the material of the official document]. Omskiy nauchnyy vestnik — Omsk Scientific Bulletin. 2 (80). pp. 246-249.

25. Vasyuta, S.P. & Khamula, O.G. (2013) The influence of reading speed font easy to read in the electronic editions. Naukovedenie. 3 (16). pp. 5661. (In Russian).

26. Morozova, L.V. & Murin, I.N. (2013) Psikhofiziologicheskaya spetsifika vospriyatiya pechatnogo shrifta. Arctic Evironmental Research. 3. pp. 76-85.

27. Akhmadeeva, L., Tukhvatullin, I. & Veytsman, B. (2012) Do serifs help in comprehension of printed text? An experiment with Cyrillic readers. Vision Research. 65. pp. 21-24. DOI: 10.1016/j.visres.2012.05.013

28. Barabanshchikov, V.A. & Zhegallo, A.V. (2014) Aytreking: Metody registratsii dvizheniy glaz v psikhologicheskikh issledovaniyakh i praktike [Eye-tracking: Methods of registering eye movements in psychological research and practice]. Moscow: Kogito-tsentr.

29. Rayner, K. (1998) Eye movements in reading and information processing: 20 years of research. Psychological Bulletin. 124 (3). pp. 372-422.

30. Schotter, E.R., Angele, B. & Rayner, K. (2012) Parafoveal processing in reading. Attention, Perception, & Psychophysics. 74. pp. 5-35. DOI: 10.3758/s13414-011-0219-2

31. Rayner, K. & Bertera, J.H. (1979) Reading without a fovea. Science. 206. pp. 468-469.

32. Friedl, F., Ott, N. & Stein, B. (1998) Typography: when, who, how. Cologne: Konemann.

33. Bouma, H. (1971) Visual Recognition of Isolated Lower-Case Letters. Vision Research. 11 (5). pp. 459-474.

34. Yan, M. et al. (2014) Eye movements guided by morphological structure: Evidence from the Uighur language. Cognition. 132 (2). pp. 181-215.

35. Bates, D., Mächler, M., Bolker, B. & Walker, S. (2015) Fitting Linear Mixed-Effects Models Using lme4. Journal of Statistical Software. 67 (1). pp. 1-48. DOI: http://dx.doi.org/10.18637/jss.v067.i01

36. Hohenstein, S. & Kliegl, R. (2014) Semantic preview benefit during reading. Journal of Experimental Psychology: Learning, Memory, and Cognition. 40. pp. 166-190.

37. Bouma, H. (1973) Visual interference in the parafoveal recognition of initial and final letters of words. Vision Research. 13 (4). pp. 767-782.

38. Polk, T.A. & Farah, M.J. (1997) A simple common contexts explanation for the development of abstract letter identities. Neural Computation. 9 (6). pp. 1277-1289.

Received: 19 September 2018

i Надоели баннеры? Вы всегда можете отключить рекламу.