Научная статья на тему 'Методы автоматизированной оценки каллиграфии'

Методы автоматизированной оценки каллиграфии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
448
132
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методы автоматизированной оценки каллиграфии»

Изображение

Признаки изображения в числовом виде

БД текстовой аннотации изображений

Семантические

признаки (или текстовая аннотация)

Рис. 7. Последовательность сохранения текстовой аннотации изображения

изображения. Затем числовые признаки преобразуются в семантические. По ним формируется текстовый запрос к БД, которая хранит аннотации различных текстовых источников данных (например, страницы в Интернете), текстовых документов. Результатом поиска является список текстовых источников, которые связаны с содержанием входного изображения.

Рассмотренные механизмы поиска изображений по семантическим признакам, аннотации семантических признаков, а также механизм поиска текстовой информации по семантическим признакам изображения предоставляют широкие возможности для объединения различных методов поиска изображений и текстовой информации.

Все представленные в данной статье способы поиска основаны на использовании семантического преобразователя, от расположения которого в общей структуре поиска меняются характер поиска и, как следствие, результат.

В заключение следует отметить, что значения семантических признаков и образов достаточно

субъективны; так как признаки или образ определенного предмета у разных людей могут отличаться, результат поиска тоже является субъективным и зависит от БД семантических признаков в семантическом преобразователе. Поэтому с целью более объективного поиска возможно применение для каждой системы поиска собственной БД семантических признаков или использование в рамках одной системы нескольких БД семантических признаков. Но в таком случае увеличиваются затрачиваемые на поиск ресурсы, что существенно сказывается на производительности.

Литература

1. Colin C. Venters and Dr. Matthew Cooper. A review of content-based image retrieval systems // Joint Information Systems Committee (JISC). 01.06.2000. URL: http://www.jisc.ac.uk/media/ documents/programmes/jtap/jtap-054.pdf (дата обращения: 25.09.2010).

2. Remco C. Veltkamp and Mirela Tanase. A survey of content-based image retrieval systems // Geometry, Imaging and Virtual Environments Lab, Utrecht University, The Netherland. 08.03.2001. URL: http://www.aa-lab.cs.uu.nl/cbirsurvey/cbir-survey/ (дата обращения: 25.09.2010).

3. Marinai S. A survey of document image retrieval in digital libraries. 9th Colloque International Francophone sur l'Ecrit et le Document (CIFED 2006). 2006. URL: http://www.dsi.unifi.it/~si-mone/Papers/cifed06.pdf (дата обращения: 25.09.2010).

4. Matthew Simpson, Md Mahmudur Rahman, Dina Demner-Fushman, Sameer Antani, George R. Thoma. Text- and Content-based Approaches to Image Retrieval for the ImageCLEF 2009 Medical Retrieval Track. The Cross-Language Evaluation Forum (CLEF) 2009. URL: http://www.clef-campaign.org/2009/working_ notes/simpson-paperCLEF2009.pdf (дата обращения: 25.09.2010).

5. Бухалто А.Н. [и др.]. Нейрокомпьютеры в системах обработки изображений; [под общ. ред. Ю.В. Гуляева и А.И. Галушкина]. М.: Радиотехника, 2003. Кн 7. 192 с.

УДК 81:002

МЕТОДЫ АВТОМАТИЗИРОВАННОЙ ОЦЕНКИ КАЛЛИГРАФИИ

А.А. Демин (МГТУ им. Н.Э. Баумана, Alex@pPropis.ru)

Статья посвящена автоматизированной оценке каллиграфии, целью которой являются выявление основ формирования графического навыка письма, анализ технологических приемов первоначального обучения письму, способствующих развитию такого навыка, а также раскрытие способов корректировки почерка.

Ключевые слова: каллиграфия, кинетическое сходство, стигмаграфический метод, стенографическая сетка, метод Карстера.

В эпоху всеобщего перехода от бумажного представления информации к электронному актуальной является проблема обучения первоклассников каллиграфически правильному письму. Трудности, возникающие при овладении техникой письма, имеют разные причины: физиологические, психологические и педагогические.

Прежде всего определим понятия каллиграфии и каллиграфических ошибок.

Каллиграфия - искусство красивого письма, то есть умение писать правильным (четким) и устойчивым почерком.

Каллиграфические ошибки - нарушение пропорции элементов букв по ширине, высоте и

углу наклона. Они являются следствием несфор-мированности координации движений пальцев, кисти, предплечья и плечевого отдела руки.

Создание эффективной системы оценки каллиграфии включает в себя анализ каллиграфических ошибок, сравнительный анализ методов их выявления и исправления дефектов, то есть задача разработки методики оценки каллиграфии входит в задачу создания системы оценки каллиграфии рукописного текста как составная часть.

Классификация графических ошибок

По оценкам психологов, проблема нарушений письма и чтения одна из самых актуальных для школьного обучения, поскольку письмо и чтение из цели становятся средством дальнейшего получения знаний учащимися.

Интерес к проблемам раннего выявления, предупреждения и коррекции специфических нарушений письма (дисграфия) и чтения (дислексия) у детей обусловлен тем, что письмо как деятельность играет важную роль в жизни человека: оно стимулирует его психическое развитие, обеспечивает общеобразовательную подготовку, влияет на формирование личности.

В методике обучения учащихся каллиграфическому письму выделяются следующие графические ошибки [1].

1. Нарушение наклона в 65°, приводящее к непараллельности элементов букв и даже элементов одной буквы, часто сопровождающееся искривлением элементов (рис. 1).

Рис. 1

2. Ошибки, связанные с нарушением пропорций: вертикальных (неодинаковая высота букв или их частей); горизонтальных (неодинаковая ширина букв и их элементов); пропорций между частями букв (увеличенные или уменьшенные элементы букв) (см. рис. 2 а, б и в соответственно).

Рис. 2

3. Искажение овалов, полуовалов и других элементов, содержащих закругления, изогнутые линии, а также ошибки, связанные с несоблюдением пропорций (рис. 3).

4. Пропуск отдельных букв или замена элементов букв: вместо м - л, вместо д - а.

5. Несоблюдение строчки, переписывание через линию полей, непропорционально большие (или маленькие) интервалы между словами, недописывание строки и пр. Часты ошибки в соединениях букв.

6. Каллиграфические ошибки по кинетическому сходству: смешение букв, начертание первого элемента которых требует тождественных движений руки (см. табл.).

Кинетическое сходство букв

Ошибочный выбор последующего элемента Неправильная передача количества однородных элементов

о-а (У-Ч) п-т (П-Т)

б-д (Г-Р) х-ж (Х-Ж)

и-у л-м (Л-М)

а-д и-ш (И-Ш)

н-к (Н-К)

н-ю (Н-Ю)

л-я

Для успешного преодоления ошибок письма очень важно в каждом отдельном случае разобраться в их причинах, выбрать для исправления ошибки соответствующий прием. Так, например, преодоление ошибок первой группы требует отработки написания прямых параллельных линий с нужным наклоном к строке в 65°. Исправление ошибок второй группы требует развития глазомера, без чего невозможно соблюдение пропорций. Третья группа ошибок требует работы над кривыми линиями, над изгибами и закруглениями, над плавностью движения руки. Ошибки четвертой группы связаны с нарушениями внимания.

Алгоритмы распознавания рукописных текстов

Выделение псевдослов в контуре. Алгоритм выделения слов в данном случае назовем алгоритмом выделения псевдослов. Под ним скрывается тот факт, что на данном этапе нельзя точно определить, чем являются наборы линий, образующих изолированные подграфы (псевдослова): целыми словами, какой-либо их частью либо несколькими словами.

Выделение псевдослов производится элементарным обходом по вершинам и ребрам таких подграфов с выставлением меток на ребрах о проходе по ним, начиная с некоторой произвольной точки, и с извлечением уже пройденных кривых в отдельный контейнер текущего псевдослова. Такие обходы выполняются до тех пор, пока не будут выделены все подграфы.

Выделение символов в слове. Данная операция выполняется после выделения строк, она необходима для последующего распознавания символов. Процесс аналогичен выделению строк: выполняется горизонтальная проекция (построение гистограммы) столбцов пикселей, на которой находятся области резкого перепада числа значимых (черных) пикселей в строке; если число черных точек в предыдущем столбце было значительно меньше их числа в текущем столбце, это говорит о начале символа, и наоборот. При этом может использоваться тот же порог выделения, что и для строк. Кроме того, после выделения символа по горизонтали осуществляется его выделение и по вертикали (уточнение границ), так как его границы могут отличаться от границ всей строки. Проблема неразделимости пересекающихся в проекции символов сохраняется.

Выбор языка распознаваемых символов. Выбранный язык определяет эталоны символов, с которыми будут сравниваться распознаваемые области изображения. В более общей задаче распознавания язык должен определяться автоматически, по максимальному совпадению символов в слове. Для этого в библиотеке эталонов должны находиться символы нескольких языков. Чтобы отладить комплекс, ограничимся языком, выбранным пользователем. На этом этапе алфавит представляется в виде среднестатистического векторного изображения символов.

Непосредственное распознавание - это сравнение выделенных областей изображения с имеющимися эталонами символов и проверка результата на допустимость. Отметим следующие моменты.

• Описание распознаваемого текста после выделения областей изображения представляет собой описание узлов и их связей для символов или слов на распознаваемом изображении; библиотека эталонов состоит из эталонных изображений символов алфавита и соответствующих им кодов.

• В процессе распознавания осуществляется перебор во внешнем цикле всех выделенных символов распознаваемого текста, а во внутреннем цикле - всех эталонов, то есть каждому символу распознаваемого текста поочередно ставятся в соответствие все эталонные символы и определяется степень их совпадения.

• Для разделения букв в слове применяется цикл разбивки контура в каждом узле поочередно слева направо.

• Для повышения эффективности распознавания сначала сравнивается количество узлов, связей и их типов у символов и эталонов (чтобы не пытаться сравнивать символ «,» с эталоном «Ж») и определяется максимальная степень отклонения символов от эталонов (если для текущего сравнения она больше допустимого, символ не распознан).

• Символ считается распознанным, если есть хотя бы один эталон, степень совпадения с которым оказалась не меньше минимально допустимой. Если таких эталонов несколько, выбирается тот, с которым была достигнута наибольшая степень совпадения; если эталонов с одинаковой наибольшей степенью совпадения несколько, выбирается первый по алфавиту.

Основное преимущество метода сравнения векторов перед методом наложения состоит в том, что он учитывает совпадение распознаваемого символа и эталона по ключевым моментам (признакам символа), а не по его графической интерпретации (рис. 4). Поэтому вероятность того, что сравнение одного и того же символа с разными эталонами даст одинаковую степень совпадения, намного меньше, чем у алгоритмов сравнения печатных символов. Наконец, сам способ определения степени совпадения может во многом определять результат; в случае с методом наложения степень совпадения будет определяться по числу нулевых точек на совмещенном изображении, отнесенным к числу точек на изображении распознаваемого символа.

А

Рис. 4. Графическая интерпретация символа

Для рукописного текста метод наложения эталонов практически неприменим, так как вариантов написания символа, его наклона и искажений может существовать бесчисленное множество. В системах распознавания рукописного текста используется сравнение, как правило, с векторными объектами и их связями между собой.

Разработка методики оценки качества каллиграфии автоматизированной системой

Исходя из проведенного исследования, система оценки каллиграфии должна сочетать в себе все описанные методы, выявлять любые возможные отклонения от существующих норм письма с точностью, достаточной для объективной оценки.

На основании этого система оценки каллиграфии должна предоставлять комплекс упражнений, направленных на выявление и устранение дефектов письма:

1) оценка написания отдельных элементов букв и соединений: короткая или длинная линия, линия с закруглением внизу, прямая с петлей, овал, полуовал, линия с закруглением с двух сторон, малая петля и дополнительный элемент (две точки);

2) оценка написания отдельных букв полностью: строчных и прописных с выдерживанием угла наклона и пропорций частей;

3) оценка написания соединений двух-трех букв с акцентом на межсоединения;

4) оценка написания значащих слов и словосочетаний с выдерживанием расстояния между буквами и словами.

На каждом этапе выполнения система должна продолжать контролировать все критерии качества каллиграфии, сочетать и подбирать упражнения на основе индивидуальных результатов их выполнения каждым учеником.

Система должна оценивать выполненные упражнения с учетом отклонения от нормированного

эталона, что позволит избежать необъективной оценки.

Подытоживая, отметим, что в данной статье проанализированы методики выявления дефектов и оценки каллиграфии, а также сформулированы главные требования, предъявляемые к системе.

Основное внимание уделено анализу каллиграфических ошибок. При разработке критериев оценки принимались во внимание существующие в этой области проблемы и совокупность методов их решения.

Литература

1. Хорошилова Е.И. Характеристика специфических ошибок письма младших школьников // Начальная школа. 2001. № 7.

2. Власов А.И., Кирбабин О.Е., Шепель А.С. Методология визуального проектирования как инструмент организации поддержки учебного процесса // Новые информационные технологии и менеджмент качества (NIT&MQ'2008): матер. Меж-дунар. симпоз. М.: ЭГРИ, 2008. 219 с.

3. Цыновникова Ю.Л. Автоматизация навыка письма на этапе первичного усвоения буквенных знаков // Начальная школа. 2001. № 7.

4. Проненко Л.И. Каллиграфия для всех. М.: Книга, 1990.

5. Кудреватова Л.И. Типичные каллиграфические ошибки и их исправления // Начальная школа. 1995. № 3.

УДК 81:002

МЕТОДЫ ВИЗУАЛЬНОГО УПРАВЛЕНИЯ ПРИ РЕАЛИЗАЦИИ ПОЛЬЗОВАТЕЛЬСКИХ ИНТЕРФЕЙСОВ

Н.В. Зеновкин; А.И. Власов, к.т.н. (МГТУ им. Н.Э. Баумана, Aby2sz@gmail.com)

В статье проводится анализ существующих решений в области системы регистрации движений глаз, вырабатываются требования к системе пользовательского интерфейса на основе регистрации движений глаз. Рассматриваются основные подходы к определению точки фокусирования взгляда и математические модели поиска зрачка в видеоизображении.

Ключевые слова: регистрация движений глаз, методы визуального управления.

Для отслеживания направления взгляда используются системы, регистрирующие движения глаза. Регистрация движений глаза - это процесс либо измерения точки направления взгляда, либо регистрации движений глаз относительно головы. Регистратор движений глаз - устройство, измеряющее положение глаза и регистрирующее его движения. Регистраторы движений глаз применяются в системах визуализации, в психологии, в когнитивной лингвистике и в промышленном дизайне. Существует множество методов измерения движений глаза. Самые популярные используют видеоизображения, из которых выделяется позиция глаза, другие методы - встроенные в контактные линзы индуктивные катушки, так называемые электроокулографы [1-4].

Изучение движений глаз опередило широкое распространение компьютеров практически на сто лет (например, работы Джавала 1878 г.). В отличие от чисто визуального наблюдения за движениями глаз эти исследования были достаточно дискомфортными, так как производились методом прямого механического воздействия на роговицу. Первая система, не предусматривающая прямого контакта с глазом, была разработана в 1901 году Доджем и Клайном и использовала свет, отраженный от роговицы.

Развитие цифровой видеотехники позволило наблюдать за движением глаз в реальном времени без непосредственного физического контакта. Одним из наиболее перспективных применений такого рода систем является построение пользова-

i Надоели баннеры? Вы всегда можете отключить рекламу.