Научная статья на тему 'Использование искусственных нейронных сетей для распознавания рукописных символов'

Использование искусственных нейронных сетей для распознавания рукописных символов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
708
154
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Чанчикова Е.В., Фаворская М.Н.

Рассматриваются сверточные нейронные сети, позволяющие устранить недостатки полносвязных нейронных сетей, при распознавании рукописных символов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование искусственных нейронных сетей для распознавания рукописных символов»

Актуальные проблемы авиации и космонавтики. Информационные технологии

шинстве своем они обеспечивают формирование низкоконтрастных изображений. Поэтому основная цель методов улучшения состоит в преобразовании изображений к такому виду, что делает их более контрастными и, соответственно, более информативнее. Довольно часто на изображении присутствуют искажения в определенных локальных окрестностях, которые вызваны дифракцией света, недостатками оптических систем или расфокусировкой. Это приводит к необходимости выполнения локальных преобразований на изображении. Иными словами, такой адаптивный подход дает возможность выделить информативные участки на изображении и соответствующим образом их обработать. Изложенным требованиям отвечают методы адаптивного преобразования локального контраста. Основные шаги реализации методов адаптивного преобразования локальных контрастов следующие.

- для каждого элемента изображения Ь(ц) вычисляют значение локального контраста С(ц) в текущей окрестности W с центром в элементе с координатами (1,]);

- вычисляют локальную статистику для текущей скользящей окрестности W;

- преобразуют (усиливают) локальный контраст С(у), употребляя для этого нелинейные функции и учитывая локальную статистику текущей скользящей окрестности W;

- восстанавливают значение яркости изображения Ь'(у) с усиленным локальным контрастом.

Таким образом, метод усиления контраста с использованием функции протяженности гистограммы эффективно используется в обработке широкого класса изображений. При использовании характеристики скользящих окрестностей удается идентифицировать участки изображения по уровню контрастности и соответствующим образом на них реагировать. Благодаря этому достигается более тонкая обработка мелких деталей.

Библиографические ссылки

1. Ярославский Л. П. Введение в цифровую обработку изображений. М. : Сов. радио, 1979.

2. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М. : Техносфера, 2006.

© Фурашев Д. А., Фаворская М. Н., 2010

УДК 004.932

Е. В. Чанчикова Научный руководитель - М. Н. Фаворская Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ РУКОПИСНЫХ СИМВОЛОВ

Рассматриваются сверточные нейронные сети, позволяющие устранить недостатки полносвязных нейронных сетей, при распознавании рукописных символов.

Среди проблем перевода рукописных источников в машиночитаемый формат к наиболее сложным и трудоемким относится создание версий рукописных книг в формате электронного текста. Чтобы получить полноценный электронный текст, как правило, используется его ручной компьютерный набор с помощью специальных редакторов. Представляется, что решение указанной задачи может лежать в плоскости создания специализированных программных продуктов на основе наиболее перспективных видов современных информационных технологий. К таковым относятся технологии, при создании которых используются приемы и методы искусственного интеллекта.

В настоящее время накоплен значительный опыт разработки и внедрения интеллектуальных информационных систем, среди которых немалое место занимают системы, предназначенные для распознавания сложных в техническом отношении текстов (нечетких, загрязненных, с множеством помарок, написанных с использованием разных шрифтов), таких, как автомобильные номерные знаки, подписи технической документации. В основе таких систем, как правило, лежат нейросетевые технологии, до-

полненные алгоритмами предварительной обработки изображений (контрастирование, бинаризация, удаление посторонних фрагментов и др.) и средствами дораспознавания, включающими орфографический, синтаксический и семантический виды анализа.

В традиционной полносвязной нейронной сети имеется ряд недостатков, понижающих эффективность их работы. Прежде всего, это большой размер изображений, который может достигать нескольких сотен. Еще одним недостатком классических полносвязных сетей является то, что они игнорируют топологию входного изображения.

Сверточные сети являются одним из подвидов нейронных сетей, который в значительной мере устраняет вышеописанные недостатки полносвязных нейронных сетей и гарантирует быстрое обучение и распознавание образов. Далее будет подробно рассмотрена архитектура такой сети, особенности ее слоев и принцип действия. В основе сверточных сетей лежат три механизма, используемые для достижения инвариантности к переносу, масштабированию, незначительным искажениям: Локальное извлечение признаков. Формирование слоев в виде

Секция «Информатика и автоматизированные системы»

набора карт признаков, подвыборка, состоящая из семи слоев. Единственным недостатком сверточных сетей является их низкая, по сравнению с классическими алгоритмами, скорость обучения. Тем не менее, архитектура сверточных сетей позволяет значительно уменьшить время обучения. Поскольку первые 4 слоя не являются полносвязными, эта часть сети легко поддается распараллеливанию, и, как результат - уменьшению времени обучения.

На данный момент сверточные сети являются наилучшим алгоритмом распознавания символов с искажениями, например, так называемых СЛРТСИЛ тестов. Для решения такой задачи необходимо использовать многомодульную систему распознавания, которая использует сверточные сети, классификатор Витерби и графотрансформирующую сеть для определения отдельных символов на изображении.

© Чанчикова Е. В., Фаворская М. Н., 2010

УДК 004.94

А. А. Чунина Научный руководитель - И. М. Данилин Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

КЛАССИФИКАЦИЯ МЕТОДОВ 3Б-МОДЕЛИРОВАНИЯ ДЕРЕВЬЕВ

Изложена классификация основных методов 3Б-моделирования, описана их сущность и приведены их положительные стороны и недостатки.

Создание 3Б-объектов лесной растительности, в частности, различных пород деревьев считается одной из самых сложных задач моделирования из-за разнообразной геометрической структуры растительности и огромного количества видов. Методы моделирования делятся на две широкие категории: методы, основанные на определенных правилах построения объекта и методы, основанные на использовании исходного изображения объекта. Рассмотрим данные категории методов более подробно.

Методы, основанные на правилах построения объекта, подразделяются на контекстно-свободные детерминированные, стохастические, контекстно-зависимые и параметрические методы. Большинство из них являются фрактальными и допустима их реализация на основе ¿-систем. Основная идея Ь-систем заключается в том, что происходит постоянная перезапись элементов строки, проводя аналогию с фракталами, можно сказать, что Ь-системы оперирует со строкой символов по специальным правилам, начиная с первоначальной простой аксиомы [1]. Напрямую данный метод оказывается неприемлемым для моделирования сложных ветвящихся структур, и поэтому используются его модификации. Самым простым примером являются контекстно-свободные детерминированные Ь-системы, которые оперируют с заданными значениями угла поворота, длины шага и базисными векторами 2Б и 3Б-пространства. Более сложные стохастические Ь-системы добавляют возможность задания вероятности выполнения правила. В контекстно-зависимых Ь-системах синтаксис правил усложняется и принимает во внимание окружение заменяемого

символа. В параметрических L -системах к каждому символу добавляется параметр-переменная, позволяющий указывать величину угла поворота, длину шага и толщину линии, проверять условия для применения правила, считать количество итераций. Основным преимуществом данных методов является компактный математический аппарат и возможность моделирования роста растений с учетом биохимических процессов и окружающей среды. Однако недостатком является сложность моделирования деревьев для людей, не являющихся экспертами в данной области, из-за огромного количества специфических параметров.

В случае применения методов, основанных на использовании исходного изображения объекта, процесс моделирования можно разбить на три этапа: получение изображения объекта; сегментация лиственной массы и ее моделирование; сегментация ветвей и ствола, их моделирование [2]. Основным недостатком данных методов является их частичная автоматизация, а преимуществом - возможность реалистичного моделирования существующей в природе растительности.

Библиографический ссылки

1. Prusinkiewicz P. and Lindenmayer A. The algorithmic beauty of plants / Springer-Verlag, New York, 1990.

2. Quan L., Tan P., Zeng G., Yuan L., Wang J. and Kang S. Image-based Plant Modeling //. ACM Transactions on Graphics, Vol. 25, No. 3. 2006. Р. 599-604.

© Чунина А. А., Данилин И. М., 2010

i Надоели баннеры? Вы всегда можете отключить рекламу.