Секция безопасности информационных технологий
поступлении факсимильного сообщения выбирает запись из базы данных, содержащую признаки наиболее похожего фрагмента.
Основной проблемой при решении поставленной задачи является обеспечение независимости правильности распознавания от сдвига сравниваемого уникального участка относительно стандартного расположения. При разработке программы использованы два подхода к вычислению меры .
1) Нахождение минимального элемента в корреляционной матрице образца и распознаваемого бланка. При использовании такого подхода фактически происходит полный перебор всех возможных вариантов парал-
.
2) Второй метод основан на вычислении евклидова расстояния между результатами автокорреляционного преобразования образца и распозна-
. , -бражений результат автокорреляционного преобразования остается неизменным [1].
Реализации обоих методов базируются на быстром преобразовании Фурье. Второй алгоритм работает быстрее, так как для реализации распознавания ему требуется производить в 1,5 раза меньше операций БПФ. Распознавание корректно происходит при наличии параллельного сдвига порядка 10-20% от размера уникального участка бланка, а также поворота документа на угол не более ±1е. Рассмотренные методы могут также применяться в определении похожести двумерных изображений и при автоматизации поиска графической информации.
ЛИТЕРАТУРА
1. Горбань А.Н., Россиев ДА. Нейронные сети на персональном компьютере. Новосибирск: Наука, 1996.
УДК 621.3.019.4:681.3.053
О.Б. Макаревич, Д.В. Бабенко
ПЕРСПЕКТИВЫ ПОМЕХОУСТОЙЧИВОГО ДЕКОДИРОВАНИЯ ПО
АЛГОРИТМУ ФАНО
Одним из самых высокопроизводительных аппаратов помехоустойчивой связи на сегодняшний день являются сверточные коды. Известно несколько алгоритмов (алгоритмы Рида-Соломона, Виттерби), которые в настоящее время используются во всей области спутниковой связи: ТВ-вещание, радиовещание, телефонная, телетайпная, факсимильная и др., передача данных в Internet и различные глобальные сети и т.д. С увеличением производительности и понижением стоимости вычислительных устройств сверточные коды начинают применяться уже в более распространенных устройствах (CDROM, DVD, системы сотовой и мобильной связи (GSM, TDMA, CDMA) и т.д.).
Особые требования по исправляющей способности предъявляются при передаче потоков данных, где вероятность появления ошибки на выхо-
10-6.
(например, Рида-Соломона) не могут удовлетворить этим требованиям при приемлемых аппаратурных затратах. Необходимо использование алгорит-
мов, более устойчивых к ошибкам. К таким алгоритмам относятся последовательные алгоритмы. Наиболее простой из них в реализации и более быстродействующий - алгоритм Фано обладает высокой исправляющей спо-.
реализации показали его значительное превосходство по исправляющей способности над алгоритмами Рида-Соломона и Виттерби. С появлением быстродействующих вычислительных устройств стала возможна приемлемая реализация алгоритма Фано. Реально работающий декодер Фано, созданный в УНЦ СИБ ТРТУ, показал хорошие результаты по исправляющей способности для скоростей кода 1/2, 3/4 и 7/8. На скоростях потока 2, 2 и 1,7 Мбод и ошибках на входе 10-2, 410-3 и 10-3 для перечисленных скоростей ,
ошибок, с вероятностью ошибки на выходе меньшей 10-7.
УДК 681.3.062:023
А.А. Трегубов, О.Ю. Пескова
ПРЕДОБРАБОТКА И ИНДЕКСИРОВАНИЕ ДОКУМЕНТОВ ЭЛЕКТРОННОЙ
БИБЛИОТЕКИ
Большинство существующих классических информационно-поисковых систем (ИПС) используют механизм автоматического сжатия (индексации) текста документов. Проблемой индексации является автоматическое выделение слов и выражений, специфичных для определенных пред. ,
, -нию степени (частоты) присутствия терминов в документе, места присутствия (находится в заголовке, подзаголовке, начале документа), характеризующих их специфичность.
Для ключевых слов при индексировании, а также при обработке терминов запросов пользователей необходимо их привести к специальной,
( ). -( ), -( ).
В русском языке смысловая информация распределена в словах дискретными «сгустками»: наиболее информационно нагруженными являются
( ), -( , ), -риантов приведения слов к специальному виду является отсечение конеч-, : . -димо ввести массив парадигм склонения русских слов, который будет содержать всевозможные падежные окончания слов, как в единственном, так и во множественном числе. Аналогичным образом можно создать массив (базу данных) суффиксов слов, к которому можно будет обращаться после обработки окончаний слов для выделения и последующего удаления суф-.
Проект поддержан грантом РФФИ №00-07-90252.