Научная статья на тему 'Скантехнологии. Параллельная обработка заданий в интрасети'

Скантехнологии. Параллельная обработка заданий в интрасети Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
90
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Скантехнологии. Параллельная обработка заданий в интрасети»

Таким образом, синтезируемые атрибуты позволяют организовать движение вверх по дереву разбора, а наследуемые— вниз по дереву разбора.

Атрибутные правила могут иметь достаточно сложный вид и структуру, в частности в качестве результатов работы атрибутных правил могут быть словесные заключения о характера ЭКГ. В принципе, подход с использованием атрибутных грамматик позволяет полностью формализовать обработку сигнала, от распознавания его структуры до формирования заключения. При этом данные анамнеза должны быть наследуемыми атрибутами первичного символа грамматики. Таким образом они будут распространяться вниз по дереву разбора и будут доступны всем дочерним нетерминалам. Структурные же элементы ЭКГ (зубцы, комплексы, интервалы) будут иметь синтезируемые атрибуты, отражающие соответственно их длительность, амплитуду, форму и будут распространяться вверх по дереву, создавая на каждом уровне все более укрупняющееся описание ЭКГ.

Достоинством подобной схемы является то, что как на этапе отладки, так и на этапе эксплуатации, можно воспроизвести цепочку вывод для дерева вывода и автоматически сгенерировать формирование конкретного заключения.

УДК 681.3.01

Ю.М. Вишняков, А. Цур, В.В. Хашковский

СКАНТЕХНОЛОГИИ. ПАРАЛЛЕЛЬНАЯ ОБРАБОТКА ЗАДАНИЙ В

ИНТРАСЕТИ

Резкий рост потребности в применении компьютеров для обработки информации привел к разработке технологии перевода информации с твердых носителей в машинные формы. Такая технология реализуется в центрах сканирования, включающих документный сканер, станции сканирования, распознавания, верификации, объединенные в сеть, и соответствующие ПО.

Различные скорости работы отдельных компонент сканцентра (сканирование - до 40 л/мин., распознавание - до 1 л/мин.) создают опасность образования больших очередей и требуют применения маршрутизатора (М) и специального ПО для реализации параллельной сетевой обработки на нескольких станциях распознавания (СР) и определения очередности выбора документов.

Маршрутизатор реализует алгоритм вероятностного диспетчирования. При появлении свободной станции распознавания диспетчер выбирает по случайному закону (в соответствии с распределением на входящих пачках Рь Р2, ...Рп) документ из пачки и передает его на распознавание. Одновременно передается ссылка на соответствующий шаблон для распознавания. Для реализации такого диспетчера интервал [Г...Н] разбивается на участки, пропорциональные значениям Рь Р2, ...Рш реализуется равномерно распределенная на интервале [Ь...Н] случайная величина и выбирается пачка, равная номеру интервала, куда попала случайная величина.

Для соблюдения распределения на входящих пачках (Рь Р2, -. -Рп)> которое может нарушаться вследствие различного времени распознавания документов, предлагается использовать средства мониторинга характеристик выходного потока. Такого рода средства дают возможность отследить задания, не попавшие на распознавание в свою очередь и, если их количество превосходит некоторую пороговую величину, изменить вероятностные характеристики диспетчера для компенсации отклонений режима диспетчирования.

Настоящие исследования выполнены на базе международной лаборатории ELDIC с 1996 г при поддержке фонда Леонарда Эйлера DAAD.

ЛИТЕРАТУРА

1. Маматов Ю.А. Организация работы мультипроцессорных СЦВМ с многоуровневой памятью //диссертация на соискание ученой степени д.т.н.

УДК 658.512

Ю.М.Вишняков, А.Цур, С.Ю.Новиков КАТАЛОГИЗАТОР ЭЛЕКТРОННЫХ ДОКУМЕНТОВ

Автоматизация документооборота предполагает использование комплекса ввода документов с бумажных носителей. Его ключевым звеном является пакетный документный сканер, а сама пакетная обработка требует автоматизации распределения документов по каталогам (каталогизация). В настоящей работе предлагается одна из реализаций такого каталогизатора, разработанного в рамках работ международной лаборатории ЕЬОІС в области безбумажной обработки информации.

Пользователь создает свою «виртуальную» структуру архива в виде дерева (файлы физически находятся в одном каталоге), структура архива записывается в файл и может модифицироваться. Электронные документы имеют сквозную нумерацию, что позволяет при необходимости переходить на следующий или предыдущий документ в пачке. Предусмотрены автоматический, ручной и полуавтоматический режимы каталогизации.

Повышение интеллектуальности каталогизатора достигается через использование различного рода критериев каталогизации путем подключения соответствующих программных модулей. Методики и критерии каталогизации документов зависят во многом от области приложения. В настоящее время нами апробирована и используется простая каталогизация на основе ключевых слов. Практические исследования показали, что следующий алгоритм полуавтоматической каталогизации имеет неплохие результаты.

1) создать базу понятий для всей группы документов. Здесь отсекаются слова на основе словаря не рекомендуемых для индексирования слов;

i Надоели баннеры? Вы всегда можете отключить рекламу.