4. Платонова С.В. Использование ленточных щелевидных п-образных фундаментов в малоэтажном строительстве // Проектирование, строительство и эксплуатация малоэтажного жилья в Западно-Сибирском регионе материалы межрегиональной научно-практической конференции. под редакцией И.К. Назаренко. 2009. С. 164-175.
5. Федорчук Ю.М., Кудяков А.И., Недавний О.И., Федорчук В.А. Способ нейтрализации побочного продукта фтористоводородного производства // Патент на изобретение RUS 2207996 26.06.2001
6. Шахворостов Н.Г., Хаджиева Я.Я., Резниченко С.А., Волынский В.Ф., Пустынин Б.В. Щит (варианты): патент на изобретение RUS 2198372 17.07.2000
Фомичёва Т.Л., Савина С.В., Казаченко А.А.
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ РАСПОЗНАВАНИЯ ДОКУМЕНТОВ
Финансовый университет при Правительстве РФ
Ключевые слова: Документ, информационные технологии, программа для распознавания, редактирование, технология OCR.
Аннотация. В статье рассматривается значение технологии распознавания документов в современном мире, а также различные направления, в которых эти технологии применяются. Авторы статьи приходят к выводу, что системы распознавания развиваются быстрыми темпами и, несмотря на новизну, уже занимают неотъемлемое место в жизни и работе людей.
Keywords: Document, information technologies, program for recognition, editing, OCR technology.
Abstract. In article the value of technology of recognition of documents in the modern world and also various directions in which these technologies are applied is considered. Authors of article come to a conclusion that the systems of recognition develop in high gear and, despite novelty, already take the integral place in life and work of people.
На сегодняшний день электронное распознавание текста с успехом применяется во многих отраслях: начиная от упрощения работы с объёмными бумажными и PDF-документами и заканчивая переписью населения и проверкой экзаменационных работ ЕГЭ и ОГЭ.
Искусственный интеллект, с помощью которого информация и проходит обработку, применяется в таких направлениях, как
распознавание текста, изображений, речи, понимание и анализ текстов, бизнес-аналитика, робототехника и во многих других задачах. Начиная с 1993 года, впервые зарождаются понятие и программы для распознавания текстовых документов. Впоследствии они совершенствуются, и к 2015 году их функционал пополняется также извлечением информации и пониманием текста на естественном языке.
Редактирование документов в формате PDF, бумажных статей, брошюр и других носителей информации заметно упростилось с внедрением системы распознавания текста. Если раньше приходилось перепечатывать исходный текст заново, то теперь процедура распознавания текста занимает совсем не много времени. В основе системы распознавания заложена технология OCR (англ. - Optical Character Recognition), которая и «работает» с документом после его сканирования.
На начальном этапе отсканированный документ представляет собой лишь набор точек, иными словами - это цельное изображение. Система OCR анализирует его, определяет структуру страниц: есть ли в нём таблицы, схемы, графики, сноски, номера страниц - то есть всё то, что составляет макет страницы. Дальнейшее распознавание строится на трёх фундаментальных принципах работы технологии OCR:
• Целостность - описание объекта как некоего целого с помощью выделения значимых элементов и связей между ними;
• Целенаправленность - анализ объекта и выдвижение гипотез о том, с каким символом он имеет больше всего схожих структурных элементов строения, а также дальнейшее подтверждение или опровержение гипотезы;
• Адаптивность - способность системы к самообучению и расширению базы возможных объектов, которые система содержит в своей памяти.
После выдвижения гипотезы система сравнивает анализируемые элементы (отрезки, дуги, точки, кольца) с уже заданными в системе примерами этих элементов.
OCR-технология лежит в основе функционирования программы распознавания документов ABBYY FineReader. Конкретно в ней используется ряд классификаторов, каждый из которых отвечает за определённый этап в распознавании. К примеру, растровый и признаковый классификаторы работают при выдвижении гипотез системой и анализе структурных элементов, дифференциальный - при проверке истинности выдвинутых гипотез, и т.д.
В частности, при подсчёте результатов ЕГЭ и ОГЭ (а также результатов итогового сочинения или изложения с 2014-2015 годов) используется технология ABBYY TestReader, созданная специально для автоматизации обработки контрольных тестирований. Каждый год через данную технологию проходит свыше 13 миллионов экзаменационных работ. Разработанная в 2009 году совместно с ФГУ «Федеральный центр тестирования» Автоматизированная информационная система «Государственная (итоговая) аттестация» во многом схожа с системой распознавания бланков ответов работ ЕГЭ. Благодаря этому проверка аттестации не требовала привлечения новых специалистов или переквалификации уже существующих, что снизило и материальные, и организационные издержки. В 2010 году был разработан ряд мер, которые существенно модернизировали и упростили процесс обработки результатов ЕГЭ, в частности, проведена оптимизация работы серверной части, осуществлено сокращение количества ручных операций для некоторых видов бланков, а также введены новые режимы сканирования.
Распознавание документов на сегодняшний день вышло за границы исключительно компьютерного использования: уже созданы мобильные версии приложений, которые распознают файлы через фотокамеру устройства. Они позволяют передавать данные с визиток прямиком в информацию о контактах на мобильном устройстве, а также отвечают за распознавание штрих-кодов и перевод слов. На данном этапе система настолько усовершенствована, что без труда справляется с распознаванием и исправлением переноса слов в текстах или изогнутых, косых строк. Мгновенное распознавание текста в формате видеопотока с мобильных устройств также уже имеет место. Такая технология получила название ABBYY Real-Time RecognitionSDK, и она в режиме реального времени сканирует и распознаёт данные паспорта, водительского удостоверения, кредитных карт, надписи, номера и другие визуальные объекты.
Системы распознавания документов постоянно совершенствуются. Выходят новые программы и приложения для разных устройств, которые заметно упрощают нашу жизнь: в одно касание человек может теперь сделать то, что раньше казалось утопией. И при всей инновационности разработок они органично и легко внедряются в уже привычные для нас задачи, охватывая широкий спектр возможностей: от обработки результатов экзаменов и мгновенного перевода иностранных слов до самоадаптивной системы перевода PDF-документов в читаемый текстовый формат и многого другого.
Список литературы
1. Рюмкин В.И.Распознавание многомерных объектов при помощи процедуры функционального шкалирования // Обозрение прикладной и промышленной математики. 2005. Т. 12. № 4. С. 1074-1075.
2. Магомедов, Р.М. Развитие экономики России через обновление инновационных технологий предприятий // Академический журнал Западной Сибири. 2017. № 2. С. 28-31.
3. Старожилова О.В.Распознавание изображений по текстурам программными методами // Перспективы развития науки и образования сборник научных трудов по материалам Международной научно-практической конференции: в 13 частях. 2015. С. 138-141.
4. Магомедов Р.М. Сервисы Web в образовательном процессе // Информатика и образование. 2017. № 1. С. 50-53.
5. Официальный сайт компании ABBYY [Электронный ресурс] -https://www.abbyy.com/ru-ru/ (Дата обращения: 20.05.2018).
6. Фомичева Т.Л., Золотарюк А.В., Кижнер А.И. Роль облачных сервисов в формировании профессиональных информационно-технологических компетенций студентов// Известия института инженерной физики. 2015. Т.2. №36. С.96-100.
7. Фомичева Т.Л., Золотарюк А.В., Кижнер А.И. Модели взаимодействия преподавателей и студентов при реализации различных форм учебной деятельности.// Известия института инженерной физики. 2014. Т.4. №34. С. 47-50.
8. Томин В.В. О проблемах машинного перевода научно -технического текста в информационном поле кросс-культурного взаимодействия // Вестник Оренбургского государственного университета. 2015. № 1 (176). С. 33-39.