Научная статья на тему 'АВТОМАТИЗИРОВАННОЕ ПРЕОБРАЗОВАНИЕ ИНФОРМАЦИИ ИЗ ВИЗУАЛЬНЫХ МАТЕРИАЛОВ ПОСРЕДСТВОМ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ ТЕКСТА'

АВТОМАТИЗИРОВАННОЕ ПРЕОБРАЗОВАНИЕ ИНФОРМАЦИИ ИЗ ВИЗУАЛЬНЫХ МАТЕРИАЛОВ ПОСРЕДСТВОМ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ ТЕКСТА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
4
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Обработка данных / оптическое распознавание символов / моделирование бизнес-процессов / Data processing / optical character recognition / business process modeling

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Макаревская Дарья Алексеевна, Панфилов Илья Александрович

Технологический процесс оптического распознавания символов предоставляет мощный инструмент для преобразования текста, визуализированного на изображении, в машиночитаемую форму. Применение данной технологии значительно упрощает работу с текстовой информацией, освобождая от необходимости вручную вводить данные и повышая эффективность обработки документов в цифровом формате.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Макаревская Дарья Алексеевна, Панфилов Илья Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AUTOMATED TRANSFORMATION OF INFORMATION FROM VISUAL MATERIALS THROUGH OPTICAL TEXT RECOGNITION

The optical character recognition technology process provides a powerful tool for converting text visualized in an image into a machine-readable form. The use of this technology greatly simplifies the work with textual information, eliminating the need to manually enter data and increasing the efficiency of processing documents in digital format.

Текст научной работы на тему «АВТОМАТИЗИРОВАННОЕ ПРЕОБРАЗОВАНИЕ ИНФОРМАЦИИ ИЗ ВИЗУАЛЬНЫХ МАТЕРИАЛОВ ПОСРЕДСТВОМ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ ТЕКСТА»

2. Garg, N., & Pandey, M. (2018). "Smart Cities: Technologies and Sustainable Solutions." CRC Press.

3. Picon, A. (2015). "Smart Cities: A Spatialised Intelligence." Wiley.

4. Goh, Y. M., & Liu, Y. (2016). "Building Information Modeling (BIM) Application in Design for Construction Safety." Automation in Construction, 61, 16-27.

5. Chen, Y., Zhang, S., Yuan, C., & Wang, X. (2019). "Key Enablers for BIM Adoption in China: A Case Study of Beijing." Journal of Construction Engineering and Management, 145(7), 04019041.

6. Hall, R. E., Bowerman, B., Braverman, J., Taylor, J., Todosow, H., & Von Wimmersperg, U. (2000). "The vision of a smart city." In The ERA of e-urbanism.

7. Mostafavi, M., & Doherty, G. (Eds.). (2010). "Ecological Urbanism." Lars Müller Publishers.

8. Batty, M., Axhausen, K. W., Giannotti, F., Pozdnoukhov, A., Bazzani, A., Wachowicz, M., & Ouzounis, G. (2012). "Smart cities of the future." The European Physical Journal Special Topics, 214(1), 481-518.

9. Weiser, M. (1991). "The Computer for the 21st Century." Scientific American, 265(3), 94-104.

10.El-Gohary, N. (2016). "Building Information Modeling (BIM): Trends, Benefits, Risks, and Challenges for the AEC Industry." Leadership and Management in Engineering, 16(3), 241-252.

© flwyMagypflbieB T., flrMbipoB fl., 2023

Макаревская Дарья Алексеевна, Панфилов Илья Александрович

Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева

г. Красноярск, РФ

АВТОМАТИЗИРОВАННОЕ ПРЕОБРАЗОВАНИЕ ИНФОРМАЦИИ ИЗ ВИЗУАЛЬНЫХ МАТЕРИАЛОВ ПОСРЕДСТВОМ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ ТЕКСТА

Аннотация

Технологический процесс оптического распознавания символов предоставляет мощный инструмент для преобразования текста, визуализированного на изображении, в машиночитаемую форму. Применение данной технологии значительно упрощает работу с текстовой информацией, освобождая от необходимости вручную вводить данные и повышая эффективность обработки документов в цифровом формате.

Ключевые слова

Обработка данных, оптическое распознавание символов, моделирование бизнес-процессов

Makarevskaya Darya A., Panfilov Ilia A.

Reshetnev Siberian State University of Science and Technology

Krasnoyarsk, Russia

AUTOMATED TRANSFORMATION OF INFORMATION FROM VISUAL MATERIALS THROUGH OPTICAL TEXT RECOGNITION

Abstract

The optical character recognition technology process provides a powerful tool for converting text

visualized in an image into a machine-readable form. The use of this technology greatly simplifies the work with textual information, eliminating the need to manually enter data and increasing the efficiency of processing documents in digital format.

Keywords

Data processing, optical character recognition, business process modeling

Эффективная модель управления подачей заявок способствует более прозрачному, быстрому и удобному взаимодействию между организаторами и участниками. В этом контексте моделирование бизнес-процесса подачи заявок становится неотъемлемым инструментом для оптимизации и совершенствования существующих практик.

OCR - системы - это системы для перевода изображений документов в редактируемый текст, который можно затем обрабатывать в текстовых и табличных редакторах [1]. Основной целью optical character recognition (OCR) является перевод визуальной информации в текстовый формат с минимальными ошибками.

OCR позволяет компьютерам распознавать и интерпретировать текст, изображенный на различных типах изображений, от сканированных документов до фотографий.

Применение OCR имеет широкий спектр применения, включая:

- преобразование бумажных документов в электронный формат;

- распознавание рукописного текста;

- интеграцию в системы распознавания текста на изображениях;

- обработку фотографий для извлечения текстовой информации [2].

Рассмотрим процесс, где применение технологии OCR действительно необходимо. Применение технологии OCR облегчает задачу оцифровки книг в библиотеке. Актуальность заключается в том, что данная технология позволяет значительно сократить время и трудозатраты на этот процесс. При использовании OCR не требуется ручное редактирование сканов, что позволяет автоматизировать процесс оцифровки.

Технология OCR также позволяет повысить качество оцифрованных книг. При ручном редактировании сканов всегда существует вероятность ошибок, которые могут привести к искажению текста. Технология OCR позволяет снизить риск таких ошибок, так как она использует алгоритмы машинного обучения для распознавания текста.

Кроме того, технология OCR позволяет повысить удобство использования оцифрованных книг. С помощью технологии OCR можно создавать полнотекстовые индексы оцифрованных книг, что позволяет пользователям быстро находить нужную информацию. В библиотеке Сибирского федерального университета действует программа оцифровки аналоговых книг. Некоторые книги представляют из себя исторические артефакты и обращение с ними требует особого подхода. Но в значительной мере оцифровка касается массовых изданий и представляет из себя рутинный процесс, требующий значительного времени [3].

Отобразим последовательность действий при оцифровке на диаграмме событий eEPC, изображенной на рис.1. EPC (Event-Driven Process Chain, событийная цепочка процессов) - тип диаграммы в нотации Aris отображения хода выполнения процесса, ключевыми элементами которой являются События и Функции. При описании бизнес-процессов, в обыденной жизни все процессы можно представить как череду событий и состояний [4].

Помимо бизнес-процесса описывающего процесс обработки аналоговых изображений, описанию, анализу и автоматизации подлежат также процессы формирования цифровых книг, учета новых библиографических объектов хранения библиотеки, бизнес-процессы по работе информационных библиографических систем.

Рисунок 1 - Диаграмма EPC процесса оцифровки книг

Таким образом, применение технологии OCR при оцифровке книг в библиотеке является актуальным и перспективным направлением. Эта технология позволяет значительно повысить

эффективность и качество процесса оцифровки, а также улучшить удобство использования оцифрованных книг.

Список использованной литературы:

1. Оптическое распознавание символов (OCR). - [Электронный ресурс]. - Режим доступа: http://wiki.technicalvision.ru/index.php/%D0%9E%D (дата обращения: 09.12.2023)

2. Нестеров А. С. Анализ рынка современных информационных систем оптического распознавания символов (OCR) - Вопросы науки и образования. - 2020. - № 23 (107). - С. 24-30.

3. Захаров П.А., Касянчук Е.Н. Библиотека и издательство вуза - объединение как основа повышения эффективности -Alma Mater (Вестник высшей школы). 2020. № 12. С. 102-105.

4. Колмыкова Е.Д. Моделирование бизнес-процессов документооборота предприятия / Е.Д. Колмыкова, В.А. Попов, Д.А. Макаревская, И.А. Панфилов // Актуальные проблемы авиации и космонавтики. - Красноярск, 2023. - С. 4-6.

© Макаревская Д.А., Панфилов И.А., 2023

i Надоели баннеры? Вы всегда можете отключить рекламу.