Научная статья на тему 'ПРЕОБРАЗОВАНИЕ ИНФОГРАФИКИ В ДАННЫЕ'

ПРЕОБРАЗОВАНИЕ ИНФОГРАФИКИ В ДАННЫЕ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
86
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОГРАФИКА / ОПТИЧЕСКОЕ РАСПОЗНАВАНИЕ СИМВОЛОВ (OCR) / ВИЗУАЛЬНОЕ ПРЕДСТАВЛЕНИЕ / ПРОСТЫЕ МЕХАНИЗМЫ OCR / ИНТЕЛЛЕКТУАЛЬНОЕ РАСПОЗНАВАНИЕ СИМВОЛОВ (ICR) / ПОИСК ДАННЫХ / ТЕКСТОВЫЕ И ВИЗУАЛЬНЫЕ ДАННЫЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бербасов В.Д.

В этом тексте исследуется динамическое пересечение инфографики и технологии оптического распознавания символов (OCR), вникая в их значение и области применения. Обсуждение OCR разворачивает процесс преобразования текста на основе изображений в машиночитаемый формат, что обеспечивает эффективную обработку данных и доступность. Выявлены преимущества OCR, охватывающие поиск данных, доступность и упрощенный ввод данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

TRANSFORMING INFOGRAPHICS TO DATA

This text contains a dynamic intersection of infographics and optical characterization (OCR) technologies, including their meaning and scope. Discuss the effectiveness of OCR in converting image-based text into a machine-readable format that uses efficient data processing and accessibility. The benefits of OCR, search data coverage, accessibility, and simplified data entry are identified.

Текст научной работы на тему «ПРЕОБРАЗОВАНИЕ ИНФОГРАФИКИ В ДАННЫЕ»

УДК 004.93

Бербасов В.Д. студент магистратуры Поволжский государственный университет телекоммуникаций и информатики

ПРЕОБРАЗОВАНИЕ ИНФОГРАФИКИ В ДАННЫЕ

Аннотация. В этом тексте исследуется динамическое пересечение инфографики и технологии оптического распознавания символов (OCR), вникая в их значение и области применения. Обсуждение OCR разворачивает процесс преобразования текста на основе изображений в машиночитаемый формат, что обеспечивает эффективную обработку данных и доступность. Выявлены преимущества OCR, охватывающие поиск данных, доступность и упрощенный ввод данных.

Ключевые слова. Инфографика, Оптическое распознавание символов (OCR), Визуальное представление, Простые механизмы OCR, Интеллектуальное распознавание символов (ICR), Поиск данных, Текстовые и визуальные данные.

Berbasov V.D. master's student

Volga State University of Telecommunications and Informatics TRANSFORMING INFOGRAPHICS TO DATA

Annotation. This text contains a dynamic intersection of infographics and optical characterization (OCR) technologies, including their meaning and scope. Discuss the effectiveness of OCR in converting image-based text into a machine-readable format that uses efficient data processing and accessibility. The benefits of OCR, search data coverage, accessibility, and simplified data entry are identified.

Keywords. Infographics, Optical Character Recognition (OCR), Visual Representation, Simple OCR Engines, Intelligent Character Recognition (ICR), Data Retrieval, Text and Visual Data.

На данный момент инфографика выделяется как очень популярный способ представления информации. Этот визуальный носитель умело передает сложные данные, знания и идеи.

Инфографика охватывает широкий спектр контента, в том числе учебные пособия и результаты исследований. Они часто используют яркие, незабываемые оттенки, сопровождаемые разборчивыми символами и привлекательными изображениями. Основная цель инфографики — не

только представить информацию, но и структурировать и упростить ее, сделав ее доступной.

Различные типы инфографики предназначены для разных целей:

1. В информационной инфографике преобладает текст, предлагающий кристально ясное понимание предмета.

2. Статистическая инфографика использует числа и графики для передачи информации.

3. Инфографика на основе временной шкалы хорошо подходит для просмотра хронологических событий.

4. В географической инфографике используются картографические диаграммы, представленные в доступной форме.

5. Инфографика процесса облегчает понимание процедурного потока, разворачиваясь последовательно сверху вниз и слева направо. Пронумерованные шаги улучшают понимание.

6. Сравнительная инфографика сопоставляет параметры объектов для удобства анализа.

7. Иерархическая инфографика представляет данные от общего к частному, иллюстрируемому такими понятиями, как пирамида Маслоу.

8. Инфографика списков добавляет креативности спискам, включая значки и визуальные элементы.

9. Темы, связанные с работой, можно изобразить художественно, превратив резюме в визуальный рассказ [1].

Данные относятся к структурированной информации, предназначенной для понимания, интерпретации или обработки людьми или компьютерами.

Хотя термины «данные» и «информация» часто используются взаимозаменяемо, в них есть нюансы. По сути, данные могут проявляться в виде чисел, символов, слов, кодов или графиков. Однако именно информация наполняет данные контекстом. Он выполняет ключевые роли, например, помогает принимать решения и делать прогнозы.

Информация представляет собой организованные, обработанные и структурированные данные, наполняющие их смыслом.

Иногда возникает потребность извлечь данные из визуальных форматов, и существуют различные решения для решения этой проблемы. Оптическое распознавание символов (OCR) — одно из таких решений, представляющее собой жизнеспособный метод преобразования визуальных данных в машиночитаемый текст.

Оптическое распознавание символов (OCR) — это преобразующий процесс преобразования текстового содержимого изображения в формат, который может быть понят и обработан машинами. Это особенно полезно в таких сценариях, как сканирование фирменных бланков или квитанций, когда создается файл изображения. Поскольку текстовые редакторы не могут взаимодействовать с файлами изображений, такие задачи, как

редактирование, поиск и подсчет слов, становятся невыполнимыми. OCR эффективно устраняет этот пробел, преобразовывая изображения в текстовые документы, тем самым инкапсулируя содержимое в виде текстовых данных [2].

Сфера оптического распознавания текста включает в себя различные технологии, каждая из которых предназначена для конкретных приложений и областей применения. Давайте углубимся в несколько типов OCR:

Используя массив сохраненных шаблонов шрифтов и текстовых изображений в качестве шаблонов, эти механизмы OCR используют алгоритмы сопоставления шаблонов. Эти алгоритмы облегчают посимвольное сравнение между изображениями текста и внутренней базой данных шаблонов. Подход соответствия может также распространяться на оптическое распознавание слов. Однако он имеет присущие ему ограничения из-за огромного ассортимента шрифтов и стилей рукописного ввода, которые невозможно учесть в базе данных.

Современные системы OCR используют интеллектуальное распознавание символов (ICR) для имитации человеческого чтения. Используя передовые методы машинного обучения, эти системы анализируют текст с навыками, подобными человеческим. Нейронные сети обрабатывают изображения на нескольких уровнях, обнаруживая такие атрибуты, как кривые, линии, пересечения и петли. Объединение различных уровней анализа дает конечный результат.

Основываясь на принципах ICR, интеллектуальные системы распознавания слов расширяют область применения до целых слов. Эти системы напрямую обрабатывают изображения полных слов, минуя предварительное извлечение отдельных символов.

Возможности OCR расширяются до идентификации логотипов, водяных знаков и обозначений в документах. Эта функция расширяет область распознавания не только текстового содержимого.

Преимущества технологии OCR включают в себя:

Распознавание текста позволяет создавать версии отсканированных документов с возможностью поиска. Это позволяет пользователям находить определенные разделы в документах с помощью ключевых слов. Кроме того, эта технология облегчает редактирование документов с помощью стандартных текстовых редакторов.

Программы чтения с экрана могут расшифровывать машиночитаемый текст, озвучивая контент для людей с нарушениями зрения, тем самым способствуя инклюзивности.

Чтобы наглядно проиллюстрировать концепцию, рассмотрим простейший метод оптического распознавания. Исходные данные будем использовать в виде инфографики на русском языке. Это сравнение послужит для оценки точности распознавания текста простейшими алгоритмами.

На рисунке 1 представлена информационная инфографика на русском

языке.

ХОЛЕСТЕРИН

Холестерин необходим для жизнедеятельности человека. Он поступает в организм с пищей, но главным образом вырабатывается в печени. Холестерин переносится по кровеносным сосудам вместе с белками —липопротеидами. Липопротеиды низкой плотности {ЛНП) вредны для человека, так как способствуют развитию атеросклероза: они откладываются в стенках кровеносных сосудов и могут вызвать их закупорку (так развивается инфаркт миокарда). Липопротеиды высокой плотности (ЛВП), напротив, полезны: они захватывают холестерин из тканей и сосудов, и доставляют его обратно в печень, препятствуя тем самым развитию атеросклероза.

О Для снижения риска инфаркта миокарда и других осложнений атеросклероза необходимо снижать уровень холестерина

Нормативные показатели липидов для здоровых людей:

Общий холестерин < 5,0 ммоль/л

ЛНП («плохой холестерин») < 3,0 ммоль/л

ЛВП («хороший холестерин») > ммоль'п У м*жчин > 1,2 ммоль/л у женщин

Триглицериды <1,7 ммоль/л

Рекомендуемый уровень холестерина у больных ишемической болезнью сердца, сахарным диабетом, хронической болезнью почек и людей с очень высоким сердечно-сосудистым риском:

ЛНП («плохой холестерин») <1,3 ммоль/л

Снижению уровня холестерина способствует соблюдение диеты с ограничением насыщенных жиров. При необходимости врач назначит вам лекарства, снижающие уровень холестерина, которые важно принимать регулярно и длительно

Рис. 1 - Входные данные с кириллицей

В качестве результата работы программы мы получаем готовый текст, который мы распознали с помощью оптического распознавания символов.

На рисунке 2 представлен результат работы программы распознавания символов.

<ол £< | ^ к и п для снижения риска инфаркта миокарда и

других осложнений атеросклероза необходимо

снижать уровень холестерина

Нормативные показатели липидов для здоровых

тюдей:

Г

эо д В они -Н :14\;Х5_ н "Э ы 7\7

— М* \ «Плохой холестерин» ЗЫСОКИЙ УРОВЕНЬ ХОЛЕСТЕРИНА -/ ч КЛЮЧЕВОЙ ФАКТОР РИСКА АТЕРОСКЛЕРОЗА <олестерин необходим для жизнедеятельности человека. Рекомендуемый уровень холестерина у Зольных ишемической

Зн поступает в организм с пищей, но главным эбразом болезнью сердца, сахарным диабетом, <ронической болезнью

"ч вырабатывается в печени. Холестерин переносится по — — почекилюдей с очень высоким сердечно-сосудистым риском: <ровеносным сосудам вместе с белками — 1ипопротеидами.

1ипопротеиды низкой плотности (ЛНП) вредны для человека, так как способствуют развитию атеросклероза:

эни откладываются в стенках кровеносных сосудов л могут

зызвать их закупорку (так развивается инфаркт миокарда). Снижению - уровня — холестерина -способствует

Пипопротеиды высокой плотности (ЛВП), напротив, :облюдение диеты с ограничением насыщенных полезны: они захватывают холестерин из тканей и госудов, и жиров. При необходимости врач чэзнэчит вам

доставляют его обратно в печень, препятствуя тем самым лекарства, снижающие - уровень <олестерина,

Зазвитиюеросааерозо; которые важно принимать

Рис. 2 - Результат работы программы с кириллицей

Исходя из полученных результатов можно сделать вывод, что на точность оптического распознавания влияет достаточно много факторов: нестандартные шрифты, использованные алфавиты, положение символов на картинке, буквы схожие с цифрами.

Если использовать более совершенные алгоритмы распознавания, то можно значительно повысить качество получаемых данных с изображений.

Использованные источники:

1. 9 видов инфографики и их применение [Электронный ресурс] URL: https://ru.venngage.com/blog/%D0%B2%D0%B8%D0%B4%D 1 %8B-%D0%B8%D0%BD%D 1 %84%D0%BE%D0%B3%D 1 %80%D0%B0%D 1 %84 %D0%B8%D0%BA%D0%B8/ (дата обращения: 21.08.2023)

2. Что такое оптическое распознавание символов? [Электронный ресурс] URL: https://aws.amazon.com/ru/what-is/ocr/ (дата обращения: 22.08.2023)

i Надоели баннеры? Вы всегда можете отключить рекламу.