Научная статья на тему 'Метод распознавания текстовой информации из цифровой формы (изображение), определение очередности нанесения реквизитов'

Метод распознавания текстовой информации из цифровой формы (изображение), определение очередности нанесения реквизитов Текст научной статьи по специальности «Прочие технологии»

CC BY
146
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Закон и право
Область наук
Ключевые слова
КРИМИНАЛИСТИЧЕСКАЯ ЭКСПЕРТИЗА / ДОКУМЕНТ / ПОДДЕЛКА / ОЧЕРЕДНОСТЬ НАНЕСЕНИЯ РЕКВИЗИТОВ / ЦИФРОВАЯ ФОРМА / FORENSIC EXAMINATION / DOCUMENT / FAKE / SEQUENCE OF APPLICATION DETAILS / DIGITAL FORM

Аннотация научной статьи по прочим технологиям, автор научной работы — Аллаберганов Ахмеджан Атаханович

Разработан метод обработки и анализа спектрального пространства, получения изображений и распознавания текста (текстовой информации) видеоспектральным и видеомикроскопическим методом исследования с применением Криминалистического многофункционального комплекса (КМК) при помощи криминалистического программного обеспечения, позволяющий определить признаки объектов, присутствующих на исследуемом (исходном) изображении. При этом в видимой зоне спектра может быть выделен оптимальный способ (метод) алгоритмической реализации преобразований в зависимости от вида характеристик объекта и их частей. Предложенный метод (способ) исследования распознавание очередности нанесения реквизитов из цифровой формы, выделение элементов текста и распознавание объектов и их частей, выявление фальсификации (подделки) документа, текстовых знаков в электронном формате (цифровой форме) способен существенно повысить эффективность экспертной деятельности в рамках производства технико-криминалистического исследования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Method text information from digital form (picture), details of the details

A method has been developed for processing and analyzing the spectral space, obtaining images and recognizing text (textual information) by the video spectral and video microscopic research method, using the Forensic Multifunctional Complex (CMC) with the help of forensic software, which allows to determine the features of objects that are present on the investigated (source) image. At the same time, in the visible region of the spectrum, the optimal method (method) of the algorithmic implementation of transformations can be selected depending on the type of their characteristics of the object and their parts. The proposed research method (method), recognition of the sequence of drawing details from a digital form, highlighting text elements and recognizing objects and their parts, identifying falsification (fake) of a document, text characters in electronic format (digital form) can significantly increase the effectiveness of expert activities in the production forensic research.

Текст научной работы на тему «Метод распознавания текстовой информации из цифровой формы (изображение), определение очередности нанесения реквизитов»

УДК 343 ББК 67

DOI 10.24411/2073-3313-2020-10197

МЕТОД РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ЦИФРОВОЙ ФОРМЫ (ИЗОБРАЖЕНИЕ), ОПРЕДЕЛЕНИЕ ОЧЕРЕДНОСТИ НАНЕСЕНИЯ РЕКВИЗИТОВ

Ахмеджан Атаханович АЛЛАБЕРГАНОВ, аспирант кафедры криминалистики, судебных экспертиз и юридической психологии Байкальского государственного университета, аспирант кафедры «АСУ.

Фотоника, приборостроение, оптические и биотехнические системы и технологии» Томского государственного университета систем управления и радиоэлектроники E-mail: nsk-kapital@mail.ru

Научная специальность: 12.00.12 — криминалистика; судебно-экспертная деятельность;

оперативно-розыскная деятельность

Аннотация. Разработан метод обработки и анализа спектрального пространства, получения изображений и распознавания текста (текстовой информации) видеоспектральным и видеомикроскопическим методом исследования с применением Криминалистического многофункционального комплекса (КМК) при помощи криминалистического программного обеспечения, позволяющий определить признаки объектов, присутствующих на исследуемом (исходном) изображении.

При этом в видимой зоне спектра может быть выделен оптимальный способ (метод) алгоритмической реализации преобразований в зависимости от вида характеристик объекта и их частей. Предложенный метод (способ) исследования — распознавание очередности нанесения реквизитов из цифровой формы, выделение элементов текста и распознавание объектов и их частей, выявление фальсификации (подделки) документа, текстовых знаков в электронном формате (цифровой форме) — способен существенно повысить эффективность экспертной деятельности в рамках производства технико-криминалистического исследования.

Ключевые слова: криминалистическая экспертиза, документ, подделка, очередность нанесения реквизитов, цифровая форма.

Annotation. A method has been developed for processing and analyzing the spectral space, obtaining images and recognizing text (textual information) by the video spectral and video microscopic research method, using the Forensic Multifunctional Complex (CMC) with the help of forensic software, which allows to determine the features of objects that are present on the investigated (source) image. At the same time, in the visible region of the spectrum, the optimal method (method) of the algorithmic implementation of transformations can be selected depending on the type of their characteristics of the object and their parts.

The proposed research method (method), recognition of the sequence of drawing details from a digital form, highlighting text elements and recognizing objects and their parts, identifying falsification (fake) of a document, text characters in electronic format (digital form) can significantly increase the effectiveness of expert activities in the production forensic research.

Keywords: forensic examination, document, fake, sequence of application details, digital form.

ЗАКОН И ПРАВО • 04-2020

Текстовая информация, представленная на бумаге (бумажном носителе) часто переносится в цифровой вид, такой, как изобра-

жение определенного формата, и, значит, может быть помещена в электронный файл, например, формата «PDF» (см. рис. 1).

Рис. 1. Текстовая информация, помещенная в цифровой формат

На сегодняшний день нет достаточно проработанной методики выделения и распознавания текстовой информации, представленной изображением.

Целью работы является распознавание фальсификации из цифровой формы, определение очередности нанесения реквизитов, изменение и формирование самих объектов исследования и их частей при изготовлении

реквизитов и части письма — при изготовлении разными способами текстовой информации. Применение новых способов и методов исследования, а также иных приборов и комплексов с техническими характеристиками оптических измерительных устройств дает возможность выделения элементов текста и распознавания объектов и их частей из цифровой формы (см. рис. 2).

Рис. 2. Исследование при помощи специального видеомикроскопа

Применяемое оборудование

В работе приводится описание приборного комплекса, позволяющего получать изображения текста, обрабатывать их и анализировать.

ЗАКОН И ПРАВО • 04-2020

Патент на изобретение № 2674495. Заявка № 2018133545. Приоритет изобретения 24 сентября 2018 г. Государственная регистрация в Государственном реестре изобретений РФ 11 декабря 2018 г. Срок действия исключительного права на изобретение — 24 сентября 2038 г.

Размещение конструктивных элементов установки на силовом каркасе и обеспечение их подвижности по осям позволяет проводить исследования во всех плоскостях, при этом все упомянутые микроскопы установлены с возможностью изменения своего вертикального и горизонтального положения, поворота на 360е по вертикальной и горизонтальным осям и изменения угла осмотра исследуемого объекта, осуществлять разворот как отдельных элементов, так и всей установки на 360е. Также за счет возможности монтажа / демонтажа установка получается переносной и быстро сборно-разборной.

Оснащение установки упомянутыми микроскопами, съемно установленными с возможностью вращения, позволяет проводить исследования за пределами установки, например, крупногабаритные объекты можно исследовать на расстоянии до 2,5 метров от установки, а также в труднодоступных местах.

Наличие инфракрасных излучателей, ультрафиолетовых излучателей, излучателя белого света и световых фильтров позволяет проводить исследования одновременно в разных зонах спектра и накладывать зоны спектра друг на друга.

Исследование проходит онлайн с электронного файла формата «PDF» при помощи установки — «Многофункционального биолого-видеомикроскопического спектрального комплекса» (см. рис. 3).

Рис. 3. Исследование при помощи специального видеомикроскопа

Алгоритм обработки изображений и распознавания текстовой информации (см. рис. 4).

Рис. 4. Алгоритм обработки и распознавания текста (РТ)

ЗАКОН И ПРАВО • 04-2020

u >

О X

2 го о

о

ГО О

ю о

^ я

S ^

Я S В н

р

н л

3 р

н s л п п

Sc

Sä i

Н i

о я

л

írt

р

ъ

X

V

л

о

W

X

V

о о g рз H Я

Я >в

О о я GJ С о и № S о в

H рз л

РЭ И Й ft я я я о о S

X а ►а о о ЬЗ п )а

я •в рз

¡q о я ft о\ О н

ft В о

й О я

о 3 и о о и ¡4 И » Я

я W и to s аа

» g ft ft Й

я ►а ¡ч

я ft

►в- я я

о я о

•в й я

g рэ рз В н

к Я «

я рэ Й РЭ

я Я рз

й 0J рэ И H

о

¡q Я 1

S Й

Й «т>

3 « iп

►е- я

S о

и »

р в

к S s s о

С\ -g

tri О

О >тЗ

« 2

О Cö Я=

я S

о

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

w

И

3 ^

M

СО ЬЧ

S g

В 5

Й S

о Ыс fcl

S Я рз Й s

о о н о> S ft о Я

S

Э

й рз

Я g

ft

я

рз

ё

рз И

Е

о X

я »

w

ё рэ to

S

Я

ft ft >тз

о н « s

O u Sc g

Й и

ft ¡q

Й

№ Я о о H

я

43 s

о

►л о

s

H

0

01 »

Ol

о

H

и s

Ol 43

SC

H

о

M

о SC

s я е

о

43

s р

в s s

о о

>

п. s

0

1 I

сг

о о s

m

ь

о

00 >

Следует развивать данное направление, позволяющее определять и изучать такие признаки, как части объектов исследования и их части в цифровой форме в обработке изображений.

Формирование спектрального и цветового пространства поверхности документа (объекта исследования)

Изображение текстовой информации содержит цветное и черно-белое изображе-

ние, преобразованное из цветного в черно-белое изображение.

Предлагаемые методы и способы позволяют выделять на изображении текстовую информацию и распознавать ее при помощи соответствующих математических алгоритмов. Выделение шрифта, типа чернил, оттиска печати связано с задачей определения очередности нанесения реквизитов.

Выделение и распознавание на изображении текстовой информации:

где,

± — это изучение падающее на осгьекты; — длина волны (спектра); ]Э — коэффициент отражения;

Используя стандартные библиотеки обработки изображений, можно оценить качество изображения, даваемого оптической системой (цифровой камерой).

Для очистки изображения от шумовой составляющей применяется далее цифровая фильтрация изображений (см. рис. 6).

Рис. 6. Цифровая фильтрация изображений

Обработка и анализ спектрального пространства позволяет определить признаки объектов, которые присутствуют на исследуемом (исходном) изображении.

При исследовании в видимой зоне спектра (см. рис. 7) можно выделить наилучший способ (метод) алгоритмической реализации преобразований в зависимости от вида характеристик объекта и их частей.

ЗАКОН И ПРАВО • 04-2020

Рис. 7. Видимые зоны спектра

При исследовании и обработке выполняется оценка алгоритмов преобразований и анализируются зависимости правильного вычисления признаков в объекте от уровня помех.

Данное исследование подтверждается -эффективностью, качеством и быстродействующим алгоритмом.

Алгоритм обработки изображений, распознавания очередности нанесения реквизитов в цифрофой форме (в различных форматах) (см. рис. 8).

Рис. 8. Алгоритм обработки изображений, распознавания очередности нанесение

реквизитов в цифровой форме

Получение результата:

_I_I_I_

ОЧЕРЕДНОСТЬ НАНЕСЕНИЕ РЕКВИЗИТОВ (В ЗОНАХ ВИДИМОГО СПЕКТРА) ИЗМЕНЕНИЕ ЦВЕТОВОЙ ГАММЫ ДЛЯ ВЫДЕЛЕНИЯ ЭЛЕМЕНТОВ ТЕКСТА (ИЗ ЦИФРОВОЙ ФОРМЫ)

Рис. 9. Очередность нанесения реквизитов (в зонах видимого спектра), изменение цифровой гаммы для выделения элементов текста (из цифровой формы)

ЗАКОН И ПРАВО • 04-2020

На рис. 9 показаны (на основе проведенных автором исследований (судебных экспертиз), с разных цифровых форматов) изменение (с целью подделки) и формирование самих объектов исследования и их частей при изготовлении реквизитов и части письма — при изготовлении разными способами текстовой информации.

Применение данного метода (способа) исследования — распознавание очередно -сти нанесения реквизитов из цифровой формы, выделение элементов текста и распознание объектов и их частей, выявление фальсификации (подделки) документа, текстовых знаков в электронном формате (цифровой форме) — намного продвинет сферу экспертной деятельности в рамках производства технико-криминалистического исследования.

Библиографический список

1. Аллаберганов А.А, Катаев М.Ю. Многофункциональный исследовательский комплекс решения задач анализа текстовой информации. / Междунар. науч.-практ. конф. (МНПК ЭС и СУ — 2018). Часть 1. 227 с.

2. Баринова О.А. Использование современных инструментальных средств для распознавания подлога документов: достоинства и недостатки // Вопросы экспертной практики. 2019. № S1. С. 41—46.

3. Бахтеев Д.В. Компьютерное зрение и распознавание образов в криминалистике // Рос. право: образование, практика, наука. 2019. № 3 (111). С. 66—74.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Булдакова Т.И., Славин О.А., Путин-цев Д.Н. Алгоритмы интеграции результатов распознавания в видеопоследовательностях полей документов, удостоверяющих личность // Междунар. журнал прикладных и фундаментальных исследований. 2017. № 72. С. 172—175.

5. Усилин С.А, Арлазаров В.В, Алиев М.А., Маталов Д.П. Программа распознавания признаков подлинности «Smart Document Forensics». Свидетельство о регистрации программы для ЭВМ RU 2018615343. 07.05.2018 г. Заявка № 2018612851 от 23.03.2018 г.

ЗАКОН И ПРАВО • 04-2020

i Надоели баннеры? Вы всегда можете отключить рекламу.