УДК 004.932.2
АНАЛИТИЧЕСКИЙ ОБЗОР МЕТОДОВ РАСПОЗНАВАНИЯ ДВУМЕРНЫХ ШТРИХКОДОВ
Л. А. Подколзина
Донской государственный технический университет, г. Ростов-на-Дону, Российская Федерация
Технология считывания штрих-кодов с использованием мобильных устройств широко используется для решения повседневных задач поиска информации об объектах. В настоящей работе были рассмотрены механизмы поиска, предварительной обработки и локализации двумерных штрих-кодов. Посредством анализа полученной информации было выявлено, что в настоящее время большинство доступных приложений для работы со штрих-кодами фокусируются на эффективном декодировании штрих-кодов. Обнаружение штрих-кода на изображении является актуальной проблемой, которая должна быть решена с использованием методов обнаружения объектов общего назначения. Из-за различий в условиях и методах съемки каждое приложение имеет свои собственные требования к скорости и точности обнаружения штрих-кодов. Ввиду сложности локализации двумерных штрих-кодов алгоритмы их поиска постоянно совершенствуются, дополняются новыми математическими и алгоритмическими инструментами, обзору и анализу которых посвящена данная работа. Ключевые слова: компьютерное зрение, штриховое кодирование, распознавание образов, линейные коды, двумерные штрих-коды, О^-код.
L4QQ/J
UDC 004.932.2
ANALYTICAL REVIEW OF METHODS FOR RECOGNITION OF TWO-DIMENSIONAL BARCODES
L. A. Podkolzina
Don State Technical University, Rostov-on-Don, Russian Federation
Barcode detection by mobile devices is widely used to solve everyday tasks of searching for information about objects. In this article, the mechanisms of searching, preprocessing and localization of two-dimensional barcodes have been considered. It has been clarified that most of the currently available bar code applications focus on effective barcode decoding. Barcode detection in a picture is a topical problem that needs to be solved using general object detection methods. Due to differences in shooting conditions and methods, each application has its own requirements for the speed and accuracy of barcode detection. Due to the complexity of the problems of localization of two-dimensional barcodes, the algorithms for their search are constantly being improved, including new mathematical and algorithmic tools, a review of which is given in this paper.
Keywords: computer vision, barcode, barcode recognition, liner barcode, 2D barcode, QR code
Введение. Штрих-код является одним из наиболее широко используемых методов для автоматической идентификации объектов. Существует две категории штриховых кодов — одномерные (линейные) и двумерные [1]. Процесс распознавания любого штрих-кода состоит из задачи его локализации и декодирования хранимых данных. Сначала появились одномерные коды, использующие для кодирования информации сегменты параллельных линий различной ширины.
Классический одномерный штрих-код кодирует информацию с использованием толстых и тонких линий, разделенных белыми полосами. Одномерный (линейный) штрих-код может быть прочитан только в одном направлении. К началу 1980-х годов использование классического штрих-кода стало недостаточным по причине ограниченного количества информации, которую он способен хранить.
Большинство линейных штрих-кодов могут кодировать только номера, причем в ограниченном количестве. Как следствие, возникла потребность в штрих-кодах, способных вмещать большой объем закодированной информации путем возможности хранения и считывания информации в двух направлениях. Для решения этой проблемы были созданы двумерные штриховые коды.
Постановка задачи. Современные алгоритмы не требуют дополнительной помощи человека относительно ориентации кода, положения и скорости обработки изображения [2, 3]. Большинство алгоритмов идентификации штрих-кодов основаны на поиске их уникальных характеристик. В области обнаружения штрих-кодов было проведено множество исследований, однако большинство методов обнаружения чаще всего применимы на небольшом расстоянии от камеры и при наличии четкого фона. Обнаружение штриховых кодов на полученных камерой изображениях с большим фоном является сложной задачей. Важными параметрами систем распознавания штрих-кодов являются быстродействие и точность при идентификации объектов. Алгоритмы локализации штриховых кодов постоянно совершенствуются, поэтому их периодический обзор является актуальной научной задачей.
Теоретическая часть. Существующие виды двухмерных штрих-кодов по способу хранения информации можно поделить на два вида: матричный (matrix) и многоуровневый (stacked). Наибольшее распространение получил матричный вид штрих-кода.
Его основными преимуществами, по сравнению с линейным, являются:
- больший объем хранимой информации;
- масштабируемость размеров;
- наличие встроенных механизмов для коррекции ошибок (ECC);
- возможность размещения непосредственно на товаре;
- простота считывания.
Благодаря этим преимуществам двухмерные штрих-коды получили широкое распространение в торговле, логистике, производстве и рекламе.
В настоящее время существует большое количество двухмерных штриховых кодов, наиболее популярными среди которых являются Aztec Code, DataMatrix, PDF-417 и QR Code. У каждого из них есть свои достоинства и недостатки, что позволяет выбирать вид штрихового кодирования в зависимости от поставленной задачи. Современные алгоритмы и системы распознавания штрих-кодов во многих случаях обрабатывают изображения, находящиеся параллельно плоскости камеры или же расположенные только под одним углом. Сама процедура распознавания в таких случаях значительно упрощается, как и время на получение конечного результата. Однако поддержка распознавания кодов, нечувствительных к наклону камеры и углу поворота, имеет большое значение для расширения функциональности сканеров кодов, при этом алгоритмы распознавания должны быть достаточно быстры для использования на мобильных системах.
В отличие от распознавания одномерных кодов, где необходимо прочитать и декодировать штриховую линию, для двухмерных кодов необходимо чётко определить не только границы, но и синхронизирующие элементы — четыре угловые точки. Используя алгоритмы, описанные в ряде
14QQ/J
работ, например, в [4-9], можно выделить общий подход к распознаванию двухмерных бар-кодов с произвольным углом наклона и поворота камеры. Общий алгоритм распознавания двухмерного кода:
1. предварительная обработка изображения;
2. детектирование ориентировочных элементов (границ и краевых точек кода);
3. восстановление матрицы кода;
4. декодирование данных.
Рассмотрим подробно каждый из этапов алгоритма.
Предварительная обработка изображения. На этапе предварительной обработки осуществляется переход к монохромному изображению путём установления уровня пороговой яркости или с помощью адаптивных методик, технологии которых реализованы в библиотеках ImagePak [10] и OpenCV [11]. Также выделяются граничные точки, соприкасающиеся как с чёрными, так и с белыми пикселями.
Детектирование ориентировочных элементов. Поскольку использование приложений накладывает особые ограничения, существует постоянная потребность в новых решениях с повышенной эффективностью. Существует несколько методов локализации штрих-кодов, которые характеризуются используемыми технологиями обработки, точностью и скоростью. Однако современные алгоритмы, давая эффективные методы на этапе декодирования, все еще не имеют универсальных решений для этапа локализации, что привлекает пристальное внимание к необходимости исследований на этом этапе распознавания штрих-кодов.
Большинство методов для обнаружения различных типов двумерных штрих-кодов в разнообразных условиях работают при наличии четкого фона, а в случае проблем с фоном задача локализации штрих-кодов усложняется.
A. Kutiyanawala и др. [5] предложили эффективный способ локализации области штрих-кода на изображении. В работе был использован многоканальный метод фильтрации Габора, где для каждого отфильтрованного изображения применялся рандомизированный иерархический метод поиска горизонтальных сегментов той же длины. Затем для каждого из сегментов вычислялась частотная мера. Если частотная характеристика была больше заданного порога, предполагалось, что она является линией сегмента с высокой частотой. Сходство между линиями высокочастотных отрезков сравнивалось с алгоритмом самой длинной общей подпоследовательности (LCS). Для выбора ограничительной рамки выбирались линии с высокой частотой и схожестью. Вычислялась гистограмма вдоль оси Х и оси Y для всех выбранных парных линий. В работе предполагалось, что гистограмма изображения со штрих-кодом будет иметь один пик с амплитудой выше порогового значения. Положение штрих-кода локализовалось путем анализа начальной и конечной координат точек пиков, а ориентация штрих-кода определялась как угол поворота изображения.
Luping Fang и Chao Xie [6] предложили алгоритм для нахождения штрих-кода, расположенного на изображении при наличии сложного фона в пространственной области. Вначале выполняется предварительная обработка изображения с применением понижающей дискретизации, преобразование изображения в градации серого и повышение контрастности. Затем вычисляются градиенты изображения вдоль направлений 0°, 45°, 90° и 135° и применяется улучшенное ядро Собеля.
Хи Хан и Joung Koo Jound [7] предложили метод для извлечения образцов штрихового пространства из бинаризированного изображения. Этот метод использует местоположение и расстояние между крайними точками, а применяется для локализации PDF-417 кода.
Последние тенденции в усовершенствовании вычислительных мощностей портативных устройств позволяют использовать классификаторы машинного обучения, основанные на более сложных функциях, чем те, которые используются в устройствах сканеров штрих-кодов [8, 9].
Восстановление матрицы кода. После нахождения границы необходимо определить, сколько строк и столбцов требуются для прочтения матрицы. Для различных видов кода существуют различные способы, поэтому их выбор зависит от типа штрих-кода.
Декодирование данных. Некоторые штрих-коды содержат метаинформацию, необходимую для правильного считывания данных с применением коррекции. Полученная на этой стадии двоичная строка далее декодируется в зависимости от типа штрих-кода.
Заключение. В данной работе были рассмотрены механизмы поиска, предварительной обработки и локализации двумерных штрих-кодов. Анализ существующих алгоритмов позволил автору сделать выводы о том, что большинство доступных в настоящее время приложений для работы со штрих-кодами фокусируются на эффективном декодировании штрих-кодов и рассматривают основную задачу обнаружения штрих-кода на изображении как побочную проблему, которая должна быть решена с использованием методов обнаружения объектов общего назначения. Учитывая высокую сложность проблемы локализации двумерных штрих-кодов автору представляется перспективным усовершенствовать алгоритм их поиска, а также дополнить его новыми математическими и алгоритмическими инструментами.
Библиографический список.
1. Zamberletti A.; Gallo I.; Albertini S. Robust Angle Invariant 1D Barcode Detection // Pattern Recognition (ACPR), 2013 2nd IAPR Asian Conference, 2013. pp. 160-164. DOI: 10.1109/ACPR.2013.17
2. Lin Jeng-An, Fuh Chiou-Shann. 2D barcode image decoding. // Mathematical Problems in Engineering, 2013.Vol. 2013. P.10. DOI: 10.1155/2013/848276.
3. Parikh Devi, Jancke Gavin. Localization and segmentation of a 2D high capacity color barcode. // In Applications of Computer Vision, 2008. WACV 2008. IEEE Workshop on, 2008. P. 1-6. DOI: 10.1109/WACV.2008.4544033.
4. Rogers D., Adams A. Mathematical elements for computer graphics. Second Edition. // Publ. McGraw-Hill Science Engineering Math 1989. P. 512.
5. Kutiyanawala A., Xiaojun Qi, Jiandong Tian. A simple and efficient approach to barcode localization // Inf. Commun.Signal Process. 2009 Icics 2009 7th Int.Conf.,pp.1-5. DOI: 10.1109/ICICS.2009.5397472.
6. Luping Fang, Chao Xie. 1D Barcode Localization in Complex Background // Comput. Intell. Softw. Engng Cise 2010 Int. Conf., 2010, pp.1-3. DOI: 10.1109/CISE.2010.5677072.
7. Hee Il Hahn , Joung Koo Joung. Implementation of algorithm to decode two dimensional barcode PDF-417. //Signal Process. 6th Int. Conf., 2002. Vol. 2. Pp.1791-1794. DOI: 10.1109/ITOSP.2002.1180150
8. Luiz F. F. Belussi, Nina S. T. Hirata. Fast QR code detection in arbitrarily acquired images. // In Graphics, Patterns and Images (Sibgrapi), 24th SIBGRAPI Conf., 2011, P. 281-288.
9. Istvan Szentandrasi, Adam Herout, Marketa Dubska. Fast detection and recognition of QR codes in high-resolution images. // Proc. 28th Spring Conf. Computer Graph., SCCG '12, 2012, P. 129-136. DOI: 10.1145/2448531.2448548.
10. ImagePak [Электронный ресурс] / VIDIKON. — Режим доступа : http://imagepak.vidikon.com (дата обращения : 16.03.17).
11. Platforms [Электронный ресурс] / OpenCV. — Режим доступа : http://opencv.org (дата обращения : 16.03.17).