Научная статья на тему 'Алгоритм идентификации необработанных пиломатериалов'

Алгоритм идентификации необработанных пиломатериалов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
148
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УЧЕТ НЕОБРАБОТАННОЙ ДРЕВЕСИНЫ / АЛГОРИТМ РАСПОЗНАВАНИЯ / IDENTIFICATION ALGORITHM / ИДЕНТИФИКАЦИЯ НЕОБРАБОТАННОЙ ДРЕВЕСИНЫ / ROUGH LUMBER IDENTIFICATION / ЦИФРОВЫЕ ОТПЕЧАТКИ / DIGITAL IMAGES / ROUGH LUMBER ACCOUNTING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Нагаев Игорь Владимирович

Статья посвящена процедуре учета необработанных пиломатериалов. Предложен алгоритм для обработки цифрового отпечатка, с помощью которого возможна идентификация необработанного пиломатериала. Анализ публикаций в этой области выявил, что существующие методики учета обладают рядом недостатков, достаточно дорогостоящи, и в ряде случаев возможность их применения ограничена. Предлагаемый алгоритм объединяет в себе ряд методик, основными из которых являются: бинаризация, оператор Собеля, конвертация в Декартову систему координат, теория Фурье, расчет Евклидовой дистанции (для выполнения процедуры сравнения идентичности).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ROUGH LUMBER IDENTIFICATION ALGORITHM

The article deals with the accounting procedure of rough lumber. It introduces an algorithm of digital image processing enabling rough lumber identification. The analysis of publications on the discussed subject has shown a number of disadvantages of the current accounting procedures: they are rather expensive and their applicability is limited in certain cases. The proposed algorithm combines a number of methods; the most important are binarization, Sobel operator, transformation to a Cartesian coordinate system, Fourier theory, Euclidean distance calculation. The latter is used to compare a digital image identity.

Текст научной работы на тему «Алгоритм идентификации необработанных пиломатериалов»

ment engineering (APEIE-2014): тр. 12 междунар. конф. (Новосибирск, 2-4 окт. 2014 г.): в 7 т. Новосибирск: Изд-во НГТУ, 2014. Т. 4. С. 77-79. 7. Морозов Ю.В. Комплексное моделирование потока данных сейсморазведки = Complex simulation of seismic exploration data stream // Решетневские чтения: материалы 18 междунар. науч. конф., посвящ. 90-летию со дня рождения генер. конструктора ра-кет.-космич. систем акад. М.Ф. Решетнева (Красно-

ярск, 11-14 нояб. 2014 г.): в 3 ч. Красноярск, 2014. Ч. 1. С. 101-103.

8. Морозов Ю.В. Совместное моделирование сигналов при интерпретации геоэлектрических и сейсмических разрезов // Решетневские чтения: материалы 17 междунар. науч. конф., посвящ. памяти генерала конструктора ракет.-космич. систем акад. М.Ф. Решетнева (Красноярск, 12-14 нояб. 2013 г.): в 2 ч. Красноярск, 2013. Ч. 2. С. 64-66.

УДК 004.932.4

АЛГОРИТМ ИДЕНТИФИКАЦИИ НЕОБРАБОТАННЫХ ПИЛОМАТЕРИАЛОВ © И.В. Нагаев1

Иркутский национальный исследовательский технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83.

Статья посвящена процедуре учета необработанных пиломатериалов. Предложен алгоритм для обработки цифрового отпечатка, с помощью которого возможна идентификация необработанного пиломатериала. Анализ публикаций в этой области выявил, что существующие методики учета обладают рядом недостатков, достаточно дорогостоящи, и в ряде случаев возможность их применения ограничена. Предлагаемый алгоритм объединяет в себе ряд методик, основными из которых являются: бинаризация, оператор Собеля, конвертация в Декартову систему координат, теория Фурье, расчет Евклидовой дистанции (для выполнения процедуры сравнения идентичности).

Ключевые слова: учет необработанной древесины; алгоритм распознавания; идентификация необработанной древесины; цифровые отпечатки.

ROUGH LUMBER IDENTIFICATION ALGORITHM I.V. Nagaev

Irkutsk National Research Technical University, 83 Lermontov St., Irkutsk, 664074, Russia.

The article deals with the accounting procedure of rough lumber. It introduces an algorithm of digital image processing enabling rough lumber identification. The analysis of publications on the discussed subject has shown a number of disadvantages of the current accounting procedures: they are rather expensive and their applicability is limited in certain cases. The proposed algorithm combines a number of methods; the most important are binarization, Sobel operator, transformation to a Cartesian coordinate system, Fourier theory, Euclidean distance calculation. The latter is used to compare a digital image identity.

Keywords: rough lumber accounting; identification algorithm; rough lumber identification; digital images.

Цифровая обработка изображений приобретает в настоящее время большое значение во многих областях производственной деятельности. Объемы цифровой информации возрастают из года в год, что требует использования вычислительной техники для автоматизации ее обработки. Это позволяет извлекать из такой информации как можно больше различных сведений.

Опубликованный федеральный закон № 415 от 23.12.2013 г. «О внесении изменений в Лесной кодекс Российской Фе-

дерации и кодекс Российской Федерации об административных правонарушениях» кардинально меняет отношение государства к учету древесины. С 1 июля 2014 г. обязательно наличие специального сопроводительного документа при транспортировке заготовленной древесины, а с 1 января 2015 г. - учет всей срубленной древесины, поштучная маркировка отдельных сортов древесины при поставке за рубеж, возможность подачи лесной декларации и отчета об использовании лесов в электронном виде.

1

Нагаев Игорь Владимирович, кандидат технических наук, доцент кафедры технологии машиностроения, тел.: 89025114069, e-mail: [email protected]

Nagaev Igor, Candidate of technical sciences, Associate Professor of the Department of Technology of Mechanical Engineering, tel.: 89025114069, e-mail: [email protected]

В рамках НИРС (Буевич В.В. «Алгоритм идентификации спилов деревьев на основе их цифровых фотоотпечатков») сделана попытка выполнения однозначной идентификации изображений необработанных пиломатериалов с учетом различных факторов, влияющих на корректность решения: освещенность, зашумленность изображения и т.д.

Процесс полной обработки изображения - от момента создания общей фотографии до назначения уникального идентификатора каждому дереву - состоит из двух этапов. В данной статье рассмотрен первый этап - обработка общего изображения.

Получение входных данных с фотокамеры (рис. 1, а) проводится с соблюдением ряда требований: расстояние фотографирования - 3 метра, в светлое время суток (либо при помощи вспышки) с фиксированными фокусным расстоянием и диафрагмой (соответственно 8 мм и F 1.4). Разделение полученного изображения на прямоугольные области, каждая из которых очерчена вокруг спила (рис. 1, б), позволяет узнать площадь спила и вычислить объем бревна, что может быть использовано для расчета общего объема партии и заполнения сопроводительной документации.

В результате исследований выявлено, что проблема разделения изображения на области может быть решена с помощью SOM {Self Organizing Maps), частного случая самообучающихся нейронных сетей с вероятностью 99% [1].

Полученные сегменты уже на дан-

ном этапе могут использоваться для вычисления объема партии необработанной древесины, загруженной в транспортное средство, а также и для классифицирования по диаметру, т.е. определения качественных характеристик пиломатериала.

Изображение переводится в серую шкалу - оттенки серого цвета, размещенные в виде матрицы в качестве эталонов яркости белого цвета (рис. 2). В компьютерном представлении широко распространенная серая шкала использует на каждый пиксель изображения один байт (8 бит) информации. Такая шкала передает 256 оттенков (градаций) серого цвета, или яркости (значение 0 представляет черный цвет, а значение 255 — белый) [2].

К полученному изображению серой шкалы применяется алгоритм выделения углов. Данная процедура разработана на основе метода Собеля [3], использующего для вычисления градиента первого порядка функции интенсивности специальные ядра. Ядра применяются к каждому пикселю изображения, который помещается в центр ядра, а значения интенсивности в соседних точках умножаются на соответствующие коэффициенты ядра, после чего полученные значения суммируются. Коэффициенты ядра выбираются таким образом, чтобы одновременно выполнялось сглаживание в одном направлении и вычисление пространственной производной - в другом.

Величина градиента определяется как квадратный корень из суммы квадратов значений вертикальной и горизонтальной составляющих градиента.

а б

Рис. 1. Входные цифровые данные (а) и разделение исходного изображения на сегменты (б)

В результате образуется массив чисел, характеризующих изменения яркости в различных точках изображения. Затем выполняется операция сравнения с порогом и определяется положение элементов изображения с наиболее сильными перепадами яркости. Выбор порога является одним из ключевых вопросов выделения перепадов. В качестве основного порога берется средняя для изображения величина градиента. Для достаточно большого изображения с малым числом точек, обладающих сильным перепадом яркости, данной пороговой величины недостаточно, так как оказывается весьма сильным влияние шума. Для ликвидации этой проблемы для каждой точки изображения считается величина, равная средней величине градиента в области 3х3 вокруг анализируемой точки.

В результате обработки получается бинарная матрица, где единицам соответствуют точки со значительным перепадом яркости, нулям - все остальные. В качестве

дополнительной меры в борьбе с шумом и ликвидации возможных разрывов в контурах применяются морфологические операции.

Входной аргумент на этом шаге -изображение серой шкалы, результат работы данной процедуры показан на рис. 3.

Измененное изображение отличается от исходного: четко прослеживается морфология дерева - трещины, ярко выраженные границы бревна.

Однако для ускорения обработки исходного изображения необходимо преобразовать его в бинарную форму, т.е. изображение, содержащее не 256 значений яркости на пиксель, а всего 2. Это также позволит избавиться от неярких точек, которые только создают «шум» и, скорее всего, нам не понадобятся. Смысл бинаризации с точки зрения преобразования заключается в следующем: яркость пикселей ниже 127 изменяем на 0, остальные - на 1 (рис. 4).

Преобразование

Рис. 2. Преобразование изображения в серую шкалу

Рис. 3. Применение алгоритма поиска углов для выделения морфологии среза

на основе метода Собеля

Рис. 4. Результат бинаризации изображения

Преобразованное бинарное изображение удобно для хранения, обработки, а также содержит морфологию среза, что является уникальным для конкретного дерева (его среза).

Необходимо отметить, что указанные преобразования позволяют нивелировать ошибки фотографирования (иное освещение и т.п.), две фотографии одного и того же необработанного пиломатериала, выполненные при разных условиях съемки, после обработки дают практически идентичные результаты.

Для выполнения дальнейшей процедуры идентификации (что подразумевает сравнение) изображения должны иметь одинаковый размер. Следовательно, необходимо выполнить масштабирование бинарных изображений до одинакового размера (рис. 5).

Оптимальный размер изображения получен экспериментальным путем -180х180 пикселей. Такое количество пикселей не случайно: объем файла не превышает 20 Кбайт, а работа с изображением достаточно удобна.

Необходимо отметить возможные проблемы описанного алгоритма:

- повторное фотографирование одного и того же дерева с различными параметрами съемки приведут к появлению на бинарном изображении дополнительных/недостающих точек и штрихов;

- поворот дерева вокруг своей оси полностью исключает возможность попик-сельного сравнения.

Исследования в области сравнения изображений привели в конечном итоге к созданию метода, при котором все эти факторы теряют свое значение, и изобра-

жения могут быть сравнены.

Учитывая то, что дерево в поперечном сечении представляет собой геометрическую фигуру, подобную кругу, а вращаться может только вокруг своей оси, предположим, что его изображение лежит в полярных координатах.

Что это дает? Как бы ни поворачивалось дерево вокруг своей оси, вектора точек от центра к границе окружности будут всегда одни и те же. Следовательно, перейдя от полярной системы координат к декартовой, мы получим изображение всех векторов изображения дерева на прямоугольнике, ширина которого 360 единиц (количество градусов в круге), а высота равна половине ширины изображения, что приблизительно совпадает с радиусом среза дерева. На рис. 6 показан результат работы метода.

Для демонстрации данного метода рассмотрим три изображения в их оригинальной и преобразованной формах (рис. 7).

При сравнении декартовых изображений А и А, повернутых на 180°, заметно смещение, произошедшее в результате поворота. Вектора остались абсолютно идентичными, сменился лишь их порядок. Сравнивая декартово представление изображения А и Б четко видим разницу, также как и видна отчетливая разница между двумя изображениями.

Декартовая форма представляет собой цифровое изображение в виде набора строк и столбцов пикселей. После преобразования получены векторы, сравнивая некоторым образом которые, можно решить задачу идентификации.

Масштабирование

Рис. 5. Изображение после масштабирования

Рис. 6. Переход из полярной системы координат в декартову

а б в

Рис. 7. Сравнение изображений: а - изображение А в оригинальной форме, б - изображение А, повернутое на 180о; в - изображение Б

Однако прямое сравнение векторов не даст однозначного совпадения по ряду причин, описанных выше. Необходимо по каждому изображению рассчитать некоторый ключ, значение которого у похожих и одинаковых изображений будет также схожим, различие между ними будет минимально.

Одним из вариантов ключа может служить средняя яркость, термин из теории сигналов и преобразования Фурье. Но средние яркости изображений тоже могут находиться очень близко, особенно если изображений в базе много. Если взглянуть теперь на преобразование Фурье, то можно увидеть, что уже из определения следует, что само по себе преобразование уникально, но при его использовании мы не будем привязаны к точкам и их конкретному расположению на изображении, т.е. тот самый уникальный ключ, но, в то же время, очень схожий для изображений со сходным содержимым, и есть не что иное, как преобразование Фурье.

На данном шаге мы будем рассчитывать преобразование Фурье, используя быстрое преобразование Фурье (БПФ) для ускорения процесса обработки.

Ключ будет представлять собой набор из 256 значений. Число 256 - это квадрат размерностью 16х16 значений, на которые мы разделим изображение Фурье после БПФ основного изображения. Сравнение ключей осуществляется с помощью расчета Евклидовой дистанции между двумя квадратами 16х16.

Тестовым методом был выведен коэффициент, по которому делается вывод о том, совпали изображения или нет.

Последний шаг данного этапа: вся информация, полученная в процессе работы алгоритма, фиксируется в базе данных.

Часть информации из базы данных используется как входная на этапе сравнения изображений, часть для математической модели учета, заготовки, транспортировки, переработки и сбыта древесины.

Информация, доступная из базы

данных: дата и время создания фотографии партии деревьев, фотография партии деревьев, уникальный идентификатор партии, изображение каждой области (отдельные деревья), уникальный идентификатор

для каждого дерева, преобразованное в декартовы координаты изображение дерева, ключ данного дерева (результат БПФ).

Статья поступила 25.05.2015 г.

Библиографический список

1. Введение в контурный анализ; приложения к ражений. М.: Техносфера, 2005. 1072 с. обработке изображений и сигналов / Я.А. Фурман 3. Sobel I. An isotropic 3x3 image gradient operator // [и др.]. 2-е изд., испр. М.: Физматлит, 2003. 592 с. Machine Vision for Three-Dimensional Scenes. San

2. Гонсалес Р., Вудс Р. Цифровая обработка изоб- Diego: Academic Press, 1990. P. 376-379.

УДК 004.414.22

ОТРАЖЕНИЕ ТРЕБОВАНИЙ ПОЛЬЗОВАТЕЛЯ В СОВРЕМЕННЫХ СТАНДАРТАХ ПРОЕКТИРОВАНИЯ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

© А.П. Петров1

Иркутский национальный исследовательский технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83.

Появление автоматизированных систем повлекло за собой потребность в формулировании требований к их разработке. С течением времени по мере развития систем менялись и требования к ним. Однако до настоящего момента не выработано формальных способов их корректного формулирования, что приводит к проблемам при проектировании и последующей эксплуатации систем. В статье кратко рассмотрены вопросы отражения требований к информационным системам, сформулированных как в ГОСТ советского периода, так и в аналогичного рода документах на современном этапе.

Ключевые слова: стандарты создания автоматизированных систем; стадии создания автоматизированных систем; требования к информационным системам

USER'S REQUIREMENT REFLECTION IN MODERN DESIGN STANDARDS OF AUTOMATED INFORMATION SYSTEMS A.P. Petrov

Irkutsk National Research Technical University, 83 Lermontov St., Irkutsk, 664074, Russia.

Emergence of automated systems has caused the need to formulate the requirements for their development. Over time, the requirements for the systems have changed with their development. However, there is still no formal methods of their correct formulation that causes problems in design and subsequent operation of systems. The article summarizes the issues dealing with the requirements to information systems formulated both in the Soviet period standards and contemporary similar documents.

Keywords: automated system development standards; stages of automated system creation; requirements for information systems.

Внедрение автоматизированных систем управления для предприятий в России началось с 60-х гг. ХХ века. Создавались такого типа системы при ориентации на те вычислительные возможности ЭВМ, которыми они обладали в те годы.

На заре внедрения ЭВМ все предприятия в нашей стране разрабатывали системы управления исключительно под внутренние нужды, а поддержанием их ра-

ботоспособности и функциональным дополнением занимались штатные отделы АСУ, которые имелись на каждом из них. Объяснялось это тем, что производство вычислительной техники относилось фактически к крупносерийному производству, стоимость одной ЭВМ была довольно высока, и предприятие не могло позволить себе, за редким исключением, иметь больше одной вычислительной машины. Кроме

1

Петров Александр Павлович, аспирант кафедры автоматизированных систем, тел.: 89149327011, e-mail: [email protected]

Petrov Alexander, Postgraduate of the Department of Automated Systems, tel.: 89149327011, e-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.