Научная статья на тему 'ПРИМЕНЕНИЕ ПЕРЦЕПТИВНОГО ХЭШИРОВАНИЯ ДЛЯ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ'

ПРИМЕНЕНИЕ ПЕРЦЕПТИВНОГО ХЭШИРОВАНИЯ ДЛЯ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
101
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ / ПЕРЦЕПТИВНОЕ ХЭШИРОВАНИЕ / ХЭШ-ФУНЦИИ / ДИСКРЕТНОЕ КОСИНУСНОЕ ПРЕОБРАЗОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Головачева М.И.

Статья посвящена задаче классификации изображений. Автором предлагается использование алгоритмов перцептивного хэширования в качестве метода классификации изображений. В статье приводится описание pHash алгоритма, основанного на дискретном косинусном преобразовании. Также приводится пример и результаты классификации с применением данного алгоритма.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE APPLICATION OF PERCEPTUAL HASHING FOR IMAGE CLASSIFICATION

The article deals with classification of images. The author proposes the use of algorithms for perceptual hashing as a method of classification of images. The article describes the pHash algorithm based on discrete cosine transformation. Also provides an example of the results of classification using this algorithm.

Текст научной работы на тему «ПРИМЕНЕНИЕ ПЕРЦЕПТИВНОГО ХЭШИРОВАНИЯ ДЛЯ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ»

URL: https://www.mathworks.com/help/optim/ug/linprog.html7requestedDomain =www.mathworks.com (дата обращения 03.02.2017).

7. Optimization Toolbox. Решение стандартных и больших задач оптимизации [Электронный ресурс]. URL: http://matlab.ru/products/optimization-toolbox/optimization-toolbox-rus web.pdf (дата обращения 01.02.2017).

8. Программный комплекс IOSO NM [Электронный ресурс]. URL: http://www.iosotech.com/ru/ioso nm.htm (дата обращения 02.02.2017).

УДК 004.932

Головачева М.И. студент магистратуры 2 курса Институт энергетики и автоматизированных систем

Магнитогорский государственный технический университет им. Г.И. Носова Российская Федерация, г. Магнитогорск ПРИМЕНЕНИЕ ПЕРЦЕПТИВНОГО ХЭШИРОВАНИЯ ДЛЯ

КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ Аннотация: статья посвящена задаче классификации изображений. Автором предлагается использование алгоритмов перцептивного хэширования в качестве метода классификации изображений. В статье приводится описание pHash алгоритма, основанного на дискретном косинусном преобразовании. Также приводится пример и результаты классификации с применением данного алгоритма.

Ключевые слова: классификация изображений, перцептивное хэширование, хэш-фунции, дискретное косинусное преобразование.

Golovacheva M.I. graduate student

2 course, Power Engineering and Automated Systems Institute Nosov Magnitogorsk State Technical University Russian Federation, Magnitogorsk THE APPLICATION OF PERCEPTUAL HASHING FOR IMAGE

CLASSIFICATION Abstract: the article deals with classification of images. The author proposes the use of algorithms for perceptual hashing as a method of classification of images. The article describes the pHash algorithm based on discrete cosine transformation. Also provides an example of the results of classification using this algorithm.

Key words: image classification, perceptual hashing, hash functions, discrete cosine transform.

Задача классификации - одна из классических задач машинного обучения. Данная задача имеет следующую формулировку: имеется множество объектов, разделённых некоторым образом на классы. Задано

конечное множество объектов, для которых известно, к каким классам они относятся. Это множество называется обучающей выборкой. Классовая принадлежность остальных объектов неизвестна. Требуется построить алгоритм, способный классифицировать произвольный объект из исходного множества [1].

Для классификации изображений можно применить алгоритм перцептивного хэширования.

Хэширование - это способ отображения множества данных произвольной длины в битовую строку фиксированной длины.

Перцептивные хэш-функции извлекают определенные признаки из изображения и на их основании вычисляют хэш - своеобразный отпечаток изображения. Далее, используя специальные функции, сравниваются значения хэшей изображений. Эти функции вычисляют коэффициент различия или сходства между двумя значениями перцептивных хэшей. Заключение о схожести изображений затем составляется на основании выбранного порогового значения [2].

В качестве примера, выполним классификацию 2539 изображений с различными вариантами начертаний буквы «а».

С помощью метода к-средних [3] выделим 8 центров кластеров, которые представлены на рисунке 1.

а а а а

л а а а

Рисунок 1 - Изображения центров кластеров

Выполним хэширование центров кластеров и изображений, классовая принадлежность которых неизвестна. Хэширование можно выполнить, например, с помощью метода рНаБИ, основанного на дискретном косинусном преобразовании (БСТ). В этом методе изображение рассматривается как совокупность пространственных волн. Дискретное косинусное преобразование позволяет переходить от пространственного представления изображения к его спектральному представлению и обратно.

Для построения перцептивного хеша с использованием дискретного косинусного преобразования необходимо:

1. Перевести изображение в оттенки серого;

2. Уменьшить изображение до квадрата 32*32 пикселя;

3. Выполнить дискретное косинусное преобразование для полученного изображения;

4. Выделить из полученной матрицы матрицу 8*8, начиная со второй строки и столбца;

5. Вычислить среднее значение элементов матрицы;

6. Построить хэш из полученной матрицы путем сравнения элементов со средним [2].

Для определения степени принадлежности изображения к тому или

иному кластеру будем применять расстояние Хэмминга, которое вычисляет число позиций, в которых соответствующие символы двух слов одинаковой

Таблица 1 - Результаты классификации изображений

Центр кластера

а а а я

Л

Изображение 1

а

а а

А

А

Изображение 2

а

а а я

А

Изображение 3

а

¿1 а а

длины различны. Расстояние Хэмминга задается следующей функцией:

где X) - сравниваемые объекты, р - размерность объектов.

Если расстояние Хэмминга меньше 10, то между центром кластера и изображением есть сходство, поэтому последнее можно отнести к данному кластеру. Для проведения классификации необходимо сравнить каждое изображение с каждым центром кластера.

а а а а а а а а

а a a а

В таблице 1 приведены примеры полученных результатов классификации для каждого кластера.

Таким образом, была показана эффективность применения на практике алгоритма перцептивного хэширования для классификации изображений. Помимо метода pHash, основанного на дискретном косинусном преобразовании, существует множество других алгоритмов перцептивного хэширования, таких как хэш на основе гистограмм цветов, хэш по среднему и т.д. Описание данных алгоритмов дано в статье авторов И.В. Рудакова и И.М. Васютович [2].

Использованные источники:

1. Классификация. Машинное обучение [Электронный ресурс]. URL: http://www.machinelearning.ru/wiki/index.php?title=Классификация (дата обращения 03.02.2017).

2. Рудаков И.В. Исследование перцептивных хеш-функций изображений / И.В. Рудаков, И.М. Васютович // Наука и образование: научное издание МГТУ им. Н.Э. Баумана. - М.: МГТУ им. Н.Э. Баумана, 2015. - №8. - 269280 с.

3. Методы кластерного анализа. Итеративные методы [Электронный ресурс]. URL: http://www.intuit.ru/studies/courses/6/6/lecture/184 (дата обращения 04.02.2017).

УДК 614.876

Гранкина А. С. студент 4 курса Любин Н.А., д.б.н. профессор

ФГБОУ ВО Ульяновская ГСХА Россия, г. Ульяновск РАДИАЦИОННЫЙ КОНТРОЛЬ ПРОДУКТОВ ПИТАНИЯ Аннотация. Радиологический контроль продуктов питания и воды, нормирование и содержание в них радионуклидов имеет первостепенное профилактическое значение в зонах повышенной радиации.

Ключевые слова: радиобиология, пищевые продукты, радиоактивное загрязнение, цезий, стронций.

i Надоели баннеры? Вы всегда можете отключить рекламу.