АЛГОРИТМ ОБНАРУЖЕНИЯ ДУБЛИКАТОВ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ С ИСПОЛЬЗОВАНИЕМ ЭФФЕКТИВНЫХ ЛИНЕЙНЫХ ЛОКАЛЬНЫХ ПРИЗНАКОВ
Кузнецов А.В.1, Мясников В.В.1,2 1 Институт систем обработки изображений РАН, 2 Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет)
Аннотация
В статье предлагается новый алгоритм обнаружения на изображениях дубликатов -совпадающих фрагментов изображения. Алгоритм использует представление анализируемого фрагмента изображения в виде значения специально подобранной хэш-функции. Собственно, хэш-функция строится с использованием эффективных линейных локальных признаков. Представлены результаты проведённых исследований разработанного нового алгоритма, сравнение с существующими, а также даны рекомендации по их применению.
Ключевые слова: цифровое изображение, дубликат, хэш-функция, хэш-таблица, гистограмма, простое поле Галуа, линейные локальные признаки.
Введение
В современном мире цифровые изображения являются одним из основных источников информации в различных сферах жизнедеятельности. Фотографии являются подтверждением каких-либо событий, космические снимки отражают состояние какой-либо территории и т.д. Изображения могут быть искажены злоумышленниками с целью скрыть или изменить информацию, содержащуюся в них.
Самым часто используемым способом подделывания изображения является копирование и вставка области этого же изображения. Такие атаки будем называть дублированием фрагментов цифрового изображения, а копируемые области - дубликатами. Существует большое количество работ [1-4], посвящённых разработке алгоритмов обнаружения подобных атак: общим в них является разработка некоторых признаков, инвариантных к различным искажениям дубликатов (яркост-ные, геометрические), вычисляемых для положений скользящих окон с перекрытиями. В работе авторов [5] рассматривался подход к обнаружению дубликатов без искажений, в основе которого лежало вычисление значений разработанных хэш-функций. В данной работе речь пойдёт о разработке новых хэш-функций, на основе которых будет построен алгоритма обнаружения неискажённых дубликатов.
Работа построена следующим образом. В первой части дано краткое определение дубликата и хэш-функции, а также координатного шаблона, лежащего в основе алгоритма обнаружения. Вторая часть посвящена собственно разработке алгоритма поиска дубликатов по координатному шаблону. В третьей части приводятся краткие теоретические сведения об эффективных линейных локальных признаках (ЛЛП). Четвёртый раздел посвящён разработке оптимальной хэш-функции на основе ЛЛП. В пятом разделе приводятся экспериментальные исследования предложенной хэш-функции и выявляются оптимальные параметры алгоритма обнаружения дубликатов по шаблону. В заключении приводятся выводы и даются рекомендации по использованию разработанных хэш-функции и алгоритма.
1. Понятие дубликата и хэш-функции
По аналогии с работой [6], определим цифровое изображение размера МхЫ как отображение вида:
/: N х N ® В8
N.
- множество целых чисел
где В °{0,1}, {0,1,...,М -1} .
Определим также координатный шаблон как конечное множество координат {(0,0),...,(т,п)}, обладающее следующими свойствами:
- координатный шаблон содержит координату (0,0);
- координатный шаблон не содержит координат с отрицательными значениями;
- координатный шаблон является четырёхсвязным [6].
Введём также в рассмотрение специальный вид координатного шаблона, обозначаемый далее N (3, а, Ь) и задаваемый следующим образом:
О, (1)
N(3,а,Ь) ° и П(а,Ь,
(т,п)е3
где множество координат П( а, Ь, (т, п), (т, п +1),..
, п ) задаётся в виде , (т, п + Ь -1),
П(а,Ь,т,п) ° <
(т + а -1, п),..., (т + а -1, п + Ь -1)
а конечное множество неотрицательных координат 3 может быть достаточно произвольным, но гарантирующим выполнение для N(3, а, Ь) свойств координатного шаблона (совпадающие пары координат считаем одним элементом множества).
Будем говорить, что на изображении присутствуют дубликаты по шаблону N(3, а, Ь), если существует по
крайней мере две пары координат (т', п') и (т", п"), для которых выполняется следующее множество равенств: / (т + т, п + п ) = / (т" + т, п + п),
"(т,п)е N(3,а,Ь).
Приведённая система равенств по сути означает поэлементное совпадение фрагментов изображения,
Д11\ I | УI I ши
t (m,n{>
расположенных в позициях (т" п ) и (т", п") и имеющих «форму», определяемую координатным шаблоном N(3, а, Ь).
Под поиском дубликатов по шаблону N(3, а,Ь) будем понимать задачу указания для каждого отсчёта (т,п), определяющего начало фрагмента изображения с «формой», определяемой координатным шаблоном N(3,а,Ь), уникального номера t(т,п)е N, характеризующего фрагмент следующим образом: 0, нет дубликата I > 0, номер «типа» дубликата
Под номером «типа» дубликата понимается некоторый уникальный номер, который оказывается одинаковым для совпадающих фрагментов (различающиеся фрагменты имеют различные номера).
Замечание 1. Представление конкретного координатного шаблона может быть не единственным. В
частности, шаблон вида N({(0,0)1,10,10) определяет то же самое множество координат, что и шаблоны N({(0,0), (1,0)},10,9) и
N({(0,0), (0,5), (5,0), (5,5)},5,5). Эта неоднозначность представления в дальнейшем будет использована при построении алгоритма поиска дубликатов.
Хэш-функцией фрагмента изображения с «формой», определяемой координатным шаблоном N(3,а,Ь) (далее фрагмента изображения по шаблону), будем называть отображение вида:
Т : В8 ^3аЬ)|® N,,
жт ^ N(3^,4)1
где N £ 2 1 1 определяет множество возможных значений хэш-функции. По сути, хэш-функция переводит значения поля яркости конкретного фрагмента изображения (с определённым шаблоном) в некоторую целочисленную неотрицательную величину в диапазоне [0, Ь -1]. В работе авторов [5] были предложены два способа построения хэш-функции для координатных шаблонов «прямоугольного» вида П(а, 4,0,0). В частности, лучшим оказалась хэш-
функция, использующая теоретико-числовое представление фрагмента изображения, задание которой производится следующим образом.
Пусть для получения хэш-значения используются все биты отсчётов координатного шаблона, тогда хэш-функция будет выглядеть следующим образом: Н (т, п, /)° / (т, п )• 28(а4-1) +
+/(т,п +1)- 28(а4-2) +... + / (т + а -1,п + Ь -1)- 20.
Ввиду того, что выделить память для хранения таких значений невозможно на стандартных ПЭВМ, было предложено [5] использовать представление
(1а)
H (m,n, f) в виде остатков от деления на R взаим-
но-простых чисел br, r = 0, R -1 (китайская теорема об остатках [7]). Тогда общий вид хэш-функции Hr (m,n, f) выглядит следующим образом:
Hr (m,n, f ) = Hr (m,n, f)modbr. (1б)
Указанная хэш-функция выступает в качестве прототипа для сравнения с предлагаемой ниже новой хэш-функцией. При этом сам предлагаемый алгоритм обнаружения дубликатов может быть использован вне зависимости от используемого варианта хэш-функции и описан в следующем разделе работы.
2. Алгоритм обнаружения дубликатов по шаблону
Пусть решается задача поиска дубликатов по шаблону N(3,a,b), представимому в виде (1). Предлагаемый алгоритм предполагает последовательный анализ всех возможных положений фрагментов П(a, b, m, n) изображения в режиме «скользящего
окна» [6]. То есть при каждом положении (m,n) по
значениям
f (m', n )
соответствующего
фрагмента изображения вычисляется значение хэш-функции, которое:
- используется для обновления хэш-таблицы Н ^), содержащей абсолютные частоты появления
соответствующих значений t хэш-функции. Эта хэш-таблица фактически содержит отсчёты ненормированной гистограммы для хэш-функции;
- заносится в изображение потенциальных «типов» фрагментов Т (т, п).
Очевидно, что, поскольку в представлении (1) шаблона N(3, а, Ь) используется несколько «прямоугольных» шаблонов П(а,Ь,т,п), анализируемый в позиции (т , п ) фрагмент изображения по шаблону N(3, а, Ь) может оказаться дубликатом только в том
случае, если все |3| фрагментов вида
f (m + m, n + n)
(m,n)e 3
1(т',п')еП(а,6,т,п)
оказались дубликатами. Таким образом, решающее правило отнесения фрагмента к определённому типу дубликата имеет вид:
[0, 3(т,п)е 3 Н(Т(ш + т,п + п)) £ 1;
t (mn ) ° •
T (m', n ) +1,
ei а^а.
Разработанный алгоритм в псевдокоде выглядит следующим образом:
FOR i=0 to M-1 FOR j=0 to N-1 BOOL isDuplicate = true;
t (i, j ) = 0;
FOREACH (m, n) in 3
IF (H (T (/ + m, j + n ))< 1)
isDuplicate = false;
BREAK;
END IF
END
IF (isDuplicate)
t (i, j ) = T (i, j) +1;
END IF END
END
Можно заметить, что в силу неоднозначности построения представления (1) для конкретного координатного шаблона N (3, a, b) (см. Замечание 1) сам алгоритм также в общем случае определён неоднозначно. По этой причине в экспериментальных исследованиях, проведённых в настоящей работе, рассматривался ряд вопросов, касающихся оптимального (в смысле показателя качества) способа построения представления (1) для конкретного координатного шаблона.
3. Эффективные линейные локальные признаки
Как можно видеть выше, значения хэш-функции являются результатами скалярного произведения значений отсчётов изображения и некоторого фильтра с конечной импульсной характеристикой - КИХ-фильтра. Для таких операций существует достаточно развитая теория построения эффективных КИХ-фильтров, позволяющих для конкретной задачи получить наилучший способ расчёта значений хэш-функции - линейных локальных признаков (ЛЛП) исходного изображения. В данном разделе представлено краткое изложение необходимых сведений и понятий из работ [8,9], опубликованных Мясниковым В.В.
Пусть K - алгебраическая система, имеющая свойства коммутативного кольца с единицей. В частности, в качестве K может выступать простое поле Галуа GF(p).
Линейным локальным признаком длины M над K
пара ({h (mе A), где {h(mГ
называется
- не-
которая КИХ, задаваемая в виде конечной последовательности над К и удовлетворяющая ограничению h(т)Ф0,h(M-1) Ф0, а A - алгоритм вычисления свёртки произвольного входного сигнала над К с
КИХ {h (т С.
Представление последовательности к (0), к (1),..., к (M -1) над К в виде:
,'0, т < 0,
h (m) =
^ akh (m - k ) + f (m), m e Z
(2)
называется расширенным линейным рекуррентным соотношением (РЛРС) K-го порядка (K > 0). Отсчёты
me {ne Z+ :f(n) Фо} называются отсчётами неодно-
родности РЛРС, множество 0 = {п е Z+ : ф (п )ф 0} -областью отсчётов неоднородности РЛРС, а вектор (М, К ,{ак }Кк=1,{т, ф (
т)} 0) - вектором параметров
РЛРС.
Рекуррентное вычисление ЛЛП (расчёт хэш-значений) для одномерных последовательностей / (п) в виде РЛРС имеет вид (обобщение для двумерного сигнала тривиально):
У (п) = X аку (п - к)+ X х (п - т )ф (т), п = 0, N -1. (*)
к=1 те 0
Алгоритм рекурсивного вычисления свёртки для одномерных последовательностей требует и* (К ) = 2К +1 умножений и и+(К ) = 2К -1 сложений на вычисление одного хэш-значения.
Последовательность {к (т)} над К, представи-
мая в виде РЛРС порядка К с областью неоднородности 0, называется МС-последовательностью порядка К над К, если выполняется ограничение |0 = К +1. МС-последовательность над К называется нормализованной (НМС-последовательностью), если к(0) =1 .
(К,М, а) - семейством НМС - последовательностей, обозначаемым |( К, М, а), называется множество НМС-последовательностей порядка К с носителем [0,М -1], удовлетворяющих РЛРС с коэффициентами а (аК Ф 0). При этом количество НМС-
последовательностей в семействе ограничено неравенством:
||(К,М,а)|< СМ+К-2, "М > К > 1, а (аК Ф 0).
В работах [8, 9] указан способ построения НМС-последовательности, который заключается в решении СЛАУ, содержащей М + К неизвестных. Вектор решения СЛАУ включает М значений КИХ - фильтра {к (т)} о и К значений отсчётов неоднородности
ф (т). СЛАУ выглядит следующим образом:
к (0) = 1,
К
к (т)-X ак (т - к ) = 0, т е [1, М -1] / 0,
к=1
К
X акк (т - к) = 0, т е [М, М + К -1] / 0,
h (m) - X akh (m - k) - f (m) = 0.
k=1
m e[1, M -1] П ©,
K
X akh (m - k) + f (m) = 0,
K
k=1
k=1
k=1
m e[M, M + K - 2] П ©, aKh (M - 1) + ф (M + K -1) = 0.
(3)
Частной задачей построения эффективного ЛЛП называется задача:
a }K "kh=
для заданных величин {ak }K ( aK ф 0) N, M, K e N
удовлетворяющих ограничениям
N >М,К < ^+1 (М), где е К[0,1] -
относительная сложность операций сложения, и заданного производящего функционала ¥(...) опреде-
лить ЛЛП
({h (m A)
такой что:
Jm=0
- КИХ {h (n)} - является НМС - последовательностью с минимальным значением целевой функции
Y(h(0),...,h(M-1))® min_ ;
WC
- алгоритм A является алгоритмом рекурсивного вычисления свёртки (*), порождаемой последовательностью {h (n)} - .
4. Построение оптимальной хэш-функции с использованием эффективных ЛЛП Для поиска неискажённых дубликатов на изображении будем решать СЛАУ (3) в простом поле Галуа GF (p). Характеристикой поля в этом случае является
простое число p, и все необходимые арифметические операции в ПЭВМ при решении СЛАУ и вычислении хэш-значений будут производиться по модулю p.
Коэффициенты СЛАУ {ak ^ будем определять
одним из следующих способов:
A. элементы последовательности Фибоначчи:
• K = 2 , aj = 1, a2 = 2 ;
• K = 3, aj = 1, a2 = 2, a3 = 3 ;
• K = 4 , aj = 1, a2 = 2, a3 = 3, a4 = 5 ;
B. полиномиальные коэффициенты:
VK •
а, =(-1)*#К •
Выбрав коэффициенты для заданного значения К, а также задав длину КИХ-фильтра М, строим СЛАУ (3) для каждой возможной НМС-последовательности из соответствующего семейства |( К, М, а).
Как было указано выше, количество различных вариантов построения СЛАУ (3) (НМС-последовательностей) равно ЛМ+К-2 [8]. В силу доказанных в [8] свойств решения частной задачи одно из решений гарантированно будет обладать минимальным значением целевой функции, то есть являться наиболее эффективным. Поскольку решения СЛАУ
(3) дают одномерные КИХ-фильтры \к (т)} , двумерный КИХ-фильтр М х М может быть получен
путём декартова произведения одномерного КИХ-фильтра Ь и его транспонированного значения Ьг . Замечание 2. Хэш-функция (1а)-(1б) также может быть представлена с использованием эффективных ЛЛП. В частности, она соответствует семейству |(К, М, а) с параметрами К = 1, а1 = 28 и остатком Ьг = р. Заметим, что для такого конкретного случая ||(1,М,а)| < С0м-1 = 1, то есть
наилучшая в смысле значения целевой функции НМС-последовательность оказывается единственной.
5. Экспериментальные исследования
Исследование эффективности предложенной хэш-функции
Ключевым параметром предложенной хэш-функции является количество неоднородностей К. В качестве показателя качества для всех проводимых в данном разделе исследований будем использовать количество ложно найденных дубликатов, или коллизий. Получаемые результаты сравним с решением на базе КТО [5] (как было показано в Замечании 2, это решение соответствует ситуации при К=1).
В качестве исходных данных для эксперимента были выбраны 3 изображения, полученные со спутника 8РОТ-4, с размерами 4600 х 6400 , дубликаты на которых отсутствовали. При выбранной длине одномерного КИХ-фильтра М = 11 сначала фиксировалось значение К = 2,3,4 и способ вычисления коэффициентов {а, }К , а затем для каждого значения К строились и решались ЛМ+'К-2 СЛАУ (3). Учитывая, что вычисления проводятся в GF (р), в качестве его
характеристики было выбрано простое число р=536870923, что соответствует полученным ранее результатам для алгоритма на основе КТО, где выбиралось простое число р, близкое к 229. Каждый полученный КИХ-фильтр применялся к выбранным изображениям для определения наилучшего вектора параметров, при котором количество коллизий минимально. Эффективность фильтров сравнивалась с результатами, полученными для хэш-функции (ХФ) на базе КТО, для окна обработки с размерами 11 х11 -результаты представлены в таблице 1. При К = {3,4}
алгоритм вычисления хэш-функции на основе ЛЛП показал лучшие результаты по сравнению с алгоритмом на основе КТО.
Таблица 1. - Сравнение количества коллизий для значений хэш-функций при фиксированных К
Положения ХФ на
K Число коллизий неоднородностей основе
A B A B КТО
2 7757353 12076155 11 1 1550186
3 1550085 1550108 1,7 3,12 1550186
4 1548417 1547133 4,11,13 1,4,7 1550186
В продолжение этого исследования мы проанализировали поведение предложенного алгоритма поиска дубликатов, описанного в разделе 2. В качестве координатного шаблона был выбран следующий шаблон: N({(0,0), (0,1), (1,0), (1,1)}, 11,11), а вектора параметров РЛРС соответствовали наилучшим КИХ-фильтрам, полученным во время предыдущего эксперимента. В результате проведённых исследований было получено, что алгоритм обнаружения на основе ЛЛП даёт меньшее число коллизий для К = {3,4} с использованием обеих схем вычисления коэффициентов \ак } по сравнению с алгоритмом на основе КТО (таблица 2).
Таблица 2. - Сравнение числа коллизий алгоритма обнаружения дубликатов на основе хэш-функций с ЛЛП
K Число коллизий Алгоритм
A B на основе КТО
2 240854 1338933 235
3 242 230 235
4 232 225 235
Как показало данное исследование, хэш-функция, конструируемая с использованием эффективных ЛЛП, позволяет получить лучший результат (по качеству), чем хэш-функция на базе КТО. В то же время расчёт хэш-значения на ПЭВМ для подхода с использованием ЛЛП занимает чуть больше времени -улучшенные качественные показатели достигались за счёт 20-25% потерь во времени обработки.
Исследование способов представления используемого координатного шаблона
В рамках настоящего исследования рассматривались два вопроса:
- о выборе оптимального количества элементов в представлении (1), то есть об оптимальной мощности множества 13 |;
- о наилучшем способе представления (1). В данном случае наиболее интересны два альтернативных способа представления (1) для заданной мощности 13 |: с наибольшим возможным парным пересечением множеств П(а,Ь, т,п), (т,п) е3 , входящих в представление (1), и с наименьшим.
Рассмотрим использование двух вариантов окон обработки анализируемого изображения: 11x11 (| 3 |= 4 ) и 18х18 (| 3 |= 9). Параметры координатного шаблона а х Ь будут варьироваться от минимально возможного (для алгоритма с минимальным пересечением составляющих шаблона) до максимального. Тогда графики изменения количества коллизий алгоритма поиска дубликатов будут выглядеть, как показано на рис. 1 и рис. 2.
Из графиков видно, что количество коллизий существенно растёт с уменьшением области пересечения множеств П(а,Ь, т,п), (т,п) е 3 , а оптимальный размер параметров шаблона составляет от
8x8 до 10x10. Также можно отметить, что число коллизий тем меньше, чем больше мощность множества | 3 | . Количество коллизий
6000
4000
2000
--« axb
10*10 9x9 8x8 7x7 6x6
Рис. 1. Зависимость количества коллизий от параметров а х Ь шаблона для окна анализа 11 х 11
Количество коллизий
®-< !-< В ( »-< ' ахЪ
16x16 14x14 12x12 10x10 8x8 7x7 бхб
Рис. 2. Зависимость количества коллизий от параметров а х Ь шаблона для окна анализа 18 х 18
В ходе исследований был также получен следующий результат для окна обработки с размерами 19х19 , | 3 |= 4 (рис. 3).
Количество коллизий
250 (
240
axb
230 220 210 200
18x18 16x16 14x14 12x12 10x10
Рис. 3. Зависимость количества коллизий от параметров a х b шаблона для окна анализа 19 х 19
На рисунке видно незначительное уменьшение количества коллизий от уменьшения размера координатного шаблона. В сравнении с результатами на рис. 1 и 2, в данном случае (параметры a х b шаблона принимают значения большие 10) число коллизий можно считать постоянным, а при увеличении мощности множества 13 | - стремящимся к 0.
По полученным результатам второго исследования можно сделать следующие выводы, связанные с выбором оптимальных/наилучших параметров координатного шаблона и, как следствие, алгоритма обнаружения дубликатов:
- наилучшими параметрами a и b шаблона являются значения не меньше «8»;
- мощность множества | 3 | не должна быть меньше «6» (рекомендуемая - «9»);
- «степень» взаимного наложения составляющих шаблона не оказывает существенного влияния на результат обработки, если выполнены предшествующие два пункта.
Выводы и рекомендации В данной работе был представлен новый алгоритм поиска неискажённых дубликатов на изображениях. Предложен новый способ вычисления хэш-функции, основанный на использовании ЛЛП. Предложенное решение показало лучшие результаты по количеству коллизий в сравнении с существующим решением на основе КТО. Даны рекомендации по выбору параметров алгоритма обнаружения - параметров координатного шаблона a, b, мощности множества 13 | и способа представления используемого координатного шаблона.
Дальнейшие исследования будут направлены на разработку алгоритма на базе ЛЛП в рамках поля R для поиска яркостно-искажённых дубликатов на цифровых изображениях.
Благодарн ости Работа выполнена при финансовой поддержке:
- грантов РФФИ, проекты № 13-07-12103-офи-м, 13-01 -12080-офи-м, 12-07-00021 -а;
- программы фундаментальных исследований Президиума РАН «Фундаментальные проблемы информатики и информационных технологий», проект 2.12;
- Министерства образования и науки Российской Федерации в рамках постановления Правительства Российской Федерации от 09.04.2010 г. № 218: договор № 02.Г36.31.0001 от 12.02.2013.
Литература
1. Christlein, V. An Evaluation of Popular Copy-Move Forgery Detection Approaches / V. Christlein, C. Riess, J. Jordan, C. Riess, E. Angelopoulou // IEEE Transactions on information forensics and security. - 2012. - Vol. 7(6). - P. 1841-1854.
2. Farid, H. Image Forgery Detection / H. Farid // IEEE Signal processing magazine. - 2009. - P. 16-25.
3. Глумов, Н.И. Обнаружение дубликатов на изображениях / Н.И. Глумов, А.В. Кузнецов // Компьютерная оптика. - 2011. - Т 35, № 4. - С. 508-512.
4. Fridrich, J. Detection of copy-move forgery in digital images / J. Fridrich, D. Soukal. - Proceedings of Digital Forensic Research Workshop, 2003. - P. 55-61.
5. Глумов, Н.И. Поиск дубликатов на цифровых изображениях / Н.И. Глумов, А.В. Кузнецов, В.В. Мясников // Компьютерная оптика. - 2013. - Т. 37, № 3. - С. 360-367.
6. Методы компьютерной обработки изображений / М.В. Гашников, Н.И. Глумов, Н.Ю. Ильясова, В.В. Мясников [и др.]; под общей ред. В.А. Сойфера. -2-е изд., испр. - М.: Физматлит, 2003. - 784 с.
7. Айерлэнд, К. Классическое введение в современную теорию чисел / К. Айерлэнд, М. Роузен - M.: Мир, 1987. - 416 с.
8. Мясников, В.В. Эффективные локальные линейные признаки цифровых сигналов и изображений / В.В. Мясников // Компьютерная оптика. - 2007. - Т. 31, № 4. - С. 58-76.
9. Мясников, В.В. Эффективные наборы совместно вычисляемых линейных локальных признаков цифровых сигналов / В. В. Мясников // Компьютерная оптика. -2011. -Т. 35, № 1. - С. 77-94.
References
1. Christlein, V. An Evaluation of Popular Copy-Move Forgery Detection Approaches / V. Christlein, C. Riess, J. Jordan, C. Riess, E. Angelopoulou // IEEE Transactions on information forensics and security. - 2012. - Vol. 7(6). -P. 1841-1854.
2. Farid, H. Image Forgery Detection / H. Farid // IEEE Signal processing magazine. - 2009. - P. 16-25.
3. Glumov, N.I. Duplicates detection on images / N.I. Glumov, A.V. Kuznetsov // Computer optics. - 2011. - Vol. 35(4). -P. 508-512. - (In Russian).
4. Fridrich, J. Detection of copy-move forgery in digital images / J. Fridrich, D. Soukal. - Proceedings of Digital Forensic Research Workshop, 2003. - P. 55-61.
5. Glumov, N.I. Copy-move detection on digital images / N.I. Glumov, A.V. Kuznetsov, V.V. Myasnikov // Computer optics. - 2013. - Vol. 37(3). - P. 360-367. - (In Russian).
6. Methods of computer image processing / M.V. Gashnikov, N.I. Glumov, N.U. Ilyasova, V.V. Myasnikov [et al]. - 2-nd edition reviewed. - Moscow: "Fizmatlit" Publisher, 2003. -784 p. - (In Russian).
7. Ireland, K. A classical introduction to modern number theory / K. Ireland, M. Rosen. - Moscow: "Mir" Publisher, 1987. - 416 p. - (In Russian).
8. Myasnikov, V.V. Efficient linear local features of signals and images / V.V. Myasnikov // Computer optics. - 2007. -Vol. 31(4). - P. 58-76. - (In Russian).
9. Myasnikov, V.V. Efficient sets of mutually-calculated features for linear local description of digital signals / V.V. Myasnikov // Computer optics. - 2011. - Vol. 35(1). -P. 77-94. - (In Russian).
EFFICIENT LINEAR LOCAL FEATURES BASED COPY-MOVE DETECTION ALGORITHM
A. V. Kuznetsov2, V. V. Myasnikov1,2 1 S.P. Korolyov Samara State Aerospace University (National Reseach University), 2 Image Processing Systems Institute of the RAS Abstract
In this paper we propose a new algorithm to detect copy-move matching parts on digital images. The algorithm uses a representation of the image's analyzed region as the value of a specially selected hash function. Actually, the hash function is constructed using the effective linear local features. The developed algorithm is compared with existing algorithm based on CRT, the recommendations are given.
Key words: digital image, duplicate, hash function, hash table, histogram, prime Galois field linear local features.
Сведения об авторах
Кузнецов Андрей Владимирович, родился в 1987 году. В 2010 году окончил Самарский государственный аэрокосмический университет (СГАУ) с отличием по специальности «Прикладная математика и информатика». В настоящее время работает стажёром-исследователем в Институте систем обработки изображений РАН, является аспирантом СГАУ. Круг научных интересов включает обработку и анализ изображений, обнаружение локальных изменений на изображениях, распознавание образов, геоинформатику. Имеет 17 публикаций, в том числе 4 научных статьи. E-mail: [email protected] .
Andrey Vladimirovich Kuznetsov (b. 1987) graduated with honours (2010) from the S. P. Korolyov Samara State Aerospace University (SSAU), majoring in Applied mathematics and Informatics. He works as a researcher in Samara Image Processing Systems Institute of the Russian Academy of Sciences (IPSI RAS), also studies as a postgraduate student in SSAU. His research interests are currently focused on image processing and analysis, local images changes detection, pattern recognition, geoinformatics. He has 17 publications, including 4 scientific papers.
Мясников Владислав Валерьевич, 1971 года рождения. В 1994 году окончил Самарский государственный аэрокосмический университет (СГАУ). В 1995 году поступил в аспирантуру СГАУ, в 1998 году защитил диссертацию на соискание степени кандидата технических наук, а в 2008 - диссертацию на соискание степени доктора физико-математических наук. В настоящее время работает ведущим научным сотрудником в Федеральном государственном бюджетном учреждении науки Институте систем обработки изображений РАН и одновременно профессором кафедры геоинформатики и информационной безопасности СГАУ. Круг научных интересов включает цифровую обработку сигналов и изображений, компьютерное зрение, распознавание образов, искусственный интеллект и геоинформатику. Имеет более 100 публикаций, в том числе 40 статей и две монографии (в соавторстве). Член Российской ассоциации распознавания образов и анализа изображений.
E-mail: [email protected] . Страница в интернете: http://www.ipsi.smr.ru/staff/MyasVV.htm .
Vladislav Valerievich Myasnikov (1971 b.), graduated (1994) from the S.P. Korolyov Samara State Aerospace University (SSAU). He received his PhD in Technical sciences (2002) and DrSc degree in Physics & Maths (2008). At present he is a leading researcher at the Image Processing Systems Institute of the Russian Academy of Sciences and holds a parttime position of Associate Professor at the Department of geoinformatics and information security at SSAU. The area of interests includes digital signals and image processing, geoinformatics, neural networks, computer vision, pattern recognition and artificial intelligence. He's list of publications contains about 100 scientific papers, including 40 articles and 2 monographs. He is a member of Russian Association of Pattern Recognition and Image Analysis.
Поступила в редакцию 11 сентября 2013 г.