Научная статья на тему 'Анализ методов проверки фотоизображений на наличие внесённых изменений'

Анализ методов проверки фотоизображений на наличие внесённых изменений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1076
172
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВОЕ ИЗОБРАЖЕНИЕ / МЕТОД АНАЛИЗА ВНЕСЕННЫХ ИЗМЕНЕНИЙ МЕТАДАННЫХ ИЗОБРАЖЕНИЯ / СИГНАТУРНЫЙ ПОИСК / КАЧЕСТВО ИЗОБРАЖЕНИЯ / ДВОЙНОЕ КВАНТОВАНИИ / DIGITAL IMAGE / DETECTING DIGITAL IMAGE MANIPULATION / IMAGE METADATA / SIGNATURE-BASED SCANNING / IMAGE QUALITY / DOUBLE QUANTIZATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гераськин Алексей Сергеевич, Желтов Святослав Юрьевич

В статье рассматриваются методы анализа цифровых изображений на наличие изменений. Проводится анализ их работоспособности на тестовых изображениях в рамках разработанного программного продукта. В результате исследования была выявлена невозможность определения экспертом изменений на изображениях, в которых были заретушированы или добавлены новые объекты. для решения этой проблемы было найдено новое семейство алгоритмов, которые в сочетании с рассмотренными дают приемлемый результат.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF THE METHODS FOR DETECTING PHOTO MANIPULATION

The paper considers the methods of analyzing digital images and detecting photo manipulation. The authors analyze the efficiency of those methods on test images using their original software. The study proves that it is impossible for experts to detect any alterations in the images where new objects have been added or retouched. To solve this problem the authors suggest using a new family of algorithms that when used in combination with the traditional methods give acceptable results.

Текст научной работы на тему «Анализ методов проверки фотоизображений на наличие внесённых изменений»

ОРГАНИЗАЦИОННЫЕ И ОБЩЕТЕОРЕТИЧЕСКИЕ ВОПРОСЫ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ

УДК 343:98

АНАЛИЗ МЕТОДОВ ПРОВЕРКИ ФОТОИЗОБРАЖЕНИЙ НА НАЛИЧИЕ ВНЕСЁННЫХ ИЗМЕНЕНИЙ

ANALYSIS OF THE METHODS FOR DETECTING PHOTO MANIPULATION

Гераськин Алексей Сергеевич

Geras'kin Aleksey Sergeyevich

кандидат педагогических наук, доцент кафедры теоретических основ компьютерной безопасности и криптографии, Саратовский национальный исследовательский государственный университет имени Н.Г. Чернышевского, Саратов

Cand. Sc. (Pedagogy), associate professor of the department of theory of computer security and cryptography, Saratov State University, Saratov

email: gerascinas@mail.ru

Желтов Святослав Юрьевич

Zheltov Svyatoslav Yur'yevich

студент 5 курса факультета компьютерных наук и информационных технологий, Саратовский национальный исследовательский государственный университет имени Н.Г. Чернышевского, Саратов

5th year student of the faculty of computer science and information technology, Saratov State University, Saratov

email: info@csit.pro

В статье рассматриваются методы анализа цифровых изображений на наличие изменений. Проводится анализ их работоспособности на тестовых изображениях в рамках разработанного программного продукта. В результате исследования была выявлена невозможность определения экспертом изменений на изображениях, в которых были заретушированы или добавлены новые объекты. Для решения этой проблемы было найдено новое семейство алгоритмов, которые в сочетании с рассмотренными дают приемлемый результат.

Ключевые слова: цифровое изображение, метод анализа внесенных изменений метаданных изображения, сигнатурный поиск, качество изображения, двойное квантовании.

The paper considers the methods of analyzing digital images and detecting photo manipulation. The authors analyze the efficiency of those methods on test images using their original software. The study proves that it is impossible for experts to detect any alterations in the images where new objects have been added or retouched. To solve this problem the authors suggest using a new family of algorithms that when used in combination with the traditional methods give acceptable results.

Keywords: digital image, detecting digital image manipulation, image metadata, signature-based scanning, image quality, double quantization.

Подделка фотографий появилась задолго до цифровых камер, компьютеров и специализированного программного обеспечения. Уже через несколько десятилетий после создания в 1822 г. Жозефом Ньепсом первого фотоизображения, была сделана первая подделка [7]. С появлением компьютеров подделка изображений перешла на новый уровень и стала доступна ещё большему числу людей. В настоящее время любой желающий может отредактировать любое доступное ему изображение в графическом редакторе, причём, если отредактировать фото достаточно аккуратно, не оставляя явных признаков изменения, то разобраться с тем, является ли фотография оригиналом или подделкой, без использования специального программного обеспечения будет практически невозможно. В связи с этим в настоящее время очень высокую роль играет проверка фотографий на наличие в них внесённых изменений. Если у печатных документов могут быть проверочные номера и другие способы проверки на оригинальность, то у обычных, не прошедших специальной обработки, нет никаких встроенных способов защиты от изменения и фальсификации. Особенно остро эта проблема стоит в сфере страхования и электронного документооборота. Таким образом, на данный момент существует потребность в решениях, обеспечивающих быструю и достаточно надёжную проверку изображений на оригинальность и факт внесения в них изменений.

На данный момент в мире существует множество различных решений для проверки изображений на наличие внесённых изменений, большая часть из них является коммерческими решениями, которые чаще всего не предоставляют демонстрационный доступ к продукту.

Методы анализа изображений Изучая популярные и использующиеся программные продукты, осуществляющие анализ изображений на предмет наличия внесённых изменений, мы отобрали алгоритмы, применяющиеся в них. Наиболее интересными и часто встречающимися методами при анализе изображений на предмет внесения в них изменений являются:

1) анализ метаданных изображения (МА) -извлечение метаданных изображения для дальнейшего изучения;

2) сигнатурный поиск (SS) - поиск известных сигнатур, оставляемых программами при обработке фотографий;

3) анализ похожих изображений (SSI) -поиск и анализ оригинала изображения, анализ миниатюр изображения;

4) анализ качества изображения (QA) - анализ матриц квантования изображения на предмет соответствия заявленному коэффициенту компрессии;

5) анализ картины шумов изображения (NA) -поиск изменений в картине шумов;

6) эффект двойного квантования (DQ) - построение гистограмм коэффициентов дискретного косинусного преобразования для выявления повторного сохранения изображения;

7) error level analysis (ELA) - поиск областей изображения с различным уровнем компрессии.

Часть приведённых методов может работать с изображениями любого формата (1-3), но такие методы как анализ картины шумов, Error Level Analysis и анализ матриц квантования применимы только к изображениям в формате JPEG, который наряду с TIFF и RAW, является одним из основных стандартов, включённых в спецификацию индустриального стандарт организации данных в устройствах получения, хранения, преобразования и вывода цифровых изображений DCF [8].

Реализация методов проверки

Для детального анализа возможностей изложенных выше методов они были реализованы в рамках одного программного продукта, который осуществляет анализ изображений

В качестве тестового изображения будем использовать фотографию учебного корпуса Саратовского Государственного Университета имени Н.Г. Чернышевского, в которую при помощи программы Adobe Photoshop CS 5 были внесены следующие изменения:

1) изображение было обрезано до размера 472 на 525 пикселей;

2) в центральной области изображения был вырезан квадратный участок, который был сохранён в меньшем качестве (QiialityFactor = = 65 %) и вставлен обратно;

3) изображение было сохранено с QiialityFactor = 99 %.

После данных манипуляций с изображением, оно было сохранено ещё раз при помощи

редактора Adobe Photoshop Lightroom 5.6. Полученное изображение представлено на рис. 1.

Рис. 1. XII корпус СГУ имени Н.Г. Чернышевского

Анализ метаданных изображения

В графическом файле хранятся разнообразные метаданные, в которых представляется информация об устройстве, с помощью которого было получено изображение, его настройках, характеристиках самого изображения, его описание, координаты места съёмки и многое другое. В зависимости от формата изображения метаданные хранятся в разных блоках, например в изображениях формата PNG метаданные хранятся в тегах tEXt, iTXt и zTX, а метаданные в изображениях форматов JPEG, TIFF и RAW хранятся в соответствии со стандартом EXIF (листинг извлечённых из изображения l EXIF тегов приведён на рис. 2). Кроме того, существует стандарт ХМР, разрабо

РН ОТО SubSctTim'cDÛgitÏHd: BD SubSecTimcOripiul АО ЕиЛеяют 2.30

DjteTimeOrijiiul: ;и 16:05:02 12:20:44 DatcTimc DigKntdt 2016Ш212ЯШ

IMAGE VRc»ldl¡iHi 240

Reolutionllnh: inch EiifTag: 162

DiteTime: 2016:05:02 19:05:46 ХКсиЬЬопс 240

Software: Adobe PhntDShop Light™ mi 5.6 [Viindawi)

THUMBNAIL rReolmion;72

ReioliitionU nit: inch

С от ргеяоп:; JPEG (old-stjle)

«teohme¡«:72

JPEGInterdiingcFornutLcngtii: 16037 JPEGInterdunjefomHt; 362

Рис. 2. Листинг EXIF тегов извлечённых из рис. 1

чей справляются различные программные решения - от программ для просмотра изображений, до специализированного программного обеспечения (ExifPro Image Viewer, ShowMeta, Exif Mot) [8].

Анализ сигнатур изображения Кроме метаданных устройства, программы, обрабатывающие графические изображения, оставляют различные следы в контейнере изображения. Такие следы могут быть типичными для данного программного обеспечения матрицами квантования, названиями тегов, заголовками файлов (например, при сохранении изображения для web устройств в графическом редакторе Adobe Photoshop CS5, в заголовок файла вносится пометка Ducky). Также с помощью данного метода выделяются наиболее значимые теги из метаданных файла (рис. 3).

танныи компанией Adobe Systems, который также может хранить внутри себя информацию для графических файлов, таких как JPEG, PNG, RAW, TIFF.

Для анализа этих данных достаточно уметь находить блоки данных внутри графического файла и правильно распознавать их. С этой зада-

EIIF-: Инфараициа о Г|1 «фнчиида редагтаре

Описание:: Тег ИГ lunge Sofawme кдерхит имя и верою ГО наняыкашнкя да m адию или форылираннин ивбмження. Значении WrtelPtatodiepughliomt6(Windoiifi) EXIF:. Время сощаныя файла

Опиинис. Ttf EXIFImajf DaK^ine пдорит^уи ipeun ошдамниабршемн. Зчзче*; М1ИШ1М5Л XHh Оран нздии фанм

□икание: Тег чигиниянгсадерттлиуи вреда имбрпеи».

3нзченне: 201ЫЫ2Ш:М!ШЮ

ХИР- Ирм» пираннш fiiu ■ Adobe Phntmliiif

Олииние. ТегЯУФ PtiMDdwp DsHeOMtd «вдшп щи к среня шраиеи «91 графический рад ddoou Adobe rttrtcshcp. Энгвм*: 201W)W12T12:JCMAW

Рис. 3. Листинг сигнатур, обнаруженных в рис. 1

Анализ похожих изображений

Часто при редактировании изображения его сохраняют без изменения миниатюры, в таком случае достаточно произвести сравнение миниатюры и самого изображения, чтобы понять, какие изменения были в него внесены. Также можно попытаться найти оригинал изображения в интернете с помощью поиска изображений, отсортированных по дате добавления в индекс поиска, и сравнить изображение с найденным.

Данный метод не всегда может быть применён к изображению, так как оно может отсутствовать в интернете или его миниатюра может быть удалена, в таком случае стоит проводить более глубокий анализ изображения методами ELA или NA. Листинг результата работы алгоритма приведён на рис. 4.

Анализ качества изображения

При сохранении изображений в формате JPEG цифровые фотоаппараты и сканеры устанавливают коэффициент сжатия большим 8о %, поэтому именно такой коэффициент ожидается при анализе качества изображения. Напрямую этот коэффициент в фотографии не содержится, его можно вычислить по матрицам квантования изображения. Матрица квантования строится по следующей формуле [6] :

BasicTable[i] * QualityFactor + 50

для i — 0,... ,63,

где Q[i] - ячейка матрицы квантования;

BasicTable - ячейка из матрицы округления;

QualityFactor - коэффициент сжатия. Коэффициент сжатия в стандарте JPEG находится следующим образом:

1) если QualityFactor < о, положить QiialityFactor = 1;

2) если QualityFactor > 100, положить QiialityFactor=100 ;

3) если QualityFactor < 50, перейти к шагу 4, иначе к шагу 5;

4) QualityFactor = 5000 / QualityFactor;

5) QualityFactor = 200 - QualityFactor.

Также существуют стандартные матрицы

округления, приведённые в стандарте JPEG (рис. 5)-

Анализ картины шумов изображения

Идея данного анализа состоит в том, что при редактировании изображения происходит изменение его картины шумов. При этом в обычном изображении увидеть это влияние практически невозможно, поэтому для отображения картины шумов применяется изменённый медианный фильтр, который обрабатывает каждый блок пикселей, но вместо удаления шума делает обратную операцию, оставляя в блоке лишь те пиксели, что содержат шум [5], алгоритм действий фильтра следующий:

1) поместить значения пикселей обрабатываемого блока 3x3 В массив Р и пронумеровать их от о до 8;

2) вычислить значения медиан

M, = median(P[o], Р[ 4, Д8]),

M, = median(P[ 1], Р[ 4], Д7]),

Мз = median(P[2], Р[4], Р[6]), М4 = median(P[3l Д4], Лб]);

3) вычислить значения медиан

Ма = median(P[4],M,Мз ),

4) Мъ = median(P[4l Мл, M);

5) если Р[4] Ф median(P[4], Мл, Мъ), то добавить Р[4] к изображению на выходе.

Данный анализ помогает выявить работу таких инструментов, как кисть, штамп, размытие, трансформирование, вставка, при этом области имеющие изменения картины шумов после выполнения алгоритма будут темнее или ярче остальных частей изображения. Данный метод был протестирован на тестовом изображении, представленном на рис. 1, но следов редактирования фотоизображения на картине шумов не видно (рис. 6).

Оригинал Превью Найденный оригинал

Рис. 4. Листинг результата работы анализа похожих изображений

16 11 10 16 24 40 51 61

12 12 14 26 58 60 55

M 13 16 24 40 57 69 56

14 17 22 29 51 SO 62

IS 22 37 56 68 109 103 77

24 35 55 64 SI 104 in 92

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

49 64 78 87 103 121 120 101

72 92 95 9S 112 100 103 99

Рис. 5. Листинг матрицы округления из стандарта JPEG

Рис. 6. Карта шумов рис. 1 (слева)

Эффект двойного квантования

Под эффектом двойного квантования понимается сжатие JPEG с различными матрицами квантования Qa и Qp [4]. Коэффициенты DCT (дискретного косинусного преобразования), С (и, v) являются коэффициентами двойного квантования, если Qa (и, v) ф Qf, (и, v). В результате второго сжатия коэффициент будет равен:

На рис. 7 представлено проявление DQ-эффекта на изображении до повторного сжатия (а), после первого сжатия (б), после второго сжатия (в).

Error Level Analysis JPEG является алгоритмом сжатия с потерями, где каждый блок 8x8 пикселей обрабатывается отдельно. Как уже говорилось ранее, если рассмотреть набор DCT коэффициентов Со, прошедший квантование с коэффициентом QualityFactorо, и коэффициенты С, прошедшие второе квантование с коэффициентом QualityFactor1 > Quality Factor о, а затем посчитать функцию разности этих коэффициентов относительно коэффициентов С,, прошедших ещё одно квантование с коэффициентом QualityFactor2, то она будет иметь два локальных минимума QualityFactor2 = Quality Factor: (рис. 8, синяя точка) и QualityFactor2 = QualityFactorо (рис. 8, красная точка). Второй минимум, который получается при коэффициенте равном коэффициенту первого квантования изображения, называют «призраком JPEG» [3].

При кодировании изображений в формате JPEG отдельно обрабатываются каждый канал внутри блока 8x8 пикселей, из-за чего придётся производить вычисление разности между всеми коэффициентами DCT на каждом канале. Но на практике обычно вместо этого используют вычисление разности между значениями самих пикселей по следующей формуле:

С Qß(u,v) =

CQß(u,v) *Qa(u,v)

Qß(u,v)

где j\x, у, i), i = 1, 2, 3 - значения каждого из каналов цветов RGB, а/ ( ■) - сжатое Д •) со значением QualityFactor = q. Если построить изображение с значениями пикселей, равными разности d(x, у, ф, при q = 98 [8] мы получим графическое представление ELA.

Для иллюстрации данного эффекта достаточно построить гистограмму распределения этих коэффициентов, так как при БС^-эффекте на гистограмме возникают периодические нули, причём с каждым последующим сжатием их число растёт [2].

Рис. 7. Гистограммы распределения DCT коэффициентов

Рис. 8. График зависимости разности пикселей d от Quality Factor

будут иметь одинаковую яркость, контуры с низким контрастом будут иметь такую же яркость, как и контуры с высоким контрастом (рис. 8), одинаковые текстуры и области на изображении будут иметь однообразную текстуру и на картине ЕЬА. Особенно хорошо это заметно на рис. 9, на котором видна область, вставленная из другого изображения.

В результате исследования методов, реализуемых большинством программных продуктов, представленных на рынке, было выявлено: все методы основываются на свойствах формата, в котором сохранено изображение, и крайне не универсальны; рассмотренные методы дают достаточно хороший результат при поиске свойственных для них изменений в изображениях. Таким образом,

для повышения универсальности применяемых методов необходимо проводить анализ на основе физических и геометрических свойствах самого изображения, к ним можно отнести: анализ теней изображения, анализ источников света. Согласно исследованиям, сочетание известных методов с анализом физических и геометрических свойств

На изображении, которое не было под- изображения повышает эффективность таких вержено редактированию, грани объектов компьютерных систем на 8о %.

Рис. д. Изображение с областями с разными уровнями компрессии и его ELA

Библиографический список (References)

1. Civil War Glass Negatives and Related Prints. URL: http://www.loc.gov/pictures/collection/cwp/mystery.htrnl.

2. Farid H. (2008) Digital image forensics. USA: Department of Computer Science. 189 p.

3. Krawetz N. (2007) A Pictures Worth Digital Image Analisys and. USA : Black Hat Briefings. 21 p.

4. Mahdian B. (2013) Detecting Double Compressed JPEG Images. Czech Republic : ASCR 11 p.

5. Noise Analysis for Image Forensics. URL: https://29a.ch/2015/08/2l/noise-analysis-for-image-forensics.

6. Алгоритм JPEG Основные соотношения. URL: http://www.mediascan.by/index.files/jpeg-ref. Algoritm JPEG Osnovnyye sootnosheniya [JPEG Algorithm. Basic Correlations]. URL: http://www.mediascan.

by/index.files/jpeg-ref.

7. Кобозева А. Эффект двойного квантования и его особенности. 2008. С. 16-19.

Kobozeva А. (2008) Effekt dvoynogo kvantovaniya i yego osobennosti [Double Quantization Effect and its Parameters]. P. 16-19.

8. Метаданные в цифровой фотографии. URL: http://www.ixbt.com/digimage/metadxph.shtml. Metadannyye v tsifrovoy fotografii [Metadata in Digital Photography]. URL: http://www.ixbt.com/digimage/

metadxph.shtml.

i Надоели баннеры? Вы всегда можете отключить рекламу.