О стойкости стеганографических схем
Грушо АА., Грушо НА., Тимонина Е.Е., РГГУ
Работа выполнена при поддержке РФФИ, грант № 07-01-00484, грант 07-07-00236. Рассматривается связь пропускной способности и выявляемости скрытой передачи информации.
Рассмотрим модель стеганографии, введенную Симмонсом [1 ]. Корреспондент А может использовать легальный контейнер для передачи скрытого сообщения корреспонденту В, а контролер и пытается выявить случай самого факта передачи скрытого сообщения. Мы предполагаем, что от А к В передается последовательность знаков в конечном алфавите, которая является допустимой с точки зрения некоторого языка I. Мы считаем, что и применяет статистические методы выявления скрытой передачи, т.е. проверяет статистическую гипотезу о том, что передаваемое сообщение выбрано в соответствии с вероятностным распределением, характерным для легальных сообщений против альтернативы, что в передаваемой последовательности содержится скрытое сообщение. Окончательное решение контролер может принять с помощью критерия для произвольного п, где п — длина увиденного контролером начального участка передаваемой последовательности. При этом предполагается, что для каждого п у контролера есть статистический критерий для различения указанных гипотез. "Невидимость" скрытой передачи в данной модели соответствует отсутствию состоятельной последовательности статистических критериев.
В работах [2, 3] доказаны необходимые и достаточные условия существования состоятельной последовательности статистических критериев в дискретньх схемах.
Пусть X = {х1,...,хт} — конечное множество, которое определяет последовательность конечных множеств X, Х2,...Хп,... На каждом из множеств этой последовательности заданы вероятностные меры
{о, п (х,1,-, х,п )> (х ,>•••> хп) е х"} (1)
{\,в, п х,„ )> (х1,-, хп) е Хп, 0е©} (2)
Обозначим пространство бесконечных последовательностей
Х°° = {« = х,„>•••)> хп е Х> п = 1>2,... }
Пусть
(хх, ) хХ°°, х; е X, п = 1,2,..., -
V 1 > Ь' ’ п ’ ’ ’ ’
элементарное цилиндрическое множество в X00, цилиндрическое множество Г есть конечное объединение элементарных цилиндрических множеств, а А—минимальная о — алгебра, порожденная всеми цилиндрическими множествами.
Пусть вероятностные меры, определяемые формулами (1) и (2), являются согласованными семействами конечномерных распределений [4]. Тогда
{ро, п(х1,•••,хп )}
определяет единственную вероятностную меру Р0 на измеримом пространстве { X00, А}.
Для каждого в е 0 согласованное семейство конечномерных
распределений
Р в, „(хк,-,х„)}
определяет единственную вероятностную меру P, в на пространстве
{ Xм, A}.
Рассматривается простая гипотеза HQ: P0 против сложной альтернативы
H: {р в, в 6 0}
Для задания критерия проверки гипотезы HQ против Н, на пространстве { X°°, A} при уровне значимости а необходимо определить критическое множество S 6 A такое, что PQ(S) < а. Мощность данного критерия — это функция от 0: W(9) = P0 , (S).
Рассмотрим последовательность критериев проверки Но против альтернативы Н, с критическими множествами S,, $2,...,такую, что
Ро(Sk) = 0. (з)
Определение 1. Последовательность критериев с критическими множествами Но для проверки Н, против альтернативы называется состоятельной [5], если выполняется условие (3) и для каждого
060:
lim Wk (в) = lim Р в( S) =1.
k kico
Теорема 1. Пусть для каждого A 6 A такого, что Po(A) = 1 суще-ствуетв 6 0, что P, в (A) > 0. Тогда не существует состоятельной последовательности критериев для проверки гипотезы Но против альтернативы Н,. Верно и обратное утверждение.
Определение 2. Множество альтернатив 0,^0 называется неотличимым для гипотезы Но, если выполняются условия:
1) 0, — бесконечное множество;
2) любое бесконечное подмножество 0, образует множество альтернатив, для которого отсутствует состоятельная последовательность критериев проверки Но против Н,. Естественно, что "невидимая" для контролера стеганографическая схема определяет некоторое множество альтернатив из 0,.
Это значит, что все последовательности языка L, описываемые мерой P0, могут появляться с положительной вероятностью в этих альтернативах и только они. То есть из приведенной выше теоремы и определений следует, что все "невидимые" для контролера стеганографические схемы используют допустимые последовательности языка L. Если рассматриваемая длина сообщений конечна и равна n, то множество допустимых последовательностей этой длины обозначим через Ln. Ясно, что если полученный контролером участок последовательности длины n не принадлежит Ln то это значит, что U выявил наличие скрытой передачи. Принадлежность принятой последовательности к Ln означает, что U, работая только статистическими методами и не учитывая семантики и контекста, не имеет возможности выявить скрытую передачу на длине n. В самом деле, статистические методы могут максимум выявить принадлежность полученного слова или последовательности заданному языку. Большая или меньшая вероятность появления слова в языке не должны учитываться, если в дальнейшем не будет дополнительной информации, уточняющей действительную возможность использования этого сообщения в передаче. Но мы предположили, что такой информации нет. Если
Спецвыпуск T-Comm, август 2оо9
187
учитывать разные уровни вероятности сообщений в рассматриваемой ситуации, то получим увеличивающееся количество ложных решений, с которыми контролер без дополнительной информации не будет знать, что делать. В тоже время с увеличением п вероятности любых легальных последовательностей становятся маленькими, а потребности легальной передачи разнообразными. Поэтому без контекста много последовательностей могут рассматриваться контролером как нелегальные.
В данной работе мы рассматриваем пропускную способность скрытого канала при условии, что контролер не может выявить скрытую передачу при любом п. Как было указано выше, это значит, что у него не существует состоятельной последовательности критериев, а для каждого п передаваемое сообщение является элементом 1.п.
Рассмотрим позицию абонента В в модели Симмонса. Множество передаваемых сообщений при условии невидимости для контролера не может быть бесконечным. В противном случае, так как эти последовательности выбраны в соответствии с мерами из , то у корреспондента В также как у контролера и не будет существовать критерия для выявления и тем более для прочтения переданного сообщения. Тогда можно считать, что существует конечный набор к альтернатив из 0,, соответствующих скрытым сообщениям. Тогда можно считать, что существует минимальный набор последовательностей а,,...,Ок из языка I., которые описывают все возможные сообщения длины п (п > к) для корреспондента В (можно рассматривать к групп последовательностей из языка). Таким образом идентифицировав ¡-ю последовательность, В принимает решение о том, что ему передается сигнал № ¡. При этом В может ошибиться. Если легальное сообщение совпало с одним из передаваемых сигналов с,,...,ск то В считает это скрытой передачей, хотя на самом деле скрытой передачи не было. Отметим, что данная модель стеганографии однозначно вытекает из предположения о "невидимости" скрытой передачи для контролера и полученных результатов об отсутствии состоятельных последовательностей критериев.
Стеганографические методы, в которых последовательность изменяется настолько, чтобы можно было прочитать вставку в исходной последовательности, либо не могут быть "невидимыми", либо попадают в рассматриваемый класс стеганографических методов.
Рассмотрим оценки пропускной способности исходя из классических моделей. Для моделирования языка воспользуемся результатами Шеннона [6], в которых обосновывается следующая модель. Для каждого достаточно большого п число слов языка равно приблизительно епН, где Н — это энтропия текста. При этом вероятности всех слов приблизительно одинаковы и равны е-пН. Если число передаваемых сообщений равно к, то В может ошибаться с вероятностью ке-пН и правильно принять сообщение с вероятностью 1 - ке-пН. Если ке-пН ^ X > 0 при п ^о, то В не может достоверно принять сообщение, то также было показано выше в более общей модели. Если ке-пН ^ 0 , то скрытый канал асимптотически позволяет однозначно получать переданное сообщение. Поэтому пропускная способность канала (количество сообщений, которые можно передать) оценивается величиной к = о(е-пН), но при этом к может стремиться к бесконечности. Таким образом, модель Шеннона дает более грубую оценку пропускной способности скрытого канала по сравнению с той, которую мы получили из условия отсутствия состоятельной последовательности критериев.
Литература
1. Simmons GJ. The prisoner's problem and the subliminal channel// Proc. Workshop on Communications Security (Crypto' 83). — 1984. — pp. 51 -67.
2. Грушо АА, Грушо НА, Тимонина ЕЕ Теоремы о несуществовании состоятельных последовательностей критериев в некоторых дискретных за-дачах//Дискретная математика. — 2008. — Т. 20. — № 2.
3. Грушо АА, Тимонина ЕЕ, Ченцов ВМ. Существование состоятельных последовательностей статистических критериев в дискретных статистических задачах при сложной нулевой гипотезе//Информатика и ее применения. — М.: ТОРУС-ПРЕСС, 2008. — Т.2. — Вып. 2. — С. 64-66.
4. Неве Ж. Математические основы теории вероятностей. — М.: Мир, 1969.
5. Леман Э. Проверка статистических гипотез. — М.: Наука, 1964.
6. Шеннон К. Работы по теории информации и кибернетике. — М.: Иностранная литература, 1963. — 829 с.
188
Спецвыпуск T-Comm, август 2009