Научная статья на тему 'Сравнительный анализ помехоустойчивых свойств генетических алгоритмов безизбыточного кодирования для кластеризующихся пространств источника'

Сравнительный анализ помехоустойчивых свойств генетических алгоритмов безизбыточного кодирования для кластеризующихся пространств источника Текст научной статьи по специальности «Математика»

CC BY
249
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ / ПОМЕХОУСТОЙЧИВОЕ КОДИРОВАНИЕ / КЛАСТЕРИЗАЦИЯ / РАСПРЕДЕЛЕНИЕ КОШИ / НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ / РАВНОМЕРНОЕ РАСПРЕДЕЛЕНИЕ

Аннотация научной статьи по математике, автор научной работы — Баталов Алексей Эдуардович, Синева Ирина Сергеевна

Помехоустойчивость является одним из главных аспектов в системах передачи сообщений. Как правило, высокая помехоустойчивость достигается путем введения дополнительной избыточности. Но, в некоторых случаях, это невозможно или нецелесообразно. Для повышения помехоустойчивости без введения дополнительной избыточности был разработан отдельный класс алгоритмов, который при этом улучшает результат декодирования при возникновении ошибок в канале связи. Данный класс алгоритмов опирается на принципы генетики, когда существует родительская популяция и популяция потомков. Популяцией является некоторый набор кодовых комбинаций. При этом на каждом конкретном шаге из популяции родительских кодовых комбинаций образуется популяция кодовых комбинаций потомков. Которые в свою очередь, будут родительской популяцией на следующем шаге. Для повышения помехоустойчивости источник сообщений кодируются с применением генетических алгоритмов. Основной принцип работы алгоритмов заключается в том, чтобы закодировать сообщения в исходном пространстве источника таким образом, чтобы близкие друг к другу сообщения в кодовом пространстве, так же являлись близкими в пространстве источника. Получается, что, при появлении ошибки в канале связи, эта ошибка искажает комбинацию незначительно. Полученная комбинация находится близко к исходной как в пространстве кодовых комбинаций, так и в исходном метрическом пространстве источника. Достаточно часто для пространств источника можно обнаружить явно выраженную кластеризацию. Одной из ключевых особенностей генетических алгоритмов является гибкость. Для каждого отдельно класса или типа кластеризующихся пространств можно разработать отдельный тип алгоритма, который будет выбирать начальные точки исходя из имеющихся кластеров. Для начала необходимо более подробно изучить поведение генетических алгоритмов без каких-либо модификаций в сравнении со случайным кодированием источника сообщений. В статье рассмотрены кластеризующиеся и некластеризующиеся метризованные пространства, которые хорошо описываются следующими распределениями: нормальное, равномерное и распределение Коши. Выбор моделей определяется тем, что гауссовские массивы имеют ярко выраженную локализацию, равномерные не имеют ее вообще, а распределенные по Коши имеют слабую локализацию, при которой даже центр рассеяния из-за расходимости интегралов не определен и приходится использовать геометрические характеристики для выбора начальной точки исходного алгоритма.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Сравнительный анализ помехоустойчивых свойств генетических алгоритмов безизбыточного кодирования для кластеризующихся пространств источника»

СРАВНИТЕЛЬНЫМ АНАЛИЗ ПОМЕХОУСТОЙЧИВЫХ СВОЙСТВ ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ БЕЗИЗБЫТОЧНОГО КОДИРОВАНИЯ ДЛЯ КЛАСТЕРИЗУЮЩИХСЯ ПРОСТРАНСТВ ИСТОЧНИКА

Баталов Алексей Эдуардович,

Московский технический университет связи и информатики

Россия, Москва, аспирант,

i.alexey.batalov@gmail.com

Синева Ирина Сергеевна,

Московский технический университет связи и информатики

Россия, Москва, профессор,

irina_sineva@mail.ru

Ключевые слова: генетические алгоритмы, помехоустойчивое кодирование, кластеризация, распределение Коши, нормальное распределение, равномерное распределение.

Помехоустойчивость является одним из главных аспектов в системах передачи сообщений. Как правило, высокая помехоустойчивость достигается путем введения дополнительной избыточности. Но, в некоторых случаях, это невозможно или нецелесообразно. Для повышения помехоустойчивости без введения дополнительной избыточности был разработан отдельный класс алгоритмов, который при этом улучшает результат декодирования при возникновении ошибок в канале связи. Данный класс алгоритмов опирается на принципы генетики, когда существует родительская популяция и популяция потомков. Популяцией является некоторый набор кодовых комбинаций. При этом на каждом конкретном шаге из популяции родительских кодовых комбинаций образуется популяция кодовых комбинаций потомков. Которые в свою очередь, будут родительской популяцией на следующем шаге. Для повышения помехоустойчивости источник сообщений кодируются с применением генетических алгоритмов. Основной принцип работы алгоритмов заключается в том, чтобы закодировать сообщения в исходном пространстве источника таким образом, чтобы близкие друг к другу сообщения в кодовом пространстве, так же являлись близкими в пространстве источника. Получается, что, при появлении ошибки в канале связи, эта ошибка искажает комбинацию незначительно. Полученная комбинация находится близко к исходной как в пространстве кодовых комбинаций, так и в исходном метрическом пространстве источника. Достаточно часто для пространств источника можно обнаружить явно выраженную кластеризацию. Одной из ключевых особенностей генетических алгоритмов является гибкость. Для каждого отдельно класса или типа кластеризующихся пространств можно разработать отдельный тип алгоритма, который будет выбирать начальные точки исходя из имеющихся кластеров. Для начала необходимо более подробно изучить поведение генетических алгоритмов без каких-либо модификаций в сравнении со случайным кодированием источника сообщений. Рассмотрены кластеризующиеся и некластеризующиеся метризованные пространства, которые хорошо описываются следующими распределениями: нормальное, равномерное и распределение Коши. Выбор моделей определяется тем, что гауссовские массивы имеют ярко выраженную локализацию, равномерные не имеют ее вообще, а распределенные по Коши имеют слабую локализацию, при которой даже центр рассеяния из-за расходимости интегралов не определен и приходится использовать геометрические характеристики для выбора начальной точки исходного алгоритма.

Для цитирования:

Баталов А.Э., Синева И.С. Сравнительный анализ помехоустойчивых свойств генетических алгоритмов безизбыточного кодирования для кластеризующихся пространств источника // T-Comm: Телекоммуникации и транспорт. - 2015. - №1. - С. 68-74.

For citation:

Batalov A.E., Sineva I.S. Comparative analysis of error-correcting properties of genetic noise immunity coding algorithms for clustered source spaces // T-Comm. 2015. No.1. Рр. 68-74.

T-Comm #1-2015

Введение

Для повышения помехоустойчивости без введения дополнительной избыточности были разработаны генетические алгоритмы кодирования [1,2], Далее они будут именоваться просто как генетические алгоритмы или ГА. Подробное описание принципа работы и особенностей реализации см. в [3]. Стоит отметить, что эффективность ГА напрямую зависит от типа пространства источника. Например, если пространство источника сообщений хорошо описывается равномерным распределением, эффективность ГА будет ниже. При этом, если нормальное распределение хорошо описывает пространство источника или оно разбивается на отдельные кластеры, эффективность будет значительно выше. Последний вариант представляет интерес для сравнения поведения ГА и алгоритмов случайного кодирования точек [4]. Для этого были проанализированы разные варианты конфигурации пространств источника. Для каждого варианта было сгенерировано сто различных пространств и для каждого выполнена операция генетического и случайного кодирования. После на ансамбль закодированных сообщений была наложена случайная однобитовая ошибка с вероятность появления 0,1. И на основании полученных комбинаций было посчитано среднее расстояние для комбинаций, имеющих единичное кодовое расстояние и среднее расстояние между исходными комбинациями и комбинациями с ошибками (или без ошибок).

Представление пространств источника

Пространство источника представляет собой набор из двумерных 2м точек. Тем самым для равномерного безызбыточного кодирования необходимы будут двухбитовые комбинации длины N. Варианты с большим числом размерностей представляют отдельный интерес и будут рассмотрены в последующих работах. Для симуляции пространств использовались генераторы случайных чисел с применением различных распределений. А именно: нормальное, равномерное и распределение Коши. Основной интерес представляют варианты с несколькими точками сгущения. Если источник описывается нормальным распределением и имеет две точки сгущения, и они расположены относительно далеко друг от друга (более чем на 3)), то имеются два четко выраженных кластера. А если расстояние между ними небольшое, то четко определить кластеризацию будет практически сложно.

Методика оценки эффективности

Поскольку исследуется влияние помехоустойчивых свойств генетического равномерного кодирования в зависимости от структуры кластеров, образующих исходное пространство источника, использовалось статистическое моделирование с анализом получающихся результатов.

Для каждого варианта распределения Р ={р(х,р),0ев},

где /-"(л-,/?) - распределения некоторого параметрического семейства Р, а В - множество допустимых значений параметра (в общем случае векторного) Р , генерировались конфигурации

0 = = е Я*, 1 < у < 2'°) (|)

Производилось кодирование генетическом алгоритмом ГА, в результате которого каждому сообщению присваивался двоичный код ^(хР'). Общее количество кодовых комбинаций, находящихся на единичном кодовом расстоянии г друг от друга (т.е. кодовых соседей) составляет л, сумма расстояний

I...../>ИП*И) (2)

в метрике р исходного пространства, отнесенная к количеству пар таких конфигураций л, равна

dGA = ~Sa

(3)

и будет той характеристикой, которую мы будем сравнивать с результатами статистического моделирования.

Моделирование состоит в том, что для той же конфигурации (I) генерируются случайным образом двоичные

кодовые комбинации равномерного кода ",л(-г('!),

1 <j<2l", где т - номер выборки, I < т < 100 . Для каждого кодирования находится сумма расстояний

= I р(К *(ЛК(*(/)) , (4)

которое впоследствии усредняется по числу пар кодового соседства

п

(5)

Для полученного массива , 1<ю<100, был сформирован массив относительной эффективности ГА по сравнению со случайными кодировками

1 < /я < 100 , (6)

EF_ =

_ т_GA

<*сл

и для него найдены несмещенные оценки среднего

1 W0 , №

М = ШЬЕР~ и дисперсии = — %{ЕР„-М)г. Чем

1 1,11 iu=] Sj ч|=1

меньше значение М, тем лучше кодирует ГА по сравнению со случайными расстановками кодовых комбинаций, причем единицей масштаба служит среднеквадратическое отклонение S. Если величина N\ близка к I, то значимого выигрыша при ГА алгоритме мы не получаем. Поэтому представляет также интерес коэффициент относительной эффективности \-М

(7)

Заметим, что для стандартных гауссовских методик значение к>Ъ означает очень хороший результат ГА по сравнению со случайными равномерными кодировками массива.

Далее проводилось моделирование появления однобитовой ошибки и по формулам, аналогичным (2-6) под-

T-Comm #1-2015

Ü» се 1Я С TS in

ftltHna эффеетиноан Иотадиая к«)(«ггра1ич

4 1111(1

Смей н тК fiTiiHC пи iy пшнС*и

Рис. 9. Плотности средних значений при распределении Коши

Параметры, приведенные в таблице 5, требуют одного существенного комментария. Ввиду отсутствия у распределения Коши математического ожидания и дисперсии, характеристики М и 5 не являются состоятельными и несмещенными оценками соответствующих числовых характеристик и приведены для соблюдения условия универсальности методики анализа эффективности ГА.

И даже в этом случае ГА дает в среднем выигрыш по сравнению со случайными кодировками.

Заключение

1. Предложена методика оценивания относительной эффективности кодирования, позволяющая сравнивать коды одинаковой длины и оценивать их помехоустойчивость относительно воздействия одиночных ошибок без введения дополнительной избыточности.

2. Для кластеризующихся пространств источника наблюдается поведение алгоритмов генетического кодирования, аналогичное поведению в пространствах с одним кластером.

3. Эффективность кодирования варьируется от 0,45 для случая ошибки в однокластерном равномерном случайном поле до 5,4 у двукластерного гауссовского случайного поля для корректных моделей.

4. Даже для математически наиболее слабо локализующихся случайных полей типа поля Коши наблюдается в среднем более эффективная работа ГА.

5. Тем самым, генетические алгоритмы производят кодирование значительно эффективнее, чем алгоритмы случайного кодирования, при широком классе распределений и кластерной структуре, которые описывают пространство источника.

Литература

1. Аджемов A.C., Горбунов КВ., Синева И.С. Оценка эффективности генетического алгоритма кодирования сообщений при различных распределениях источников и их разнообразных мет-ризациях, В кн.: Научная конференция профессорско-преподавательского, научного и инженерно-технического состава. -М.: ИТУСИ, 2002. - С-106-107.

2. Синева И.С. Улучшение качества передачи кодами, опирающимися на топологию источника сообщений // Технологии информационного общества: Тезисы докладов московской отраслевой научно-технической конференции, 23-25 апреля 2007 г.

- М,: Инсвязьиздат, 2007. - С. 169-170.

3. Баталов А.Э. Морфизмы пространств кодов и источников с согласованными топологиями. В кн.: Сборник тезисов участников. VI Международного молодежного форума и IX Международной научно-технической конференции студентов и молодых специалистов из стран участников Регионального содружества в области связи «Информационные технологии в мире коммуникаций», Москва, I3-I8 мая 2013. - C.I0-I I.

4. Баталов А.Э., Синева И.С. Оптимизация алгоритма генетического кодирования источника сообщений [Электронный ресурс] / T-Comrn: Телекоммуникации и транспорт. - 2014. - NB12.

- С. 6-9.

5. Фвнчук ММ., Синева И.С. Анализ помехоустойчивости генетического кодирования с применением циклического избыточного кода [Электронный ресурс] I 8-ая международная отраслевая научная конференция «Технологии информационного общества», тезисы научно-технических секций, 20-21 февраля 2014 г., Москва - с. 100. URL: http://www.media-publisher.ru/pdf/Tezis-20l4.pdf.

6. Баталов А.Э., Синева И.С. Повышение устойчивости совершенного кода Хэмминга к воздействию импульсных помех с использованием генетического кодирования источника. Фундаментальные проблемы радиоэлектронного приборостроения / Материалы Международной научно-технической конференции «INTERMATIC-20I3», 2-6 декабря 2013 г., Москва. / Под ред. академика РАН A.C. Сигова. - М.: Энергоатомиздат, 20I3, часть 4. -с. 150-154

7. Фенчук ММ., Баталов А.Э., Синева И.С. Повышение помехоустойчивости кодов CRC при помощи предварительного генетического кодирования метризованного источника сообщений. Фундаментальные проблемы радиоэлектронного приборостроения / Материалы Международной научно-технической конференции «INTERMATIC-2013», 2-6 декабря 2013 г., Москва. / Под ред. академика РАН A.C. Сигова, - М.: Энергоатомиздат, 2013, часть 4. -С. 65-70.

COMPARATIVE ANALYSIS OF ERROR-CORRECTING PROPERTIES OF GENETIC NOISE IMMUNITY CODING ALGORITHMS FOR CLUSTERED SOURCE SPACES

Alexey Batalov

postgraduate student of MTUCI, Moscow, Russia, i.alexey.batalov@gmail.com

Irina Sineva

professor of MTUCI, Moscow, Russia, irina_sineva@mail.ru

Abstract

Noise immunity is one of the main aspects of the messaging system. As a rule, high noise immunity is achieved by introducing of the additional redundancy. However, in some cases, it is impossible or impractical. To improve noise immunity without introducing additional redundancy has been developed a distinct class of algorithms, which thus improves the decoding result if an error occurs in the communication channel. This class of algorithms based on the principles of genetics, when there is a parent population and the population of descendants. Population is a set of codewords. Wherein for each step of the parental population of codewords generated codewords offspring population. This, in turn, will be the parent population in the next step. To improve noise immunity source messages are encoded using genetic algorithms. The basic operating principle is that the algorithms to encode the original message source space is that for neighbor messages in code space correspond also close message in the initial space. It turns out that, when an error occurs in the communication channel, this error distorts the combination slightly. The resulting combination is close to the original one, as in the codeword space and in the original metric source space. Quite often the source space can be clustered for some reasonable number of clusters. One of the key features of genetic algorithms is its flexibility. Separately for each class or clustering type spaces can develop a separate type of algorithm that will select the starting point on the basis of existing clusters. First we need to examine in greater detail the behavior of genetic algorithms without any modifications in comparison with a random source coding messages. The article describes the clustering and non-clustering metrized spaces that are well described by the following distribution: normal, uniform and Cauchy distribution. The choice of models is determined by the fact that the Gaussian random fields have a strong localization, uniform do not have it at all, and the distribution of the Cauchy have weak localization, in which even the center of the scattering due to the divergence of integrals is not defined and it is necessary to use the geometric characteristics to select the starting point of the original algorithm .

Keywords: genetic algorithms, noise immunity coding, clustering, Cauchy distribution, normal distribution, uniform distribution. References

1. Adzhemov A.S., Gorbunov N.V., Sineva I.S., Evaluating the effectiveness of the genetic encoding algorithm for different distributions of sources and a variety of metrization / Scientific Conference of faculty, scientific and technical staff, Moscow, 2002: materials. M.: MTUCI, 2002. Pp. 106-107. [in Russian]

2. Sineva I.S., Improving the quality of the transmission codes, based on the topology of the message source. In the book: Information Society Technologies: Proceedings of the Moscow branch scientific and technical conference. M.: Insvyazizdat, 2007. Pp. 169-170. [in Russian]

3. Batalov A.E. Morphisms of spaces codes and sources with agreed topologies. Proc .: Book of Abstracts participants of the VI International Youth Forum and the IX International scientific and technical conference of students and young professionals from countries participating in the Regional Commonwealth in the field of communication "Information technology in the world of communications", Moscow, 13-18 May 2013. Pp.10- 11. [in Russian]

4. Batalov A.E., Sineva I.S. Optimization of genetic algorithm of source coding of messages [electronic resource] / 8th International Trade Conference "Information Society Technologies", abstracts of scientific and technical sections, February 20-21, 2014, Moscow, p.95. URL: http://www.media-publisher.ru/pdf/Tezis-20l4.pdf. [in Russian]

5. Fenchuk MM., Sineva I.S. Analysis of genetic coding noise immunity using CRC [electronic resource] / 8th International Trade Conference "Information Society Technologies", abstracts of scientific and technical sections, February 20-21, 2014, Moscow, p. 100. URL: http://www.media-publisher.ru/pdf/Tezis-20l4.pdf. [in Russian]

6. Sineva I.S., Batalov A.E., Enhancing the stability of the perfect Hamming code to the effects of impulse noise using a genetic source coding. Fundamental problems of radioelectronics/ Proceedings of the International Scientific and Technical Conference "INTERMATIC-2013", 2-6 December 2013, Moscow / Ed Academician AS. Sigova. M .: Energoatomizdat, Part 4, 2013, Pp. 150-154. [in Russian]

7. Sineva I.S., Batalov A.E., Fenchuk M.M. Increase noise immunity of CRC codes using preliminary genetic coding of a metrized messages source. Fundamental problems of radioelectronics/ Proceedings of the International Scientific and Technical Conference "INTERMATIC-2013", 2-6 December 2013, Moscow / Ed Academician AS. Sigova. M .: Energoatomizdat, Part 4, 2013. Pp. 65-70. [in Russian]

i Надоели баннеры? Вы всегда можете отключить рекламу.