Научная статья на тему 'УЛУЧШЕНИЕ ИНФОРМАЦИОННЫХ ХАРАКТЕРИСТИК СООБЩЕНИЙ ПРИ ОБРАБОТКЕ ИНФОРМАЦИИ МЕТОДОМ ХЕШ-КОДИРОВАНИЯ'

УЛУЧШЕНИЕ ИНФОРМАЦИОННЫХ ХАРАКТЕРИСТИК СООБЩЕНИЙ ПРИ ОБРАБОТКЕ ИНФОРМАЦИИ МЕТОДОМ ХЕШ-КОДИРОВАНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
5
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
хеш-кодирование / информационные характеристики / хеш-слова / marking / hash encoding / information characteristics / hash words

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Комолов Дмитрий Викторович, Горшков Алексей Анатольевич

Рассматриваются аспекты применения хеш-кодирования при обработке информационных сообщений на примере искусственного языка toki pona. Предметом исследования настоящей работы является оценка информационных характеристик сообщений, формируемых на языке toki pona, применимость процедуры хеш-кодирования сообщений для сокращения объема информации или повышения информационной скорости передаваемых сообщений в каналах управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Комолов Дмитрий Викторович, Горшков Алексей Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IMPROVING THE INFORMATION CHARACTERISTICS OF MESSAGES WHEN PROCESSING INFORMATION USING THE HASH ENCODING METHOD

Aspects of the use of hash encoding in the processing of information messages are considered using the example of the artificial language toki pona. The subject of the study of this work is to evaluate the information characteristics of messages generated in the toki pona language, the applicability of the message hash encoding procedure to reduce the amount of information or increase the information speed of messages transmitted in control channels.

Текст научной работы на тему «УЛУЧШЕНИЕ ИНФОРМАЦИОННЫХ ХАРАКТЕРИСТИК СООБЩЕНИЙ ПРИ ОБРАБОТКЕ ИНФОРМАЦИИ МЕТОДОМ ХЕШ-КОДИРОВАНИЯ»

5. Карпенко А.П. Современные алгоритмы поисковой оптимизации. Алгоритмы вдохновленные природой. :уч.пособие. Москва:Изд.МГТУ им.Н.Э.Баумана. 2017. 446 с.

6. Есиков Д.О. Методика выбора метода решения задач обеспечения устойчивости функционирования распределенных информационных систем // Электронные информационные системы № 1 (16), 2018. С. 64-76.

7. Есиков О.В. Теоретические основы оптимизации информационно-вычислительного процесса и состава комплексов средств защиты информации в вычислительных сетях/Киселев В.Д., Есиков О.В., Кислицын А.С. /Под ред. профессора Сухарева Е.М. -М.:Полиграфсервис XXI век.- 2003.- 198 c.

8. Есиков О.В. Общие принципы выбора параметров многоагентных алгоритмов стохастического поиска для решения отдельных задач дискретной оптимизации/ Есиков О.В., Есиков Д.О., Акиншина Н.Ю.//Приборы и системы. Контроль, управление, диагностика. №5, 2018. С. 47-56.

Есиков Олег Витальевич, д-р техн. наук, профессор, заместитель начальника отдела, [email protected], Россия, Тула, АО ЦКБА,

Ковинько Андрей Иванович, заместитель начальника отдела, Россия, Москва, Главное управление вооружения МО РФ

RECOMMENDATIONS ON THE PRACTICAL USE OF MATHEMATICAL MODELS AND METHODS FOR CONSTRUCTING INFORMATION STORAGE AND PROCESSING PROCESSES IN EDUCATIONAL AND TRAINING

SYSTEMS

O.V. Yesikov, A.I. Kovinko

Recommendations on the practical use of models and methods for constructing information storage and processing processes in educational and training systems are proposed. The initial data, results and the order of solving problems are given. The features of using the fish shoal method to obtain rational solutions to problems in a limited time are considered. The variants of both interconnected and autonomous solutions to the problems of building information storage and processing processes in educational and training systems, taking into account their integrated application, are considered.

Key words: training complexes, mathematical modeling, distributed systems.

Yesikov Oleg Vitalievich, doctor of technical sciences, professor, deputy head of the department, cdbae@cdbae. ru, Russia, Tula, JSC CDBA,

Kovinko Andrey Ivanovich, deputy head of department, Russia, Moscow, Main Directorate of Armament of the Ministry of Defense of the Russian Federation

УДК 004.67; 004.912

DOI: 10.24412/2071-6168-2024-2-235-236

УЛУЧШЕНИЕ ИНФОРМАЦИОННЫХ ХАРАКТЕРИСТИК СООБЩЕНИЙ ПРИ ОБРАБОТКЕ ИНФОРМАЦИИ МЕТОДОМ ХЕШ-КОДИРОВАНИЯ

Д.В. Комолов, А.А. Горшков

Рассматриваются аспекты применения хеш-кодирования при обработке информационных сообщений на примере искусственного языка toki pona. Предметом исследования настоящей работы является оценка информационных характеристик сообщений, формируемых на языке toki pona, применимость процедуры хеш-кодирования сообщений для сокращения объема информации или повышения информационной скорости передаваемых сообщений в каналах управления.

Ключевые слова: хеш-кодирование, информационные характеристики, хеш-слова.

Формированию, передаче и обработке информационных сообщений по каналам управления посвящено множество работ [1-3], и практически каждая из них затрагивает вопросы повышения эффективности составных процессов обработки информации. Вне зависимости от физического источника первичной информации в каналах управления циркулируют сообщения, однозначно интерпретируемые лицом, принимающим управленческие решения, как сообщения на языке его носителя, даже если это не естественный, а специализированный или искусственный язык. Информационный подход при формировании специализированных или искусственных языков используется редко, чаще они формируются по апостериорному принципу. Данный принцип заключается в заимствовании автором, как правило лингвиста или переводчика, по его интуитивному мнению, наиболее ^звучных или экономных конструкций из различных естественных языков и их синтезе в новый лексико-грамматический конструкт. Анонсированный интернет-общественности в 2001 году канадским лингвистом, переводчиком и эсперантистом Соней Ланг язык toki pona, имеющий код ISO «tok», реализовал на практике апостериорный принцип создания искусственного языка [4]. Отличительной особенностью данного языка является ограниченный 119 корнями или языковыми словарными единицами словарь, при этом сами слова или корни записываются всегда строчными буквами, ограниченными 14 латинскими символами. Это символы: a, e, i, j, k, l, m, n, o, p, s, t, u, w. Для придания выразительности предложениям языка toki pona, что дословно в переводе на русский обозначает «добрый язык», в качестве служебных символов применяются стандартные знаки: точка, запятая, восклицательный и вопросительный знаки, двоеточие и кавычки. В таблице 1 представлен оригинальный набор слов языка toki pona, разбитый на 14 групп по начальному символу, с некоторыми информационными характеристиками.

Таблица 1

Оригинальный набор слов языка toki pona_

Группа слов Слова (корни) Количество

слов в группе символов в слове

минимальное максимальное

a a akesi ala ali ale anpa ante anu awen 9 1 5

e e en 2 1 2

i ijo ike ilo insa 4 3 4

j jakijanjelojo 4 2 4

k kala kalama kama kasi ken kepeken kili kin kiwen ko kon kule kute kulupu 14 3 7

l la lape laso lawa len lete li lili linja lipu loje lon luka lukin lupa 15 1 5

m ma mama mani meli mi mije moku moli monsi mu mun musi mute 13 2 5

n nanpa nasa nasin nena ni nimi noka 7 2 5

o o oko olin ona open 5 1 4

P pakala pali palisa pana pi pilin pimeja pini pipi poka poki pona 12 2 6

s sama seli selo seme sewi sijelo sike sin sina sinpin sitelen sona soweli suli suno supa suwi 17 3 7

t tan taso tawa telo tenpo toki tomo tu 8 2 4

u unpa uta utala 3 3 5

w walo wan waso wawa weka wile 6 3 4

Анализ данных, представленных в таблице 1, показывает, что количество слов в группах распределено неравномерно: от 2 слов в группе слов с начальным символом «e» до 17 в группе слов с начальным символом «s». Кроме того, доля слов с максимальным количеством символов в слове составляет лишь 1 % от общего объема слов, однако при этом они требуют максимального количества битов для представления их в цифровой форме выбранной кодировки. Так, для ASCII кодировки слово из семи символов будет представлено 56 битами. В среднем слово оригинального словаря языка toki pona состоит из 3,84 символа, или с округлением до целого числа 31 бит на слово. С учетом применения помехоустойчивых кодов для последующей передачи сообщений по каналам управления данное значение будет расти пропорционально количеству проверочных символов кода или при сверочном кодировании -скорости кода.

Формулировка технической задачи улучшения информационных характеристик сообщений заключается в преобразовании исходных кодовых слов, из которых в дальнейшем формируется информационное сообщение, таким образом, чтобы в конечном счете сокращался объем передаваемой информации или повышалась информационная скорость передаваемых сообщений в каналах управления.

Данная техническая задача решается тем, что слова исходного кода хеш-кодированием преобразуют к словам, состоящим из трех байтовых двоичных комбинаций или после конкатенации данных комбинаций 24-битной последовательности двоичных символов следующим образом.

Предложения из слов Sj соответствующих кодировок последовательных числовых значений символов nj для языка toki pona - 14 символов (см. таблицу 1), строки слов преобразуют от первого до последнего символа слова в последовательность из трех чисел Bj вида:

Bj = [Bj!, Bj2, BJ3] (1)

где Bj! - первое число последовательности, BJ2 - второе число последовательности, BJ3 - третье число последовательности.

Значение первого числа Bj± соответствует десятичному числовому значению кодового знака первого символа слова sJi j-й строки. Значение второго числа Bj2 рассчитывается выражением:

1 Bj2 = GZ^njiW"-1) mod R, (2)

где nJk - код -го символа в алфавите символов; mk - число символов в j-м слове; w - целое число больше или равно 3; mod - функция модуля по основанию R.

Значение третьего числа Bj3 рассчитывается выражением:

Bj3 = (l^^1nJkwk) mod R. (3)

Числовые примеры преобразования символьных сообщений в хеш-коды для различных буквенно-знаковых систем письменности представлены в работе [5].

В результате хеш-кодирования каждое слово словаря преобразуется в хеш-слово, состоящее из трех десятичных чисел. Далее полученные хеш-слова проверяют на уникальность для всех слов словаря. В случае обнаружения хеш-слов с одинаковой последовательностью числовых значений из разрешенных символов алфавита языка формируют новое благозвучное или экономное слово таким образом, чтобы общее количество слов в новом словаре по группам было распределено равномерно, т.е. каждая группа слов насчитывала примерно одинаковое количество слов. Неуникальное слово или группу таких слов удаляют из словаря. Получив конечное число уникальных хеш-слов, а соответственно, и слов языка, для дальнейшего кодирования слов в сообщения осуществляют представление каждого десятичного числового значения в двоичную форму, т.е. последовательность из 8 двоичных символов. Далее осуществляют конкатенацию двоичных последовательностей каждого хеш-слова в двоичную числовую последовательность емкостью в 24 двоичных символа. Таким образом, среднее слово отличного от оригинального словаря языка toki pona составит 3 символа или 24 бита на слово. То есть объем передаваемой информации сократится в среднем на 7 битов на слово.

Для графического отображения слов языка после процедуры хеш-кодирования воспользуемся кодом m-программы для среды MatLab, приведенном в таблице 2. Программа отображает размещение в трехмерном пространстве векторов, которые соответствуют хеш-значениям для каждого из заданных 119 слов (корней) словаря языка toki pona.

Таблица 2

__________________________________________________________КодпрограммьгдляМАТ^ЛВ___________________________________________________________

m-программа отображения корней в 3Б-пространстве cla %очистка рабочей области и области данных load D:\\Tab1 Лх^%загрузка содержимого файла tab.txt %матрица данных, состоящая из 5 столбцов и 119 строк /первые 3 столбца содержат рассчитанные хеш-значения для i-го корня /автоматическое присваивание матрице данных имени Tabl %выделение данных из матрицы по столбцам nabor_1 = Tab1(:,1); % 119 значений 1-го символа для i-го корня nabor_2 = Tab1(:,2); % 119 значений 1-го хеш-значения для i-го корня nabor_3 = Tab1(:,3); % 119 значений 2-го хеш-значения для i-го корня nabor_4 = Tab1(:,4); % значения, задающие объем отображаемых точек nabor_5 = Tab1(:,5); % 14 значений для групп корней scatter3(nabor_1,nabor_2,nabor_3,nabor_4,nabor_5,'filled') % 5D- графика ax = gca;

ax.XDir = 'reverse';

view(-45,30) % задание проекции отображения фигуры xlabelCl-й хеш') % подпись X оси графика ylabe^'2-й хеш') % подпись Y оси графика zlabel('3^ хеш') % подпись Z оси графика

% цвет точки фигуры указывает на её принадлежность к одной из 14 групп cb = colorbar; % создание цветовой палитры для 14 групп корней cb.Label.String = 'i-я группа'; % подпись цветовой палитры set(gcf,'Color',[1 1 1]) % установка белого фона

На рисунке 1 представлены результаты отображения векторов хеш-кодирования для оригинального словаря таблицы 1, а также для нового словаря с перегруппированными и частично переименованными словами словаря toki pona, который условно назовем словарем языка toki pona d3. Необходимость добавления символа d3 к оригинальному названию поясняется тем, что кодовые слова, перегруппированные, частично переименованные и представленные в 24-битной последовательности двоичных символов на слово, отличаются друг от друга в худшем случае на 3 двоичных символа. Минимальное кодовое расстояние, равное 3, определяет корректирующую способность кода [2].

Рисунок 1 указывает на то, что в трехмерном векторном пространстве перегруппированные и частично переименованные слова (см. рисунок 1 б) имеют более разреженную картину и большее Евклидово расстояние между точками, чем у слов оригинального словаря toki pona.

£ i», i

г.т* >

•• и*

..Wh *

5 ¡и • т «

*

a i»

а

Рис. 1 - Корни языка toki pona: а - оригинальные, б - перегруппированные и частично переименованные

б

Кроме того, расчет хэш-кодов оригинального словаря для w=4 и R=231 показал совпадение хеш-слов для слов pokala и poki, а именно одинаковые числовые значения (112, 72, 249) или после конкатенации двоичных кодов данных значений в последовательность 011100000100100011111001 в двоичной форме. В таблице 2 представлен словарь языка toki pona d3 с перегруппированными и частично переименованными словами, где отличные от оригинального словаря слова выделены полужирным шрифтом.

В результате перегруппировки слов и частичного их переименования после хеш-кодирования получили 119 уникальных слов, двоичное представление, которых позволяет добиться в худшем случае минимального кодового расстояния равного 3, т.е. позволяющего без дополнительных проверочных символов, как при помехоустойчивом кодировании, декодировать сообщение по каналам управления, при этим обнаруживать двойные ошибки и (или) исправлять одиночную ошибку в любой кодовой последовательности из 24 битов, т.е. в хеш-кодовом слове из словаря.

Результаты расчета минимального кодового расстояния хэш-кодовых слов покажем на примере i-группы слов словаря языка toki pona d3. В таблицу 3 сведены результаты расчета хеш-кодовых слов по выражениям 1-3 с параметрами w=4 и R=231, результаты преобразования десятичных значений в двоичные, конкатенацию последовательностей Bj2 и Bj3. Так как Bj1 - первое значение в хеш-коде для единой i-группы слов равно 105, то для расчета минимального кодового расстояния достаточно конкатенации Bj2 и Bj3 - второго и третьего значений хеш-кодов.

Таблица 2

Словарь языка toki pona ^ d3_

Группа слов Слова (корни) Количество

слов в группе символов в слове

минимальное максимальное

a a ala ali ale anpa anti anu awin 8 1 4

e e en elen epin eja ewa epi ewis 8 1 4

i ijo ika ike ilo insa iwen inja ikin 8 3 4

j jaki jan jelo jo jama jala ju jao 8 2 4

k kala kama kawi ken kili kin ko kon kule kute 10 3 4

l la lape laso len lete li lili lipu lot lipa 10 2 4

m ma mom mani meli mi mije mok mun musi mute 10 2 4

n non nasa nu nena ni nimi noli noka 8 2 4

o o oko olin oje ol owel ona open 8 1 4

p pali pana pil pini pipi poka poki pona 8 2 4

s sama seli selo sike sin sona suno supa 8 3 4

t tan tako tawa telo tenpo toki tomo tu 8 2 4

u unpa uka use uta uwi ume ulsi unsi upu 9 3 4

w wa walo wan wako wow wina wika wile 8 3 4

Таблица 3

Результаты расчета i-группы слов словаря языка toki pona d3_

№ п/п Слова Bji B¡2 Двоичное представление B¡ Конкатенация Bi2 и Bj3

1 ijo 105 226 211 01101001 11100010 11010011 1110001011010011

2 ika 105 6 24 01101001 00000110 00011000 0000011000011000

3 ike 105 70 49 01101001 01000110 00110001 0100011000110001

4 ilo 105 3 12 01101001 00000011 00001100 0000001100001100

5 insa 105 46 184 01101001 00101110 10111000 0010111010111000

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6 iwen 105 228 219 01101001 11100100 11011011 1110010011011011

7 inja 105 133 70 01101001 10000101 01000110 1000010101000110

8 ikin 105 13 52 01101001 00001101 00110100 0000110100110100

Результаты расчета минимального кодового расстояния между словами г-группы слов словаря языка toki pona d3 сведены в таблицу 4.

Таблица 4

Результаты расчета минимального кодового расстояния i-группы слов словаря языка toki pona d3

^min Слова

1 2 3 4 5 6 7 8

1 - 9 7 11 9 3 9 13

2 9 - 4 4 4 8 8 6

3 7 4 - 8 6 8 10 6

4 11 4 8 - 8 12 6 6

5 9 4 6 8 - 8 12 6

6 3 8 8 12 8 - 8 13

7 9 8 10 6 12 8 - 6

8 13 6 6 6 6 13 6 -

Минимальное кодовое расстояние, равное 3, вычисляется между первым и шестым словами г-группы слов словаря языка toki pona d3, между остальными словами минимальное кодовое расстояние варьируется от 4 до 13, т.е. остальные слова обладают большей потенциальной способностью к исправлению ошибок в декодированном управляющем сообщении.

Для других групп словаря языка toki pona d3 минимальное кодовое расстояние, равное 3, вычислено для следующих пар слов: (iwen; ijo), (pona; poki), (lili; mani), (anu; walo), (la; ma), (non; oko), (ma, pipi). Повысить минимальное кодовое расстояние при хеш-кодировании можно лишь последовательно подбирая комбинации слов в словарь, начиная со слов, для которых данное расстояние минимально.

Таким образом, применение процедуры хеш-кодирования к словарю искусственного языка позволило скорректировать его в сторону улучшения информационных характеристик и получить блочное помехоустойчивое кодирование без расширения количества проверочных символов, т.е. при информационной скорости, равной 1, добиться исправляющей способности линейных блочных кодов Хемминга. Кроме того, двоичные последовательности хеш-кодов слов могут использоваться как информационные символы, которые далее способны подвергаться помехоустойчивому кодированию и за счет пропорционального снижения скорости кода повышать потенциальную помехоустойчивость объединенной кодовой конструкции.

Список литературы

1. Гургенидзе, А.Т., Мультисервисные сети и услуги широкополосного доступа [Текст] : Монография / А.Т. Гургенидзе, В.И. Кореш. - СПб.: «Профи», 2006. - 400 с.

2. Хмельков, А.Н., Минеев, В.А., Помехоустойчивое кодирование в цифровых системах связи [Текст] : Учебное пособие для вузов / А.Н. Хмельков, В.А. Минеев. - СПб.: «Горячая линия - Телеком», 2023. - 360 с.

3. Скляр, Бернард, Цифровая связь. Теоретические основы и практическое применение [Текст] : Пер. с англ. // М. : Издательский дом «Вильямс». 2003. - 1104 с.

4. Toki pona [Электронный ресурс] URL: http://tokipona.org/nimi.html (дата обращения 08.01.2024, доступ свободный).

5. Патент РФ №2011151684 МПК G 06 F 17/30, 16.12.2011.

Комолов Дмитрий Викторович, канд. техн. наук, сотрудник, dimkomolov@mail. rn, Россия, Орёл, Академия Федеральной службы охраны Российской Федерации,

Горшков Алексей Анатольевич, канд. техн. наук, сотрудник, gorsch&nbox.m, Россия, Орёл, Академия Федеральной службы охраны Российской Федерации

IMPROVING THE INFORMATION CHARACTERISTICS OF MESSAGES WHEN PROCESSING INFORMATION

USING THE HASH ENCODING METHOD

D.V. Komolov, A.A. Gorshkov

Aspects of the use of hash encoding in the processing of information messages are considered using the example of the artificial language toki pona. The subject of the study of this work is to evaluate the information characteristics of messages generated in the toki pona language, the applicability of the message hash encoding procedure to reduce the amount of information or increase the information speed of messages transmitted in control channels.

Key words: marking, hash encoding, information characteristics, hash words.

Komolov Dmitriy Victorovich, candidate of technical sciences, employee, dimkomolov@mail. ru, Russia, Orel, Academy of the Federal Security' Service of the Russian Federation,

Gorshkov Aleksey Anatol'yevich, candidate of technical sciences, employee, [email protected], Russia, Orel, Academy of the Federal Security' Service of the Russian Federation

УДК 621.396

DOI: 10.24412/2071 -6168-2024-2-239-240

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИЗМЕРЕНИЯ УГЛА МЕСТА НИЗКОЛЕТЯЩЕЙ ЦЕЛИ В РЛС

С.А. Курбатский

Приведены результаты синтеза математической модели дискретного случайного процесса, представляющего собой измерения угла места низколетящей цели в РЛС для ее использования в алгоритме совместного оценивания параметров и состояния такой модели. Показано, что некоторые параметры модели должны задаваться априорно в виде компромиссных констант, найденных в процессе обработки реальных данных телеметрии для низколетящих целей в различных условиях переотражений. Поскольку получившаяся таким образом модель оказывается нелинейной, то для оценивания ее вектора состояния требуется использовать нелинейный фильтр.

Ключевые слова: дискретный случайный процесс, формирующий фильтр, корреляционная функция, фильтр Калмана.

Анализ существующих способов компенсации ошибок в измерениях угла места низколетящих целей (НЛЦ) при многолучевом распространения радиоволн показывает [1-5], что наиболее эффективными являются ма-тематико-статистические способы, сводящиеся к фильтрации цветного шума в сигнале измерений угла места на этапе вторичной обработки измерений (ВОИ) в РЛС.

При этом модель для многолучевого распространения радиоволн строилась путем дополнения исходной модели изменения высоты цели специальной линейной динамической системой (формирующим фильтром), которая преобразовывала стандартный гауссовский белый шум в цветной с требуемыми характеристиками.

Представляет определенный интерес синтез математической модели дискретного случайного процесса, представляющего собой измерения угла места низколетящей цели в РЛС для ее использования в алгоритме совместного оценивания параметров и состояния такой модели. Алгоритм предусматривает по результатам текущих измерений в реальном масштабе времени выделение двух составляющих этого процесса: медленно изменяющуюся составляющую, являющуюся оценкой истинного угла места цели и периодическую составляющую, являющуюся следствием переотражений от поверхности.

Будем рассматривать измеренный приемной антенной РЛС сигнал угла места в качестве некоторого дискретного случайного процесса, скомбинированного из трех составляющих: постоянной или очень медленно изменяющейся детерминированной компоненты, по сути, являющейся истинным углом места цели; автокоррелированного (цветного) случайного сигнала с прослеживаемой периодичностью, являющегося следствием переотражений от поверхности; нормально распределенного белого шума с нулевым средним, причинами возникновения которого являются собственные шумы антенны, а также множество других внешних факторов, способных внести погрешности в измерения [1,6].

i Надоели баннеры? Вы всегда можете отключить рекламу.