УДК 51.007.004
А.А.Коп ыл ьцов
Санкт-Петербург, Россия
АЛГОРИТМ КОРРЕКЦИИ СВЯЗЕЙ МЕЖДУ ФРАГМЕНТАМИ СЛАБО ФОРМАЛИЗОВАННОЙ ИНФОРМАЦИИ В ХРАНИЛИЩЕ И ГЕНЕРАЦИИ НОВОЙ ИНФОРМАЦИИ
Аннотация. Разработан алгоритм коррекции связей между фрагментами слабо формализованной информации, поступающей от технических систем. Предполагается, что информация поступает в хранилище и характеризуется некоторым конечным набором показателей. Осуществляется свертка этих показателей, которая представляет собой взвешенную сумму с весовыми коэффициентами. Далее осуществляется сравнение полученной свертки со свертками фрагментов ранее поступивших фрагментов информации в хранилище. Если евклидово расстояние между свертками меньше некоторого заранее заданного числа е, то считается, что эти фрагменты информации между собой связаны. В хранилище рассматриваются связи между фрагментами информации, и осуществляется их коррекция, т.е. выявление фрагментов информации, находящейся в хранилище, которые между собой связаны с точностью до е, до 2 е, до 3 е и т.д. Таким образом, вводится уровень связности первого, второго, третьего и других порядков. Информация о том, что некоторые фрагменты информация между собой связаны, можно рассматривать как новую информацию, и эта новая информация определяется множеством показателей, которое представляет объединение показателей, которыми определяются первоначальные фрагменты информации. Можно в хранилище рассмотреть сети связности первого, второго, третьего и так далее порядков, т.е. сети, элементы которых между собой связаны с точностью до е, до 2 е, до 3е и т.д. В некоторых случаях можно определить взаимосвязь фрагментов информации, т.е. какой фрагмент информации какому фрагменту информации предшествует или какой фрагмент из какого фрагмента следует. Это можно сделать следующим образом. Если фрагмент информации с номером П определяется некоторыми показателями, а фрагмент информации с номером 12 определяется другими показателями, и если все первые показатели характеризуются более ранними временными характеристиками, чем все вторые показатели, то фрагмент информация с номером П предшествует фрагменту информации с номером 12. Однако это не позволяет сделать заключение о том, что информация с номером П следует из информации с номером 12 или наоборот. Для того, чтобы фрагмент информации с номером 12, определяемый некоторым набором показателей, следовал из фрагмента информации с номером 11, определяемым другим набором показателей, нужно, чтобы фрагмент информации с номером 12 уже содержался в фрагменте информации с номером 11, т.е. набор
A.AKopyltsov
St. Petersburg, Russia
ALGORITHM OF CORRECTING CONNECTIONS BETWEEN FRAGMENTS OF POORLY FORMALIZED INFORMATION IN STORAGE AND GENERATION OF NEW INFORMATION
Abstract: The author has developed an algorithm for correcting the connections between fragments of poorly formalized information received from technical systems. It is assumed that the information comes to storage and it is characterized by a finite set of indicators. These indicators are convoluted and the convolution is a weighted sum with weight coefficients. Further the resulting convolution is compared with convolutions of fragments previously received pieces of information in the storage. If the Euclidean distance between the convolutions is less than a predetermined value e, it is believed that these pieces of information are interconnected. The connections between pieces of information are considered and corrected in the storage, i.e. the fragments of information in storage which are interconnected with up to e, up to 2 e, up to 3 e etc. are identified. Thus the connection level of the first, second, third and other orders is introduced. The information that some fragments of information are connected to each other can be regarded as new information, and this new information is determined by a set of indicators, which represents a union of indicators determining the initial pieces of information. One may consider a connectivity network of the first, second, third, etc. orders, i.e. a network with elements which are interconnected up to e, up to 2 e, up to 3 e, etc. In some cases it is possible to determine the connection of pieces of information, i.e. which piece of information precedes the other or which fragment follows the other. This can be done as follows. If a piece of information number 11 is defined by some indicators, as a piece of information number 12 is determined by other indicators, and if all of the first indicators are characterized by earlier time parameters than all the second indicators, the piece of information number 11 precedes the piece of information number 12. However, it is not possible to conclude that the information number 11 results from information number 12 or vice versa. To the piece of information number 12, defined by some set of indicators, result from the piece of information number 11, defined by a different set of indicators, it is necessary that the piece of information number 12 must already contain the piece of information number 11, i.e. the set of indicators defining 12 must be contained in the set of indicators defining 11. This means that the piece of information number 11 already contains the fragment of information number 12, and therefore 12 can be obtained from 11, i.e. 12 results from 11. An example of such pieces of information is considered. Let there be a piece of information number 11, defined by some set of indicators consisting of k elements. Then this piece of information results in pieces of
показателей определяющий 12 должен содержаться в наборе показателей определяющем II. Это означает, что в фрагменте информации с номером II уже содержится фрагмент информации с номером 12 и, поэтому, из II можно получить 12, т.е. 12 следует из II. Рассмотрен пример таких фрагментов информации. Пусть дан фрагмент информации с номером II, определяемый некоторым набором показателями состоящим из k элементов. Тогда из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется некоторым подмножеством множества состоящего из k показателей. Возможны следующие варианты: фрагменты информации, определяемые различными комбинациями, состоящими из (к-1) показателей, из (к-2') показателей, ..., из 3 показателей, из 2 показателей, из 1 показателя. Кроме того, аналогично, из каждого фрагмента информации, определяемого (к-1) показателями, следуют фрагменты информации, определяемые наборами из (к-2) показателей, ..., из 3 показателей, из 2 показателей, из 1 показателя. Аналогично для фрагментов информации, определяемых (к-2), (к-3) и меньшим количеством показателей. Если дан фрагмент информации, определяемый набором показателей, состоящим из 3 элементов, то из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется различными комбинациями, состоящими из 2 показателей и из 1 показателя. Если дан фрагмент информации, определяемый набором показателей, состоящим из 2 элементов, то из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется 1 показателем. Таким образом, разработан алгоритм, который позволяет установить степень взаимосвязи различных фрагментов информации, находящихся в хранилище, и эту взаимосвязь можно рассматривать как новую информацию, которая в дальнейшем может быть подвергнута дальнейшей обработке. Ключевые слова: информация; обработка информации; технические системы.
information, each of which is defined by a subset of the set consisting of k indicators. The following options are possible: the pieces of information defined by various combinations consisting of (k-1) indicators of the (k-2) indicators, ..., of 3 indicators, of 2 indicators, of 1 indicator. Moreover, similarly, each piece of information defined by (k-1) indicators results in pieces of information defined by a set of (k-2) indicators, ..., 3 indicators, by 2 indicators, by 1 indicator. Similarly it is for the pieces of information defined by (k-2), (k-3) and fewer indicators. In case of a piece of information defined by a set of indicators, consisting of 3 elements, this piece of information is followed by pieces of information, each of which is determined by various combinations consisting of 2 indicators and 1 indicator. In case of a piece of information defined by a set of indicators, which consists of 2 elements, then this piece of information is followed by pieces of information, each of which is defined by 1 indicator. Thus, an algorithm was developed to set a degree of connection of various pieces of information in storage, and this connection can be regarded as new information which can be processed further.
Key words: information; processing information; technical systems._
Сведения об авторе: Антон Александрович Копыль-цов, инженер-программист кафедры автоматизированных систем обработки информации и управления СПбГЭТУ
Место работы: Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И.Ульянова (Ленина) (СПбГЭТУ)._
About the author: Anton Alexandrovich Kopyltsov, Programming Engineer at the Department of Automated Information Processing Systems of Saint Petersburg State Electrotechnical University «LETI». Place of employment: Saint Petersburg State Electro-technical University «LETI».
Контактная информация: 197198, г. Санкт-Петербург, ул. Лизы Чайкиной, д.18, кв. 8; тел.: 9214019427. E-mail: kopyl2001 @ mail.ru
В последние годы много внимания уделяется обработке слабо формализованной информации, поступающей от технических систем [3—11]. Под слабо формализованной информацией обычно понимают информацию, которая поступает от технических систем в непрерывном или дискретном виде с видео, аудио, температурных, ионных и других датчиков. Такая разнообразная информация, поступающая в больших объемах, плохо поддается обработке. Поэтому из слабо формализованной информации стараются получить формализованную путем, например, представления непрерывной информации в дискретном
виде, а дискретную информацию можно, например, записать в таблицу в определенном, заранее выбранном, формате. Однако это не всегда возможно [2]. Часто поступающие от технических систем фрагменты информации взаимосвязаны. Однако эта взаимосвязь не очевидна, и трудно определить, какая информация следует из другой информации. Поэтому предлагается алгоритм коррекции связей между фрагментами слабо формализованной информации, находящимися в хранилище, который позволяет установить степень взаимосвязи различных фрагментов информации. Эту взаимосвязь фрагментов информации можно рассматривать как новую информацию и подвергать дальнейшей обработке.
Обработка информации, поступающей в хранилище.
Предполагается, что информация в хранилище характеризуется некоторым конечным набором показателей. При поступлении новой информации в хранилище осуществляется свертка ее показателей (Сы — результат свертки) [1; 3; 5; 12; 13] и сравнение со свертками (С1, С2, ..., Ск) ранее полученных фрагментов информации, находящихся в хранилище, следующим образом. Если дыг = \Сы —Сг\ < £ для некоторого г е {1, 2, ..., к} и некоторого >0 , то считаем, что новая информация с номером N и старая информация с номером г между собой связаны.
Пусть фрагменты информации поступают в хранилище. Считаем соответствующие им свертки С1, С2, ..., Сп. Рассмотрим ду = \Сг - С \, где ¡, ] = 1, 2, ., п и I Ф]. Если ду < £ для некоторого £ > 0, то считаем, что эти фрагменты информации взаимосвязаны и образуют устойчивую группу взаимосвязанных фрагментов информации.
Коррекция связей в хранилище и генерация новой информации.
Рассмотрим сеть связей в хранилище для устойчивой группы взаимосвязанных фрагментов информации, состоящей из п элементов, г = 1, ... , п. Если между информацией с номером г и информацией с номером у имеется Су связей и Су > С* , где С* — некоторое число, то считаем, что информация с номером г и информация с номером у связаны непосредственно (уровень связности Су) (рис. 1).
Информацию о том, что информация с номером I, и информация с номером I связаны, можно рассматривать как новую информацию с номером Ь. Это означает, что если информация с номером I, определяется показателями г1, г2, ..., гг1, а информация с номером I — показателямиу ]2, ..., , то информация с номером Ь = Ъц определяется показателями г1, г2, .■■, Ьь ]1, ]2, • •,у , представляющими собой объединение показателей, которыми определяется информация с номерами I, и I). Это означает, что свертка в дальнейшем делается по показателям г1, г2, ..., 1ц, ]1, ]2, .■■, ]}1.
Рис. 1. Уровни связности между точками
Если число связей второго порядка больше или равно двум (например, между точками А и В (сплошные линии)), то считаем, что точки А и В связаны непосредственно (уровень связности между точками А и В больше или равен 2, т.е. САВ > 2, пунктирная линия)
В некоторых случаях можно между информацией с номером I и информацией с номером I ввести отношение порядка, т.е. определить, какая из них предшествующая, а какая последующая, или какая из какой следует.
Это можно сделать следующим образом. Если информация с номером I определяется показателями г1, г2, ..., гг1, а информация с номером I — показателямиу ]2, ..., , и если все показатели г1, г2, ..., гг1 характеризуются более ранними временными характеристиками, чем все показатели у ]2, ..., ¡¡1, то информация с номером II предшествует информации
X
с номером I . Однако это не позволяет сделать заключение о том, что информация с номером I следует из информации с номером I,, или наоборот.
Для того, чтобы информация с номером I, определяемая показателями ¡1, ¡2, ..., ¡¡1, следовала из информации с номером I, определяемой показателями]1, ]2, нужно, чтобы информация с номером I, уже содержалась в информации с номером 1, т.е. { ¡1, ¡2, ..., ¡¡1 } с {Д ]2, .■■, ]}1}. Это означает, что в информации с номером 1 уже содержится информация с номером I,, и поэтому из 1 можно получить I, , т.е. I следует из I .
Пусть дан фрагмент информации с номером Ъ , определяемый показателями ¡1, ¡2, ..., ¡к. Тогда из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется некоторым подмножеством множества {¡1, ¡2, ..., ¡к}, т.е.
{¡1} с {¡1, 12, ..., ¡к},
{Ь} с {¡1, ¡2, ..., ¡к},
{¡з} с {¡1, ¡2, ..., ¡к},
{ii, i2} с {ii, ¡2, ..., ik}, {ii, ¡3} с {i1, i2, ..., ik}, {i1, i4} с {i1, i2, ..., ik},
и т.д.
Например, пусть дан фрагмент информации с номером I, определяемый показателями i1, i2, i3,, i4. Тогда
{i1} с {ii, i2, i3,, i4}, или I1 с I1234 ,
{i2} с {ii, i2, i3,, i4}, или I2 с I1234 ,
{i3} с {ii, i2, i3,, i4}, или I3 с I1234 ,
{i4} с {ii, i2, i3,, i4}, или I4 с I1234 ,
{ii, i2} с {ii, i2, i3,, i4}, или Ii2 с Ii234 , {ii, i3} с {ii, i2, i3,, i4}, или Ii3 с Ii234 , {ii, i4} с {ii, i2, i3,, i4}, или Ii4 с Ii234 , {i2, i3} с {ii, i2, i3,, i4}, или I23 с Ii234 , {i2, i4} с {ii, i2, i3,, i4}, или I24 с Ii234 , {i3, i4} с {ii, i2, i3,, i4}, или I34 с Ii234 ,
{ii, i2, i3} с {ii, i2, i3,, i4}, или Ii23 с Ii234 , {ii, i2, i4} с {ii, i2, i3,, i4}, или Ii24 с Ii234 , {ii, i3, i4} с {ii, i2, i3,, i4}, или Ii34 с Ii234 , {i2, i3, i4} с {ii, i2, i3,, i4}, или I234 с Ii234 ,
Аналогично можно получить для {ii, i2, i3}:
{ii} с {ii, i2, i3}, или Ii с Ii23 , {i2} с {ii, i2, i3}, или I2 с Ii23 , {i3} с {ii, i2, ¡з}, или I3 с Ii23 ,
{ii, i2} с {ii, i2, i3}, или Ii2 с Ii23 , {ii, i3} с {ii, i2, ¡з}, или Ii3 с Ii23 , {i2, i3} с {ii, i2, ¡з}, или I23 с Ii23,
для {il, i2, i4}:
{il} с {il, i2, i4}, или Il с I124 , {i2} с {il, i2, i4}, или I2 с I124, {i3} с {il, i2, i4}, или I3 с I124 ,
{il, i2} с {il, i2, i4}, или I12 с I124 , {il, i4} с {il, i2, i4}, или I14 с I124 , {i2, i4} с {il, i2, i4}, или I24 с I124,
для {i2, i3,, i4}:
{i2} с {i2,, i3,, i4}, или I2 с I234 , {i3} с {i2,, i3,, i4}, или I3 с I234 , {i4} с {i2,, i3,, i4}, или I4 с I234 ,
{i2,, i3} с {i2,, i3,, i4}, или I23 с I234 , {i2 , i4} с {i2,, i3,, i4}, или I24 с I234 , {i3,, i4} с {i2,, i3,, i4}, или I34 с I234,
для {il, i2}:
{il} с {il, i2}, или Il с I12 , {i2} с {il, i2}, или I2 с I12 ,
для {il, i3}:
{il} с {il, i3}, или Il с I13 , {i3} с {il, i3}, или I3 с I13 ,
для {il, i4}:
{il} с {il, i4}, или Il с I14 , {i4} с {il, i4}, или I4 с I14 ,
для {i2, i3}:
{i2} с {i2,, i3}, или I2 с I23 , {i3} с {i2,, i3}, или I3 с I23 ,
для {i2,, i4}:
{i2} с {i2,, i4}, или I2 с I24 , {i4} с {i2,, i4}, или I4 с I24 ,
для {i3,, i4}:
{i3} с {i3,, i4}, или I3 с I34 , {i4} с {i3,, i4}, или I4 с I34 ,
На рисунке 2 приведена схема сети связности для фрагментов информации с номерами М23 (определяется показателями П, i2, i3), >12 (определяется показателями П, i2), i-13 (определяется показателями П, i3), i-23 (определяется показателями i2, i3), i-1 (определяется показателем П), i-2 (определяется показателем i2), i-3 (определяется показателем i3). Стрелками обозначены отношения порядка (следования).
Рис. 2. Схема сети связности
Из рисунка 2 видно, что:
- из фрагмента информации с номером i-123 следуют фрагменты информации с номерами i-12, i-13, i-23, i-1, i-2, i-3;
- из фрагмента информации i-12 следуют фрагменты информации с номерами i-1 и i-2;
- из фрагмента информации i-13 следуют фрагменты информации с номерами i-1 и i-3;
- из фрагмента информации i-23 следуют фрагменты информации с номерами i-2 и i-3.
Заключение
Таким образом, разработан алгоритм, который позволяет установить степень взаимосвязи различных фрагментов информации, находящихся в хранилище, и эту взаимосвязь можно рассматривать как новую информацию, которая в дальнейшем может быть подвергнута дальнейшей обработке.
ЛИТЕРАТУРА
1. Воробьев В.И., Копыльцов А.В., Пальчун Б.П., Юсупов Р.М. Методы и модели оценивания качества программного обеспечения. СПб., 1992.
2. Воройский Ф.С. Информатика. Энциклопедический словарь-справочник: введение в современные информационные и телекоммуникационные технологии в терминах и фактах. М., 2011.
3. Копыльцов А.А. Модель классификации информации и алгоритм ее предварительной обработки для статических и динамических объектов // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2013. № 6.
4. Копыльцов А.А. Обработка информации в живых и технических системах // Материалы XIII Санкт-Петербургской международной конференции «Региональная информатика — 2012» (24—26 октября 2012 г.). СПб., 2012.
5. Копыльцов А.А. Обработка слабо формализованной информации в живых и технических системах // Материалы Всероссийской научно-практической конференции студентов, магистров, аспирантов «Современное программирование» (16—17 апреля 2014 г.). Нижневартовск, 2014.
6. Копыльцов А.А. Обработка слабо формализованной информации при недостатке информации // Материалы XIII Санкт-Петербургской международной конференции «Региональная информатика — 2012» (24—26 октября 2012 г.). СПб., 2012.
7. Копыльцов А.А. Сохранение конфиденциальности данных при поддержке принятия решений на основе извлекаемой специальным образом информации // Материалы VIII Санкт-Петербургской межрегиональной конференции «Информационная безопасность регионов России» (23—25 октября 2013 г.). СПб., 2013.
8. Копыльцов А.А., Копыльцов А.В. Алгоритм обработки слабо формализованной информации, поступающей от технических систем // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2012. № 8.
9. Копыльцов А.А., Копыльцов А.В. Обработка слабо формализованной информации, поступающей от технических систем // Вестник Нижневартовского государственного гуманитарного университета. 2013. № 1.
10. Копыльцов А.А., Копыльцов А.В. Технические системы и слабо формализованная информация // Материалы XIII Санкт-Петербургской международной конференции «Региональная информатика — 2012» (24—26 октября 2012 г.). СПб., 2012.
11. Копыльцов А.А., Нечитайленко Р.А. Кластерное атрибутирование объектов информационной обработки по понятийным частным и интегральным признакам // Материалы XII Санкт-Петербургской международной конференции «Региональная информатика — 2010» (20—22 октября 2010 г.). СПб., 2010.
12. Копыльцов А.В. Об оценке качества программных продуктов // Проблемы информатизации (теоретический и научно-практический журнал). 1994. Вып. 3—4.
13. Хованов Н.В. Статистические модели теории квалиметрических шкал. Л., 1986.
REFERENCES
1. Vorobyov V.I., Kopyltsov A.V., Palchun B.P., Yusupov R.M. Methods and models for evaluating software quality. St. Petersburg, 1992.
2. Voroisky F.S. Computer Science. Encyclopedic glossary: introduction to modern information and communication technologies — Terms and Facts. Moscow, 2011.
3. Kopyltsov A.A. Model of information classification and algorithm of its preliminary processing for statistic and dynamic objects // «LETI» Proceedings. Series «Science, Management and Computer Technology». 2013. № 6.
4. Kopyltsov A.A. Processing information in living and technical systems // Proceedings of XIII Saint Petersburg International Conference «Regional Informatics 2012» (October 24—26, 2012). St. Petersburg, 2012.
5. Kopyltsov A.A. Processing poorly formalized information in living and technical systems // Proceedings of all-Russian scientific-practical conference of students, masters and postgraduate students «Modern Programming» (April 16—17, 2014). Nizhnevartovsk, 2014.
6. Kopyltsov A.A. Processing poorly formalized information with the lack of information // Proceedings of XIII Saint Petersburg International Conference «Regional Informatics 2012» (October 24—26, 2012). Saint Petersburg, 2012.
7. Kopyltsov A.A. Maintaining the confidentiality of data in support of decision making on the basis of special extracted information // Proceedings of the VIII Saint Petersburg Interregional Conference «Information Security of Russian Regions» (October 23—25, 2013). Saint Petersburg, 2013.
8. Kopyltsov A.A., Kopyltsov A.V. Algorithm for processing poorly formalized information from technical systems // «LETI» Proceedings. Series «Science, Management and Computer Technology». 2012. № 8.
9. Kopyltsov A.A., Kopyltsov A.V. Processing poorly formalized information from technical systems // Nizhnevartovsk State University of Humanities Journal. 2013. № 1.
10. Kopyltsov A.A., Kopyltsov A.V Technical systems and poorly formalized information // Proceedings of XIII Saint Petersburg International Conference «Regional Informatics 2012» (October 24—26, 2012). St. Petersburg, 2012.
11. Kopyltsov A.A., Nechitailenko R.A. Cluster attribution of information processing objects in terms of individual and integral characteristics // Proceedings of XII Saint Petersburg International Conference «Regional Informatics 2010» (October 20—22, 2010). St. Petersburg, 2010.
12. Kopyltsov A.V. Assessing software quality // Problems of Informatization (theoretical and research journal). 1994. № . 3—4.
13. Khovanov N.V. Statistical models of qualimetric scales theory. Lenigrad, 1986.