Научная статья на тему 'Процессорные логические структуры для анализа big data'

Процессорные логические структуры для анализа big data Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
337
60
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Хаханов Владимир Иванович, Зайченко Сергей Александрович, Мищенко Александр Сергеевич, Хаханов Иван Владимирович

Предлагается инфраструктура обеспечения параллельного анализа big data для поиска, распознавания и принятия решений на основе использования булеановой метрики измерения киберпространства. Разрабатывается новая структурная модель анализа big data, которая характеризуется применением облачных сервисов, киберфизических и поисковых систем, параллельных виртуальных мультипроцессоров с минимальным набором векторно-логических операций для точного поиска информации на основе предложенной булеановой метрики и нечисленных критериев качества, что дает возможность создавать семантическую инфраструктуру «чистого» киберпространства путем компетентностной классификации и метрического упорядочения big data в масштабах киберэкосистемы планеты.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Хаханов Владимир Иванович, Зайченко Сергей Александрович, Мищенко Александр Сергеевич, Хаханов Иван Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Metrics and Structures for Big Data Analysis

An infrastructure for parallel analyzing big data is proposed to search, pattern recognition and decisionmaking through the use of the developed cyberspace metric. The metric of cyberspace (big data) analysis is used; it is characterized by the presence of a single logical xor-operation to determine the cyber distance by cyclical closing at least one object, which allows significantly increasing the speed of data analysis. A new model for analyzing big data, based on the use of cloud services, cyber physical systems, parallel virtual multiprocessors with a minimal set of vector-logical operations for accurate information retrieval by using the proposed Boolean metric and vector-logical quality criteria is shown; it allows gradual classifying and ordering data based on the competency structuring big data in the frame of the planet cyber-ecosystem.

Текст научной работы на тему «Процессорные логические структуры для анализа big data»

УДК 004:519.713

В.И. ХАХАНОВ, С.А. ЗАЙЧЕНКО, А.С. МИЩЕНКО, И.В. ХАХАНОВ

ПРОЦЕССОРНЫЕ ЛОГИЧЕСКИЕ СТРУКТУРЫ ДЛЯ АНАЛИЗА BIG DATA

Предлагается инфраструктура обеспечения параллельного анализа big data для поиска, распознавания и принятия решений на основе использования булеановой метрики измерения киберпространства. Разрабатывается новая структурная модель анализа big data, которая характеризуется применением облачных сервисов, киберфизических и поисковых систем, параллельных виртуальных мультипроцессоров с минимальным набором векторно-логических операций для точного поиска информации на основе предложенной булеановой метрики и нечисленных критериев качества, что дает возможность создавать семантическую инфраструктуру «чистого» киберпространства путем компетентностной классификации и метрического упорядочения big data в масштабах киберэкосистемы планеты.

1. Введение

Цель - создание метрико-семантической модели взаимодействия технологической культуры big data с интеллектуальными сенсорами мониторинга реального мира для управления киберфизическими процессами, повышения качества жизни людей и сохранения экосистемы планеты. Задачи из анализа источников [1-20]: 1) Определение актуальных рыночно-ориентированных направлений научно-образовательных исследований и дизрапторного развития киберэкосистемы планеты. 2) Рыночно ориентированные структуры киберфизических систем управления неприродными процессами. 3) Использование технологической культуры big data для создания киберфизических систем мониторинга и управления.

Почему возникла парадигма больших данных как новый рыночный тренд, раскручиваемый учеными и компаниями? Короткий ответ содержит всего два тезиса: 1) большие данные невозможно просмотреть людскими ресурсами за приемлемое время - нужны фабрики для их хранения и многократного использования; 2) большие данные невозможно осмыслить даже совокупным мозгом всего человечества - нужны мощные интеллектуальные анализаторы для извлечения полезной информации, интегрируемой в знания. Процесс получения знаний можно свести к четырем технологиям: 1) экспериментальные измерения; 2) аналитические исследования; 3) численное моделирование; 4) инновационный компонент, замыкающий все процессы в систему - data-driven science for control. Что касается эволюции киберпространства, то здесь наблюдается экспоненциальный рост объемов (удвоение каждые 1,5 года) и сложности данных, что приводит к трансформированию понимания процессов и структур: 1) от бедности данных к их перенасыщению; 2) от наборов данных к их потокам; 3) от статики данных к их динамическому развитию; 4) от обработки данных «время от времени» к их анализу в реальном масштабе времени; 5) от централизованного хранения данных к распределенным в пространстве big data; 6) от владения данными к обладанию их полезной экспертизы. Однако на пути становления киберэкосистемы планеты возникают новые научные и практические проблемы, связанные с формированием киберфизических процессов: 1) data gathering - сбор данных от сенсоров и сетей; 2) data farming - создание фабрик и распределенных структур для хранения, архивирования, индексирования, поиска, объединения и разделения данных; 3) data mining - извлечение данных по шаблонам и их суперпозициям, кластерный анализ и классификация, поиск аномалий или выбросов, гиперпространственная визуализация; 4) data understanding - семантическое понимание данных; 5) new cyber knowledge - формирование новых знаний для управления киберфизическими процессами.

Как итог сказанному выше можно констатировать, что киберфизические системы, большие данные и квантоподобные параллельные мультипроцессоры формируют сегмент рынка, предназначенный для поиска, распознавания и принятия эффективных управленческих решений.

2. Критерии и структуры для оценивания качества взаимодействия объектов в киберпространстве

Цель - разработка универсального критерия и структур оценивания качества взаимодействия объектов в детерминированном киберпространстве на основе использования только логических операций для определения расстояний между процессами и явлениями путем построения высокопроизводительных параллельных процессоров, ориентированных на эффективное решение задач поиска, распознавания и принятия решений. Задачи: 1) Разработка универсальной аналитической модели для определения бинарного взаимодействия между процессами и явлениями в многозначной логике. 2) Разработка неарифметической вычислительной параллельной структуры для метрического оценивания детерминированных процессов, явлений и выбора оптимального решения. 3) Примеры использования вычислительных логических параллельных процессоров для решения практических задач.

Для понимания последующего материала необходимо ввести некоторые допущения и определения. Входной вектор и анализируемый объект А=(^...Др.-Дк), А е{°,1х}, который также представлен вектором, имеют одинаковую размерность к. Степень принадлежности т-вектора к А обозначается как д(т е А). Существует 5 типов координатного

теоретико-множественного А -взаимодействия двух векторов тДА, определенных на рис. 1. Они формируют все примитивные варианты реакции обобщенной системы поиска, распознавания и принятия решения на входной вектор-запрос. В технологической отрасли знаний - технической диагностике - упомянутая последовательность действий изоморфна маршруту: поиск дефектов, их распознавание, принятие решения на восстановление работоспособности. Данные стадии технологического маршрута нуждаются в метрике оценивания решений для выбора оптимального варианта.

Рис. 1. Результаты взаимодействия двух векторов Определение. Интегральная теоретико-множественная метрика для оценивания качества запроса есть функция взаимодействия многозначных по координатам векторов тДА, которая определяется средней суммой трех параметров: кодовое расстояние d(m,A),

функция принадлежности ц(т е А) и функция принадлежности р,(А е т):

0 = - ^(т, А) + ц(т е А) + ц(А ет)],

а(т, А) = - [п-саМ[Д ^ п Ai =0, i = 1,.. .,к)] ]; ц(те А) = 2с-а; ц(Ает) = 2С-Ь; п

а = сай[Д ^ = хД = 1,.,к)]; Ь =саг^Д ^ = хД = 1,.,к)]; с = сай[Д ^ п Ai = хД = 1,.,к)];

(1)

Пояснения. Пересечение (объединение) векторов - есть векторная операция, основанная на соответствующих координатных теоретико-множественных операциях. Операции координатного пересечения и объединения (1) определены в алфавите Кантора

А = {0,1х = {0,1}0. Нормирование параметров позволяет оценить уровень взаимодействия векторов в численном интервале [0,1]. Если зафиксировано предельное максимальное значение каждого параметра, равное 1, то векторы равны между собой. Минимальная

оценка, Р = 0, фиксируется в случае полного несовпадения векторов по всем п координатам. Если т О А = т и мощность покоординатного пересечения равна половине мощности пространства вектора А, то функции принадлежности и качества равны:

^(ше А) =1; ^(Аеш) = 1; = 1; 0(т,А) =-5- = 5

2 2х 3 6

Аналогичное значение будет иметь параметр Q, если шоА=А и мощность покоординатного пересечения равна половине мощности пространства вектора ш. Здесь пространство вектора есть функция от числа координат Ю , равная X: q = 2 ю . Если сагс^ш о А) -мощность покоординатного пересечения равна половине мощностей пространств векторов А и ш, то функции принадлежности имеют значения:

ц(ше А) = 2; ц(Аеш) = 2; d(ш,A) = 1; р(ш,А) = 3х^2 + 2 +1) = 3

Например, даны два вектора: А = (ХХХ10) и ш = (ХХ0Х0). Их пересечение равно (ХХ010) = {00010, 01010, 10010, 11010}. Иначе, мощность результирующего пространства равна четырем двоичным векторам или половине мощностей исходных двоичных векторов. Следует заметить, если пересечение двух векторов равно пустому множеству

31(ш1 о А^ = 0 ,

то количество общих точек (двоичных векторов) при пересечении двух пространств, формируемых двумя векторами, равно нулю.

Цель введения векторно-логического критерия качества решения заключается в существенном повышении быстродействия при подсчете оценки Q взаимодействия компонентов (векторов) ш и А при анализе ассоциативных структур данных путем использования только векторных операций, выполняемых одновременно (параллельно) над всеми разрядами. С учетом изоморфизма теоретико-множественных и логических операций арифметический критерий (1) без усреднения функций принадлежности и кодового расстояния можно трансформировать к виду:

Р = А) + ц(ш е А) + ц(А е ш),

а(щА) =сагс({: щ © А = и, 1 = 1,.. .,к});

ц(ше А) = сагс!({1: А = и, 1 = 1,.. ,к})- сагс({: ш © А1 = и, 1 = 1,.. ,к}); ц(А е ш) = сагс({1 :щ = и, 1 = 1,.,к})- сагс({: щ © А = и, 1 = 1,.. ,к});

и = |1 ^{ш1,А1}е{0,1}; [х ^{ш1,А1}е{0,1х}.

Если векторы ш и А - двоичные по всем координатам, то переменная и=1 и вычисления проводятся по правилам двоичной © -операции. Если векторы ш и А определены в троичном алфавите, то переменная и=х инициирует вычисления на основе использования

теоретико-множественной операции симметрической разности А (2). Введение переменной и дает возможность уйти от написания двух формул критерия в зависимости от значности алфавита описания координат взаимодействующих векторов. Представленные в

(2) векторные логические операции (л^,©,—) изоморфны теоретико-множественным (о,и, А,~). При этом теоретико-множественные координатные операции, соответствующие

данным логическим, были определены ранее на многозначном алфавите Кантора. Первый компонент (2), составляющий критерий, формирует степень несовпадения k-мерных векторов - кодовое расстояние путем выполнения операции xor, второй и третий определяют степени непринадлежности результата конъюнкции к числу единиц каждого из двух взаимодействующих векторов. Понятия принадлежности и непринадлежности являются взаимодополняющими, но в данном случае технологичнее вычислять непринадлежность или близость. Следовательно, необходимый критерий качества равен нулю (по всем координатам), когда два вектора равны между собой. Оценка качества взаимодействия двух двоичных векторов ухудшается по мере возрастания критерия от нуля до единицы. Для того чтобы окончательно исключить арифметические операции при подсчете векторно-логического критерия качества, необходимо логически объединить три оценки (2) в одну:

Q = d(m, A) v ц(т е A) v ц(А е m) =

= (m © A) v (A л m л A) v (m л m л A) =

= (m © A) v [A л (m v A)] v [m л (m v A)] =

= (m © A) v [(A л m) v (A л A) v (m л m) v (m л A)] =

= [(A л m) v (m л A)] v [(A л m) v (A л A) v (m л m) v (m л A)] =

= (A л m) v (m л A) v (A л m) v (A л A) v (m л m) v (m л A) =

= m © A.

Процедура вычисления векторного критерия качества зависит от значности алфавита:

Q fm©A^{mj,Aj}e{0,1};

Q [m\A^{mi,Ai}e{0,bx} (3)

Для двоичного алфавита таблица истинности координатной хог-операции имеет вид:

0®0=0. 0@1=L 1©0=Х 1©1=0.

Во втором случае, когда алфавит описания координат имеет три значения, вычисление

симметрической разности осуществляется в соответствии с Л-операцией.

Критерий качества Q однозначно определяет три формы взаимодействия двух любых объектов в n-мерном векторном логическом пространстве: расстояние и две функции принадлежности. При ненулевом расстоянии по Хэммингу функции принадлежности равны нулю, поскольку пространства двух векторов в данном случае не пересекаются. В противном случае - кодовое расстояние, равное нулю - взаимодействие объектов оценивается по функциям принадлежности. Увеличение числа нулей повышает критерий качества, а увеличение количества единиц обусловливает ухудшение качества взаимодействия по соответствующим булевым переменным. Критерий качества Q=m©A согласуется с введенной выше метрикой оценивания расстояния или взаимодействия объектов в векторно-логичес-ком пространстве, а также имеет тривиальную вычислительную процедуру для оценивания решений, связанных с анализом и синтезом информационных объектов. В самом деле, векторное логическое пространство не должно иметь метрического расстояния и численных критериев качества, включающих арифметические операции на скалярных величинах.

Для сравнения критериев качества необходимо определять число единиц в каждом векторе без выполнения операций суммирования. Это можно сделать с помощью регистра сдвига [15], который позволяет за один такт выполнить процедуру slc (shift left bit crowding) - сдвиг влево с одновременным уплотнением единичных координат n-разрядного двоичного вектора.

После процедуры сжатия номер правого единичного бита уплотненной серии единиц формирует значение критерия качества взаимодействия векторов. Но в данном случае такое число есть дань скалярной оценке бинарного отношения, которая нужна лишь человеку как информация для сравнения предлагаемой инфраструктуры относительно существующих технологий. В практических задачах такая оценка теряет свой смысл при выборе квазиоптимальной альтернативы, поскольку векторная оценка удобней для вычислителя, который определяет лучшее решение без участия в данном процессе пользователя. Для

наборов т = (1100110011 00), А = (0000111101 01) определение качества их взаимодействия по формулам (3) представлено в виде следующих процедур (нулевые координаты отмечены точками):

m 3 110011001100

A 3 000011110101

Q* 3 m 3 A 110000111001

Q 3 slc(Q*) 111111

Здесь сформирована оценка взаимодействия векторов и, что самое главное, единичные координаты строки О* = ё(т,А) vц(m е А) vц(A е т) идентифицируют все существенные переменные, по которым взаимодействие векторов не соответствует критерию качества. Процедура сжатия для получения О(т, А) не означает потерю информативной векторной

оценки О* = т © А. Результат сжатия позволяет лишь сделать выбор лучшего из двух или более решений путем параллельного сравнения группы сдвинутых влево единиц, неарифметически формирующих скалярные оценки критериев, необходимые для убеждения человека.

Что касается формулы кибервыбора, то важно при рассмотрении практически ориентированных задач найти лучшее решение из конечного числа вариантов взаимодействия mЕAi для его последующей реализации без арифметических операций, которые на один-два порядка снижают быстродействие. Пусть, например, имеются два вектора А В,

относительно которых необходимо выполнить операции: а = т © А, Ь = т © В, чтобы оценить близость каждого из них к вектор-запросу т:

A= B= 1 0 1 0 0 1 0 1 0 1 0 0 1 0 11

m= 111111 0 0

^a(meA) =m©A 0 1 0 11 0 0 1

Hb(meB) =m©B 1 0 11 0 111

a=sl(ia) 1 1 1 1 0 0 0 0

b=sl<Hb) 111111 0 0

A= B= 0 0 0 1 0 0 0 1 0 1 0 0 11 0 0

m= 111111 0 0

^a(meA) = m©A 111 0 11 0 1

Hb(meB) = m©B 1 0 1 1 0 0 0 0

a=sl<Ha) 111111 0 0

b=sl<Hb) 1 1 1 0 0 0 0 0

A= B= 1 0 1 0 0 111 0 1 0 0 1 0 0 1

m= 111111 0 0

^a(meA)=m©A 0 1 0 11 0 11

jib(meB) = m©B 1 0 11 0 1 0 1

a=sl<Ha) 11111 0 0 0

b=sl<(Mb) 11111 0 0 0

Далее предлагается простая и доступная для понимания и реализации структура параллельного вычисления лучшего варианта на основе нечисленного сравнения двух альтернативных векторов а и Ь, полученных на основе использования однотактной операции slc -сдвиг всех единиц влево с уплотнением [15]. После параллельного сдвига за один такт всех единиц в регистрах векторного критерия качества, оценивающих взаимодействия объектов в киберпространстве, теоретически возможны три варианта соотношения единиц, представленных ниже (взаимодействие ранее полученных векторов а и Ь):

a = b = 11110 0 0 0 1111110 0

1A Ъ 1 1 1 1 0 0 0 0

qb =(алЬ)®Ь 0 0001100

qa =(алЬ)еа 00000000

Qb= vq>=l i=l

k Qa = vqf = Q i=l winner

a = b = 1111110 0 1110 0 0 0 0

алЬ 1 I 1 0 0 0 0 0

qb = (aAb)eb 00000000

qa =(алЬ)©а 0 0 0 1110 0

Qb= ^ q?=0 i=l winner

Q*= vqf-1 bl

a = b = 111110 0 0 111110 0 0

а АЬ 1 I 1 1 1 0 0 0

qb=(aAb)eb 0000000 0

qa =(алЬ)©а 00000000

Qb= vq|>=0 i=l winner

Qa= wq?=l Ы winner

Пояснения: Нулевое значение Q-критерия означает лучшую альтернативу из рассмотренных, которая используется далее для сравнения с другими оценками или в качестве конечного варианта решения проблемы. Логическая структура для реализации кибер-выбора имеет следующий вид:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/q «(алЬ)©Ь\

(а аЬ).

/а\ /а = )'■ .цл(т е А)=т ф Лг\ " \Ь/ \Ъ=з1с(иъ) - \nb{m е В) = т е В / г-

Регистровые переменные а и Ь, обозначающие векторы сжатых влево единичных значений, объединяются и инвертируются для одновременного выполнения хог-операций. Затем результаты в виде состояний регистров подаются на входы двух логических элементов ог, которые уже формируют состояния двух булевых переменных, создающих три сочетания: 00, 01, 10. Нулевое значение одной из двух переменных означает лучшее решение, которое необходимо выбрать. Два нулевых состояния означают, что оба решения равнозначны по уровню предпочтения. Единичная комбинация булевых переменных невозможна. Схемная реализация кибервыбора из двух альтернатив, соответствующая приведенной выше логической структуре, представлена на рис. 2.

Рис. 2. Схемная реализация выбора оптимального решения

Если учесть, что выбор лучшего решения должен идентифицироваться логическим сигналом 1 (вместо 0), что соответствует максимальному значению функции принадлежности, определенной ранее, тогда схемная структура для определения лучшего варианта из двух альтернатив может быть незначительно модифицирована с помощью дополнительных инверторов на выходах логических or элементов, формирующих {Qa,Qb}eQ. В этом случае на выходах цифровой структуры возможны следующие пары состояний: 10, 01 и 11, где выбор решения (а или b) осуществляется по единичному значению одного из выходов. Пара сигналов 00 на внешних выходах схемы с инверторами невозможна. Таким образом, точный поиск заказанной информации в big data можно и нужно выполнять на основе только логических операций and, or, not, xor, slc без использования арифметических функций, что позволяет проектировать быстродействующие векторно-логические физические и/или виртуальные мультипроцессоры для существенного уменьшения времени исполнения сервисов облачными приложениями. Вычислительная процедура поиска лучшего варианта из двух возможных сводится к параллельному выполнению 4-х векторных операций и одной логической, в результате которых на одном или нескольких выходах формируется значение нуля, которое идентифицирует лучшее решение:

Q3 = v{ [slc(m © А) л slc(m © 8)] © A}, Qb =v{[sk(m©A)ASk(m©B)]©B>. i i

Предложенная дискретная булева метрика, векторные критерии качества хог-взаимо-действия объектов в киберпространстве, нечисленное ранжирование полученных критериев для выбора объекта по запросу дают основания полагать о рыночном внедрении программно-аппаратной реализации метрики и основанной на ней вычислительной структуры в облачные сервисы анализа big data.

Векторно-логический SIMD-мультипроцессор характеризуется отсутствием арифметических операций, параллельным вычислением расстояния между запросом и информационными квантами, а также одновременным определением лучшего из возможных n-решений по минимуму функции принадлежности, что дает возможность на порядок повысить быстродействие максимально точного поиска данных в big data. Его структура изображена на рис. 3, где представлены только логические примитивы для выполнения векторных и булевых (битовых) операций. Процессор работает следующим образом: вектор-запрос m, состоящий из k-битов, взаимодействует по xor-функции с матрицей M, имеющей n строк или векторов. В результате выполнения хог-операций формируется n функций принадлежности, определяющих степень близости или расстояние между запросом и каждой вектор-

строкой матрицы М. Для оценивания расстояний и выбора лучшего (минимального) взаимодействия выполняется регистровая операция slc, которая осуществляет уплотнение всех единиц со сдвигом влево за один автоматный такт, что дает возможность оценивать

минимальное расстояние т © М1 номером бита, в котором находится правая крайняя единица. Для определения номера вектор-строки, формирующей минимум функции принадлежности, осуществляется параллельная поразрядная операция логического умножения над всеми векторами, содержащими сдвинутые влево единичные значения, что дает

возможность вычислить вектор с минимальным числом единиц Ат1п . Последний используется для определения номера или индекса вектор-строки матрицы М, имеющей лучшее значение функции принадлежности, путем выполнения векторной хог-операции между Ат^ и всеми сдвинутыми функциями принадлежности А[ (1=1.п) . В результате формируются векторы qi (1 = 1,п), биты которых определяют входные значения каждого из п логических элементов ог. Выход каждого ог-элемента равен единице, если существует хотя бы одно единичное значение в результатах сравнения А^ЭА^. Если таких единиц нет, то минимальное расстояние между т © М 1 идентифицируется 0-состоянием одного или, возможно, нескольких выходов 0 1 (1 = 1,п) . Аналитическая модель поиска оптимального решения в киберпространстве по вектор-запросу оперирует пятью параллельными логическими операциями, выполняемыми последовательно:

}=Ц£ Р=1п !=].П Г=1д 1=1,п

Структурная модель векторного логического процессора, соответствующая аналитической модели формирования оптимального решения, имеет вид, представленный на рис. 3.

Рис. 3. Векторно-логический мультипроцессор Три примера вычисления состояний выходов векторно-логического процессора, как реакции на запрос т для матрицы М, состоящей из двух вектор-строк, представлены ниже. Первая фаза иллюстрирует формирование векторов единичных значений, сдвинутых влево: {АЬА2> - А:

ММ II II 1 0 1 0 0 1 0 1 0 1 0 0 1 0 11

т= 111111 0 0

щ(теМ1) =т©М1 0 1 0 11 0 0 1

Ц2(теМ2)=т©М2 1 0 11 0 111

А1 ^ФО 1 1 1 1 0 0 0 0

А2 =^Ф2) 111111 0 0

ММ II II 0 0 0 1 0 0 0 1 0 1 0 0 11 0 0

т= 111111 0 0

Р1(теМ1) !т©М1 111 0 11 0 1

Ц2(теМ2) !т©М2 1 0 1 1 0 0 0 0

Ах =slфl) 111111 0 0

А2 =slф2) 1 1 1 0 0 0 0 0

ММ II II 1 0 1 0 0 111 0 1 0 0 1 0 0 1

т! 111111 0 0

щ(теМ1)=m©Ml 0 1 0 11 0 11

Ц2(те М2) I т©М2 1 0 11 0 1 0 1

А1 ^ФО 11111 0 0 0

А2 ^Кй) 11111 0 0 0

Вторая фаза иллюстрирует формирование состояний выходов процессора: {01^2 } - 0, где в первом и втором случаях существует только один «победитель» с нулем на выходе, а в третьем случае обе вектор-строки матрицы М являются оптимальными решениями для запроса т:

II II 1 1 1 1 0 0 0 0 1111110 0

Атга=М|лМ2 1 1 1 1 0 0 0 0

=(М, дМ:)®М2 0 0 0 0 110 0

Ч]=(М! лМ2)®М, о о о о о о о о

(Ь= V ^=1 ы

к 1 1—1 я1 1 и п е г

и II 1111110 0 1110 0000

А,Я|л =М]ЛМ; 1 1 I 0 0 0 0 0

Ч2=(М, лМ2)®М2 00000000

(¡1 =<м, лмг)ем! 0 0 0 1110 0

11 а = V ([¡- =0 1=1 <Г)П п« г

к [ <3| = V ч| =1

А,= А2 = 111110 0 0 111110 0 0

А,™ =м(лм: 1 1 1 1 1 0 0 0

- (М,лМ2)©М, 50050000

оооооооо

к 1 С}2 = V ¡¡¡" =0 1=1 й' 1 п и м

к 1 (?1 = V я" =0 ы щппи

Интерес представляет формирование запросов в многозначном алфавите (например, Кантора) описания переменных взаимодействующих векторов. На первый взгляд, существуют проблемы подсчета расстояния между запросом и информационным компонентом киберпространства с недвоичным кодированием. Но если многозначные символы булеана примитивов, участвующие в формировании векторов, обозначить двоичными кодами (0 =

10, 1 = 01, X = 11, В = 00), то расстояние «запрос - компонент» можно оценивать с помощью ранее описанной процедуры сдвига всех единиц влево с уплотнением:

м= М, = 10 10 0 10 1 0 10 0 10 11 2 1 == 0 0 0 0 0 0 0 1 0 11111 0 0 М= М= X 0 1 X 0 X 1 X 0 X X 0 X 0 X 1

т= 1X1 1X1X0 т= XX 1 1 X 1 XX т= XX 1 1 X X 0 0

ц (теМ)=т®М 0 1 0 X 1 0 1 X ц(теМ) =т®М 1 1 XX 1 X 1 0 ц(теМ) =т®М 0 1 0 0 1 0 X 1

ц>(теМ>)=т®М2 X0XX0X0X ц>(теМ>) =т©М> 1 0 0 0 0 0 1 1 ц>(теМ2) =т©М> 1 0 0 X 0 1 1 X

А =§1<(и) 11 11 11 1 0 0 0 0 А =8%) 11 11 11 11 11111 0 А =81«Ц) 11 11 11 0 0 0 0 0

А =«1<(Ц2) 11 11 1111 1111 1 0 А =»1<(и>) 11 11 1 0 0 0 0 0 А =»1<(Ц2) 11 11 11 11 0 0 0 0

Победителями в трех, приведенных выше, номинациях становятся соответственно: М^ ,М2,М 1 , как имеющие минимальное число единиц или максимальное количество нулевых координат. Таким образом, не существует принципиальных ограничений для оценивания взаимодействия объектов в киберпространстве путем использования нечисленных метрик, исключающих арифметические операции. Более того, все расстояния в информационном мире можно измерять с помощью хог-операции или симметрической разности, которые обеспечивают выбор лучшего решения на основе векторно-логических критериев качества взаимодействия.

Следующий пример иллюстрирует работу мультипроцессора в многозначном алфавите описания логических переменных, ориентированном на компетентностное рейтингование учащейся молодежи. Пусть имеется группа студентов, получившая сессионные оценки по восьми экзаменам в метрике А,В,С^, которые кодируются соответствующими векторами: 1000, 1100, 1110, 1111. Необходимо определить лучшего студента, который интегрально получил максимальные баллы за сессию. Результаты вычислений представлены ниже:

Л В Б п л л с с С С 0 А В Э А ь в с с в Л А с с ¿С £ II II и А В Е> С В \ С С ССОЛВВАС ВССВААСО

т= Л В С А А А А С а = А К А \ А А А А

|||,т€ М . = т к! . | = иуе-М. =тЭЧ. кос аж ооо1 от о1оо оооо т и от ОНО №10 «01 Ш1 0100 0100 СО» 0001 от: оою пта-оют аюо адю оно сои г. тМ |=ж£ М :«о окоош сои ото гаю оно оно ОНО ОНО 0111 0000 0100 0100 ООП) 0111 око оно оиоогсооию кой оно ни

пи 11] ни 111 Ш1 и А[=*0ч) 1111 1111 1111 1 1111 1111 1111 1 1111 1111 111

м,= я I п п г г * 1 р И * Т

Здесь в верхней таблице вектор-эталон т приведен к лучшим фактическим оценкам, полученным студентами по каждому экзамену. Нижняя таблица оперирует вектором-эталоном с теоретически возможными лучшими (А=1000) значениями тестирования знаний. В обоих случаях интегральный критерий качества сессии определяет лучшим -студента под номером 3. Для кодирования всех пяти градаций болонской метрики оценивания знаний предлагается использовать и нулевую комбинацию: А=0000, В=1000, С= 1100, D=1110, Е= 1111. В этом случае две последующие таблицы дают аналогичный предыдущему результат выбора лучшего студента по итогам сессии:

М| = м: = M.I ABDDBACC CCDABBAD В С С В А А С D М,= Mj = Mi= ABDDBACC CCDABBAD BCCBAACD

111 - А В С А А А А С с: = ■i А А .V А А А Л

!LimcU|)=meM| [i.i^SynlimSM, я;*» га» «на [ 1 ю ldw за» поо га» 1 юс ото аою аио ¡Doti lone оооо шю moooim сто [ко ало асоо поо оюо иЧтЁкНгпеЧ; р^исМэИибМ) ООГОККЮИП ШО 1К0 №W 1IW 11% нос ноошоосоо )ко woo мо то им и» ноо кет ооняксмоошо

Л] = llci(l| ; Аг = ||ф;) A J = } Uli HI ни in Uli II А|*«Мч) Aj =*!>;) 1111 III! Ш1 111! 1111 111] 111! 1111 111

Mj- ш i л 1 с t \13 = * i ь A e r

Если примитивы оценок неравнозначны по весу в метрике сравнения, то их нельзя обозначать унитарными кодами, которые выполняют лишь роль идентификаторов элементов в универсальном множестве равных примитивов. Поэтому для обозначения весов в кодах оценок был использован фактор количества единиц. Тем не менее, последующие действия, ориентированные на определение интегрального качества знаний студентов для выбора лучшего из них путем сравнения с идеальным результатом, не связаны с какими-либо арифметическими операциями, а используют только логические процедуры. Стратегически задача линейной вычислительной сложности решалась в рамках следующей формулировки - найти студента, который имеет минимальное расстояние к заранее известному идеальному результату, в виде вектор-эталона m. Альтернативная стратегия предполагает поиск лучшего из n студентов путем последовательного сравнения каждого из них друг с другом, на что будет затрачено существенно больше времени, поскольку вычислительная сложность такой процедуры - (n /2)Дn. Для ранжирования всех студентов отно-

2

сительно идеального результата необходимо выполнить (n /2)Дn векторно-логических операций. После определения на каждом шаге лучшего студента соответствующую ему строку матрицы M (экзаменационной компетенции академической группы учащихся) следует исключить из последующего рассмотрения путем занесения в ее разряды единичных значений сигналов.

Для эффективной работы логического мультипроцессора необходимо сформировать M-матрицу (рис. 4) возможных вариантов решения проблемы, которая, в частности, может быть продуктом применения поисковой системы Google (Hadoop) к киберпространству Internet (big data), используемой для грубой и широкой выборки, когда количество найденных информационных фрагментов достигает сотен или тысяч вариантов. Затем наступает очередь функционирования мультипроцессора, формирующего точное решение по запросу m, которое должно быть сохранено в структурированной, специализированной части кибер-пространства для последующего многократного использования. Поэтому входом и выходом логического мультипроцессора следует считать формы киберпространства: Internet of Things, Big Data, Cyber-Physical Systems. Рыночная привлекательность предложенного мультипроцессора заключается в возможности его использования для: повышения качества и быстродействия поисковых процедур в big data, создания встроенных автоматических, автономных систем диагностирования и восстановления работоспособности, средств целеуказания и распознавания образов. Типичной для киберфизических систем, использующих информационное пространство, является функциональность, когда по запросу возникают многоальтернативные варианты его исполнения в векторно-логической форме описания компонентов киберпространства (субъектов, процессов или явлений), которые необходимы для управления социальными, биологическими и неприродными производственно-технологическими процессами без участия человека.

Перспективное направление будущего исследования - «Образные транзакции больших данных» - «Big Data Image Transactions». Образная культура мышления, общения или транзакций: перевод компонентов описания объекта из времени в пространство. Возможно ли такое? «Красный (100), синий (010), зеленый (001)» - записано во времени; если слова совместить, заменив их образами и исключив время, получится принципиально новый, но уже сгенерированный образ белого цвета (111). «Мама (100) мыла (010) раму (001)», - если обозначить слова примитивами, то их суперпозиция дает код параллельного образа (111),

который легко представить фотографией женщины со щеткой, моющей окно. Художник Леонардо да Винчи создает параллельный образ Моны Лизы путем суперпозиции последо-вательностных визуальных фрагментов. Но результат не имеет параметра времени и тем он ценен. Если разбить его картину на суперпозиционные фрагменты, то она потеряет свою привлекательность. Джоконду невозможно описать словами! Любая картина лучше ее текстуального описания. Тем не менее, на рынке электронных технологий уже существуют автоматические программные приложения как прямого синтеза «вербальное описание -картина», так и обратного анализа «картина - вербальное описание». Здесь можно начинать с голосового и/или мануального синтеза и анализа простых геометрических фигур (треугольник, квадрат, круг).

Рис. 4. Взаимодействие мультипроцессора с киберпространством

Еще одно направление исследования - «Образный транзакционный процессор», «Image Transactions Processor». Имеется в виду процессор, создающий билатеральную симметрию «образ - транзакция - образ», которая разбивается на два типа транзакторов: «вербальное (мануальное, голосовое) описание - транзакция-синтез - образ» и «образ - транзакция-анализ - вербальное (мануальное, голосовое) описание».

Язык последовательных символов, используемый человечеством, несовершенен по своим временным затратам, связанным с транзакциями информации между приемником и передатчиком. Поэтому ученые вынуждены сегодня констатировать факт, что рынку необходим дизраптор новой культуры параллельного, суперпозиционного, образного мышления, общения, генерирования, приема-передачи и восприятия информации и действительности без параметра времени. Следует переводить киберпространство в параллельные образы для осуществления транзакций на основе квантовых структур данных (свойства: суперпозиция, перепутывание, параллелизм). Этим можно существенно сэкономить память, время обучения, приема-передачи и восприятия информации в непосредственно взаимодействующих парах: «человек - компьютер», «компьютер - компьютер», «человек - человек» без традиционных интерфейсов (клавиатура, голос, тактильность). История знает аналоги в форме иероглифов, клинописи, настенных рисунков, где наши предки старались убрать несущественность времени при описании фактов прошлой действительности, чтобы минимизировать время нашего внимания на познание сущности, а не на процесс, который уже не очень интересен. Образ эффективнее для восприятия, чем вербальное описание, поэтому PR-акции всегда оперируют фотографиями с короткими слоганами. Образное мышление - компрессия или сжатие процесса в одно фотографическое мгновение или явление. Фильм - в картину, слова и предложения - в образ. Последовательность логических элементов в один информационный «квантовый» примитив - кубит.

3. Выводы

Разработан универсальный критерий и структуры оценивания качества взаимодействия объектов в детерминированном киберпространстве на основе использования только логических операций для определения расстояний между процессами и явлениями путем построения высокопроизводительных параллельных процессоров, ориентированных на эффективное решение задач поиска, распознавания и принятия решений. Предложена универсальная аналитическая модель для определения бинарного взаимодействия между процессами и явлениями в многозначной логике. Разработана неарифметическая вычислительная параллельная структура для метрического оценивания детерминированных процессов, явлений и выбора оптимального решения. Приведены примеры использования вычислительных логических параллельных процессоров для решения практических задач.

1. Новая модель векторно-логического SIMD-мультипроцессора, который характеризуется отсутствием арифметических операций, параллельным вычислением расстояния между запросом и информационными квантами, а также одновременным определением лучшего из возможных n-решений по минимуму функции принадлежности, что дает возможность на порядок повысить быстродействие максимально точного поиска данных в big data.

2. Практическая значимость предложенных моделей заключается в необходимости реструктуризации киберпространства путем замены концепции аморфных big data на семантически классифицируемую информационную инфраструктуру полезных данных, предназначенных для управления киберфизическими процессами. В связи с этим предложены направления формирования технологической культуры big data для постепенного повышения уровня полезной информации от 0,4 до 10% путем компетентностной инфраструктури-зации киберпространства больших данных.

Список литературы: 1. Hasan Alkhatib, Paolo Faraboschi, Eitan Frachtenberg, Hironori Kasahara, Danny Lange, Phil Laplante, ArifMerchant, Dejan Milojicic, Karsten Schwan. IEEE CS 2022 Report. IEEE Computer Society. 2014. 163 p. 2. [http://www.tssonline.ru/articles2/fix-corp/rost-obema-informatsii—realii-tsifrovoy-vselennoy#sthash.rpNOdQLF.dpuf]. 3. Mayer-Schцnberger V. Big Data: A Revolution that Will Transform How We Live, Work / V. Mayer-Sch^berger, K. Cukie / Виктор Майер-Шенбергер, Кеннет Кукьер. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим. Изд-во Манн, Иванов и Фербер. 2013. 240 c. 4. Demchenko Y., de Laat C., Membrey P. Defining architecture components of the Big Data Ecosystem // International Conference on Collaboration Technologies and Systems (CTS). 2014. P. 104 - 112. 5. GrolingerK., HayesM., Higashino W.A., L'HeureuxA., AllisonD.S., CapretzM.A.M. Challenges for MapReduce in Big Data // IEEE World Congress on Services (SERVICES). 2014. P. 182 - 189. 6. Lichen Zhang. A framework to specify big data driven complex cyber physical control systems // International Conference on Information and Automation (ICIA). 2014. P. 548 - 553. 7. Zhang Lichen. Designing big data driven cyber physical systems based on AADL // International Conference on Systems, Man and Cybernetics (SMC). 2014. P. 3072 - 3077. 8. MichalikP., Stofa J., Zolotova I. Concept definition for Big Data architecture in the education system // 12th International Symposium on Applied Machine Intelligence and Informatics (SAMI). 2014. P. 331 - 334. 9. MunozM. Space systems modeling using the Architecture Analysis & Design Language (AADL) // International Symposium on Software Reliability Engineering Workshops (ISSREW). 2013. P. 97 - 98. 10. Курс высшей алгебры. М.: Наука. 1968. 426с. 11. Michael A. Nielsen & Isaac L. Chuang. Quantum Computation and Quantum Information. Cambridge University Press. 2010. 676p. 12. Stenholm Stig, Kalle-Antti Suominen. Quantum approach to informatics.-John Wiley & Sons, Inc. 2005. 249p. 13. Hahanov V.I., LitvinovaE.I., ChumachenkoS.V. et al. Qubit Model for solving the coverage problem // Proc. of IEEE East-West Design and Test Symposium. Kharkov. 14-17 September, 2012. P.142 - 144. 14. Горбатов В.А. Основы дискретной математики. М.: Высшая школа, 1986. 311 с. 15. БондаренкоМ.Ф., ХахановВ.И., ЛитвиноваЕ.И. Структура логического ассоциативного мультипроцессора// Автоматика и телемеханика. 2012. N° 10. С. 71-92. 16. Ariane Hellinger, Ariane Hellinger, Heinrich Seeger. Cyber-Physical Systems. Driving force for innovation in mobility, health, energy and production. Acatech. National Academy of Science and Engineering. 2011. 48p. 17. Vladimir Hahanov, Wajeb Gharibi, Kudin A.P., Ivan Hahanov, Ngene Cristopher (Nigeria), Tiekura Yeve (Cфte d'lvoire), Daria Krulevska, Anastasya Yerchenko,Alexander Mishchenko, Dmitry Shcherbin, Aleksey Priymak. Cyber Physical Social Systems - Future of Ukraine?// Proceedings of 12th IEEE EWDT Symposium, Kiev, Ukraine, September 26-29. 2014.P. 67-81. 18.Han Hu, Yonggang Wen, Tat-Seng Chua, XuelongLiP. Toward Scalable Systems for Big Data Analytics: A Technology Tutorial. IEEE Explore: 2014. ISSN: 2169-3536. P. 652

- 687. 19.Fadi H. Gebara, H. Peter Hofstee, and Kevin J. Nowka, IBM Research-Austin. Second-Generation Big Data Systems. IEEE Computer magazine. 2015, January. P. 36-41.20. PureData System for Analytics: http://www-0 1.ibm.com/common/ssi/cgi-bin/ssialias?subtype = SP&infotype=PM&appname=SWGE_WA_UZ_USEN&htmlfid=WAS12385USEN&attachment= WAS12385USEN.PDF#loaded

Поступила в редколлегию 11.12.2014

Хаханов Владимир Иванович, декан факультета КИУ ХНУРЭ, д-р техн. наук, профессор кафедры АПВТ ХНУРЭ, IEEE Senior Member, IEEE Computer Society Golden Core Member. Научные интересы: техническая диагностика цифровых систем, сетей и программных продуктов. Увлечения: баскетбол, футбол, горные лыжи. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. +380 57 70-21-326. E-mail: [email protected].

Зайченко Сергей Александрович, канд. техн. наук, доцент кафедры АПВТ ХНУРЭ. Научные интересы: автоматизированное проектирование и верификация цифровых систем. Увлечения: технологии онлайн-образования. Адрес: Украина, 61045, Харьков, ул. Космическая, 23а, тел. (057)-760-47-25.

Мищенко Александр Сергеевич, аспирант кафедры АПВТ ХНУРЭ. Научные интересы: облачные технологии, web-программирование. Увлечения: путешествия. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. +380 57 70-21-326, E-mail: [email protected].

Хаханов Иван Владимирович, студент факультета КИУ. Научные интересы: техническая диагностика цифровых систем, программирование. Увлечения: горные лыжи, английский язык. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. +380 57 70-21-326.

i Надоели баннеры? Вы всегда можете отключить рекламу.