Научная статья на тему 'Киберфизические структуры для анализа больших данных'

Киберфизические структуры для анализа больших данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
520
91
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Хаханов Владимир Иванович, Литвинова Евгения Ивановна, Зайченко Сергей Александрович, Гуреев Богдан Николаевич, Шляхтун Максим Михайлович

Предлагается инфраструктура обеспечения параллельного анализа big data для поиска, распознавания и принятия решений на основе использования булеановой метрики измерения киберпространства. Она характеризуется наличием единственной логической xor-операции для определения кибер-расстояния путем циклического замыкания не менее одного объекта, что дает возможность на порядок повысить быстродействие анализа больших данных. Разрабатывается новая структурная модель анализа big data, которая характеризуется использованием облачных сервисов, киберфизических и поисковых систем, параллельных виртуальных мультипроцессоров с минимальным набором векторно-логических операций для точного поиска информации на основе предложенной булеановой метрики и нечисленных критериев качества. Это дает возможность создавать семантическую инфраструктуру «чистого» киберпространства путем компетентностной классификации и метрического упорядочения big data в масштабах киберэкосистемы планеты.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Хаханов Владимир Иванович, Литвинова Евгения Ивановна, Зайченко Сергей Александрович, Гуреев Богдан Николаевич, Шляхтун Максим Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Metrics and Structures for Big Data Analysis

A new model for analyzing big data, based on the use of cloud services, cyber physical systems, parallel virtual multiprocessors with a minimal set of vector-logical operations for accurate information retrieval by using the proposed Boolean metric and vector-logical quality criteria is shown; it allows gradual classifying and ordering data based on the competency structuring big data in the frame of the planet cyber-ecosystem.

Текст научной работы на тему «Киберфизические структуры для анализа больших данных»

проектирования в HDL-коде / А.С. Шкиль, Е.Е. Сыревич, Д.Е. Кучеренко, С. Альмадхоун // Радиоэлектроника. Информатика. Управление. 2009. №2. C. 86-90.

Поступила в редколлегию 11.06.2015

Рецензент: д-р техн. наук, проф. Кривуля Г.Ф.

УДК004:519.713

КИБЕРФИЗИЧЕСКИЕ СТРУКТУРЫ ДЛЯ АНАЛИЗА БОЛЬШИХ ДАННЫХ

ХАХАНОВ В.И., ЛИТВИНОВА Е.И., ЗАЙЧЕНКО С.А., ГУРЕЕВ Б.Н., ШЛЯХТУН М.М.

Предлагается инфраструктура обеспечения параллельного анализа big data для поиска, распознавания и принятия решений на основе использования булеановой метрики измерения киберпространства. Она характеризуется наличием единственной логической хог-операции для определения кибер-расстояния путем циклического замыкания не менее одного объекта, что дает возможность на порядок повысить быстродействие анализа больших данных. Разрабатывается новая структурная модель анализа big data, которая характеризуется использованием облачных сервисов, киберфизических и поисковых систем, параллельных виртуальных мультипроцессоров с минимальным набором векторно-логических операций для точного поиска информации на основе предложенной булеановой метрики и нечисленных критериев качества. Это дает возможность создавать семантическую инфраструктуру «чистого» киберпространства путем компетентностной классификации и метрического упорядочения big data в масштабах киберэкосистемы планеты.

1. Введение

Киберфизическая система призвана сделать активной концепцию big data, рассматривая большие данные во взаимодействии с киберсистемами (облаками) управления, ориентированными на поиск, распознавание и принятие решений. Структурное содержание CPS (рис. 1) - совокупность коммуникационно связанных реальных и виртуальных компонентов с выраженными функциями адекватного физического циф-

Шкиль Александр Сергеевич, канд. техн. наук, доцент кафедры АПВТ ХНУРЭ. Научные интересы: логическое моделирование, техническая диагностика компьютерных систем. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, комн. 319.

рового мониторинга и оптимального облачного компьютерного киберуправления для обеспечения качества жизни, продукции, процессов или сервисов в заданных условиях ограничений на время и ресурсы. CPS включает компоненты: Cyber Control, Internet of

Things или Cloud, Security, Intelligence, Big Data and Services, Digital Monitoring, Cyber Managing, Physical Smart Everything, Nature, Social and Tech World. Регу-ляторные отношения (Relationship) между компонентами CPS формируются законами, уставами предприятий и организаций, мор ально -этическими правилами поведения внутри социальной группы. Направление движения RoadMap - Harmony of Human, Nature and Tech киберфизической системы человечества можно определить как достижение такого интегрального уровня развития киберфизических компонентов, который обеспечит гармонию жизни человека с природой и техникой (созданным миром - Created World).

Big data - технологическая культура киберпростран-ства, направленная на формирование динамически развивающейся инфраструктуры киберфизической экосистемы планеты путем метрико-семантической структуризации больших потоков (объемов) гетерогенных данных на основе использования интеллектуальных быстродействующих специализированных облачных фильтров параллельного мониторинга и метрического анализа извлекаемой информации для online управления физическими и виртуальными процессами.

Рыночно-привлекательные глобальные проекты сегодня выполняются под эгидой о бъединения физического и виртуального пространства в единое целое. Киберфизическое пространство (Cyber Physical Space)

Рис. 1. Киберфизическая система управления неприродными процессами

- метрика телекоммуникационного взаимодеиствия физических, биологических и социальных объектов, процессов и явлении с виртуальными или облачными (компьютерными) технологиями мониторинга и управления на основе использования Internet of Things & Smart Everything для достижения социально значимых целеИ. Оно призвано интегрировать наиболее перспективные киберфизические технологические решения: 1) Встроенный интерфейс непосредственной связи мозга человека с компьютером и/или киберпро-странством путем замены последовательных языковых интерфейсов на параллельные образные отношения. 2) Создание искусственного интеллекта для самообучения и самосовершенствования киберфизи-ческих структур, программ и процессов. 3) Нановы-ращивание компьютера путем аддитивного структурирования атомов. 4) Самое интересное решение связано с неотвратимостью естественного отказа человечества от функций управления биологическими, социальными и техническими объектами и процессами в пользу беспристрастных киберфизических систем!

Девять технических лидеров IEEE Computer Society [1 ] объединили усилия для прогнозирования будущего планеты, в которое включены 23 компьютерные технологии 2022 года. Сформирована кибермода на ближайшие 8 лет: 3D printing, big data and analytics, open intellectual property movement, massively online open courses, security cross-cutting issues, universal memory, 3D integrated circuits, photonics, cloud computing, computational biology and bioinformatics, device and nanotechnology, sustainability, highperformance computing, internet of things, life sciences, machine learning and intelligent systems, natural user interfaces, computer vision and pattern recognition, networking and interconnectivity, quantum computing, software-defined networks, multicore, and robotics for medical care.

2. Основное содержание

Предлагается big data driven киберфизическая система (рис. 2) online управления физическими и/или виртуальными процессами, инвариантными по отношению к сферам человеческой деятельности.

Рис. 2. Киберфизическая система управления процессами

Представленная big data driven киберфизическая система управления физическими процессами имеет инновационные отличия от существующих решений: 1) матричное представление цели, процесса, маршрута движения, компетенций объектов и субъектов; 2) online исполнение всех процессов; 3) использование нецифровой булеан-метрики для структурного и скалярного оценивания процессов и явлений; 4) использование метрического дискретного булевого пространства для идентификации процессов и явлений, применение big data технологической культуры для организации и активного управления киберфизичес-кими процессами; 5) киберсистемное управление процессами на основе жесткого взаимодействия исполнительного и управляющего механизмов, сенсоров и актюаторов.

Взаимодействие интеллектуальных средств (фильтров) управления и big data в рамках киберфизической системы фильтров поиска полезной информации подобно процессу добычи золота из песка с помощью драги, настроенной на выделение тяжелого металла, когда легкие фракции вымываются водой. Следует заметить, что баланс экосистемы не нарушается, а добытое золото остается на планете, только в строго определенном месте. Аналогичные процессы протекают и в киберэкосистеме планеты, когда из хаоса киберпространства тяжелым трудом умных фильтров добывается полезная информация, чтобы ее затем положить в ячейку уже структурированной части киберпространства, которая становится reusable и может быть легко доступна всем желающим. Человечество стремится к порядку и структуризации, но оно также ответственно за мусор и хаос в киберпростран-стве, объемы которого еще в большей степени подчиняются закону Мура. Каждые 2 года информация удваивается, а к 2020 году ее объем составит 40 зеттабайт. Поэтому процесс упорядочения информации всегда будет отставать от мусоризации киберпространства. Сегодня человечество фильтрует и использует порядка 0,4 процента уже полезной информации. Дальше не будет больше. Это означает, что в ближайшие 100 лет актуальность технологической культуры big data для создания «правильной» инфраструктуры киберпространства будет только возрастать. Прогнозируется, что финансовые и кадровые инвестиции для создания инфраструктуры киберэкосистемы до 2020 года вырастут на 40%. Инвестиции в хранение и защиту информации, Big Data и Cloud Computing будут расти значительно быстрее [2].

Сегодня более 60% компаний делают инвестиции в технологии Big Data, Cloud Services и аналитические продукты, чтобы иметь big data-driven киберуправле-ние кадровыми и материальными ресурсами. Порядка 60% компаний в мире, по оценкам журнала «Форбс», готовы купить программные системы управления ресурсами. Компании замотивированы семью аргументами: продукты взрослеют и умнеют, их становится легко купить, появился удобный пользовательский интерфейс, системы способны интегрировать много-

численные программные средства компании, big data реально позволяет управлять кадрами - путем playing "Moneyball" with their people data, облачные технологии позволяют легко переключаться на новые сервисы управления кадрами, а талант стал навсегда стратегическим товаром и главным вопросом каждого руководителя. Человеческий капитал, по оценке журнала «Форбс», имеет индекс важности для решения проблем компании, организации, государства - 2,44; управление и выполнение операций 2,10; инновации 1,99; остальные 7 имеют индексы: отношения с потребителями 1,72; глобальная политика 1,68; правительственное регулирование 1,55; глобальная экспансия 1,31; корпоративный бренд и репутация 0,92; устойчивость 0,82 и вера в бизнес 0,46. Дуализм управления на основе Big Data и Cloud Services включает: 1) детерминизм - технологии (правильные данные) управляют нами и 2) волюнтаризм - мы управляем технологиями. Оба варианта в своем комплексном развитии приводят рынок облачных технологий управления к детерминизму на основе использования концепции киберфизических систем, где фигурируют огромные массивы данных, не всегда достоверной информации. Но умная аналитика движков по big data пространствам должна научиться формировать правильное решение. Leon Trotsky: "Tell me anyway -maybe I can find the truth by comparing the lies" (Скажи мне, что ты думаешь, в любой форме, а я сумею найти правду сравнением даже ложных высказываний). По данным журнала "Форбс" технология big data сгенерирует в 2015 году 3,7 триллиона прибыли в продуктах и сервисах, что означает появление на рынке 4,4 миллиона новых рабочих мест. Если учесть, что во всех компаниях мира заработная плата составляет 40% доходов, то управление персоналом и ресурсами сегодня есть самая важная проблема бизнеса. Главный вывод из сказанного - человечество настолько гениально и одновременно несовершенно, что оно не может объективно управлять самим собой! Человек гениален в творчестве и бездарен в самоуправлении. Таким образом, мировой рынок безальтернативно приходит к необходимости использования кибероб-лачного управления ресурсами и кадрами без участия человека, но на основе извлечения правильных данных из киберинформационного «мусора».

Цель рыночного бренда big data - выращивание в киберпространстве культурного слоя инфраструктуры метрико-семантически упорядоченной легко доступной полезной reusable информации за счет разработки виртуальных облачных сервисов на основе параллельных мультипроцессоров, выполняющих роль быстродействующих интеллектуальных фильтров при поиске, распознавании и принятии решений.

Задачи технологической культуры big data:

1) Хранение неструктурированной разнородной информации в надежных распределенных системах, обслуживаемых Hadoop-сервисами.

2) Анализ big data в реальном времени с помощью низкоуровневых параллельных интеллектуальных быстродействующих процессоров среды Map-Reduce, помещенных в облачные сервисы.

3) Создание новых метрик измерения расстояний между процессами и явлениями в киберпространстве для построения быстродействующих метрико-семан-тических фильтров поиска полезной информации.

4) Разр аботка инфраструктурных решений для кибер -пространства в целях компактного хранения и быстрого семантико-метрического извлечения полезной классифицированной информации с помощью облачных сервисов и специализированных процессоров.

5) Создание типового шаблона киберфизической системы управления big data analytics, использующей структуры облачных фильтров для извлечения полезной информации из больших объемов неструктур иро-ванных данных в целях получения прибыли путем big data driven управления физическими и виртуальными процессами.

6) Построение масштабируемой киберинформацион-ной системы массовой метрико-семантической переработки в реальном масштабе времени больших объемов данных в полезную структурированную информацию, используемую для управления физическим миром.

7) Разработка big data-driven аналитической киберфизической системы прогнозирования (планирования) и управления неприродными (социальными) процессами и явлениями (катаклизмами) путем точного и исчерпывающего мониторинга общественного мнения для выработки регуляторных информационных управляющих воздействий в целях обеспечения качества жизни социальных групп и устранения конфликтов. Например, при желании власть имущих можно без финансовых и временных затрат устранить все конфликты в Украине путем законодательного учета интересов всех слоев населения во времени и пространстве на основе толерантного объединения исторических, языковых и национальных культур. Курс любой системы власти на пересечение интересов социальных групп, очевидно всем и не только знающим математику, непременно приводит к нарушению целостности и/или гибели государственных образований.

Структура киберинформационной системы (рис. 3) с сигналами мониторинга и управления включает компоненты: 1) «Big data - good data», которые должны стремиться к процентному соотношению 90:10. 2) Облачные сервисы-фильтры, предназначенные для формирования 10 процентов структурированной, легко доступной, полезной и многократно востребованной информации. 3) Материальные и временные ресурсы для трансформирования киберпространства в семантико-метрическую инфраструктуру правильных данных. 4) Метрики классификации и оценивания информационных объектов, необходимые для создания фильтров, анализа big data и синтеза структур

правильных данных. 5) Вектор состояния киберпространства, определяющий фактическое соотношение между «big data и good data» в реальном времени. 6) Цель - достижение высокого уровня правильных данных (Good Data = PureData [5-7]) по отношению к «информационному мусору» - big data и последующее использование уже метрико-семантически-струк-турированных данных для оптимального управления киберфизическими процессами планеты.

По оценке журнала «Форбс» сегодня 36 процентов компаний вкладывают ресурсы в технологическую культуру big data. Однако только 13 процентов из них занимаются прогнозированием бизнеса в своем сегменте рынка. Тем не менее, уже 16 процентов компаний пытаются использовать добытые из big data правильные данные для управления киберфизическими процессами.

Таким образом, можно сделать вывод, что взамен статистическому анализу данных по частичной представительной выборке приходит точный и полный анализ больших данных по наперед заданной тематике, где экспертная формулировка проблемы есть искусство попадания в цель.

3. Выводы

Существующие программные продукты и публикации не предлагают ассоциативно-логических технологий поиска, распознавания и принятия решений в дискретном информационном пространстве [4], состоящем из big data. Практически все они используют универсальную систему команд современного дорогостоящего процессора с математическим сопроцессором. В то же время, аппаратные специализированные средства логического анализа, являющиеся их прототипами [3], как правило, ориентированы на побитовую или невекторную обработку информации.

1.Новая киберинформационная модель анализа big data, использующая средства облачных сервисов, киберфизические системы, параллельные виртуальные мультипроцессоры с минимальным набором век-торно-логических операций для точного поиска информации на основе предложенной булеановой метрики и векторно-логических критериев качества, дает возможность постепенной классификации и упорядо -

чения хаотических данных big data в масштабах кибе-рэкосистемы планеты.

2. Практическая значимость предложенных моделей заключается в необходимости реструктуризации ки-берпространства путем замены концепции аморфных big data на семантически классифицируемую информационную инфраструктуру полезных данных, предназначенных для упр авления кибер физическими процессами. В связи с этим предложены направления формирования технологической культуры big data для постепенного повышения уровня полезной информации от 0,4 до 10% путем компетентностной инфра-структуризации киберпространства больших данных.

3. Направления будущих исследований - проектирование big data driven cyber physical systems, которые ориентированы на постоянную метрико-семантичес-кую реструктуризацию киберпространства в целях удобного извлечения знаний, 2) также на преобразование социальных отношений неприродного мира путем передачи управления от человека к облачным сервисам.

Литература: 1. Hasan Alkhatib, Paolo Faraboschi, Eitan Frachtenberg, Hironori Kasahara, Danny Lange, Phil Laplante, Arif Merchant, Dejan Milojicic, Karsten Schwan. IEEE CS 2022 Report. IEEE Computer Society. 2014. 163 p. 2. [http://www.tssonline.ru/articles2/fix-corp/rost-obema-informatsii — realii-tsifrovoy-vselennoy# sthash.rpNOdQLF.dpuf] 3. Бондаренко М.Ф., Хаханов В.И., Литвинова Е.И. Структура логического ассоциативного мультипроцессора // Автоматика и телемеханика. 2012. № 10. С. 71Ï92. 4. Vladimir Hahanov, Wajeb Gharibi, Kudin A.P., Ivan Hahanov, Ngene Cristopher (Nigeria), Tiekura Yeve (Cоte d'Ivoire), Daria Krulevska, Anastasya Yerchenko, Alexander Mishchenko, Dmitry Shcherbin, Aleksey Priymak. Cyber Physical Social Systems - Future of Ukraine // Proceedings of 12th IEEE EWDT Symposium, Kiev, Ukraine, September 26-29. 2014. P. 67-81. 5. Han Hu, Yonggang Wen, Tat-Seng Chua, Xuelong LiP. Toward Scalable Systems for Big Data Analytics: A Technology Tutorial. IEEE Explore: 2014. ISSN: 2169-3536. P. 652 - 687. 6. FadiH. Gebara, H. Peter Hofstee, and Kevin J. Nowka, IBM Research-Austin. Second-Generation Big Data Systems. IEEE Computer magazine. 2015, January. P. 36-41. 7. PureData System for Analytics: http://www-01.ibm.com/common/ssi/cgi-bin/ ssialias?subtype=SP&infotype=PM&appname=SWGE_WA_

Рис. 3. Киберинформационная система трансформирования big data

UZ_USEN&htmlfid=WAS12385USEN&attachment= WAS 123 85USEN.PDF#loaded

Поступила в редколлегию 21.04.2015

Рецензент: д-р техн. наук, проф. Харченко В.С.

Хаханов Владимир Иванович, декан факультета КИУ ХНУРЭ, д-р техн. наук, профессор кафедры АПВТ ХНУ-РЭ, IEEE Senior Member, IEEE Computer Society Golden Core Member. Научные интересы: техническая диагностика цифровых систем, сетей и программных продуктов. Увлечения: баскетбол, футбол, горные лыжи. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. +380 57 70-21326. E-mail: [email protected].

Литвинова Евгения Ивановна, д-р техн. наук, профессор кафедры АПВТ ХНУРЭ, зам. декана факультета КИУ ХНУРЭ, IEEE Member. Научные интересы: техническая диагностика цифровых систем, сетей и программных продуктов. Увлечения: музыка. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. +3805770-21-326. E-mail: [email protected].

Зайченко Сергей Александрович, канд. техн. наук, доцент кафедры АПВТ ХНУРЭ. Научные интересы: автоматизированное проектирование и верификация цифровых систем. Увлечения: технологии онлайн-образования. Адрес: Украина, 61045, Харьков, ул. Космическая, 23а, тел. (057)-760-47-25.

Гуреев Богдан Николаевич, магистрант факультета КИУ ХНУРЭ, инженер-программист ООО "Алдек-КТС" (Харьков). Научные интересы: автоматизированное проектирование и верификация цифровых систем. Адрес: Украина, 61045, Харьков, ул. Космическая 23а, тел. (057)-760-47-25.

Шляхтун Максим Михайлович, магистрант факультета КИУ ХНУРЭ, инженер-программист ООО "Алдек-КТС" (г. Харьков). Научные интересы: автоматизированное проектирование и верификация цифровых систем. Адрес: Украина, 61045, Харьков, ул. Космическая 23а, тел. (057)-760-47-25.

i Надоели баннеры? Вы всегда можете отключить рекламу.