Научная статья на тему 'РАЗРАБОТКА СИСТЕМЫ МОНИТОРИНГА СОЦИАЛЬНОЙ СИТУАЦИИ ДЛЯ НЕОИНДУСТРИАЛЬНОГО ОСВОЕНИЯ АРКТИКИ'

РАЗРАБОТКА СИСТЕМЫ МОНИТОРИНГА СОЦИАЛЬНОЙ СИТУАЦИИ ДЛЯ НЕОИНДУСТРИАЛЬНОГО ОСВОЕНИЯ АРКТИКИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
188
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМА ПОСТАНОВКИ И ПРИНЯТИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ / ХРАНИЛИЩЕ ДАННЫХ / БОЛЬШИЕ ДАННЫЕ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / SYSTEM FOR SETTING AND MAKING MANAGERIAL DECISIONS / DATA WAREHOUSE / BIG DATA / DATA MINING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Силин Анатолий Николаевич, Барбаков Олег Михайлович, Яковлев Александр Владимирович, Токарь Дмитрий Андреевич

Статья посвящена анализу процессов разработки и внедрения интеллектуальной информационно-аналитической системы мониторинга социальной ситуации для неоиндустриального освоения Арктики, формулированию методологических положений, а также разработке научных выводов в сфере использования интеллектуальных систем при анализе информации. По результатам проведенного исследования были раскрыты и обобщены подходы к формированию хранилища данных Арктической зоны. Проведенный анализ литературы помог сформулировать теоретические выводы, разработать практические рекомендации и очертить перспективы и особенности внедрения интеллектуальной информационно-аналитической системы мониторинга социальной ситуации для неоиндустриального освоения Арктики. В статье научно обоснована и предложена разработка интеллектуальной информационно-аналитической системы мониторинга социальной ситуации для неоиндустриального освоения Арктики, которая еще будет включать систему постановки и принятия управленческих решений властными структурами Арктического региона.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Силин Анатолий Николаевич, Барбаков Олег Михайлович, Яковлев Александр Владимирович, Токарь Дмитрий Андреевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF SYSTEM OF MONITORING SOCIAL SITUATION FOR NEO-INDUSTRIAL DEVELOPMENT OF THE ARCTIC

The article is devoted to the analysis of the development and implementation of an intellectual information-analytical system for monitoring the social situation for the neo-industrial development of the Arctic, the formulation of methodological provisions, as well as the development of scientific conclusions in the use of intelligent systems in the analysis of information. Based on the results of the study, approaches to the formation of a data warehouse of the Arctic zone were disclosed and generalized. The conducted analysis of the literature helped to formulate theoretical conclusions, develop practical recommendations and outline the prospects and feature es of the introduction of an intellectual information-analytical system for monitoring the social situation for the neo- industrial development of the Arctic. The article scientifically substantiates and proposes the development of an intellectual information-analytical system for monitoring the social situation for the neo-industrial development of the Arctic, which will also include a system for setting and making managerial decisions by the authorities of the Arctic region.

Текст научной работы на тему «РАЗРАБОТКА СИСТЕМЫ МОНИТОРИНГА СОЦИАЛЬНОЙ СИТУАЦИИ ДЛЯ НЕОИНДУСТРИАЛЬНОГО ОСВОЕНИЯ АРКТИКИ»

УДК 316.4.051

РАЗРАБОТКА СИСТЕМЫ МОНИТОРИНГА СОЦИАЛЬНОЙ СИТУАЦИИ ДЛЯ НЕОИНДУСТРИАЛЬНОГО ОСВОЕНИЯ АРКТИКИ

Анатолий Николаевич Силин1, Олег Михайлович Барбаков2, Александр Владимирович Яковлев1, Дмитрий Андреевич Токарь1

1 Кафедра маркетинга и муниципального управления, Тюменский индустриальный университет, Тюмень, Российская Федерация

2Кафедра бизнес-информатики и математики, Тюменский индустриальный университет, Тюмень, Российская Федерация

Аннотация. Статья посвящена анализу процессов разработки и внедрения интеллектуальной информационно-аналитической системы мониторинга социальной ситуации для неоиндустриального освоения Арктики, формулированию методологических положений, а также разработке научных выводов в сфере использования интеллектуальных систем при анализе информации. По результатам проведенного исследования были раскрыты и обобщены подходы к формированию хранилища данных Арктической зоны. Проведенный анализ литературы помог сформулировать теоретические выводы, разработать практические рекомендации и очертить перспективы и особенности внедрения интеллектуальной информационно-аналитической системы мониторинга социальной ситуации для неоиндустриального освоения Арктики. В статье научно обоснована и предложена разработка интеллектуальной информационно-аналитической системы мониторинга социальной ситуации для неоиндустриального освоения Арктики, которая еще будет включать систему постановки и принятия управленческих решений властными структурами Арктического региона.

Ключевые слова: система постановки и принятия управленческих решений, хранилище данных, большие данные, интеллектуальный анализ данных.

Development of System of Monitoring Social Situation for Neo-Industrial Development of the Arctic

Anatoly N. Silin1, Oleg M. Barbakov2, Alexander V. Yakovlev1, Dmitriy A. Tokar1

department of Marketing and Public Administration, Industrial University of Tyumen, Tyumen, Russian Federation 2Department of Business-Informatics and Mathematics, Industrial University of Tyumen, Tyumen, Russian Federation

Abstract. The article is devoted to the analysis of the development and implementation of an intellectual information-analytical system for monitoring the social situation for the neo-industrial development of the Arctic, the formulation of methodological provisions, as well as the development of scientific conclusions in the use of intelligent systems in the analysis of information. Based on the results of the study, approaches to the formation of a data warehouse of the Arctic zone were disclosed and generalized. The conducted analysis of the literature helped to formulate theoretical conclusions, develop practical recommendations and outline the prospects and feature es of the introduction of an intellectual information-analytical system for monitoring the social situation for the neo-industrial development of the Arctic. The article scientifically substantiates and proposes the development of an intellectual information-analytical system for monitoring the social situation for the neo-industrial development of the Arctic, which will also include a system for setting and making managerial decisions by the authorities of the Arctic region.

Keywords: system for setting and making managerial decisions, data warehouse, big data, data mining. Введение

В современной информационной цивилизации для постановки и решения управленческих задач в органах власти всех уровней и форм, в образовательных структурах для сбора, хранения, накопления, обработки и анализа огромного количества структурированных и

73

неструктурированных данных по информационным потокам процессов и явлений в жизнедеятельности общества требуются инновационные специализированные компьютерные средства, такие как интеллектуальные информационно-аналитические системы, Big Data и Data Mining, электронные симуляторы и единые хранилища данных разноплановых типов и форм, использование которых может обеспечить решение проблем любого региона и отраслевых предприятий, мониторинг и прогноз развития территорий, формирование базы альтернативных сценариев повышения эффективности управленческой деятельности на базе интеллектуальной аналитической системы с привлечением экспертов в любой области человеческого знания. Использование такого инструментария при организации неоиндустриального развития Арктики обеспечит эффективную реализацию управленческой деятельности властных структур и их эффективное взаимодействие с градообразующими предприятиями. Решение задачи предполагает проведение исследований социально-гуманитарных аспектов развития арктических пространств Западно-Сибирского региона в контексте современных глобальных и локальных вызовов, с учетом действующих и формируемых практик освоения Арктической зоны Российской Федерации (АЗРФ), выявление ключевых проблем, разработку и реализацию проектов, направленных на повышение благополучия населения.

Исследовательские задачи решаются на базе комплексного социологического мониторинга неоиндустриального освоения арктических регионов, который предлагается рассматривать как систему средств регулярного и оперативного социологического наблюдения и анализа изменений в жизнедеятельности населения, связанных с реализуемыми неоиндустриальными проектами в этих регионах, позволяющую отслеживать предварительно выбранные показатели и индикаторы, адекватно отражающие сущностные социальные характеристики регионального социума и дающие комплексное представление о его функционировании и динамике в процессе осуществления неоиндустриальных проектов.

Одной из основных целей комплексного социологического мониторинга неоиндустриального освоения арктических регионов, предлагаемого также для организации в странах-участницах Арктического совета, председательствовать в котором в 2022-2023 годах будет Российская Федерация, является получение следующей актуальной достоверной информации:

• о состоянии, изменениях и тенденциях, социальных факторах и компонентах пространственного (территориального) развития арктических регионов;

• о влиянии изменений социально-экономической, социокультурной ситуации в арктических регионах, в том числе среды обитания аборигенных этносов, происходящих в связи с реализуемыми неоиндустриальными проектами, на устойчивое социально-экономическое развитие регионов в целом, на решение социальных проблем отдельных региональных этносов (в первую очередь коренных малочисленных народов Севера) и отдельных социальных групп (например, старожилы, новоселы, вахтовики).

Материалы и методы

Предлагается создать научно-организационный механизм комплексного социологического мониторинга неоиндустриального освоения арктических регионов, который позволит решать следующие задачи:

• отслеживание и сопоставление показателей социально-экономического и социокультурного состояния различных территориальных образований, индикаторов качества и образа жизни различных социальных групп и социокультурных типов жителей (например, старожильческий, оседло-кочевой и мигрантский типы);

• отслеживание показателей человеческого и социального потенциала конкретных неоиндустриальных проектов, реализующихся на территориях арктических регионов, их успешности, проблем и влияния на социальные условия жизнедеятельности населения;

• сравнительная оценка на этой основе эффективности управленческой практики органов государственной и муниципальной власти арктических регионов, а также связанных с неоиндустриальными проектами отдельных бизнес-структур, в том числе реализованных и реализуемых управленческих решений, обоснованных при принятии данными мониторинга или принятых на основе иных информационных ресурсов;

• научно-аналитическое обоснование оценок изменений социальной ситуации в арктических регионах, обусловленных реализацией неоиндустриальных проектов на их территориях, и рекомендаций по адаптации жизнедеятельности к этим изменениям, по снижению рисков, способных оказать негативное влияние на устойчивость жизнедеятельности, для рассмотрения правительствами стран-участниц Арктического совета и властями их отдельных регионов, информирования органов власти и структур гражданского общества.

Информационной основой мониторинга будет являться объединенный массив данных социодиагностики (статистические данные и результаты их анализа, а также результаты прикладных социологических исследований, проведенных по согласованным тематике и методикам, информация из других баз данных), создаваемый как совокупность национальных баз данных и периодически пополняемый в странах-участницах Арктического совета. Этот массив будет представлять собой информационно-социологический полигон исходных данных управления, систематизированных, сгруппированных в наборы социальных показателей и индексов, описывающих социально-экономические и социокультурные признаки объектов управления [1]. Для работы с этим информационным массивом потребуется разработка и создание интеллектуальной информационно-аналитической системы (ИАС) комплексного социологического мониторинга, в частности:

• разработка методологии, технологии описания, стандартов хранения данных управленческих и социально-экономических процессов арктических территорий, связанных с неоиндустриальными проектами;

• создание системы сбора, хранения, передачи информации, обеспечения информационной безопасности (специализированное ПО и технические решения — базы данных, компьютеры, сервера, сайты, социальные сети, мессенджеры, системы поиска информации и так далее);

• проектирование и внедрение в информационном пространстве объединенного хранилища данных, содержащего набор информации о неоиндустриальных объектах управления арктическими территориями, систему ее классификации и кодирования;

• проектирование и внедрение программно-аппаратного решения ИАС управленческой деятельности как организационно-программно-технического комплекса поддержки управленческих решений в арктических территориях;

• разработка аналитического инструментария ИАС управленческой деятельности как программного решения комплексного мониторинга факторов влияния на процессы жизнедеятельности и формирования альтернативных сценариев управления арктическими территориями и так далее.

Используя механизм мониторинга, возможно в рамках решения задачи реализовать следующие подходы:

• обобщение и анализ текущего состояния и ключевых противоречий в сложившейся системе пространственной организации экономики и населения арктических пространств Западно-Сибирского региона;

• диагностика актуальных социокультурных, экологических, социально-экономических, политико-правовых условий развития АЗРФ;

• выделение ключевых проблем устойчивого развития Арктических пространств Западно-Сибирского региона;

• разработка прогнозов и сценариев социально-экономического развития территорий;

• выработка рекомендаций, в том числе проектов законов и нормативно-правовых актов, концепций, стратегий, программ и социогуманитарных технологий для органов государственной власти и местного самоуправления по вопросам комплексного и устойчивого развития арктических пространств Западно-Сибирского региона [2].

Задача решается с опорой на: 1) анализ текущего состояния социально-экономического развития Арктических пространств Западно-Сибирского региона; 2) анализ потенциала социально-экономического развития в будущем в контексте глобальных и локальных вызовов и угроз; 3) эмпирические, в том числе полевые исследования текущего состояния социогуманитарных аспектов; 4) анализ успешных практик развития арктических пространств в РФ и зарубежных арктических странах; 5) разработку и реализацию проектов, инновационных моделей и практических механизмов развития Арктических пространств Западно-Сибирского региона. Показатели развития и благополучия населения, достигаемые в ходе решения задачи и отслеживаемые с помощью механизма мониторинга:

• снижение уровня бедности населения ЯНАО;

• увеличение количества занятого эндемичного населения ЯНАО;

• увеличение уровня образования населения ЯНАО;

• увеличение продолжительности жизни населения ЯНАО;

• повышение оценки субъективного восприятия качества жизни населения ЯНАО;

• увеличение количества субъектов малого предпринимательства и занятого в нем населения ЯНАО.

Возможно добавление других актуальных индикаторов.

Результаты и обсуждение

Решение проблем управленческой деятельности региона, городов и отраслевых предприятий предполагает разработку и внедрение платформы информационно-аналитической системы мониторинга социальной ситуации для неоиндустриального развития в виртуальном пространстве, что, во-первых, потребует в свою очередь разработки методологии, технологии описания и стандартов централизованного хранения данных управленческих и социально-экономических процессов региона и города, позволяющих симулировать качественные и количественные показатели жизнедеятельности на них. Во-вторых, для системы постановки и принятия управленческих решений при наличии огромного количества данных, структурированных и неструктурированных, необходимо создание аналитического инструментария интеллектуальной аналитической системы управленческой деятельности как программного решения комплексного мониторинга факторов влияния на развитие всех процессов жизнедеятельности и прогнозирования и формирования альтернативных сценариев повышения эффективности управления регионом и городом. В-третьих, по той же причине разнообразия многочисленной информации разной формы и разного представления нужно спроектировать и внедрить в информационное пространство (или облачное) единое хранилище данных, содержащее полный набор информации об объектах управления и систему ее классификации и кодирования для реализации процессов для управленцев: моделирования, прогнозирования, управления — в режимах онлайн и оффлайн.

Такая постановка задачи мониторинга социальной ситуации в Арктике требует в рамках интеллектуальной аналитической системы управленческой деятельности разработки платформы технического, информационного и программного обеспечения системы постановки и принятия управленческих решений для повышения эффективности всех процессов жизнедеятельности Арктической зоны, включая блоки — подсистемы: сбора

информации (специализированное ПО и технические решения-базы данных, компьютеры,

сервера, сайты предприятий и государственных учреждений (органы власти и другие), социальные сети, мессенджеры, системы поиска информации, средства измерения интернета вещей и так далее); хранения информации (специализированное ПО, разработанное

хранилище данных, компьютеры, сервера); передачи информации (специализированное ПО, каналы связи, локальные сети и Интернет); обеспечения информационной безопасности; анализа и структурирования информации (специализированное ПО, методология ситуационного анализа, построения и оптимизации бизнес-процессов, управления проектами, моделирования и прогнозирования, OLAP-технологии, интеллектуальный анализ данных (Data Mining), технологии обработки больших данных (Big Data), личные кабинеты экспертов, электронная площадка обсуждения проблем с многооконным интерфейсом, виртуальный модератор организации интерактивного обсуждения экспертов и другие); визуализации, представления информации (специализированное ПО, интерактивные панели, комплексные дисплейные системы, озвучивание и управление визуализации голосом, технологии коллективной работы с информацией, мобильные приложения и другие).

Таким образом, можно создать подсистему постановки и принятия управленческих решений для руководителей и управленцев органов власти разных уровней и форм для информационно-аналитической поддержки процедур и процессов оперативного моделирования и анализа, прогнозирования сценариев развития социальной ситуации в Арктической зоне при ее неоиндустриальном освоении. Естественно, имеются определенные риски при реализации интеллектуальной информационно-аналитической системы мониторинга, в частности, такие как социальные — сложность внедрения результатов экспериментов в виртуальном пространстве в реальную управленческую деятельность, организационные — длительный период закупки оборудования и программного обеспечения, сложности в организации совместной работы экспертов из разных отраслей производства и областей знания, технологические — сложность организации обратной связи с представителями заказчиков при проведении тестовых испытаний системы, политические — неэффективность продвижения на рынок Тюменской области аналитических модулей постановки и решения управленческих задач, экономические — задержка поступления средств на финансирование стратегического проекта, отсутствие единого информационного пространства, где бы были собраны все данные всех процессов в едином формате.

Разработка интеллектуальной информационно-аналитической системы для мониторинга, моделирования и проектирования управленческих траекторий в Арктической зоне при ее неоиндустриальном освоении дает возможность в первую очередь составить принципиальную схему исследуемого объекта — реальной социальной ситуации в Арктике — в виртуальном пространстве, где управленцы будут реализовывать целевые параметры своей деятельности. На основе такой схемы можно имитировать различные сценарии работы, не вкладывая средства в физическую инфраструктуру, что дает возможность, используя базу реализации альтернативных сценариев, решить задачу оптимизации исходных и/или целевых параметров своей деятельности [3]. Блок бизнес-аналитики информационно-аналитической системы включает в себя реализацию пакета прикладных программ комплексного неоиндустриального мониторинга критериев и показателей, то есть интегральных факторов влияния на процессы жизнедеятельности, на основе которых можно повысить эффективность управленческой деятельности. Базисом такой системы станет информационный полигон на виртуальном пространстве для проведения экспериментов по решению проблем реальной социальной ситуации в Арктике в динамике [4].

Реализовать интеллектуальную информационно-аналитическую систему мониторинга можно на платформе комплекса программных средств, включая SQL Server, SAP ERP ECC (GBI) для организации хранилища данных структурированной и неструктурированной информации, SAP Business Objects Enterprise XI, облачные технологии Goggle Analytics, Goggle и другие инструменты Goggle, Microsoft Azure, IBM, библиотеки Python и R для создания модулей аналитики, платформа больших данных на основе HADOOP. Информационной основой системы является информационная база, создаваемая на этапе социодиагностики, где собираются статистические данные, результаты исследований,

информация из других баз данных. Такая информация — неоднородные по своей структуре данные — преобразуется в приемлемый для информационно-аналитической системы единый формат с помощью специализированных разработанных процедур преобразования данных. Так, авторами в течение последних 13 лет изучалась ситуация и проблемы, связанные со здоровьесбережением арктического населения. Некоторые результаты опубликованы, в частности, в коллективной монографии [5], однако основной массив информации накапливался, позволяя анализировать динамику изменений, степень влияния на исследуемые параметры различных факторов и другого. Таблица 1 позволяет констатировать явную тенденцию ухудшения здоровья северян и необходимость принятия адекватных мер для разных социальных групп участников арктического освоения.

Таблица 1. Динамика изучения самооценки здоровья жителей ЯНАО, % опрошенных

Самооценка здоровья Годы

2006 2010 2015 2019

Чувствую себя хорошо 37 40 38 13

Иногда болею 40 36 35 58

Часто болею 8 10 12 11

Хронически больной 8 8 8 15

Инвалид 1 3 2 3

Затрудняюсь с оценкой 5 3 5 -

Итого 100 100 100 100

При этом массовые опросы, проведенные нами на территории ЯНАО, подтвердили наблюдения предыдущих лет, в частности, то, что мужчины традиционно оценивают свое здоровье выше, чем женщины, что противоречит данным медстатистики (таблица 2).

Таблица 2. Гендерные различия в самооценке здоровья северян, % опрошенных в 2019 году

Самооценка здоровья Пол

мужчины женщины

Совершенно здоров 18,8 9,2

Здоровье удовлетворительное 59,9 57,5

Часто болею, но хронических заболеваний нет 10,7 11,3

Здоровье плохое, имею хронические болезни 7,6 19,7

Инвалид 3,0 2,3

Итого 100,0 100,0

Компьютерные инновационные технологии опираются, прежде всего, на исследование и анализ информации объектов реального мира. Огромное количество такой информации находится в открытом и закрытом доступе в сети Интернет, локальных сетях государств, производственных отраслей, предприятий, властных структур и так далее. Эта информация в виде данных, таких как факты, текст, графики, картинки, звук, видео, может быть представлена в форме, пригодной для хранения, передачи и обработки. И хотя технически данные представляют собой любую информацию, с которой мы так или иначе можем взаимодействовать, технологическую пригодность для извлечения ценности информации имеют те данные, которые можно обрабатывать средствами вычислительной техники. Все данные представляют собой информационные ресурсы, в том числе отдельные документы и массивы документов в информационных системах (библиотеках, архивах, фондах, банках данных, других информационных системах) [6].

Информационный ресурс можно определить как организованную совокупность документированной информации, которая представляет собой базы данных и знаний, другие массивы информации в информационных системах (библиотеки, архивы, делопроизводство и так далее). В качестве таких массивов могут выступать рукописные, печатные и электронные издания, содержащие нормативную, распорядительную и другую информацию по различным

направлениям общественной деятельности (законодательство, политика, социальная сфера и так далее) [6]. Существуют основные характеристики данных, и именно они определяют возможности вычислительной техники их хранить, обрабатывать и анализировать. Первая характеристика — это объем данных, измеряемый от малых до больших величин: от битов, байтов, килобайтов, мегабайтов, гигабайтов, терабайтов до петабайтов, экзабайтов (1 бит — 0 или 1, байт — 8 бит и так далее). Так называемые малые данные могут обрабатываться на персональном компьютере, обработка больших данных требует специальных технологий, в частности платформ Big Data, технологий Hodoop, MapReduce и другие.

Следующая характеристика — структурированность, и в рамках этого параметра данные могут быть следующего типа. Структурированными данными являются упорядоченные некоторым определенным образом данные, при этом организованные для того, чтобы обеспечить возможность применить к ним некоторые действия, например, визуальный или машинный анализ. Можно сказать, что это данные, различные части информации в которых разделены не визуально (для человека), а при помощи различных меток и структур, то есть для облегчения понимания их компьютером. В некоторых базах данных информация упорядочена в вертикальных столбцах, которые называются полями, и горизонтальных строках, называемых записями. В таких структурах все записи содержат один и тот же набор полей, а в полях присутствует один и тот же набор записей. Такая структура применяется в реляционных базах данных. Слабоструктурированные данные, их еще называют полуструктурированные или плохо структурированные данные, — это форма организации данных, когда структура документа не может быть задана заранее. Схема описания таких баз данных документов имеет неопределенности или изменяется в течение эксплуатации. Определенным образом данные структурируются, но не строго в соответствии со структурой таблиц и отношениями в моделях реляционных баз данных. Это данные бессхемные, и структура у них самоописываемая. Достаточно часто встречается третий тип данных — неструктурированные данные, когда информация не имеет заранее определенной структуры данных или не организована в установленном порядке. Пример — текст, содержащий такие данные, как даты, цифры и факты, что затрудняет их анализ. При этом традиционные программные средства не работают, и требуются иные информационные технологии, такие как обработка больших данных [7].

Третья характеристика данных, от которой зависят способы и методы хранения, обработки и анализа данных, — это однородность данных, и в рамках этого параметра данные могут быть однородными или однотипными с одинаковым форматом и неоднородные или данными с различными форматами. Есть еще несколько характеристик данных, которые в той или иной мере влияют на выбор принципов обработки и анализа данных, такие как доступность данных, то есть состояние информации (ресурсов автоматизированной информационной системы), при котором субъекты, имеющие права доступа, могут реализовывать их беспрепятственно. Или связанность данных, которая может затруднить их извлечение из источников и дальнейшую их обработку [7].

Неструктурированные и неоднородные данные, как и данные большого объема, требуют специализированных технологий обработки данных, таких как платформы Big Data, технологи Hodoop, MapReduce и другие. Эти платформы и технологии могут эффективно обрабатывать так называемые большие данные. В современной терминологии большие данные — это несколько более широкое понятие, чем было определено выше. Big Data или большие данные — это совокупность подходов, инструментов и методов обработки структурированных и неструктурированных данных огромных объемов и значительного многообразия для получения воспринимаемых человеком результатов, эффективных в условиях непрерывного прироста, распределения по многочисленным узлам вычислительной сети, альтернативных традиционным системам управления базами данных и решениям класса Business Intelligence [7].

Признаками больших данных (правило 3V) будут являться:

• Volume (объем): действительно большие данные, хотя размер зависит от доступных ресурсов для их обработки;

• Variety (разнообразие): слабоструктурированные и разнородные;

• Velocity (скорость): обрабатывать надо очень быстро, причем и результаты часто нужны оперативно, если речь об онлайновых сервисах [8].

Платформа Big Data является базисом в разрабатываемой интеллектуальной информационно-аналитической системе мониторинга. Аналитика проведенных исследований в регионе, городе, отраслевых предприятиях будет осуществляться с помощью технологий Data Mining. Огромный вихрь разнообразных данных приходит из науки, бизнеса, Интернета и других источников. По официальным источникам, в Интернете объем накопленных знаний всего человечества удваивается каждые два года.

Постановка и реализация управленческих решений возможны только на основе анализа информации, но из-за ее огромного количества человеку очень сложно ее обработать без специальных методов. Data Mining или интеллектуальный анализ данных (ИАД) дает такую возможность и в последнее время используется повсеместно. Технология Data Mining (также называемая Knowledge Discovery In Data — обнаружение знаний в данных) исследует процесс нахождения новых, действительных и потенциально полезных знаний в базах данных. В основе использования Data Mining или интеллектуального анализа данных лежат методы статистики, искусственного интеллекта, машинного обучения и хранилищ данных [9].

Развитие информационных технологий предопределило создание Data Mining как интеллектуального анализа данных или метода обработки и анализа больших объемов данных. Особое место и роль в этой области занимают базы данных как средство хранения, накопления, обработки и управление информацией. С 60-х годов XX столетия до сегодняшних дней такие способы обработки информации претерпели существенные изменения: от примитивных методов хранения информации в простых файлах до сложных и мощных систем управления базами данных, а также хранилищ данных. В настоящее время диапазон используемых средств в этой области достаточно широк: реляционные СУБД, применение языка запросов SQL для работы с информацией, визуализация и оперативный анализ данных (OLAP), управление транзакциями (OLTP). В настоящее время используются такие хранилища данных, как объектно-ориентированные, объектно-реляционные, дедуктивные, предметно-ориентированные и другие [10].

Известный ученый Gregory Piatetsky-Shapiro определил Data Mining как процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Фактически Data Mining — это программные системы постановки и принятия управленческих решений, когда осуществляется поиск скрытых, ранее неизвестных, содержательных и потенциально полезных закономерностей в огромных объемах разнородных, структурированных и неструктурированных данных [11].

В рамках интеллектуального анализа данных определены 3 уровня информации работы платформ больших данных:

• исходные данные (сырые данные, исторические данные или просто данные) — необработанные массивы данных, получаемые в результате наблюдения за некой динамической системой или объектом и отображающие его состояние в конкретные моменты времени;

• информация — обработанные данные, которые несут в себе некую информационную ценность для пользователя; сырые данные, представленные в более компактном виде;

• знания — они несут в себе некое ноу-хау, отображают скрытые взаимосвязи межу объектами, которые не являются общедоступными (в противном случае это будет просто информация); данные с большой энтропией (или мерой неопределенности) [8].

В рамках создания интеллектуальной информационно-аналитической системы мониторинга социальной ситуации Арктической зоны при ее неоиндустриальном освоении разворачивается платформа Big Data. Данные для платформы собираются с разных источников информации [12]. Данные на такой платформе воспринимаются приемником, передаются в хранилище, где они преобразуются, очищаются, хранятся и могут быть использованы по запросам пользователей [13]. Фактически данные являются источником информации, но в результате применения одних и тех же данных может появляться разная информация. Разные выбранные методы обрабатывают исходные данные по-разному, и поэтому результат может различаться в значительной мере. Сам метод обработки — это норма или правило, средство или способ решения теоретических, практических, познавательных или управленческих задач. Извлечение данных происходит по алгоритмам, то есть точному предписанию относительно последовательности действий (шагов), преобразующих исходные данные в искомый результат [5].

Фактически данные являются объективными, так как отражают реальную ситуацию с объектами, явлениями и процессами. Методы же можно считать субъективными, так как при их реализации используются алгоритмы, которые составляют конкретные люди, подготавливая их к применению на объективных данных. Диалектически взаимодействуя, объективные данные формируют информацию совместно с субъективными данными, и тогда сама информация преобразуется в знания, под которыми мы понимаем всю совокупность сведений, образующих и формирующих целостное описание, которое соответствует некоторому уровню осведомленности об описываемом объекте, вопросе, предмете, проблеме и так далее. Все факты, закономерности и эвристические правила, использующиеся для решения поставленной задачи, объединенные в единую совокупность, и есть знания.

В результате сбора, передачи, обработки данных формируется информация, чаще всего, разнородная и слабоструктурированная, и на основе возникновения распределенных взаимосвязей между отдельными элементами этой информации образуются истинные знания. Достаточно часто получаемый результат не определен, но получая информацию, мы формируем свои знания, и эти знания могут способствовать для определения конкретного результата сбора и обработки информации. Понятно, что данные сами по себе бессмысленны, но на основе их формируется определенная информация.

По определению Денхема Грэя, «знания — это абсолютное использование информации и данных, совместно с потенциалом практического опыта людей, способностями, идеями, интуицией, убежденностью и мотивациями» [13]. По сравнению с данными, информация несет смысловое содержание. И тем более третий уровень — знания. То есть если рассматривать эти понятия с философской точки зрения, то знания и информация — понятия более высокого уровня, чем данные. «Данные» — это фактически количественные и качественные параметры, характеризующие объекты, предметы, явления и процессы, причем формализованные. Эта категория возникла достаточно недавно, с появлением инструментария обработки данных (ЭВМ). Понятие «информация» определяет сущность процессов внутри информационной системы и касается элементов этой системы, в то время как понятие «знание», скорее всего, ориентировано на качество процессов. Категория «знание» является основным в системе постановки и принятия управленческих решений. Таким образом, технологии Data Mining ценны тем, что при их реализации наблюдается четкая ориентация на практическую составляющую любого исследования. Обработка сырых данных через формирование информации и получение конкретного знания ведет к достижению конкретного результата, четкая постановка задачи способствует созданию готового приложения, при помощи которого можно решать любые проблемы.

Итак, на информационном полигоне сформирован комплекс объектов управления, так называемых образов, описанных наборами социальных показателей, которые преобразуются в интегральные индексы. В виртуальном пространстве именно эти социальные показатели

являются основой для управленческих решений. Информационный полигон исходных данных для управленческой деятельности — это множество наборов социально-экономических, социально-политических и социокультурных признаков, когда каждый набор со своими характеристиками в многомерном геометрическом пространстве формирует образы прогнозируемого свойства. На полигоне выявляются индексы как группировка социальных показателей, которые используются в дальнейшем при построении прогнозных моделей системы управления. В информационном пространстве реализуются постановка и принятие управленческого решения, когда все этапы перенесены в виртуальную реальность, искусственный иллюзорный мир, который создается при помощи технических средств имитационного моделирования. В этом мире в качестве субъекта выступает управленец, и именно он осуществляет автоматизировано реализацию управленческих решений. В рамках такой методологии проведения социальных экспериментов управления на виртуальном пространстве можно выявлять альтернативные варианты решения проблем Арктической зоны на имитационных моделях в информационном пространстве, а не экспериментировать в реальных условиях на людях.

На создаваемом информационно-социологическом полигоне в виртуальном пространстве симулятора проводятся эксперименты по моделированию, прогнозированию и повышению эффективности управленческой деятельности. Предлагаемые рекомендации по результатам социальных экспериментов на виртуальном пространстве становятся основой для разработки новых нормативно-законодательных актов по развитию территорий, отраслевых предприятий, финансовых, банковских и образовательных структур, корректировке нормативно-законодательной базы, обоснованию и внедрению комплекса мероприятий, направленных на повышение эффективности управленческой деятельности.

Выводы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, управленцы получили инструментарий для повышения эффективности деятельности органов власти, отраслевых предприятий, образовательных, финансовых и банковских структур, включающий в себя разработку схемы предметной области, формирование алгоритма функционирования микро- и макропоказателей для сеанса моделирования (экономические, социодемографические, специфические показатели предметной области и иные), задание начальных условий моделирования и получение желаемого результата, моделирование с возможностью выбора промежуточных решений и корректировки конечных результатов, аналитику по результатам прогноза и причины, повлекшие отклонение от желаемого результата.

Ключевыми преимуществами системы видятся хранилище данных структурированной и неструктурированной информации, собранной из различных источников и преобразованных к единому формату, обширный набор предобученных модулей для моделирования экономических, социальных, политических, технических, производственных показателей деятельности предприятия, властных, образовательных, финансовых, банковских структур, механизм создания собственных моделей в интерфейсе симулятора. Для организаций, которые не публикуют детальную информацию о себе и своих процессах в публичном доступе, нужна возможность настроить модель на основе своих данных. Предполагается обширное использование алгоритмов аналитики, машинного обучения, Data Mining и Big Data, визуализация информации для эффективной постановки и принятия управленческих решений.

Благодарности

Статья подготовлена при поддержке РФФИ (грант № 19-29-07355/19 «Человеческий капитал арктического региона в концепции пространственного развития России»).

Библиографический список

[1] Барбаков О.М., Белоножко М.Л., Гюрджинян А.С., Силин А.Н., Ситева С.С., Белоножко Л.Н. Этносоциологический мониторинг в рамках стратегического проекта по Арктике // Известия высших учебных заведений «Социология. Экономика. Политика». -

2018. - № 4(59). - С. 23-35.

[2] Barbakov O.M., Belonozhko M.L., Belonozhko L.V. The problems of social and information support of the population of the arctic zone of Russia in the cut of the industrialization of the development of the region // Utopia y Praxis Latinoamericana. - 2018. - Vol. 23, No 82. -P. 270-279.

[3] Barbakov O.M., Kiselyov V.G. Methodology of carrying out social experiments in virtual space // Tyumen State University Herald. - 2012. - No 8. - P. 123-135.

[4] Belonozhko M.L., Silin A.N., Barbakov O.M. Social and Human Potential of the Arctic Frontier (by the results of the sociological research in the Yamal) // International Journal of Ecological Economics & Statistics. - 2018. - Vol. 39, No 1, - P. 132-142.

[5] Акимов А.М., Барбаков О.М., Белоножко М.Л. Здоровьесбережение участников освоения арктического нефтегазового региона / Отв. ред. А.Н. Силин, В.В. Маркин. - Тюмень: ТИУ,

2019. - 171 с.

[6] Барбаков О.М., Зобнин Ю.А., Еропкина А.С. Информационный менеджмент: учебное пособие. - Тюмень: Издательство ТюмГНГУ, 2014. - 272 с.

[7] Гришковский А. Интегрированная обработка неструктурированных данных [Электронный ресурс]. - Режим доступа: http://www.tadviser.ruЛndex.php/Статья:Большие_дшньIе_(Big_Data) (дата обращения: 11.03.2020).

[8] Степанов Р.Г. Технология Data Mining: Интеллектуальный Анализ Данных. - Казань: Казанский Государственный Университет им. В.И. Ульянова-Ленина, 2008. - 58 с.

[9] Барсегян А.А., Куприянов М.С. Технологии анализа данных. Data Mining, Visual Mining, Text Mining, OLAP. - 2-е изд., перераб. и дополн. - Санкт-Петербург: БХВ-Петербург, 2007. - 384 с.

[10] Cogdell J.W., Piatetski-Shapiro I.I. The Arithmetic and Spectral Analysis of Poincaré Series // Perspectives in Mathematics. - London: Academic Press, 1990.

[11] Han J., Kamber M., Pei J. Data Mining: Concepts and Techniques. - Waltham: Morgan Kaufmann, 2000.

[12] Чубукова И.В. Data Mining. Пособие. - Москва: Интернет-ун-т информ. технологий, 2008. - 382 с.

[13] Пальмов С.В. Интеллектуальные системы и технологии: учебное пособие. - Самара: ПГУТИ, 2017. - 196 с.

References

[1] Barbakov, O.M., Belonozhko, M.L., Gurdzhinyan, A.S., Silin, A.N., Siteva, S.S., & Belonozhko, L.N. (2018). Ethnosociological monitoring as part of a strategic project in the Arctic. News of Higher Educational Institutions "Sociology. Economy. Politics", 4(59), 23-35.

[2] Barbakov, O.M., Belonozhko, M.L., & Belonozhko, L.V. (2018). The problems of social and information support of the population of the arctic zone of Russia in the cut of the industrialization of the development of the region. Utopia y Praxis Latinoamericana, 23(82), 270-279.

[3] Barbakov, O.M., & Kiselyov, V.G. (2012). Methodology of carrying out social experiments in virtual space. Tyumen State University Herald, 8, 123-135.

[4] Belonozhko, M.L., Silin, A.N., & Barbakov, O.M. (2018). Social and Human Potential of the Arctic Frontier (by the results of the sociological research in the Yamal). International Journal of Ecological Economics & Statistics, 39(1), 132-142.

[5] Akimov, A.M., Barbakov, O.M., & Belonozhko, M.L. (2019). Health saving of participants in the development of the Arctic oil and gas region. Tyumen: TIU.

[6] Barbakov, O.M., Zobnin, Y.A., & Yeropkina, A.S. (2014). Information management: a training manual. Tyumen: Publishing house Tsogu.

[7] Grishkovsky, A. (2013). Integrated processing of unstructured data. Retrieved from http://www.tadviser.ru/index.php/Article:Larger_data_(Big_Data).

[8] Stepanov, R.G. (2008). Data Mining Technology: Data Mining. Kazan: Kazan State University named after V.I. Ulyanov-Lenin.

[9] Barsegyan, A.A., & Kupriyanov, M.S. (2007). Data analysis technologies. Data Mining, Visual Mining, Text Mining, OLAP. St. Petersburg: BHV-Petersburg.

[10] Cogdell J.W., & Piatetski-Shapiro, I.I. (1990). The Arithmetic and Spectral Analysis of Poincaré Series. In Perspectives in Mathematics. London: Academic Press.

[11] Han, J., Kamber, M., & Pei, J. (2000). Data Mining: Concepts and Techniques. Waltham: Morgan Kaufmann.

[12] Chubukova, I.V. (2008). Data mining. Moscow: Internet University of Information Technologies.

[13] Palmov, S.V. (2017). Intelligent systems and technologies. Samara: PSUTI.

Получена / Submitted: 12/03/2020

Доработана / Revised: 11/04/2020

Принята к публикации / Accepted: 20/05/2020

i Надоели баннеры? Вы всегда можете отключить рекламу.