Цифровая экономика = модели данных + большие данные + архитектура + приложения?
В.П. Куприяновский, Н.А. Уткин, Д.Е. Намиот, П.В. Куприяновский
Аннотация—Настоящая работа посвящена
рассмотрению отраслевых моделей в цифровой экономике. На примере отраслевых моделей, предложенных компаниями ESRI и IBM, рассматривается их структура, роль и место развитии цифровой экономики. В работе предложено практическое определение цифровой экономики, как совокупности отраслевых моделей, приложений их реализующих и накопленных данных. Статья является продолжением серии работ, посвященных Умным городам и Интернету Вещей.
Ключевые слова—цифровая экономика, ESRI, IBM, отраслевые модели.
I. Введение
Ключевой функцией успешной работы практически всех составляющих цифровой экономики является возможность работать с информацией. Конечно, работать с неструктурированными данными чрезвычайно сложно, представьте себе, что вы ищете нужную бумагу в куче бумаг размером в дом, и сколько времени у вас займет этот процесс! Конечно, есть методы и в этом случае, но все равно это потеря времени и ресурсов, а, следовательно, и денег. Есть вопросы в реальных системах, на которые надо давать немедленный ответ. И как быть в этих случаях (непрерывные производственные операции, военные действия и т.п.)? Человечество всегда работало с данными и много чего придумало по этому поводу: письменность и цифры, книги и библиотеки, документы и архивы, картотеки и классификаторы, компьютеры, наконец, и связь разного рода. Наконец и общество почти целиком начинает переходить в разных странах от "аналоговой экономики к цифровой" [1]. Мы много писали о том, что собственно названия не являются сутью процессов и зачастую даже приводят к большой путанице [2,3,4] и, что еще более прискорбно, к совершенно неправильным практическим действиям и затратам ресурсов.
Статья получена 14 марта 2016.
Куприяновский В.П., МГУ имени М.В. Ломоносова, (email: [email protected]).
Уткин Н.А., РВК, (email: [email protected])
Намиот Д.Е., МГУ имени М.В. Ломоносова, (email: [email protected]).
Куприяновский П.В., Henley Business School, (email: [email protected]).
Невероятно модная тема «больших данных» из их числа. Бедный читатель может просто заблудиться в этом море книг, презентаций, вебинаров, статей и просто рекламы. Далеко не все, что пишут, при этом является рекламой и попыткой навязать свое мнение. Просто (и это один из принципов цифровой экономики) надо учиться, учиться и еще раз учиться! Собственно в базах данных и даже сверхбольших базах данных ничего сверхнового нет. Этим дисциплинам в компьютерном мире более 50 лет. Практики баз данных давно знают о специальных языках описания структур хранения данных, семантических, онтологических отношениях между элементами информации и классификаторами различного рода. Но когда надо оптимизировать работу умных городов или иных сложных систем с большим количеством, как данных, так и процессов управления, то нужны и новые средства и новые понятия (увы, как бы не ошибались, явления надо называть!).
И такое название явления было выработано и получило название моделей. Именно применение принципов и подходов привело вначале к инновационным изменениям в области строительства, которое получило название информационного моделирования зданий или просто информационного моделирования (В1М, 1М), а потом и породило на практике то явление, которое сегодня и называется цифровой экономикой. При этом мы не умоляем ролей интернета, различных средств связи, языков программирования и т.д., ибо без их прогресса цифровая экономика вряд ли была бы возможной. Но смысл в том, что моделирование и связало физически существующий мир и его процессы с цифровым пространством, дав выход в практику огромного числа инноваций, порождая в итоге новый способ существования человечества.
II. О МОДЕЛЯХ
Итак, модели бывают как собственно для отображения, хранения, поиска и применения, как информации или данных, так и процессов. Они давно стали настолько распространены, что мы, зачастую, их не воспринимаем, и превратились в стандарты, законы, регламенты и т.п., которые, при всей своей важности, мало применимы напрямую, в цифровом мире компьютеров. Мы уже достаточно много писали собственно о регламентной стороне жизни моделей и
решили эту статью посвятить практическим возможностям их применения. Для этого, понимая, что использование моделей связано с их обработкой программными средствами, мы выбрали двух лидеров мира ИТС - IBM и ESRI.
Всё чаще IT-специалисты обращают своё внимание на решения по управлению данными, основанные на стандартных отраслевых моделях данных и шаблонах бизнес-решений. Готовые к загрузке комплексные модели физических данных и отчёты бизнес-аналитики для конкретных сфер деятельности позволяют унифицировать информационную составляющую деятельности предприятия и значительно ускорить выполнение бизнес-процессов. Шаблоны решений позволяют поставщикам услуг использовать возможности нестандартной информации, скрытой в существующих системах, сокращая тем самым сроки выполнения проектов, затраты и риски. Например, реальные проекты показывают, что модель данных и шаблоны бизнес-решений могут сократить объём трудозатрат на разработку на 50%. Однако для понимания сущности явления мы ввели термин «отраслевой логистической модели» именно для отображения многообразия их конкретного использования.
Отраслевая логическая модель - это предметно-ориентированное, интегрированное и логически структурированное представление всей информации, которая должна находиться в корпоративном хранилище данных, для получения ответов, как на стратегические, так и на тактические бизнес-вопросы. Основное назначение моделей - облегчение ориентации в пространстве данных и помощь в выделении деталей, важных для развития бизнеса. В современных условиях, для успешного ведения бизнеса совершенно необходимо иметь чёткое понимание связей между различными компонентами и хорошо представлять себе общую картину организации. Идентификация всех деталей и связей с помощью моделей позволяет наиболее эффективно использовать время и инструменты организации работы компании. Естественно, что для удобства читателя мы не стали выделять в отдельные части государство как бизнес или банки как бизнес, относя сами модели ко всем направлениям деятельности.
Под моделями данных понимаются абстрактные модели, описывающие способ представления данных и доступ к ним. Модели данных определяют элементы данных и связи между ними в той или иной области. Модель данных - это навигационный инструмент, как для бизнес-профессионалов, так и для IT-профессионалов, в котором используется определённый набор символов и слов для точного объяснения определённого класса реальной информации. Это позволяет улучшить взаимопонимание внутри организации и, таким образом, создать более гибкую и стабильную среду для работы приложений. При этом и изменения, как в моделях, так и в приложениях могут быть оптимально синхронизированы.
Рис. 1 Пример модели "ГИС для органов власти и местного самоуправления".
Сегодня поставщикам программного обеспечения и услуг стратегически важно уметь быстро реагировать на изменения в отрасли, связанные с технологическими новинками, снятием государственных ограничений и усложнением цепочек поставок. Вместе с изменениями бизнес-модели растёт сложность и стоимость информационных технологий, необходимых для поддержки деятельности компании. Особенно управление данными затруднено в среде, где корпоративные информационные системы, а также функциональные и бизнес-требования к ним постоянно изменяются. Помочь в облегчении и оптимизации этого процесса, в переводе ИТ-подхода на современный уровень как раз и призваны отраслевые модели данных.
III. Как возникли модели данных и бизнес-процессов
Прежде чем переходить к конкретным реализациям, поясним, собственно, как возникли модели данных и бизнес-процессов. В процессе реализации тех или иных информационных систем их разработчики стали описывать структуры данных и бизнес-процессов. Достаточно быстро обнаружилось, что у разных разработчиков вообще-то они имеют совершенно общие черты. Улица любого города в мире состоит из проезжей части той или иной ширины, тротуара, столбов освещения, автобусных остановок, парковочных мест и т.п. И вообще говоря, есть возможность сделать из множества описаний структур данных универсальную модель, которую можно потом только кастомизировать на конкретные проекты. Эти процессы получили поддержку тех компаний, которые поставляли программные средства и языки трансляции, например, с того же UML в собственно структуры той или иной СУБД. Для компаний, производителей программных решений, это стало дополнительным конкурентным преимуществом, и они поощряли создание этих моделей данных и бизнес-процессов, предоставляя сами эти модели на своих сайтах бесплатно. В ряде случаев, как например с ГИС-моделями, их оказалось удобным представлять и в виде графического наглядного материала и с полным описанием свойств элементов данных и их взаимосвязей.
В дальнейшем именно эти описания превратились, как лучшая практика в стандарты государств,
международных организаций и различных организаций. Важно, что это чрезвычайно упростило миграцию различных приложений по обработке данных, которые используют эти стандартизованные описания.
IV. Отраслевые модели данных от компании ESRI
Модели данных под платформу ESRI ArcGIS представляют собой рабочие шаблоны для применения в ГИС-проектах и создания структур данных для разных прикладных областей. Формирование модели данных включает создание концептуального дизайна, логической и физической структуры, которые затем можно использовать для построения персональной или корпоративной базы геоданных. ArcGIS предоставляет инструменты для создания и управления схемой базы данных, а шаблоны модели данных используются для быстрого запуска ГИС-проекта по разным сферам применения и отраслям. Специалисты ESRI вместе с сообществом пользователей потратили значительное количество времени на разработку ряда шаблонов, которые могут обеспечить возможность быстрого начала проектирования базы геоданных предприятия. Эти проекты описаны и задокументированы на вебсайте [5]. Ниже, в порядке их упоминания на этом сайте, представлен смысловой перевод названий отраслевых моделей ESRI:
• Адресный реестр
• Сельское хозяйство
• Метеорология
• Базовые пространственные данные
• Биоразнообразие
• ШПД
• Внутреннее пространство зданий
• Учет парниковых газов
• Ведение административных границ
• Вооружённые силы. Разведка
• Энергетика (включая новый протокол ArcGIS MultiSpeak)
• Экологические сооружения
• МЧС. Пожарная охрана
• Лесной кадастр
• Лесное хозяйство
• Геология
• ГИС национального уровня (e-gov)
• Подземные и сточные воды
• Здравоохранение
• Археология и охрана памятных мест
• Национальная безопасность
• Гидрология
• Международная гидрографическая организация (IHO). Формат S-57 для ENC
• Ирригация
• Земельный кадастр
• Муниципальное правительство
• Морская навигация
• Государственный кадастр
• Нефтегазовые структуры
• Трубопроводы
• Растровые хранилища
• Батиметрия, рельеф морского дна
• Телекоммуникации
• Транспорт
• Водопровод, канализация, ЖКХ
Эти модели содержат все необходимые признаки отраслевого стандарта, а именно:
• находятся в свободном доступе;
• не имеют привязки к технологии «избранного» производителя;
• созданы в результате реализации реальных проектов;
• созданы при участии отраслевых специалистов;
• призваны обеспечить информационное взаимодействие между различными продуктами и технологиями;
• не противоречат другим стандартам и регулирующим документам;
• используются в реализованных проектах по всему миру;
• проектируются для работы с информацией на всем жизненном цикле создаваемой системы, а не самого проекта;
• расширяемы под нужды заказчика без потери совместимости с другими проектами и/или моделями;
• сопровождаются дополнительными материалами и примерами;
• используются в методических указаниях и технических материалах различных промышленных компаний;
• большое сообщество участников, при этом доступ в сообщество открыт для всех;
• большое количество ссылок на модели данных в публикациях за последние годы.
Специалисты ESRI входят в экспертную группу независимых органов, которые рекомендуют к использованию различные отраслевые модели, например PODS (Pipeline Open Data Standards -открытый стандарт для нефтегазовой отрасли; в настоящее время имеется реализация PODS в качестве базы геоданных ESRI PODS ESRI Spatial S.I.I) или база геоданных (БГД) из ArcGIS for Aviation, которая учитывает рекомендации ICAO и FAA, а также стандарт обмена навигационными данными AIXM S.0. Кроме того, существуют рекомендованные модели, строго соответствующие существующим отраслевым стандартам, например S-S7 и ArcGIS for Maritime (морские и прибрежные объекты), а также модели, созданные по результатам выполненных работ ESRI Professional Services и являющиеся «де-факто» стандартами в соответствующей области. Например, GIS for the Nation и Local Government ("ГИС для органов государственной власти и местного самоуправления") оказали влияние на стандарты NSDI и INSPIRE, а Hydro и Groundwater (гидрология и грунтовые воды) активно используются в свободно доступном профессиональном пакете ArcHydro и коммерческих продуктах третьих фирм. Нужно отметить, что ESRI поддерживает и
стандарты "de-facto", например NHDI. Все предлагаемые модели данных документированы и готовы к использованию в IT-процессах предприятия. Сопроводительные материалы к моделям включают:
• UML-диаграммы связей сущностей;
• структуры данных, домены, справочники;
• готовые шаблоны баз геоданных в формате ArcGIS GDB;
• примеры данных и примеры приложений;
• примеры скриптов загрузки данных, примеры утилит анализа;
• справочники по предлагаемой структуре данных.
Компания ESRI обобщает свой опыт построения
отраслевых моделей в виде книг и локализует
публикуемые материалы. Компанией ESRI CIS локализованы и изданы следующие книги:
• Геопространственная сервис-ориентированная архитектура (СОА);
• Проектирование баз геоданных для транспорта;
• Корпоративные геоинформационные системы;
• ГИС: новая энергия электрических и газовых предприятий;
• Нефть и газ на цифровой карте;
• Моделирование нашего мира. Руководство ESRI по проектированию базы геоданных;
• Думая о ГИС. Планирование ГИС: руководство для менеджеров;
• Географические информационные системы. Основы;
• ГИС для административно-хозяйственного управления;
• Веб-ГИС. Принципы и применение;
• Стратегии проектирования систем, 26-е издание;
• 68 выпусков журнала ArcReview с публикациями компаний и пользователей ГИС-систем;
• ... и множество других тематических заметок и публикаций.
Например, книга [6] (перевод) - это всестороннее руководство и справочник по моделированию данных в ГИС вообще, и по модели данных базы геоданных в частности. Книга показывает, как вырабатывать правильные решения по моделированию данных, решения, которые участвуют в каждом аспекте проекта ГИС: от проектирования базы данных и сбора данных до пространственного анализа и визуального представления. Подробно описывается, как спроектировать географическую БД, соответствующую проекту, настроить функциональность базы данных без программирования, управлять потоком работ в сложных проектах, моделировать разнообразные сетевые структуры, такие как речные, транспортные или электрические сети, внедрять данные космосъёмки в процесс географического анализа и отображения, а также создавать 3D-модели данных ГИС. Книга "Проектирование баз геоданных для транспорта" содержит методологические подходы, опробованные на большом количестве проектов и полностью
соответствующие законодательным требованиям Европы и США, а также международным стандартам. А в книге "ГИС: новая энергия электрических и газовых предприятий" с использованием реальных примеров показаны преимущества, которые корпоративная ГИС может дать компании-поставщику энергии, включая такие аспекты как обслуживание клиентов, эксплуатация сетей и другие бизнес-процессы.
Рис 2. Некоторые из книг, переводных и оригинальных, изданных на русском языке компаниями Esri CIS и DATA+.
Некоторые из книг, переводных и оригинальных, изданных на русском языке компаниями ESRI CIS и DATA+. В них затрагиваются как концептуальные вопросы, связанные с технологией ГИС, так и многие прикладные аспекты моделирования и развертывания ГИС разного масштаба и назначения.
V. BISDM
Так как мы уже подробно рассматривали тему BIM [78], то мы решили рассмотреть применение отраслевых моделей на примере модели данных BISDM (Building Interior Space Data Model, информационная модель внутреннего пространства здания) версии 3.0. BISDM является развитием более общей модели BIM (Building Information Model, информационная модель здания) и предназначена к использованию в задачах проектирования, строительства, эксплуатации и вывода из эксплуатации зданий и сооружений. Используется в ПО ГИС, позволяет эффективно обмениваться геоданными с другими платформами и взаимодействовать с ними. Относится к общей группе задач FM (управление бизнес свойствами и инфраструктурой организации). Заметим, что совершенно разные модели могут быть использованы для разных задач в жизненном цикле одного объекта, главное при этом это многократное использование информации. Перечислим основные возможности модели BISDM, применение которой позволяет при наличии соответствующих приложений:
• организовать обмен информацией в гетерогенной среде по единым правилам;
• получить «физическое» воплощение концепции BIM и рекомендуемых правил управление проектом строительства, особенно когда речь идет об окружающей среде;
• поддерживать средствами ГИС единое хранилище на всем жизненном цикле здания (от проекта до вывода из эксплуатации);
• координировать работу различных специалистов в проекте;
• визуализировать заложенный календарный план и этапы строительства для всех участников;
• давать предварительную оценку стоимости и сроков возведения (4D- и 5Б-данные);
• контролировать ход реализации проекта;
• обеспечить качественную эксплуатацию здания, включая обслуживание и ремонты;
• стать частью системы управления активами, включая функции анализа эффективности использования площадей (сдача в аренду, складские помещения, менеджмент сотрудников);
• проводить расчёт и осуществлять управление задачами энергоэффективности здания;
• моделировать перемещения людских потоков.
BISDM так же помогает определять через программные приложения правила работы с пространственными данными на уровне внутренних помещений в здании, в том числе предназначение и виды использования, проложенные коммуникации, установленное оборудование, учёт ремонтов и обслуживание, протоколирование инцидентов, взаимосвязи с другими активами компании. Модель помогает создавать единое хранилище географических и негеографических данных. Был использован опыт ведущих мировых компаний для выделения сущностей и моделирования на уровне БГД (базы геоданных) пространственных и логических взаимосвязей всех физических элементов, формирующих как само здание, так и его внутренние помещения. Следование принципам BISDM позволяет существенно упростить задачи интеграции с другими системами. На первом этапе это, как правило, интеграция с CAD. Затем, при эксплуатации здания, используется обмен данными с ERP и EAM-системами (SAP, TRIRIGA, Maximo и др.).
VI. Визуализация структурных элементов BISDM средствами ArcGIS.
В случае использования BISDM заказчик/владелец объекта может получить сквозной обмен информацией от идеи создания объекта до разработки полного проекта. Заказчик обеспечивает себе контроль строительства с получением актуальной информации к моменту ввода объекта в эксплуатацию, контроль параметров во время эксплуатации, и даже при реконструкции или выводе объекта из эксплуатации, т.е. - в жизненном цикле. Следуя парадигме BISDM, ГИС и создаваемая с её помощью БГД становятся общим хранилищем данных для связанных систем. Часто в БГД оказываются данные, созданные и эксплуатируемые сторонними системами. Это нужно учитывать при проектировании архитектуры создаваемой системы.
На определённом этапе накопленная «критическая
масса» информации позволяет перейти на новый качественный уровень. К примеру, по завершению этапа проектирования нового здания, в ГИС возможно автоматически визуализировать обзорные ЭБ-модели, составить перечень устанавливаемого оборудования, подсчитать километраж прокладываемых инженерных сетей, выполнить ряд поверок и даже дать предварительную финансовую оценку стоимости проекта.
Рис 3. Визуализация структурных элементов BISDM средствами ArcGIS.
Ещё раз отметим, что при совместном использовании BISDM и ArcGIS появляется возможность автоматического построения 3D-моделей по накопленным данным, поскольку БГД содержит полное описание объекта, включая z-координаты, принадлежность к этажу, виды соединений элементов, способы установки оборудования, материал, доступные пути перемещения персонала, функциональное назначение каждого элемента и т.д. и т.п. Нужно учесть, что после выполнения первоначального импорта всех проектных материалов в BISDM БГД возникает потребность дополнительного информационного наполнения для:
• простановки на обозначенных местах 3D-моделей объектов и оборудования;
• сбора сведений о стоимости материалов и порядка их укладки и монтажа;
• контроля проходимости по габаритам устанавливаемого нестандартного оборудования.
За счёт применения ArcGIS может быть упрощен импорт дополнительных 3D-объектов и справочников из внешних источников, т.к. модуль ArcGIS Data Interoperability позволяет создавать процедуры по импорту подобных данных и корректному их размещению внутри модели. Поддерживаются все используемые в данной отрасли форматы, в том числе IFC, AutoCAD Revit, Bentlye Microstation.
VII. ОТРАСЛЕВЫЕ МОДЕЛИ ДАННЫХ ОТ КОМПАНИИ IBM
IBM также предоставляет набор инструментов и моделей управления хранением данных для различных областей деятельности:
• IBM Banking and Financial Markets Data Warehouse
(финансы)
IBM Banking Data Warehouse IBM Banking Process and Service Models IBM Health Plan Data Model (здравоохранение) IBM Insurance Information Warehouse (страхование) IBM Insurance Process and Service Models IBM Retail Data Warehouse (розничная торговля) IBM Telecommunications Data Warehouse (телекоммуникации)
• InfoSphere Warehouse Pack:
1. for Customer Insight (для понимания клиентов)
2. for Market and Campaign Insight (для понимания
компании и рынка)
3. for Supply Chain Insight (для понимания
поставщиков).
Например, модель IBM Banking and Financial Markets Data Warehouse предназначена для решения специфических проблем банковской отрасли с точки зрения данных, а IBM Banking Process and Service Models - с точки зрения процессов и СОА (сервис-ориентированной архитектуры). Для
телекоммуникационной отрасли представлены модели IBM Information FrameWork (IFW) и IBM Telecommunications Data Warehouse (TDW). Они помогают существенно ускорить процесс создания аналитических систем, а также снизить риски, связанные с разработкой приложений бизнес-анализа, управлением корпоративными данными и организацией хранилищ данных с учётом специфики телекоммуникационной отрасли. Возможности IBM TDW охватывают весь спектр рынка телекоммуникационных услуг - от интернет-провайдеров и операторов кабельных сетей, предлагающих услуги проводной и беспроводной телефонии, передачи данных и мультимедийного контента, до транснациональных компаний, предоставляющих услуги телефонной, спутниковой, междугородней и международной связи, а также организации глобальных сетей. На сегодняшний день TDW используется крупными и мелкими поставщиками услуг проводной и беспроводной связи по всему миру.
Инструмент под названием InfoSphere Warehouse Pack for Customer Insight представляет собой структурированное и легко внедряемое бизнес-содержимое для всё большего числа бизнес-проектов и отраслей, среди которых банковское дело, страхование, финансы, программы медицинского страхования, телекоммуникации, розничная торговля и дистрибуция. Для бизнес-пользователей InfoSphere Warehouse Pack for Market and Campaign Insight помогает максимально повысить эффективность мероприятий по анализу рынка и маркетинговых кампаний благодаря пошаговому процессу разработки и учёта специфики бизнеса. С помощью InfoSphere Warehouse Pack for Supply Chain Insight организации имеют возможность получать текущую информацию по операциям цепочек поставок.
VIII. Позиция ESRI внутри архитектуры решений IBM.
Особого внимания заслуживает подход IBM для электроэнергетических компаний и предприятий ЖКХ. Для того чтобы удовлетворить растущие запросы потребителей, энергоснабжающим предприятиям необходима более гибкая архитектура по сравнению с используемой сегодня, а также стандартная отраслевая объектная модель, что упростит свободный обмен информацией. Это повысит коммуникативные возможности энергетических компаний, обеспечивая взаимодействие в более экономичном режиме, и предоставит новым системам лучшую видимость всех необходимых ресурсов независимо от того, где они располагаются в пределах организации. Базой для такого подхода служит СОА (сервис-ориентированная архитектура), компонентная модель, устанавливающая соответствие между функциями подразделений и сервисами различных приложений, которые можно многократно использовать. «Службы» таких компонентов обмениваются данными посредством интерфейсов без жёсткой привязки, скрывая от пользователя всю сложность стоящих за ними систем. В таком режиме предприятия могут легко добавлять новые приложения независимо от поставщика программного обеспечения, операционной системы, языка программирования или иных внутренних характеристик ПО. На основе СОА реализуется концепция SAFE (Solution Architecture for Energy), она позволяет компании электроэнергетической отрасли получить основанное на стандартах целостное представление своей инфраструктуры.
Рис 4 Позиция ESRI внутри архитектуры решений IBM.
ESRI ArcGIS - признанная во всём мире программная платформа для геоинформационных систем (ГИС), обеспечивающая создание и управление цифровыми активами электроэнергетических, газотранспортных, распределительных, а также телекоммуникационных сетей. ArcGIS позволяет провести наиболее полную инвентаризацию компонентов электрической распределительной сети с учётом их пространственного расположения. ArcGIS существенно расширяет архитектуру IBM SAFE, предоставляя инструменты, приложения, рабочие процессы, аналитику и информационно-интеграционные возможности,
необходимые для управления интеллектуальным энергопредприятием. ArcGIS в рамках IBM SAFE позволяет получать из различных источников информацию об объектах инфраструктуры, активах, клиентах и сотрудниках с точными данными об их местоположении, а также создавать, хранить и обрабатывать геопривязанную информацию об активах предприятия (опоры, трубопроводы, провода, трансформаторы, кабельная канализация и т.д.). ArcGIS внутри инфраструктуры SAFE позволяет динамически объединить основные бизнес-приложения, комбинируя данные из ГИС, SCADA и систем обслуживания клиентов с внешней информацией, например, об интенсивности трафика, погодных условиях, или спутниковыми снимками. Энергопредприятия используют такую комбинированную информацию для различных целей, от С.О.Р. (общей картины оперативной обстановки) до инспектирования объектов, технического обслуживания, анализа и планирования сетей.
Информационные компоненты энергоснабжающего предприятия можно смоделировать с помощью нескольких уровней, которые ранжируются от самого низкого - физического - до верхнего, наиболее сложного уровня логики бизнес-процессов. Эти уровни можно интегрировать, чтобы обеспечить соответствие типичным отраслевым требованиям, например, при автоматизированной регистрации измерений и управлении системой диспетчерского контроля и сбора данных (SCADA). Выстраивая архитектуру SAFE, энергоснабжающие компании делают значительные шаги в продвижении общеотраслевой открытой объектной модели под названием «Общая информационная модель для энергетических компаний» (Common Information Model (CIM) for Energy and Utilities). Эта модель обеспечивает необходимую базу для продвижения множества предприятий к сервис-ориентированной архитектуре, поскольку она поощряет использование открытых стандартов для структуризации данных и объектов. За счёт того, что все системы используют одни и те же объекты, путаница и неэластичность, связанные с различными реализациями одинаковых объектов, будут сокращены до минимума. Таким образом, определение объекта «клиент» и прочих важных бизнес-объектов будет унифицировано во всех системах энергоснабжающего предприятия. Теперь с помощью CIM поставщики и потребители услуг могут использовать общую структуру данных, облегчая вывод дорогостоящих компонентов бизнеса на аутсорсинг, так как CIM устанавливает общую базу, на которой можно построить обмен информацией.
Наряду уже с используемыми нами материалами от компаний из инженерно-архитектурно-строительной области, такими как ARUP и ATCIS (на них мы активно ссылались в статье [4]) мы предлагаем читателю материал от VINCI [9]. VINCI, вообще говоря, одна из самых больших компаний такого рода в мире. Она проектирует, строит и эксплуатирует скоростные автомобильные дороги, мосты, музеи и практически все, что возможно построить. Активный участник BIM
преобразований и единственный нюанс, что они из Франции хоть и работают по всей Европе и всему миру.
В 2010 году VINCI Group образовал фонд La Fabrique de la Cite, что можно перевести как фонд фабрики городов и начал публиковать свои исследования. Исследование, упомянутое выше, собственно посвящено развитию 5 городов в направлении использования данных в сервисах на качественном уровне и очень остроумно называется "прожектором". Вот небольшая цитата, которая обобщает их работу (в вольном переводе):
"Растущее число данных в городах, развивающихся в рамках общих стандартов умных городов, создало в некоторых из них совершенно новую ситуацию с использованием данных и возможности для внедрения инноваций.
Правительственные и муниципальные власти в этих городах сумели радикально использовать эти новые возможности для трансформации своей сервисной деятельности. Многократное использование данных -принципиальный вопрос для построения сервисов в энергетике, управления информацией и общественными пространствами, здоровьем населения, обучением, отдыхом и участием в общественной жизни районных жителей. Целью этого процесса использования данных является обеспечение наиболее эффективного сервиса путем вовлечения наибольшего количества участников: городских жителей, девелоперов, больших и только начинающих компаний".
Еще одним очень интересным исследованием по финансированию «зеленой» части умных городов и их инфраструктурных моделей, включая модели данных и их реализации (есть, к примеру, модели данных парков) является работа [10], выполненная фондом La Fabrique de la Cite совместно с OECD, к роли которого мы перейдем ниже.
IX. Модели данных и бизнес-процессов
СТАНОВЯТСЯ НЕЗАВИСИМЫМИ ОТ ПРОИЗВОДИТЕЛЕЙ БАЗОВОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
Сложившаяся ситуация преимуществ ряда компаний (и, в том числе, ESRI и IBM) не очень устраивала как регуляторов многих стран так и международных организаций и не соответствовала принципам конкурентности. По многим направлениям моделей данных и бизнес-процедур возникли независимые и часто некоммерческие объединения и организации, которые стали создавать стандарты и описания, независимые от конкретных производителей программных продуктов. Именно к ним в итоге и стали обращаться государственные и международные заказчики с целью избежать возможных обвинений в сговоре с производителем и коррупционных схемах. В итоге именно такие организации и получили официальные аккредитации при международных организациях по стандартизации, и именно такого рода «общественные стандарты» и стали страновыми,
международными или корпоративными [3].
X. Данные, открытые данные, большие данные
В процессе своей деятельности человек научился создавать вначале проект (виртуальный образ) того что он хочет создать, который может быть чертежом, планом или макетом сооружения и только потом приступать к его физическому воплощению. Со времен возникла специализация. Одни организации делают проект, а другие по нему строят, другие эксплуатирую, ремонтируют и утилизируют. Процесс этот приобрел формальный характер передачи одного произведенного продукта другому. Выяснилось, что есть ошибки, например, в проекте и исходная информация в необходимом объеме может существенно упростить и удешевить работу следующих этапов - так появилось требования открытости данных и сотрудничества. Выяснилось, что если распространить требования открытости на другие источники (непроектные данные) то возможно создание совсем новых сервисов и коммерческих и общественных приложений. Последние источники информации в массе своей уже стали цифровыми данными (интернет, цифровое телевиденье, радио, библиотеки, географические карты и тому подобное) начали приобретать свои модели данных или цифровые форматы параметры и т.п. Так мир стал миром цифровых открытых данных. На базе работы с ними и появилась собственно цифровая экономика. Явление как любое новое инновационное направление развивается там, где ему создаются хорошие условия. Но там его и лучше анализировать, и поэтому мы выбрали несомненного лидера в этом направлении -Великобританию.
В этой стране был создан независимый институт открытых данных (ODI) , который и является главным независимым экспертом по этому направлению. Ряд исследований он проводит с WB (Мировым банком) [11,12], а другие, например, с одним из лидеров по работе с информацией - Thomson Reuters [13]. Из ODI мы и взяли определение « открытых данных», которое на наш взгляд наиболее простое и понятное - « Открытые данные это данные, которые возможны для использования правительством, бизнесом и индивидуальными лицами. Они доступны для любого их применения и совместного использования». При всей
простоте этого определения, нужно понимать, что понятие открытости и возможности оно детализируется исходя из того, что это мир всех данных и далеко не ко всем из данных можно получить доступ.
Для того, чтобы избежать путаницы в понимании укажем, что как бы данные не назывались, они все равно обладают некоторыми имманентными свойствами. Приведем простой пример - данные реального времени. Они порождаются в режиме реального времени и должны обрабатываться в таком же режиме, и по ним принимается решение в режиме реального времени [14]. Это свой класс «больших данных» и аналитических средств [15,16]. Очень сложно, скажем, иногда придумать, зачем эти данные могут быть открыты.
Однако в цифровой экономике никто не знает всех последствий и поворотов развития инновационных применений.
Мы живем в век данных. Так сказал сэр Тим Бернерс-Ли, предложив свой "смутный, но захватывающий план для «распределенной информационной системы в СЕИК-а» который и породил из проекта международных физических исследований сегодняшние понятия «больших данных» и «открытых данных». Тим Бернерс-Ли
непреднамеренно запустил информационную революцию - объем открытых данных в СЕИ^-е до сих пор не знает аналогов. Правильно эксплуатируемые, эти данные стали преобразующей силой повышение эффективности мировых научных исследований, открывая новые возможности для внедрения инноваций во всех секторах и отраслях человеческой деятельности. Это послужило, кроме того, и хорошим примером международной практики работы с открытыми данными, о чем мы скажем ниже.
Опыт Тим Бернерс-Ли и положили в основу информационно-телекоммуникационной сети инноваций Великобритании. По стратегии, принятой правительством еще в 2014 году [17] именно данные и их особенности уже диктовали структуру этой сети (рис 5).
Рис 5. Структура инновационной сети Великобритании. В Построенная инновационная сеть и послужила прототипом для правительственных, муниципальных и городских сетей страны для работы с большими и открытыми данными. Эффективность работы этих систем и обеспечила успехи цифровой экономики Великобритании [18].
Из множества примеров удивительных эффектов применения больших открытых данных приведем лишь некоторые. Потенциальные преимущества больших объемов данных также оказались важны в области здравоохранения и медицинских исследований, как с точки зрения эффективного предоставления услуг и открытия более эффективной, персонифицированной лечения больных. Профессор Джон Уильямс из Королевского колледжа врачей проиллюстрированы возможности больших объемов данных для стратифицированной медицины, используя пример целенаправленных методов лечения раздраженного заболеваний кишечника. Он пришел к выводу, что:
Если бы мы имели большие наборы данных, где мы могли проанализировать физическую и генетическую картину у пациента и их болезни, мы смогли бы предсказать из большого набора данных, какой из этих методов лечения пациента должен был бы, скорее всего, сработать. Мы бы не проводили пациента через ряд очень опасных манипуляций и, в конечном итоге, работали именно с одним из наиболее вероятных методов, который может принести ему пользу.
Диагностика рака и "Маршруты к диагнозу" Национального онкологического исследования с помощью этой сети рассматривают различные маршруты для диагностики рака, включая задержки в постановке диагноза, а также их влияния на выживание. Открытые большие данные сети и аналитика связывают данные из больницы, статистику раковых заболеваний, время ожидания и скрининг рака по данным Национальной базы открытых данных рака. Личные идентификаторы используются, чтобы связать эти наборы данных на уровне пациента и смотреть на последствия таких факторов, как социально-
левом верхнем углу ODI экономический статус, возраст, пол и этническая принадлежность для того, чтобы оптимизировать пути диагностики и результаты лечения пациентов [19].
Для того, чтобы продемонстрировать необычность подходов к использованию больших открытых данных еще раз воспользуемся работой [19]:
«Пример 5: Моделирование железнодорожной сети активов. Программа Network Rail в 330 миллионов £ 'ORBIS'. Планируется в рамках проекта создать детальную цифровую модель железнодорожной сети Великобритании с целью повышения эффективности управления активами организации. Модель будет использовать географические данные, собранные с помощью обслуживающего персонала их планшетов и смартфонов для создания пространственной модели железнодорожной инфраструктуры, содержащий информацию о том, как используются активы и средства железной дороги».
Заметим, что в данном случае проект фактически выполняется и сопровождается самими служащими дороги на базе их личных планшетов и смартфонов. Тут должны быть опять достигнуты удивительные результаты, плохо себе представимые вне постулатов цифровой экономики и применения больших открытых данных: проект явно будет дешевле традиционных, качество будет выше и работники железной дороги реализуют себя и получат постоянный дополнительный источник дохода. Правда, только те, кто уже научился работать в цифре. Сделаем к этим двум примерам только два комментария: собственно о медицинских модели данных читатель может прочесть в [3], а железнодорожным моделям посвящена целая книга издательства ESRI, к тому же переведенная на русский язык.
Для того, чтобы уметь работать в цифровой экономике существуют замечательные работы [20,21,22], объединенные в серию отчетов по цифровой экономике, взяв из них только, которые относятся к теме большие открытые данные (OECD Digital Economy). Не только международные организации невероятно активно
разрабатывают эту тему, но и начавшие ее ученые практически всех направлений. К сожалению, это -огромная тема просто, потому что все данные или информация имеют не только свои модели, но и особую семантику и онтологию, ведь это накопленные и постоянно актуализирующиеся знания человечества о мире. Тем не менее, укажем читателю на несколько опубликованных книг и монографий, очень известных издательств: O'Reilly Media [15], Springer [23], McGraw-Hill [24] и John Wiley & Sons [25, 26]. На последнем и самом старом (основано в самом начале 19 века) и этого перечня известных издательств хотелось бы остановиться. Две книги им выпущенные входят в супер известную в России серию «для чайников» (2013 и 2014 года издание). Этим замечанием мы хотели бы придать силы всем желающим работать в этой замечательной теме - ведь она уже раскрыта для чайников и крайне необходима и востребована!
Британский математик и физик лорд Кельвин в тяжелую пору после второй мировой войны сказал: "Если вы не можете измерить что-то, вы не можете улучшить это". В 1948 году после войны британскому правительству были крайне необходимы меры, чтобы улучшить экономику страны. Для того, чтобы помочь сделать это улучшение в экономике страны, правительство приняло очень научный подход ,которым был очень горд его автор лорд Кельвин. Органам статистики было поручено посчитать, классифицировать и измерить экономическую деятельность каждого бизнеса в стране. Они (статистики) разработали набор стандартной отраслевой классификации (SIC) кодов и данных, которые они собрали для формирования политики учитывающей каждый аспект британской экономики. Это было замечательным делом. Правительство, использовало большие данные для принятия разумных решений задолго до того, это стало модно.
Вместе с тем вопрос о том, в каких «попугаях» и как измерять большие открытые данные и в целом цифровую экономику остается чрезвычайно актуальным [22, 27,28]. Обратим внимание читателя на последнюю публикацию [22], в которой именно большие данные и предлагается пока только в Великобритании и сделать тем «попугаем», который измеряет успехи развития цифровой экономики.
XI ЗАКЛЮЧЕНИЕ
В России, как и во многих странах, избравших путь цифровой модернизации, начали появляться разнообразные исследования по теме открытых данных. И в этом плане работа [29] сильно выделяется полнотой и глубиной проработки. Вместе с тем многие аспекты этой ключевой темы необходимо разрабатывать максимально комплексно. Такую попытку мы и предприняли настоящей статьей. Связь открытых больших данных с успехами цифровой экономики, позволяет ставить вопросы о приоритетности этих исследований и надеяться, что и другие авторы примут
активное обсуждение в этом вопросе. Комплексные отраслевые модели данных обеспечивают государству и компаниям единое интегрированное представление их бизнес-информации. Многим компаниям бывает непросто осуществить интеграцию своих данных, хотя это является необходимым условием для большинства общекорпоративных проектов. По данным исследования Института Хранилищ данных (The Data Warehousing Institute, TDWI), более 69% опрошенных организаций обнаружили, что интеграция является существенным барьером при внедрении новых приложений. Напротив, осуществление интеграции данных приносит компании ощутимый доход и рост эффективности.
Правильно построенная модель однозначно определяет значение данных, которые в данном случае представляют собой структурированные данные (в противоположность неструктурированным данным, таким как, например, изображение, бинарный файл или текст, где значение может быть неоднозначным). Наиболее эффективны отраслевые модели, предлагаемые профессиональными поставщиками (вендорами), в число которых входят ESRI и IBM. Высокая отдача от использования их моделей достигается благодаря значительному уровню их детальности и точности. Они обычно содержат много атрибутов данных. Кроме того, специалисты компаний ESRI и IBM не только обладают большим опытом моделирования, но и хорошо разбираются в построении моделей для определенной отрасли.
Необходимо отметить, что рассмотрение вопросов моделей при всей важности этого вопроса далеко не все что необходимо для создания успешных ИТС систем цифровой экономики, ведь конечный или пользовательский эффект дает архитектура решений и собственно сами приложения. Далеко не случайно, что важнейшей частью цифровой экономики является APP экономика или часть по производству собственно приложений [30]. Тут уже давно торжествуют решения на открытых платформах, и все производители программных решений учитывают эти обстоятельства. Собственно это привело и очень существенным изменениям в политике ранее довольно замкнутых в этом плане IBM и ESRI. Сегодня они всячески поддерживают производителей решений на любых и, в том числе, открытых платформах, как впрочем, и большинство компаний в ИТС бизнесе - без этого просто не выжить в цифровой экономике даже гигантам. В России до сих пор шестой по размеру отряд создателей приложений в классе APP экономики, что позволяет планировать его использование в российских проектах цифровой экономики и осуществлять разумную политику импортозамещения.
Ключевым вопросом построения умных городов -столиц цифровой экономики так же являются методы оптимальной работы с большими открытыми данными и построения полной системы приложений [3]. Из трех основных стандартов на эту тему, выпущенных в Великобритании [PAS 180, PAS 181, PAS 182] один -PAS 182 целиком и полностью посвящен именно теме семантической модели данных и сервисов (приложений)
в умном городе. Приведем цитату из этого документа, поясняющую вышесказанное: "Отличительной особенностью умных городов является способность компонентов их системы взаимодействовать друг с другом. Этот PAS определяет концепцию модели и дает руководство для лиц, принимающих решения по ее применению для обеспечения совместимости данных, созданных, используемых, и поддерживаемых городом во всех секторах, от его имени, а также в сотрудничестве с его гражданами.
Данные является ресурсом, который может трансформировать возможности города, путем разработки систем и услуг, а также поддержки принятия обоснованных решений. Однако, лица, принимающие решения и граждане вряд ли будут иметь необходимый опыт и, вероятно, будут полагаться на специалистов по данным, чтобы обеспечить выгоды от данных для достижения целей для своего города.
Данные часто маркируются с помощью языка и терминов из сектора, из которого изначально собирали их для предоставления услуги. Например, сектор здравоохранения может предоставить информацию, относящуюся к пациенту и планам ухода за ним, социальные услуги могут так же относиться к такому клиенту (с другим его названием), сектор образования может сослаться данные об ученике и учебных планах, а в транспортном секторе данные могут относиться к пассажиру и планам путешествий.
Каждый сектор имеет свои собственные модели и терминологии, которые позволяют определять данные, чтобы обнаруживать и понимать их в этом секторе, но эта разница в наименованиях образует барьер для взаимодействия с другими секторами".
Концепция модели умного города (SCCM), изложенная в этом PAS указывает пути устранения этого недостатка интероперабельности путем определения общих рамок концепций и отношений, которые могут быть использованы для описания данных с любого сектора. Обмен данными по городу требуется больше, чем взаимодействия, покрываемого за счет SCCM. Например, обеспечение соблюдения,
конфиденциальности, безопасности, целостности, доступности и качества данных также следует рассматривать лицам принимающих решения. Например, законодательство о защите данных и его положения, касающиеся использования персональных данных, скорее всего, будут воздействовать на некоторые из структурных взаимосвязей между данными из различных систем и надо определять, как такое разделение можно было бы ввести".
Стандарт PAS 182 позволяет так же сделать прозрачными не только возможности использования данных из других, ранее созданных систем (и это очень большая экономия уже денежных средств), но так же применять и разработанные в других системах сервисы или приложения, основанные на данных (и это - второй источник экономии средств на создание умного города).
При этом сама модель умного города выстроена независимо от производителей решений и позволяет выбрать решения, сообразующиеся с целями и задачами
умных городов.
Британские стандарты умных городов в первую очередь созданы для Великобритании. Однако идеи и подходы, заложенные в них, было бы целесообразно, по нашему мнению, учесть и при разработке российских стандартов умных городов.
Библиография
[1] Доклад о мировом развитии 2016. Цифровые дивиденды. Обзор. Международный банк реконструкции и развития / Мировой банк 2016. http://www-wds.worldbank.org/external/default/WDSContentServer/WDSP/IB/20 16/01/13/090224b08405bbc0/1_0/Rendered/PDF/World0developm0l 0dividends0overview.pdf
[2] Добрынин А. П. и др. Цифровая экономика-различные пути к эффективному применению технологий (BIM, PLM, CAD, IOT, Smart City, BIG DATA и другие) //International Journal of Open Information Technologies. - 2016. - Т. 4. - №. 1. С. 4-11
[3] Куприяновский В. П., Намиот Д. Е., Куприяновский П. В. Стандартизация Умных городов, Интернета Вещей и Больших Данных. Соображения по практическому использованию в России //International Journal of Open Information Technologies. -2016. - Т. 4. - №. 2. С. 34-40
[4] Куприяновский В. П. и др. Умные города как «столицы» цифровой экономики //International Journal of Open Information Technologies. - 2016. - Т. 4. - №. 2. С. 41-52.
[5] ESRI Support http://support.esri.com/en/knowledgebase/techarticles/detail/40585
[6] Зейлер М. Моделирование нашего мира. Руководство ESRI по проектированию базы геоданных //М.: Дата. - 1999. - Т. 254.
[7] Куприяновский В. П. и др. BIM - Цифровая экономика. Как достигли успеха? Практический подход к теоретической концепции. Часть 1. Подходы и основные преимущества BIM //International Journal of Open Information Technologies. - 2016. -Т. 4. - №. 3. С. 1-8.
[8] Куприяновский В. П. и др. BIM - Цифровая экономика. Как достигли успеха? Практический подход к теоретической концепции. Часть 2. Цифровая экономика //International Journal of Open Information Technologies. - 2016. - Т. 4. - №. 3. С. 9-20.
[9] Toward data-driven cities? Spotlight on Boston, Los Angeles, New York, Pittsburg and Chicago. VINCI, La Fabrique de la Cite 2015 http://www.thecityfactory.com/fabrique-de-la-cite/data.nsf/951F68AEB0B75B1CC1257E0F003225D2/$file/etude_ ud_en_9juin.pdf
[10] Merk, O., Saussier, S., Staropoli, C., Slack, E., Kim, J-H (2012), —Financing Green Urban Infrastructure □, OECD Regional Development Working Papers 2012/10, OECD Publishing; http://dc.doi.org/10.1787/5k92p0c6j6r0-en
[11] Supporting sustainable development with open data. Open Data Institute 2015
[12] Benchmarking open data automatically. Open Data Institute 2015
[13] Creating Value with Identifiers in an Open Data World Open Data Institute, Thomson Reuters October 2014
[14] Куприяновский В. П., Намиот Д. Е., Синягов С. А. Кибер-физические системы как основа цифровой экономики //International Journal of Open Information Technologies. - 2016. -Т. 4. - №. 2. С. 18-25
[15] Real-Time Big Data Analytics: Emerging Architecture. Mike Barlow. 2013 O'Reilly Media
[16] Namiot D. On Big Data Stream Processing //International Journal of Open Information Technologies. - 2015. - Т. 3. - №. 8. - С. 48-51.
[17] Open Data Strategy 2014-2016 Crown copyright 2014 BIS/14/946
[18] Куприяновский В. П. и др. Информационные технологии в системе университетов, науки и инноваций в цифровой экономике на примере Великобритании //International Journal of Open Information Technologies. - 2016. - Т. 4. - №.4. С.30-39
[19] The big data dilemma .Fourth Report of Session 2015-16 House of Common GB 10 February 2016
[20] Reimsbach-Kounatze, C. (2015), "The Proliferation of "Big Data" and Implications for Official Statistics and Statistical Agencies: A Preliminary Analysis", OECD Digital Economy Papers, No. 245, OECD Publishing. http://dx.doi.org/10.1787/5js7t9wqzvg8-en
[21] Deetjen, U., E. T. Meyer and R. Schroeder (2015), "Big Data for Advancing Dementia Research: An Evaluation of Data Sharing
Practices in Research on Age-related Neurodegenerative Diseases", OECD Digital Economy Papers, No. 246, OECD Publishing. http://dx.doi.org/10.1787/5js4sbddf7jk-en
[22] MEASURING THE UK'S DIGITAL ECONOMY WITH BIG DATA National Institute of Economic and Social Research 2015
[23] Dan Wang , Zhu Han Sub-linear Algorithms for Big Data Applications Springer Briefs in Computer Science 2015
[24] Harness the Power of Big Data.The IBM Big Data Platform Paul C. Zikopoulos, Dirk deRoos, Krishnan Parasuraman, Thomas Deutsch, David Corrigan, James Giles Copyright © 2013 by The McGraw-Hill Companies.
[25] Big Data Analytics For Dummies®, Alteryx Special Edition John Wiley & Sons, Inc. Copyright © 2013
[26] Big Data Analytics Infrastructure For Dummies,® IBM Limited Edition Published by John Wiley & Sons, Inc.
[27] Benchmarking open data automatically. Open Data Institute 2015
[28] Data-Driven Business Models: Challenges and Opportunities of Big Data Monica Bulger, Greg Taylor, Ralph Schroeder Oxford Internet Institute September 2014
[29] Открытые данные. Годовой отчет. Краткая версия. Автономная некоммерческая организация «Информационная культура». 2015
[30] Ghose A., Han S. P. Estimating demand for mobile applications in the new economy //Management Science. - 2014. - Т. 60. - №. 6. -С. 1470-1488.
Digital Economy = data models + big data + architecture + applications?
Vasily Kupriyanovsky, Nikita Utkin, Dmitry Namiot, Pavel Kupriyanovsky
Abstract—The present work is devoted to industry models in the digital economy. For example, we target industry models offered by companies ESRI and IBM. We describe their structures, roles and places in the development of the digital economy. The paper offers a practical definition of the digital economy, as a set of industry models, their application and the accumulated data. This article is a continuation of a series of works devoted to the Smart Cities and the Internet of Things.
Keywords—digital economy, ESRI, IBM, industry models.