УДК 519.76
О СЕМАНТИЧЕСКИХ ТЕХНОЛОГИЯХ ДЛЯ НАУЧНО-ТЕХНОЛОГИЧЕСКОГО ПРОГНОЗИРОВАНИЯ В ЭНЕРГЕТИКЕ
Михеев Алексей Валерьевич
К.т.н., Институт систем энергетики им. Л.А. Мелентьева СО РАН, 664130 г. Иркутск, ул. Лермонтова 130, e-mail: mikheev@isem.irk.ru
Аннотация. В статье рассмотрены возможности применения семантических технологий для решения задач научно-технологического прогнозирования в энергетике. Дан обзор текущих методов и подходов, используемых для научно-технологического прогнозирования в России и за рубежом. Обсуждаются пути решения проблем, стоящих перед сферой прогнозных исследований, с помощью аппарата семантических технологий, а также общие принципы интеграции семантической информационно-аналитической системы с методологией системного технологического моделирования.
Ключевые слова: семантическое моделирование, онтологии, научно-технологическое прогнозирование, энергетические технологии.
Введение. Интеграция национальных систем энергетики, глобальные изменения климата наряду как с интенсивным развитием энергетических технологий, особенно в части возобновляемых источников энергии, так и с растущими масштабами применения интеллектуальных информационно-коммуникационных технологий для управления энергетическими объектами и системами, влекут неизбежное изменение технологических укладов на обозримом горизонте. Причем развитие технологий - это постоянный и непрерывный процесс, который идет ускоряющимися темпами в соответствии с доминирующей в настоящее время мировой концепцией устойчивого развития. Более того, технологически консервативный энергетический сектор находится на пороге принципиальных изменений в сторону клиенто-ориентированных инфраструктурных систем для надежного и эффективного обслуживания отраслей экономики и социальной сферы.
В этой связи возникает необходимость, с одной стороны, в хорошем понимании текущего состояния исследований технологий в сфере энергетики, особенно, их взаимосвязей с технологиями широкого спектра смежных областей - от разработки новых материалов до интеллектуального управления. С другой стороны, актуальной остается потребность в выявлении основных технологических трендов, идентификации и оценки эффективных разработок с высоким потенциалом применения в ближайшем будущем, в систематическом планировании и управлении технологическим развитием через выстраивание приоритетов, в обосновании научно-исследовательских разработок и/или трансфера технологий из-за рубежа.
Используемый в настоящее время в России инструментарий научно-технологического прогнозирования часто не отвечает на вызовы сегодняшнего дня. Среди главных вызовов можно выделить как наиболее важные следующие:
• необходимость поддержки устойчивого научно-технологического развития;
• ускорение технологических изменений;
• усиление влияния прогресса в области науки и технологий на социально-экономические процессы;
• рост сложности объектов, контрагентов, и, как следствие, объединяющих их систем;
• усиление междисциплинарных эффектов, влияния друг на друга смежных областей знания, в том числе конвергенция технологий;
• необходимость систематического адаптивного прогноза и механизмов «скользящего» планирования при непрерывной актуализации научно-технической информации.
Вместе с тем развитие информационных технологий и наступление «эпохи больших данных» предоставляют качественно новые возможности для решения сложных слабоструктурированных задач, какими, несомненно, являются задачи научно-технологического прогнозирования в силу большой неопределенности объекта исследования. В этом могут помочь развивающиеся технологии искусственного интеллекта: семантическое моделирование, онтологии, информационный интеллектуальный поиск, методы извлечения и анализа гетерогенных данных, методы статистического анализа, когнитивного моделирования и визуализации. Существует насущная потребность в разработке методологии и соответствующего информационно-вычислительного инструментария на интеллектуальной основе для формирования качественного «скользящего» прогноза научно-технологического развития энергетики и поддержки принятия решений в изменяющихся условиях.
1. Обзор исследований в области научно-технологического прогнозирования. За рубежом, особенно в США, где обоснованные научно-технологические прогнозы и программы инновационного развития - это одна из важнейших устоявшихся форм регулирования экономики, в последние десятилетия наблюдается активное развитие целого спектра интеллектуальных подходов и методов в целях обеспечения поддержки принятия решений по планированию и управлению инновационным развитием экономики.
С 2003 года международная рабочая группа из ведущих ученых из США, Европы и стран Восточной Азии координирует исследования по перспективному анализу технологического развития (Future-oriented Technology Analysis или сокращенно FTA) [5]. Эти исследования объединяют связанные и пересекающиеся направления:
• технологический мониторинг (Technology Monitoring, Watch, Alerts) - сбор и интерпретация данных;
• конкурентные технологические знания (Technical and Competitive Intelligence) -конвертирование технологической информации в полезные знания, как правило, через анализ угроз и возможностей;
• научно-технологическое прогнозирование (Technological Forecasting) -определение наиболее вероятных направлений развития и темпов изменений;
• стратегическая оценка технологий (Strategic Technology Assessment) - оценка непреднамеренных, непрямых и отложенных эффектов и последствий технологических изменений;
• технологические дорожные карты (Technology Roadmapping) - соотношение ожидаемого прогресса в связке технология-продукт в виде перспективного плана;
• технологический форсайт (Technology Foresight) - предвидение и выработка стратегии действий, часто с привлечением прямого участия экспертного сообщества.
Для решения задач в рамках этих направлений разработано много различных методов, инструментов и их комбинаций: экспертное мнение, анализ трендов, математическое и имитационное моделирование, статистические, сценарные, обучающие, описательные, интеллектуальные и другие методики. Одну из разновидностей обобщенной классификации методов FTA можно найти в [9].
Цель исследований FTA - это разработка средств интеллектуальной поддержки систематического процесса обоснования возможных путей развития науки и технологий, оценки перспективного влияния новых технологий на общество и окружающий мир, в том числе и на конкретные отраслевые инфраструктуры, а также поддержка выработки стратегических решений по инновационному развитию от мирового/национального уровня до уровня интересов высокотехнологичных компаний.
В России инструментарий, применяемый для задач поддержки принятия решений по научно-технологическому прогнозированию и инновационному развитию в энергетическом секторе, условно можно разделить на три основных группы подходов. Первая базируется на методах научно-технологического форсайта, когда все обзоры, оценки, прогнозы и рекомендации формируются на основе консолидированного мнения экспертов [6]. Несмотря на простоту, оперативность, малые затраты, такой подход часто критикуется за субъективность, слабую обоснованность и отсутствие ответственности экспертов. Основу второй группы составляют аналитический мониторинг и планирование развития в крупных энергетических компаниях, который отличается узкой специализацией и ориентированностью на конкретные задачи технологического развития такой компании на ближайшие годы.
Третья группа - это методология системного анализа, которая является наиболее строго научно обоснованным подходом, поскольку использует в качестве основных инструментов: (а) методы системного оценивания и сопоставления технологий; (б) системное технологическое моделирование (математические модели технологий и их структуры). При этом учитываются как сами энергетические технологии по всей совокупности их основных характеристик, так и целый комплекс внешних факторов -потребности, ресурсы, экология, функционирование, институты [3]. Однако, применение инструмента системного анализа для разработки программ инновационного развития, в том числе и в сфере энергетики, подразумевает выполнение комплекса полномасштабных исследовательских работ, требующих больших затрат труда и времени высококвалифицированных научных коллективов. Кроме того, большой проблемой является отсутствие эффективных механизмов оперативной адаптации аппарата системного технологического моделирования к меняющимся условиям технологического развития, особенно в части учета факторов научно-технического прогресса в смежных или слабосвязанных областях, в сложности учета междисциплинарных и инфраструктурных технологических эффектов, в возросшей информационной, технической и организационной комплексности объектов исследования.
Стоит упомянуть, что интеллектуальные методы и средства разрабатываются для поддержки принятия решений в достаточно близких к научно-технологическому
прогнозированию областях энергетических исследований, а именно в исследованиях направлений развития топливно-энергетического комплекса страны с учетом требований энергетической безопасности [2]. Дополнительно разработаны методы, основанные на онтологическом, когнитивном и событийном моделировании, на применении байесовских сетей доверия для оценки рисков чрезвычайных ситуаций в энергетике и декларативных представлений процессов преобразования данных. Реализована интеллектуальная ИТ-среда, интегрирующая инструментальные средства интеллектуальных вычислений и обеспечивающая поддержку двухуровневой технологии исследований [1]. Однако при прогнозировании развития ТЭК структура технологий учитывается в обобщенном виде и прогноз их показателей эффективности носит экспертный характер.
2. Семантические технологии для научно-технологического прогнозирования. Достаточное количество методов из большинства направлений перспективного анализа технологического развития (FTA) используют семантические технологии поиска, извлечения и анализа гетерогенных данных по электронным источникам информации в русле концепции «больших данных». В частности, предложена и применяется на практике методика Tech Mining - форма статистического контекстного анализа текстовых документов по базам научно-технических ресурсов - в первую очередь баз научных публикаций и патентных баз данных - для выявления прорывных исследований и разработок и для получения характеристик их инновационного потенциала [7].
В рамках исследовательского проекта «Технологическое прогнозирование с использованием интеллектуального анализа данных и семантики / Technological Forecasting using Data Mining and Semantics» (Массачусетский технологический университет, США) разрабатываются основанные на семантических подходах методы с целью анализа массива научно-технической информации из электронных ресурсов, в том числе в сфере перспективных технологий возобновляемых источников энергии и распределенной генерации энергии [10, 11]. Достигнуты определенные успехи в создании систем интеллектуального поиска, технологий согласования разнородной информации, автоматической генерации таксономии предметной области, методик идентификации перспективных технологий и определения их количественных и качественных индикаторов инновационного потенциала, методов визуализации поля исследований и разработок.
Можно выделить следующие семантические методы, представляющие интерес для задач научно-технологического прогнозирования:
1. Семантический информационный поиск вместе с анализом слабоструктурированных текстов и данных, включая извлечение терминов, концептов, их согласование и агрегирование с последующей статистической обработкой полученных семантически структурированных данных.
2. Когнитивная визуализация полученных данных.
3. Онтологическое моделирование.
Применение семантического поиска, мониторинга научно-технической информации по текстовым гетерогенным источникам и количественного их анализа открывает новые возможности для технологического прогнозирования:
1. Идентификация технологий с высоким потенциалом применения в ближайшем будущем.
2. Расчет количественных индикаторов оценки потенциального роста конкретных развивающихся технологий или индикаторов ожидаемых инноваций. Пример вычисления таких индикаторов приведен в работе [10].
3. Автоматическое построение таксономий энергетических технологий с определением взаимосвязей со смежными областями знания.
Накладывая вычисленные количественные инновационные индикаторы на онтологическую карту предметной области, с помощью методов когнитивной визуализации возможно представление так называемого научно-технологического «ландшафта», отражающего текущее состояние перспективных исследований и разработок. Таким образом, представление знаний о развитии технологий осуществляется в понятной форме для конечного пользователя (эксперта).
Общая схема работы подобной семантической информационно-
аналитической системы (СИАС) показана на рис. 1. В качестве источников текстовых данных целесообразно использовать массив научных публикаций из международных и национальных баз цитирования как наиболее достоверных источников информации, прошедших
квалифицированную экспертизу.
Поисковые запросы в системе могут быть сформированы на основе онтологий предметной области. Одно из важных преимуществ системы - это сбор информации в автоматическом режиме. Данный семантический подход достаточно универсален и может быть применен в качестве информационной основы для построения научно-технологического прогноза, как в энергетике, так и иной предметной
Вместе с тем, такой подход находится еще в стадии становления и имеет немало проблем. Главная из них та, что это скорее попытка ответа на вопросы «Кто? Что? Где?», но не на «Как? Почему?», которые наиболее интересны для прогностических целей. Среди проблемных точек можно также указать качество и достоверность источников информации, противоречивость данных, обусловленных наличием шума, нерегулярностью и неравномерностью в исследуемых источниках. Сложности вызывают согласование и интеграция гетерогенных данных из разных источников. Подчеркивается необходимость итеративного обучения и экспертной или иной верификации качества полученных результатов [8].
Рис. 1. Общая схема информационно-аналитической системы, основанной на семантических технологиях, для научно-технологического прогнозирования
3. Интеграция семантической информационно-аналитической системы с методологией системного технологического моделирования. Перечисленные выше недостатки семантического подхода берут истоки в его универсальности, когда при анализе научно-технических документов из области конкретных энергетических технологий не учитываются присущие им свойства и ограничения, имеющие изначально физико-техническую природу. Один из возможных путей преодоления указанных проблем лежит в плоскости интеграции семантической информационно-аналитической системы с методологией системного технологического моделирования в энергетике, которая уже достаточно хорошо разработана и применяется. Системные технологические модели, являющиеся разновидностью более общих системных энергетических моделей, подробно описывают возможную технологическую структуру добычи, производства, переработки, транспорта, потребления энергии разных видов для удовлетворения ожидаемого спроса с учетом целого комплекса глобальных, региональных, системных, экологических, социально-экономических и других факторов. Потребительский сектор характеризуется по принципу единообразия условий применения технологий - график потребления, уровень требуемой мощности, ценовые условия и т.п. В результате такого моделирования производится оценка оптимальных по критерию минимума экономических затрат объемов и структуры применения энергетических технологий при учете будущих потребностей (объемов рынка, режимов потребления, цен), доступности ресурсной базы, экологических и иных ограничений, научно-технического прогресса в других отраслях. Подробнее построение системных технологических моделей обсуждено в [4].
Интегрирование информационных систем и ресурсов в слабо формализованных областях, к которым безусловно относится научно-технологическое прогнозирование в энергетике, как правило, строится на формировании общего концептуального базиса через выделение и представление основных понятий (концептов) предметной области и описания содержательных связей между ними. Это возможно сделать на основе аппарата онтологического моделирования через построение полного связного комплекса онтологий рассматриваемой предметной области и решаемых на ней задач. Общая концепция интеграции семантической информационно-аналитической системы с методологией системных технологических исследований в энергетике представлена на рис. 2.
Помимо построения избыточных онтологических моделей при интеграции семантического и системного подходов необходимо решить ряд методических задач разной степени сложности. В частности, необходимо разработать:
1. Метод онтологического проектирования системных технологических моделей, позволяющий строить прогнозные математические модели, описывающие развитие технологий и их структуры, на основе избыточных онтологических моделей предметной области.
2. Методику рационального агрегирования индикаторов ожидаемых инноваций с результатами системного технологического прогноза - вариантными оценками развития энергетических технологий (структура, объемы, масштабы, условия применения).
3. Методику когнитивной визуализации пространства прогноза научно-технологического развития в энергетике.
4. Механизм интеграции таксономий, автоматически сгенерированных семантической информационно-аналитической системой, в существующее онтологическое ядро в целях пополнения и развития онтологической модели предметной области, а также выделения взаимосвязей и эффектов влияния на энергетику научно-технического прогресса в смежных областях.
5. Программный компонент доступа к базам данных показателей технологий на основе онтологий - Ontology Based Data Access (OBDA). OBDA - это технология доступа к источникам данных через онтологии на основе декларативного механизма описания связей между ними.
Рис. 2. Концепция интеграции семантической информационно-аналитической системы с методологией системных технологических исследований в энергетике
Заключение. В статье рассмотрено использование возможностей семантических технологий для повышения качества и обоснованности научно-технологического прогнозирования в энергетике. Предложена концепция онтологической интеграции традиционных методов системного моделирования развития энергетических технологий и семантической информационно-аналитической системы, способной извлекать предметно ориентированные данные из различных источников научно-технической информации и рассчитывать на их основе индикаторы инновационного роста конкретных технологий.
СПИСОК ЛИТЕРАТУРЫ
1. Массель Л.В. Создание и интеграция интеллектуальных информационных технологий и ресурсов для комплексных исследований в энергетике // Вестник РФФИ. 2012. №4 С. 74-81.
2. Массель Л.В., Массель А.Г. Интеллектуальные вычисления в исследованиях направлений развития энергетики // Известия Томского политехнического университета. Управление, вычислительная техника и информатика. Т. 321. № 5. 2012. С. 135-141.
3. Системные исследования в энергетике: ретроспектива научных направлений СЭИ-ИСЭМ / отв. ред. Н.И. Воропай. Новосибирск: Наука. 2010. 686 с.
4. Системные исследования проблем энергетики / Л.С. Беляев, Б.Г. Санеев, С.П. Филиппов и др. Новосибирск: Наука. 2000. 558 с.
5. Future-Oriented Technology Analysis / Eds. Cagnin C., Keenan M., Johnston R. et al. Springer. 2008. 166 p. - DOI: 10.1007/978-3-540-68811-2.
6. L. Proskuryakova. Energy technology foresight in emerging economies. // Technological Forecasting and Social Change. 2016. DOI: 10.1016/j.techfore.2016.05.024
7. Porter A. Tech mining // Competitive Intelligence Magazine. Vol. 8(1). 2005. Pp. 30-36.
8. Porter A.L., Zhang Y. Tech mining of science & technology information resources for future-oriented technology analyses // Futures Research Methodology - Version 3.1. / Eds. Glenn J.C., Gordon T.J. The Millennium Project, Washington, DC online at the global futures intelligence system in futures methodologies: Available at: https://themp.org/
9. V. Coates, M. Faroque, R. Klavins et al. On the future of technological forecasting // Technol. Forecast. Soc. Change. Vol. 67 (1). 2001. Pp. 1 - 17.
10. Woon W.L., Aung Z., Madnick S. Forecasting and Visualization of Renewable Energy Technologies using Keyword Taxonomies. // Data Analytics for Renewable Energy Integration. / Ed. by W.L. Woon et al. Second ECML PKDD Workshop (DARE 2014), Nancy, France, September 19, 2014. Revised Selected Papers. Springer. 2014. Pp. 122-136. DOI: 10.1007/978-3-319-13290-7_10.
11. Woon W.L., Zeineldin H., Madnick S. Bibliometric analysis of distributed generation // Technological Forecasting and Social Change. Vol. 78. 2011. Pp. 408 - 420.
UDK 519.76
SEMANTIC-BASED APPROACH FOR ENERGY TECHNOLOGY FORECASTING
Alexey V. Mikheev
Dr. of Eng. Melentiev Energy Systems Institute Siberian Branch of the Russian Academy of Sciences 130, Lermontov Str., 664033, Irkutsk, Russia, e-mail: mikheev@isem.irk.ru
Abstract. This paper reviews a semantic-based approach and its feasibility for an improvement of technology forecasting in energy sector. The semantic-based information system implies the use of so-called "tech mining" over a suitable databases and information science & technologies sources with calculation of respective innovation growth indicators and further visualization. The integration on the base of ontologies between the semantic approach and the traditional methodology of system analysis is proposed as one of possible way to get new quality of forecasting research. Keywords: semantic technique, tech mining, ontologies, technological forecasting, energy technologies
References
1. Massel L.V. Sozdanie and integraciya intellektualnih informacionnih technologiy and resursov dlya kompleksnih issledovaniy v energetike [Development and integration of information technologies and resources for complex energy studies] // Herald of RFBR. 2012. No. 4. Pp. 74-81. (in Russian)
2. Massel L.V., Massel A.G. Intellektualnie vichisleniya v issledovaniayah napravleniy razvitiya energetiki [Intellectual computations in energy development research] // Bulletin of the Tomsk Polytechnic University. Control, computer science and technology. 2012. Vol. 321. No. 5. Pp. 135-141. (in Russian)
3. Sistemnie issledovaniya v energetike: retrospektiva nauchnih napravlenii SEI-ISEM [System energy research: scientific research retrospective of SEI-ISEM] / Eds. N.I.Voropai. -Novosibirsk: Nauka. 2010. 686 p. (in Russian).
4. Sistemnie issledovaniya problem energetiki [System research of energy problems] / L.S. Belyaev, B.G. Saneev, S.P. Philippov et al. - Novosibirsk: Nauka. 2000. 558 p. (in Russian)
5. Future-Oriented Technology Analysis / Eds. Cagnin C., Keenan M., Johnston R. et al. -Springer. 2008. 166 p. - DOI: 10.1007/978-3-540-68811-2.
6. L. Proskuryakova. Energy technology foresight in emerging economies // Technological Forecasting and Social Change. 2016. - DOI: 10.1016/j.techfore.2016.05.024
7. Porter A. Tech mining // Competitive Intelligence Magazine. 2005. Vol. 8(1), Ppp. 30-36.
8. Porter A.L., Zhang Y. Tech mining of science & technology information resources for future-oriented technology analyses // Futures Research Methodology - Version 3.1. / Eds. Glenn J.C., Gordon T.J. The Millennium Project, Washington, DC online at the global futures intelligence system in futures methodologies. Available at: https://themp.org/
9. V. Coates, M. Faroque, R. Klavins et al. On the future of technological forecasting // Technol. Forecast. Soc. Change. 2001. Vol. 67 (1), Pp. 1 - 17.
10. Woon W.L., Aung Z., Madnick S. Forecasting and Visualization of Renewable Energy Technologies using Keyword Taxonomies. // Data Analytics for Renewable Energy Integration. / Ed. by W.L. Woon et al. Second ECML PKDD Workshop (DARE 2014), Nancy, France, September 19, 2014. Revised Selected Papers. Springer. 2014. Pp. 122-136. - DOI: 10.1007/978-3-319-13290-7_10.
11. Woon W.L., Zeineldin H., Madnick S. Bibliometric analysis of distributed generation // Technological Forecasting and Social Change. 2011. Vol. 78. Pp. 408 - 420.