Научная статья на тему 'БИКЛАСТЕРИЗАЦИЯ ЭКОНОМИЧЕСКИХ ДАННЫХ О СУБЪЕКТАХ ПФО'

БИКЛАСТЕРИЗАЦИЯ ЭКОНОМИЧЕСКИХ ДАННЫХ О СУБЪЕКТАХ ПФО Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
25
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ ФОРМАЛЬНЫХ ПОНЯТИЙ / БИ-КЛАСТЕРИЗАЦИЯ / ТАКСОНОМИЯ КЛАССОВ / ЭКОНОМИЧЕСКИЕ ПАРАМЕТРЫ / ПРИВОЛЖСКИЙ ФЕДЕРАЛЬНЫЙ ОКРУГ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Самойлов Д.Е.

В статье рассматривается анализ объектно-признаковых данных. На демонстрационном примере бикластеризации экономических данных о субъектах Поволжского федерального округа (ПФО) в условиях пандемии. Демонстрируются возможности выбранного подхода - классического анализа формальных понятий - к структурированию эмпирических данных. В качестве исходного материала выступают данные из отчета РосСтата за 2020 год. В качестве объектов были выбраны субъекты ПФО, а в качестве признаков - некоторые экономические показатели регионов. Свойства были подвергнуты шкалированию. Для обработки данных использовались классические алгоритмы анализа формальных понятий и их конкретная авторская имплементация. Отмечено, что корректное применение используемых методов возможно лишь при сотрудничестве экспертов предметной области.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «БИКЛАСТЕРИЗАЦИЯ ЭКОНОМИЧЕСКИХ ДАННЫХ О СУБЪЕКТАХ ПФО»

температуры газа на выходе из АВО, снижение энергопотребления, повышение эффективности работы аппарата.

Список использованной литературы:

1. Мутугуллина И.А. Устройство и расчет аппаратов воздушного охлаждения: учебное пособие, Казань: РИЦ «Школа», 2017.- 80 с.

2. Омельянюк М.В. Повышение экономичности и безопасности эксплуатации аппаратов, воздушного охлаждения / Омельянюк М.В., Черномашенко А.Н. «Нефтеропмысловое дело» 2009 №4 с. 43-46.

©Мутугуллина И.А., Маякин К.Ю., 2021

УДК519.711.2

Самойлов Д.Е.

магистрант 3 курса Самарского Университета,

г. Самара, РФ

БИКЛАСТЕРИЗАЦИЯ ЭКОНОМИЧЕСКИХ ДАННЫХ О СУБЪЕКТАХ ПФО

Аннотация

В статье рассматривается анализ объектно-признаковых данных. На демонстрационном примере бикластеризации экономических данных о субъектах Поволжского федерального округа (ПФО) в условиях пандемии. Демонстрируются возможности выбранного подхода - классического анализа формальных понятий - к структурированию эмпирических данных. В качестве исходного материала выступают данные из отчета РосСтата за 2020 год. В качестве объектов были выбраны субъекты ПФО, а в качестве признаков - некоторые экономические показатели регионов. Свойства были подвергнуты шкалированию. Для обработки данных использовались классические алгоритмы анализа формальных понятий и их конкретная авторская имплементация. Отмечено, что корректное применение используемых методов возможно лишь при сотрудничестве экспертов предметной области.

Ключевые слова

Анализ формальных понятий, бикластеризация, таксономия классов, экономические параметры,

Приволжский федеральный округ

Введение

В задачах управления такими сложными системами, как административные субъекты страны ведущую роль занимает анализ данных. При поиске удачных управленческих решений и рекомендаций для отстающих регионов приходится обрабатывать статистические данные, результаты соцопросов и прочие результаты наблюдений и экспериментов. В этом смысле интересны возможности подходы к бикластеризации объектно-признаковых данных. Упомянутая кластеризация используется как основа онтологического моделирования - конструирования иерархии понятий, описывающей рассматриваемую ПрО. Бикластер включает в себя, помимо множества объектов, множество их общих признаков [1].

Формализацию анализа объектно-признаковых данных предлагает анализ формальных понятий (АФП). Это активно развивающийся метод, зарекомендовавший себя в задачах бикластеризации данных [1]. Короткое изложение основ АФП предлагается ниже.

Классический АФП в качестве исходных данных рассматривает бинарное представление объектно-признаковых данных вида совокупности базовых семантических суждений bgm = «объект g обладает свойством т» [2]. АФП использует следующие обозначения и модели [2, 3]:

• К = (О*, М, I) - формальный контекст, где О* - набор объектов ПрО, (т.е. «обучающая выборка»),

М - множество свойств таких объектов, I - бинарное отношение «объекты-свойства» - совокупность оценок ||^т|| е {Истина, Ложь};

• операторы Галуа р, со (общая нотация «'») для контекста К:

(X) = X' = {т | т е М, Уg е X ((£, т) е I)} - общие свойства объектов, составляющихX с О*; ю(Т) = 7 ' = {g | g е О*, Ут е 7 ((g, т) е I)} - объекты, которые обладают всеми свойствами из У с М;

• (X, У) - формальное понятие, у которого X с О* - объем, У с М - содержание, причем X = У ', У = X';

• В(К) - множество формальных понятий контекста К;

• (В(К), <) - замкнутая решетка понятий, где (XI, У1) < У2), еслиXI с X2 (или У1 з У2).

Данная статья демонстрирует возможность применения алгоритмов классического АФП к исследованию экономических показателей субъектов ПФО.

Поиск данных для демонстрационного примера

Для демонстрации возможностей АФП данные выбирались с учетом их систематизированности и достоверности. Материал подобного качества был найден в статистическом отчете РосСтата за 2020 год. Соответственно, выбранные данные отображают картину на конец 2020 года. Этот год интересен в разрезе наступившей пандемии и необходимостью регионов справляться с ней. Было решено произвести выборку признаков - экономических показателей - непосредственно относящихся к контролю заболеваемости и смертности, а также потенциально влияющих на них. Данные по смертности и заболеваемости за 2020 год с достаточной достоверностью были найдены на официальном интернет-портале [4].

На основе выбранных данных был сконструирован простейший пример объектно-признаковых данных для демонстрации возможностей анализа формальных понятий.

Подготовка исходных данных для демонстрационного примера

В качестве объектов ПрО были выбраны субъекты ПФО. Их признаки извлекались из указанных выше источников. Фокус был сделан на данные, описывающие урон от пандемии, статистику по рынку труда, а также здравоохранение, инвестиции и валовый продукт Конкретно, были выбраны следующие признаки: кол-во заражений на млн. человек, кол-во смертей на млн. человек, процент организаций региона использующих Интернет, уровень безработицы, уровень высококвалифицированных рабочих кадров, средняя начисленная заработная плата, уровень бедности, численность врачей на 10 тыс. человек, число больничных коек на 10 тыс. человек, ВРП и объем инвестиций в основной капитал.

Выбранные признаки носят многозначный характер. Переход к их бинарному представлению классически осуществляется с помощью процедуры шкалирования свойств. Выбор корректных порогов для шкалирования с целью не потерять значимую информацию - задача в общем случае не тривиальная и решается привлекаемыми экспертами ПрО. В случае демонстрационного примера было принято решение ограничиться шкалированием по квартилям. В таблице 1 символом «+» показано, что попадание значения признака в квартиль учитывалось в итоговом бинарном контексте как истинное. В таблице 2 приведен пример преобразования одного из признаков в бинарную форму.

Таблица 1

Выбранные правила шкалирования

1 квартиль 3 квартиль 4 квартиль

Заражений, на млн. ч. +

Смертей, на млн. ч. +

Используют Интернет + +

Безработица +

В. и Ср. образование, % + +

Средняя з.п. в месяц + +

Кол-во бедных, на тыс.ч. +

Численность врачей на 10 тыс.ч. + +

Число коек на 10 тыс. ч. + +

ВРП +

Инвестиции в основной капитал +

Таблица 2

Пример шкалирования признака

Заражений, на млн. ч., до шкалирования Заражений, на млн. ч., в 1 квартиле

Республика Башкортостан 4777 Истина

Республика Марий Эл 13632 Ложь

Республика Мордовия 17306 Ложь

Республика Татарстан 3430 Истина

Удмуртская Республика 13261 Ложь

Чувашская Республика 13594 Ложь

Пермский край 11955 Истина

Кировская область 20587 Ложь

Нижегородская область 22045 Ложь

Оренбургская область 14832 Ложь

Пензенская область 20215 Ложь

Самарская область 10011 Истина

Саратовская область 14779 Ложь

Ульяновская область 29891 Ложь

Применив предложенный подход ко всем отобранным свойствам, получаем исходные данные для анализа - бинарный формальный контекст.

Бикластеризация данных о субъектах ПФО

Для вывода понятий и построения решетки по подобным исходным данным имеется ряд программных средств: ConExp, OntoWorker, Galicia и др. [5] Однако в рамках данной работы была использована собственная реализация алгоритмов АФП, выполненная на языке GoLang и сохраняющая решетки в графовую базу данных Neo4j. Такой подход оказывается удобен тем, что выбранная база позволяет делать запросы, извлекая информацию гранулярно и рассматривая лишь интересующие исследователя понятия и их связи.

Для визуализации выводимой решетки используется граф, ребра которого покрывают отношение «быть более общим понятием». На множестве формальных понятий это отношение формализуется как отношение частичного порядка «<». Верхний узел решетки таким образом имеет максимальный объем, т.е. включает в себя все объекты. У нижнего узла, соответственно, максимальное содержание (все возможные признаки) [1, 6].

Обработав данные демонстрационного примера получаем решетку, приведенную на рисунке 1. Ребра помечены лейблом «Parent», по аналогии с отношением наследования в программировании. Для одного из понятий вынесены его объем и содержание. Используемая база данных позволяет гибко настраивать отображение извлекаемых графов. Видно, что даже в случае небольшого демонстрационного примера, количество выводимых понятий велико. Это связано с тем, что АФП фиксирует все, даже незначительные, отличия объектов друг от друга по значениям свойств [6]. Поэтому АФП предлагает ряд алгоритмов, направленных на редуцирование решетки понятий по разным критериям (например, «высокая чувствительность к изменению объема»).

Одним из алгоритмов редуцирования является переход от решетки формальных понятий к т.н. таксономии понятий. Данный алгоритм был разработан в ИПУСС РАН [1]. При обработке множества формальных понятий упомянутым алгоритмом происходит переход к таксономии, показанной на рисунке 2. Достоинства такой таксономии - удобство интерпретирования и извлечения неявной информации из полученного графа [1].

Голубым цветом на графе выделены фундаментальные понятия, непосредственно репрезентирующие объекты ПрО, а зеленым - понятия, известные в программировании как «виртуальные». Виртуальные понятия являются обобщениями реальных объектов и в некотором смысле агрегацией их по общим свойствам. Анализировать полученную таксономию возможно следующим образом: каждое фундаментальное понятие (группа объектов) связано с теми виртуальными понятиями

(свойствами), которые присущи данной группе. В этом смысле имеет место сравнение фундаментальных понятий с дата-классами в объектно-ориентированном программировании, а виртуальные понятия - с их интерфейсами.

Рисунок 1 - Решетка формальных понятий

Рисунок 2 - Таксономия понятий предметной области

В частности, по построенной таксономии сразу заметно, что Чувашская и Кировская области образуют кластер, имея одинаковый набор признаков. Также свойства «Уровень заболеваемости, 1 квартиль» и «Средняя зарплата, 3 квартиль» встречаются у объектов одновременно, что наводит на мысли о связи экономической развитости региона и уровня заболеваемости. Вызывает удивление отсутствие сильной связи между уровнем заболеваемости и смертности. Также связь между низкой смертностью и показателями уровня здравоохранения (высокое количество больничных коек и докторов) выражена не так сильно. В то же время, большинство регионов ПФО с низким показателем смертности также характеризовались высоким процентом работников с высшим и средним образованием. Заключение

В статье на демонстрационном примере показаны возможности применения АФП для бикластеризации и структуризации экономических показателей. В качестве примера были обработаны данные регионов ПФО, однако в перспективе возможна обработка любых субъектов экономики.

Исходные данные для анализа могут иметь более богатую структуру, отображая степени доверия к различным измерительным процедурам. Процедуры измерения могут конкурировать между собой, а также могут присутствовать пропуски измерений и отказы измерительных приборов. Учет всех описанных возможностей описан теоретически [7-9], и планируется к реализации в ходе дальнейшей работы.

Следует отметить, что результаты бикластеризации, извлекаемые с помощью АФП, следует подготавливать, интерпретировать и использовать лишь при помощи экспертов в исследуемой ПрО [1, 2, 6]. Поэтому демонстрируемый концептуальный анализ данных рекомендуется проводить при поддержке таких экспертов, а также специалистов в сфере технологий обработки информации. Список использованной литературы:

1. Семенова В.А. OntoWorker: программная лаборатория для онтологического анализа данных / В.А. Семенова, В.С. Смирнов, С.В. Смирнов // Проблемы управления и моделирования в сложных системах: Труды XVII междунар. конф. (22-25 июня 2015 г., Самара, Россия). - Самара: СамНЦ РАН, 2015. С. 382393.

2. Самойлов, Д.Е. Субъективные аспекты формирования и обработки данных в анализе формальных понятий / Д.Е. Самойлов, С.В. Смирнов // Информационные технологии и нанотехнологии (ИТНТ-2016): Материалы Международной конференции и молодежной школы (17-19 мая 2016 г., Самара, Россия). -Самара: Изд-во СамНЦ РАН, 2016. - С. 1038-1043.

3. Смирнов, С.В. Двухсоставность феномена информации и анализ данных (с примерами из когнитивного анализа) / С.В. Смирнов // Информационные технологии и нанотехнологии (ИТНТ-2017): Сборник трудов III Международной конференции и молодежной школы (25-27 апреля 2017 г., Самара, Россия). - Самара: Изд-во Новая техника, 2017. - С. 1846-1849.

4. Федеральная служба государственной статистики [Электронный ресурс]. - URL: https://rosstat.gov.ru/ (дата обращения 20.11.2021)

5. Formal Concept Analysis Homepage [Electronic resource]. - Access mode: http://www.upriss.org.uk/fca/fca.html (29.11.2021)

6. Смирнов, С.В. Онтологический анализ предметных областей моделирования / С.В. Смирнов // Известия Самарского научного центра РАН. - 2001. - Т. 3, №1. - C. 62-70.

7. Yang, K.M. Fuzzy Concept Mining based on Formal Concept Analysis / K.M. Yang, E.H. Kim, S.H. Hwang, S.H. Choi // Int. J. of Computers. - 2008. - Issue 3, Vol. 2. - P. 279-290.

8. Смирнов, С.В. Нестрогий анализ формальных понятий / С.В. Смирнов // Знания - Онтологии - Теории: Материалы Всероссийской конф. с международным участием (6-8 октября 2015 г., Новосибирск, Россия). Т. 2. - Новосибирск: Институт математики СО РАН, 2015. - С. 142-150.

9. Семенова, В.А. Модели и методы интеллектуального анализа неполных данных для построения формальных онтологий. / В.А. Семенова, С.В. Смирнов // Информационные технологии и нанотехнологии

(ИТНТ-2015): Материалы международной конф. и молодежной школы (29 июня-1 июля 2015 г., Самара, Россия). - Самара: Изд-во СамНЦ РАН, 2015. - С. 192-196.

© Самойлов Д.Е., 2021

УДК 697.91

Семеновский В.В.

магистрант 2 курса СПбГАСУ г. Санкт-Петербург, РФ Богатая А.В. магистрант 2 курса СПбГАСУ г. Санкт-Петербург, РФ

ОСОБЕННОСТИ ЭФФЕКТИВНОГО ПОДБОРА ТЕПЛООБМЕННИКА ДЛЯ СИСТЕМ ВЕНТИЛЯЦИИ И КОНДИЦИОНИРОВАНИЯ

Аннотация

В данной статье рассматривается способ подготовки к работе теплоносителя для систем вентиляции и кондиционирования посредством применения пластинчатых теплообменников. Рассмотрены основные составляющие аппарата и наиболее правильно экономические решения по подбору теплообменников.

Ключевые слова

Тепловой баланс, теплообменник, уплотнение, потери давления, рабочая среда,

подготовка теплоносителя.

Теплообменник - устройство, в котором осуществляется нагрев или охлаждение за счет разницы температур между двумя средами. Правильный подбор аппарата является залогом успешной работы системы, экономии теплоносителя и стоимости теплообменника.

В системе вентиляции и кондиционирования воздуха теплообменники применяются для охлаждения приточного воздуха. В качестве охладителя используется фреон. Проходя через теплообменник, он охлаждает воздух, который в последствии охлаждает воздух в помещении.

Основой для расчета теплообменника является уравнение теплового баланса.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где Q - тепловая мощность, Вт;

О - расход теплоносителя, кг/ч;

д т

- разность температур, .

Применение теплообменников в системах кондиционирования и вентиляции весьма обширно. Это может быть подготовка теплоносителя для чиллера. По первому контуру поступает фреон, который является охладителем для воды, находящейся во втором контуре. Далее охлажденная вода поступает в приборы для охлаждения. Также аппараты могут использоваться не только для охлаждения, но и для нагрева воздуха за счет передачи тепла от горячего теплоносителя из теплосети.

Теплообменники бывают кожухотрубные и пластинчатые. Сейчас наиболее эффективны и современны пластинчатые аппараты. Отличительной особенностью является наличие пластин, за счет

i Надоели баннеры? Вы всегда можете отключить рекламу.