DOI: 10.18454/IRJ.2016.50.176 Харитонова Л.П.
ORCID: 0000-0003-3578-1890, кандидат технических наук, доцент, Волгоградский государственный архитектурно - строительный университет К ВОПРОСУ ОБ ИСПОЛЬЗОВАНИИ НЕЙРОСЕТЕВОГО МОДЕЛИРОВАНИЯ ДЛЯ ОЦЕНКИ ПОТРЕБЛЕНИЯ ЭНЕРГИИ БОЛЬШИМИ МАССИВАМИ ПОТРЕБИТЕЛЕЙ (ЗДАНИЯМИ)
Аннотация
Исследование посвящено математическим методам современной прикладной математики, а именно нейросетевому моделированию при исследовании процессов различной физической природы, комплексному анализу применения искусственных нейронных сетей и нейросетевого моделирования для оценки потребления энергии большими массивами потребителей. Выполнен регрессионный анализ прогнозируемых результатов и целевых выходов. Получены уравнения линий регрессии и коэффициенты корреляции при различной геометрии нейронной сети и алгоритмах расчета. Тема перспективна для прогнозирования и управления городским (районным и т.д.) хозяйством в целом для исключения перебоев, чрезвычайных ситуаций, обеспечения потребностей жителей и их комфортного проживания.
Ключевые слова: нейросетевое моделирование, большие массивы потребителей.
Haritonova L.P.
ORCID: 0000-0003-3578-1890, PhD in Engineering, associate professor, Volgograd State University of Architecture and Civil Engineering ON THE ISSUE OF NEURAL NETWORK MODELING TO ASSESS THE ENERGY CONSUMPTION OF LARGE ARRAYS OF CONSUMERS (BUILDINGS)
Abstract
Research is devoted to the mathematical methods of modern applied mathematics, namely neural network modeling in the study of the processes of different physical nature, the complex analysis of the use of artificial neural networks and neural network modeling to assess the energy consumption of large arrays of consumers. Regression analysis predicted results and the target output are made. The equations of the regression lines and correlation coefficients are obtained in different geometries neural network and calculation algorithms. Subject promising for the prediction and management of the city (district, etc.) economy as a whole to avoid outages, emergencies, providing residents' needs and their comfortable living.
Keywords: neural network modeling, large arrays of consumers.
Предсказания климатологов и наблюдаемые в разных регионах мира изменения климата делают прогнозы затраченной зданиями энергиями перспективными. Этот вопрос актуален в случае, как возможного потепления, так и похолодания и особенно важен при большом количестве строений (в районе, городе и т.д.). Правительство РФ своим распоряжение от 31 октября 2015 г. № 2217-р утвердило изменения в программу фундаментальных научных исследований на 2013-2020 годы и внесло в число перспективных развитие методов извлечения знания из больших массивов информации, оценки ситуации и принятия управляющего решения, нейросетевых систем адаптивного управления для сложных ... систем.
Ранее применение нейронных сетей вызывало у ряда исследователей скептическое отношение из-за присущих им недостатков: сложной структуры, плохой интерпретируемости и большого времени обучения. Но преимущества: постоянная оптимизация алгоритмов обучения сетей, высокая допустимость к зашумленным данным и низкий коэффициент ошибок делают нейронные сети все более перспективными [1]. Долгое время основным инструментом интеллектуального анализа данных была традиционная математическая статистика, но она главным образом представляет интерес при проверке ранее сформулированных гипотез [2].
Одно из преимуществ нейронных сетей [2] - они (теоретически) могут аппроксимировать любую непрерывную функцию, что позволяет исследователю не принимать заранее какие-либо гипотезы относительно модели. Несмотря на недостатки нейронных сетей: окончательное решение зависит от начальных установок сети и его сложно интерпретировать в традиционных аналитических терминах, в последнее время появилось много работ. В [3] описан метод использования нейронных сетей в интеллектуальном анализе данных (в том числе нечетких нейронных сетей). В ряде работ рассматривается применение искусственных нейронных сетей для диагностирования, прогнозирования технического состояния изделия. Авторы из МИФИ [4] посвятили свою работу применению нейросетевых структур для моделирования пространственного поля энерговыделения в активной зоне ВВЭР-1000. В работе [5] представлены разработки нейронной сети для оценки пространственного распределения загрязнения воздуха. Представляется весьма перспективным применение нейросетевого моделирования также при моделировании повышения конкурентоспособности выпускника университета [6] и для моделирования повышения мотивации при исследовании различных процессов [7].
Итак, применение нейросетевых моделей весьма перспективно. Эти модели позволяют решать задачи описания динамики состояний объекта в нормальных условиях, в условиях неопределенности и ограничений по ресурсам. Нейросетевые технологии позволяют решать задачи, решение которых классическими методами затруднено или не представляется возможным.
Использовалась последняя версия пакета MATLAB R200^ (с использованием Neural Network). Для обучения нейронной сети были использованы 14 показателей (в том числе температура и влажность наружного воздуха, величина солнечного излучения, скорость ветра, время суток и день недели) для более четырех тысяч различных зданий. То есть вводилась матрица размерности 14x4200. Была выполнена серия из 6 опытов, некоторые результаты которых представлены далее. Второй этап построения нейронной сети - выбор её архитектуры. Точность предсказания зависит от количества скрытых слоев и количества нейронов в каждом слое. Использовалась двухслойная
однонаправленная сеть (two-layer feed-forward network) со скрытыми нейронами (hidden neurons) и линейными выходными нейронами (fitnet), так как она может соответствовать многомерным задачам отображения сколь угодно хорошо при достаточном количестве нейронов в скрытом слое. На третьем этапе определялась структура нейронной сети. Нейроны организованны в слои, причем элементы каждого слоя связаны только с нейронами предыдущего слоя, так что информация передается от предыдущих слоев в сети (рис. 1).
Четвертый этап построения нейросетевой модели - ее обучение (нелинейная задача оптимизации для выяснения набора параметров (то есть синаптических весов) таким образом, чтобы выход сети был бы как можно ближе к нужному выходу). Существуют несколько алгоритмов. В нашем случае сеть обучалась с помощью алгоритма обратного распространения Левенберга-Маркарта (Levenberg-Marquardt), а также алгоритмов сопряженных градиентов обратного распространения Bayesian Regularization и Scaled Conjugate Gradient.
Рис.1
Пятый этап построения прогнозирующей нейросетевой модели - её тестирование. Завершить процесс обучения возможно при использовании различных критериев, например, приняв за достаточный какой-либо интервал времени (количество интервалов времени (epochs) по истечении которых обучение завершится). В качестве объективного критерия может служить уровень ошибки. Если среднеквадратическое отклонение (ошибка) (Means Squared Error) будет меньше заданного уровня, то построенную модель можно использовать для решения задач прогнозирования параметров.
При исследованиях были выполнены изменения количества скрытых нейронных слоев от 5 до 20. Установлено, что при этом имеет место минимум среднеквадратической ошибки и хороший коэффициент корреляции, а количество требуемых итераций при использовании алгоритма Levenberg -Marquardt уменьшилось с 52 до 21. При фиксированном количестве нейронов в скрытом слое расчет по алгоритму Levenberg-Marquardt оказалось предпочтительным, так как приводил к меньшему количеству требуемых итераций. При неизменном количестве скрытых нейронов (например, 10) количество итераций было равно:
- алгоритм Levenberg-Marquardt 45,
- алгоритм Bayesian Regularization 154,
- алгоритм Scaled Conjugate Gradient 173.
При исследованиях изучались также разные соотношения объемов обучающих и тестовых выборок. В ряде опытов 70% (2946 зданий) от общего объема экспериментальных данных были случайным образом отобраны для обучения нейронной сети, 15% (631 здание) - для измерения сетевого обобщения, (обучение прекращается, когда обобщение перестает улучшаться); и оставшиеся данные 15% (631 здание) - для проверки работы обученной сети. В дальнейшем для обучения нейронной сети использованы 60%, а для проверки - соответственно 20% и 20%, что в принципе мало повлияло на значения коэффициентов корреляции.
Выводы:
- выполнен анализ применения искусственных нейронных сетей и нейросетевого моделирования в различных областях человеческой деятельности; можно сделать вывод о целесообразности использования нейросетевого моделирования для анализа больших массивов данных для оценки потребления энергии зданиями;
- выбрана оптимальная архитектура (геометрия) нейросетевой модели, а также оптимальный алгоритм вычисления;
- выполнен регрессионный анализ прогнозируемых результатов и целевых выходов, получены уравнения линии регрессии и коэффициенты корреляции (чтобы оценить прогноз использования нейросетевой модели): при обучении(Тшт^), проверке (Validation), тестировании (Test) и общий (All) при различной архитектуре нейронной сети (количестве внутренних нейронов) и алгоритмах расчета. Часть формул (для геометрии и алгоритма, указанного на рис.1) приведена на рис.2.
0.1 0.2 0.3 0.4 0.5 0.6 0.7 Target
Рис. 2
Литература
1. Xianjun Ni. Research of Data Mining Based on Neural Networks . World Academy of Science, Engineering and Technology. 2008. № 39. pp . 381-384.
2. Дюк В.А. Data Mining - интеллектуальный анализ данных // Информационные технологии: сайт. URL: http://www.inftechwebservis. ru/it/database/datamining/ar2.html (дата обращения 01.11.2010).
3. Manzhula V.G., Fedyashov D.S. Kohonen neural networks and fuzzy neural networks in data mining. Fundamental research. №4. 2011. pp.108-114.
4. Круглов И.А., Мишулина О.А., Шумский Б.Е. Применение нейросетевых структур для моделирования пространственного поля энерговыделения в активной зоне ВВЭР-1000. Научная сессия МИФИ. 2009. Том 1. С. 69.
5. Wahid H., Ha Q.P., Duc H. and Azzi M. Neural network- based meta-modelling approach for estimating spatial distribution of air of air pollution levels. Applied Soft Computing. 2013, vol. 13, no. 10, pp. 4087-4096.
6. Haritonova L.P. On the issue of mathematical modeling for competitive advantages of university graduates and intensification of brain activity, including the study of higher mathematics. ISJ theoretical & applied science.2016, issue 2, volume 34, pp. 164-171. soi: http://s-o-i.org/L1/tas-02-34-22 doi: http://dx.doi.org/10.15863/tas.2016.02.34.22
7. Haritonova L.P. The issue of mathematical modeling motivation in the study of different processes. International research journal. 2016. № 3 (45). P. 2 . pp. 91-93 . doi: 10.18454/irj.2016.45.031.
References
1. Xianjun Ni. Research of Data Mining Based on Neural Networks . World Academy of Science, Engineering and Technology. 2008. № 39. pp . 381-384.
2. Djuk V.A. Data Mining - intellektual' nyj analiz dannyh // Informacionnye tehnologii: sajt. URL: http://www.inftech.webservis. ru/it/database/datamining/ar2.html (data obrashhenija 01.11.2010)
3. Manzhula V.G., Fedyashov D.S. Kohonen neural networks and fuzzy neural networks in data mining. Fundamental research. №4. 2011. pp.108-114.
4. Kruglov I.A., Mishulina O.A., Shumskij B.E. Primenenie nejrosetevyh struktur dlja modelirovanija prostranstvennogo polja jenergovydelenija v aktivnoj zone VVJeR-1000. Nauchnaja sessija MIFI. 2009. Tom 1. S. 69.
5. Wahid H., Ha Q.P., Duc H., Azzi M. Neural network-based meta-modelling approach for estimating spatial distribution of air of air pollution levels. Applied Soft Computing. 2013, vol. 13, no. 10, pp. 4087-4096.
6. Haritonova L.P. On the issue of mathematical modeling for competitive advantages of university graduates and intensification of brain activity, including the study of higher mathematics.ISJ theoretical & applied science. 2016, issue 2, volume 34, pp. 164-171. soi: http://s-o-i.org/L1/tas-02-34-22 doi: http://dx.doi.org/10.15863/tas.2016.02.34.22
7. Haritonova L.P. The issue of mathematical modeling motivation in the study of different processes. International research journal. 2016. № 3 (45). P. 2 . pp. 91-93 . doi: 10.18454/irj.2016.45.031.
DOI: 10.18454/IRJ.2016.50.221 Шайдук А.М.1, Останин С.А.2, Семёнов Г.А.3
1 Доктор физико-математических наук, Алтайский государственный медицинский университет,
2кандидат физико-математических наук, Алтайский государственный университет, ООО "АГФЗ",
3кандидат физико-математических наук, Санкт-Петербургский государственный аграрный университет РЕЙТИНГ КАК СЛЕДСТВИЕ ПРИНЦИПА МАКСИМУМА ЭНТРОПИИ
Аннотация
Для математического моделирования сложной социальной системы использованы методы статистической физики. Аналитически доказано, что рейтинг преподавателей учебных заведений определяется принципом максимума энтропии. Нормированные рейтинговые кривые имеют вид распределения Больцмана. По величине отклонения рейтинговой кривой от распределения Больцмана можно количественно оценивать величину управляющего воздействия на элементы системы. Анализ рейтинговой кривой в полулогарифмическом масштабе позволяет обнаружить скрытую структуру системы - определять количество подсистем и их статистические характеристики.
Ключевые слова: рейтинг, управление сложными системами, методы статистической физики.
Shayduk A.M.1, Ostanin S.A.2, Semenov G.A.3
1PhD in Physics and Mathematics, Altai state medical university; 2PhD in Physics and Mathematics, Altai state university; 3PhD in Physics and Mathematics, Saint-Petersburg state agrarian University RATING AS A CONSEQUENCE OF MAXIMUM ENTROPY PRINCIPLE
Abstract
For the mathematical modeling of complex social systems used methods of statistical physics. Analytically proved that the rating of teachers of educational institutions is determined by the principle of maximum entropy. Standardized rating curve has the form of the Boltzmann distribution. The magnitude of deviations from the Boltzmann distribution curve rating may be quantified amount of control to the system elements. Analysis of the rating curve in the semi-log scale allows you to discover the hidden structure of the system - to determine the number of subsystems and their statistical characteristics.
Keywords: rating, control of complex systems, methods of statistical physics.
Вариационные ряды часто являются исходным объектом исследования случайных величин методами статистики [1-4]. Естественным образом вариационные ряды получаются при построении различных рейтингов [5-8].
Для целей анализа управляющих воздействий представляют интерес следующие вопросы. Влияют ли процессы управления на вид рейтинговой кривой? Какими процессами определяется вид рейтинговой кривой и можно ли эту кривую получить теоретически?
Основанием для подобных вопросов служит любопытное совпадение. На рисунке 1а приведён безразмерный рейтинг преподавателей одного из университетов, который представляет собой вариационный ряд, упорядоченный по убыванию некоторой характеристики - баллов, количественно характеризующих интеллектуальные ресурсы, созданные преподавателем. А на рисунке 1б представлен безразмерный ранжированный по убыванию значений компонент спектр случайного сигнала (нормального шума). Видно, что эти кривые практически совпадают, хоть и порождаются совершенно различными физическими и социальными процессами.