BECTHMK 11/2013
MfCY_11/2013
References
1. Goncharov A.K., Kozeychuk V.A., Naryshkin D.A. Opyt nablyudeniy za stroitel'stvom vysotnykh zdaniy [Observation Experience of High-Rise Buildings Construction]. Stroitel'nye materialy [Construction Materials]. 2009, no. 5, pp. 65—67.
2. Bayburin A.Kh. Metodika otsenki kachestva vozvedeniya kirpichnykh zdaniy [Method of Quality Evaluation of Brick Building Erection]. Vestnik Yuzhno-Ural'skogo gosudarstvenno-go universiteta. Seriya: Stroitel'stvo i arkhitektura [Proceedings of South Ural State University. Series: Construction and Architecture]. 2009, no 35 (168), pp. 24—27.
3. Davidyuk A.A. Analiz rezul'tatov obsledovaniya mnogosloynykh naruzhnykh sten mnogoetazhnykh karkasnykh zdaniy [Analysis of the Study Results of Multilayer External Walls of Multistory Frame Buildings]. Zhilishchnoe stroitel'stvo [House Construction]. 2010, no 6, pp. 21—26.
4. Ivanova N.N., Zholobova O.A. Predlozheniya po rasshireniyu oblasti primeneniya tsi-frovoy fotografii pri otsenke sostoyaniya stroitel'nykh konstruktsiy [Proposals to Expand the Application Field of Digital Photography in the Process of State Estimation of Building Structures]. Naukovedenie [Science Studies]. 2012, no. 3. Available at: http://naukovedenie.ru/ sbornik12/12-95.pdf. Date of access: 16.09.2013.
5. Gonzalez R.C., Woods R.E. Digital Image Processing, 3rd ed. Prentice Hall, 2008, 954 p.
6. Brusser M.I., Ershov I.D. Zavisimost' tsveta dekorativnogo betona ot osnovnykh tekh-nologicheskikh faktorov pri ego proizvodstve [The Dependence of Decorative Concrete Color on the Main Technological Factors during its Production]. Beton i zhelezobeton [Concrete and Reinforced Concrete]. 2004, no 4, pp. 12—14.
7. Kol'tsov P.P. Sravnitel'noe izuchenie algoritmov vydeleniya i klassifikatsii tekstur [Comparative Study of the Algorithms for Extraction and Classification of Textures]. Zhurnal vychislitel'noy matematiki i matematicheskoy fiziki [Journal of Computational Mathematics and Mathematical Physics]. 2011, vol. 51, no. 8, pp. 1561—1568.
8. Drimbarean A., Whelan P.F. Experiments In Colour Texture Analysis. Pattern Recognition Letters. 2001, vol. 22, no 10, pp. 1161—1167.
9. Yang S., Hung C. Texture Classification in Remotely Sensed Images. Proceedings of the IEEE Southeast Conference. 2002, pp. 62—66.
10. Milani G., Lourengo P.B. A Simplified Homogenized Limit Analysis Model for Randomly Assembled Blocks Out-of-plane Loaded. Computers & Structures. 2010, vol. 88, no. 11—12. pp. 690—717.
About the author: Zholobova Ol'ga Aleksandrovna — Assistant, Department of Economics and Management In Construction, Rostov state university of civil engineering (RGSU), 162 Sotsialisticheskaya st., Rostov-on-Don, 344022, Russian Federation; olga@ rgsu.ru.
For citation: Zholobova O.A. Proizvodstvennyy kontrol' kachestva kamennykh sten i drugikh ograzhdayushchikh konstruktsiy zdaniy po fotograficheskim izobrazheniyam [Manufacturing Quality Control of Stone Walls and Other Enclosing Structures of Buildings Based on Photographic Images]. Vestnik MGSU [Proceedings of Moscow State University of Civil Engineering]. 2013, no. 11, pp. 234—240.
УДК 624.01
В.В. Козырева, А.А. Волков
ФГБОУВПО «МГСУ»
МОДЕЛЬ АГЕНТА С АДАПТИВНЫМ ПОВЕДЕНИЕМ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ВАРИАНТНОГО ПРОЕКТИРОВАНИЯ СТРОИТЕЛЬНЫХ КОНСТРУКЦИЙ
В настоящее время среди поисковых методов параметрической оптимизации строительных конструкций особое место занимают бионические методы, основанные на адаптивном поведении живых организмов. Они рассматривают оптимальное проектирование конструкций как процесс целенаправленного адаптивного поведения коллектива агентов. Модели таких агентов состоят из внутренней и внешней среды, а их поведение реализуется как реакция на смену внутреннего состояния на основе построения наилучшей стратегии действий.
Ключевые слова: вариантное проектирование конструкций, параметрическая оптимизация, адаптивное поведение, агент, многоагентный подход.
Вариантное проектирование является методом оптимального проектирования конструкций на конечном дискретном множестве вариантов (альтернатив). Данное множество можно представить в форме И-ИЛИ-дерева, а решение задачи оптимизации как процесс поиска по данному дереву. В этом случае оптимизация представляет собой параметрический синтез модели строительной конструкции. Как показала практика, наиболее эффективными в настоящее время поисковыми методами являются методы случайного поиска, в особенности, бионические — основанные на реализации процессов эволюции, генетических изменений и поискового и приспособительного поведения животных. Последние из них носят название «адаптивное поведение».
Основной подход данного направления заключается в построении и исследовании искусственных «организмов», способных приспосабливаться к внешней среде [1—3]. Эти организмы называются аниматами (от англ. Animal + + robot = animat). Часто используют также близкий термин «агент», подразумевая под ним модельный искусственный организм [4].
Агент, согласно [5, 6], формирует свое поведение как реакцию на воздействия со стороны внешней среды. При этом процесс принятия решений может выражаться как в форме обычной базы правил, организованной в виде простой нейронной сети, так и сложного процесса, состоящего из ступеней изучения, планирования, оценки стратегии поведения с точки зрения получения наибольшей выгоды (как при методе обучения с подкреплением [7]) или основанный на цепочке вера — убеждение — намерение (как в случае BDI-агентов [6]).
С помощью агентов можно реализовать и решение задачи оптимизации строительной конструкции, представив последнюю в форме коллектива элементарных «организмов». В этом случае целевые функции задачи оптимизации (например, минимум объема конструкции) и ограничения могут быть представлены в двух уровнях (элементном и системном). Достижение целей и ограничений элементного уровня будут положены в основу первичных мо-
ВЕСТНИК
МГСУ-
11/2013
тивации поведения элементарных агентов, а реализация целей и выполнение ограничений системного уровня будут достигнуты за счет организации коллективного поведения.
Рассмотрим подробнее модель элементарного агента.
Согласно теории агентов и многоагентных систем любой агент имеет внутреннюю и внешнюю среду [6, 8]. Внешняя среда выражается через значения узловых напряжений и перемещений, возникающих в элементе. Состояние окружающей сред ы описывается как вектор
E = {M, Q, N, Z},
где M, Q, N — соответственно максимальные значения изгибающего момента, поперечной и продольной силы, получаемые в узлах элемента; z — вектор узловых перемещений элемента.
Внутренняя среда организована в форме совокупности нескольких блоков [6, 8] (рис. 1):
1) сенсоров, воспринимающих сигналы о состоянии внешней среды;
2) блока восприятия;
3) блока принятия решений;
4) памяти;
5) блока действий (или актора, англ. actor);
6) эффекторов, воздействующих на внешнюю среду.
Рис. 1. Абстрактная схема агента
На основе входного сигнала о состоянии окружающей среды (£(0), получаемого сенсорами, в блоке 2 формируется восприятие агента (Р(0) в форме интегральной логической функции выполнения ограничений для /-го элемента, принимающей значение 1, если все ограничения выполнены, и 0 — в противном случае. По значению функции определяется состояние агента S, имеющее два значения, как и восприятие.
т Г1, все условия выполнены;
5(0 = Фм(0 = п Ф' Н„
'=1 [0, в противном случае.
В зависимости от значения состояния агента (5"(/)) в блоке 3 происходит процесс выбора наиболее подходящего в данный момент действия (А(/)) из множества действий, которыми обладает агент и хранимыми в блоке 5.
S(t) ^ A(t).
В процессе принятия решений принимает участие память. Согласно [8], в памяти выделяют три области: область хранения информации о состоянии организма, область хранения данных о положении и состоянии эффекторов и область, содержащую информацию о внешнем мире (модель среды).
Общее поведение агента, как и живого существа, носит гомеостатический характер [9—12], т.е. нацелено на поддержание определенного состояния агента (в случае строительной конструкции им является S = 1). Кроме того, данное поведение также должно удовлетворять потребностям рассматриваемого организма, выражаемым в форме мотиваций. Такими мотивациями могут выступать следующие цели:
достижения цели Фэл (t) ^ 1 ; достижения цели Уэл ^ 1.
При этом мотивация 1 является гомеостатическим параметром агента и имеет больший приоритет, чем мотивация 2. Ее можно сравнить с элементарными инстинктами сохранения жизни у живых организмов.
Данные мотивации определяют процесс управления агентом, который согласно теории функциональных систем П.К. Анохина [13] и работе [5], можно изобразить в виде схемы, приведенной на рис. 2.
Рис. 2. Общая схема управления адаптивным поведением агента
В зависимости от ситуации (действующей цели (мотивации)) агент может выполнять определенный набор действий:
М1(5 = 0) = {А0,А Т); М 2( 5 = 1) = {А0 ,А±),
где А0 — значения регулируемых параметров элемента остаются без изменений; А| — значение регулируемого параметра элемента увеличивается; А[ — значение регулируемого параметра элемента уменьшается.
ВЕСТНИК 11/2013
МГСУ_11/2013
Процесс выбора действия, совершаемый агентом на основе мотиваций, представляет собой финитный марковский процесс (МППР), который удобно представить в форме схемы переходов (рис. 3).
Рис. 3. Граф переходов для элементного агента
Согласно МППР и теории обучения с подкреплением, каждому действию соответствует вероятность осуществления перехода в некоторое состояние и вознаграждение за осуществленный переход. При этом вознаграждение может иметь положительное значение (поощрение) и отрицательное (штраф). Таким образом цель агента выражается в максимизации суммарной награды, которую можно получить в будущем в течение длительного периода времени.
В процессе обучения агент формирует свою оценку суммарной награды и совершенствует ее. Для получения значения оценки используется уравнение оптимальности Беллмана, а также модель среды. Она реализуется в форме некоторой функции, описывающей зависимость + 1) от пары {5"(/), А(/)} и являющейся по сути аппроксиматором функции внешней среды. Модель среды позволяет прогнозировать возможное состояние, в которое перейдет агент при совершении выбранного действия, и тем самым осуществляет краткосрочное планирование стратегии поведения.
Окончательный выбор действия из множества возможных осуществляется по значениям рассчитанных оценок на основе выбранного алгоритма («жадного» или «е-жадного»).
На этом завершается процесс принятия решения внутри агента. Далее действие выполняется и с помощью эффекторов вырабатывается соответствующий сигнал, посылаемый во внешнюю среду.
Во внешней среде происходит перерасчет значений параметров, составляющих ее состояние, а также вырабатывается оценка действий агента в форме «реального» вознаграждения. При этом с помощью данной оценки осуществляется и контроль за выполнением целенаправленного поведения группы агентов. Если поведение коллектива выходит за рамки назначенного общего системного закона поведения, то на всю группу налагается штраф, прибавляемый к локальной оценке действий отдельного агента.
Представленная модель элементарного агента и его среды показывает, как можно решить задачу оптимизации сложной системы с использованием основных методов теории адаптивного поведения и управления.
Библиографический список
1. Meyer J.-A., Wilson S.W. (Eds) From Animals to Animats. Proceedings of the First International Conference on Simulation of Adaptive Behavior (Complex Adaptive Systems). Cambridge, Massachusetts, London, England, The MIT Press, 1990.
2. Непомнящих В.А. Аниматы как модель поведения животных // Нейроинформати-ка — 2002 : IV Всеросс. науч.-техн. конф. М. : МИФИ, 2003. С. 58—76.
3. Непомнящих В.А. Поиск общих принципов адаптивного поведения живых организмов и аниматов // Новости искусственного интеллекта. 2002. № 2. С. 48—53.
4. Редько В.Г. From Animal to Animat — направление исследований «адаптивное поведение» // От моделей поведения к искусственному интеллекту / под ред. В.Г. Редько. 2-е изд. М. : КомКнига, 2010. 456 с.
5. Городецкий В.И., Грушинский М.С., Хабалов А.В. Многоагентные системы (обзор) // Новости искусственного интеллекта. 1998. № 2. С. 64—116.
6. Wooldridge M., Michael J. An Introduction to MultiAgent Systems. 2nd ed., by John Wiley & Sons, 2009, 484 p.
7. Саттон Р.С., Барто Э.Г. Обучение с подкреплением / пер. с англ. М. : БИНОМ, Лаборатория знаний, 2012. 400 с.
8. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика. М. : Эдиториал УРСС, 2002. 352 с.
9. ВолковА.А. Гомеостат в строительстве: системный подход к методологии управления // Промышленное и гражданское строительство. 2003. № 6. С. 68.
10. Волков А.А. Основы гомеостатики зданий и сооружений // Промышленное и гражданское строительство. 2002. № 1. С. 34—35.
11. Волков А.А. Гомеостат строительных объектов. Часть 3. Гомеостатическое управление // Строительные материалы, оборудование, технологии XXI века. 2003. № 2. С. 34—35.
12. Волков А.А., Вайнштейн М.С., Вагапов Р.Ф. Расчеты конструкций зданий на прогрессирующее обрушение в условиях чрезвычайных ситуаций. Общие основания и оптимизация проекта // Вестник МГСУ 2008. № 1. С. 388—392.
13. Анохин П.К. Принципиальные вопросы общей теории функциональных систем // От моделей поведения к искусственному интеллекту / под. ред. В.Г. Редько. 2-е изд. М. : КомКнига, 2010. 456 с.
Поступила в редакцию в ноябре 2013 г.
Об авторах: Козырева Виктория Викторовна—аспирант кафедры информационных систем, технологий и автоматизации в строительстве, ФГБОУ ВПО «Московский государственный строительный университет» (ФГБОУ ВПО «МГСУ»), 129337, г. Москва, Ярославское шоссе, д. 26, [email protected];
Волков Андрей Анатольевич — доктор технических наук, профессор, первый проректор, заведующий кафедрой информационных систем, технологий и автоматизации в строительстве, ФГБОУ ВПО «Московский государственный строительный университет» (ФГБОУ ВПО «МГСУ»), 129337, г. Москва, Ярославское шоссе, д. 26, [email protected].
Для цитирования: Козырева В.В., Волков А.А. Модель агента с адаптивным поведением для решения задачи вариантного проектирования строительных конструкций // Вестник МГСУ 2013. № 11. С. 241—247.
BECTHMK 11/2013
MfCY_11/2013
V.V. Kozyreva, A.A. Volkov
AGENT MODEL WITH ADAPTIVE BEHAVIOR FOR THE PROBLEM SOLUTION OF TRIAL DESIGN OF CONSTRUCTIONS
Nowadays among searching methods of parametric optimization of constructions the special place is held by the bionic methods based on adaptive behavior of living organisms. These methods are called "adaptive behavior" and can be applied to a problem of optimization of constructions. In this case the process of task solution represents purposeful behavior of a group of agents, governed by a goal — the criterion of optimization. Each agent of the considered collective represents a model of an artificial organism. It consists of external and internal environment. The external environment is expressed through the values of nodal voltage and displacements that occur in an element. The internal environment consists of six functional blocks. The main characteristic of the internal environment of an agent is the condition of the agent. It is expressed through a logical function of all restrictions performance, it is equal to 1 if all the conditions are satisfied, and 0 — otherwise. The considered conditions of the agent express motives of its behavior: the intention to succeed optimization (a minimum of a construction volume) and the intention to keep load bearing capacity of a construction. Possible actions of the agent that express a choice of section size of an element correspond to motives. The process of choosing actions on the basis of two motivations represents the finite Markov process. It can be carried out by means of a reinforcement learning method. In this method the agent earns some reward for each action (positive or negative). The goal of the agent's behavior is to maximize the total reward. The agent makes an assessment of each action for planning the behavior strategy. The choice of the behavior strategy is carried out on the basis of this assessment. As all goals of agents are connected by all-system law of behavior, it allows to carry out purposeful behavior and to optimize the construction.
Key words: trial design of constructions, parametric optimization, adaptive behavior, agent, multiagent systems.
References
1. Meyer J.-A., Wilson S.W., editors. From Animals to Animats: Proceedings of the First International Conference on Simulation of Adaptive Behavior (Complex Adaptive Systems). Cambridge, Massachusetts, London, England, the MIT Press, 1990.
2. Nepomnyashchikh V.A. Animaty kak model' povedeniya zhivotnykh [Animats as the Model of Animal Behavior]. Neyroinformatika — 2002: IV Vserossiyskiyskaya nauchno-tekhnicheskaya konferentsiya [Neuroinformatics — 2002: the 4th All-Russian Scientific and Technical Conference]. Moscow, MIFI Publ., 2003, pp. 58—76.
3. Nepomnyashchikh V.A. Poisk obshchikh printsipov adaptivnogo povedeniya zhivykh organizmov i animatov [Searching for the General Principles of Adaptive Behavior of Living Organisms and Animats]. Novosti iskusstvennogo intellekta [News of Artificial Intelligence]. 2002, no. 2, pp. 48—53.
4. Red'ko V.G. From Animal to Animat — napravlenie issledovaniy «adaptivnoe povede-nie» [From Animal to Animat — the Line of Research "Adaptive Behavior"]. Ot modeley povedeniya k iskusstvennomu intellektu [From Behavior Models to Artificial Intelligence] Moscow, KomKniga Publ., 2010, 456 p.
5. Gorodetskiy V.I., Grushinskiy M.S., Khabalov A.V. Mnogoagentnye sistemy (obzor) [Multiagent Systems (review)]. Novosti iskusstvennogo intellekta [News of Artificial Intelligence]. 1998, no. 2, pp. 64—116.
6. Wooldridge M., Michael J. An Introduction to MultiAgent Systems. 2nd ed. John Wiley & Sons, 2009, 484 p.
7. Satton R.S., Barto E.G. Obuchenie s podkrepleniem [Reinforcement Learning]. Moscow, BINOM, Laboratoriya znaniy Publ., 2012, 400 p.
8. Tarasov V.B. Ot mnogoagentnykh sistem k intellektual'nym organizatsiyam: filosofiya, psikhologiya, informatika [From Multiagent Systems to Intellectual Organizations: Philosophy, Psychology, Informatics]. Moscow, Editorial URSS Publ., 2002, 352 p.
9. Volkov A.A. Gomeostat v stroitel'stve: sistemnyy podkhod k metodologii uprav-leniya [Homeostat in construction: a systems approach to management methodology]. Promyshlennoe i grazhdanskoe stroitel'stvo [Industrial and civil construction]. 2003, no. 6, p. 68.
10. Volkov A.A. Osnovy gomeostatiki zdaniy i sooruzheniy [Fundamentals of Homeostatic Buildings and Structures]. Promyshlennoe i grazhdanskoe stroitel'stvo [Industrial and civil Engineering]. 2002, no. 1, pp. 34—35.
11. Volkov A.A. Gomeostat stroitel'nykh ob"ektov. Chast' 3. Gomeostaticheskoe uprav-lenie [Homeostat of Construction Projects. Part 3. Homeostatic Management]. Stroitel'nye materialy, oborudovanie, tekhnologii XXI veka [Building Materials, Equipment, Technologies of the 21st century]. 2003, no. 2, pp. 34—35.
12. Volkov A.A., Vaynshteyn M.S., Vagapov R.F. Raschety konstruktsiy zdaniy na pro-gressiruyushchee obrushenie v usloviyakh chrezvychaynykh situatsiy. Obshchie osnovani-ya i optimizatsiya proekta [Design Calculations for the Progressive Collapse of Buildings in Emergency Situations. Common Grounds and Project Optimization]. Vestnik MGSU [Proceedings of Moscow State University of Civil Engineering]. 2008, no. 1, pp. 388—392.
13. Anokhin P.K. Printsipial'nye voprosy obshchey teorii funktsional'nykh sistem [Fundamental Questions of the General Theory of Functional Systems]. Ot modeley pove-deniya kiskusstvennomu intellektu [From Behavior Models to Artificial Intelligence]. Moscow, KomKniga Publ., 2010, 456 p.
About the authors: Kozyreva Viktoriya Viktorovna — postgraduate student, Moscow State University of Civil Engineering (MGSU), 26 Yaroslavskoe shosse, Moscow, 129337, Russian Federation; [email protected];
Volkov Andrey Anatol'evich — Doctor of Technical Sciences, Professor, Vice-Rector for Research, Chair, Department of Information Systems, Technology and Automation in Civil Engineering, Moscow State University of Civil Engineering (MGSU), 26 Yaroslavskoe shosse, Moscow, 129337, Russian Federation; [email protected].
For citation: Kozyreva V.V.,Volkov A.A. Model' agenta s adaptivnym povedeniem dlya resheniya zadachi variantnogo proektirovaniya stroitel'nykh konstruktsiy [Agent Model with Adaptive Behavior for the Problem Solution of Trial Design of Constructions]. Vestnik MGSU [Proceedings of Moscow State University of Civil Engineering]. 2013, no. 11, pp. 241—247.