Architecture and Modern Information Technologies. 2023. №2(63). С. 298-315 ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И АРХИТЕКТУРА
Научная статья
УДК/UDC 72.021.23:004.9
DOI : 10.24412/1998-4839-2023-2-298-315
Использование вычислительного проектирования и искусственного интеллекта при моделировании архитектурных объектов
Эмиль Альмирович Акшов1
Московский архитектурный институт (государственная академия), Москва, Россия [email protected]
Аннотация. В статье приведена общая характеристика методов вычислительного проектирования. Особое внимание уделено генеративному моделированию, развивающемуся в трёх направлениях: алгоритмического, нодового параметрического и нейросетевого моделирования. Дается обзор наиболее популярных и широко используемых в архитектуре и дизайне инструментов искусственного интеллекта, а именно - сверточных нейронных сетей (CNN), рекуррентных нейронных сетей (RNN), генеративно-состязательных сетей (GAN) и нейронных полей свечения (NeRF). Обосновываются основные принципы применения каждого инструмента, а также преимущества и ограничения их использования в архитектурном проектировании. Статья сопровождается схемами применения нейронных сетей в личной практике автора. Рассматриваются этические и социальные последствия использования вычислительного проектирования и искусственного интеллекта в архитектуре, такие как изменения творческого процесса создания архитектурных концепций.
Ключевые слова: генеративное моделирование, искусственный интеллект, нейронные сети, архитектурное проектирование
Для цитирования: Акшов Э.А. Использование вычислительного проектирования и искусственного интеллекта при моделировании архитектурных объектов // Architecture and Modern Information Technologies. 2023. №2(63). С. 298-315. URL: https://marhi.ru/AMIT/2023/2kvart23/PDF/19 akshov.pdf DOI: 10.24412/1998-4839-2023-2298-315
INFORMATION TECHNOLOGIES AND ARCHITECTURE
Original article
Actual methods of computational design and artificial intelligence in the modeling of architectural objects
Emil A. Akshov1
1Moscow Architectural Institute (State Academy), Moscow, Russia [email protected]
Abstract. The article provides a general description of computational design methods. Special attention is paid to generative modeling, which develops in three directions: algorithmic, node parametric and neural network modeling. An overview of the most popular and widely used artificial intelligence tools in architecture and design is given, namely convolutional neural networks (CNN), recurrent neural networks (RNN), generative-adversarial networks (GAN) and neural glow fields (NeRF). The basic principles of application of each tool, as well as the advantages and limitations of their use in architectural design are substantiated. The article is
1 © Акшов Э.А., 2023
accompanied by diagrams of the use of neural networks in the personal practice of the author. The ethical and social consequences of the use of computational design and artificial intelligence in architecture, such as changes in the creative process of creating architectural concepts, are considered.
Keywords: generative modeling, artificial intelligence, neural networks, architectural design. For citation: Akshov E.A. Actual methods of computational design and artificial intelligence in the modeling of architectural objects. Architecture and Modern Information Technologies, 2023, no. 2(63), pp. 298-315. Available at: https://marhi.ru/AMIT/2023/2kvart23/PDF/19 akshov.pdf DOI : 10.24412/1998-4839-2023-2-298-315
В настоящее время быстро развиваются методы вычислительного проектирования архитектурных объектов, которые существенно изменяют характер работы архитекторов. Используя современные технологии, проектировщики могут создавать цифровые модели зданий и сооружений, проводить компьютерное моделирование и анализ конструкций, а также получать данные об энерго- и экономической эффективности проектируемого объекта. Корректное использование таких методов позволяет при ускорении процесса проектирования повышать его качество и точность создаваемых моделей будущих архитектурных объектов, улучшать характеристики и комфортность строящихся зданий. Вычислительное проектирование предоставляет архитекторам возможность увеличить широту охвата данных и сформировать более точные и детальные модели, на основании которых на следующих стадиях проектирования происходит выпуск рабочих чертежей.
Специалисты, не использующие возможности вычислительного проектирования, оказываются в невыигрышной позиции, так как проектирование без применения современных технологий занимает больше времени и требует большего количества ресурсов. Используя методы вычислительного проектирования, архитекторы могут быстро и качественно реагировать на запросы заказчиков или конкурсные предложения, что приводит к увеличению конкурентоспособности архитектурных мастерских. В настоящее время вычислительное проектирование становится неотъемлемой частью профессии архитектора.
Виды вычислительного проектирования
Вычислительное проектирование - это совокупность методов создания архитектурных объектов, которые включают в себя различные инструменты и технологии, используемые для создания проектов в цифровой среде. Существует несколько видов вычислительного проектирования, каждый из которых имеет свои особенности и применяется в различных сферах архитектурной практики.
Вычислительный (computing) подход - общее понятие, основанное на использовании цифровых технологий в архитектуре в целом. Например, использование AutoCAD или Photoshop для архитектурных задач без алгоритмической логики - это «computing design» или вычислительное проектирование, но создание вариативного алгоритма на базе любой компьютерной программы — это «generative design» или генеративное (создающее) проектирование. С переходом на компьютерные программы весь процесс проектирования уже может быть назван вычислительным.
Для дальнейшего рассмотрения вопроса необходимо еще раз уточнить различие определений вычислительного подхода и генеративного, как одного из его видов. Так, например, в статье «Вычислительное проектирование как средство формирования архитектурного объекта» А.А. Кривенко, В.К. Мора и А.Г. Гаврилова [1] вычислительное проектирование рассматривается в двух направлениях: 1) изменение параметров в
геноме2 - прямое воздействие на конечный результат проектирования; 2) использование эволюционных алгоритмов с получением непредсказуемого результата. Второе направление авторы называют генеративным. В данном случае проблема терминологии связана с переводом с английского на русский язык. С точки зрения определения, предложенного общими интернет-ресурсами3, 1 и 2 пункты являются генеративным моделированием. Автор статьи придерживается мнения о том, что генеративное моделирование, являясь общим принципом, включает в себя алгоритмическое, параметрическое, а также моделирование с помощью нейросетей.
Генеративное моделирование как один из видов вычислительного проектирования зародилось в 2000-х годах. Сегодня оно развивается в трёх направлениях: алгоритмическое моделирование (написание кода), нодовое параметрическое моделирование, моделирование с помощью нейросетей. В целом, генеративное моделирование представляет собой метод, основанный на использовании алгоритмов и правил для создания цифровых моделей, способных изменяться и развиваться согласно заданному алгоритму или параметрам, определенным пользователем. Этот метод позволяет создавать модели, которые могут быть оптимизированы для определенных целей, например, для улучшения эффективности использования энергии или для создания более эргономичной среды для жизни и работы людей. В этом случае результат работы будет предсказуем, но если добавить степени свободы для значений параметров, то архитектурная модель может развиваться «самостоятельно», подчиняясь сформированным правилам.
Такие компании, как BIG (Bjarke Ingels Group) и Zaha Hadid Architects, 3XN успешно используют генеративный дизайн для своих проектов. Это позволяет им создавать инновационные и эффективные решения, оптимально сочетающие функциональность и эстетику проектируемых объектов.
Архитекторы BIG (Bjarke Ingels Group) применяли алгоритмическое моделирование при проектировании «The Twist» - здания-моста, соединяющего два корпуса музея в норвежском городе Кисте (рис. 1). Алгоритмы использовались для создания сложных криволинейных форм, ставших основой для металлического обрамления здания. The Twist - это музей современного искусства, расположенный в скульптурном парке Kistefos в Норвегии. Извилистая скульптурная форма здания была найдена с помощью технологии генеративного дизайна, которая учитывала естественный ландшафт местности и функциональные требования музея. Проект был разработан на основе параметрической модели, которая позволила исследовать различные варианты решений и оптимизировать производительность здания. Использование генеративного дизайна позволило BIG создать здание, которое не только функционально, но и визуально уникально, гармонично вписывается в окружающую среду и является произведением архитектурного искусства.
Центр Гейдара Алиева - это культурный центр, расположенный в г. Баку, Азербайджан (рис. 2). Он был спроектирован известной архитектурной фирмой Zaha Hadid Architects и завершен в 2012 году. Плавная, органичная форма здания была создана с использованием передовых технологий генеративного проектирования, которые учитывают уникальные условия участка, функциональные требования и критерии производительности. На основе программного обеспечения (Rhino/Grasshopper, Autodesk Maya, Autodesk Revit) архитекторы проектировали сложные кривые формы и управляли параметрами здания, такими как высота, ширина и длина различных архитектурных элементов (стены, окна,
2 Геном - в параметрическом дизайне геномом называется набор параметров или переменных, определяющих конкретный дизайн или систему. Его можно представить как генетический код, который определяет характеристики и поведение дизайна или системы. Геном в параметрическом дизайне обычно включает входные параметры, такие как размеры, свойства материалов и условия окружающей среды, а также параметры дизайна, такие как геометрия, форма и структура объекта проектирования. Изменяя эти параметры, архитекторы могут создавать и исследовать различные варианты и вариации архитектуры (определение автора).
3 Генеративный дизайн. URL: https://en.wikipedia.org/wiki/Generative design
проемы, перекрытия, элементы отделки и т.д.). В культурном центре расположено множество объектов, включая конференц-центр, музей и библиотеку. Проект получил множество наград за инновационный подход и поразительный визуальный образ. Центр Гейдара Алиева считается достопримечательностью современной архитектуры города Баку и ярким примером использования генеративного дизайна для создания сложных и инновационных форм, отвечающих конкретным контекстуальным и функциональным требованиям.
Рис. 1. The Twist, мост-музей, Норвегия, архитектурное бюро BIG, 2019 г.
Ui
Рис. 2. Центр Гейдара Алиева, Баку, Азербайджан, архитектурное бюро Zaha Hadid Architects, 2012 г.
Архитектурная компания 3XN использовала генеративный дизайн в нескольких своих последних проектах. Например, в проектировании Олимпийского дома в г. Лозанна,
Швейцария 3XN использовала AI4 для генерации и оптимизации фасада здания, что привело к уникальному и экологичному дизайну (рис. 3). Olympic House в Лозанне - это главный офис Международного олимпийского комитета. Он создан на основе принципов устойчивости и эффективного потребления ресурсов. Здание имеет множество уникальных архитектурных элементов, таких как крыша с солнечными батареями, фасад с многократно повторяющимся олимпийским символом, а также стеклянный прозрачный элеватор, поднимающийся по центру объекта.
Рис. 3. Olympic House, архитектурное бюро 3XN, 2019 г.
Архитекторы также использовали AI при проектировании других зданий, таких как Quay Quarter Tower в г. Сиднее, Австралия, для оптимизации производительности и энергоэффективности здания (рис. 4). Quay Quarter Tower - это небоскреб, известный своей высокой степенью экологической устойчивости. Здание имеет уникальную фасадную систему, которая регулирует освещение и теплообмен внутри сооружения. Система состоит из стеклянных панелей, которые могут поворачиваться вокруг своей оси, чтобы контролировать количество света и тепла, проходящего через фасадную поверхность. Объект имеет и множество других элементов экосистемы, таких как сбор дождевой воды, солнечные батареи и ветроэнергетические установки.
Рассмотрим отдельно особенности каждого из трех типов генеративного моделирования (алгоритмического моделирования, нодового параметрического моделирования и моделирования с помощью нейросетей). В зависимости от рассматриваемого типа моделей предлагается описать алгоритмы их применения для создания концептуальной модели архитектурного объекта на основе генеративного моделирования для достижения нескольких целей. Во-первых, метод позволяет создать более точную и подробную модель объекта, что может быть полезно для архитекторов и инженеров, работающих над проектированием и строительством различных сооружений. Во-вторых, генеративное
4 AI - Artificial intelligence, наука и технология создания интеллектуальных машин, согласно определению Джон Маккарти, которого многие считают одним из основателей области искусственного интеллекта ("The science and engineering of making intelligent machines, especially intelligent computer programs"). URL: https://en.wikipedia.org/wiki/Artificial intelligence (дата обращения 10.04.2023).
моделирование позволяет быстро вносить изменения в модель, чтобы отразить изменения в проекте или удовлетворить новые требования заказчика.
Рис. 4. Quay Quarter Tower, Сидней, Австралия, архитектурное бюро 3XN, 2022 г.
Данные, которые можно включить в модель, работают на основе геометрии объекта (форма, размеры и пропорции). Кроме того, допускается включение информации о конструкциях, материалах, данных о планировке и расположении помещений, о системах инженерных коммуникаций, освещении, вентиляции и т.д. Вся перечисленная информация может быть использована для создания более точных и полных моделей объектов, чтобы помочь архитекторам и инженерам в работе над проектом.
Описанные методы обладают каждый своими особенностями и отличаются как по формам применения и входным данным, так по тем смысловым процедурам, которые необходимо проходить в процессе работы.
Алгоритмическое моделирование, основанное на написании компьютерного кода - это процесс создания сложных архитектурных форм и конструкций с использованием математических алгоритмов и компьютерного программирования. При таком подходе архитекторы и дизайнеры используют языки программирования, такие как Python, JavaScript или C#, для создания пользовательских алгоритмов, генерирующих сложные проекты и структуры, которые было бы трудно или невозможно создать вручную. Вводя различные условия и ограничения в программу, архитекторы могут генерировать широкий спектр вариантов дизайна и оценивать их эффективность на основе таких критериев, как устойчивость конструкции, энергоэффективность и эстетическая привлекательность. Такой подход позволяет архитекторам выполнять более сложные проекты, оптимизировать производительность и автоматизировать определенные аспекты процесса проектирования и строительства.
Алгоритмическое моделирование основывается на создании процедур и алгоритмов, которые затем могут быть применены для автоматического генерирования архитектурных форм из программного кода. Поскольку процедуры и алгоритмы могут быть написаны на разных языках программирования, это позволяет, с одной стороны автоматизировать определенные задачи и процессы, связанные с проектированием и моделированием
архитектурных объектов, но с другой - усложняет процесс вхождения в технологию для архитекторов и проектировщиков, так как требует дополнительной квалификации в программировании.
Алгоритм создания модели на основе написания кода может быть представлен как ряд последовательных шагов в следующем виде:
1. Определение цели создания модели, ее параметров и характеристик (в данном случае рассматриваются числовые значения: размер, способ описания формы с помощью математики, предполагаемые пропорции формы);
2. Выбор языка программирования, который будет использоваться для создания модели. Наиболее популярны: Python, Java и C++;
3. Написание кода: после того, как определились параметры и выбран язык программирования, можно приступить к написанию кода для 3D-модели. Обычно это связано с использованием библиотек или фреймворков5, специально разработанных для 3й-моделирования, таких как OpenCV или Blender, Rhinoceros, Houdini и др.;
4. Тестирование и доработка: после того, как код для 3D-модели написан, важно тщательно протестировать его, чтобы убедиться, что он работает так, как задумано. Возможно, потребуется внести некоторые коррективы или уточнения в код, чтобы получить желаемый результат;
5. Визуализация финальной модели средствами программной среды.
Для алгоритмического моделирования архитектурных объектов используются специализированные программные средства, которые позволяют описывать геометрические формы, а также определять логику их соединения. В процессе алгоритмического моделирования форма объекта создается с помощью набора математических операций, заданных алгоритмом.
Нодовое параметрическое моделирование является методом создания цифровых моделей, использующим параметры и правила, которые определяют форму, размер и другие характеристики объекта. Этот метод позволяет архитекторам быстро изменять параметры модели для получения различных вариантов проекта, что может быть особенно полезно в случае работы над крупными сооружениями. При таком моделировании дизайнеры используют программное обеспечение, такое как Grasshopper, Dynamo или Houdini для получения сети взаимосвязанных нодов, которые определяют параметры и взаимосвязи модели или системы. Каждый нод представляет собой определенную операцию или функцию (взятую из библиотеки нодов программы), такую как создание геометрии, математические вычисления или анализ данных, и может быть подключен к другим нодам для создания сети зависимостей. Такой подход может облегчить сотрудничество и коммуникацию между членами команды, поскольку визуальный характер узлов нодовой модели облегчает совместное использование и обсуждение проекта с другими специалистами, а также предоставляет новые инструменты создания формы.
Нодовое параметрическое моделирование (Parametric modeling) основывается на создании модели, которая зависит от параметров, определяющих ее форму и характеристики. Параметры могут быть связаны друг с другом и изменяться в соответствии с определенными правилами, что позволяет быстро менять форму и свойства модели. Такой подход особенно полезен для разработки конструктивных систем и повторяемых элементов, таких как оконные блоки или фасадные элементы. В отличие от первого подхода (алгоритмического моделирования) архитектор использует визуальный интерфейс, что облегчает порог вхождения в технологию, а также имеет возможность дополнять его с помощью написания кода по мере необходимости.
5 Фреймворк (англ. framework - «каркас, структура») - готовый набор инструментов, который помогает разработчику быстро создать продукт: сайт, приложение, интернет-магазин, CMS-систему. Академия Яндекса. URL: https://academv.vandex.ru/iournal/chto-takoe-freimvork (дата обращения: 10.04.2023).
Параметрическое моделирование позволяет изменять геометрические параметры модели и получать новые варианты дизайна автоматически. Алгоритм создания параметрической модели включает несколько шагов:
1. Определение проектного замысла объекта: задаются основные параметры, которые будут использоваться в модели;
2. Создание базовой математической геометрии (куб, сфера, цилиндр), которая будет подвергнута параметризации;
3. Параметризация - определяются геометрические параметры модели, которые будут изменяться. Для каждого параметра задается диапазон значений;
4. Создание связей - связи между параметрами и элементами модели устанавливаются таким образом, чтобы изменение значения параметра влияло на геометрию элемента за счет связей параметров между собой;
5. Тестирование и оптимизация - модель тестируется на предмет соответствия требованиям и оптимизируется путем настройки параметров.
В параметрической модели могут быть представлены условия и требования, такие как размеры, формы, расположение элементов, конструктивные особенности, свойства материалов и т.д. Приемы моделирования могут включать использование уравнений и формул, алгоритмов оптимизации, редактирование параметров в соответствующих полях.
Проектирование архитектурных объектов с помощью нейросетей. Особенности проектирования с помощью нейронных сетей связаны с необходимостью более тщательного и глубокого изучения методов моделирования, так как это относительно новая технология в области архитектуры и строительства. Нейронные сети могут использоваться для создания более точных и сложных моделей, но требуют значительного количества данных для обучения, а также определенного уровня подготовки в программировании и алгоритмах машинного обучения.
Языковая модель искусственной нейронной сети (ANNs)6 - это тип модели машинного обучения, созданный по аналогии с работой нейронной структуры человеческого мозга. Поэтому проектирование с помощью нейронных сетей получило общее название «ИИ» -искусственный интеллект. ANNs состоят из большого количества взаимосвязанных обработчиков, узлов или нейронов, организованных в слои. Каждый нейрон получает входные данные от нейронов предыдущего слоя и обрабатывает этот ввод, используя набор изученных весов и смещений. Затем (итог работы) выход каждого нейрона передается нейронам следующего слоя, пока не будет получен конечный результат. ANNs способны учиться сложным нелинейным отношениям между входными и выходными данными и могут быть обучены с использованием различных алгоритмов, таких как обратное распространение ошибки7. ANNs широко используются в таких приложениях, как
6 Искусственные нейронные сети (Artificial Neural Networks, ANN) представляют собой вычислительные системы, вдохновленные биологическими нейронными сетями, из которых состоит мозг животных. Википедия. URL: https://en.wikipedia.org/wiki/Artificial neural network (дата обращения 10.04.2023). Они состоят из множества связанных между собой нейронов, которые обрабатывают информацию и передают ее дальше в сеть. ANNs используются для решения широкого спектра задач машинного обучения, включая классификацию, регрессию, кластеризацию, обработку изображений, обработку естественного языка и многие другие. ANNs обучаются на основе принципа обратного распространения ошибки, который позволяет модели улучшать свои результаты на основе обратной связи от желаемых выходных данных (дополнение автора).
7 Метод обратного распространения ошибки (англ. backpropagation) - метод вычисления градиента, который используется при обновлении весов многослойного перцептрона. Впервые метод был описан в 1974 г. А.И. Галушкиным, а также независимо и одновременно Полом Дж. Вербосом. Далее существенно развит в 1986 г. Дэвидом И. Румельхартом, Дж. Е. Хинтоном и Рональдом Дж. Вильямсом независимо и одновременно С.И. Барцевым и В.А. Охониным (Красноярская группа). Это итеративный градиентный алгоритм, который используется с целью минимизации ошибки работы многослойного перцептрона и получения желаемого выхода. URL: https://en.wikipedia.org/wiki/Backpropagation (дата обращения 10.04.2023).
распознавание изображений и речи, обработка естественного языка и задачи прогнозирования.
Искусственные нейронные сети имеют богатую историю, которая начинается с 1940-х годов, когда Варрен Маккалок и Уолтер Питтс предложили первую модель искусственного нейрона. В следующие десятилетия ученые продолжали исследовать потенциал нейронных сетей, но прогресс ограничивался вычислительной мощностью компьютеров и доступностью данных. В 1980-х годах новые алгоритмы обучения, такие как обратное распространение ошибки, и развитие более быстрых компьютеров возродили интерес к ANNs. Это привело к созданию первых практических приложений нейронных сетей, таких, как системы распознавания рукописного текста. В 1990-х годах были осуществлены дальнейшие прогрессивные достижения в ANNs, включая разработку сверточных нейронных сетей8 (CNN) и рекуррентных нейронных сетей9 (RNN). Эти типы сетей используются для более сложной обработки визуальных и временных данных соответственно.
В 2000-х годах ANNs начали широко использоваться в промышленности, особенно в областях компьютерного зрения и распознавания речи. Появление больших данных и облачных вычислений дополнительно ускорило рост ANNs, позволяя обучать более крупные и сложные модели сетей. Сегодня ANNs являются краеугольным камнем машинного обучения и искусственного интеллекта, обеспечивая широкий спектр приложений, от автономных автомобилей до виртуальных помощников. Дальнейшие исследования в этой области направлены на улучшение эффективности и интерпретируемости нейронных сетей, а также на разработку новых типов вычислительных цифровых систем для конкретных приложений.
Создание модели с помощью нейросетей. В архитектуре выделяются два направления использования нейросетей: генерация 2D изображений с последующим моделированием и генерация 3D контента автоматически. В первом случае возможности технологии ограничиваются только текстовым запросом пользователя. На основе текста нейросеть воспроизводит в 2D любые здания. Для генерации в 3D возможны разные сценарии: 1) нейросеть выдает готовую 3D модель на основе запроса; 2) нейросеть помогает создавать модель с помощью инструкций для создания набора кодов на разных языках программирования по стадиям; 3) нейросеть может быть использована для получения различных данных, влияющих на процесс создания цифровой модели. Этот метод
8 Сверточная нейронная сеть (Convolutional Neural Network, CNN) - специальная архитектура искусственных нейронных сетей, предложенная Яном Лекуном в 1988 году и нацеленная на эффективное распознавание образов, входит в состав технологий глубокого обучения (англ. deep learning). Использует некоторые особенности зрительной коры, в которой были открыты так называемые простые клетки, реагирующие на прямые линии под разными углами, и сложные клетки, реакция которых связана с активацией определённого набора простых клеток. URL: https://en.wikipedia.org/wiki/Convolutional neural network (дата обращения 10.04.2023).
Этот тип глубокой нейронной сети часто используется для анализа и распознавания изображений. Она состоит из множества слоев, взаимосвязанных между собой, где каждый слой выполняет различный тип преобразований над входными данными. В случае анализа изображений входными данными обычно является изображения и CNN может извлекать и изучать особенности изображения, применяя различные фильтры и свертки (дополнение автора).
9 Рекуррентная нейронная сеть (Recurrent Neural Network, RNN) - вид нейронных сетей, где связи между элементами образуют направленную последовательность. Благодаря этому появляется возможность обрабатывать серии событий во времени или последовательные пространственные цепочки. URL: https://en.wikipedia.org/wiki/Recurrent neural network (дата обращения 10.04.2023). Это класс нейронных сетей, которые обрабатывают последовательности данных, такие как тексты, речь, временные ряды и т.д. Он использует циклическую структуру, позволяющую передавать информацию от предыдущих шагов обработки к следующим. Это позволяет RNN обрабатывать последовательности переменной длины и учитывать контекст, что делает ее особенно полезной для задач, связанных с последовательностями. Примерами таких задач могут быть машинный перевод, генерация текста, анализ эмоций и т.д. (дополнение автора).
позволяет создавать модели, которые могут учитывать большое количество данных, таких как топография местности, погодные условия и даже информацию о поведении людей.
Описываемые модели могут быть особенно полезны для проектирования любых зданий городской среды при решении как градостроительных, так и архитектурных задач. Например, через нейросеть возможно запросить или сгенерировать данные по инсоляции. Такая информация актуальна как для фасада строящегося здания, так и для размещения объектов в среде.
Для создания моделей архитектурных объектов с помощью нейросетей используется технология глубокого обучения, которая позволяет моделировать объекты на основе анализа большого количества данных. Для этого нейросеть обучается на основе многочисленных образцов, после чего может создавать новые объекты, исходя из полученных знаний (рис. 5). Этот метод позволяет создавать объекты с высокой степенью детализации и реалистичности, но требует больших вычислительных ресурсов и времени на обучение. Одной из популярных технологией машинного обучения является GAN10.
Обучение нейросети на готовых примерах Результат
Рис. 5. Пример обучения нейросети на базе готовых архитектурных решений и ручной графики
GAN - это тип нейронной сети, состоящей из двух моделей: генератора и дискриминатора. Генератор создает изображения на основе случайного шума, а дискриминатор оценивает созданные изображения и предоставляет обратную связь генератору. Генератор изменяет свой вывод на основе обратной связи от дискриминатора, и процесс повторяется, пока генератор не создаст изображения, которые неотличимы от реальных.
10 GAN (Generative Adversarial Networks) широко используются для моделирования и генерации синтетических данных в различных областях, включая компьютерное зрение, обработку естественного языка, а также архитектуру и дизайн (текст автора).
Порождающие состязательные сети (англ. Generative Adversarial Nets, GAN) - алгоритм машинного обучения, входящий в семейство порождающих моделей и построенный на комбинации из двух нейронных сетей: генеративная модель G, которая строит приближение распределения данных, и дискриминативная модель D, оценивающая вероятность, что образец пришел из тренировочных данных, а не сгенерированных моделью G. Обучение для модели G заключается в максимизации вероятности ошибки дискрминатора D. Впервые такие сети были представлены Иэном Гудфеллоу в 2014 году (определение Википедии).
GAN могут применяться для генерации новых и уникальных образцов данных на основе заданного набора параметров или ограничений. В архитектуре и дизайне GAN могут использоваться для создания новых идей и решений, а также для получения реалистичных изображений архитектурных проектов (рис. 6). Хотя сгенерированные GAN-данные не всегда могут быть абсолютно точными или представлять реальный мир, они могут быть полезным инструментом для исследования и генерации новых возможностей создания архитектурного объекта и для визуализации проектов более реалистичным образом.
Рис. 6. Пример использования GAN технологий для создания изображения современного деревянного дома в лесу, обучение нейросети на основе текстовых запросов
В настоящее время использование нейросетей значительно продвинулось в получении 2D данных, а также текстовых, числовых значений. Тогда как создание 3D моделей находится на начальном, развивающемся уровне. Очевидно, что ИИ имеет потенциал изменить способ создания 3D-моделей в будущем. Один из подходов, который уже исследуется, это работа с генеративно-состязательными сетями (GANs) для создания облаков точек, которые затем можно применить для генерации 3D-моделей. Еще один подход - использование алгоритмов обучения с подкреплением, которые могут научить нейросеть генерировать 3D-модели методом проб и ошибок, основываясь на обратной связи с окружающей средой11. Кроме того, существуют работы по созданию ИИ-инструментов, которые могут автоматически генерировать 3D-модели из 2D-изображений или видео с использованием таких технологий, как фотограмметрия и компьютерное зрение. На примере продолжающегося развития ИИ и машинного обучения мы, вероятно, увидим еще более инновационные способы использования ИИ для создания SD-моделей в будущем.
Особенность работы нейросетей сегодня заключаются в том, что их создатели предоставляют свои облачные сервисы с доступом через браузеры для вычислений. Пользователи, создавая свои запросы, обучают их искусственный интеллект. Так, например, архитектор и аналитик данных Станислас Чайлоу создал свою нейросеть, основанную на GAN-технологии и имеющую узкую специализацию - генерирование
11 Среда - окружение, совокупность природных условий, в которых протекает деятельность человеческого общества, организмов. Географическая с. Охрана окружающей среды. (Ожегов С.И. Словарь русского языка / под общ. ред. Л. И. Скворцова. 28-е изд., перераб. Москва: Мир И образование, 2015. 1375, [1] с.: портр.; 22 см. (Новые словари); ISBN 978-5-94666-657-2).
планировочных решений (рис. 7). Для ее использования необходимо только перейти по адресу12, а затем следовать инструкциям для генерации вариантов.
Рис. 7. Алгоритм GAN технологий, разработанный Станисласом Чайлоу (Stanislas Chaillou) для планировочных решений в своей магистерской диссертации в Harvard Graduate School of Design в 2019 г.
Использование GAN-технологий для создания 3D активно исследует компания NVIDIA. Результаты работы таких сервисов, как Point-E, GET3D (от NVIDIA) позволяют получать простые готовые 3D модели, которые пользователи могут изменять по текстовому запросу. NVIDIA также активно развивает технологии компьютерного зрения, позволяющего переводить фото и видео в 3D - облако точек, с помощью технологий фотограмметрии. Одна из таких технологий, которая сегодня находится на стадии бета-тестирования, разработана Luma Labs - креативной студией, занимающейся дизайном цифровых продуктов и услуг. Их продукт Luma AI - онлайн-сервис на основе искусственного интеллекта для создания и визуализации 3D-контента. Разработчики студии используют технологию NERF13 в своей платформе для генерации реалистичных 3D-моделей из 2D-изображений. Благодаря NERF, платформа Luma AI может создавать
12 URL: http://stanislaschaillou.com/thesis/GAN/unit program/ (дата обращения 30.04.2023).
13 Neural Radiance Fields (нейронные поля свечения), это техника синтезирования 3D-объектов из 2D-изображений с помощью нейронных сетей. Она работает путем обучения нейронной сети предсказывать свечение (яркость) и цвет 3D-объекта с разных точек зрения на основе набора входных изображений. Это позволяет создавать высоко детализированные и реалистичные 3D-объекты из небольшого количества 2D-изображений без необходимости ручного моделирования 3D-объектов. Техника NERF имеет применение в компьютерной графике, виртуальной и дополненной реальности и других областях, где требуется реалистичное 3D-моделирование.
детализированные и точные 3D-модели объектов или сцен из нескольких 2D-изображений без необходимости ручного моделирования. Эта технология позволяет более быстро и эффективно создавать 3D-контент и может применяться в архитектуре и дизайне (рис. 8).
а) б)
Рис. 8. Создание модели макета в 3D с помощью Luma А1, 2023. Захват пространства в 3D, и отделение окружающего фона выполнено также с помощью нейросети: а) нейросеть редактирует захваченное 3D пространство, оставляет только макет постройки; б) 3D модель пространства, общий захват, построение геометрии нейросетью на основе видео
Рассмотрим два способа создание модели с помощью нейросети. Алгоритм №1 - создание модели с помощью нейросети NERF:
1. Создание макета архитектурного объекта;
2. Создание круговых изображений или видео вокруг макета;
3. Выгрузка информации в нейросеть NERF (например, Luma AI) для вычислений;
4. Скачивание полученных результатов в формате для работы с 3D файлами (например, OBJ);
5. Создание архитектурной модели с использование BIM технологий на базе полученной модели.
Алгоритм №2 - создание модели с помощью нейросетей GAN:
1. Подготовка тренировочных данных, которые включают в себя изображения объектов и соответствующие им параметры и характеристики;
2. Создание «промптов» (англ. prompt - запрос) в нейронной сети (общих тематического запросов для дальнейшей работы на базе существующих облачных сервисов GAN вычислений, Midjourney, DALL-E 2 и другие), которые будут обучаться на тренировочных данных, чтобы научиться связывать изображения объектов с их параметрами;
3. Обучение нейросети на тренировочных данных для достижения достаточной точности;
4. Использование обученной нейросети для генерации параметров объекта на основе его изображения;
5. Применение полученных параметров для создания трехмерной модели объекта, или 2D изображений, или текстовых кодов.
Тема использования нейронных сетей в архитектуре получила значительное внимание со стороны исследователей и профессионалов в последние годы. Несмотря на то, что искусственный интеллект может помочь в оптимизации процессов, ускорении и улучшении качества принимаемых решений, необходимо помнить о потенциальных опасностях и ограничениях в использовании ИИ. Ряд научных исследований активно исследуют данную проблематику:
- Исследователи Ала Аль-Хаварнеха, Салахеддин Бендак, Фирас Ганимб из Университета в Шардже в ОАЭ показывают, что нейросети могут генерировать планы зданий, учитывая ограничения, такие как размер участка, количество этажей и требования к помещениям, в статье «Dynamic facilities planning model for large scale construction projects. Automation in Construction» [2].
- Исследование, опубликованное в журнале «International Journal of Architectural Computing», группой ученых из Университета Твенте в Нидерландах: Р.Г. Кипперс, М. Коева, М. Ван Кеулен, С. Дж. Ауде Эльдебринк - демонстрирует использование нейронных сетей для генерации трехмерных моделей зданий на основе двухмерных планов. Исследование показывает, что нейронные сети могут использоваться для генерации точных трехмерных моделей зданий на основе ограниченной информации [3].
- Вопросам использования платформ искусственного интеллекта посвящены работы Ахмед Адель, Ахмед С. Халифа, Мохаммед Ф. Толба и Сальма Т. Эльбехейри «Is Midjourney-Ai the New Anti-Hero of Architectural Imagery & Creativity» [4].
- Нейт Берг «AI tools like DALL-E 2 and MidJourney are helping architects and their clients Design new buildings»14 [5].
Ученые поднимают проблемы делегирования части работы архитектора нейросетям. В частности, рассматриваются такие сети, как DALL-E 2 и Midjourney, которые помогают архитекторам и их клиентам справляться с созданием растровых изображений. При этом существует опасность замены человеческого творческого потенциала и интуиции на ИИ, что может привести к потере инноваций и оригинальности.
По мнению исследователей, использование искусственного интеллекта может быть полезным в различных областях, но необходимо помнить о его ограничениях и потенциальных опасностях. В случае архитектуры, ИИ может помочь архитекторам работать более эффективно, но роль человеческого творчества и интуиции всегда будет иметь определяющее значение в процессе проектирования.
Использование естественного языка запросов перечисленными платформами искусственного интеллекта открывает новые возможности для творчества. Зачастую именно в этом направлении процесс генерации начинает развиваться по собственному сценарию, выбранному нейросетью. Архитектор может получить решения, которые он не предвидел изначально. Такой подход отличается от традиционного поиска, при котором происходит авторское личное переосмысление разных аналогов для использования их в проектном решении.
Приведенные в пример исследования демонстрируют потенциал платформ на базе искусственного интеллекта (Midjourney, DALL-E 2 и аналогичных им), в оказании помощи архитекторам в процессе проектирования. Анализируя миллионы архитектурных проектов и документов, эти платформы могут предоставлять информацию и рекомендации, которые помогают архитекторам генерировать новые идеи и принимать более обоснованные решения (рис. 9). Важно понимать, что творческий процесс идет в этом случае по-другому. Проектировщикам необходимо применять свои креативные способности на уровне
14 Пер. с англ.: «Инструменты искусственного интеллекта, такие как DALL-E 2 и MidJoumey, помогают архитекторам — и их клиентам — проектировать новые здания».
создания текстовых схем, структур, запросов. Чем точнее и яснее архитектор будет выражать свои мысли и идеи, тем лучше будет результат работы с ИИ. Концепция проекта в любом случае исходит от специалиста, а программное обеспечение помогает быстро находить ответы на поставленные вопросы и проводить сравнение многих вариантов решений. Процесс обучения работе с ИИ похож на изучение иностранного языка с той разницей, что общаться специалист учится с программой. Соединение уникальных свойств человеческого интеллекта с возможностями программного обеспечения - это наиболее выигрышный путь создания архитектуры будущего.
ГЕНЕРАЦИЯ 4 ВАРИАНТОВ ВАРИАНТ ДЛЯ ПРОРАБОТКИ
ГЕНЕРАЦИЯ 4 ВАРИАНТОВ ВАРИАНТ ДЛЯ ПРОРАБОТКИ
Рис. 9. Создание изображений деревянного павильона нейросетью Midjpurney, предварительно обученной автором на примерах деревянной архитектуры. Слева генерация четырёх изображений. Справа - итог: два варианта для дальнейшей разработки
Выводы
1. Создание концепций архитектурных объектов на основе алгоритмического, параметрического и нейросетевого моделирования имеет огромный потенциал в проектной сфере. Рассматриваемые методы позволяют архитекторам создавать более сложные и инновационные архитектурные формы, которые были бы невозможны при
использовании традиционных методов. Для исследовательских проектов сформировался полноценный новый инструмент, который не только обращается к огромной базе данных, но и выдает на ее основе возможные решения. В рабочей документации нейросети становятся консультантом с возможностью стать в будущем инструментом, проверяющим и частично исполняющим работу архитектора.
2. Сегодня генеративное моделирование выходит на новый уровень. Описанные в работе три метода постепенно становятся неотъемлемой частью проектного процесса. Создавать построения только с помощью кода - трудоемко. В данном случае на помощь приходит нодовый интерфейс. Нехватка инструментария может дополняться кодом. В свою очередь, использование нейросетей позволяет одновременно творчески и логически решать поставленные задачи в разных сферах деятельности от генерации текста до архитектурного решения, создавая любую цифровую графику.
3. Нейросетевое моделирование позволяет использовать искусственный интеллект для анализа больших объемов данных и выявления скрытых зависимостей и закономерностей. Архитектор в этом случае может лучше понимать потребности клиентов и создавать более эффективные и функциональные здания. Взаимодействие архитектора с нейросетями основано на понятном человеку языке - формировании текстовых запросов. Результат зависит напрямую от качества логического описания: сгенерированные изображения, технические рекомендации, базы данных, коды для моделирования - все это создается в разных бесконечных вариациях.
4. Моделирование с помощью искусственного интеллекта только с помощью текстовых запросов находится на стадии развития. Но ряд вспомогательных технологий (NERF технология, генерация 2D изображений, текстовый консалтинг и другие) уже активно применяются в архитектурном проектировании. На данном этапе развития актуально использовать в проектной и исследовательской практике процесс синергии трех путей развития моделирования с помощью кодов, параметров и нейросетей.
Источники иллюстраций
Рис. 1. URL: https://www.archdaily.com/925106/the-twist-museum-big/5d822967284dd136320000a1-the-twist-museum-big-photo?next project=no (дата обращения 11.04.2023).
Рис. 2. URL: https://www.zaha-hadid.com/architecture/heydar-aliyev-centre/ (дата обращения 11.04.2023).
Рис. 3. URL: https://www.archdaily.com/919974/olympic-house-
3xn/5d1544a0284dd1f57f00000c-olympic-house-3xn-photo?next project=no (дата обращения 11.04.2023).
Рис. 4. URL: https://www.archdaily.com/991922/3xns-quay-quarter-tower-in-sydney-wins-the-international-high-rise-award-2022-23/636b3dffdc6bcd25d03201f7-3xns-quay-quarter-tower-in-sydney-wins-the-international-high-rise-award-2022-23-photo (дата обращения 11.04.2023). Рис. 5, 9, 10. Схема автора статьи. Рис. 6, 8. Изображения автора статьи.
Рис. 7. URL: https://developer.nvidia.com/blog/archigan-generative-stack-apartment-building-design/ (дата обращения 30.04.2023).
Список источников
1. Кривенко А.А. Вычислительное проектирование как средство формирования архитектурного объекта / А.А. Кривенко, В.К. Моор, А.Г. Гаврилов // Новые идеи нового века: материалы международной научной конференции ФАД ТОГУ. Хабаровск: ТОГУ, 2017. С. 172-177.
2. Al Hawarneh A., Bendak S., & Ghanim F. Dynamic facilities planning model for large scale construction projects // Automation in Construction, 2019. №98, 72-89. URL: https://www.sciencedirect.com/science/article/abs/pii/S0926580517308397 (дата обращения: 11.04.2023). DOI:10.1016/j.autcon.2018.11.021
3. Kippers R., Koeva Mila, Keulen M., & Oude Elberink S. Automatic 3D building model generation using deep learning methods based on CityJSON and 2D floor plans // The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, XLVI-4/W4-2021, 49-54. URL:
https://research.utwente.nl/en/publications/automatic-3d-building-model-generation-using-deep-learning-method (дата обращения: 11.04.2023). DOI: 10.5194/isprs-archives-XLVI-4-W4-2021-49-2021
4. Radhakrishnan Mohesh. Is Midjourney-Ai the New Anti-Hero of Architectural Imagery & Creativity? // Global Scientific Journals 11 (2023): 94-114. URL: https://www.researchgate.net/publication/367252933 Is Midjourney-Ai the New Anti-Hero of Architectural Imagery Creativity (дата обращения: 11.04.2023). DOI: 10.11216/gsj.2023.01.102270
5. Nate Berg. AI tools like Dall-E 2 and Midjourney are helping architects and their clients design new buildings // Fast Company, 2021. URL:
https://www.fastcompany.com/90780871/ai-tools-like-dall-e-2-and-midjourney-are-helping-architects-and-their-clients-design-new-buildings (дата обращения: 11.04.2023).
References
1. Krivenko A.A., Moor V.K., Gavrilov A.G. Computational design as method of forming an architectural object [New ideas of the new century: materials of the International scientific conference of the PNU]. Khabarovsk, PNU, 2017, pp. 172-177.
2. Al Hawarneh A., Bendak S., & Ghanim F. Dynamic facilities planning model for large scale construction projects. Automation in Construction, 2019, no. 98, pp. 72-89. Available at: https://www.sciencedirect.com/science/article/abs/pii/S0926580517308397 DOI:10.1016/j.autcon.2018.11.021
3. Kippers R., Koeva Mila, Keulen M., & Oude Elberink S. Automatic 3D building model generation using deep learning methods based on CityJSON and 2D floor plans. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, XLVI-4/W4-2021, pp. 49-54. Available at:
https://research.utwente.nl/en/publications/automatic-3d-building-model-generation-using-deep-learning-method DOI: 10.5194/isprs-archives-XLVI-4-W4-2021-49-2021
4. Radhakrishnan Mohesh. Is Midjourney-Ai the New Anti-Hero of Architectural Imagery & Creativity? Global Scientific Journals no. 11, 2023, pp. 94-114. Available at: https://www.researchgate.net/publication/367252933 Is Midjourney-Ai the New Anti-Hero of Architectural Imagery Creativity DOI: 10.11216/gsj.2023.01.102270
5. Nate Berg. AI tools like Dall-E 2 and Midjourney are helping architects and their clients design new buildings. Fast Company, 2021. Available at:
https://www.fastcompany.com/90780871/ai-tools-like-dall-e-2-and-midjourney-are-helping-architects-and-their-clients-design-new-buildings
ОБ АВТОРЕ
Акшов Эмиль Альмирович
Аспирант, кафедра «Информационные технологии в архитектуре», Московский архитектурный институт (государственная академия), Москва, Россия [email protected]
ABOUT THE AUTHOR Akshov Emil A.
Postgraduate Student, Department of «Information Technology in Architecture», Moscow
Architectural Institute (State Academy), Moscow, Russia