Территория новых возможностей. Вестник Владивостокского государственного университета. 2024. Т. 16, № 2. С. 151-160 The Territory of New Opportunities. The Herald of Vladivostok State University. 2024. Vol. 16, № 2. Р. 151-160
Научная статья УДК 687.1, 004.08
DOI: https://doi.org/10.24866/VVSU/2949-1258/2024-2/151-160 EDN: https://elibrary.ru/SRKCGM
Искусственный интеллект как инструмент в проектировании модного образа
Гусева Марина Анатольевна Гетманцева Варвара Владимировна Иванова Марина Сергеевна Швайбович Аля Викторовна
ФГБОУ ВО «Российский государственный университет им. А.Н. Косыгина (Технологии. Дизайн. Искусство)» Москва. Россия
Аннотация. В повседневную и творческую деятельность современного человека прочно включены новые инструменты - нейросетевые технологии. Благодаря цифровизации появилось множество электронных приложений для решения разного рода задач, ускоряющих результативность труда. Прогресс технологий позволил в отдельных видах деятельности полностью исключить ручной труд, заменив человека роботами и чат-ботами. Искусственные нейронные сети используют для решения рутинных задач аналитики, прогнозирования, а также в дизайн-проектировании. Скорость как вычислительных процедур, выполняемых компьютерными программами, так и генерирования ими образов объектов в графических редакторах в несколько раз превышает аналогичные возможности людей. Однако в настоящее время любой созданный искусственным интеллектом художественный образ нуждается в совершенствовании, поскольку в основе работы нейросетей лежит не биологический субстрат мыслительной деятельности творческого человека, а математические алгоритмы и аппаратная реализация. Представлены результаты эксперимента по применению голосового помощника в творческой деятельности дизайнера-конструктора одежды. Установлено, что для полноценной работы чат-бота в индустрии моды необходимо машинное обучение, а для синтезирования вариантов ответов виртуальных ассистентов важно расширять базы данных графических образов модной швейной продукции и их вербальных смыслоразличительных характеристик.
Ключевые слова: модная одежда, распознавание, искусственный интеллект, машинное обучение, нейросети.
Для цитирования: Искусственный интеллект как инструмент в проектировании модного образа / М.А. Гусева, В.В. Гетманцева, М.С. Иванова, А.В. Швайбович // Территория новых возможностей. Вестник Владивостокского государственного университета. 2024. Т. 16, № 2. С. 151-160. DOI: https://doi.org/10.24866/VVSU/2949-1258/2024-2/151-160. EDN: https://elibrary. ru/SRKCGM
© Гусева М.А., 2024 © Гетманцева В.В., 2024 © Иванова М.С., 2024 © Швайбович А.В., 2024
151
Original article
Artificial intelligence as a tool in fashion design
Marina A. Guseva
Varvara V. Getmantseva
Marina S. Ivanova
Alya V. Shvaybovich
The Kosygin State University of Russia Moscow. Russia
Abstract. New tools - neural network technologies - are firmly integrated into the daily and creative activities of modern people. Thanks to digitalization, many electronic applications have appeared to solve various kinds of problems that speed up labor productivity. The progress of technology has made it possible to completely eliminate manual labor in some activities, replacing humans with robots and chatbots. Artificial neural networks are used to solve routine problems, analytics, forecasting and in design. The speed of both computational procedures performed by computer programs and their generation of images of objects in graphic editors is many times higher than that of humans. However, currently. Any artistic image created by artificial intelligence needs to be improved, since the work of neural networks is based not on the biological substrate of the mental activity of a creative person, but on mathematical algorithms and hardware implementation. The article presents the results of an experiment on the use of a voice assistant in the creative activity of a clothing designer. It has been established that for a chatbot to fully operate in the fashion industry, machine learning is necessary, and in order to synthesize the response options of virtual assistants, it is important to expand the database of graphic images of fashionable clothing products and their verbal semantic characteristics.
Keywords: fashionable clothes, recognition, artificial intelligence, machine learning, neural networks. For citation: Artificial intelligence as a tool in fashion design / M.A. Guseva, V.V. Getmantseva, M.S. Ivanova, A. V. Shvaybovich // The Territory of New Opportunities. The Herald of Vladivostok State University. 2024. Vol. 16, № 2. P. 151-160. DOI: https://doi.org/10.24866/VVSU/2949-1258/2024-2/151-160. EDN: https://elibrary.ru/SRKCGM
Введение
Искусственный интеллект (ИИ) - технология, позволяющая компьютеру «выполнять задачи, требующие мышления», т.е. компьютерная программа призвана имитировать мыслительную деятельность человека, выдавать ответы на конкретные вопросы, обучаться с использованием разнообразной информации, извлекаемой из загруженных баз данных и найденной на просторах Интернета.
Современное разнообразие задач, решаемых с помощью искусственного интеллекта, впечатляет: он используется в играх, приложениях, общении в Интернете, создании текстов, генерации изображений и многом другом. Искусственный интеллект также является отраслью науки, входя в обиход как инструмент, описывающий качественный уровень «умной» одежды и «умного текстиля» [1].
Термин «искусственный интеллект» появился в 1956 г. на летнем семинаре в Дартмут-колледже (Хановер, США), причем если первоначально данный термин оказывал большое впечатление на обывателей, то сегодня никого не удивишь этим словосочетанием. На начальном этапе перед учеными стояла задача по изучению разума человека и животных и возможности описания этой логики с помощью формул и программирования. Формализация данной задачи казалась загадочной и неизвестной, так как многое человек создает с помощью вообра-
152
жения [2], поэтому когнитивные функции пытались описать и воспроизвести компьютером на протяжении 60 лет. Данный вопрос до сих пор остается открытым для ученых.
В последние годы разработчики пытаются вывести программные продукты искусственного интеллекта за пределы символьно-логической системы, для чего с помощью алгоритмов формализации и имитационного моделирования [3] обучают нейросети интерпретировать данные и принимать решения [4].
Развитие модной индустрии в настоящее время также опирается на искусственный интеллект. Разработаны программные приложения, реализующие некоторые действия дизайнера: создание эскизов, подбор цветовой гаммы, обработка изображений [5]. Известны программы анализа модных трендов [6] и нейросете-вые разработки коллекций одежды, обуви и аксессуаров [7], алгоритмы генерирования уникальных решений в композиции костюма [8].
Исследование проблемы и постановка задачи
Сегодня искусственный интеллект стал универсальным термином, которым можно описать сложные задачи, решающиеся компьютером. Новым инструментом реализации стали нейронные сети (НС). Нейросети - тип машинного обучения, при котором компьютерной программой имитируется аналитическая работа человеческого мозга для решения каких-то задач [9]. Нейросети состоят из нейронов - алгоритмов, обрабатывающих и возвращающих полученную информацию [10]. Благодаря этой технологии стала возможной генерация изображений и текстов компьютерной программой [11, 12].
Работа нейросети происходит следующим образом: человеку необходимо ввести запрос, а дальше с помощью накопленной информации из баз данных, закономерностей и решения задач выдаётся сгенерированный ответ пользователю. Проделанная работа запоминается нейросетью и используется в следующих запросах.
Сегодня возможности нейросетей интересуют специалистов различных направлений творческой деятельности. Известны примеры генерирования нейросетью логотипов, принтов, изображений несуществующих субъектов, перекодировки замыслов художников (картину в фотографию и наоборот), создания изображений по словесному описанию [13].
Цель исследования - анализ применимости популярных чат-ботов с искусственным интеллектом в процессе творческого поиска модельных решений одежды в модном гардеробе.
Основная часть
В сфере дизайна применяют разнообразные цифровые инструменты, среди которых нейронные сети, работающие с графическими программами. Технологическим символом цифрового прогресса последних лет стали компьютерные программы - чат-боты, простые (chat bot) и обучающиеся, т.е. с искусственным интеллектом (AI chatbot) [14]. Термин «чат-бот» сформирован в сочетании двух слов в англоязычной версии: chat - беседа и robot - робот. Чат-боты используют в разных отраслях экономики - от постпродажного обслуживания потребителей в торговле и менеджменте [15] до постановки диагноза в медицине [16].
153
Главной задачей, поставленной перед чат-ботом, является общение с пользователем, ответ на его вопросы с помощью различных инструментов (распознавание голосовых или текстовых сообщений, визуальной информации). В чат-ботах с искусственным интеллектом реализованы диалоговые алгоритмы ИИ.
В тройку лидеров нейросетевых инструментов в сфере творческого труда включены:
- DALL-E (разработчик - OpenAI). Генерирует изображения по текстовому описанию [17]. Преимуществом нейросети является поддержка запросов на русском языке, распознавание естественной речи. Кроме того, сеть способна доработать изображения, генерированные в других нейросетях;
- Midjourney (разработчик - американская компания Midjourney) - нейросеть нового поколения. Позволяет создавать изображения по текстовому описанию, способна улучшить созданные ранее визуалы, перерисовать, адаптировать и т.д. [18];
- ChatGPT (Chat-based Generative Pre-trained Transformer, разработчик -OpenAI). Поддерживает русскоязычные запросы; третья версия нейросети наиболее успешно имитирует человеческую беседу, генерирует текст и изображения [14].
Применение продвинутых чат-ботов с искусственным интеллектом в трудовой деятельности дизайнера-конструктора швейной продукции является своеобразным импульсным генератором творчества, поскольку, несмотря на высокоскоростную генерацию контента, имеются ограничения в количестве вводимых в запросе символов; основной недостаток - платная подписка.
Для эксперимента нами выбраны три нейросети доступного уровня:
1) Kandinsky 2.1 (российский аналог нейросети Midjourney);
2) Lexica (разработчик Sharif);
3) НейроПлод (NPLod, РФ).
Нейросеть Kandinsky 2.1 разработали специалисты «Сбера» [19]. Она умеет генерировать изображения на основе текстовых описаний, а также улучшать уже существующие фотографии. Инструментарий нейросети доступен по бесплатному обращению к сайту; обработка запроса выполняется в 101 языковом формате, в том числе по-русски.
Чат-бот Kandinsky способен:
1) сгенерировать изображение по запросу;
2) отредактировать в онлайн-формате ранее полученный визуал, убрав лишние детали кисточкой;
3) дорисовать изображение;
4) соединить два изображения в одно.
Недостатком нейросети Kandinsky является необходимость подробного формирования запроса и получение на выходе лишь одного изображения.
Нейросеть Lexica генерирует изображения с помощью текстового запроса на английском языке. Искусственный интеллект Lexica выдает уже готовые изображения, которые созданы на модели Stable Diffusion [20], т.е. пользователь для своих проектов использует готовые шаблоны-картинки, созданные нейросетью. Приложение довольно просто в использовании. Недостатком является платное обслуживание, причем предварительно необходимо пройти регистрацию на сайте и подтвердить свой профиль. 154
Нейросеть №Ьоё [21] (российская разработка) позволяет с помощью текстового запроса генерировать несколько изображений. Приложение довольно точно выдает ответ на заданный текст. При неточности передачи информации можно отредактировать первоначальную версию текстового запроса и попросить нейросеть сгенерировать новый ответ. Качество итоговых картинок достаточно высокое и соответствует запросу. Приложение Нейроплод в основном бесплатное в использовании, с подпиской на некоторые дополнительные функции. Недостатком является ограничение количества запросов на генерацию изображений и длительное ожидание результата.
На первом этапе тестирования в качестве запрашиваемого результата исследуемым нейросетям был предложен одинаковый текст: «Коллекция женской одежды для активного отдыха на электрических самокатах и повседневной носки».
Результаты генерации изображений нейросетями представлены на рис. 1-3. Анализ визуальных объектов показал высокую степень схожести с образами, созданными человеком.
Рис. 1. Результат генерации изображений от нейросети Kandinsky 2.1
На втором этапе эксперимента использована нейросеть Scribblediffusion (разработана командой ControlNet) для генерирования цветного объемного изображения швейного изделия по карандашному рисунку [22]. Алгоритм работы ИИ Scribblediffusion основан на генеративной модели Stable Diffusion, используемой для создания изображений из «шума».
В качестве диалога ИИ Scribblediffusion помимо изображения запрашивает уточнение в виде словесного описания объекта (основной язык - английский, понимает запросы на русском языке). Поэтому перед сетью была поставлена следующая задача: «Женский жилет из ткани синего цвета с меховыми карманами». Результат работы чат-бота Scribblediffusion представлен на рис. 4.
155
Рис. 2. Результат генерации изображений от нейросети Lexica
Рис. 3. Результат генерации изображений от нейросети NPLod
156
Модель №3 Модель №4
Рис. 4. Результат работы нейросети БспЬЬ^Шшюп
Анализ полученной от 8сйЬЫе<^£Ги8юп визуальной информации показал, что в целом нейросеть удовлетворительно отвечает на запросы пользователя. Сгенерированные модели одежды характеризуются сохраненным, в соответствии с эскизом, силуэтом, пропорциями, видом отделки (в нашем случае это карманы, застежка).
На повышение результативности и креативности ответа непосредственно влияет как качество графического представления объекта, так и вербальные смыслоразличительные характеристики.
Для повышения адекватности итоговых изображений швейных изделий с меховой отделкой авторами разработана база данных «Декоративные меховые элементы в цифровом проектировании, редизайне и апсайклинге швейной продукции» [23], включающая графические изображения объектов (плоские и трехмерные) и вербальные описания свойств материалов, включая инструменты 3Б-визуализации.
Заключение
Современные компьютерные программы с искусственным интеллектом обладают большими возможностями в обеспечении пользователей креативной информацией для творческой деятельности. Чат-боты работают в разных стилях: реалистичный, карандашная графика, аниме, «мультяшки» и т.д. Пользователь получает как плоскую, так и объемную визуальную информацию. Доступен функционал генерации полноценных картин и логотипов, реалистичных и фантастических персонажей, отдельных предметов гардероба и модного образа.
Благодаря разработкам ученых и программистов компьютерные программы имитируют некоторый потенциал человеческого мозга и создают запрашиваемые изображения. Однако искусственный интеллект пока еще не может полностью заменить работу дизайнера и художника.
157
Для работы нейросетей необходимы базы данных, содержащие накопленный опыт человечества. Итоговые изображения, генерируемые нейросетями, все
еще отличаются от креативного плода трудовой деятельности человека и нуждаются в доработке и совершенствовании.
Список источников
1. Гетманцева В.В., Иванова М.С. Настоящее и будущее «умных» материалов и «умной» одежды // Все материалы. Энциклопедический справочник. 2023. № 8. С. 37-43.
2. Кондрат Н.Н. Применение искусственного интеллекта в обучении дизайнеров // Инженерные технологии: традиции, инновации, векторы развития: матер. 1Х Всерос. науч.-практ. конф. с междунар. участием. Абакан, 2023. С. 123, 124.
3. Рогожин А.Ю., Гусева М.А. Имитационное моделирование процесса проектирования одежды // Современные инженерные проблемы промышленности товаров народного потребления: Междунар. науч.-техн. симпозиум. Москва: ФГБОУ ВО «РГУ им. А.Н. Косыгина». 2017. Т. 1. С. 151-155.
4. Аверкин А.Н. Объяснимый искусственный интеллект как часть искусственного интеллекта третьего поколения // Речевые технологии. 2023. № 1. С. 4-10.
5. Гусова Д.Т. Изучение потенциала искусственного интеллекта в творческих отраслях на примере обучения студентов в области искусства, моды и дизайна // Теория и практика в сфере искусства костюма и моды (интеграция в бизнес-сообщество). Москва, 2023. С. 4-10.
6. Филенко С.С., Макарова Т.Л. Анализ мобильных приложений моды // Дизайн и технологии. 2020. № 75 (117). С. 106-113.
7. Углубленное использование нейросетей для создания модного образа / А.В. Голова-нева, В.С. Белгородский, М.И. Алибекова, Е.Г. Андреева // Дизайн и технологии. 2023. № 94 (136). С. 6-14.
8. Польшина В. Д., Гусева М.А. Использование генеративных алгоритмов визуализации локальных звуковых данных для создания уникальных решений в дизайне костюма // Инновации и технологии к развитию теории современной моды «Мода (Материалы. Одежда. Дизайн. Аксессуары)»: сб. матер. III Междунар. науч.-практ. конф., посвящённой Фёдору Максимовичу Пармону. Москва, 2023. С. 112-117.
9. Rosenblatt F. Principles of neurodynamics. New York: Spartan Books. 1962. 65 p.
10. Созыкин А.В. Обзор методов обучения глубоких нейронных сетей // Вестник ЮУр-ГУ. Серия: Вычислительная математика и информатика. 2017. Т. 6, № 3. С. 28-59.
11. Harris R. M. Using Artificial Neural Networks for Forensic File Type Identification. West Lafayette: Purdue University, 2007. 66 p.
12. Hinton G.E., Osindero S., Teh Y.-W. A Fast Learning Algorithm for Deep Belief Nets // Neural Computing. 2006. Vol. 18, no. 7. P. 1527-1554.
13. Габриелян Т.О. Глобальная графическая сеть как дизайн-среда // Дизайн-ревю. 2018. № 1-4. С. 155-166.
14. ChatGPT и «друзья»: лучшие чат-боты с искусственным интеллектом в 2024. URL: https://eternalhost.net/blog/tehnologii/chat-boty-s-iskusstvennym-intellektom?ysclid=lr9c8plehp326828076 (дата обращения: 11.01.2024).
15. Сидорчук Р.Р. Теоретические и практические аспекты применения ChatGPT в маркетинге // Маркетинг MBA. Маркетинговое управление предприятием. 2023. Т. 14, № 1. С. 4-25.
16. Крошилин С.В., Медведева Е.И., Макар С.В. Искусственный интеллект в медицинских чат-ботах: векторы развития // Дискуссия. 2023. № 3 (118). С. 116-126.
158
17. OpenAI. URL: https://openai.com/dall-e-2 (дата обращения: 11.01.2024).
18. Midjourney.com. URL: https://www.midjourney.com/home?callbackUrl=%2Fexplore (дата обращения: 11.01.2024).
19. Kandinsky 2.1. URL: https://www.sberbank.com/promo/kandinsky/ (дата обращения: 10.09.2023).
20. Lexica. URL: https://lexica.art/ (дата обращения: 12.04.2023).
21. Нейроплод. URL: https://nplod.ru/?ysclid=lramcax8te364119769 (дата обращения: 02.05.2023).
22. Scribblediffusion. URL: https://scribblediffusion.com/ (дата обращения: 02.05.2023).
23. Свидетельство о рег. БД 2023622455. Декоративные меховые элементы в цифровом проектировании, редизайне и апсайклинге швейной продукции: опубл. 18.07.2023, бюл. № 7 / Гусева М. А., Швайбович А.В., Али к. К., Андреева Е.Г.
References
1. Getmantseva V.V., Ivanova M.S. The present and the future of "smart" materials and "smart" clothes. All materials. Encyclopedic reference book. 2023; (8): 37-43.
2. Kondrat N.N. Application of artificial intelligence in training designers. Engineering technologies: traditions, innovations, development vectors. Materials of the IX All-Russian scientific and practical conference with international participation. Abakan; 2023. P. 123, 124.
3. Rogozhin A.Yu., Guseva M.A. Simulation modeling of the clothing design process. Collection of scientific papers of the International Scientific and Technical Symposium "Modern engineering problems in the consumer goods industry ". Moscow: Federal State Budgetary Educational Institution of Higher Education "Russian State University named after. A.N. Kosygina". 2017; (1): 151-155.
4. Averkin A.N. Explainable artificial intelligence as part of third generation artificial intelligence. Speech technologies. 2023; (1): 4-10.
5. Gusova D.T. Studying the potential of artificial intelligence in the creative industries using the example of teaching students in the field of art, fashion and design. Theory and practice in the field of art of costume and fashion (integration into the business community). Moscow; 2023. P. 4-10.
6. Filenko S.S., Makarova T.L. Analysis of mobile fashion applications. Design and technology. 2020; 75 (117): 106-113.
7. In-depth use of neural networks to create a fashionable image / A.V. Golovaneva, V.S. Belgorodsky, M.I. Alibekova, E.G. Andreeva. Design and technology. 2023; 94 (136): 6-14.
8. Polshina V.D., Guseva M.A. Using generative algorithms for visualizing local sound data to create unique solutions in costume design. Innovations and technologies for the development of the theory of modern fashion "Fashion (Materials. Clothing. Design. Accessories) ". Collection of materials of the III International Scientific and Practical Conference dedicated to Fedor Maksimovich Parmon. Moscow; 2023. P. 112-117.
9. Rosenblatt F. Principles of neurodynamics. New York: Spartan Books; 1962. 65 p.
10. Sozykin A.V. Review of methods for training deep neural networks. Bulletin of SUSU. Series: Computational mathematics and computer science. 2017; 6 (3): 28-59.
11. Harris R.M. Using Artificial Neural Networks for Forensic File Type Identification. West Lafayette: Purdue University; 2007. 66 p.
12. Hinton G.E., Osindero S., Teh Y.-W. A Fast Learning Algorithm for Deep Belief Nets. Neural Computing. 2006; 18 (7): 1527-1554.
159
13. Gabrielyan T.O. Global graphical network as a design environment. Design review. 2018; (1-4): 155-166.
14. ChatGPT and "friends": the best chatbots with artificial intelligence in 2024. URL: https://eternalhost.net/blog/tehnologii/chat-boty-s-iskusstvennym-intellektom?ysclid=lr9c8plehp326828076 (accessed date: 01.11.2024).
15. Sidorchuk R.R. Theoretical and practical aspects of using ChatGPT in marketing. Marketing MBA. Marketing management of an enterprise. 2023; 14 (1): 4-25.
16. Kroshilin S.V., Medvedeva E.I., Makar S.V. Artificial intelligence in medical chatbots: development vectors. Discussion. 2023; 3 (118): 116-126.
17. Open AI. URL: https://openai.com/dall-e-2 (accessed date: 01.11.2024).
18. Midjourney.com. URL: https://www.midjourney.com/home?callbackUrl=%2Fexplore (accessed date: 01.11.2024).
19. Kandinsky 2.1. URL: https://www.sberbank.com/promo/kandinsky/ (accessed date: 09.10.2023).
20. Lexica. URL: https://lexica.art/ (accessed date: 04.12.2023).
21. Neuroplod. URL: https://nplod.ru/?ysclid=lramcax8te364119769 (accessed date: 05.02.2023).
22. Scribblediffusion. URL: https://scribblediffusion.com/ (accessed date: 05.02.2023).
23. Certificate of registration. DB 2023622455. Decorative fur elements in digital design, redesign and upcycling of clothing products: publ. 07.18.2023, bulletin. no. 7 / Guseva M.A., Shvaibovich A.V., Ali K.K., Andreeva E.G.
Информация об авторах:
Гусева Марина Анатольевна, канд. тех. наук, доцент, доцент каф. художественного моделирования, конструирования и технологии швейных изделий, ФГБОУ ВО «Российский государственный университет им. А.Н. Косыгина (Технологии. Дизайн. Искусство)», г. Москва, [email protected], https://orcid.org/0000-0003-3491-6132
Гетманцева Варвара Владимировна, д-р тех. наук, профессор каф. художественного моделирования, конструирования и технологии швейных изделий, ФГБОУ ВО «Российский государственный университет им. А.Н. Косыгина (Технологии. Дизайн. Искусство)», г. Москва, [email protected], https://orcid.org/0000-0003-0441-3198
Иванова Марина Сергеевна, студент каф. художественного моделирования, конструирования и технологии швейных изделий, ФГБОУ ВО «Российский государственный университет им. А.Н. Косыгина (Технологии. Дизайн. Искусство)», г. Москва;
Швайбович Аля Викторовна, магистрант каф. художественного моделирования, конструирования и технологии швейных изделий, ФГБОУ ВО «Российский государственный университет им. А.Н. Косыгина (Технологии. Дизайн. Искусство)», г. Москва.
DOI: https://doi.org/10.24866/VVSU/2949-1258/2024-2/151-160 EDN: https://elibrary.ru/SRKCGM
Дата поступления: Одобрена после рецензирования: Принята к публикации:
16.01.2024 05.04.2024 17.05.2024
1б0