Научная статья на тему 'ОБЗОР СОВРЕМЕННЫХ ГЕНЕРАТИВНЫХ НЕЙРОСЕТЕЙ: ОТЕЧЕСТВЕННАЯ И ЗАРУБЕЖНАЯ ПРАКТИКА'

ОБЗОР СОВРЕМЕННЫХ ГЕНЕРАТИВНЫХ НЕЙРОСЕТЕЙ: ОТЕЧЕСТВЕННАЯ И ЗАРУБЕЖНАЯ ПРАКТИКА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
768
150
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
генеративные нейросети / искусственный интеллект / GAN / классификация / систематизация / отечественная практика / зарубежная практика / ChatGPT / DALL-E / generative neural networks / artificial intelligence / GAN / classification / systematization / domestic practice / foreign practice / ChatGPT / DALL-E

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — И О. Малышев, А А. Смирнов

В настоящее время все больше внимания уделяется развитию искусственного интеллекта в мире во всех сферах экономики. Поэтому важно иметь множество подходов по их развитию в различных отраслях и применению. Одним из ключевых вопросов при этом является подготовка кадров способных разрабатывать и усовершенствовать программы, а также их обслуживать. Автор статьи систематизирует информацию о генеративных нейросетях, а также классифицирует их в соответствии с функциональной принадлежностью.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OVERVIEW OF MODERN GENERATIVE NEURAL NETWORKS: DOMESTIC AND FOREIGN PRACTICE

Currently, increasing attention is being paid to the development of artificial intelligence in the world across all economic sectors. Therefore, it is important to have a variety of approaches for their development in different industries and applications. One of the key issues in this context is the training of personnel capable of developing and improving programs, as well as servicing them. The author of the article systematizes information on generative neural networks and classifies them according to their functional affiliation.

Текст научной работы на тему «ОБЗОР СОВРЕМЕННЫХ ГЕНЕРАТИВНЫХ НЕЙРОСЕТЕЙ: ОТЕЧЕСТВЕННАЯ И ЗАРУБЕЖНАЯ ПРАКТИКА»

ОБЗОР СОВРЕМЕННЫХ ГЕНЕРАТИВНЫХ НЕЙРОСЕТЕЙ: ОТЕЧЕСТВЕННАЯ И

ЗАРУБЕЖНАЯ ПРАКТИКА

И.О. Малышев, аспирант

Научный руководитель: А.А. Смирнов, д-р экон. наук, профессор Марийский государственный университет (Россия, г. Йошкар-Ола)

DOI:10.24412/2500-1000-2024-1-2-168-171

Аннотация. В настоящее время все больше внимания уделяется развитию искусственного интеллекта в мире во всех сферах экономики. Поэтому важно иметь множество подходов по их развитию в различных отраслях и применению. Одним из ключевых вопросов при этом является подготовка кадров способных разрабатывать и усовершенствовать программы, а также их обслуживать. Автор статьи систематизирует информацию о генеративных нейросетях, а также классифицирует их в соответствии с функциональной принадлежностью.

Ключевые слова: генеративные нейросети, искусственный интеллект, GAN, классификация, систематизация, отечественная практика, зарубежная практика, ChatGPT, DALL-E.

Современное общество развивается крайне быстрыми темпами. Совсем недавно понятие «генеративная нейросеть» было абсолютной диковинкой, а об их использовании в качестве рабочего инструмента не было и речи. Однако все значительно изменилось, и человечество стало использовать ИИ в повседневной жизни. Появилось множество генеративных нейросетей, которые обладают определенными возможностями и различным функционалом.

Благодаря этому формируется актуальность исследования - активное развитие искусственного интеллекта в Российской Федерации стало предпосылкой для появления множества инструментов, которые следует классифицировать и систематизировать. Так, в ряде вакансий на сайте HeadHunter на текущий момент можно увидеть новые обязанности сотрудников, связанных с владением генеративными нейросетями ChatGPT, Midjoumey, DALLE и так далее.

Целью данного исследования является классификация и систематизация современных генеративных нейросетей как отечественного, так и зарубежного производства.

Задачи исследования:

1. Определение исторических предпосылок появления генеративных нейросе-тей;

2. Исследование сущности генеративных нейросетей;

3. Организация классификации генеративных нейросетей.

Объект исследования - генеративные нейросети.

Предмет исследования - развитие искусственного интеллекта в Российской Федерации и зарубежом.

Методы исследования, которые используются автором работы: сравнение, индукция, дедукция, синтез, анализ и прочие.

1. Результаты исследования

1.1. История появления генеративных нейросетей, их сущность

Генеративные нейросети - это неотъемлемая часть новой реальности. Следует понимать, что нейросеть - это вид искусственного интеллекта, а не он сам в прямом его понимании. То есть, это лишь его частица. Так, Барщевский Е.Г. в своей научной статье отмечает, что в 1956 году было дано определение понятию «искусственный интеллект» (ИИ). В соответствии с ним, искусственный интеллект -это возможность осуществления творческих задач как программными, так и техническими системами.

Также данный ученый определяет, что на текущий момент принято выделять всего три вида искусственного интеллекта. Он классифицируется в зависимости от задач, которые он должен выполнять. Видами ИИ являются [1]:

1. Общий искусственный интеллект. Это такой вид ИИ, который способен выполнять множество различных задач как человек. Примером данного ИИ являются различные суперкомпьютеры, к которым относится и K Computer от японской компании Fujitsu. Данное устройство является «суперкомпьютером общего назначения», призванным выполнять широкий спектр задач [2].

2. Ограниченный искусственный интеллект. Вид ИИ, который специализируется на конкретной задаче. Например, нейросеть DALL-E, которая может генерировать изображения по текстовому запросу (также именуется как prompt).

3. Искусственный сверхинтеллект. Вид ИИ, которого на текущий момент не существует. Являясь высокопотенциальным проектом будущего, данный ИИ может превзойти человека или группу людей, включая всё человечество.

Генеративные нейросети относятся к ограниченному виду ИИ, поскольку они могут решать только конкретные задачи и на настоящее время не способны соперничать с человеческим разумом.

Наиболее известным примером ограниченного искусственного интеллекта, получившим активное развитие в текущее время, является GAN. Само понятие Generative adversarial network (или сокращённо GAN) появилось не так давно. Оно переводится как «генеративно-состязательная сеть». Это специализированный алгоритм машинного обучения, который основан на комбинации двух нейросетей: G и D. Нейросеть G - это модель, которая генерирует данные, а D - это дискриминативная модель, которая определяет сгенерирован ли образец данных нейросетью G или нет. Данная технология была сформирована в 2014 году Ианом Гудфеллоу [3].

Нейросеть ChatGPT является примером функционирования GAN. Так, ChatGPT использует набор готовых текстов, а также

может создавать абсолютно новые, которые схожи с реальными. В результате этого формируются такие тексты, которые максимально подходят под пользовательские запросы, а также выглядят привычным образом.

Именно благодаря данной технологии настоящее изменилось. Так, Егорычев Д.Н. и Егорычев А.Д. в своей научной статье рассматривают основные направления, которые затронут генеративные нейросети в современном мире: увеличение количества инвестиций в искусственный интеллект и генеративные нейросети, изменение привычных профессий или их исчезновение, появление инновационных продуктов и проектов, связанных с ИИ и генеративными нейросетями, изменение привычного функционала управленческих профессий, рост процента автоматизации процессов, связанных с продажами и производством, изменения в области интеллектуальной собственности [5]. С авторами данного исследования легко согласиться, поскольку уже сейчас генеративные нейросети активно влияют на мир: поменялись требования к некоторым рабочим профессиям (программисты и дизайнеры), система «Антиплагиат» ввела проверку на сгенерированный текст, а представители малого и среднего бизнеса оптимизируют затраты с помощью ChatGPT и DALL-E.

1.2. Классификация генеративных нейросетей

Динамичной развивающийся мир предоставляет множество инноваций: компания Яндекс внедряет голосового помощника Алису (со встроенным YandexGPT) в портативные колонки, Сбер выпускает телевизоры совместно с собственной нейросетью - GigaChat. Недавно появившиеся генеративные нейросети, разнообразие их функционала, вариативность их применения - всё это требует проведения систематизации и классификации.

Поэтому рассмотрим современные наиболее популярные нейросети, которые активно применяются множеством людей в современном мире [4]:

1. ChatGPT. Зарубежная универсальная генеративная нейросеть, которая может создавать тексты, вести диалог, в соответ-

ствии с запросами, которые пользователь ей предоставит.

2. Dall-E. Специализированная нейросеть, которая способна генерировать изображения, исходя из текстового запроса пользователей. Является зарубежной генеративной нейросетью.

3. Character AI. Специализированная платформа, которая может создать имитацию многих современных медийных личностей, популярных персонажей и так далее. Например, данная нейросеть может вести диалог от лица Илона Маска. Разработана иностранной компанией.

4. YandexGPT. Универсальная нейросеть, разработанная компанией из Российской Федерации. Может генерировать текст, вести диалог, а также связана с голосовым помощником - Алисой.

5. Bing AI. Это зарубежная генеративная нейросеть, отличающейся тем, что она связана с поисковой системой, что подтверждает достоверность информации в ответе пользователю.

6. GigaChat. Отечественная универсальная нейросеть, которая может создавать текст в ответ на запросы пользователя, генерировать изображения, а также вести диалоги.

7. Bing Image Creator. Нейросеть, которая может создавать изображения, исходя из текстового запроса пользователей. Разработана иностранной компанией.

8. Kandinsky. Нейросеть, разработанная в Российской Федерации, которая способна генерировать изображения и короткие анимационные ролики. Отличие данного сервиса от зарубежных аналогов в том, что она поддерживает русский язык и обладает «фотореализмом».

9. Шедеврум. Отечественная нейросеть, основанная на модели YandexGPT. Облада-

ет возможностью генерировать картинки по текстовому описанию.

10. Runway Gen-2. Зарубежная нейросеть, которая работает с готовыми видеороликами, а также может генерировать видео по текстовому описанию.

11. Nvidia Eye Contact. Специализированная иностранная нейросеть, которая позволяет «удерживать взгляд пользователя в камере» в том случае, если пользователь ответ глаза.

12. Adobe Enhance. Специализированная нейросеть, которая способствует устранению шума на аудиозаписях. Разработана зарубежом.

13. Voice.AI. Специализированная иностранная нейросеть, которая выступает в качестве генератора голоса.

14. DeepL. Зарубежная нейросеть в виде онлайн-переводчика, позволяющая быстро переводить текста различного объема.

15. Any Summary. Зарубежная уникальная нейросеть, которая может проанализировать текст любого объема и сократить его, сохранив при этом основной смысл.

16. Grammarly. Зарубежная нейросеть, которая основана на использовании искусственного интеллекта при использовании английского языка.

17. RoomGPT. Нейросеть, которая позволяет создать дизайн в комнатах. Она использует искусственный интеллект для создания различных вариаций. Является зарубежной.

18. Outfits AI. Иностранная нейросеть, которая позволяет изменять одежду на фотографии.

В рамках данного исследования предлагается разбить нейросети на подвиды по их функционалу. В результате представим таблицу с распределением наиболее популярных нейросетей по их функционалу (таблица).

Таблица. Классификация нейросетей по их функционалу

Функционал нейросети Наименование нейросети

Генерация текста CharacterAI, Bing AI

Создание изображений Dall-E, Kandinsky, Шедеврум

Монтаж видео Runway Gen-2, Nvidia Eye Contact

Работа со звуком Adobe Enhance, Voice.AI

Производительность DeepL, Any Summary, Grammarly

Развлечения RoomGPT, Outfits AI.

Универсальные ChatGPT, YandexGPT, GigaChat

Таким образом, следует разделять со- тивных нейросетях - они классифициру-временные нейросети по следующим ются в качестве ограниченного искус-функциональным категориям: генерация ственного интеллекта. Также нами разра-текста, создание изображений, монтаж ви- ботана собственная классификация генера-део, работа со звуком, производительность, тивных нейросетей по их функциональной развлечения и универсальный формат. принадлежности: универсальные, для ге-

Заключение нерации текста, для работы со звуком, для

В рамках данной статьи проведено ком- работы с видео, для создания изображе-плексное исследование, которое позволяет ний, производительности, развлечений. систематизировать информацию о генера-

Библиографический список

1. Барщевский Е.Г. Использование искусственного интеллекта // Восточно-Европейский научный журнал. - 2023. - № 3-2 (88). - C. 56-58. https://doi.org/10.31618/ESSA.2782-1994.2023.2.88.348 EDN: NCEYDM.

2. Японский суперкомпьютер «K Computer». ABOUTDC.RU: системы вентиляции. -[Электронный ресурс]. - Режим доступа: https://www.aboutdc.ru/page/849.php (дата обращения: 12.01.2024).

3. Что такое GAN? AWS.AMAZON.COM. - [Электронный ресурс]. - Режим доступа: https://aws.amazon.com/ru/what-is/gan/ (дата обращения: 12.01.2024).

4. Бесплатные нейросети. JOURNAL.TIKNOFF.RU: Тинькофф Журнал: журнал про ваши деньги. 2023. 31 авг. - [Электронный ресурс]. - Режим доступа: https://joumal.tinkoff.ru/short/ai-for-all/#six (дата обращения: 12.01.2024).

5. Егорычев Д.Н., Егорычев А.Д. Направления влияния нейросетей на экономику, бизнес и образование // ЭСГИ. - 2023. - №2 (38).

OVERVIEW OF MODERN GENERATIVE NEURAL NETWORKS: DOMESTIC AND

FOREIGN PRACTICE

I.O. Malyshev, Postgraduate Student

Supervisor: A.A. Smirnov, Doctor of Economic Sciences, Professor Mari State University (Russia, Yoshkar-Ola)

Abstract. Currently, increasing attention is being paid to the development of artificial intelligence in the world across all economic sectors. Therefore, it is important to have a variety of approaches for their development in different industries and applications. One of the key issues in this context is the training of personnel capable of developing and improving programs, as well as servicing them. The author of the article systematizes information on generative neural networks and classifies them according to their functional affiliation.

Keywords: generative neural networks, artificial intelligence, GAN, classification, systemati-zation, domestic practice, foreign practice, ChatGPT, DALL-E.

i Надоели баннеры? Вы всегда можете отключить рекламу.