Научная статья на тему 'ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В СОВРЕМЕННОЙ КУЛЬТУРЕ И ПОЛИТИЧЕСКОЙ СФЕРЕ ОБЩЕСТВЕННОЙ ЖИЗНИ (НА ПРИМЕРЕ STABLE DIFFUSION И MIDJOURNEY)'

ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В СОВРЕМЕННОЙ КУЛЬТУРЕ И ПОЛИТИЧЕСКОЙ СФЕРЕ ОБЩЕСТВЕННОЙ ЖИЗНИ (НА ПРИМЕРЕ STABLE DIFFUSION И MIDJOURNEY) Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
450
79
Читать
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
нейросети / генеративные модели / современная культура / политическая сфера / машинное обучение / медиа-коммуникации / neural networks / generative models / modern culture / political sphere / machine learning / media communications / AI

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Мухина К. И., Чернавский А. С.

Работа анализирует влияние генеративных моделей на культурную сферу и политику. Описывается использование нейросетей в создании реалистичных видеоигр, музыки, искусства, а также их влияние на социальные сети и политические процессы. Работа также затрагивает вопросы внутренней цензуры в контексте работы современных генеративных моделей ИИ, подчеркивая необходимость борьбы с дезинформацией и негативным контентом. Рассматриваются методы цензуры, такие как фильтры в машинном обучении, и их применение в решении проблем, связанных с созданием и распространением визуального контента. В заключение, авторы проводят эксперимент на примере визуальных генеративных моделей Stable Dif fusion и Midjourney.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Мухина К. И., Чернавский А. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
Предварительный просмотр
i Надоели баннеры? Вы всегда можете отключить рекламу.

ARTIFICIAL INTELLIGENCE TECHNOLOGIES IN MODERN CULTURE & POLITICAL SPHERE OF PUBLIC LIFE

The paper analyzes the influence of generative models on the cultural sphere and politics. It describes the use of neural networks in creating realistic video games, music, art, as well as their impact on social networks and political processes. The work also addresses issues of internal censorship in the context of the work of modern generative AI models, emphasizing the need to combat disinformation and negative content. The methods of censorship, such as filters in machine learning, and their application in solving problems related to the creation and distribution of visual content are considered. In conclusion, the authors give an approximate example of visualization of genetic models that provide stable dif fusion and intermediate transition.

Текст научной работы на тему «ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В СОВРЕМЕННОЙ КУЛЬТУРЕ И ПОЛИТИЧЕСКОЙ СФЕРЕ ОБЩЕСТВЕННОЙ ЖИЗНИ (НА ПРИМЕРЕ STABLE DIFFUSION И MIDJOURNEY)»

УДК 32

Мухина К.И.

студент, кафедра политологии, факультет прикладной политологии Московский педагогический государственный университет

(г. Москва, Россия)

Научный руководитель: Чернавский А.С.

старший преподаватель Московский педагогический государственный университет

(г. Москва, Россия)

ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В СОВРЕМЕННОЙ КУЛЬТУРЕ И ПОЛИТИЧЕСКОЙ СФЕРЕ ОБЩЕСТВЕННОЙ ЖИЗНИ (НА ПРИМЕРЕ STABLE DIFFUSION И MIDJOURNEY)

Аннотация: работа анализирует влияние генеративных моделей на культурную сферу и политику. Описывается использование нейросетей в создании реалистичных видеоигр, музыки, искусства, а также их влияние на социальные сети и политические процессы. Работа также затрагивает вопросы внутренней цензуры в контексте работы современных генеративных моделей ИИ, подчеркивая необходимость борьбы с дезинформацией и негативным контентом. Рассматриваются методы цензуры, такие как фильтры в машинном обучении, и их применение в решении проблем, связанных с созданием и распространением визуального контента. В заключение, авторы проводят эксперимент на примере визуальных генеративных моделей Stable Diffusion и Midjourney.

Ключевые слова: нейросети, генеративные модели, современная культура, политическая сфера, машинное обучение, медиакоммуникации.

В культурной сфере - технологии ИИ не только создают развлекательный контент, но и принципиально изменяют способы, которыми мы

потребляем информацию. Алгоритмы рекомендаций, основанные на искусственном интеллекте, позволяют персонализировать контент, предлагая нам книги, фильмы, музыку и новости, которые соответствуют нашим интересам. Также, технологии ИИ улучшают медиакультурный обмен, предоставляя инструменты для автоматического перевода текста и речи между разными языками. Музеи уже сегодня также используют данные технологии для анализа коллекций, классификации и реставрации произведений, обеспечения более интерактивных и образовательных выставок. Так, можно привести в пример, известную выставку, посвященную Ван Гогу. Ее особенностью являлось то, что для погружения в творчество художника использовалась уникальная технология Cinema360, то есть, изображения проецируются не только на стены, но и на пол, и на экраны обратной проекции, визуально изменяющие геометрию зала. На развитие политической сферы общественной жизни, ИИ также оказывает сильное влияние. Например, политики и правительства могут использовать искусственный интеллект для анализа больших объемов данных, получения рекомендаций при принятии решений, анализ данных об избирательном поведении, общественном мнении и экономических трендах. Примером умелого использования искусственного интеллекта в разработке политической программы может послужить кампания Эммануэля Макрона во время выборов президента Франции в 2017 году. Макрон воспользовался алгоритмами машинного обучения для анализа обширных объемов информации, включая текстовые данные из социальных сетей и новостных источников, с целью понять настроения избирателей по разнообразным вопросам и создать свою избирательную платформу. Также, ИИ может использоваться для отслеживания обсуждений в социальных сетях и анализа общественного мнения. Это помогает политикам оценивать реакции на свои инициативы и адаптировать свою стратегию под интересы общества или определенной аудитории. Не стоит также забывать и о том, что искусственный интеллект может использоваться и в личных целях. Политики могут с помощью соответствующих технологий создавать и распространять дезинформацию или фейковые новости. Алгоритмы

машинного обучения могут автоматически генерировать ложную информацию, чтобы повлиять на общественное мнение. А также, используя ИИ, политики могут настраивать свои сообщения и рекламу так, чтобы они были максимально эффективными или создавать «ботов». Для контроля над фейк-аккаунтами также существует и административная ответственность. В более тяжелых случаях -уголовная. «...примером уголовно наказуемых деяний является создание страницы-клона, с которой происходит в дальнейшем рассылка сообщений с просьбой под благовидным предлогом срочно одолжить определенную сумму денег. Такой поступок квалифицируется по ст. 159 УК РФ (мошенничество) и влечет наказание вплоть до 2 лет лишения свободы.» - пишет Панов Александр Юрьевич доцент кафедры социально правовых дисциплин.

Искусственные нейронные сети представляют собой мощный класс алгоритмов в области искусственного интеллекта. В своей книге «Создаем нейронную сеть» , специалист в области количественного анализа данных и разработки решений на базе продуктов с открытым исходным кодом, Тарик Рашид подробно описал, как работают нейронные сети, откуда они берут информацию и как создают ответы. Так, генеративные модели состоят из нейронов, которые являются базовыми вычислительными элементами. Нейроны объединены в слои, и обычно нейросети имеют несколько слоев, включая входной, скрытый и выходной слои. Информация поступает на входной слой, который представляет собой вектор значений. Этот вектор пропускается через сеть, и каждый нейрон выполняет определенные вычисления, как это происходит в биологическом мозге. Генеративные модели, для получения информации, использует веса и функции активации. Веса представляют собой параметры, которые настраиваются в процессе обучения нейронной сети. Они определяют, какая информация будет учитываться и каким образом она будет обработана. Функции активации определяют, как активированные нейроны реагируют на входные данные. Процесс обучения нейронной сети заключается в настройке весов таким образом, чтобы сеть могла успешно выполнять конкретную задачу. Для этого используются алгоритмы градиентного спуска, которые

оптимизируют веса, чтобы минимизировать ошибку между прогнозами нейронной сети и желаемыми значениями. Этот процесс требует большого объема размеченных данных для обучения, чтобы нейронная сеть могла "узнать" образцы и закономерности в данных. Генерация информации нейронными сетями также зависит от их архитектуры и обученных весов. Например, для генерации текста можно использовать рекуррентные нейронные сети (RNN) или генеративные сети вариационного автокодировщика (VAE). Генеративные нейронные сети принимают на вход случайный вектор и генерируют данные, которые соответствуют заданным правилам и структуре обучающих данных.

Влияние на культурную сферу проявляется в индустрии развлечений, предоставляя новые возможности для создания реалистичных видеоигр, генерации музыки, художественных произведений. Так, например, с 8 июля по 29 октября 2023 года, проходит выставка в Центре цифрового искусства Artplay Media, на которой всемирно известные шедевры встречаются с искусственным интеллектом. Также, на выставке нейросеть сама рассказывает о своей истории создания и отвечает на такие вопросы как: в чем секрет гениальных художников? Что является красивым? Сможет ли нейрохудожник заменить человека? Текст написан был при помощи российской нейросети Retext.ai. В социальных сетях генеративные модели определяют контент, который мы видим, и влияют на восприятие информации. Также, существуют конкретные аспекты политической сферы, которые особенно подвержены воздействию нейронных сетей. Как уже говорилось ранее, нейросети возможно использовать для анализа политических данных, включая результаты выборов, мнения из социальных сетей и опросы общественного мнения. Данные системы могут выявлять тенденции, прогнозировать исходы политических событий и помогать кампаниям и партиям принимать обоснованные решения. Также, кампании и политические лидеры используют нейросети для микротаргетинга.

Но, с развитием генеративных моделей, возникают сложные вопросы о цензуре и контроле в создании и распространении генерированного контента. Генеративные модели, способные создавать текст, изображения и звук,

открывают новые возможности, но также представляют определенную угрозу, связанную с распространением дезинформации и «оскорбительного» контента. Цензура в контексте генеративных моделей относится к мерам контроля, используемая с целью ограничения публикации нежелательного или вредоносного контента, созданного этими моделями. Механика цензуры очень важна в контексте борьбы с фейковыми новостями, ненавистью в социальных сетях, дезинформацией и другими проблемами, связанными с технологиями генеративных моделей. Генеративные модели могут использовать систему фильтрации, которая определяет, какой контент допустим, а какой запрещен. Эти фильтры могут анализировать текст, изображения и звук, чтобы определить, содержится ли в них запрещенный контент, такой как насилие, порнография, ненависть или мат. Так, например, русская нейросеть «Теком» находит не слова на английскую букву «f», а слова на букву «Х». Это первое русскоязычное решение, которое может «запикивать» мат в прямом эфире. Пока оно предлагается только для проверки медиафайлов: MP4, M4A, 3GP, - но анализирует видео на наличие запрещенных слов в три раза быстрее реального времени, так что ничто не мешает пропускать через него реальный видеопоток. Еще одним механизмом цензуры является машинное обучение. Нейронные сети могут быть обучены на больших объемах данных, чтобы автоматически распознавать и классифицировать контент. Алгоритмы модерации также служат механизмом для автоматической проверки и классификации контента. Такие алгоритмы могут анализировать текст на предмет оскорблений, угроз и дискриминации, а также изображения на предмет неприемлемого содержания и, если контент не соответствует правилам и нормам определенной нейросети, он может быть удален или заблокирован. Не стоит забывать и о постоянном обновление систем цензуры в нейронных сетях, которые помогают адаптироваться к изменяющемуся контенту и новым видам нарушений.

Для понимания того, как сегодня работает цензура в генеративных моделях, мы проведем небольшой авторский эксперимент на примере Stable Dif fusion и Midjourney - визуальных генеративных моделях. Взаимодействие с

первой моделью будет происходить через Playground AI, которая относится к концепции веб-платформы или приложения, где пользователи могут взаимодействовать и экспериментировать с различными моделями, инструментами или алгоритмами ИИ. Playground AI предлагает удобную для использования среду, где люди могут работать с предварительно настроенными моделями ИИ для таких задач, как распознавание изображений и обработка естественного языка, без необходимости владения навыками программирования. Платформа также использует передовые генеративные алгоритмы ИИ, в том числе от компании OpenAI, для содействия творческим задачам, включая генерацию изображений из текста и создание искусственного искусства. Согласно исследованию Everypixel Journal, активное количество пользователей Midjourney составляет 1,5-2,5 миллиона пользователей, в то время как у Stable Dif fusion более 10 миллионов. А количество сгенерированного контента за всё время у Stable Dif fusion составляет 12,590 миллиарда изображений, Midjourney же пользуются в разы меньше - его показатель составляет 964 миллиона.

Так как данная модель является американской разработкой, то эксперимент будет осуществляться через призму работы «цензуры» в США. Подготовленные вопросы для нейросети представлены в таблице №1. Все запросы задавались на английском языке.

Таблица 1. - вопросы для Stable Dif fusion

1. Joe Bidan shakes hands with Vladimir Putin. The Kremlin is visible in the background. / Джо Байдан пожимает руку В.В. Путина. На фоне виден Кремль.

2. Russian troops drive a tank into the White House. The flag of Russia is visible on the background. / Российские войска заезжают на танке в Белый дом. На фоне виден флаг России

Первый ответ на наш запрос от Stable Dif fusion представлен на рисунке №1.

Рис. 1. Ответ Stable Dif fusion на первый запрос.

Мы видим то, что сгенерировала нейросеть не совсем подходит под наш запрос. Да, изображено два человека, они пожимают руки, на фоне виден Кремль, визуализация выглядит реалистично, но при этом, искусственный интеллект почему-то изобразил двух президентов России. Возможно, Stable Dif fusion не знает кто такой Джо Байден, поэтому был сделан запрос на генерацию изображения президента США, который улыбается на фоне Белого дома. Ответ представлен на рисунке №2.

Рис. 2. Ответ Stable Dif fusion на запрос генерации Джо Байдана.

Следовательно, нейросеть знает кто такой Джо Байден и может создать изображения с ним. «Попросим» еще раз сгенерировать двух президентов США и России, но просто стоящими рядом, без жестов и на нейтральной территории, например, в парке. Ответ представлен на рисунке №3.

Рис. 3. Ответ Stable Dif fusion на первый запрос с внесенными изменениями.

Мы видим, что Stable Dif fusion уже лучше изобразил нам то, что мы просили, но при этом, фигура В.В. Путина угадывается с большим трудом.

Переходим к следующему запросу для Stable Dif fusion. Ответ представлен на рисунке №4.

Рис. 4. Ответ Stable Dif fusion на второй запрос.

В целом, можно считать результат успешным. На первой фотографии четко виден российский флаг, танк, Белый дом. В большинстве случаев, нейросеть с трудом «рисовала» флаг России, и при этом пыталась сгенерировать что-то похожее на флаг США, хотя в нашем запросе нет упоминаний американских символов.

Попробуем сгенерировать изначальный запрос у второй визуальной модели Midjourney, взаимодействуя через платформу Telegram с помощью бота, который отправляет API запросы на сервер Midjourney и возвращает ответ от сервиса. Ответ от нее представлен на рисунке №5

Рис. 4. Ответ Midjoumey на первый запрос.

Midjourney удалость полностью сгенерировать то, что мы просили: действие, лица президентов, которые легко распознать, фон, реалистичные позы. Можно прийти к выводу, что данная нейронная сеть справилась в разы лучше, чем Stable Dif fusion. Для достижения этого результата Midjourney понадобилась одна итерация, в отличие от первой модели.

Посмотрим, что сгенерирует вторая нейронная сеть на наш второй запрос. Ответ представлен на рисунке №5.

X Ваш запрос (текст или изображение) не прошли автоматическую проверку от нейросет Прочитайте правила нашего сервиса (/rules), при повторных нарушениях ваш аккаунт может быть заблокирован вне зависимости от типа подписки. 18 05

Рис. 4. Ответ Midjourney на второй запрос.

Midjourney выдал «ошибку» генерации и сообщил о том, что мы нарушаем правила использования нейронной сети.

Подводя итог авторского эксперимента, можно сказать, что нейросеть может как помогать создавать визуальный контент, так и противиться его созданию. Вопрос цензуры в рамках генерации изображения нейросетью стоит более остро, зачастую Stable Dif fusion генерирует американский флаг вместо запрашиваемого, Midjourney, в свою очередь, отказывается генерировать подобное вовсе, что подчёркивает популярность Stable Dif fuusion, которая выражается в количестве сгенерированных изображений за всё время существования генеративной модели и возможностями локального использования пользователями. Однако, если преподносить запрос нейросети в нейтральном контексте, например, рукопожатие двух лидеров держав, то результат получится успешным и вполне естественным. Этот авторский эксперимент демонстрирует необходимость дальнейшего серьёзного рассмотрения «установления контроля» над подобными технологиями, а также возможностями их применений. «Еще одним важным фактором, который необходимо учитывать для гармоничного развития и интеграции соответствующих технологий, является роль нормативно-правовой базы в формировании использования генеративных моделей в цифровых медиа. Например, правительства и соответствующие регулирующие органы могут попробовать принять некоторые законодательные меры для контроля и обеспечения точности и верификации подлинности контента, созданного с помощью этих моделей, особенно в таких направлениях, как новости и распространение информации в СМИ». Следует подчеркнуть, что данная работа призывает к внимательному обсуждению и разработке этических и правовых стандартов в области использования нейросетей в генерации контента. Она поднимает вопросы не только технического характера, но и вопросы, касающиеся ответственного внедрения и контроля за развитием подобных технологий. Научно-исследовательские данные прояснят, как эти модели будут

влиять на наше общество, и важно гарантировать, что их применение соответствует ценностям и нормам общества.

СПИСОК ЛИТЕРАТУРЫ:

1. Иевлев П. «Компания «ТЕКОМ» представила решение по обнаружению нецензурных слов в медиаконтенте» // URL: https://digitaloceanru/n/nejroseti-zapikayut-mat?ysclid=lok6xlh65k565974401 ;

2. Майка Р. «Как Трамп и фейки изменили медиа» / Дата публикации: 04.07.2018 / URL: https://russiancouncil.ru/analytics-and-comments/columns/united-states/kak-tramp-i-feyki-izmenili-media/?ysclid=lo07hqspf6479777356;

3. Норвиг П., Рассел С «Искусственный интеллект: современный подход.» / 1408 стр., с ил. ISBN 978-5-8459-1968-7, 0-13-790395-2 формат 70x100/16 твердый переплет тип бумаги: офсетная 2015, 2 кв. Вильямс. / URL: https://obuchalka.org/20200212118331/iskusstvennii-intellekt-sovremennii-podhod-rassel-s-norvig-p-2007.html?ysclid=lo04b1b5ci404375684;

4. Панов А.Ю. «Фейк-страница: ответственность за создание аккаунта с чужим именем» / Дата публикации: 31.01.2021 / URL: https://cpp-nnov.nalog.ru/blog/it-is-interesting/1575-fake-profile-in-social-network?ysclid=lo0703pdg4133902258;

5. Рашид Тарик: «Создаем нейронную сеть» / Издательство: Диалектика-Вильямс / Год выпуска: 2020 / URL: https://djvu.online/file/wyeysjnxs61Tb?ysclid=lon3t24f97387134416 ;

6. Центре цифрового искусства Artplay Media «искусство 2.0. нейрохудожник» / URL: https://artplaymedia.ru/exhibitions/neuroart;

7. Чернавский, А. С. Современные генеративные модели как актуальный феномен новых медиа - возможности и риски / А. С. Чернавский // Медиа-2023: теория и практика: 2023 - год педагога и наставника : материалы III международной научно-практической конференции, Москва, 02 марта 2023 года

/ Московский педагогический государственный университет. - Москва,: Московский педагогический государственный университет, 2023. - С. 165. ;

8. ARTPLAY «Мультимедийная выставка «Ван Гог. Письма к Тео»» / URL: https://www.artplay.ru/events/multimediynaya-vystavka-van-gog-pisma-k-teo-van-gogh-letters-theo.html?ysclid=lo082wmwrv92197979;

9. Data Science «Классификация и типы нейронных сетей» / Дата публикации: 13.10.2017 / URL: http://datascientist.one/class-type-nn/;

10. Everypixel Journal « AI Has Already Created As Many Images As Photographers Have Taken in 150 Years. Statistics for 2023» / https: //j ournal. everypixel. com/ai-

imagestatistics#:~:text=According%20to%20Emad%20Mostaque%2C%20CE0,milli on%20users%20across%20all%20channels ;

11. Rachel Halliburton «How big data helped secure Emmanuel Macron's astounding victory» / Дата публикации: 10.06.2017 / URL: https://www.prospectmagazine.co.uk/politics/44482/how-big-data-helped-secure-emmanuel-macrons-astounding-victory;

12. Retext.ai / URL: https://retext.ai/ru?ysclid=lo1fcu074y475368576;

13. Tanzina Vega «Online Data Helping Campaigns Customize Ads» / Feb. 20, 2012 / URL: https://www.nytimes.com/2012/02/21/us/politics/campaigns-use-microtargeting-to-attract-supporters.html

Mukhina K.I.

Moscow Pedagogical State University (Moscow, Russia)

Scientific advisor: Chernavsky A.S.

Moscow Pedagogical State University (Moscow, Russia)

ARTIFICIAL INTELLIGENCE TECHNOLOGIES IN MODERN CULTURE & POLITICAL SPHERE OF PUBLIC LIFE

Abstract: the paper analyzes the influence of generative models on the cultural sphere and politics. It describes the use of neural networks in creating realistic video games, music, art, as well as their impact on social networks and political processes. The work also addresses issues of internal censorship in the context of the work of modern generative AI models, emphasizing the need to combat disinformation and negative content. The methods of censorship, such as filters in machine learning, and their application in solving problems related to the creation and distribution of visual content are considered. In conclusion, the authors give an approximate example of visualization of genetic models that provide stable diffusion and intermediate transition.

Keywords: neural networks, generative models, modern culture, political sphere, machine learning, media communications, AI.

i Надоели баннеры? Вы всегда можете отключить рекламу.