Нейросетевые технологии анализа тональности мнений для реализации человек-ориентированной концепции трансформации городской среды
Д.Ю. Воронин, П.Н. Кузнецов, В.П. Евстигнеев, Р.Н. Литвинова, С.А. Митягин
Аннотация — Использование сквозных цифровых технологий повышения эффективности организации функционирования городских процессов и предоставления инновационных услуг составляет основу умного устойчивого города. Однако, в настоящее время остро возникает необходимость перехода от технологии-ориентированной парадигмы формирования умной городской среды к человек-ориентированной концепции, учитывающей индивидуальные потребности отдельных граждан и различных социальных групп, не ограничиваясь только лишь аспектами внедрения современных технических средств. В статье рассматривается применение нейросетевых технологий для формирования информационного обеспечения, необходимого для принятия эффективных решений по реализации человек-ориентированной концепции трансформации городской среды. Приведен пример формирования информационного обеспечения для реализации данной концепции при использовании рекуррентной нейронной сети с долгой краткосрочной памятью. Автоматизированный анализ тональности мнений горожан о внедрении инновационных решений в городскую среду, выраженных посредством использования социальных медиа ресурсов, удалось выполнить с довольно высокой точностью (более 95%).
Ключевые слова — Умный город, городская среда, человек-ориентированная концепция, системный подход, анализа тональности мнений, городские исследования, машинное обучение, нейронные сети
I. Введение
В современном мире информация становится наиболее востребованным и существенным ресурсом. Подтверждением этого является появление в медиа пространстве нового термина «нетократия», описывающего методику управления социумом,
Воронин Дмитрий Юрьевич, Севастопольский государственный университет, зав. базовой кафедры "Программная инженерия интеллектуальных систем", канд. технич. наук ([email protected]) Кузнецов Павел Николаевич, Севастопольский государственный университет, доцент кафедры "Возобновляемые источники энергии и электрические системы и сети", канд. технич. наук ([email protected])
Евстигнеев Владислав Павлович, Севастопольский государственный университет, вед. научн. сотр., канд. физ.-мат. наук ([email protected])
Литвинова Раиса Николаевна, Севастопольский государственный университет, старший преп., кафедры «Менеджмент и бизнес-аналитика» ([email protected])
Митягин Сергей Александрович, Университет ИТМО, директор Института дизайна и урбанистики, канд. технич. наук ([email protected])
используя исключительно информационные, а не материальные ресурсы [1]. Это связано с тем, что общество переживает новую фазу трансформационного развития, характеризующуюся повсеместной цифровизацией процессов жизнедеятельности и увеличения роли знаний в жизни каждого гражданина. Такая тенденция пронизывает абсолютно все сферы жизнедеятельности любого человека и формирует высокую значимость вопросов анализа, формирования и управления информационными ресурсами.
Грамотное оперирование информационными потоками дает возможность построить единую каскадную модель управления обществом. Использование даже незначительных фрагментов цифрового следа позволяет манипулировать отдельной личностью, предоставляя возможность формировать целенаправленное влияние не только на самого человека, но и на все его близкое окружение, используя его репутацию и авторитет в качестве рычага воздействия [1, 2]. Одним из таких инструментов являются социальные сети, например, «ВКонтакте», «Facebook», «Одноклассники.ги», которые кроме функций передачи и обмена мультимедийными сообщениями могут служить эффективным средством верификации идей трансформации городской среды, формируя чувство сопричастности и социального принятия этих процессов у горожан [3], что соответствует базовым принципам реализации человек-ориентированной концепции трансформации городской среды. Эффективное управление этими процессами возможно только при условии возможности измерения ключевых характеристик. Одной из таких характеристик является отклик населения на определенные информационные послания, выраженные в различной форме: комментарии, оценки, а также действия по распространению или блокированию соответствующего контента. На основании изучения полученных комплексных оценок в динамике можно выявлять определенную зависимость между содержанием информационных сообщений и эмоциональной реакцией населения, а также формировать прогнозные сценарии поведения потребителей контента различного содержания.
Таким образом, описанные особенности подтверждают актуальность задачи синтеза развитых инструментальных средств автоматического и
автоматизированного анализа тональности мнений граждан, базирующихся на использовании сквозных цифровых технологий.
В данной статье рассматривается подход формирования информационного обеспечения для реализации человек-ориентированной концепции трансформации городской среды. Для анализа тональности мнений граждан используются технологии машинного обучения. Применение предлагаемого подхода при создании комфортной городской среды для горожан должно обеспечить учет мнения различных социальных групп.
II. Анализ существующих методов и подходов
Современные инструменты анализа текстов чаще всего базируются на интеллектуальных методах, которые позволяют обрабатывать большие массивы данных. Такие задачи предполагают использование сложных алгоритмов, которые не всегда могут обеспечить высокую точность и скорость обработки. Для выявления скрытых структур и закономерностей, содержащихся в пользовательском контенте, а также типовых шаблонов и их сочетаний применяются следующие ключевые методики и программные продукты:
- интент-анализ (Ethnograph, Leximancer, Minnesota Contextual Content Analysis);
- контент-анализ (CrawdadDesktop, INTEXT, Kwalitan, PROTAN, Yoshikoder);
- фоносемантический анализ (Vaal, DIATON);
- дискурс-анализ (САТРАС);
- нарративный анализ (LIWC, PC-ACE);
- экспертная оценка текста;
- морфологический анализ (ATLAS.ti, Textanz, TextArc);
- синтаксический анализ (ProfilerPlus, DictaScope);
- семантический анализ (PROTAN, T-LAB) [4-9].
Однако использование этих методов сопровождается
рядом сложностей [4-9]:
- наличие существенной неопределенности в случаях, когда смысл слов и фраз отличается от буквально понимаемого, например, когда в них присутствует сарказм или ирония;
- необходимость идентификации сообщений, созданных спамерами и ботами;
- отсутствие широкого набора инструментов для анализа мнений в других языках, кроме английского;
- необходимость скрытой верификации демографической информации;
- наличие четких количественных критериев достаточности объема выборки.
Согласно [2], основные методы анализа, используемые при исследовании социальных сетей, базируются на теории графов, методах детектирования тональности текстовых сообщений, аудио и видео фрагментов. Авторами приведен перечень критериев для использования описанных методов при выявлении скрытых знаний, заключенные в пользовательском контенте. В [10] выделяют два основных подхода к решению задачи извлечения мнений: машинное обучение и лингвистические методы. Использование
методов машинного обучения становится наиболее популярным для повышения продуктивности обработки больших текстовых и минимизации возможных проблемных аспектов [4]. Обзор работ в этой области [4-10] позволяет выделить следующие подходы:
1. На базе устойчивых фраз-шаблонов и их сочетаний. Этот подход поддерживают такие инструменты, как Part-of-Speech-taggers и парсеры. Для идентификации часто используемых комбинаций предлагается использовать N-граммы, которые объединяются в слова. На основе принятой шкалы тональности текста N-граммам присваивается положительный или отрицательный рейтинг.
2. На базе обучающих фраз-образцов. Учебный образец определяется вручную экспертами в этой области, а далее используется для обучения различных классификаторов (простой байесовский классификатор, классификатор опорных векторов (SVM), искусственные нейронные сети (ANN) различных конфигураций).
3. Неуправляемое машинное обучение. Такой подход предполагает отсутствие ручной разметки для обучения модели, а также использование скрытых шаблонов, скрытого распределения и структур для извлечения информации из больших объемов немеченых данных.
4. Смешанные формы, предполагающие комбинацию методов машинного обучения и использования правил шаблонов.
5. Использование глубоких нейронных сетей. В данном случае модель предварительно обучают для решения конкретных задач, например, BERT, а затем используют её для изучения объекта.
Необходимо отметить, что основной проблемой при анализе социальных сетей остается выявление кластеров, объединяющих пользователей по различным интересам [11, 12], а точнее, формирование эффективных критериев для оценки «близости» характеристик акторов сети для отнесения их к общему сообществу [13 - 18]. Например, в [19] предлагается алгоритм гибридной кластеризации, основанный на алгоритмах GSA и DPC, в [20] авторы предложили алгоритм кластеризации гауссово-ориентированных графов для кластера социальных сетей, который для повышения точности ищет пользователя с максимальным сходством по отношению к ранее обнаруженному центральному пользователю. Следует отметить, что научная область кластеризации графов социальных сетей сформировалась довольно хаотично, и нет четких, общепринятых определений, что считать сообществом в социальных сетях [21]. Это вносит дополнительные сложности при формировании предиктивных маркеров для оценки психологического состояния общества. Таким образом, имеется острая потребность в разработке единой методики оценки психологического состояния общества, базирующаяся на консолидационных и протестных моделях поведенческих реакций акторов в виртуальной среде. Выделяют несколько групп теоретических моделей, объясняющих протестную активность [22-26]:
- концепция коллективного действия (теории заражения, конвергенции, возникновения норм, прирастающей ценности);
- концепция относительной депривации (теории аномии, социальной справедливости, прогрессивной депривации);
- концепция мобилизации ресурсов (экономическая и политическая версия);
- концепция рационального выбора (теория безбилетника, теория повстанца);
- концепция политических возможностей;
- концепция новых социальных движений.
По результатам выполненного обзора можно сделать следующий вывод. Большинство технических решений, к сожалению, лишь в некоторых случаях используют научно-практический потенциал современных технологий машинного обучения, что не позволяет в полной мере выявлять особенности причинно-следственных связей социологического характера в медийных ресурсах. Кроме того, существующие подходы в основном не ориентированы на формирование информационного обеспечения для реализации человек-ориентированной концепции трансформации городской среды.
III. СИСТЕМОТЕХНИЧЕСКИЙ АНАЛИЗ ВАРИАНТОВ РЕАЛИЗАЦИИ ЧЕЛОВЕК-ОРИЕНТИРОВАННОЙ КОНЦЕПЦИИ ТРАНСФОРМАЦИИ ГОРОДСКОЙ СРЕДЫ
Задача формулируется следующим образом: найти такой вариант реализации человек-ориентированной концепции трансформации городской среды
R = { r, r2,..., rm } , что Ф(г ) ^ max , q = 1, m .
I 1 2 m J q res
Здесь rq - кортеж, описывающий вариант
реализации человек-ориентированной концепции в q-ый момент времени, Ф(rq) - функция, оценивающая
эффективность трансформации городской среды при q-ом варианте реализации концепции (верификация реализована на основе анализа тональности мнений граждан в социальных сетях), ЭТ - множество допустимых вариантов реализации человек-ориентированной концепции. Для решения поставленной задачи необходимо сформировать информационную модель, описываемую кортежем ^ ИМХ, ИМY ^, где ИМX - кортеж входных данных,
ИМY - кортеж результирующей информации о выбранной оптимальной концепции трансформации городской среды.
ИМХ = (M, G, D, f) , где M - общий объем финансовых ресурсов, выделенных для
трансформации городской среды; G = ^Z, rz = |Z|
граф, задающий отношение связности между этапами мероприятий по цифровой трансформации городской среды, Z - множество вершин, которым поставлены в соответствие функционально-логические связи между различными этапами мероприятий; множество дуг rz характеризует трудоемкость реализации мероприятий;
Б = Гм = |0|2J - граф конфигурации финансового
обеспечения проекта, здесь Q - множество вершин графа (соответствуют выделенным денежным ресурсам на различные этапы цифровой трансформации), а Гк - множество дуг, которые поставлены в соответствие каналам перераспределения финансовых ресурсов;
ИМ¥ =( Ш, , ЪПр , Я , где Ш (г,, О, Б) -
результат отображения графа в на Б, г, еЭТ
представляет собой ,-ый вариант отображения графовых структур в ,-ый момент времени, причем
и ШЛр, ШО п ЭТПр = 0 ; ЭТ - множество всех
допустимых вариантов отображений, - слабо
эффективные результаты отображения, -
эффектные варианты реализации цифровой трансформации городской среды.
Для формирования информационной модели
^ ИМХ, ИМ ^ реализован программно-диалогового
комплекс, структурная схема которого представлена на рисунке 1.
Подсистема сбора и обработки априорной информации 1 Подсистема идентификации типа информационной ситуации -* •
-<—и —
ö
Подсистема анализа тональности мнений горожан 4 Адаптивный выбор варианта цифровой трансформации городской среды
-*—с—
<3
Информационное и методическое обеспечение 5 Лицо принимающее решение
в—
\ 1
_ Управляющие ь сигналы
г Информационные " сигналы
' Оптимальный вариант цифровой трансформации V городской среды
Рис. 1 - Обобщенная структурная схема программно-диалогового комплекса по обеспечению высокой готовности систем критического применения
Целью функционирования программно-диалогового комплекса является поиск оптимального варианта цифровой трансформации городской среды. Запуск процессов подготовки необходимой априорной информации для идентификации типа складывающейся информационной ситуации инициируется управляющим сигналом а. В результате выполнения данной операции из подсистемы сбора и обработки априорной информации в подсистему идентификации типа информационной ситуации передается информационный сигнал 1, описывающий необходимое информационное обеспечение для идентификации типа информационной ситуации
(сигнал 2). Ниже приводится описание используемых информационных и управляющих сигналов.
Управляющие сигналы:
a - подготовить необходимую априорную информацию для идентификации типа складывающейся информационной ситуации;
b - идентифицировать тип складывающейся информационной ситуации;
c - получить оценку текущих потерь для процедуры адаптивного выбора вариантов (анализ тональности мнений горожан);
d - получить оптимальную стратегию цифровой трансформации городской среды для складывающейся информационной ситуации;
e - получить необходимое информационное и методическое обеспечение для принятия решения о выборе оптимального варианта цифровой трансформации городской среды.
Информационные сигналы:
1 - необходимая информация для идентификации типа складывающейся информационной ситуации;
2 - тип складывающейся информационной ситуации;
3 - информация о текущей итерации процедуры адаптивного выбора вариантов;
4 - оценка текущего варианта цифровой трансформации цифровой среды на основе анализа тональности мнений горожан;
5 - необходимое информационное и методическое обеспечение для принятия решения о выборе оптимального варианта цифровой трансформации городской среды.
Одним из ключевых элементов программно-диалогового комплекса является подсистема анализа тональности мнений граждан, позволяющая на основе объективной методологии оценить общественное мнение на каждом этапе человек-ориентированной трансформации городской среды. Информационной основой такого анализа, как правило, служат данных социальных медиа.
IV. АНАЛИЗ ТОНАЛЬНОСТИ МНЕНИЙ ГОРОЖАН О КАЧЕСТВЕ ТРАНСФОРМАЦИИ ГОРОДСКОЙ СРЕДЫ
Нейронные сети зарекомендовали себя эффективным инструментом для решения задач анализа и кластеризации текстовой информации. В частности, для получения достоверных оценок общественного мнения, выражаемого посредством формирования комментариев в электронных сервисах о внедрении инновационных решений в городскую среду, в настоящей работе предлагается использовать рекуррентную нейронную сеть (Recurrent neural network - RNN) с долгой краткосрочной памятью (Long short-term memory -LSTM) [27]. Использование нейронной сети такого вида обусловлено повышенным качеством ее характеристик, проявляющихся при распознавании текстов и речи по сравнению с рядом других альтернатив (например, многослойные персептроны) [28].
Обучение нейронной сети проводилось на основе мнений, опубликованных на популярных интернет площадках размещения отзывов пользователей. Размер обучающей выборки составил около двух миллионов
записей. Непосредственно перед обучением нейронной сети была осуществлена бинарная классификация исходных данных, выполненная по следующему принципу: при оценивании пользователем в одну, две и три звезды отзыв считался «негативным», а, в случае четырех и пяти звезд - «положительным».
Программная реализация модуля была написана на высокоуровневом языке программирования Python, используя бесплатный облачный сервис для разработчиков искусственного интеллекта Google Colab. Данный сервис позволяет разрабатывать приложения для обучения многослойных нейронных сетей из браузера, предоставляя вычислительные мощности производительного графического процессора NVIDIA Tesla K80 с 13 Гб видеопамяти. Наличие GPU ускорителя является критическим фактором для повышения скорости обучения моделей глубинных нейронных сетей, без которого практически невозможно полноценно экспериментировать со структурой нейронной сети. По умолчанию Colaboratory не использует ускорителей вычислений GPU или TPU. Подключить их можно в меню Runtime -> Change runtime type -> Hardware accelerator. В появившемся списке выбираем «GPU» или «TPU» После выбора типа ускорителя виртуальная машина, к которой подключается ноутбук Colaboratory, перезапустится и станет доступен выбранный режим.
Достоинствами данного сервиса также является то, что в нем предустановлено большинство необходимых для работы библиотек. При этом, в случае необходимости, также поддерживается возможность установки требуемого пакета. Ещё одним немаловажным достоинством является возможность производить в Colaboratory совместную работу над написанием и тестированием программного года.
Для обучения нейронной сети использовалась открытая программная библиотека машинного обучения - TensorFlow. Данный инструмент является разработкой компании Google и имеет открытый код, что позволяет гибко встраивать его для решения различных задач. По своему функционалу TensorFlow является довольно мощным инструментом с широкими функциональными возможностями, однако эффективное взаимодействие с системой требует высокой квалификации программиста. Ввиду этого, для работы с данным инструментальным средством была применена библиотека Keras, являющейся надстройкой над библиотекой TensorFlow и позволяющей существенно упростить процедуры формирования нейронной сети [27].
Для загрузки данных из файла и удобного их представления в виде табличной структуры, была использована библиотека Pandas, являющаяся надстройкой над библиотекой NumPy [28]. При этом, столбцами DataFrame выступают именованные объекты, указывающие на отзыв и соответствующую ему оценку (класс).
train = pd.read_csv('opinions_city.csv',
header=None,
names=['Rating', 'Opinions'])
Преобразование текстов отзывов к виду, адаптированному для работы с нейронной сетью, было
выполнено при помощи встроенного в Keras класса Tokenizer, заменяющего слова цифровыми кодами в соответствии с частотой их употребления.
С целью увеличения производительности нейронной сети без снижения её эффективности, максимальное значение анализируемых слов было ограничено 10 тысячами (наиболее часто встречающимися в обучающей выборке словами), а размер отзыва был ограничен 140 словами. num_words = 10000 max_Feedback_len = 140 tokenizer = Tokenizer(num_words=num_words)
При создании нейронной сети была использована архитектура, состоящая из трёх последовательно соединенных (Sequential) слоев:
- 1-й слой: Embedding c размером векторного пространства - 64;
- 2-й слой: LSTM, образованный 160 блоками;
- 3-й слой: Dense, состоящий из 1-го нейрона, ввиду бинарной классификации, с функцией активации Сигмоида (sigmoid), дающий на выходе вещественное число в интервале от 0 до 1.
model = Sequential() model.add(Embedding(num_words, 64, input_length=max_Feedback_len)) model.add(LSTM(160)) model.add(Dense(1, activation='sigmoid'))
Для компиляции нейронной сети, был использован алгоритм оптимизации «Adam» (adaptive moment estimation). Для вывода потерь использовалась функция «Binary crossentropy», а для вычисления доли правильных ответов - метрика «Accuracy».
model.compile(optimizer='adam',
loss='binary_crossentropy',
metrics=['accuracy'])
Для недопущения «переобучения» нейронной сети была задействована функция Callback, позволяющая сохранять результаты обучения нейронной сети после прохождения каждой эпохи. Причем данная функция была настроена таким образом, чтобы после окончания очередной эпохи обучения параметры модели, полученные при текущей итерации, сохраняются лишь в том случае, если число верных ответов при анализе тестовой выборки возросло.
model_save_path = ' nice_model.h' checkpoint_callback= ModelCheckpoint(model_save_path, monitor='val_accuracy',save_best_only=True, verbose=1)
На рис. 2 представлен график, отражающий эффективность обучения нейронной сети. отображаются функциональные зависимости доли правильных ответов от числа пройденных эпох обучения сети (для тестовой и обучающей выборки).
Результаты, полученные при использовании описанной выше методики, показывают, что применение нейронных сетей глубокого обучения
позволяет с довольно высокой точностью выявлять тональность отзывов. Точность классификации, полученная на тестовой выборке объемом более 6 тысяч отзывов, составила не менее 95 %.
При этом необходимо отметить, что после 2-й эпохи обучения, доля верных ответов при анализе тестовой выборки снизилась. Это говорит о том, что нейронная сеть «переобучилась».
Эпоха
Рис. 2 - График зависимости доли правильных ответов нейронной сети в зависимости от количества эпох обучения
Из чего следует вывод, что использование более трех эпох не является целесообразным, так как дальнейшее повышение временных затрат не приводит к увеличению точности классификации. При использовании предлагаемого подхода был произведен анализ различных вариантов цифровой трансформации городской среды для складывающихся информационных ситуаций, характерных для апреля 2019 г. (рис 3) и апреля 2020 г (рис.4). В качестве основных критериев верификации вариантов цифровой трансформации были выбраны: тональность мнения горожан и их возраст.
В качестве анализируемых альтернатив были выбраны следующие направления цифровой трансформации:
- модернизация объектов ЖКХ (вариант А);
- электронные сервисы дистанционного получения услуг (заказ продуктов питания, товаров) и т.п. (вариант В);
- внедрение систем комплексной безопасности, в том числе, систем видео-наблюдения (вариант С);
- фокусировка на объектах рекреационного и туристического назначения, включая развитие парковых зон (вариант В).
Мероприятия, связанные с реализацией варианта А традиционно интересуют граждан, изменение возраста интересантов практически не наблюдается. Увеличение возраста интересантов для варианта трансформации В характеризируется появлением дополнительных ограничений для реализации традиционного способа получения услуг. Например, граждане, активно посещающие кафе и рестораны, вынуждены пользоваться службами доставки еды. Мероприятия, связанные с реализацией варианта С стабильно имеют низкую поддержку у населения. Однако, изменение информационной ситуации характеризуется сменой возрастной группы интересантов. Вероятно, причиной этого является введение ограничительных мероприятий:
автомобилисты существенно снижают интенсивность своих перемещений, а горожане 20-летнего возраста, не имеющие собственных транспортных средств, предполагают, что системы видеонаблюдения будут ориентированы на детектирование случаев нарушения режима самоизоляции.
Снижение интереса горожан для варианта Б обусловлено введением режима всеобщей самоизоляции и другими ограничительными мероприятиями, направленными на противодействие распространению коронавирусной инфекцией на территории Российской Федерации.
Рис. 3 - Диаграмма рассеяния, верифицирующая варианты цифровой трансформации городской среды для информационной ситуации, сложившейся в апреле 2019 г.
Таким образом, приведенный подход к визуализации эффективности вариантов цифровой трансформации городской среды может быть мощным инструментом при оценке различного рода инициатив в режиме реального времени. Это позволит создать единую систему приоритетов для городского планирования в среднесрочной и краткосрочной перспективе.
V. Заключение и направления дальнейших исследований
Процессы перехода от технологии-ориентированной парадигмы формирования умной городской среды к человек-ориентированной концепции, учитывающей индивидуальные потребности отдельных граждан и различных социальных групп, требует создания развитых информационных технологий верификации мероприятий по цифровой трансформации городской среды, базирующихся на использовании мнений горожан, оцененных при помощи рекуррентной нейронной сети, используя фреймворк Тешо^о^^. Описанный в статье подход ориентирован на обеспечение лиц, принимающих решения, необходимым информационным
обеспечением, позволяющим формировать
аргументированные, взвешенные решения по развитию городских территорий. Приведен пример использования предлагаемого подхода для анализа различных вариантов цифровой трансформации городской среды при различных информационных ситуациях. Предлагаемый подход, позволяет в том числе формировать диаграммы рассеяния, которые являются мощным средством визуализации при оценке различных стратегий цифровой трансформации городской среды.
Этот подход может быть полезен для создания комфортных городов, предоставляющих необходимые, желательные и дополнительные возможности для горожан с точки зрения их взаимодействия с городской средой. То есть создания более конкурентоспособных и привлекательных городов для жизни. В дальнейшем планируется развивать проект и включить в цифровую модель самообучающийся элемент для обеспечения возможности автоматического анализа складывающихся информационных ситуаций без участия человека, а также внедрить ГИС-технологии, имитационное моделирование, статистический и интеллектуальный анализ данных и другие технологии, развиваемые, в том числе, для рынков будущего - в рамках концепции Национальной технологической инициативы.
Исследование выполнено при частичной финансовой поддержке РФФИ и Правительства Севастополя в рамках научного проекта №20-47-920006, а также Севастопольского государственного университета в рамках внутреннего гранта №28/06-31 по проекту «Развитие методов агентного моделирования и больших данных для анализа социальных медиа в постконфликтных обществах» и №513/06-31 по проекту «Технологии Больших Данных при проактивном управлении телекоммуникационными системами».
Рис. 4 - Диаграмма рассеяния, верифицирующая варианты
цифровой трансформации городской среды для информационной ситуации, сложившейся в апреле 2020 г.
Библиография
[1] Губанов Д.А., Новиков Д.А., Чхартишвили А.Г. Социальные сети:
модели информационного влияния, управления и противоборства. - 3 изд. - М.: МЦНМО, 2018. - 224 с.
[2] Губанов Д.А., Новиков Д.А., Чхартишвили А.Г. Модели
репутации и информационного управления в социальных сетях // Математическая теория игр и ее приложения. - 2009. - №2. -С. 14 - 37.
[3] Митягин С.А., Воронин Д.Ю., Соболевский С.Л., Дрожжин А.И.,
Евстигнеев В.П., Садовникова Н.П., Парыгин Д.С., Чугунов А.В. Цифровая модель города: принципы и подходы к реализации // International journal of open information technologies. - 2019. - №7 (12). - С. 94 - 103.
[4] Tarasov D.S. Deep Recurrent Neural Networks for Multiple Language
Aspect-Based Sentiment Analysis // Proceedings of the International Conference "Dialogue-2015" (Moscow, Russia, May 27-30, 2015), Computational Linguistics and Intellectual Technologies, 2015. P. 65 -74.
[5] Prabowo R., Thelwall M. Sentiment analysis: A combined approach //
Journal of Informetrics. - 2009. - №2. - P. 143 - 157.
[6] Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. Bert. Pre-training of
deep bidi-rectional transformers for language understanding // ArXiv. Preprint arXiv:1810.04805 - 2018.
[7] Tandel S. S., Jamadar A., Dudugu S. A. Survey on Text Mining
Techniques // 5th International Conference on Advanced Computing & Communication Systems (ICACCS). - IEEE, 2019. - P. 1022 -1026.
[8] Kuckartz U. Qualitative text analysis: A systematic approach //
Compendium for early career researchers in mathematics education. -Springer, Cham, 2019. - P. 181 - 197.
[9] Беляков М.В. Анализ новостных сообщений сайта МИД РФ
методом контент-анализа // Вестник российского университета дружбы народов. Серия: теория языка, семиотика, семантика. -2016. - №4. - С. 115 - 124.
[10] Дудина В.И., Юдина Д.И. Извлекая мнения из сети Интернет: могут ли методы анализа текстов заменить опросы общественного мнения? // Мониторинг общественного мнения: Экономические и социальные перемены. - 2017. - № 5. - С. 63 -78.
[11] Youngchul C., Junghoo C. Social-network analysis using topic models // Proceedings of the 35th international ACM SIGIR conference on Research and development in information retrieval (SIGIR '12). -ACM, NY. - 2012. P. 565 - 574.
[12] Huang X. et al. Learning from networks: Algorithms, theory, and applications // Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. - 2019. -P. 3221 - 3222.
[13] Yousefi Nooraie R. et al. Social network analysis: An example of fusion between quantitative and qualitative methods // Journal of Mixed Methods Research. - 2020. - Vol. 14. - № 1. - P. 110 - 124.
[14] Y. Chen, J. Hu, H. Zhao, Y. Xiao, P. Hui. Measurement and Analysis of the Swarm Social Network with Tens of Millions of Nodes // IEEE Access. - 2018. - P. 4547 - 4559.
[15] Truong Q. D., Truong Q. B., Dkaki T. Graph Methods for Social Network Analysis // International Conference on Nature of Computation and Communication. - Springer, Cham, 2016. - P. 276 - 286.
[16] Taniarza N., Maharani W. Social network analysis using k-Path centrality method // Journal of Physics: Conference Series. 2018. Vol. 971.
[17] Yang J., McAuley J., Leskovec J. Community Detection in Networks with Node Attributes // 13th International Conference on Data Mining, Dallas, TX, 2013. - P. 1151 - 1156.
[18] Lee C., Wilkinson D. J. A Social Network Analysis of Articles on Social Network Analysis // ArXiv. - 2018. - abs/1810.09781.
[19] Sun L. et al. An optimized clustering method with improved cluster
center for social network based on gravitational search algorithm // International Conference on Industrial IoT Technologies and Applications. - Springer, Cham, 2017. - P. 61 - 71.
[20] Sun Y., Yin S., Li H., Teng L., Karim S. GPOGC: Gaussian Pigeon-Oriented Graph Clustering Algorithm for Social Networks Cluster // IEEE Access.- 2019. Vol. 7 — P. 99254 - 99262
[21] Fortunato S. Community detection in graphs. Physics Reports // ArXiv.- 2010. - №486. - P. 75 - 174.
[22] Smelser N. J. Theory of Collective Behavior. - London: Routledge, 2013. - 484 p.
[23] Гарр Т.Р. Почему люди бунтуют. - СПб: Питер, 2005. - 461 с.
[24] McAdam D., S. Tarrow, C. Tilly. Dynamics of Contention. -Cambridge: Cambridge University Press, 2001. - 412 p.
[25] Opp K. D. Theories of Political Protest and Social Movements. - New York: Routledge, 2009. - 424 p.
[26] Kendall D. Sociology in Our Times. - Boston: Massachusetts: Cengage Learning, 2012. - 704 p.
[27] Sak H., Senior A., Beaufays F. Long short-term memory recurrent neural network architectures for large-scale acoustic modeling // Proceedings of the Annual Conference of the International Speech Communication Association. 2014.- P. 338-342.
[28] Xiangang L., Xihong W. Constructing Long Short-Term Memory based Deep Recurrent Neural Networks for Large Vocabulary Speech Recognition // IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 2015. - P. 4520 - 4524. DOI: 10.1109/ICASSP.2015.7178826.
Neural network technologies for analysis of opinion tonality for realization of human-oriented concept of urban environment
transformation
Dmitri Yu. Voronin, Pavel N. Kuznetsov, Vladislav P. Evstigneev, Rajisa N. Litvinova, Sergei A. Mityagin
Abstract — The basis of the smart sustainable city's concept lies in application of the end-to-end digital technologies to improve organization of urban processes and innovative services. However, nowadays, there is an acute need in transition from a technology-oriented to a human-oriented paradigm of "sustainable smart cities" taking into account personal demands of citizens and various social groups rather than just implementing modern technical innovations. The present study deals with application of artificial neural network to informational support of effective decisions within implementation of the human-oriented concept of transformation of the urban environment. An example of such an informational support for the concept to be realized using a recursive neural network with long short-term memory is provided. Highly accurate (over 95%) automated analysis of tonality of citizens' opinions on implementation of innovations into the urban environment has been performed using social media data.
Keywords — Smart city, urban environment, human-oriented concept, systemic approach, opinions' tonality analysis, urban research, machine learning, artificial neural network
References
[1] Gubanov D.A., Novikov D.A., Chkhartishvili A.G. Social networks:
models of informational influence, management and confrontation. -3rd ed.- M.: MCME, 2018. - 224 p. (in Russian)
[2] Gubanov D.A., Novikov D.A., Chkhartishvili A.G. Models of
reputation and information management in social networks // Mathematical theory of games and its applications. - 2009. - №2. - P. 14 - 37. (in Russian)
[3] Mityagin S.A., Voronin D.Yu., Sobolevsky S.L., Drozhzhin A.I.,
Evstigneev V.P., Sadovnikova N.P., Parygin D.S., Chugunov A.V. Digital model of the city: principles and approaches to implementation // International journal of open information technologies. - 2019. - №>7 (12). - P. 94 - 103. (in Russian)
[4] Tarasov D.S. Deep Recurrent Neural Networks for Multiple Language
Aspect-Based Sentiment Analysis // Proceedings of the International Conference "Dialogue-2015" (Moscow, Russia, May 27-30, 2015), Computational Linguistics and Intellectual Technologies, 2015. P. 65 -74.
[5] Prabowo R., Thelwall M. Sentiment analysis: A combined approach //
Journal of Informetrics. - 2009. - №2. - P. 143 - 157.
[6] Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. Bert. Pre-training of
deep bidi-rectional transformers for language understanding // ArXiv. Preprint arXiv:1810.04805 - 2018.
[7] Tandel S. S., Jamadar A., Dudugu S. A. Survey on Text Mining
Techniques // 5th International Conference on Advanced Computing & Communication Systems (ICACCS). - IEEE, 2019. - P. 1022 -1026.
[8] Kuckartz U. Qualitative text analysis: A systematic approach //
Compendium for early career researchers in mathematics education. -Springer, Cham, 2019. - P. 181 - 197.
[9] Belyakov M.V. Analysis of news messages on the website of the
Ministry of Foreign Affairs of the Russian Federation by the method of content analysis // Bulletin of the Peoples' Friendship University of Russia. Series: theory of language, semiotics, semantics. - 2016. - №4. - P. 115 - 124.
[10] Dudina V.I., Yudina D.I. Extracting opinions from the Internet: can text analysis methods replace polls? // Monitoring public opinion: Economic and social changes. - 2017. - № 5. - P. 63 -78. (in Russian)
[11] Youngchul C., Junghoo C. Social-network analysis using topic models // Proceedings of the 35th international ACM SIGIR conference on Research and development in information retrieval (SIGIR '12). -ACM, NY. - 2012. P. 565 - 574.
[12] Huang X. et al. Learning from networks: Algorithms, theory, and applications // Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. - 2019. - P. 3221 - 3222.
[13] Yousefi Nooraie R. et al. Social network analysis: An example of fusion between quantitative and qualitative methods // Journal of Mixed Methods Research. - 2020. - Vol. 14. - № 1. - P. 110 - 124.
[14] Y. Chen, J. Hu, H. Zhao, Y. Xiao, P. Hui. Measurement and Analysis of the Swarm Social Network with Tens of Millions of Nodes // IEEE Access. - 2018. - P. 4547 - 4559.
[15] Truong Q. D., Truong Q. B., Dkaki T. Graph Methods for Social Network Analysis // International Conference on Nature of Computation and Communication. - Springer, Cham, 2016. - P. 276 - 286.
[16] Taniarza N., Maharani W. Social network analysis using k-Path centrality method // Journal of Physics: Conference Series. 2018. Vol. 971.
[17] Yang J., McAuley J., Leskovec J. Community Detection in Networks with Node Attributes // 13th International Conference on Data Mining, Dallas, TX, 2013. - P. 1151 - 1156.
[18] Lee C., Wilkinson D. J. A Social Network Analysis of Articles on Social Network Analysis // ArXiv. - 2018. - abs/1810.09781.
[19] Sun L. et al. An optimized clustering method with improved cluster center for social network based on gravitational search algorithm // International Conference on Industrial IoT Technologies and Applications. - Springer, Cham, 2017. - P. 61 - 71.
[20] Sun Y., Yin S., Li H., Teng L., Karim S. GPOGC: Gaussian Pigeon-Oriented Graph Clustering Algorithm for Social Networks Cluster // IEEE Access.- 2019. Vol. 7 — P. 99254 - 99262
[21] Fortunata S. Community detection in graphs. Physics Reports // ArXiv.- 2010. - №486. - P. 75 - 174.
[22] Smelser N. J. Theory of Collective Behavior. - London: Routledge, 2013. - 484 p.
[23] Garr, T.R. Why do people rebel [Text] / T. R. Garr. - St. Petersburg: Peter, 2005. - 461 p. (in Russian)
[24] McAdam D., S. Tarrow, C. Tilly. Dynamics of Contention. -Cambridge: Cambridge University Press, 2001. - 412 p.
[25] Opp K. D. Theories of Political Protest and Social Movements. - New York: Routledge, 2009. - 424 p.
[26] Kendall D. Sociology in Our Times. - Boston: Massachusetts: Cengage Learning, 2012. - 704 p.
[27] Sak H., Senior A., Beaufays F. Long short-term memory recurrent neural network architectures for large-scale acoustic modeling // Proceedings of the Annual Conference of the International Speech Communication Association. 2014. - P. 338-342.
[28] Xiangang L., Xihong W. Constructing Long Short-Term Memory based Deep Recurrent Neural Networks for Large Vocabulary Speech Recognition // IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 2015. - P. 4520 - 4524. DOI: 10.1109/ICASSP.2015.7178826.