Научная статья на тему 'СЛОВАРЬ СЕТЕВЫХ И СВЯЗАННЫХ ТЕРМИНОВ'

СЛОВАРЬ СЕТЕВЫХ И СВЯЗАННЫХ ТЕРМИНОВ Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
144
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Редакция Журнала

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «СЛОВАРЬ СЕТЕВЫХ И СВЯЗАННЫХ ТЕРМИНОВ»

СЛОВАРЬ СЕТЕВЫХ И СВЯЗАННЫХ ТЕРМИНОВ

В словаре представлены термины, упоминаемые авторами статей настоящего сборника. Некоторые из них кажутся самоочевидными и понятными из контекста. Но, поскольку мы стараемся работать в жанре научно-популярных публикаций, научная составляющая для нас основа популяризации, она является базой представленных исследований. Мы стараемся сделать понятной научную составляющую, а не новомодным идеям придать шарм научности.

В словарь вошли ключевые термины, на осмысление, теоретическую, методологическую и математическую интерпретацию которых у сетевиков ушло значительное время - иногда десятилетия. Желая отдать дань уважения ученым, которые стояли у истоков современного сетевого анализа, мы в словарных статьях упоминаем имена, которые невозможно не знать, если интересуешься сетевым анализом.

В то же время сетевой анализ - современное научное направление, которое динамично развивается, и значит, некоторые понятия еще находятся в процессе становления. Для них нет устойчивого русскоязычного перевода, поэтому некоторые термины продублированы на английском языке.

Мы не претендуем на полноту представления характерной сетевой терминологии, скорее, это подборка базовых понятий и некоторых ключевых тем, в направлении которых работают эксперты «Сетей 4.0». После каждой словарной статьи приводится список литературы, чтобы заинтересованный читатель сам мог разобраться подробнее с каждым термином. Кроме того, там приведены формулы, описанием которых мы не стали обременять читателя в этом издании.

Словарные статьи представлены в последовательности, соответствующей развитию концептуализации и преемственности прочтения, не в алфавитном порядке.

Когда речь идет о развивающемся и сравнительно молодом научном направлении, ключевые концепты развиваются группами, оказывая влияние друг на друга. Поэтому в конце каждой словарной статьи приведены связанные понятия, упоминание которых поможет сконцентрировать внимание читателей в интересующем направлении. Некоторые из связанных понятий есть в нашем словаре, некоторые описаны в указанной литературе, прочтение которой поможет глубже изучить такое интересное научное направление, как сетевые исследования.

В составлении словарных статей принимали участие

Г. В. Градоссльская, М. А. Пильгуп, А. Н. Расходчиков, О. Р. Михайлова, Т. £ Щеглова, А. Д. Волгин.

СЕТЕВОЙ АНАЛИЗ

Сетевой анализ - особая философия рассмотрения и обработки данных в социальных науках, которая изучает социальную реальность как структурные отношения между социальными единицами, наблюдаемые в реальности или моделируемые по результатам исследования.

Концепция социальных сетей сформировалась в западных исследованиях в конце 70-х годов XX века. Показателем того, что сетевой подход получил признание в мире, является основание в 1978 году общества INSNA - International network for social network analysis (https://www.insna.org/).

Чуть позже начинают выходить два журнала, посвященных сетевым исследованиям: Connections, Social network.

В научной теории, особенно современной, идентификация дисциплины происходит по именам наиболее ярких ученых. Можно назвать «релевантные имена» и в сетевом анализе, упоминания которых определяют одну из самых интересных современных социологических теорий:

1. Б. Веллман (В. Wellman), профессор социологии, университет Торонто в NetLab Network. Написал одну из базовых работ по сетевому анализу Network analysis: some basic principles (1985). Основоположник, методолог сетевого анализа. В настоящее время под его редакцией выходят сборники конкретных исследований с применением методов социальных сетей;

2. Л. Фриман (L. Freeman), редактор-основатель журнала Social network в 1979 году, разрабатывал наиболее известные сегодня сетевые индикаторы (в том числе меры цен-тральностей);

Ъ. С. Вассерман (S. Wassermsn), профессор психологии, статистики и социологии. Вместе с К. Фауст (К. Faust) написал фундаментальную книгу по методологии социальных сетей Social network analysis (1994);

4. Д. Ноук (D. Knoke), профессор социологии, университет Миннесоты. Вместе с Дж. Куклински (J. H. Kuklinski) написал книгу Network analysis (1982), второе издание -2008 год. В настоящее время проводит прикладные сетевые исследования, прежде всего в области политики.

Можно выделить несколько предпосылок институциализации сетевого анализа: математическую, теоретическую и исследовательско-прикладную.

Начнем с очевидного - математического базиса сетевого анализа - теории графов. Именно этот раздел дискретной математики прежде всего был задействован для решения конкретных прикладных задач. В процессе развития сетевого подхода для каждого теоретического социологического концепта (актора, ресурса и т.д.) находилось математическое выражение в терминах теории графов (вершина, ребро и т.д.). В России теория графов широко использовалась, получив распространение прежде всего в технических и информационных дисциплинах, прикладной математике и т.п. Поэтому не было недостатка ни в учебниках по теории графов, ни в преподавателях. В социологии теория графов получила меньшее распространение, ее преподавали и использовали в исследованиях ученые, пришедшие из технических, математических дисциплин. Долгое время, пожалуй, единственным широко известным социологам учебником по теории графов на русском языке оставалось издание 1977 года «Исчисление графов» (авторы Ф. Харари и Э. Палмер). Однако сетевой анализ, заимствовав многое из теории графов, и прежде всего способы моделирования дискретного объекта, привнес свое видение, свои подходы и методы моделирования, что также характеризует его как сложившуюся дисциплину, особую методологию анализа данных.

Другое направление, оказавшее серьезнейшее влияние на формирование сетевого анализа, - прикладные исследования. Ученые из разных областей знания при решении конкретных задач независимо друг от друга приходили к выводу о важности структурной позиции акторов в тех или иных сообществах, о влиянии структурной позиции на

выполняемые роли, перераспределяемые ресурсы и пр. Структурные закономерности выявлялись в психологических исследованиях; антропологических исследованиях; организационных исследованиях корпоративной структуры; исследованиях рынков и пр.

И, наконец, третья важнейшая предпосылка возникновения сетевого анализа, его обоснование - новые теоретические концепции как в социологии, так и в экономике, которые бурно развивались в 80-х - 90-х годах XX века.

В экономике и социологии важную роль в дискретизации объекта исследования сыграли: теории социального капитала, человеческого капитала, теории обмена.

Важнейшую роль в понимании необходимости дискретизации структур сыграла активистская парадигма, поскольку достаточно прозрачно обосновала необходимость актора - краеугольного понятия сетевого анализа. Наряду с социальными структурами существуют и социальные атомы, или единицы социального взаимодействия. Но до сих пор нет единого мнения о том, кто является этой самой неделимой частицей. Разные теории останавливают процесс атомизации на уровне, необходимом для данного исследования или концепции. Надо заметить, что личность не исчерпывает перечня единиц социального взаимодействия. В данном случае правильнее говорить об акторе, или агенте взаимодействия.

Значимый вклад в теоретическую компоненту сетевого анализа внесли: реляционная социология и акторно-сетевой подход (Д. В. Мальцева).

Сетевой анализ, в отличие от многих сложившихся теоретических концепций, развивался снизу, исходя из практических потребностей исследователей, поэтому его теоретическая часть не является стройной и монолитной. Возможно, это его сильная сторона, поскольку он способен гибко меняться и не разрушится от накопленных противоречий в столкновении с реальностью, как, например, это произошло в свое время со структурным функционализмом.

Такая теоретическая разношерстность оказывает свое влияние и на современное развитие самого сетевого анализа. Сетевой анализ не является единым, теоретически однородным научным направлением. Теоретические концепты здесь возникают скорее под влиянием некоей моды или появления нового явления, требующего изучения, чем под влиянием четкого понимания объекта и предмета своего научного направления.

Связанные понятия

Социальные сети, теория графов, современные социологические теории, актор-но-сетевой подход, реляционная теория

Список литературы

1. Градосельская Г. В. Сетевые измерения в социологии: Учебное пособие / Под ред. Г. С. Батыгина. - М.: Издательский дом «Новый учебник», 2004.

2. Градосельская Г. В. Бизнес-сети в России. - М.: Издательский дом Высшей школы экономики, 2014.

3. Мальцева Д. В. Сетевой подход в социологии: генезис идей и применение. - Новосибирск, 2017.

4. Харари Ф., Палмер Э. Перечисление графов. - М.: «Мир», 1977.

5. Turner J. S. The structure of sociological theory: 5th ed. - Wadsworth Publishing Company, 2002.

6.WassermanS., Faust K. Social network analysis:methods and applications. - Cambridge: Cambridge University Press, 1994.

7. Knoke D., Yang S. Social network analysis: 2nd ed. - Sage, 2008.

8. Borgatti S. P., Everett M. G., Johnson J. C. Analyzing social networks. - Sage, 2013.

9. https://www.insna.org/

ТЕОРИЯ ГРАФОВ

Теория графов - раздел дискретной математики, занимающийся изучением свойств графов - математических структур, используемых для моделирования связей между объектами или частями сложных систем.

Родоначальником теории графов принято считать выдающегося математика Леонарда Эйлера, который в 1736 году опубликовал статью о кёнигсбергских мостах, считающуюся первой в истории статьей о теории графов. Необходимо было найти такой путь по всем семи городским мостам Кёнигсберга, в котором бы переход по каждому из мостов не повторялся дважды. Эйлер доказал, что это невозможно, и тем самым изобрел понятие эйлеровых циклов.

Само понятие «граф» было введено английским математиком Джеймсом Джозефом Сильвестром в статье, опубликованной в журнале Nature, где он проводил аналогию между «квантовыми инвариантами» и «ковариантами» в алгебре и молекулярными диаграммами. Первый учебник по теории графов был написан Денешом Кёнигом и опубликован в 1936 году. Другой учебник, написанный Фрэнком Харари, вышел в свет в 1969 году и был во всем мире признан авторитетным ресурсом по теории графов, что позволило математикам, химикам, инженерам и социологам установить междисциплинарный диалог в данной области.

Определение 1. Графом G называется совокупность двух множеств: множества точек V и множества линий Е, причем каждая линия, принадлежащая множеству Е, соединяет ровно две точки, принадлежащие множеству V.

Название элементов теории графов долгое время носило хаотический характер.

Ф. Харари в 1970-х годах провел терминологическое упорядочение, теперь в большинстве книг по теории графов приводятся его названия.

В теории графов элементы V носят названия: точка (point), вершина (vertex), узел (node). В сетевом анализе эти же элементы называются акторы (actors).

Элементы Е носят названия: линия (Line), ребро (edge), дуга (arc). В сетевом анализе эти же элементы чаще всего называются связями (connections).

При моделировании естественных процессов связи между вершинами редко бывают нейтральными и направленными. Можно придать взаимодействию направление, и тогда придем к определению ориентированных графов.

Определение 2. Если пары в наборе Е являются упорядоченными, то граф называется ориентированным (кратко - орграфом) и обозначается D (каждому ребру приписывается направление). Ребра орграфа называются дугами.

Если появляется понятие направления взаимодействий между акторами, следующим этапом становится измерение их силы. Тогда можно сформулировать определение взвешенных, или нагруженных, графов.

Определение 3. Назовем орграф D = (V, Е) нагруженным, если на множестве дуг Е определена некоторая функция: E-"R, которую часто называют весовой функцией. Тем самым в нагруженном орграфе D каждой дуге поставлено в соответствие некоторое действительное число 1(e).

Спустя более века после публикации статьи Эйлера о кёнигсбергских мостах Артур Кэли в рамках дифференциальных исчислений положил начало исследованиям деревьев - отдельного класса графов. Работы Кэли, основанные преимущественно на методах исчисления графов - раздела перечислительной комбинаторики, имели важнейшее значение для теоретической химии.

Теория графов является составной частью других математических направлений. Среди них: кибернетика; теория игр; теория вероятностей (цепи Маркова); социолингвистика, математическая лингвистика; FCA - Formal Concept Analysis; Data Mining

(представление данных в виде гиперкуба - OLAP-куб); деревья решений (CHAID-analysis) и др.

Современные направления развития теории гргфов: симплекс-графы; случайные графы; раскраска графов; теория автоматов; теория решеток и др.

Теория графов активно используется современной наукой.

В компьютерных науках графы применяются для представления телекоммуникационных сетей, организации данных, вычислительных устройств, потока вычислений и т.п. Например, структура ссылок веб-сайта может быть представлена ориентированным графом, в котором вершины - это веб-страницы, а направленные ребра - ссылки между страницами.

Теория графов играет важную роль в моделировании электрических сетей, где веса связаны с сопротивлением сегментов провода для получения электрических свойств сетевых структур.

Можно моделировать процессы в социальных медиа, в области путешествий, биологии, разработке компьютерных чипов, в сфере картирования развития эпидемий и многих других.

В химии граф составляет естественную модель структуры молекул, где вершины представляют собой атомы, а ребра - связи между атомами.

В статической физике графы могут представлять локальные связи между взаимодействующими частями системы, а также динамику физического процесса в таких системах.

Теория графов полезна также в биологии и в сфере деятельности по охране окружающей среды: вершины представляют собой регионы, где обитают определенные виды животных, а ребра - пути миграции или перемещения между регионами. Исследования с применением такого моделирования важны при изучении процессов размножения или отслеживания распространения болезней.

В нейронауках нервные системы можно рассматривать как граф, где узлы - это нейроны, а ребра - связи между ними.

Теория графов также широко используется в социологии, например, для измерения престижа акторов или для изучения распространения слухов в сети. Под термином «социальные сети» понимается множество различных типов графов. Например, графы знакомства и дружбы описывают социальные связи между людьми; графы влияния позволяют моделировать влияние определенных акторов на поведение других.

В лингвистике методы теории графов также оказались полезными, поскольку естественный язык часто хорошо поддается дискретной структуризации. Так, синтаксис и композиционная семантика описываются древовидными структурами.

Связанные понятия

Социальные сети, актор, атрибуты акторов, связь, взвешенный граф, ориентированный граф

Список литературы

1. Андерсон Дж. А. Дискретная математика и комбинаторика. - М., 2004. (James A. Anderson. Discrete mathematics with combinatorics).

2. Ope О. Графы и их применение. - M.: URSS, 2006. (Oysten Ore. Graphs and their uses.)

3. Харари Ф. Теория графов. - M.: URSS, 2006. (Frank Harary. Graph theory.)

4. Biggs N, Lloyd E. К, Wilson R. J. Graph theory, 1736-1936. - Clarendon Press, 1986.

5. Sylvester J. J. Chemistry and algebra. Nature 17:284.1878.

6. Tutte W. T. Graph theory. - Cambridge University Press, 2001.

7. Cayley A. XXVIII. On the theory of the analytical forms called trees. The London, Edinburgh, and Dublin philosophical magazine and journal of science 13(85): 172-176.1857.

СОЦИАЛЬНЫЕ СЕТИ

Социальные сети - дискретные модели, отражающие структуру связей между социальными объектами.

С целью подчеркнуть применимость графовых моделей к социальным системам вместо термина «граф» используется понятие «сеть», где акторы характеризуются широким набором атрибутов и объединены связями (см. статьи «Актор» и «Связь»). Разница между теорией графов и сетевым анализом не только в терминологии, но и в специальных показателях, индикаторах, которые были разработаны для анализа структурных социальных моделей.

Можно сказать, что социальные сети - это особая реальность и особая философия анализа данных, позволяющая интегрировать различные математические подходы с современными социальными теориями.

Социальная сеть (в английской транскрипции social network) имеет ряд синонимов из смежных областей: граф, социальная структура, сеть отношений социальных сущностей и пр.

Социальная сеть состоит из конечного набора или наборов акторов и отношений между ними. Наличие информации о множестве отношений - обязательное условие, которое определяет характерную особенность социальных сетей.

Основное отличие от традиционных социологических методов исследования социальной реальности состоит в учете окружения акторов. Вместо того чтобы изучать изолированных социальных акторов, сетевой подход рассматривает акторов, вовлеченных в сети взаимосвязанных отношений. Если анализировать ближайшее окружение акторов, то можно говорить об эгоцентричных сетях. Если брать во внимание всю совокупность связей системы, то говорят о полных сетях.

Главное заблуждение, в которое попадают новички, привлеченные термином «сеть», заключается в том, что они считают, что понятие «социальная сеть» относится только к социальным сетям в интернете. Но социальная сеть - это не только Facebook, Instagram, ВКонтакте и т.д. Для отличия этих понятий лучше ввести термин «онлайн-со-циальные сети» (см. соответствующую статью).

Даже беглый обзор существующих подходов к анализу социальных сетей занимает большой объем. В данной статье просто перечислим несколько направлений развития современного сетевого анализа.

Существует много различных типов социальных сетей, которые можно изучать: эгоцентричные/полные; связные/многокомпонентные; многомодальные; нейронные и Др.

Изучение современных типов социальных сетей привело к развитию отдельных больших научных тем, среди которых: семантические сети; стохастические социальные сети; временные социальные сети и др.

Развитие методов сетевого анализа привело к возникновению самостоятельных сетевых моделей: ERGM; кластеризация на графах; блок-моделинг и др.

Связанные понятия

Теория графов, актор, связь, сетевой анализ, многомодальная сеть, семантическая сеть, нейронная сеть, онлайн-социальные сети

Список литературы

1. Градосельская Г. В. Сетевые измерения в социологии: Учебное пособие / Под ред. Г. С. Батыгина. - М.: Издательский дом «Новый учебник», 2004.

2. Wasserman S., Faust К. Social network analysis: methods and applications. - Cambridge: Cambridge University Press, 1994.

3. Knoke D., Yang S. Social network analysis: 2nd ed. - Sage, 2008.

4. Borgatti S. P., Everett M. G., Johnson J. C. Analyzing social networks. - Sage, 2013.

АКТОР

Актор - базовый элемент социальной сети, социальная сущность, множество которых и конструирует сетевое пространство.

Актор - один из двух базовых элементов, из которых состоит социальная сеть. Без акторов не могут существовать связи (см. статью «Связь»).

В сетевом анализе нет одного устоявшегося термина на английском языке, соответствующего понятию актора. В качестве равноправных используются несколько терминов: nodes (узлы), dots, points (точки) и пр.

В теории графов понятию «актор» соответствует термин «вершина».

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Акторами могут являться персоны, организации, социальные роли, практики, социальные институты и пр. В современном сетевом анализе актором могут быть слова, речевые маркеры и другие абстрактные сущности.

Каждый актор характеризуется набором характеристик, которые называются атрибутами акторов и отражают их социальное наполнение. Например, персоны можно охарактеризовать уровнем образования, организации - числом сотрудников, страны -уровнем ВВП и т.п. По этим характеристикам осуществляются подвыборки в социальной сети, акторы объединяются в группы, проводится анализ получившихся структур.

В зависимости от уровня обобщения выделяются индивидуальные и коллективные акторы.

Индивидуальные акторы. Индивидуальный актор является неделимой единицей анализа и не может распадаться на составные части. Например, индивидуальным актором может быть персона, речевой маркер, социальная роль, должностная позиция.

Коллективные акторы. Коллективный актор состоит из частей. Например, коллективными акторами могут быть семья, сообщество, отдел в организации.

В процессе исследования возможно изменение урозня акторов, когда индивидуальные акторы объединяются в коллективные. Например, связанные персоны образуют сообщества, потом эти сообщества можно объявить новыми единицами анализа и построить новую сеть на уровне укрупненных акторов. Это происходит без потери связей, поскольку они также складываются, если инцидентные им вершины объединяются в один общий элемент.

Связанные понятия

Теория графов, социальная сеть, актор, атрибуты акторов, связь, инцидентность вершин

Список литературы

1. Градосельская Г. В. Сетевые измерения в социологии: Учебное пособие / Под ред. Г. С. Батыгина. - М.: Издательский дом «Новый учебник», 2004.

2. Wasserman S., Faust К. Socialnetworkanalysis:methods and applications. - Cambridge: Cambridge University Press, 1994.

3. Knoke D., Yang S. Social network analysis: 2nd ed. - Sage, 2008.

4. Borgatti S. P., Everett M. G., Johnson J. C. Analyzing social networks. - Sage, 2013.

связь

Связь - компонент социальной сети, соответствующий отношениям между двумя акторами. В теории графов связь соответствует термину «ребро». С математической точки зрения это подмножество линий, которые инцидентны вершинам графа.

В сетевом анализе нет одного устоявшегося термина на английском языке, соответствующего понятию связи. В качестве равноправных используется несколько терминов: links, ties, connections. Связи могут существовать, только если они соотносятся с двумя акторами. Таким образом, связь не может начаться в одной точке и подвиснуть в пустоте.

Хотя по отношению к акторам связи имеют подчиненное положение, тем не менее большинство исследований социальных сетей изучают именно рисунок связей, его общие характеристики, влияние на общие свойства сети.

Характеристикам связей социальных сетей уделяется большое внимание, существует большое число индикаторов, измеряющих свойства связей: сила связи, интенсивность, знак (позитивная или негативная) и т.п.

Связь может иметь разную природу: объективно наблюдаемая связь, отношение между акрами, вероятностная связь. Разным типам социальных сетей или графов могут соответствовать разные типы связей. Связи могут иметь направление. Например, трудовая миграция между регионами, причинные связи между событиями и т.д. В случае направленных связей ребра в теории графов называются дугами. Связи могут иметь вес. Например, обмен экономическими ресурсами между семьями или странами, корреляционные связи между переменными и т.д.

При выполнении разных операций на социальных сетях (сложение, вычитание и т.п.) связи также могут меняться, объединяться или удаляться из текущего отображения графов.

Связанные понятия

Теория графов, социальная сеть, актор, атрибуты акторов, связь, взвешенный граф, ориентированный граф, инцидентность ребер, изоморфизм графа

Список литературы

1. Градосельская Г. В. Сетевые измерения в социологии: Учебное пособие / Под ред. Г. С. Батыгина. - М.: Издательский дом «Новый учебник», 2004.

2. Wasserman S., Faust К. Social network analysis: methods and applications. - Cambridge: Cambridge University Press, 1994.

3. Knoke D., Yang S. Social network analysis: 2nd ed. - Sage, 2008.

4. Borgatti S. P., Everett M. G., Johnson J. C. Analyzing social networks. - Sage, 2013.

ВЗВЕШЕННЫЙ ГРАФ (СЕТЬ)

Взвешенный граф (сеть) - это граф, ребрам которого приписаны значения (веса).

Веса в сети могут отражать как степень сходства между двумя узлами, так и степень различий между узлами. Можно привести множество прикладных примеров взвешенных связей в социальной сети: число лайков и комментариев между подписчиками, товарно-денежные отношения между корпорациями, конфликтный потенциал между сотрудниками организации и пр.

Кроме того, взвешенная связь может иметь как направленный, так и ненаправленный характер. Направленной может быть сеть торговли между странами, где связь будет обозначать объем товаров, который был продан одной стране другой. Ненаправленная взвешенная сеть - это, например, сеть, где вес может обозначать степень близости между объектами (сеть корреляций) или речевыми маркерами в семантической сети.

Понятия «взвешенный граф» и «взвешенная сеть» имели разную историю.

Сначала теория графов работала в основном с бинарными графами, где связи обладали только двумя значениями: «0» - ребра нет; «1» - ребро есть.

Потом в рамках теории графов было разработано понятие взвешенного графа, где отношения между вершинами измерялись по целочисленной шкале. В настоящее время ребрам могут приписываться практически любые значения, в том числе комплексные.

В теории графов выделяют и другие, усложненные типы взвешенных графов: раскраску графов, многозначные графы, нечеткие графы и нейросети, биполярные взвешенные графы, решетки графов и многие другие.

Сетевой анализ взял за основу наработки теории графов, но привнес свой методологический вклад. Например, у сетевых исследователей возникает понятие взвешенной сети, где помимо интервальных мер связи между узлами используются номинальные и порядковые (согласно социологической традиции). Появление веса у связей ведет к усложнению расчетов специфических сетевых индикаторов, например плотности, мер центральности и связности, эквивалентности и пр.

Многие социальные, экономические, психологические, коммуникативные и другие сети изначально имеют взвешенный характер, но по усмотрению исследователя их би-наризируют, например соавторство в библиометрических сетях. Или при построении сильных базовых подструктур связям присваивают вес «1» при достижении некоторого порогового уровня и «О», если связь меньше некоторого порогового уровня.

Сетевые связи могут также иметь вес в форме знака: положительные, отрицательные или нейтральные отношения (социальная психология, социометрия). Технически они обрабатываются как индикаторы номинальных шкал, где приписываемое число не имеет сущностного математического значения, и служат маркерами отнесения к разным категориям.

Связанные понятия

Теория графов, социальная сеть, актор, связь, ориентированный граф, типы шкал

Список литературы

1. Андерсон Дж. А. Дискретная математика и комбинаторика. - М., 2004. (James A. Anderson. Discrete mathematics with Combinatorics.)

2. Ope О. Графы и их применение. - М.: URSS, 2006. (Oysten Ore. Graphs and their Uses.)

3. Харари Ф. Теория графов. - M.: URSS, 2006. (Frank Harary. Graph theory.)

4. Казанский А. А. Дискретная математика. Краткий курс. - М.: «Проспект», 2017.

5. Wasserman S., Faust К. Social network analysis: methods and applications. - Cambridge University Press, 1994. - 852 c.

6. Turner J. The structure of sociological theory. 7th ed. - Wadsworth Thomson Learning, 2003: 529.

7. Akram M., Yousaf M. M., Dudek W. A. Self centered interval-valued fuzzy graphs // Afr. Mat. 2015. Vol. 26. № 5-6. Pp. 887-898.

8. Bisdorff R., Pirlot M., Roubens M. Choices and kernels in bipolar valued digraphs // European journal of operational research. 2006. Vol. 175. № 1. Pp. 155-170.

9. Freeman L. C., Borgatti S. P., White D. R. Centrality in valued graphs: A measure of betweenness based on network flow// Social networks. 1991. Vol. 13. № 2. Pp. 141-154.

10. Harary F., Hedetniemi S., Robinson R. Uniquely colorable graphs // Journal of combinatorial theory. 1969. Vol. 6. № 3. Pp. 264-270.

11. Koval I. и др. Statistical learning of spatiotemporal patterns from longitudinal manifold-valued networks. - Springer, 2017. Pp. 451-459.

12. Mariadassou M., Robin S., Vacher C. Uncovering latent structure in valued graphs: A variational approach //Ann. Appl. Stat. 2010. Vol. 4. № 2. Pp. 715-742.

13. Peay E. R. Connectedness in a general model for valued networks // Social networks. 1980. Vol. 2. № 4. Pp. 385-410.

14. Rousseau R., Zhang L. Betweenness centrality and O-measures in directed valued networks // Scientometrics. 2008. Vol. 75. № 3. Pp. 575-590.

15. Yang S., Knoke D. Optimal connections: strength and distance in valued graphs // Social networks. 2001. Vol. 23. № 4. Pp. 285-295.

МНОГОМОДАЛЬНЫЙ ГРАФ (СЕТЬ)

Многомодальный граф (сеть) - это граф, который состоит из нескольких непересекающихся подмножеств, при этом ребра могут соединять только вершины из подмножеств разного типа.

Часто используют термин «мультимодальный граф» (сеть). Оба термина, «многомодальный» и «мультимодальный», являются равноправными и могут использоваться как синонимы.

Понятие мул ьти модальности получило развитие в рамках решения классических задач теории графов: задачи о назначениях (например, выстроить оптимальный граф соответствия переводчиков туристическим группам или граф компетенций в организации), задачи расписания (взаимосоответствие преподавателей, студенческих групп и аудиторий) и других.

Сети могут быть одно-, дву- или многомодальными. Чаще всего встречаются одномо-дальные сети, которые изучают набор одинаковых акторов, - это обычные сети, никаких особых пометок при их исследованиях не ставится, к ним применяются обычные сетевые индикаторы (меры центральности, плотности и т.п.).

На модальность сети влияет количество исследуемых социальных сущностей разного типа. Из многомодальных чаще всего встречаются двумодальные (синонимичное название: бимодальные) сети, которые рассматривают два набора акторов разного типа (например, студенты и курсы, которые они прослушали). Наиболее известным примером двумодальных сетей в российской социологии является науковедческое исследование ученых-социологов Г. В. Градосельской и Г. С. Батыгина.

Взаимодействие между учеными рассматривалось как двумодальная сеть, на одном из уровней которой располагались акторы (ученые), а на втором уровне - так называемые «артефакты» - сущности, способствующие кооперации ученых (научные организации, события и пр.).

Социальные сети с большей модальностью встречаются крайне редко, поскольку методы анализа социальных сетей не всегда приспособлены для таких сложных структур данных. Тем не менее многомодальные сети можно разбить на последовательность двумодальных и рассматривать каждый слой как отдельную двумодальную сеть.

В рамках сетевых исследований выделяют аффиляционные сети - сети включения акторов в некоторые события. За изучением аффиляционных сетей стоит несколько логик: во-первых, исследователи могут предполагать, что путем анализа соприсутствия на мероприятиях можно выйти на связи между акторами и событиями; во-вторых, в некоторых исследованиях аффиляции с мероприятиями могут интерпретироваться как усиливающие связи между акторами; в-третьих, отношения между акторами и событиями могут рассматриваться как системообразующие.

Индикаторы, которые рассчитываются для обычных сетей (например, центральности, плотности и т.п.), требуют существенной модификации при анализе бимодальных и многомодальных сетей. Используют специальные технические приемы (например, кластеризации), которые превращают многомодальные сети в одномодальные и позволяют рассчитать сетевые индикаторы с определенными поправками. Специально для бимодальных сетей, превращенных в одномодальные, часто используется «метод островов».

Многомодальные графы - это более общее понятие графов разных типов, каждый из которых имеет свою историю и может быть выделен в отдельное теоретическое направление, например: двудольные графы, нейронные сети, гиперграфы, вероятностные графы, когнитивные графы и пр.

Связанные понятия

Теория графов, актор, атрибуты акторов, связь, взвешенный граф, ориентированный граф, нейронные сети

Список литературы

1. Градосельская Г. В. Сетевые измерения в социологии: Учебное пособие / Под ред. Г С. Батыгина. - М.: Издательский дом «Новый учебник», 2004.

2. Батыгин Г. С., Градосельская Г. В. Сетевые взаимосвязи в профессиональном сообществе социологов: методика контент-аналитического исследования биографий // Социологический журнал. 2001. № 1. С. 156-163.

3. Андерсон Дж. А. Дискретная математика и комбинаторика. - М., 2004. (James A. Anderson. Discrete mathematics with Combinatorics).

4. Казанский А. А. Дискретная математика. Краткий курс. - M.: «Проспект», 2017.

5. Wasserman S., Faust К. Social network analysis: methods and applications. - Cambridge: Cambridge University Press, 1994.

6. Borgatti S. P., Everett M. G., Johnson J. C. Analyzing social networks. - Sage, 2013.

7. Berge C. Graphs and hypergraphs // 1973.

8. De Nooy W., Mrvar A., Batagelj V. Exploratory social network analysis with Pajek: Revised and expanded edition for updated software. - Cambridge University Press, 2018.

9. Wilson T. P. Relational networks: An extension of sociometric concepts // Social networks. 1982. Vol. 4. № 2. Pp. 105-116.

ПЛОТНОСТЬ ГРАФА (СОЦИАЛЬНОЙ СЕТИ)

Плотность - это метрика, показывающая тесноту и полноту связей между акторами графа или его частей. Плотность - это пропорция количества имеющихся в графе связей (L) к числу возможных.

В ненаправленном и невзвешенном графе для того, чтобы рассчитать максимальное количество связей, которое может быть в графе, надо вычислить значение произведения между числом имеющихся вершин (g) и уменьшенным на 1 количеством вершин (д-1). Максимальное число возможных связей делится на 2, для того чтобы не учитывать направление связи (при расчете плотности направленной сети деление на 2 не производится). Также расчет плотности может быть осуществлен через определение средней степени вершины в сети. Плотность принимает значение от 0 до 1. Поскольку формула очень проста, приведем ее:

D = 2L/(g(g-l))

Количественное вычисление плотности позволяет сравнивать графы между собой.

Плотность - это важное понятие, которое используется при более сложном структурном анализе графов и сетей (например, кластеризации).

Рассмотрение плотности разных частей графа помогает выделить его подструктуры с более тесными связями.

Части графа с повышенной плотностью называются кликами.

Выявление клик позволяет проводить анализ структуры на новом, обобщенном уровне. Таким образом, понятие плотности оказывается связанным с другими важными сетевыми метриками - центральностью и эквивалентностью.

Плотность также используется для измерения сплоченности акторов в графе или в его кликах. Более сложными мерами сплоченности можно назвать противоположные понятия «связность» Д. Кракхардта и «фрагментированность» С. П. Боргатти.

Связность - это пропорция пар узлов i и j, которые находятся в рамках одного компонента в сети.

Фрагментированность вычисляется при помощи вычитания связности из 1. Обычно связность и фрагментированность используются для анализа структурных изменений, происходящих со временем.

Поскольку при расчете плотности используется среднее, многие исследователи считают эту меру ненадежной. Предлагается использовать иные меры анализа сетей, которые учитывают дисперсию, например меры централизации сети, такие как централизация по степени, посредничеству или близости.

Связанные понятия

Клики, связность, компоненты связности графа, кластеризация графов, фрагментация, центральность, эквивалентность

Список литературы

1. Wasserman S., Faust К. Social network analysis: methods and applications. - Cambridge University Press, 1994. - 852 c.

2. Borgatti S. P. Identifying sets of key players in a social network// Computational & mathematical organization theory. 2006. Vol. 12. № 1. Pp. 21-34.

3. Borgatti S. P., Everett M. G.Johnson J. C. Analyzing social networks. - Sage, 2018.

4. Krackhardt D. Graph theoretical dimensions of informal organizations, Computational organization theory, L // Computational organization theory. 1994.

5. Marsden P. V. The reliability of network density and composition measures // Social networks. 1993. Vol. 15. № 4. Pp. 399-421.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЦЕНТРАЛЬНОСТЬ (ЧЕТЫРЕ ОСНОВНЫХ ВИДА)

Центральность - это группа сетевых индикаторов, определяющих степень структур-но-приоритетного положения актора в общей сети. В зависимости от типа центральности принципы приоритетности могут изменяться.

Цешральноиь являекя одним из первых меюдолшических вызовов, коюрые пришлось решать в рамках сетевого анализа как нового подхода. Необходимо было методологически описать новое понятие и предложить математический инструмент для расчета. В 1970-1980-х годах, наверное, наибольшее количество работ по методологии сетевых измерений было посвящено измерению свойств центральности как отдельных вершин, так и графов в целом. Метрики центральности стали первым уникальным индикатором сетевого анализа, которых не было в теории графов. Исследователями было предложено несколько десятков разных индикаторов, но в настоящее время наиболее употребимыми в прикладных исследованиях и сущностно различными являются всего четыре индикатора. Их мы и рассмотрим кратко в этой словарной статье.

Л. С. Фриман (L. С. Freeman) провел важный концептуальный обзор подходов к измерению центральности для неориентированных графов и опубликовал свою статью в первом выпуске журнала Social networks в 1979 году. Л. С. Фриман и сам разработал несколько подходов к расчету центральности.

Со временем список наиболее популярных подходов к расчету центральностей расширился незначительно. Добавление новых метрик расчета центральностей связано прежде всего с изменившимся типом данных: появлением больших сетей, необходимостью сравнения большого числа структур, ростом характеристик сетей (расширением атрибутов акторов) и т.п.

Сегодня можно выделить четыре подхода к измерению центральности.

Степень центральности. При этом подходе важно количество акторов, с которыми связан данный актор, - в простейшем случае это просто подсчет числа связей актора.

Такой подход расчета центральности несвободен от содержательных недостатков. Например, периферийный актор, локально имеющий много связей, может получить большее значение, чем актор, связывающий небольшое число подгрупп сети и реально находящийся в центре. Исправить подобную «несправедливость» призваны следующие два индикатора центральности.

Близость центральности. Здесь измеряется, насколько близко актор находится к другим участникам сети. Если позиция центральна, то актор может быстро взаимодействовать с остальными акторами. При этом подходе централь - это позиция, из которой приходится делать минимальное количество шагов ко всем остальным позициям группы. Она наиболее выигрышна при осуществлении коммуникации с другими акторами.

Центрапьность как посредничество. Наиболее объективно отражает положение актора третий индикатор, рассматривающий центральность как посредничество. Здесь

центральность рассматривается как контроль связей между определенными позициями. Так, если кратчайшее расстояние между акторами п2 и пЗ проходит через ni и п4 (например, n2-nl-n4-n3), то позиции ni и п4 являются контролирующими по отношению к паре акторов п2 и пЗ. Главную идею этого подхода можно сформулировать следующим образом: актор тем более централен, чем между большим количеством других акторов он находится (чем больше маршрутов он контролирует).

Если мы посчитаем все минимальные пути в сети, которые проходят через позицию актора, то мы получим ту активность сети, которую он контролирует. Индикатор носит вероятностную интерпретацию. По сути, он показывает, какую долю маршрутов контролирует тот или иной актор. Иными словами, если мы хотим попасть из одной части сети в другую, то какова вероятность того, что маршрут пройдет через данного актора? Чем ближе центральность к 100%, тем более центральным является актор.

Расчетной особенностью этого индикатора является резкое дифференцирование значимых и незначимых акторов (в отличие от других индикаторов центральности). Так, висячие, или концевые, вершины по данной метрике будут равны «0», так как они ничего не контролируют, через них не проходит ни один маршрут.

Для каждой из перечисленных трех центральностей разработаны формулы расчета как для каждого отдельного актора, так и для сети в целом. В литературе приводятся нормированные формулы с поправкой на размер сети.

Очевидно, что для одной и той же сети, для одних и тех же акторов разные индикаторы дают разное значение. При проведении исследований считается допустимым приводить в таблице все три показателя центральностей.

Указанные выше три вида расчета центральности считаются классическими и приводятся во всех учебниках по сетевому анализу. Их описание и формулы читатель найдет в учебниках С. Вассермана, Д. Ноука или Г. В. Градосельской.

Четвертый, сравнительно новый способ расчета центральности называется степенью влиятельности (eigenvector centrality). Его описание и формула приводятся в учебнике С. П. Боргатти.

Степень влиятельности (eigenvector centrality). Несмотря на то что этот показатель центральности был предложен еще в 1972 году П. Боначичем, популярен он стал сравнительно недавно в связи с ростом числа исследований на больших сетях (размером в несколько тысяч вершин). Расчет классических индикаторов (особенно центральности как посредничества) является в таком случае ресурсоемким.

При вычислении степени влиятельности проводится расчет собственного значения X (лямбда) подматрицы, построенной среди всех соседей наблюдаемого актора. Актор с наибольшим числом лямбда является наиболее центральным.

Связанные понятия

Актор, связь, плотность графа, связанность, эквивалентность, ранг страницы (page rank)

Список литературы

1. Градосельская Г. В. Сетевые измерения в социологии: Учебное пособие / Под ред. Г. С. Батыгина. - М.: Издательский дом «Новый учебник», 2004.

2. Градосельская Г. В. Бизнес-сети в России. - М.: Издательский дом Высшей школы экономики, 2014.

5. Wasserman S., Faust К. Social netv/ork analysis: methods and applications. - Cambridge: Cambridge University Press, 1994.

6. Knoke D., Yang S. Social network analysis: 2nd ed. - Sage, 2008.

7. Borgatti S. P., Everett M. G., Johnson J. C. Analyzing social networks. - Sage, 2013.

8. Freeman L. C. Centrality in social networks: I. Conceptual clarification//Social networks. 1979. № 1. Pp. 215-239.

9. Bonacich, P. Factoring and weighting approaches to status scores and clique identification. Journal of mathematical sociology. 1972. № 2. Pp. 113-120.

ЭКВИВАЛЕНТНОСТЬ

Эквивалентность - это сходство структурных позиций акторов в социальной сети, которое обосновывает сходство их поведения и упрощает дальнейший анализ структуры на новом уровне обобщения элементов.

Понятие эквивалентности имеет как теоретический смысл, так и математическое выражение, позволяющее рассчитать его значение количественно.

Многие методы при описании структурных свойств сети прибегают к понятиям структурного сходства отдельных акторов. Выявление структурно похожих позиций дает возможность для дальнейшего упрощения графа в целом путем объединения схожих по своим структурным свойствам акторов в новые обобщенные элементы-блоки, или модули. К понятию схожести некоторых акторов можно прийти, анализируя сходные значения центральностей (см. статью «Центральность»). Однако требуется определить более общую характеристику эквивалентности как целой структуры, а не только структурное свойство одного актора.

Наиболее известный подход для математического определения эквивалентности позиций акторов в социальных сетях при помощи так называемого евклидова расстояния был предложен Р. С. Бертом в конце 1970 годов. В евклидовом расстоянии метрика рассчитана как расстояние различия между позициями двух акторов. Чем дальше акторы в структурном смысле находятся друг от друга, тем больше накопленное расстояние.

Таким образом, можно рассчитать попарно расстояние между всеми позициями акторов в сети и выделить наиболее близкие и наиболее далекие группы акторов. В современных программных пакетах расчет евклидова расстояния между позициями акторов и выделение наиболее сходных групп выполняется автоматически. Однако качество группировки с содержательной точки зрения оставляет желать лучшего, и эксперты справляются с этой задачей успешнее.

Математический расчет эквивалентности у С. Вассермана сопровождается серьезным теоретическим рассмотрением сходства поведенческих практик акторов в реальных сетевых взаимодействиях. В классическом сетевом анализе этот подход носит название по-зиционно-ролевого анализа и опирается на теоретические работы социологов (Р. К. Мер-тон), антропологов (Р. Линтон и С. Ф. Найдел) и социальных психологов (Т. М. Ньюкомб).

Позиционно-ролевой анализ описывает сходство поведенческих паттернов и практик исходя из сходства позиций, которые занимает тот или иной актор. Таким образом, кажущееся спонтанным и персональным поведение акторов принимает объективную деперсонализированную интерпретацию.

Связанные понятия

Актор, связь, плотность графа, связанность, центральность, моделирование блоков (block-modeling)

Список литературы

1. Градосельская Г. В. Сетевые измерения в социологии: Учебное пособие / Под ред. Г. С. Батыгина. - М.: Издательский дом «Новый учебник», 2004.

2. Burt R. S. Position in networks. Socail forces. 1976. № 55. Pp. 93-122.

3. Wasserman S., Faust K. Social network analysis: methods and applications. - Cambridge: Cambridge University Press, 1994.

4. Knoke D., Yang S. Social network analysis: 2nd ed. - Sage, 2008.

5. Borgatti S. P., Everett M. G., Johnson J. C. Analyzing social networks. - Sage, 2013.

6. Merton R. K. Social theory and asocial structure. - New York: Free Press, 1957.

7. Linton R. The study of man. - New York: D. Appleton-Century, 1936.

8. Nadel S. F. The theory of social structure. - New York: Free Press, 1957.

9. Newcomb T. M. Role relationship. In Newcomb T. M., Turner R. H., Converse P. E. (eds.). Social psychology. - New York: Holt, Rinehart and Winston, 1965.

ОНЛАЙН-СОЦИАЛЬНЫЕ СЕТИ

Онлайн-социальные сети (online social network) - объект исследований сетевого анализа, где в фокусе находятся элементы виртуального интернет-пространства: пользователи, тексты, их разнообразные связи.

Под онлайн-социальными сетями понимается система, в которой: 1) пользователи являются основными объектами сервиса с доступным публичным профилем; 2) пользователи могут общаться с другими пользователями и ссылаться на элементы контента; 3) пользователи могут перемещаться по социальной сети, просматривая ссылки и профили других пользователей.

В качестве узлов в онлайн-социальных сетях могут выступать объекты в Twitter, Facebook, Instagram, LiveJournal. В качестве связей могут выступать разные виды отношений между двумя пользователями (лайки, комментарии, гиперссылки и пр.), прямые и опосредованные. Общее число потенциально возможных взаимодействий между объектами онлайн-социальных сетей превышает четыре десятка.

Исследования онлайн-социальных сетей появились в конце XX века, когда впервые были зафиксированы и стали доступны ученым данные о социальных взаимодействиях в интернете. В этот период произошел рост числа работ о сетях в естественных науках (физике, биологии) и прикладной математике, которые изучали гораздо более крупные физические сети. Многие ученые попросту переносили алгоритмы исследования структур из естественных наук в социальные области, что давало не очень хороший прикладной результат.

Социологи внесли свой вклад в концептуальные основы понимания структуры он-лайн-социальных сетей и их визуализации, а также выявления ключевых игроков и сообществ. Представители естественных наук, в свою очередь, изучали структуру и динамику больших сетей, разработали методы сбора данных и алгоритмы, необходимые для анализа сетей с большим количеством акторов и связей.

Именно столкновение с виртуальной реальностью подвигло исследователей на разработку новых алгоритмов, способных собирать, визуализировать и анализировать так называемые большие данные (big data).

Многие методы и задачи классического сетевого анализа могут быть адаптированы и успешно использованы при исследовании онлайн-социальных сетей.

Например, обнаружение сообществ (community detection) в онлайн-социальных сетях основано на анализе структуры сети и поиске акторов, которые больше связаны друг с другом, чем с другими пользователями, что помогает оценить, в каких видах деятельности, товарах или услугах человек может быть заинтересован.

Популярной задачей является обнаружение лидеров общественного мнения, людей, которые могут влиять на мнения большого количества других пользователей.

С помощью большого объема данных, доступного в онлайн-социальных сетях, также можно прогнозировать появление связей между несколькими пользователями в будущем, основываясь на их общих друзьях, интересах, месте жительства и т.п.

Частой задачей для анализа онлайн-социальных сетей выступает определение отношения к объекту - является ли отношение пользователей к чему-либо (другим объектам, событиям, текстам и т.п.) позитивным, негативным или нейтральным. Могут обобщаться суждения пользователей о физическом лице, организациях, политике, законах, фильмах, книгах, продуктах потребления и многом другом.

Классическая тема сетевого анализа, связанная с распространением информации в сети, особо актуальна при исследованиях онлайн-социальных сетей. Используя сетевые алгоритмы, можно ответить на вопросы о том, почему, каким образом и по каким маршрутам информация распространяется или будет распространяться, какие пользователи играют наиболее важную роль в этом процессе.

Смежными для исследования онлайн-социальных сетей являются исследования медиа (media studies) - область исследований, в которой рассматриваются содержание, история и влияние различных средств массовой информации на общество.

Связанные понятия

Интернет, группы, сообщества, страницы, паблики, исследования медиа (media studies), большие данные (big data), on ределение сообществ в сетях (community detection)

Список литературы

1. Arnaboldi V., Guazzini A., Passarella A. Egocentric online social networks: Analysis of key features and prediction of tie strength in Facebook. Computer communications. 36 (10-11). 2013:1130-44.

2. Boyd D., Ellison N. Social network sites: definition, history, and scholarship //Journal of computer-mediated communication. 13. 2007: 210-30.

3. Charalampakis В., Spathis D., Kouslis E., Kermanidis K. A comparison between semi-supervised and supervised text mining techniques on detecting irony in greek political tweets. Engineering applications of artificial intelligence. 51, 2016: 50-57.

4. Guille A., Hacid H., Favre C., Zighed D. A. Information diffusion in online social networks. - A Survey. 2013.13.

5. Himelboim I. Social network analysis (social media) //The international encyclopedia of communication research methods, edited by J. Matthes, C. S. Davis, and R. F. Potter. -Hoboken, NJ, USA: John Wiley & Sons, Inc. 2017. Pp. 1-15.

6. Nandi G., Das A. A Survey on using data mining techniques for online social network analysis. 10(6): 2013.7.

7. Sobhani P., Mohammad S., Kiritchenko S. Detecting stance in tweets and analyzing its interaction with sentiment. Proceedings of the Fifth Joint Conference on lexical and computational semantics. - Berlin, Germany: Association for computational linguistics. 2016. Pp. 159-69.

ОПРЕДЕЛЕНИЕ СООБЩЕСТВ В СЕТЯХ (COMMUNITY DETECTION)

Сообщество (community), также иногда называемое кластером или модулем, представляет собой группу вершин, которые имеют общие свойства и/или играют сходные роли в графе.

Сообщество также можно определить как подмножество вершин графа, которые имеют сильные, направленные, частые или положительные связи между собой.

Изначально термин «сообщество» использовался в социальных науках для обозначения групп людей с общими интересами или деятельностью. Понятие сообщества было связано с сетями акторов, проявляющих определенные характерные структурные свойства. По мере того как сети становились популярной моделью для описания многих других сложных систем, понятие сообщества расширилось и стало применяться к групповым структурам в различных сетях, необязательно относящихся к социальным взаимоотношениям.

Ранние упоминания сообщества сосредоточиваются на понятиях сплоченности подгрупп и взаимности. Примерами таких определений сообщества являются клики, п-клики, n-клубы, п-кланы, k-плексы и К-ядра. Однако большинство приведенных выше определений являются слишком ограниченными и вычислительно затратными, поэтому в дальнейшем сообщество стали чаще определять с помощью внутренних и внешних связей узлов в подграфе. В данном случае определение сообщества может быть представлено в нескольких видах.

Сообщество в сильном смысле. В сильном сообществе каждый узел имеет больше связей внутри сообщества, чем с остальной частью графа.

Необходимо различать число связей и плотность связей (см. статью «Плотность графа»). Тогда сообщество - это подграф с повышенной плотностью связей по сравнению с остальной частью графа.

Близко к такому пониманию сообщества определение клики.

Клика (clique) - подмножество сети, в которой участники более тесно и интенсивно связаны друг с другом, чем с другими членами сети.

На данный момент разработано большое количество различных методов обнаружения сообществ в сетях.

Кластеризация (clustering) - статистический метод для группировки ряда объектов таким образом, что в одной группе (кластере) оказываются объекты, более похожие друг на друга, чем на объекты в других группах.

Один из первых таких алгоритмов был создан М. Гирваном и М. Ньюманом в 2004 году. Это иерархический алгоритм разделения, в котором связи итеративно удаляются на основе значения их взаимности, которое выражает количество кратчайших путей между парами узлов, проходящих через связь. Процедура удаления связей заканчивается, когда модулярность достигает максимума.

Модулярность (modularity) - мера для определения частоты взаимодействия в сети по сравнению с ожидаемыми связями для случайного графа.

Существует также более быстрая реализация данного алгоритма, известная как модульная оптимизация А. Клаузета, М. Ньюмана и К. Мура. Начиная с набора изолированных узлов ссылки исходного графа итеративно добавляются таким образом, чтобы произвести максимально возможное увеличение модульности на каждом шаге.

Из более поздних алгоритмов хорошие результаты для нахождения сообществ показывает структурный алгоритм М. Росвала и К. Бергстрома. Здесь задача нахождения наилучшей кластерной структуры графа превращается в задачу оптимального сжатия информации о графе, чтобы в дальнейшем можно было максимально точно восстановить исходную структуру при декодировании сжатой информации.

Поиск (определение) сообществ происходит в исследовании сетевых систем в биологии, информатике, экономике, политике и многих других сферах.

В социальных науках метод определения сообществ используется в совершенно разных тематических областях: исследованиях сети коллаборации ученых, поиске политических клик в социальных сетях, группы страниц по сходству в интернете, изучении топологии урбанистических сетей, структуры сети джазовых музыкантов и многих других.

Связанные понятия

Community, кластер, модуль, клики (clique), определение сообществ (community detection), кластеризация на графах (clustering), модулярность (modularity)

Список литературы

1. Clauset A., Newman М. Е. J., Мооге С. Finding Community structure in very large networks // Physical review. E 70 (6). 2004: 066111 - Published 6 December 2004. https:// journals.aps.org/pre/abstract/10.1103/PhysRevE.70.066111

2. Fortunato S. Community detection in graphs //Physics reports. 486 (3-5). 2010:75-174.

3. M. E. J. Newman and M. Girvan. Finding and evaluating community structure in networks // Physical review. E 69 (2). 2004: 026113. http://www.cse.cuhk.edu.hk/~cslui/ CMSC5734/newman_community _struct_networks_phys_rev.pdf

4. Radicchi F., Castellano C., Cecconi F., Loreto V. and Parisi D. Defining and identifying communities in networks// Proceedings of the National academy of sciences. 101 (9). 2004: 2658-63. https://www.researchgate.net/publication/5248536_Defining_andJdentifying_ communitiesinnetworks

5. Rosvall M., Bergstrom С. T. Maps of random walks on complex networks reveal community structure// Proceedings of the national academy of sciences. 105 (4). 2008:1118-23. https://www.pnas.Org/content/pnas/105/4/1118.full.pdf

6. Wasserman S., Faust K. Social network analysis: methods and applications. - Cambridge University Press. 1994.

ЗЕРНОВАЯ КЛАСТЕРИЗАЦИЯ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Метод зерновой кластеризации - методологическое направление сетевого анализа, нацеленное на быстрое получение информации о составе групп в социальных сетях в привязке к реальным социальным рамкам, заданным исследованием: региональным, стратификационным, по сфере активности и т.п.

Метод зерновой кластеризации был предложен Г. В. Градосельской в 2013-2014 годах при решении исследовательской проблемы структурирования политически активных групп России в РасеЬоок. Существовавшие на тот момент традиционные математические и лингвистические подходы не принесли практической пользы и/или оказались слишком затратными с точки зрения времени и финансов. Необходимо было решить вполне стандартную для большинства исследований социальных сетей задачу: имея минимальную стартовую информацию, получить максимально полный список групп и акторов, представляющих целевой сегмент (политические предпочтения). Целевой сегмент может быть разным: городские группы, молодежные группы, региональные группы, группы с определенным финансовым или социальным поведением и т.п.

С того времени было проведено более двадцати исследований научного и коммерческого характера по картированию сетей на разном уровне: федеральных, региональных, городских и районных. Исследовались разные социальные сети: РасеЬоок, ВКон-такте, 1п51адгат, Ыуе.1оита1, Одноклассники. Это были исследования политической активности, социальные, националистические, криминальные, профессиональные сети и т.п. Во всех случаях были получены интересные содержательные результаты, неожиданные сточки зрения здравого смысла..

В настоящее время метод зерновой кластеризации используется в рутинном режиме в исследованиях АСИС под руководством А. Н. Расходчикова.

Метод зерновой кластеризации сочетает поисковые подходы и алгоритмы кластеризации объектов на графах. После автоматического сбора объектов (групп) проводится экспертная кодировка, которая способствует содержательной интерпретации собранных данных. Автоматическая кластеризация поможет более четко структурировать политическое пространство, а экспертная кодировка - понять сущностные, содержательные механизмы, регулирующие процессы в политическом сегменте социальных сетей.

Основной посыл в разработке метода зерновой кластеризации состоит в том, что кластеры в социальных сетях имеют не формальную, а социальную природу. Поэтому, чтобы построить кластеры с учетом этой социальной природы, нужно следовать содержательным связям. Базовое теоретическое предположение состоит в том, что деятельность групп и акторов происходит по принципу «социального заражения» через связи. Актор, интересующийся определенной тематикой, будет входить в несколько групп в социальных сетях, при этом набор групп для каждого актора может быть разным, но количество исследуемых групп конечно. Объединяя персональные активности, мы получаем рисунок общей структуры связей между социально активными группами. Связь между группами определяется через сходство по набору участников. Чем больше акторов одновременно входят в две социально активные группы, тем сильнее связь.

Основные идеи, которые мы принимаем в основу разработанного метода:

• Идея 1: естественные кластеры. Предполагается, что существуют естественно образованные группы повышенной плотности, которые можно зацепить через одну зерновую группу. Это аналогично тому, как, потянув за одну виноградину, можно вытащить и всю кисть.

• Идея 2: значение эксперта. Значение эксперта при кластеризации обычно недооценивают или заслуженно принижают. Зерновая кластеризация делает роль эксперта в исследовании более четкой, указывая явно, на каком этапе алгоритма работает эксперт, а где начинают работать математические принципы расширения кластера. Для каждого из кластеров экспертом определяются 3-5 зерновых групп, из которых потом будут наращиваться остальные группы.

• Идея 3: актор как связь. Каждый пользователь включен в несколько групп. Его персональная микросеть объединяется с микросетями других акторов и образует макроструктуру взаимосвязей между группами. Таким образом, связи между группами можно представить в виде акторов, одновременно входящих в обе группы.

Кратко алгоритм зерновой кластеризации можно описать как последовательность нескольких этапов:

1. Отбор небольшого количества зерновых групп. Эксперты отбирают от пяти до десяти групп, наиболее точно соответствующих той плоскости исследования, в которой проводится анализ сетевого пространства: политические, финансовые, криминальные группы и т.п. Как было отмечено выше, количество зерновых групп обычно является небольшим, поскольку заказчики исследования, как правило, сами не имеют представления, что происходит в их регионах.

2. Между зерновыми группами пересчитывается плотность связей. Это считается нулевым циклом приращения кластера.

3. Собираются все группы всех пользователей зерновых групп и ранжируются по убыванию частоты общих пользователей. Таким образом, связью между объектами кластера (группами) будет являться число совместных пользователей между группами.

4. Далее пересчитывается изменение плотности при добавлении в кластер каждой новой группы. Как только плотность кластера начинает быстро снижаться, добавление новых групп прекращается и первый цикл приращения кластера считается завешенным.

5. После этого возвращаемся к этапу 2 и запускаем следующий цикл приращения. По опыту проведенных исследований можно сказать, что для того, чтобы картировать большую часть групп региона, достаточно всего 2-3 циклов приращения.

Помимо контроля плотности кластера, при реализации циклов алгоритма можно добавить контроль порогового значения связей, вектор соответствия новых групп уже включенным в кластер на предыдущих циклах и т.п.

Связанные понятия

Клики, определение сообществ (community detection), картирование социальных сетей (mapping of social networks), кластеризация на графах, поисковые алгоритмы (seeking algorithms)

Список литературы

1. Градосельская Г. В., Щеглова Т. Е., Карпов И. А. Картирование политически активных групп в Фейсбуке: динамика 2013-2018 гг. // Вопросы кибербезопасности. 2019. № 4 (32). С. 94-104.

ИНФОРМАЦИОННЫЕ ВОЛНЫ

Информационная волна - управляемое распространение информации по целевым группам для достижения социальных эффектов.

Исследования информационных волн - новое методологическое направление в сетевом анализе, изучающее основные принципы распространения информации в социальных сетях и интернет-медиа. В фокусе исследований информационных волн находятся теоретический анализ и детерминация основных понятий, а также развитие семейства программно-алгоритмических инструментов.

Сложность исследования информационных процессов в социальных сетях связана с тем, что единица анализа имеет двойственную природу: г. одной стороны, это текст, с другой -текст привязан к сетевым акторам - персонам и сообществам. И скорость распространения информации зависит от ряда сопутствующих обстоятельств: где размещена первая публикация, насколько содержание текста попадает в ожидания целевой аудитории, насколько велико желание пользователей сетей поделиться этой информацией, и многих других.

Так формируются информационные волны - определенный тип информации, который быстро становится известен всем пользователям социальных сетей. Его нельзя описать только с помощью математических моделей (например, теории каскадов), как это пытались сделать ранее, потому что в них не учитывается социальная природа текстов в современной интерактивной медиасреде. Анализировать этот новый феномен (информационные волны) можно на стыке нескольких отраслей знания: социологии, лингвистики, сетевого анализа, статистики и других.

Самое интересное, термин «информационные волны» долгое время использовался в среде маркетологов, а потом и политтехнологов как инструмент распространения информации, доминирования нужных мнений в информационной среде. Эти манипуля-тивные технологии использовались как минимум с начала 1990-х годов. С появлением социальных сетей и интернета они стали настолько заметными, что начали оказывать существенное влияние на социальную, политическую и культурную сферы жизни общества. Только после этого с 2010-х годов к данному феномену было привлечено внимание ученых-исследователей, прежде всего лингвистов и математиков.

Феномен информационных волн на постсоветском пространстве был выявлен исследовательским коллективом Г. В. Градосельской при исследовании многих практических случаев (политические события на Украине 2014 года, выборы в Госдуму РФ 2016 года, выборы в Московскую городскую думу 2018 года и многие другие). Исследования информационных волн продолжаются в АСИС под руководством А. Н. Расходчикова.

На данный момент сформулировано основное определение и несколько операцио-нально-прикладных, направленных на решение параллельных методологических задач в социологии. Основное определение приведено в начале статьи.

Практические исследования группы Г. В. Градосельской показывают, что информационные волны составляют от 65% до 85% всего контента в социальных сетях. Они становятся все более отточенным механизмом распространения информации, сочетающим как технологические, так и социальные ресурсы.

Помимо исследования информационных волн, существует несколько направлений сопутствующих исследований, которые было бы интересно развивать:

1. Лингвистическое направление. В распространении информации важную роль играют содержание самого текста, его правильное построение, выбор ключевых слов и т.п. Кроме того, информационная волна состоит в основном из похожих или повторяющихся текстов, поэтому изучение и разработка специальных методов кластеризации текстов также весьма важны в этом направлении исследования информационных волн.

2. Математическое направление. В это направление входит математическое описание характеристик волны и ее распространения (профилирование волн). На основе профилирования волн и их типологизации можно развивать методы ранней диагностики и прогнозирования поведения информационных потоков.

3. Социологическое направление. Имея лингвистические и математические данные о характеристиках распространения информации в интернет-среде, социологи могут ответить на вопросы о том, как, для кого, кем распространяется информация, какая аудитория является целевой.

Построенный профиль информационной волны также представляет интерес для содержательной интерпретации, помогая выделить смысловые этапы - компоненты волн.

Кроме того, как было показано в работах Г. В. Градосельской и Т. Е. Щегловой, успех распространения информации на каждом этапе зависит от состава вовлеченных акторов - распространителей. Поэтому необходимо провести типологизацию ролей, а также разработать алгоритмы для автоматической классификации акторов сточки зрения их участия в распространении информационных волн.

Сети акторов и их пересекающиеся профили в разных социальных сетях обеспечивают межсетевое распространение информационных волн (сети Ыуе.)оигпа1, РасеЬоок, ВКонтакте). Поэтому исследования информационных волн частично пересекаются с другим словарным понятием - о зерновом картировании социальных сетей.

Связанные понятия

Распространение информации, теория каскадов, эхокомната (echo-chamber), зерновая кластеризация в социальных сетях

Список литературы

1. Градосельская Г. В., Щеглова Т. Е., Карпов И. А. Информационные волны в социальных сетях: проблематизация, определение, механизмы распространения //Системы высокой доступности. 2018. Т. 14. № 3. С. 87-91.

2. Болотнов А. В. О некоторых закономерностях формирования информационных волн в современном медиадискурсе // Вестник ТГПУ. 2017. № 11 (188). С. 46-52.

3. Galina Gradoselskaya, Tamara Shcheglova. Theoretical foundation of information waves investigation in social networks. IEEE Proceedings of the 2019 Twelfth international conference «Management of large-scale system development» (MLSD, Moscow) (https:// ieeexplore.ieee.org/document/8911027).

4. Galina Gradoselskaya, Artem Volgin. Decomposition of a media event through the définition of information waves. IEEE Proceedings of the 2019 Twelfth international conference «Management of large-scale system development» (MLSD, Moscow) (https:// ieeexplore.ieee.org/document/8911056).

5. Gradoselskaya G., Shcheglova T., Karpov I. Information waves on social networks: problematization, definition, distribution mechanisms // IEEE Proceedings of the 2018 Eleventh international conference «Management of large-scale system development» (MLSD, Moscow). 2018. Pp. 1-4 (https://ieeexplore.ieee.org/document/8551888).

6. Bessen J. Riding the marketing information wave // Harvard Business Review. Market research, September-October 1993 Issue [Электронный ресурс] URL: https://hbr. org/1993/09/riding-the-marketing-information-wave (дата обращения: 10.04.2018).

СЕМАНТИЧЕСКИЕ СЕТИ

Семантические сети - это тип сетей, который позволяет представить текст в виде совокупности слов (концептов) и связей между ними.

Немаловажную роль в построении семантической сети имеют принципы вычисления связей между словами и выделения ключевых подструктур. Существует множество алгоритмов, которые рассчитывают матрицу связей между речевыми маркерами в соответствии с идеологией исследования.

Наиболее известными программами, позволяющими обрабатывать и визуализировать семантические сети, являются Automap и ORA. Они разработаны Центром вычислительного анализа социальных и организационных сетей (Center for computational analysis of social and organizational systems - CASOS) при Университете Карнеги-Мел-лона.

В Automap процесс выделения семантических сетей связан с понятием «размер окна» (window size): своеобразный «ползунок», перемещаясь по строкам текста, определяет количество связей между словами. Чем шире «окно», тем больше связей и, соответственно, сложнее вычленить базовую структуру текста. Оптимальным «размером окна» считается ± 2 слова (всего 5 слов, включая целевой речевой маркер в центре). Далее заполняется матрица связей между словами и применяются алгоритмы построения базовой структуры текста. Затем выделяются устойчивые группы речевых маркеров, которые на новом уровне анализа можно обозначить концептами.

Таким образом, построение семантической сети - это постоянное обоснование этапов в зависимости от целей исследования.

В 1966 году когнитивный психолог Росс Куилан в своей кандидатской диссертации предложил использовать семантические сети для моделирования семантической памяти человека.

Семантическая память - это память, которая отвечает за способность людей припоминать факты о мире, общую информацию о нем и является противоположной по своим свойствам эпизодической памяти, связанной с воспоминаниями о конкретных событиях в жизни человека.

Впоследствии семантические сети не только стали использоваться для моделирования памяти психологами, но и оказались полезны для анализа текстов в социальных, гуманитарных и компьютерных науках. Одну из широко распространенных классификаций семантических сетей предложил Дж. Ф. Сова, выделив: дефинитивные, ассорта-тивные, импликативные, вычислительные, обучающиеся и гибридные сети (см. статью «Нейронные сети»).

Семантические сети, один из типов которых ввел в исследовательскую практику Р. Куилан, можно назвать вычислительными, то есть это сети, позволяющие изменять вводимую в них информацию. Изменения, происходящие с информацией в вычислительной сети, могут быть связаны с передачей сообщений, подсчетом характеристик узлов и трансформацией структуры графа путем перегруппировки вершин и ребер.

Дефинитивные сети - это сети, где узлами являются концепты и их подтипы, идеи подобных структур базируются на логике Аристотеля. В 1960 году лингвист С. Чеччато описал корреляционные сети, которые базировались на 56 типах отношений между объектами. Компьютеризация дефинитивных сетей была продолжена М. Мастерман.

Другой тип семантических сетей - ассортативные сети, в которых отдельные узлы оцениваются по степени сходства/различия друг с другом.

Семантические сети, основанные на операции импликации как способе соединения слов, называются импликативными. В зависимости от интерпретации такие сети могут называть сетями причинности, байесовыми сетями и пр.

Связанные понятия

Window size, нейронные сети, комплексные сети, речевой маркер, концепт, коэффициент ассортативности, силлогизмы Аристотеля

Список литературы

1. Brachman R. J. What's in a concept: structural foundations for semantic networks // International journal of man-machine studies. 1977. Vol. 9. № 2. Pp. 127-152.

2. Brachman R. J. On the epistemological status of semantic networks // Associative networks. - Elsevier, 1979. Pp. 3-50.

3. Brachman R. J., Fikes R. E., Levesque H. J. Krypton: a functional approach to knowledge representation//Computer. - United States, 1983. Vol. 10.

4. Ceccato S., Maretti E. Linguistic analysis and programming for mechanical translation (mechanical translation and thought). - Milan Univ (Italy), 1960.

5. Doyle J. A truth maintenance system // Artificial intelligence. 1979. Vol. 12. № 3. Pp. 231-272.

6. Masterman M. Semantic message detection for machine translation, using an interlingua. - 1961. Pp. 438-475.

7. PearlJ. Fusion, propagation, and structuring in belief networks//Artificial intelligence. -1986. Vol. 29. №3. Pp. 241-288.

8. Pearl J. Bayesian networks // 2011.

9. Reisig W. Petri Nets: an Introduction. - Berlin, Heidelberg: Springer Berlin Heidelberg, 1985.

10. Selz O. Uber die Gesetze des geordneten Denkverlaufs, erster Teil // Spemann, Stuttgart, 1913.

11. Sowa J. F. Semantic Networks [Электронный ресурс]. URL: https://onlinelibrary.wiley. com/doi/abs/10.1002/0470018860.s00065 (дата обращения: 27.08.2019).

12. Tulving E. Episodic and semantic memory // Organization of memory. - Oxford, England: Academic Press, 1972. Pp. XIII, 423 - XIII, 423.

13. Yuan E. J., Feng M., Danowski J. A. "Privacy" in Semantic networks on Chinese social media: The case of Sina Weibo: Privacy in semantic networks on Sina Weibo // Journal of Communication. 2013. Vol. 63. № 6. Pp. 1011-1031.

14. CASOS Automap: http://www.casos.cs.cmu.edu/projects/automap/

15. CASOS ORA: http://www.casos.cs.cmu.edu/projects/ora/

КОНЦЕПТ

Концепт отражает обобщенные представления актора о мире, выраженные группой речевых маркеров. Обозначает некоторый класс, категорию, тип объекта или ситуацию внешнего, а иногда и внутреннего мира акторов.

Важной частью сетевого анализа является изучение семантических сетей, представляющих собой наборы узлов и отношений, которые их связывают. Анализ семантической сети позволяет выявлять и изучать связанные между собой темы, тематическую структуру, семантические отношения и пр. Концепты соотносятся с вершинами семантической сети, которые могут выражаться группой речевых маркеров.

Термин «концепт» используется в различных научных парадигмах: философии, искусствоведении, программировании, социологии, филологии, лингвистике и пр. Закономерно, что значение термина различается в зависимости от специфики сферы научного знания.

Кроме того, в англоязычной научной литературе, посвященной сетевому анализу, слово «concept» используется в значении «концепция», «методология» (Wilson; Wanzenböck), «понятие» (Leblebici and Whetten).

Термин «концепт» имеет очень долгую историю, его появление связывают с работами Т. Гоббса, П. Абеляра, У. Оккама и других основоположников средневекового концептуализма.

Формирование когнитивного направления в психологии, языкознании привело к формированию таких дисциплин, как когнитивная психология и когнитивная лингвистика. В частности, когнитивистика получила развитие в трудах Ж. Р. Андерсона, Т. Р. Андерсона, Л. В. Барсалоу, А. Вежбицкой, Р. Джекендорфа, Дж. Лакоффа, С. Стила, Б. Шварца, С. Шифера.

В XX веке термин стал активно использоваться в работах лингвистов различных школ, между тем стоит отметить, что он до сих пор не получил общепризнанного определения. Достаточно вспомнить труды С. А. Аскольдова (Алексеева), А. П. Бабушкина, Г. И. Берестнева, Н. Н. Болдырева, С. Г. Воркачева, В. И. Карасика, В. В. Колесова, Е. С. Ку-бряковой, Д. С. Лихачева, 3. Д. Поповой, Ю. С. Степанова, И. А. Стернина, Г. Г Слышкина, В. Н. Телии, Р. М. Фрумкиной, Л. О. Чернейко.

Например, Ю. Д. Апресян называет концептами лингвокультурные изоглоссы.

А. Вежбицкая, развивая идеи Гумбольдта, опирается на понимание природы естественного языка как системы, объединяющей психологическую, экстралингвистическую реальности с социальным миром носителя языка. Она приводит интерпретацию понятия концепта как объекта из «идеального» мира, который имеет наименование и отражает определенное культурно обусловленное представление человека о «реальном» мире. А. Вежбицкая трактует концепт в качестве инструмента познания внешней действительности, который необходимо описать языковыми средствами в виде некоторых объяснительных конструкций. Следует отметить, что, по А. Вежбицкой, важная особенность концептов заключается в способности выражать этническую специфику, позволяющую проводить сопоставительное изучение культур разных народов, выделять их интегральные и дифференциальные признаки. Понимание концепта-максимума свидетельствует о высокой компетенции, владении лексическими ресурсами, характерном для типичного носителя языка; знание концепта-минимума, в свою очередь, демонстрирует недостаточное владение лексическими средствами, которое, однако, не должно опускаться

ниже определенных границ. Причем противопоставление концепта-максимума и кон-цепта-минимума оказывается культурно обусловленным.

В русскоязычном контексте анализа социальных сетей концепт, как правило, обозначает не просто совокупность признаков той категории объектов или ситуаций, которые входят в понятие о данной категории, а наиболее значимые различительные признаки, на основании которых категория была выделена из ряда других и получила соответствующее наименование.

Связанные понятия

Семантическая сеть, речевой маркер, текст, дискурс-анализ

Список литературы

1. Апресян Ю. Д. Избранные труды. - М.: Языки русской культуры, 1995.

РЕЧЕВЫЕ МАРКЕРЫ

Речевые маркеры - лексические средства, которые используются для фиксации специфических характеристик объекта, явления, класса, категории или ситуации в сетевом анализе.

Речевые маркеры содержат денотативную информацию (о каком-либо фрагменте мира), сигнификативную (определяющую способ представления указанного фрагмента мира в сознании), прагматическую (характеризующую автора сообщения и других акторов коммуникативного взаимодействия), синтаксическую (о других языковых знаках, которые могут использоваться в окружении конкретного речевого маркера).

Чаще всего речевые маркеры рассматриваются в контексте моделей семантических сетей. Именно так обычно удается обнаружить устойчивые клики речевых маркеров, которые могут быть проинтерпретированы в качестве концептов на следующем уровне анализа. Речевые маркеры позволяют, в частности, выделять текстовые сегменты данных, необходимые для семантического анализа, построения ассоциативных сетей, решения конкретных исследовательских задач (например, вычисление социального стресса или социального удовлетворения акторов).

Речевые маркеры соотносятся с лингвистическим пониманием семантики, изучающей, как при помощи естественного языка осуществляется передача информации. Семантика, как система не жестко детерминированная, позволяет изучить содержание, информацию, передаваемую в контексте сетевого анализа какой-либо единицей языка (словом, грамматической формой слова, словосочетанием, предложением) - речевым маркером.

Связанные понятия

Семантическая сеть, концепт, текст, дискурс-анализ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Список литературы

1. Апресян Ю. Д. Избранные труды. - М.: Языки русской культуры, 1995.

2. Арутюнова Н. Д. Предложение и его смысл. Логико-семантические проблемы. -М., 1976.

3. Кобозева И. М. Лингвистическая семантика. - М.: Едиториал УРСС, 2000. - 352 с.

4. Лайонз Дж. Лингвистическая семантика. Введение / Джон Лайонз; Пер. с англ. И. Б. Шатуновского, В. В. Морозова. - М.: Языки славянской культуры, 2003. - 400 с.

5. Wierzbicka A. Semantics: Primes and universals: Primes and universals. - UK: Oxford University Press, 1996.

6. Wierzbicka A. Semantics, culture, and cognition: Universal human concepts in culture-specific configurations. Oxford University Press on Demand, 1992.

TF-IDF

TF-IDF (от англ. TF - term frequency, IDF - inverse document frequency) - статистическая мера, используемая для оценки важности слова в документе, являющегося частью коллекции документов. Вес некоторого слова прямо пропорционален частоте употребления этого слова в документе и обратно пропорционален частоте употребления слова во всех документах коллекции.

TF-IDF сегодня является одной из наиболее часто используемых метрик для измерения веса слов в задачах, связанных с информационно-поисковыми системами. Более правильным было бы сказать, что TF-IDF - это целый класс метрик, поскольку существует множество различных формул, основанных на методе TF-IDF. Они отличаются нормировками и использованием различных шкал. Ниже будет дано определение классическому варианту TF-IDF, на основе которого создаются частные вариации рассматриваемой меры.

Как понятно из названия, мера TF-IDF является производной двух самостоятельных статистических мер: TF и IDF.

TF (term frequency - частота слова) - отношение числа вхождений некоторого слова в документ к общему числу слов документа. Таким образом оценивается важность слова в пределах отдельного документа.

Поскольку тексты могут быть различны по своей длине (и в длинных текстах, вероятно, какой-то термин будет использован большее количество раз, чем в коротких), для вычисления TF используют нормализацию: делят количество употреблений слова в документе на общее количество слов в документе.

tñ • = -5*-

где п. - число вхождений z-ro слова в документ у, а Е* Пк- общее число слов в документе.

Однако при таком раскладе велика вероятность, что акцент будет сделан на часто употребляемых словах. Сложность в подборе весов слов состоит в установке баланса между популярностью слова и его специфичностью. Для этого применяется IDF (inverse document frequency - обратная частота документов) - инверсия частоты, с которой некоторое слово встречается в документах коллекции. Эта мера возникла из предположения о том, что слово, которое встречается в большом количестве документов, - плохой дискриминатор и должно наделяться меньшим весом, чем слова, которые встречаются в небольшом количестве документов. Учет IDF уменьшает вес широкоупотребительных слов.

idfi = log (£),

где N - количество документов в коллекции, df\ - число документов, в которых встречается i-e слово.

Было доказано, что большие значения IDF означают большое отклонение от нормального распределения и, следовательно, такие слова привносят «контекст» и являются более содержательными.

Классическая формула для вычисления TF-IDF:

Щ.) = tfrj х idfi.

где w. - весг-го слова в j-том документе, tftу- TFi-го слова ву-том документе, idfc - IDF /'-го слова в коллекции документов.

Мера TF-IDF часто используется в задачах анализа текстов и информационного поиска, например, для оценки релевантности документа поисковому запросу, при расчете меры близости документов при кластеризации. TF-IDF нередко используют для фильтрации стоп-слов.

Связанные понятия

Речевой маркер, концепт, текст, дискурс-анализ

Список литературы

1. Jones К. S. A statistical interpretation of term specificity and its application in retrieval //Journal of Documentation. 28.1972. Pp. 11-21.

2. Jones K. S. IDF term weighting and IR research lessons, Journal of documentation. 60(6). 2004. Pp. 521-523.

3. Zhang W., Yoshida T., Tang X. TFIDF, LSI and multi-word in information retrieval and text categorization // 2008 IEEE International Conference on Systems, Man and Cybernetics, https://ieeexplore.ieee.org/document/48112597arnumberM811259

4. Aizawa A. An information-theoretic perspective of TF-IDF measures // Information processing and management. 39. 2003. Pp. 45-65.

5. Church K., Gale W. Inverse document frequency (IDF): A measure of deviations // Poisson, natural language processing using very large corpora. 11.1999. Pp. 283-295.

6. Salton G., Buckley C. Term-weighting approaches in automatic text retrieval // Information processing & management. 24(5). 1988. Pp. 513-523.

7. Ramos J. Using TF-IDF to determine word relevance in document queries // 2003. https://pdfs.semanticscholar.org/b3bf/6373ff41all5197cb5b30e57830cl6130c2c.pdf?_ga=l .183821606.1606390940.1482600858

8. Bafna P., Pramod D., Vaidya A. Document clustering:TF-IDF approach // Proceedings of the 2016 International conference on electrical, electronics, and optimization techniques (ICEEOT).

НЕЙРОННЫЕ СЕТИ

Искусственная нейронная сеть - набор нейронов, определенным образом связанных между собой и выполняющих поставленные интеллектуальные задачи путем принятия логических решений.

Искусственная нейронная сеть основана на наборе связанных единиц или узлов, называемых искусственными нейронами, которые являются отдаленной симуляцией нейронов в биологическом мозге. Каждое соединение - ребро, - подобно синапсам в мозге живого существа, может передавать сигнал другим нейронам. Сигнал - это реальное число, а выход каждого нейрона вычисляется некоторой нелинейной функцией суммы его входов. Нейроны и ребра, как правило, имеют вес, который регулируется в процессе обучения и изменяет силу сигнала при соединении. Нейроны могут иметь определенный порог, позволяющий посылать сигналы только в том случае, если совокупный сигнал превышает этот порог.

Принципиальная основа функционирования нейрона заключается в разделении двух функций: восприятия и принятия решения. Иными словами, мозг не видит, глаз не думает. Итоговое решение зависит не только от одного нейрона, но и от структуры их взаимосвязей (архитектуры).

Архитектура нейронной сети зависит от задач, которые она должна решать. Как правило, нейроны объединяются в слои, различающиеся по типам преобразований, которые они выполняют на входе. Но могут быть и цикличные, и полносвязные сети.

Сети могут различаться по типам обучения: обратного распространения, встречного распространения, нейронные сети Хопфилда и Хэмминга, сеть с радиальными базисными элементами, вероятностные нейронные сети и другие.

Выделяются также сети, основанные на нечеткой логике, - так называемые «гибридные сети».

Американские ученые нейропсихологУоррен Мак-Каллок и нейролингвистУолтер Питтс впервые предприняли попытку смоделировать процессы, протекающие в мозге живого организма, создав вычислительную модель для нейронных сетей. В конце 1940-х годов

канадский физиолог Дональд Олдинг Хебб создал принцип обучения, основанный на механизме нейронной пластичности (способность синапсов усиливаться или ослабевать с течением времени в ответ на повышение или понижение их активности), который стал известен как «обучение по Хеббиану». Американский психолог Розенблатт создал пер-септрон - алгоритм контролируемого обучения бинарных классификаторов. Первые исследования о функциональных сетях с множественными слоями были опубликованы советскими математиками А. Ивахненко и В. Лапа в качестве метода группового учета аргументов (МГУА). Основы непрерывного обратного распространения были выведены в контексте теории управления американским ученым в области авиационно-космической инженерии Г. Келли и американским инженером А. Брайсоном с использованием принципов динамического программирования.

Благодаря способности воспроизводить и моделировать нелинейные процессы искусственные нейронные сети нашли применение во многих практических сферах: в распознавании лиц, компьютерных играх, переводчиках с иностранных языков, создании интернет-ботов, в физических моделях, геологии и психодиагностике.

В сетевом анализе нейронные сети наиболее широко и успешно применяются в анализе текстов (например, в программе Text Analyst), а также при анализе семантических сетей.

Искусственные нейронные сети успешно используются для синтеза систем управления динамическими объектами, широкое применение имеют в экономике, в предсказании финансовых временных рядов и многих других областях.

Основной недостаток практического применения нейронных сетей состоит в том, что после обучения и выполнения поставленной задачи они остаются «вещью в себе» -работают по принципу «черного ящика», когда исследователю нельзя понять функциональную зависимость и правила получения итогового результата. Собственно, сама нейронная сеть и является итоговым результатом исследования.

Связанные понятия

Artificial neural networks, нейрон, базовый оценочный модуль, нейросетевое моделирование, искусственный интеллект, машинное обучение, глубокое обучение, алгоритмы обучения, архитектура нейронных сетей, конечные автоматы, кибернетика, многомодальные графы, нечеткие множества, лингвистическая переменная

Список литературы

1. Калацкая Л. В., Новиков В. А. Организация и обучение искусственных нейронных сетей. 2002.

2. Хайкин С. Нейронные сети. Полный курс. Издание второе, исправленное. - М. -СПб - Киев: Изд-во Вильяме, 2008.

3. Круглов В. В., Дли М. И., Голунов Р. Ю. Нечеткая логика и искусственные нейронные сети. Учебное пособие. - М.: Издательство физико-математической литературы, 2001. - 224 с.

4. Bryson, А. Е. A gradient method for optimizing multi-stage allocation processes// Proceedings of Harvard Univ. symposium on digital computers and their applications. Vol. 72.1961.

5. Hebb D. O. Organization of behavior. - New York: Wiley, 1949.

6. Ivakhnenko A., Lapa V. Cybernetics and forecasting techniques. 1967.

7. Kelley H. J. Gradient theory of optimal flight paths. Ars Journal 30(10). 1960:947-954.

8. Kleene S. Representation of events in nerve nets and finite automata // С. E. Shannon and J. McCarthy (eds.), Automata Studies. - Princeton University Press. 3-42.1956.

9. McCulloch W. S., Pitts W. A logical calculus of the ideas immanent in nervous activity// The bulletin of mathematical biophysics 5(4) 1943:115-133.

10. Rosenblatt F. The perceptron: a probabilistic model for information storage and organization in the brain. Psychological review 65(6) 1958: 386.

11. Schmidhuber J. Deep learning in neural networks: an overview. Neural networks 61. 2015:85-117.

12. Text Analyst: http://www.analyst.ru/

СОЦИАЛЬНЫЕ ТЕХНОЛОГИИ

Социальные технологии в широком смысле - это методы применения теоретических выводов (достижений) гуманитарных наук в практических целях.

Чаще всего под социальными технологиями понимается некий набор действий или последовательность приемов, позволяющих достигнуть определенных целей. То есть не просто применение научных знаний на практике, а создание определенных алгоритмов, правил и условий их эффективного использования. В идеале точное соблюдение технологии должно приводить к заранее заданным результатам.

Рост научного знания о поведенческих особенностях человека, условиях формирования сообществ, устойчивости институтов и других характеристиках социальных систем и процессов неизбежно приводит к попыткам применить эти теоретические модели на практике. В качестве ставших уже обыденными примеров социальных технологий можно назвать психологические тесты при приеме на работу.

К более сложным вариантам социальных технологий можно отнести методы прогнозного социального проектирования Т. Дридзе, позволяющие последовательно изменять городскую среду под меняющиеся потребности жителей. Или процедуры социальной диагностики деловой организации В. Щербины, направленные на выявление наиболее жизнеспособных стратегий и ориентиров развития компании.

Здесь следует обозначить основные проблемы все более активного применения социальных технологий. Во-первых, как и технологии, основанные на точных науках, социальные технологии могут быть использованы не только во благо, но и с целью причинения вреда людям, сообществам, институтам и даже государствам. Классическим примером двоякого использования технологий на основе точных наук является применение энергии распада атомного ядра, с одной стороны, для получения электроэнергии, с другой - для создания атомной бомбы. Аналогичным образом социальные онлайн-сети не только принесли определенный общественный прогресс, но и стали удобным инструментом для терроризма, теневого рынка, а также для различного рода вмешательств в дела национальных государств.

Вторая проблема социальных технологий вытекает из некоторой неточности гуманитарных наук. В результате формирующиеся социальные технологии строятся не на основе четких законов, а на базе выводов более или менее доказанных теорий. Такая теоретическая неопределенность и фрагментарность гуманитарного знания ставит под вопрос возможность достижения точных, прогнозируемых результатов при применении социальных технологий.

Кроме того, возникает вопрос этичности применения социальных технологий, направленных на изменение поведения, установок, ценностей индивидов или общепринятых норм и социальных процессов. Если приведенные выше примеры социальных технологий направлены на усовершенствование какой-либо деятельности (работы кадровых служб, градостроительной или управленческой), то целый ряд другого рода технологий, также называемых социальными, ориентирован на оказание воздействия на людей и изменение их поведения. В качестве примеров таких технологий можно назвать приемы политтехнологов, техники эффективных переговоров, использование цветового кодирования в рекламе и т.д.

Список литературы

1. Поппер К. Р. Открытое общество и его враги. Т. 1-2. - М.: «Феникс», 1992.

2. Прогнозное социальное проектирование / Под ред. Т. М. Дридзе. - М.: «Наука», 1989.

Ъ. Социология управления: Теоретико-прикладной толковый словарь / Отв. ред. А. В. Тихонов. - М.: КРАСАНД, 2015.

4. Щербина В. В. Рационализирующие диагностические управленческие социальные технологии. - М.: «Новый хронограф», 2018.

МОСКОВСКИЙ ЦЕНТР УРБАНИСТИКИ

ЭКСПЕРТНЫЕ ЗАСЕДАНИЯ ПО САМЫМ АКТУАЛЬНЫМ ВОПРОСАМ ГРАДОСТРОИТЕЛЬНОГО РАЗВИТИЯ

ОСНОВНАЯ ЦЕЛЬ ПРОЕКТА:

развитие обратной связи между властью и обществом по вопросам градостроительного развития, улучшения качества общественной экспертизы и прогнозирования.

□ МЕРОПРИЯТИЯ

проходят при поддержке ВЦИОМ и Комплекса градостроительной политики и строительства города Москвы

□ ФОРМАТ:

круглые столы, открытые дискуссии и экспертные сессии.

□ УЧАСТНИКИ:

представители власти, бизнеса, медиа, экспертного

сообщества и общественных структур.

Ф] #МЦУГОРОД

i Надоели баннеры? Вы всегда можете отключить рекламу.