УДК 81'22
К.И. Белоусов, Д.А. Баранов, Е.В. Ерофеева, Н.Л. Зелянская, Д.А. Ичкинеева
РЕАЛИЗАЦИЯ КОНЦЕПТУАЛЬНО-ГИПЕРТЕКСТОВОЙ СТРУКТУРЫ ПРЕДМЕТНОЙ ОБЛАСТИ В ЖУРНАЛЕ «ВОПРОСЫ КОГНИТИВНОЙ ЛИНГВИСТИКИ»1
В статье описывается исследовательская программа моделирования информационного пространства, сложившегося в отдельной предметной области, которая формируется тематическим научным журналом. В качестве предметной области рассмотрена КОГНИТИВНАЯ ЛИНГВИСТИКА, а материалом исследования послужили публикации российского научного журнала «Вопросы когнитивной лингвистики», целиком посвященного разработке лингвоког-нитивной проблематики.
Ключевые слова: научная статья, термин, набор ключевых слов, предметная область, когнитивная лингвистика, «Вопросы когнитивной лингвистики», прогнозирование, концептуально-гипертекстовая структура, ИС «Семограф».
Одной из наиболее актуальных сфер приложения теоретической и прикладной лингвистики является изучение профессиональной (в т.ч. научной) коммуникации, а также поиск методов ее прогнозирования. Поскольку научная коммуникация строится на базе некоторой научной области, т.е. определенной структуры знания, при ее анализе продуктивно использовать методы, разработанные для изучения когниции, такие как концептуальный анализ, фреймовое, тезаурусное моделирование, которые в совокупности с методами корпусной лингвистики позволяют реализо-вывать анализ концептуального потенциала разнообразных научных и практических областей человеческой деятельности. Эти методы и теоретический базис когнитивной лингвистики, «погруженные» в контекст современных информационных технологий и методов математического моделирования, могут решать не только классификационные задачи, но и задачи оценки, прогнозирования и управления исследовательской деятельностью, в том числе и в рамках создания СППР - систем поддержки принятия решений. СППР представляют интерес для всех участников научного процесса: руководителей, исследователей, редколлегий научных журналов и издательств и др.
В качестве концептуального ядра для СППР в научной сфере нами предлагается концептуально-гипертекстовая структура научной предметной области (далее. - ПрО), подробно описанная в работе [Белоусов, Баранов, Зелянская 2014]. Сама концептуально-гипертекстовая структура реализо-
1 Исследование выполнялось при финансовой поддержке РФФИ (проект № 15-06-06373).
вана в ИС «Семограф» (URL: http://semograph.com). Структурированная в концептуально-гипертекстовой структуре ПрО КОГНИТИВНАЯ ЛИНГВИСТИКА2 включает в себя: 1) описание публикаций журнала «Вопросы когнитивной лингвистики» за период 2008-2013 гг.; 2) номенклатур-но-терминологические единицы, характеризующие каждый текст корпуса; 3) набор метаданных, характеризующих каждый текст корпуса; 4) систему терминополей, сформированных в результате экспертного анализа; 5) методы автоматизированной обработки научного контента, дающие возможность генерировать комплекс результатов (обобщенных данных, моделей, и др.), описывающих закономерности организации ПрО. Полученные в ходе исследования результаты целесообразно представить поэтапно.
1. Терминогруппы: временные и социально-территориальные аспекты
Первый этап связан с анализом употребления собственно терминов. В качестве интегратив-ной единицы можно ввести понятие терминогруппы R* (далее. - Т-группа), под которой будем понимать множество терминов, каждый из которых имеет в своем составе корень R. Например, Т-группа КОНЦЕПТ* включает термины: КОНЦЕПТ, КОНЦЕПТУАЛИЗАЦИЯ, КОНЦЕПТУАЛЬНЫЙ АНАЛИЗ, ЭКОНОМИЧЕСКАЯ КОН-ЦЕПТОСФЕРА, ХУДОЖЕСТВЕННЫМ КОНЦЕПТ, КЛЮЧЕВЫЕ КОНЦЕПТЫ, КОНЦЕПТ ЛЕТО и мн. др. Термин может входит в несколько Т-групп: например ДИСКУРСООБРАЗУЮЩИЕ
2 Здесь и далее речь идет о моделировании ПрО КОГНИТИВНАЯ ЛИНГВИСТИКА по материалам публикаций журнала «Вопросы когнитивной лингвистики».
КОНЦЕПТЫ входит в Т-группу КОНЦЕПТ* и Т-группу ДИСКУРС*.
Т-группа используется как рабочий инструмент первичной группировки терминов и выделе-
ния наиболее популярных направлений терминологической рефлексии над ПрО. В таблице 1 представлены основные Т-группы ПрО КОГНИТИВНАЯ ЛИНГВИСТИКА.
Таблица 1
Характеристика доминирующих Т-групп ПрО КОГНИТИВНАЯ ЛИНГВИСТИКА
Доминантные Т-группы Примеры Встречаемость Вес в корпусе
КОНЦЕПТ* концепт, концептуализация, экономическая концептосфера 268 0,601
КОГНИТ* когнитивный, лингвокогнитивный уровень, когниция 175 0,392
ДИСКУРС* дискурс, дискурсообразующие концепты, дискурс-анализ 110 0,247
КАТЕГОР* категория, модусные категории, категоризация 74 0,166
МЕТАФОР* концептуальная метафора, метафорический концепт 72 0,161
КОММУНИКАТ* коммуникативная стратегия, текстовая коммуникация 66 0,148
ФРЕЙМ* фрейм, фреймовый анализ, фрейм-образец 50 0,112
ТЕРМИН* понятийная структура терминологии, терминосистема 49 0,110
КАРТИН* лингвокультурная картина мира, языковая картина мира 40 0,090
Примечание. Вес в корпусе вычисляется как отношение встречаемости Т-группы к общему количеству статей в корпусе.
Представляет интерес варьирование употребления Т-групп в зависимости от различных социаль-ныхи временных параметров (о варьировании социальных параметров см.: [Доценко, Ерофеева, Ерофеева 2010]). На рисунке 1 отражено распределение употребления терминов доминирующих Т-групп за изучаемый временной период. Наиболее популярные Т-группы «стремятся» к некоторым устойчивым для себя значениям. Так, Т-группа КОНЦЕПТ имеет частотность, близкую 0,59. В то же время в отдельные временные интервалы может усиливаться интерес к той или иной теме. Например, показатели частотности Т-группы ТЕРМИН в 2012 г. значительно превысили типичные для себя показатели в 0,08 ± 0,02.
Рис. 1. Временная динамика использования терминов доминирующих Т-групп
Кроме временного распределения встречаемости Т-групп в НКС, представляет интерес стратификационного (научный статус авторов) и/или территориального (место проживания авторов) влияния на выбор / предпочтение Т-групп. На рисунке 2 представлено распределение встречаемости основных Т-групп в НКС к публикациям четырех научных страт: д.ф.н., к.ф.н., аспирантов, исследователей без
уч. степени. Сумма Т-групп: д.ф.н. - 2,0; к.ф.н. - 2,0; аспиранты - 2,14; без уч/с - 2,44 - свидетельствует о более частотном обращении к популярным в данной ПрО терминам представителей двух последних научных страт.
Рис. 2. Использование терминов доминирующих Т-групп представителями четырех научных страт
Введем КХ - коэффициент следования научному тренду (который можно рассматривать как проявление нормативности в формировании предметной области:
Щ =
где КХ/ - коэффициент следования научному тренду представителями /-группы; si - вес статьи с /-группами терминов в корпусе; пк - количество статей с данным весом частотности; N - количество представителей /-группы. При этом si рассчитывается по формуле:
т Е [-г
где/г - вес Т-группы г*, а т - количество Т-групп, актуализированных в данной статье.
Вес каждой Т-группы определяется как отношение встречаемости терминов данной Т-груп-пы к общему количеству публикаций (столбец «Вес в корпусе» таблицы 1). Вес Т-группы показывает, с какой вероятностью можно обнаружить в корпусе статью, содержащую в ключевых словах термин / термины данной Т-группы. Например, статья [Русова 2008: 104] имеет следующие ключевые слова: ФРЕЙМ; КОНЦЕПТУАЛЬНАЯ МЕТАФОРА; ПЕРЕВОД; КОГНИТИВНЫЙ АНАЛИЗ; ПОЭТИЧЕСКИЙ ДИСКУРС. В них ак-
туализовано сразу пять Т-групп: ФРЕЙМ*, КОНЦЕПТ*, МЕТАФОР*, КОГНИТ*, ДИСКУРС*, -поэтому вес данной статьи s1 = 5 * (0,112 + 0,601 + 0,161 + 0,392 + 0,247) = 7,565.
Коэффициент следования научному тренду КХ может рассчитываться для разных выборок, например, для выборок статей, сформированных по научным стратам или региональным научным центрам. Полагаем, что средние значения КХ не будут релевантно представлять данные для выделенных научных сообществ из-за большого влияния отдельных статистических выбросов при небольшом объеме данных. Поэтому вместо средних значений будем использовать медиану, а данные представлять в виде графика типа Ьох-whiskeгplot (рис. 3). Результаты КХ для разных научных страт можно объяснить различием типичной деятельности, характерной для них - от необходимости следовать определенным традициям и трендам, важным для квалификационных работ, до разработки новых научных направлений.
Результаты КХ для региональных научных центров представлены на рисунке 4. Сразу отметим, что объемы выборок публикаций исследователей, сгруппированных по городам, недостаточны, чтобы говорить о тех концепциях когнитивной лингвистики, которые разрабатываются в данных региональных центрах. Результаты свидетельствуют о региональных концепциях КОГ-
НИТИВНОЙ ЛИНГВИСТИКИ как они представлены в журнале «Вопросы когнитивной лингвистики». Таким образом, можно говорить о проекциях региональных концепций на ПрО, разрабатываемую журналом. На рисунке 4 видно, что высокие показатели медианы К характерны для Тамбова и Н. Новгорода. Вероятно, высокие показатели медианы Кх, характерные для публикаций тамбовских исследователей, объясняются ведущей ролью, которую играет тамбовская школа в разработке и формировании научных направлений КОГНИТИВНОЙ ЛИНГВИСТИКИ, представленных в журнале.
Значения показателей медианы К Москвы расположены в среднем диапазоне, характерном для всего корпуса. В НКС к публикациям московских когнитивистов входят 1 -2 термина доминирующих Т-групп (ср. с 2-3 терминами Т-групп в публикациях тамбовских исследователей и 3-4 терминами Т-групп в статьях ученых из Н. Новгорода). В работах исследователей из Санкт-Петербурга в меньшей степени представлен концептуальный аппа-
рат, характерный для журнала. Остальные региональные центры имеют чуть более 10 публикаций, поэтому результаты по данным центрам сложно оценивать.
2. С-графы терминов и терминополей
Генерация семантической карты (далее. -С-карты) и семантического графа (далее. - С-графа) может осуществляться на «сыром» материале: узлами структуры будут являться термины, а ребрами - показатели частоты их совместного использования в НКС. Недостатком такой модели является ее размер: в нашем случае, структурная модель состояла бы из 1650 узлов. Поэтому возможности использования С-карты и С-графа терминов ограничены и представляют интерес только в аспекте моделирования наиболее значимого фрагмента структуры ПрО. На рисунке 5 представлен С-граф наиболее частотных терминов ПрО КОГНИТИВНАЯ ЛИНГВИСТИКА (порог значимости определялся как превышающий определенную частоту появления термина (в данном случае 0,01) в корпусе.
Рис. 3. Распределение статей по весу Kt для основных научных страт
Рис. 4. Распределение статей по весу Kt для основных региональных научных центров
Примечание. График box-whiskerplot отображает распределение Kt для каждой страты по квартилям. Первый квартиль (четверть всех данных) соответствует расстоянию от 0 (начало нижнего «уса») до начала «коробки» (box); второй квартиль - от начала коробки до медианы (изображена в центре «коробки» и сопровождается числовыми данными); третий квартиль - от медианы до верхней части коробки; четвертый квартиль - от верхней части коробки до границы верхнего «уса». Остальные наблюдаемые случаи представляют собой статистические выбросы.
Рис. 5. Графосемантическая модель совместной встречаемости в НКС наиболее частотных терминов
ПрО КОГНИТИВНАЯ ЛИНГВИСТИКА
Примечание. Размер узла отражает встречаемость КС в проанализированном материале. Толщина линии маркирует силу связи (частоту совместного использования в НКС) между терминами.
Представленная модель отражает «взгляд» на ПрО со стороны исследователей ее наиболее разработанного сектора. Однако данная модель передает лишь 8,1 % всех связей между терминами в ПрО. Поэтому для релевантного представления ПрО используется метод полевого анализа, результатом применения которого является структурированная в виде С-карты и С-графа система терминополей. Кроме того, выявляются зависимости между временными (дата публикации), топологическими (географическими), социальными факторами и моделируемым информационным пространством ПрО. Соотнесенность семантики предметной области с территориальной, социальной, временной «картографией» позволяет понять логику развития предметной области, т.е. проследить пути, способы и механизмы реализации предметной интенции через социальные, географические и временные каналы обмена информацией (и их возможные комбинации).
Полевой анализ ключевых терминов к 446 научным статьям, опубликованным в журнале «Вопросы когнитивной лингвистики» за анализируемый период, позволил выделить 30 терминополей (показатели частотности рассчитываются как отношение веса терминополя к количеству публикаций): 1) структурная организация - 0,633 (система, субфрейм, сценарий); 2) концепт и концеп-
тосфера - 0,402 (концептуальный анализ, мифо-концепт); 3) когниция - 0,324 (когнитивный, лин-гвокогнитивный уровень); 4) сфера культуры и лингвокультуры - 0,316 (лингвокультурема, мифоконцепт); 5) текст и дискурс - 0,277 (интертекстуальность, дискурс-анализ); 6) психологические категории - 0,250 (память, ассоциации); 7) лексика и фразеология - 0,245 (идиомы, термин, антропонимы); 8) коммуникация - 0,215 (манипуляция, коммуникативная стратегия); 9) понятийно-категориальная сфера - 0,210 (мо-дусные категории, категоризация); 10) семиотическое пространство - 0,205 (знак, семиосфера, биосемиотика); 11) язык - 0,197 (лингвокогни-тивный уровень, языковое сознание);12) грамматика - 0,189 (синтаксис, грамматикализация); 13) предметная область - 0,189; (экономика, политика); 14) семантика - 0,162 (семантические сети, семантическое поле); 15) тропы и фигуры -0,157 (метафора, антитеза); 16) модель и моделирование - 0,141 (метафорическая модель, когнитивное моделирование); 17) направления, школы - 0,141 (когнитивная лингвистика, политическая лингвистика); 18) методы исследования -0,136 (эквиполентноешкалирование, сравнительный анализ); 19) процессуальность - 0,130 (когнитивные процессы, взаимодействие значений); 20) знание и информация - 0,128 (форматы зна-
ний); 21) понимание и смысл - 0,125 (когнитивная модель переосмысления); 22) картина, образ, модель мира - 0,117 (лингвокультурная картина мира); 23) речевая деятельность - 0,109 (рече-коммуникативный акт); 24) значение - 0,101 (широкозначные глаголы); 25) социосфера - 0,088 (гендер, социальная маркированность); 26) пространство и время - 0,088 (темпоральный код культуры); 27) логические категории и операции -0,074 (отрицание, противопоставление, тезис); 28) сфера аксиологии - 0,069 (прагматический оценочный абсурд); 29) функциональность - 0,059 (функции эпиграфа); 30) языковая личность -0,040 (авторская модальность).
На рисунке 6 представлено временное распределение частотности терминополей за период 2008-2013 гг. График дает представление об общем интересе авторов журнала «Вопросы когнитивной лингвистики» к тем или иным частным научным направлениям, отражаемым в содержании каждого терминополя. На рисунке видно, что СТРУКТУРНАЯ ОРГАНИЗАЦИЯ - наиболее
значимое для ПрО терминополе, что свидетельствует о важности включения в модель всех терминов ПрО, а не только ее наиболее разработанного сектора, в котором доминирующее положение отводилось КОНЦЕПТУ (см. рис. 5).
В качестве примера проанализируем НКС из цитируемой выше статьи [Эмер 2011: 50]:
- ФОЛЬКЛОРНЫЙ ДИСКУРС относится к терминополям КУЛЬТУРА И ЛИНГВОКУЛЬ-ТУРА; ТЕКСТ И ДИСКУРС.
- КОГНИТИВНО-ДИСКУРСИВНОЕ ИССЛЕДОВАНИЕ относится к терминополям ТЕКСТ И ДИСКУРС; КОГНИЦИЯ; НАПРАВЛЕНИЯ, ШКОЛЫ.
- КОММУНИКАТИВНЫЕ СТРАТЕГИИ относится к терминополям СТРУКТУРНАЯ ОРГАНИЗАЦИЯ; КОММУНИКАЦИЯ.
ЦЕННОСТИ относится к терминополю СФЕРА АКСИОЛОГИИ.
- ДИСКУРСООБРАЗУЮЩИЕ КОНЦЕПТЫ относится к терминополям КОНЦЕПТ И КОНЦЕПТОСФЕРА; ТЕКСТ И ДИСКУРС.
Рис. 6. Распределение частотности терминополей за период 2008-2013 гг.
В то же время информационное пространство каждого конкретного исследования создается на основе взаимодействия нескольких терминополей, что хорошо видно на представленном ниже рисунке 7.
Рис. 7. Распределение количества терминополей по научным статьям за период 2008-2013 гг.
Таким образом, в данном НКС актуализова-но восемь связанных друг с другом терминопо-лей. На рисунке 7 видно, что минимальное количество полей, актуальных для научной статьи, равно 1; максимальное - 13; мода приходится на 6 полей. Данная модель показывает значимость исследования структурной связности терминолей, формирующих информационное пространство как отдельной публикации, так и журнала
в целом, т.к. структурные связи отражают существующие в реальности композиции научных проблем и направлений. Моделирование структуры терминополей осуществляется с помощью метода графосемантического моделирования. С-граф терминополей информационного пространства журнала «Вопросы когнитивной лингвистики» за период 2008-2013 гг. представлен на рисунке 8.
Рис. 8. С-граф терминополей предметной области КОГНИТИВНАЯ ЛИНГВИСТИКА
Примечание. В С-графе вершины соответствуют терминополям, а ребра - связям между ними. Размер вершины пропорционален частотности поля, а толщина ребра - силе связи между полями (частоте совместного присутствия двух терминополей в контекстах). Порог значимости для ребер превышает частоту 0,05.
Ядро графа - терминополе СТРУКТУРНАЯ ОРГАНИЗАЦИЯ имеет связи почти со всеми терминополями, репрезентируясь в НКС в соответствии с используемыми типами структур в том или ином терминополе. Например, соединение СТРУКТУРНОЙ ОРГАНИЗАЦИИ с КОНЦЕПТОМ И КОНЦЕПТОСФЕРОЙ частотно репрезентируется в терминах ФРЕЙМОВАЯ СТРУКТУРА КОНЦЕПТА, КОНЦЕПТУАЛЬНАЯ МЕЖФРЕЙМОВАЯ СЕТЬ и др. В то же время связь СТРУКТУРНОЙ ОРГАНИЗАЦИИ с ГРАММАТИКОЙ актуализирует более традиционные типы структурных наименований: СТРУКТУРА НАРЕЧИЯ, АНАЛИТИЧЕСКИЙ ГЛАГОЛ, СТРУКТУРНАЯ СХЕМА ПРЕДЛОЖЕНИЯ и т.п. Интересно, что терминополе ПРОЦЕССУАЛЬНОСТЬ, являющееся антиномией СТРУКТУРЕ, занимает периферийное положение и соотнесено только с КОНЦЕПТОМ И КОНЦЕПТОСФЕРОЙ.
На рисунке 8 видно, что информационное пространство ПрО в журнале формируется за счет включения в лингвокогнитивную проблематику таких областей, как ТЕКСТ И ДИСКУРС и ЛИНГВО-КУЛЬТУРОЛОГИЯ, - при этом исследовательский «акцент» делается на изучении ЛЕКСИКИ и ФРАЗЕОЛОГИИ (ГРАММАТИКА отходит на второй план). Отметим также значимость терми-нополя ПСИХОЛОГИЧЕСКИЕ КАТЕГОРИИ, актуального для когнитивистики в целом, однако, отсутствие связей данного терминополя с важными для него терминополями позволяет говорить о недостаточной разработанности психологической проблематики (в частности, отсутствие связей с терминополями ГРАММАТИКА, ЯЗЫКОВАЯ ЛИЧНОСТЬ и др.). Интерес представляет и терминополе СЕМИОТИЧЕСКОЕ ПРОСТРАНСТВО, которое задает семиотическую модель описания лингвоконитивным проблемам. Несмотря на относительно невысокую частотность, семиотические конструкты используются при характеристике наиболее значимых сфер анализируемой ПрО. Вероятно, СЕМИОТИЧЕСКОЕ ПРОСТРАНСТВО обладает большим метаязыко-вым потенциалом, т.к. позволяет описывать когнитивные процессы не только на материале естественного языка.
3. Анализ соответствий использования терминополей в публикациях научных страт
Одним из результатов использования концептуально-гипертекстовой структуры является генерация таблиц сопряженности, в качестве признаков которых берутся как Метаполя : Метаполя
(например, Научные страты : Годы публикаций), так и «Метаполя : Терминополя» (например, Научные страты : Терминополя). Особый интерес представляет второй вариант генерации таблиц сопряженности, количественно репрезентирующих значимость конкретного терминополя для каждой научной страты. Таблица сопряженности может использоваться в рамках метода снижения размерности признакового пространства с помощью анализа соответствий (Correspondence Analysis). Данный метод позволят визуально представить исследуемые терминополя и научные страты в координатном пространстве переменных малой размерности (в частности, на плоскости) (см.: [Боровиков 2003: 561-576]). На рисунке 9 визуализированы результаты применения анализа соответствий к таблице сопряженности Научные страты : Терминополя.
Для интерпретации графика нужно учитывать следующее:
- расстояние между данными одного типа свидетельствует о качестве связи между ними: чем меньше расстояние, тем связь сильнее, чем больше - тем слабее. В нашем случае речь может идти 1) о совместном использовании терминов, относящихся к разным терминополям, и 2) о близости стратегий употребления КС разными научными стратами;
- сила связи между данными разных типов устанавливается на основе размера угла между двумя точками (относящихся к разным типам данных), вершина которого расположена в центре тяжести графика (точке пересечения осей). Острый угол свидетельствует о положительной корреляции (чем меньше угол, тем выше корреляция); тупой угол - об отрицательной корреляции; прямой угол - об отсутствии корреляции [Боровиков 2003: 570-571].
Не будем подробно останавливаться на интерпретации данных, отметим лишь некоторые наиболее интересные, на наш взгляд, корреляции. Так, можно отметить сильную связь между стратой «без уч. ст.» и терминополем ЛЕКСИКА И ФРАЗЕОЛОГИЯ, в которое были включены все единицы Т-группы ТЕРМИН*. Видно, что результаты коррелируют с теми, которые представлены на рисунке 2. Аспиранты более всего сосредоточены на изучении КОНЦЕПТОВ (тематика, характерная для квалификационных работ), а докторов наук в большей мере интересуют ПОНЯТИЙНО-КАТЕГОРИАЛЬНАЯ СФЕРА, НАПРАВЛЕНИЯ И ШКОЛЫ и МЕТОДЫ ИССЛЕДОВАНИЯ.
Рис. 9. Расположение терминополей и научных страт в двумерном пространстве
4. Частнонаучная предметная область как композиция терминополей
Частнонаучная предметная область -
композиция терминополей, репрезентирующая отдельное научное направление в общей предметной области [Belousov, Baranov, Zelyanskaya 2014]. Выделение частнонаучных ПрО из общей предметной области научного журнала осуществляется с помощью метода кластерного анализа. Кластерный анализ производится над множеством контекстов, параметрами которых являются бинарные векторы, содержащие наборы полей соответствующих контекстов. Набором полей контекста называется множество терминополей, связанных с данным контекстом посредством произвольного числа терминов (в нашем случае ключевых слов к публикациям). Поскольку каждому контексту соответствует частнонаучная ПрО, можно использовать результат кластеризации в качестве оценки подобия публикаций и соответствующих им частнонаучных ПрО.
Выделение частнонаучных предметных областей осуществляется с помощью метода нечеткой кластеризации C-means [Kaymak, Setnes 2000 URL: http://repub.eur.nl/pub/57/erimrs20001123094510.pdf]. В отличие от других распространенных методов кластерного анализа, таких как K-means или само-
организующихся карт Кохонена, данный метод допускает принадлежность одного элемента двум и более кластерам, что в данной задаче позволяет отнести одну публикацию к нескольким направлениям в случае высокой неопределенности в ее описании. В результате кластеризации определяются: 1) частнонаучные предметные области, соотносимые с выделенными кластерами, и 2) публикации, в той или иной мере соответствующие частнонауч-ным предметным областям.
На основе полученных данных, публикации были отсортированы по номеру кластера и расстоянию от его центра в порядке возрастания значений. В таблице 2 представлена кластеризация контекстов в виде 9-ти кластерной модели, которая была отобрана из спектра других моделей (состоящих из 6, 7, 8, 9 и 10 кластеров) на основании наибольшего соответствия ПрО КОГНИТИВНАЯ ЛИНГВИСТИКА.
Выявленные на основе кластеризации публикаций частнонаучные ПрО представляют собой основные направления исследований в 2008-2013 гг., а представленная на рисунке 10 гистограмма распределения выделенных кластеров (частнонаучных ПрО) по временным срезам отражает временную динамику научных интересов авторов журнала. Представленная диаграмма дает воз-
можность оценить, насколько динамичны, изменчивы и в то же время в отдельных аспектах взаимосвязаны области научных интересов журнала. Так, в частности, увеличение в последние годы количества публикаций кластера 3 «к-лф-с» (реконструкция концептов на основе лексического анализа) свидетельствует о выборе журналом в качестве приоритетных проблем концептологии. Альтернативное направление (кластер 6 «к-псх-с»), имеющее в 2008 г. близкую стартовую позицию,
в дальнейшем вытесняется на периферию (особенно это заметно по количественным данным 2013 г.). Полагаем, что вытеснению данного направления способствовали набирающие популярность исследования в рамках кластера 8 (к-лф-по-сп-с), связанные с исследованием терминосистем и кон-цептосфер специального знания. Аналогичным образом связаны между собой исследования в области теории дискурса (кластеры 1, 4 и 7) и лингво-культурологии (кластеры 7 и 9).
Таблица 2
Частнонаучные предметные области (9-ти кластерная модель)
№ кластера Композиции терминополей Условное обозначение Количество статей Репрезентативные статьи
1 Коммуникация + Структура + Текст и дискурс ком-с-тд 66 Виноградова 2010; Начерная 2009
2 Грамматика + Структура гр-с 69 Березина 2010; Хованова 2010
3 Концепт + Лексика и фразеология + Структура к-лф-с 68 Юсупова 2011; Непрокина, Писку-нова 2009
4 Направления и школы + Структура +Когниция + Текст и дискурс нш-с-кгн-тд 41 Болдырев 2013; Мишанкина 2013
5 Знание и информация + Психол. категории + Структура зн-псх-с 38 Золотова, Комарова 2008; Новикова 2011
6 Концепт + Психол. категории + Структура к-псх-с 45 Коваленко 2012; Доценко 2011
7 Предметная область + Культура и лингвокуль-тура + Текст и дискурс по-клт-тд 43 Рожкова 2008; Пеньков 2010
8 Концепт + Лексика + Предметная область + Семиотика + Структура к-лф-по-сп-с 26 Зыкова 2012; Бочарникова 2010
9 Структура + Культура и лингвокультура + Язык с-клт-яз 50 Тахтарова 2008; Исакова 2013
Рис. 10. Распределение выделенных кластеров (частнонаучных ПрО) за период 2008-2013 гг.
На рисунке 11 представлена карта научных интересов авторов журнала (сгруппированных по географической принадлежности), составленная в соответствии с выделенными частнонаучными ПрО.
Рис. 11. Карта научных интересов авторов журнала «Вопросы когнитивной лингвистики» за период 2008-2013 гг. (по частнонаучным ПрО)
Примечание. Точками обозначены отдельные публикации. Центры кластеров располагаются на линиях, проведенных вертикально из намеченных кластеров (над их названиями). Чем ближе расположена точка к такой вертикальной линии, тем более репрезентативна для данного кластера публикация.
График дает наглядное представление, с одной стороны, о научных интересах авторов, а с другой - об обоснованности самой группировки по городам, показывающей «научную географическую специализацию». В том случае, когда речь идет о ведущих научных центрах (Москва, Санкт-Петербург) и достаточно большом объеме публикаций, сферы научных интересов распределяются почти равномерно. Небольшие научные центры даже при внушительном объеме публикаций имеют тенденцию к специализации. Особенно это заметно с публикациями исследователей из Махачкалы (почти все находятся в кластере 2). В то же время изучение научной «географической специализации» нужно осуществлять с временной «привязкой» публикаций, поскольку это позволит 1) сопоставить синхронные изменения в информационном пространстве ПрО; 2) выявить наличие / отсутствие изменений в исследовательских интересах к тем или иным научным проблемам, 3) установить зависимости в появлении интересов к тем или иным научным проблемам. Обозначенная проблема нуждается в отдельном исследовании; однако нельзя совсем не затронуть проблему изменения во времени состояния частнонаучных ПрО.
5. Оценка и прогнозирование состояния научной предметной области
Имеющиеся данные позволяют рассматривать проблему в следующем аспекте: 1) по каждой частнонаучной ПрО есть данные, свидетельствующие об интересе к ней в любой временной срез (см. рис. 10); 2) в то же время имеются данные о среднем количестве терминополей, актуа-лизованных в НКС к статьям каждой частнонауч-ной ПрО в те же временные срезы. Можно предположить, что разработка частнонаучной ПрО (и всей ПрО) будет приводить к ее усложнению, что на формальном уровне может выражаться в увеличении среднего количества терминополей в НКС к статье. А временная динамика среднего количества терминополей в НКС к статье в част-нонаучной ПрО должна соотноситься с количеством публикаций по данной тематике (т.е. с интересом к изучаемому проблемному полю).
На рисунке 12 соотнесены два ряда данных (среднее количество терминополей в НКС к статье и количество публикаций). Рисунок представляет сгруппированные данные по кластерам (частнонаучным ПрО) с отображением показателей коэффициента корреляции Кендалла.
Рис. 12. Временная динамика распределения (с прогнозом) по кластерам среднего количества терминополей в НКС к публикациям и количества публикаций (группировка по кластерам)
Примечание. Подчеркнуты показатели значимых корреляций при р<0,05 (прогнозируемые значения не учитывались).
На рисунке 12 видно, что только три част-нонаучные ПрО имеют корреляцию уровня сложности ПрО с ее популярностью. Заметим, что со временем корреляции между сложностью и популярностью увеличиваются: от отсутствия корреляции (2008 г.) до отрицательной корреляции (2009 и 2010 гг.) и изменения знака на положительную корреляцию (2011 и 2013 гг.). Обнаруженные закономерности между уровнем сложности / разработанности ПрО и ее популярностью среди исследователей нуждаются в более масштабной проверке и в случае подтверждения могут использоваться, в том числе для оценки, прогноза и планирования редакционно-издательской деятельности научных журналов или уровня поддержки научными фондами тех или иных исследовательских направлений.
Для прогнозирования значений количества терминополей и публикаций в 2014 и 2015 гг. был использован метод Multiple Regression, реализованный в статистическом пакете Statistica 8.0 [Вуколов 2008: 180-190]. Прогнозируемые показатели рассчитываются для каждого выделенного кластера; результаты представлены на рисунке 12. На рисунке видно, что прогнозируется наибольший рост коли-
чества публикаций кластера 3 «к-лф-с» и уменьшение количества публикаций конкурирующих с ним кластеров 6 «к-псх-с» и 8 «к-лф-по-сп-с». Между тем, кластер 3 - наиболее простая частнонаучная ПрО (как правило, используется в квалификационных работах). Кластеры 6 и 8 представляют, на наш взгляд, большую теоретическую и прикладную ценность, поэтому складывающаяся ситуация требует некоторого «выравнивания» частнонаучных ПрО, придания импульса для наиболее значимых из них.
Заключение
В данной работе мы стремились показать базовые возможности концептуально-гипертекстовой структуры ПрО, реализованной в ИС «Се-мограф»: классификационные задачи, выполняемые экспертами, а также задачи оценки и прогнозирования состояния всей ПрО и отдельных ее частнонаучных ПрО. В то же время вне обсуждения осталось много других важных научных проблем: множественность классификаций ПрО и их соотношение друг с другом; альтернативные методы прогнозирования состояния ПрО; близость региональных центров в понимании ПрО (на основе исчисления семантических расстояний) и влияние
региональных центров друг на друга; альтернативные оценки уровня сложности ПрО и ее част-нонаучных ПрО и мн. др. Отдельной проблемой видится соотношение, с одной стороны, концептуального пространства, создаваемого отдельными исследователями или научными коллективами, и концептосферы ПрО научного журнала; а с другой, - концептосферы ПрО научного журнала и концептосфер ПрО, а) создаваемой ведущими исследователями в данной области, б) научными Фондами, в) зарубежными научными журналами, специализирующимися в той же ПрО. Полагаем, что обозначенное направление исследований научных ПрО может быть востребовано в научном сообществе и в сфере управления исследовательской деятельностью.
Список литературы
Белоусов К.И., Баранов Д.А., Зелянская Н.Л. Научная предметная область: от онтологии к кон-цептосфе // Вопросы когнитивной лингвистики. 2014. № 4. С. 52-62.
Березина О.А. К вопросу о языковой репрезентации категории безличности // Вопросы когнитивной лингвистики. 2010. № 4. С. 39-51.
Болдырев Н.Н. Актуальные задачи когнитивной лингвистики на современном этапе // Вопросы когнитивной лингвистики. 2013. № 1. С. 5-13.
Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов. СПб.: Питер, 2003.
Бочарникова Е.А. Интертекстуальные включения как вербальные средства объективации экономических концептов // Вопросы когнитивной лингвистики. 2010. № 4. С. 52-57.
Виноградова С.А. Инструменты речевой манипуляции в политическом медиадискурсе // Вопросы когнитивной лингвистики. 2010. № 2. С. 95-101.
Вуколов Э.А. Практикум по статистическим методам и исследованию операций с использованием пакетов Statistica и Excel. М.: ФОРУМ, 2008.
Доценко Д.В. Гештальтный анализ древнеанглийского концепта GELEAFA (ВЕРА) // Вопросы когнитивной лингвистики. 2011. № 3. С. 21-25.
Доценко Т.И., Ерофеева Е.В., Ерофеева Т.И. Пермская школа социолингвистики: теоретические и методологические основы // Вестник Пермского университета. Российская и зарубежная филология. 2010. Вып. 2 (8). С. 144-155.
Золотова Н.О., Комарова Ю.В. Идентификация незнакомого слова как необходимое звено
познавательных процессов // Вопросы когнитивной лингвистики. 2008. № 2. С. 72-77.
Зыкова И.В. Семиотика музыки в построении фразеологического значения (лингвокульту-рологический подход) // Вопросы когнитивной лингвистики. 2012. № 4. С. 108-117.
Исакова С.С. Лингвокультурологическое исследование когнитивной сферы человека (на материале казахско-французской фразеологии) // Вопросы когнитивной лингвистики. 2013. № 2. С. 42-46.
Коваленко Г.Ф. Межтекстовое ассоциативно-смысловое поле как способ представления художественного концепта LOVE в идиостиле И. Стоуна // Вопросы когнитивной лингвистики. 2012. № 3. С. 76-83.
Мишанкина Н.А. Методология когнитивной лингвистики в исследовании научной коммуникации // Вопросы когнитивной лингвистики. 2013. № 3. С. 16-24.
Начерная С.В. Маркеры устности как речевые сегменты судебной защитительной речи: проекция на риторическую аргументацию // Вопросы когнитивной лингвистики. 2009. № 1. С. 114-118.
Непрокина Ю.А., Пискунова С.В. Концепт ЛЕТО и его воплощение в языковой культуре Тамбовского края // Вопросы когнитивной лингвистики. 2009. № 4. С. 123-128.
Новикова М.Г. Возможность графической интерпретации процесса понимания // Вопросы когнитивной лингвистики. 2011. № 3. С. 132-137.
Пеньков Б.В. Ядро и периферия образовательного дискурса (на материале британской средней школы) // Вопросы когнитивной лингвистики. 2010. № 3. С. 84-91.
Рожкова О.Е. Метафорическое представление концептов ВОИНА и ТЕРРОРИЗМ в политическом дискурсе // Вопросы когнитивной лингвистики. 2008. № 1. С. 72-74.
Русова И.А. Когнитивное исследование юридической метафоры в сонетах В. Шекспира и их переводах на русский язык // Вопросы когнитивной лингвистики. 2008. № 1. С. 104-111.
Тахтарова С.С. Концепт TOLERANZ в немецкой лингвокультуре // Вопросы когнитивной лингвистики. 2008. № 1. С. 64-71.
Хованова С.Ю. Репрезентация фразовых отглагольных имен типа SPIN-OUT в лексикографических источниках // Вопросы когнитивной лингвистики. 2010. № 2. С. 111-115.
Эмер Ю.А. Фольклорный дискурс: когнитивно-дискурсивное исследование // Вопросы когнитивной лингвистики. 2011. № 2. С. 50-60.
Юсупова С.М. Концептуализация труда в идиомах (на материале английского, немецкого, русского и чеченского языков) // Вопросы когнитивной лингвистики. 2011. № 2. С. 124-128.
Belousov K.I., Baranov D.A., Zelyanskaya N.L. A research team and its subject area: Towards the question of the effective planning of scientific activi-
ties // Scientific and Technical Information Processing. 2014. Vol. 41, Issue 2. P. S5-97.
Kaymak U., Setnes M. Extended fuzzy clustering algorithms // Erasmus Research Institute of Management. 2000. URL: http://repub.eur.nl/pub/57/ erimrs20001123094510.pdf (дата обращения: 09.06.2014).
K.I. Belousov, D.A. Baranov, E. V. Erofeeva, N.L. Zelyanskaya, D.A. Ichkineeva
IMPLEMENTATION OF SUBJECT AREA CONCEPTUAL AND HYPERTEXT STRUCTURE IN THE JOURNAL "ISSUES OF COGNITIVE LINGUISTICS"
The paper describes the research program of the modeling. This information space exists in a separate subject domain that is formed by the thematic scientific journals. COGNITIVE LINGUISTICS was considered as the subject domain and the publications of the Russian scientific journal "Issues of cognitive linguistics", entirely dedicated to the development of cognitive problems were used as the study material.
The basic method is the method of graph-semantic modeling implemented in the Information System "Semograph". We grouped sets of keywords from "Journal of Cognitive Linguistics" public a-tions for a six-year period 2008-2013 into termfields and used them as operational units. We chose R - high level programming language designed for statistical data processing as the main research tool of graph-semantic model.
The study includes the selection of terms; grouping of terms into termfields relevant to the analyzed subject domain; the study of the temporal dynamics of termfield updating in "Journal of Cognitive Linguistics" publications. Structural connectedness of termfields in each study allows us to offer a theoretical construct "particular science subject area", which is understood as provided in the form of a mathematical model termfields composition, representing some research directions in the general subject domain of COGNITIVE LUNGUISTICS.
Based on the algorithm of fuzzy clustering of graph-semantic model C-means cluster model of research areas within the general subject area is proposed. This map of scientific interests gives an overview of the main areas of research, the dynamics of interests change, approaches to the development of individual areas throughout the subject domain. One of the results of the study is also the opportunity to assess and predict the state of COGNITIVE LINGUISTICS subject domain in the analyzed thematic scientific journal.
Key words: scientific article, the term, a set of key words, subject area, cognitive linguistics, Issues of cognitive linguistics", forecasting, conceptual and hypertext structure, information system "Semograph ".