Научная статья на тему 'Инфокогнитивная технология моделирования вербальногосознания'

Инфокогнитивная технология моделирования вербальногосознания Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
216
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕРБАЛЬНОЕ СОЗНАНИЕ / АССОЦИАТИВНЫЙ ЭКСПЕРИМЕНТ / ЧАРЛЗ САНДЕРС ПИРС / СОБЫТИЙНО-СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / МОДЕЛИРОВАНИЕ ТЕКСТА / VERBAL CONSCIOUSNESS / ASSOCIATIVE EXPERIMENT / CHARLES SANDERS PEIRCE / EVENT-STATISTICAL MODELLING / SIMULATION OF TEXT

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Филиппович Юрий Николаевич

Одной из центральных идей моделирования языкового сознания, получивших теоретическое и практическое воплощение, является «идея построения когнайзера» – семиотической машины (автомата), как инфокогнитивной компьютерной системы / технологии, реализующей возможные модели операциональных отношений, существующих в сознании носителя языка культуры, между языковыми единицами (ЯЕ), которые зафиксированы в различных ассоциативных и когнитивных экспериментах. Теоретическое и практическое воплощение идеи когнайзера актуально как для решения общей проблемы когниции, так и для решения частных проблем многих наук, междисциплинарных исследований и разработок, для интегрированных и / или конвергентных технологий, в частности NBIC-технологий. Рассматриваются теоретические основания формального сравнительного анализа психолингвистических ассоциативных экспериментов и анализа текстовых массивов с использованием различных метрик, основанных на дистрибутивно-статистическом методе икомпонентноманализе.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INFOCOGNITIVE MODELLING OF VERBAL CONSCIOUSNESS

One of the central ideas in modelling linguistic consciousness, which has already received theoretical and practical embodiment, is the idea of building “cognizers”. Cognizers are semiotic tools (automatic infocognitive computer systems, i.e. technologies) used to reveal the possible models for operational relations among language units in the mind of the speech (cultural) community on the basis of the data recorded in various associative and cognitive experiments. Theoretical and practical embodiment of the idea of Cognizers is to address the fundamental problem of cognition as well as many specific and interdisciplinary aspects of research in different sciences, it can also contribute to the development of integrated and / or convergent technologies, in particular the NBIC-technologies. This article discusses some theoretical grounds for formal comparative analyses of associative psycholinguistic experiments and textual data referring to distributive-statistical method and component analysis.

Текст научной работы на тему «Инфокогнитивная технология моделирования вербальногосознания»

УДК 004.822; 81’23

Ю. Н. Филиппович

Московский государственный университет печати

им. Ивана Фёдорова ул. Прянишникова, 2а, Москва, 127550, Россия E-mail: [email protected]

ИНФОКОГНИТИВНАЯ ТЕХНОЛОГИЯ МОДЕЛИРОВАНИЯ ВЕРБАЛЬНОГО СОЗНАНИЯ *

Одной из центральных идей моделирования языкового сознания, получивших теоретическое и практическое воплощение, является «идея построения когнайзера» - семиотической машины (автомата), как инфокогнитивной компьютерной системы / технологии, реализующей возможные модели операциональных отношений, существующих в сознании носителя языка культуры, между языковыми единицами (ЯЕ), которые зафиксированы в различных ассоциативных и когнитивных экспериментах. Теоретическое и практическое воплощение идеи когнайзера актуально как для решения общей проблемы когниции, так и для решения частных проблем многих наук, междисциплинарных исследований и разработок, для интегрированных и / или конвергентных технологий, в частности NBIC-технологий. Рассматриваются теоретические основания формального сравнительного анализа психолингвистических ассоциативных экспериментов и анализа текстовых массивов с использованием различных метрик, основанных на дистрибутивно-статистическом методе и компонентном анализе.

Ключевые слова: вербальное сознание, ассоциативный эксперимент, Чарлз Сандерс Пирс, событийностатистическое моделирование, моделирование текста.

Исходные теоретические положения

Теоретически когнайзер представляет собой действующую (функционирующую) модель сознания носителя конкретного языка культуры, под которым понимается речемыслительная деятельность человека, с использованием знаковых систем, в частности вербальных. Гипотетически предполагается, что вербальное сознание отражает реальный мир, фиксирует его целостность посредством установления парадигматических отношений между мысли-знаками (МЗ), каждый из которых означивает некий предмет реального мира. Парадигматические отношения интерпретируют предметные отношения реального мира. В их числе отношения части-целого, сходства-различия, каузальности, пространства, времени и др.

Центральное место в теоретических положениях идеи построения когнайзера занимает семиотическая концепция Чарлза Сандерса Пирса. В основу формальной модели когнайзера легли следующие его суждения: а) «всякий раз, когда мы мыслим, нашему сознанию налично некоторое переживание, образ, понятие или другая репрезентация», служащая субъекту <внутренним = «мозговым»> знаком; б) «...если - после какой бы то ни было мысли - поток идей свободно течет далее, <то> он следует закону умственной ассоциации, <и> в этом случае каждая предшествующая мысль предпосылает нечто мысли следующей за ней.»; в) «. новый неожиданный опыт никогда не является делом мгновения, но является событием, занимающим время и пришедшим к своему свершению через непрерывный процесс»; г) «. мыслительная последователь-

* В статье приводятся результаты исследований, выполненных при поддержке РГНФ (гранты № 12-04-12039в и №12-04-12059в) и Президента РФ (грант № НШ-3661.2012.6).

1818-7935

Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2012. Том 10, выпуск 2 © Ю. Н. Филиппович, 2012

... ^ {МЗ,_т> ^ ...^ {МЗм} ^{МЗ,} ^ {МЗм} * ■ ■■* {МЗД * ...

«побудительное воздействие» «внешний знак»

Рис. 1. Речемыслительная деятельность

ность... на протяжении всей своей длительности свободно следует собственному закону ассоциации, и нет ни одного момента, в который имела бы место некая, принадлежащая этому ряду мысль, и последовательно за которым не имела бы места другая мысль, интерпретирующая или повторяющая первую» [Пирс, 2000а; 2000б].

Следуя этим суждениям, речемыслительная деятельность является «непрерывной» последовательной сменой мысли-знаков и при определенных условиях («после немалого внутреннего развития» субъекта и какого-либо побудительного воздействия на него) может быть выражена в форме внешнего знака, например, вербализована в устной или письменной форме (рис.1).

Символическое представление речемыслительной деятельности, изображенное на рис. 1, не демонстрирует в полной мере приведенные суждения Ч. Пирса, но позволяет далее рассматривать ее как случайный (вероятностный) процесс перехода от одного мысли-знака к другому, последующему. При этом возможными являются следующие варианты: первый, известными являются только «внешние знаки» и моменты време-

ни их возникновения (зафиксированные с определенной точностью, или вычисленные по некоторым правилам); второй, известными являются «побудительное воздействие», «внешний знак» и моменты их возникновения, которые могут быть получены так же, как и в первом варианте.

Текст как модель вербального сознания

Первый вариант назовем восприятием «внешних знаков», например чтение вербальных (языковых) единиц, представленных в виде текста, выраженных субъектом ранее («после немалого внутреннего развития»), без какого-либо «побудительного воздействия» - неизвестного, неопределенного или не принимающегося во внимание (рис. 2).

Овнешнённая, т. е. представленная внешне в виде вербального текста речемыслительная деятельность содержит и отражает некоторый «закон ассоциации» в процессе последовательной смены мысли-знаков. Текст как результат овнешнения языкового сознания содержит ассоциативные связи

между своими элементами, оформленными в виде соседствующих «внешних знаков», языковых единиц (ЯЕ), синтагм.

Заметим, что в нашей модели для субъекта, воспринимающего текст, он отражает лишь факты существования конкретного «внешнего знака» и его соседства с другими, т. е. фиксирует только синтагматические отношения между ними и представляет МЗг-в некоторой окрестности других соседних МЗг-1...МЗг_т и МЗг-+1...МЗг-+к, где т и к -границы левого и правого контекстов «внешнего знака» (в общем случае ЯЕ). «Закон ассоциации» мысли-знаков в данном случае есть отражение парадигматических отношений, установленных создавшим текст субъектом для предметов реального мира, в форму синтагм, иначе - «закон ассоциации» есть правила перехода от парадигматических отношений к синтагматическим. Текст латентно отражает парадигматические отношения мысли-знаков вербального сознания субъекта и явно синтагматические отношения между ними. Установление «закона ассоциации», т. е. правил перехода от парадигматических отношений к синтагматическим для субъекта, воспринимающего текст, представляется возможным только в случаях некоторого экспериментального воздействия на создавшего его субъекта, или предположения такого воздействия, а также и того и другого. В случае экспериментального воздействия возможно получение нового текста или метатекста (так называемых объяснений, пояснений и уточнений), что теоретически не меняет ситуацию, но практически в определенных случаях оказывается приемлемым. Основой предположений «закона ассоциации» являются суждения об общности для субъектов (как создавшего текст, так и воспринимающего его) предметов реального мира, а также физического строения самих субъектов, в том числе и субстрата сознания.

Ассоциативно-вербальная сеть как модель вербального сознания

Второй вариант назовем условно экспериментом, который представляет собой организованную серию «побудительных воздействий» на субъекта, например письменных вербальных стимулов, и фиксацию

его вербальных письменных реакций, ассоциированных с этим воздействием - «внешних знаков». Такой эксперимент в общем случае называют ассоциативным и в зависимости от условий его проведения, например, психолингвистическим - свободным массовым письменным вербальным.

Следует заметить нетривиальность в установке ассоциативной связи между стимулами и реакциями. В нашей модели (модели Пирса) ассоциация возможна только между следующими во времени друг за другом мысли-знаками. В проводимом же эксперименте предполагается, что в конкретный момент времени известный вербальный стимул «побудительного воздействия» S оказывается связанным с конкретным, но неизвестным мысли-знаком Мь реакция Я на который в последующем и фиксируется в момент времени ^ (рис. 3). При этом считается, что ассоциативная связь устанавливается между S и Я. Не учитываются процессы восприятия S и формирования Я, а также «контекст» мысли-знака МЗг-, который представляет собой некоторую цепочку речемыслительной деятельности, процесс потенциально возможного перехода между МЗг_т...МЗг-...МЗг+к. Этим процессам соответствуют следующие времена:

Твоспр. ^т1 tS,

время восприятия внешнего стимула;

Тформ. ?т2 tR,

время формирования внешнего представления состояния мыслительного процесса и время мыслительного процесса

Тмысл. ?т2 ?т1.

Дальнейшее развитие модели требует задания некоторых априорных условий. Будем считать что: а) имеет место «абсолютное доминирование» вербального стимула над текущим мысли-знаком и, как следствие из этого, его «полное замещение» им, т. е. S это и есть МЗг-; б) имеет место «абсолютное совпадение» МЗг+1 с реакцией Я; в) ассоциативное взаимодействие мысли-знаков, «побудительное воздействие» и выражение «внешнего знака» осуществляются симультанно, т. е. имеет место только одно сти-мульно-реактивное событие SR.

С учетом выдвинутых априорных условий наша модель речемыслительной деятельности представляет собой последовательность SR событий, которая может быть зафиксирована в виде множества связанных между собой SR вербальных пар, в общем

X

со

_0

X

0

со

о

о_

>

го н

X

0 СІ X

о с о 0 о.

± 00 с; о о о ъ о 2 § о о.

0

го

§2 I ё£ I

_0 О- и

X 0 £ 0 СО о

со

о

о_

Субъект

Прием внешнего стимула через | органы чувств |

Формирование внешнего представления реакции:

| написание или озвучивание

{Б-^}

Стимульно-реактивные пары, полученные в ассоциативном эксперименте

Рис. 3. Временные характеристики ассоциативного эксперимента:

- момент предъявления стимула респонденту; ^ - момент времени, в который респондент завершил восприятие реакции в виде написанного текста или озвученных слов; т - момент времени, в котором стимул включается в деятельность мыслительных процессов респондента; т - момент времени, в который начинается фиксация текущего состояния мыслительного процесса в некоторой внешней форме (звуковой или письменной)

случае образующих ассоциативно-вербальную сеть - АВС.

Ассоциативно-вербальная сеть так же, как и текст фиксирует синтагматические отношения между «внешними знаками» субъекта (в общем случае респондентов), наперед заданными стимулами S и потенциально возможными реакциями Я, и представляет парадигматические отношения.

Основным отличием вариантов представления речемыслительной деятельности в виде текста и в виде АВС является следующее: текст - это априори данная (созданная самим субъектом по заданным заранее правилам) синтагматическая конструкция «внешних знаков» его вербального сознания (формальная модель «Я так мыслю»); АВС - это апостериори полученная (сконструированная экспериментатором по заданным заранее правилам) синтагматическая конструкция стимульно-реактивных пар «побудительных воздействий» и «внешних знаков» (формальная модель «Он так мыслит»).

Сравнение

ассоциативно-вербальной сети

и текста

АВС, представляющую языковое сознание типового носителя языка, отнесем к классу моделей речемыслительной деятельности человека, которые назовем событийно-статистическими. Основное допущение событийно-статистического моделирования речемыслительной деятельности состоит в следующем. Речемыслительная деятельность субъекта (респондента) и «типового (усредненного) носителя языка» - это дискретные стационарные случайные эргодиче-ские семиотические (вербальные) процессы

смены в фокусе их «умного зрения» (центра внимания) мысли-знаков (вербальных единиц) - многомерная случайная величина Я^, 0 = [фъ tk)], где 1 = 1.7 - стимулы; ] = 1.. ..7 - реакции; к = 1...К - моменты испытаний. Данный класс моделей в числе других характеризуется следующими особенностями.

Во-первых, способом получения данных для моделирования. Они поставляются массовым психолингвистическим ассоциативным экспериментом, который представляет собой выборочное эмпирическое исследование генеральной совокупности событий -вербальных реакций на слова-стимулы множества респондентов (условно назовем эту особенность «событийность в большом»). Такой тип исследования характеризуют способ его организации, метод отбора респондентов, метод оценивания обобщенных параметров (статистик).

Во-вторых, априорными суждениями о речемыслительной деятельности респондентов, состоящих в том, что в вербальном ассоциативном эксперименте фиксируются события речемыслительной деятельности респондентов - мысли-знаки из некоторой их последовательности, цепочки (назовем это «событийность в малом»). При этом цепочка развернута во времени и представляет собой динамический временной ряд событий, имеющий свои параметры.

В-третьих, способом интеграции данных ассоциативного опроса. АВС не представляет языкового сознания конкретного субъекта и является формальным лингвистическим объектом, сконструированным по определенным правилам. Основных правил два: 1) одинаковые слова-реакции разных респондентов являются эквивалентными -это позволяет для каждого слова-стимула

Оружие (является стимулом 8)

ОРУЖИЕ: холодное 9; массового поражения, ружье 5; огнестрельное, ядерное 4; война, стреляет, убийства 3; безопасность, мощное, пистолет, смертельное, смерть, старинное, убийцы 2; абсолютное, автомат, армия, Бальзак, винтовка, военное, возмездия, врага, в руках, выстрелило, газовое, грозное, дерево, железо, зонтик, именное, и пушка, кинжал, командира, кровь, любви, массового уничтожения, мести, мое, мортира, МП, на складе, нож, опасно, опасное, орудие, перестройки, перо, пищаль, продавать, пролетариата, прощай, прятать, -разоружение, самозащиты, секретное, сильный, слово, сложить, смерти, спортивное, ствол, стрельба, стрелять, твое, холодная, черный 1;

Рис. 4. Частотное поле реакций слова «оружие»

(числа показывают количество одинаковых слов-реакций разных респондентов)

оружие

1 оружие -1-> стрельба______________________________________

2_ оружие -2-> пистолет -2-> стрельба

2 оружие -5-> ружье -1-> стрельба___________________________

3 оружие -5-> ружье -5-> охота -1-> стрельба

3 оружие -1-> армия -1-> оружие -1-> стрельба

оружие -1-> армия -1-> мучение -1-> борьба —1—>_стрельба

4 оружие -1-> ствол -1-> пушка -1-> чугун -1-> стрельба Всего цепочек 141, а том числе: 1 — нт,2 —1,3—2,4—15,5—Ш.

оружие -1-> ствол -1-> орудие

оружие -5-> ружье -1-> ствол -1-> орудие оружие -1-> перо -1-> топор -1-> орудие

оружие -2-> пистолет -1-> железо —3—> лом -1-> орудие

4 оружие -1-> армия -28-> солдат -1-> топор -1-> орудие

Всего

цепочек

29, в том числе: 1 — нет. 2—нет, 3—1,4—2.5—26

Рис. 5. Табличное и графовое представление АВС

<Ряска - это зеленое «одеяло» водоемов> ^ <зеленый; одеяло; водоем>^<ряска> = <зеленый 1^ лягушка 7^ болото 1^ ..., зеленый 1^ газ 1^ болото 1^ ..., зеленый 10^ крокодил 3^ болото 1^ ..., зеленый 1^лягушка 2^ пруд 1^... 4; одеяло 1^ночь 1^туман 1 ^болото 1^..., одеяло 1^ночь 1 ^рассвет 1^болото 1^... 2; водоем 3^ лягушка 7^ болото 1^..., водоем 1^море 1^болото 1^..., водоем 10^ озеро 2^ болото 1^ ..., водоем 2^ река 1^болото 1^..., водоем 6^ вода 1 ^болото 1^..., водоем З^лягушка 2^ пруд 1^ ..., водоем 2^ река 1^пруд 1^..., водоем 1 Гречка 1^пруд 1^ ..., водоем 4^ рыба 1^ пруд 1^...

Рис. 6. Сопоставление: предложение, 4-членная пропозиция и стимульно-реактивные цепочки длиной Ь < 4. Числами представлен вес (частота) ассоциативных пар

Ї Слово-стимул Слово-реакция Синтагматические отношения Парадигматические отношения

8 оператор эвм словосочетание

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4 оператор языка словосочетание

3 оператор пользователь вид-род

3 оператор человек вид-род

2 оператор программист сложное слово род-вид

1 оператор киностудия часть-целое

1 оператор команда синоним

Рис. 7. Пример конкретных ассоциативных, синтагматических и парадигматических отношений

построить частотное поле его реакций (рис. 4); 2) одинаковые слова-реакции и слова-стимулы, в том числе и разных респондентов, также являются эквивалентными - это позволяет искусственно сформировать цепочку из двух и более стимульно-реактивных пар, «удлинить» и «замкнуть» стимульно-реактивные цепочки, преобразовать иерархические связи между стимулами и реакциями в сетевые и представить их в форме таблицы переходов между словами или графа (рис. 5).

Основанием для применения этих правил является предположение об «эргодичности» двух процедур - эквивалентными для последующего моделирования языкового сознания являются процедуры многократного опроса одного респондента и параллельного опроса многих. Назовем эту особенность «пространственно-временной структурностью» АВС.

Текст внешне представляет языковое сознание и является моделью речемыслительной деятельности субъекта. Если событием считать появление в тексте некоторого знака (ЯЕ - слова, словосочетания и др.), то такую модель можно также отнести к классу событийно-статистических и справедливы-

ми окажутся отмеченные особенности этого класса моделей.

«Событийность в большом» для исследований текстов состоит в частотном анализе выделяемых в нем ЯЕ, этапами которого являются формирование (организация) корпуса текстов, отбор и определение статистических параметров ЯЕ. «Событийность в малом» - это анализ «линеарности» построения и динамики развития текста и составляющих его ЯЕ. «Пространственно-

временная структурность» текста - это представление текста в виде связанных между собой синтагматических и парадигматических конструктивов ЯЕ [Филиппович, Прохоров, 2002].

Возможными могут оказаться следующие сопоставления: а) текст ^ АВС в целом или какая-либо ее часть; б) ЯЕ текста (например, словосочетание, предложение, в общем случае некоторый контекст) ^ пропозиция ЯЕ как ближайшая, удаленная на К шагов стимульно-реактивная окрестность некоторого слова-стимула, или стимульно-реактивная цепочка длины Ь (рис. 6);

в) конкретные синтагматические или парадигматические отношения ^ ассоциативные отношения (рис. 7).

Исследовательский инструментарий

Инструментарий исследования событийно-статистических моделей хорошо развит и широко используется для анализа текстов в таких практических задачах, как индексирование, реферирование, создание онтологий, информационный поиск, обучение языку, редактирование, библиометрия, в целом -в задачах text-mining, автоматизированной обработке текстов (АОТ) и машинном обучении. Наиважнейшими инструментами здесь следует считать гиперболические распределения.

Первое из них - это формула Ципфа -Мандельброта:

i(k, r) = рк (r + v)-b, где b, к, v - const, r - ранг слова, i(k, r) - частота слова. Есть и другие формулы описания частотных распределений применительно к ассоциативным исследованиям.

Второе - это закон Бредфорда:

Ji = bJ-i = Ьк lJ\, где i = 1, 2, ..., к; к = 1, 2, ..., m; Ji - количество областей в ядре; bk > 1 - множитель Бредфорда для разбиения J наименований ына k групп.

Статистические методы пока не нашли широкого применения в исследованиях АВС. Единственным значимым результатом следует считать лишь подтверждение действенности закона Ципфа и определение его параметров, а также некоторые устойчивые значения мощностей множеств стимульно-реактивных пар «ядра АВС» (см., например: [Черкасова, 2010а; 2010б; 2007; 2005; 2004; 2002] и уточнение формулы Ципфа - Мандельброта, сделанное в работах В. В. До-линского [2012; 2011; 1988] применительно к распределению стимульно-реактивных пар в ассоциативном эксперименте).

Классическими методами исследования текстов, его пространственно-временной структуры, являются методы дистрибутивно-статистического (ДСМ) и компонентного анализа (КА); системное их описание,

включающее 8 формальных метрик, например, приведено в 1971 г. в работе В. А. Мос-ковича [1971. С. 213]. В работах Ю. Н. Караулова и его коллег [1982а; 19826]

приведены комбинация ДСМ и КА в виде частотно-семантического метода (ЧСМ) и соответствующая ему метрика - критерий Ю. Н. Караулова. Описание перечисленных методов и используемых в них метрик приведено также и в работе Ю. Н. Филиппова и А. В. Прохорова [2002], там же рассмотрена модификация критерия Ю. Н. Караулова. Анализ более 34 модификаций ДСМ и КА, включающий и многие их комбинации (комбинированные метрики), приведен в работах А. И. Панченко [Панченко и др., 2012; Панченко, 2011; 2010]. Практически все современные ДСМ и КА реализуются как технологии многомерного анализа данных, в частности кластерного и тензорного.

Обобщенной моделью исходных данных для анализа «пространственно-временной структурности» и текста, и АВС является матрица ассоциативной связанности ЯЕ [Филиппович, Прохоров, 2002] (рис. 8), элементы которой - значения функции «силы связи» /ц = ¥(ЯЕЬ ЯЕц). Сама функция ¥ означивается, денотируется и интерпретируется в соответствии с некоторыми априорно заданными правилами.

Такой формализм в подаче исходных данных, основанный на отмеченных выше особенностях представления речемыслительной деятельности, потенциально позволяет применять уже известные и апробированные методы анализа текста (ДСМ, КА, ЧСМ и др.) в анализе АВС.

Возможными также к применению в анализе текстов оказываются как метод расширения / свертки составляющих его ЯЕ с использованием ассоциативных полей, так и метод ассоциативных цепочек, который был предложен для представления статей ассоциативного словаря [Филиппович, 2010; 2009].

Слово (частота) ЯЕг = а, (/)

ЯЕ, = b, (/ь) fob

Рис. 8. Ассоциативная матрица функции «силы связи» / = ^(ЯЕ,-, ЯЕ,)

Формальная знаковая эквивалентность элементов ассоциативной цепочки элементам ЯЕ текста, интерпретация самой цепочки как пропозиции ЯЕ и предположение или факт единственности денотата позволяют заменить (расширить / свернуть) текст на множество связанных стимульно-реактив-ных пар, которые, с одной стороны, будут являться фрагментом АВС, а с другой - ассоциативно-вербальным образом текста.

Данный подход к анализу текста, приводящий к замене его пропозициями ЯЕ с дальнейшим преобразованием их в ассоциативные цепочки и подведением к некоторому «результирующему» знаку-концепту, может оказаться полезным и продуктивным в таких задачах автоматизированной обработки текстов, как классификация, реферирование, индексирование, информационный поиск, машинный перевод и др.

Разработаны, представлены в Интернете на сайте Научно-образовательного кластера CLAIM 1 и используются в исследованиях два программных комплекса: «Лингвокультурный когнайзер русского языка» (описание дано в работах А. В. Сиренко [2007; 2009; 2010; 2011]) и «Ассоциативная сеть» (описание дано в работе А. И. Панченко [2007]). В разработке находится исследовательский комплекс Е. А. Выломовой [Вы-ломова, Филиппович, 2012; Vylomova, 2011. С. 4], который реализует нейросетевую модель АВС.

* * *

Идея когнайзера, его компоненты и программные модели неоднократно представлялись на конференциях и в различных публикациях (см., например: [Филиппович,

2002; 2006а-в; 2007а; 2007б; 2009; 2010; 2011; 2012] в рамках проекта Российского гуманитарного научного фонда «Информационная система когнитивных экспериментов (ИСКЭ)». Проект направлен на построение программируемой компьютерной системы поддержки эмпирических и теоретических когнитивных исследований вербального сознания носителя русского языка-культуры, компьютерного моделирования механизмов работы языкового сознания для

1 http: // www.it-claim.ru

решения фундаментальной проблемы, касающейся нескольких смежных научных дисциплин (когнитивной лингвистики, компьютерной лингвистики, когнитивной психологии, психолингвистики) - проблемы типологии знаний, их объема, качества, оперирования ими в масштабе русской языковой личности.

Конкретная задача, решаемая в проекте -это создание Информационной системы когнитивных экспериментов (ИСКЭ). С ее использованием предполагается провести теоретическую разработку вопросов типологии знаний: выделения в их числе минимальной единицы (когнемы), более крупных единиц (концептов, суперконцептов и кон-цептосфер) [Караулов, 2004а; 2004б; Караулов, Филиппович, 2009], использования

понятий живые, остаточные, обязательные (рецептные), факультативные (ретушные), личностные, потенциальные, профессиональные и лингвокультурные знания. Центральное место в проекте отводится разработке про-граммно-моделирующей подсистеме - ког-найзеру, состоящему из пяти компонентов, выполняющих следующие когнитивные функции: смысловую, которая оформляется как гипертекст; операционную, содержащую перечень способов задания смысла, которыми пользуется русская языковая личность; знаковую, которая охватывает всю совокупность установленных в эксперименте когнем; предметную, переводящую зафиксированное элементарное знание на концептуальный уровень; и качественнооценочную, устанавливающую релевантность / нерелевантность (обязательность / факультативность) конкретной когнитивной единицы для языковой личности. При построении когнайзера в качестве инструментария исследования различных размерностей языкового сознания, так же как и его содержательных характеристик, предполагается использовать три типа компьютерных моделей: формально-логические, нейросете-вые и эволюционные.

Сфера использования проекта - это учебные и научные институты филологического и технического (специальности: информатика и вычислительная техника, информационные системы и технологии) профиля Министерства образования и науки РФ и РАН, в том числе: Институт русского языка им. В. В. Виноградова, Институт языкозна-

ния РАН, МГЛУ, МГТУ им. Н. Э. Баумана, МГУП им. Ивана Фёдорова.

Круг потенциальных пользователей разрабатываемой системы - отечественные и зарубежные исследователи, изучающие вербальное сознание носителя русского языка-культуры, филологи, лексикографы, преподаватели, аспиранты, студенты, разработчики новых информационных технологий и средств человеко-машинного коммуникативного взаимодействия, информационнопоисковых, справочных, обучающих систем и др.

Список литературы

Выломова Е. А., Филиппович Ю. Н. Ней-росетевая модель ассоциативно-вербальной сети // Жизнь языка в культуре и социуме: Материалы междунар. науч. конф. М.: Эй-дос, 2012. С.141-142.

Долинский В. А. Теория ассоциативных полей в квантитативной лингвистике. М.: УРСС, 2012. 511 с.

Долинский В. А. Экспериментальные исследования вербальных ассоциаций в квантитативной лингвистике // Вестн. МГЛУ. Серия «Языкознание». 2011. Вып. 14 (620).

Долинский В. А. Распределение реакций в экспериментах по вербальным ассоциациям // Учен. зап. Тартуского ун-та. 1988. Вып. 827. С. 89-101.

Караулов Ю. Н. Концептография языковой картины мира. Статья 1: Первый этап «восхождения» к образу мира: от элементарных фигур знания к предметно-референтным областям культуры // Scripta lin-guisticae applicatae. Проблемы прикладной лингвистики: Сб. ст. / Под ред. Н. В. Васильевой. М.: Азбуковник, 2004а. Вып. 2. С. 7-17.

Караулов Ю. Н. Концептография языковой картины мира. Статья 2: Референтные области, концепты и концептосферы. (Второй этап «восхождения» - от областей к концептам) // Языковое сознание: теоретические и прикладные аспекты: Сб. ст. М., 2004б. С. 69-82.

Караулов Ю. Н., Молчанов В. И., Афанасьев В. А., Михалев Н. В. Анализ метаязыка словаря с помощью ЭВМ. М.: Наука, 1982а. 96 с.

Караулов Ю. Н., Молчанов В. И., Афанасьев В. А., Михалев Н. В. Частотный сло-

варь семантических множителей русского языка. М.: Наука, 1982б. 208 с.

Караулов Ю. Н., Филиппович Ю. Н. Лингвокультурное сознание русской языковой личности. Моделирование состояния и функционирования. М.: Азбуковник, 2009. 288 c.

Москович В. А. Информационные языки. М., 1971.

Панченко А. И., Филиппович Ю. Н., Адей-кин С. А., Пономарев П. В., Пономарев А. В. Метод и система извлечения семантических отношений из статей википедии на основе компонентного анализа // Жизнь языка в культуре и социуме: Материалы междунар. науч. конф. М.: Эйдос, 2012. С. 339-341.

Панченко А. И. Towards an Efficient Combination of Similarity Measures for Semantic Relations Extraction // Системы, методы, техника и технологии обработки медиаконтента: Тез. докл. / МГУП. М., 2011. С. 3-4.

Панченко A. И. Метод автоматического построения семантических отношений между концептами информационно-поискового тезауруса. // Вестн. ВГУ. Серия: Системный анализ и информационные технологии. 2010. Т. 2. C. 160-168.

Панченко А. И. Инструментальное средство для анализа ассоциативных сетей // Интеллектуальные технологии и системы: Сб. ст. аспирантов и студентов. М.: Изд-во НОК CLAIM, 2007. Вып. 9. C. 169-202.

Пирс Ч. Логические основания теории знаков / Пер. с англ. В. В. Кирющенко, М. В. Колопотина, послесл. В. Ю. Сухачева. СПб.: Алетейя, 2000а. 352 с.

Пирс Ч. Начала прагматизма / Пер. с англ. В. В. Кирющенко, М. В. Колопотина, послесл. В. Ю. Сухачева. СПб.: Алетейя, 2000б. 318 с.

Сиренко А. В. Оценка автоматизированной системы когнитивного моделирования в качестве вопросно-ответной системы // Системы, методы, техника и технологии обработки медиаконтента: Тез. докл. / МГУП. М., 2011. С. 91-92.

Сиренко А. В. Алгоритмы поиска в ассоциативно-вербальных сетях психолингвистических экспериментов // Научная школа для молодых ученых «Компьютерная графика и математическое моделирование (Visual Computing)»: Тез. и докл. М., 2009.

Сиренко А. В. Информационная технология анализа результатов ассоциативных экспериментов: переход от веб-ориентирован-

ной к локальной информационной системе // Жизнь языка в культуре и социуме: Материалы конф. М.: Эйдос, 2010. С. 118-119.

Сиренко А. В. Лингвокультурный тезаурус русского языка // Интеллектуальные технологии и системы: Сб. ст. аспирантов и студентов. М.: Изд-во НОК CLAIM, 2007. Вып. 9. C. 264-277.

Филиппович Ю. Н. Аспекты информационной технологии когнитивного эксперимента создания лингвокультурного тезауруса // Интеллектуальные технологии и системы: Сб. ст. аспирантов и студентов. М.: Изд-во НОК CLAIM, 2006а. Вып. 8. С. 7-32.

Филиппович Ю. Н. Ассоциативные алгебраические выражения вербальных формул смысла // Речевая деятельность. Языковое сознание. Общающиеся личности. XV Международный симпозиум по психолингвистике и теории коммуникации: Тез. докл. М.; Калуга: Эйдос, 2006б. С. 312-314.

Филиппович Ю. Н. Когнемный словарь ассоциативных цепочек концептосферы «быт» в модели языкового сознания // [Электронное издание: компакт-диск] MegaLing'2010. Горизонты прикладной лингвистики и лингвистических технологий: Докл. междунар. науч. конф. Симферополь, 2010.

Филиппович Ю. Н. Когнитивные технологии: моделирование вербального сознания // Системы, методы, техника и технологии обработки медиаконтента: Тез. докл. /

МГУП. М., 2011. С. 107-108.

Филиппович Ю. Н. Компьютерное моделирование вербального сознания // Жизнь языка в культуре и социуме: Материалы междунар. науч. конф. М.: Эйдос, 2012. С. 169-170.

Филиппович Ю. Н. Макет когнемного словаря ассоциативных цепочек // Тенденции развития современной психолингвистики. Расширенное заседание постоянно действующего семинара «Язык, сознание, культура». Звенигород, 2009.

Филиппович Ю. Н. Моделирование работы лингвокультурного когнайзера русского языка // Вопр. психолингвистики. 2007а. № 6. С. 123-143.

Филиппович Ю. Н. Моделирование языкового сознания // Интеллектуальные технологии и системы: Сб. ст. аспирантов и студентов. М.: Изд-во НОК CLAIM, 2007б. Вып. 9. С. 7-41.

Филиппович Ю. Н. Эскиз информационной технологии лингвокультурного тезауруса // Язык. Сознание. Культура: Сб. ст. / Под ред. Н. В. Уфимцевой, Т. Н. Ушаковой. М.; Калуга: Эйдос, 2006в. С. 319-334.

Филиппович Ю. Н., Прохоров А. В. Семантика информационных технологий: опыты словарно-тезаурусного описания. Серия: Компьютерная лингвистика / Вступ. ст. А. И. Новикова. М., 2002.

Филиппович Ю. Н., Сиренко А. В. Программный комплекс исследований психолингвистической модели вербального сознания на основе когнитивного и ассоциативного экспериментов // Вопр. психолингвистики. 2011. № 1. С. 126-139.

Филиппович Ю. Н., Черкасова Г. А., Дельфт Д. Ассоциации информационных технологий: эксперимент на русском и

французском языках. Серия: Компьютерная лингвистика / Вступ. ст. Н. В. Уфимцевой. М., 2002.

Черкасова Г. А. Ядерные подграфы ассоциативно-вербальной сети Русского ассоциативного тезауруса // Вопр. психолингвистики. 2010а. № 12 (2). С. 184-200.

Черкасова Г. А. Исследование ядра ассоциативно-вербальной сети русского ассоциативного тезауруса // Жизнь языка в культуре и социуме: Материалы конф. М.: Эйдос, 20106. С. 246-249.

Черкасова Г. А. Исследование динамики ассоциативно-вербальной модели языкового сознания русских // Вопр. психолингвистики. 2007. № 6. С. 105-122.

Черкасова Г. А. Квантитативные исследования ассоциативных словарей // Общение. Языковое сознание. Межкультурная коммуникация: Сб. ст. / Под ред. Н. В. Уфимцевой, Т. Н. Ушаковой. М.; Калуга, 2005. С. 308318.

Черкасова Г. А. Формальная модель ассоциативного исследования // Scripta lin-guisticae applicatae. Проблемы прикладной лингвистики: Сб. ст. / Под ред. Н. В. Васильевой. М., 2004. Вып. 2. С. 139-156.

Vylomova E. Analyses of Russian Associative Thesaurus // Системы, методы, техника и технологии обработки медиаконтента: Тез. докл. / МГУП. М., 2011. С. 4.

Материал поступил в редколлегию 25.09.2012

Yu. N. Philippovich INFOCOGNITIVE MODELLING OF VERBAL CONSCIOUSNESS

One of the central ideas in modelling linguistic consciousness, which has already received theoretical and practical embodiment, is the idea of building “cognizers”. Cognizers are semiotic tools (automatic infocognitive computer systems, i.e. technologies) used to reveal the possible models for operational relations among language units in the mind of the speech (cultural) community on the basis of the data recorded in various associative and cognitive experiments. Theoretical and practical embodiment of the idea of Cognizers is to address the fundamental problem of cognition as well as many specific and interdisciplinary aspects of research in different sciences, it can also contribute to the development of integrated and / or convergent technologies, in particular the NBIC-technologies. This article discusses some theoretical grounds for formal comparative analyses of associative psycholinguistic experiments and textual data referring to distributive-statistical method and component analysis.

Keywords: verbal consciousness, associative experiment, Charles Sanders Peirce, event-statistical modelling, simulation of text.

i Надоели баннеры? Вы всегда можете отключить рекламу.