Научная статья на тему 'Моделирование работы лингвокультурного когнайзера русского языка'

Моделирование работы лингвокультурного когнайзера русского языка Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
145
55
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЯЗЫКОВОЕ СОЗНАНИЕ АССОЦИАТИВНЫЙ ТЕЗАУРУС / КОГНИТИВНЫЙ ТЕЗАУРУС / КОГНАЙЗЕР / МОДЕЛИРОВАНИЕ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Филиппович Юрий Николаевич

Статья посвящена вопросам компьютерного моделирования вербального сознания. Основой рассматриваемых моделей являются примеры когнитивного эксперимента (языковой игры типа «кроссворд») и вербального ассоциативного эксперимента. Анализируются безальтернативные варианты осознания априори известные переходы между языковыми единицами. В компьютерных моделях реализованы алгоритмы Дейкстра и «волновой» для поиска цепочек в ассоциативных графах.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Моделирование работы лингвокультурного когнайзера русского языка»

Ю.Н. Филиппович

МОДЕЛИРОВАНИЕ РАБОТЫ ЛИНГВОКУЛЬТУРНОГО КОГНАЙЗЕРА

РУССКОГО ЯЗЫКА1

Языковое сознание ассоциативный тезаурус, когнитивный тезаурус, когнайзер, моделирование

Статья посвящена вопросам компьютерного моделирования вербального сознания. Основой рассматриваемых моделей являются примеры когнитивного эксперимента (языковой игры типа «кроссворд») и вербального ассоциативного эксперимента. Анализируются безальтернативные варианты осознания - априори известные переходы между языковыми единицами. В компьютерных моделях реализованы алгоритмы Дейкстра и «волновой» для поиска цепочек в ассоциативных графах.

Введение

Языковое сознание (ЯС) — это форма мышления человека с использованием языковых единиц (ЯЕ). ЯС возникает и развивается как процесс осознавания — перехода от неосознанного (неопределенного, «альтернативного») восприятия предмета реального мира к осознанному (определенному, «безальтернативному»). Предмет осознан

— значит вербализован, ему в соответствие поставлена некоторая конкретная языковая единица. ЯС локализовано в субстрате мышления и неотрывно от него. Реально существующее в пространственно-временном континууме оно может быть измерено. Пространственными свойствами размерности ЯС являются его элементарность (дискретность и непрерывность), структурность и протяженность; временными — длительность, неповторимость и необратимость. ЯС проявляет себя симультанно в виде пространственного объекта знаний о мире (языковой картины мира — ЯКМ); в виде развивающегося во времени процесса порождения единиц знаний о мире (ЕЗМ); в виде ситуации=явления (композиции объекта и процесса) — как некоторый когнай-зер, динамично изменяющий симультанную ЯКМ посредством двух разнонаправленных процессов: от языковой единицы к знаниям о мире (ЯЕ ЗМ) и от знаний о

мире к языковой единице (ЗМ ЯЕ)2.

1 В статье представлены результаты работ, выполняемых по проекту РФФИ № 05-06-80284 «Языковое сознание нашего современника: когнитивная структура и лингвокультурное содержание».

Правомерность таких суждений о ЯС требует экспериментального подтверждения, которое состоит из собственно экспериментов, сводящихся к наблюдению, измерению и фиксации его проявлений, и последующих модельных построений.

Экспериментов два.

Первый — это свободный вербальный ассоциативный эксперимент, результатом

2 Эти суждения представляют собой попытку непротиворечивого соединения авторских представлений о предмете [Филиппович 2001] и исходных посылок-определений Ю.Н.Караулова для тех основных понятий, которые используются в данной статье: «....языковое сознание складывается из вербально выраженных знаний о мире, т.е. содержанием языкового сознания является вербализованная часть картины мира. ... языковое сознание представляет собой подвижное, динамическое образование, своего рода когнайзер, манипулирующий элементарными единицами знания (фигурами знания) и функционирующий в активном, смыслопорождающем (т.е. в направлении от знака — к смыслу) и пассивном, знакопорождающем (от смысла — к знаку) режимах. ... Языковая, или наивноязыковая, картина мира складывается не из слов, не из понятий, имеющих логико-лингвистическую природу, а из единиц когнитивной природы, обладающих различной системообразующей мощностью и вступающих одна с другой в различные иерархически-координативные отношения . » [Караулов 2004а]. Понятие элементарной единицы знаний — «фигуры знания», «когнемы» — введено и интерпретировано как минимальная когнитивная единица, представляющая собой пятикомпонентное отношение {<слово-знак>, <вербальная-формула-смысла>, <способ задания смысла>, <референтная область>, <функция>} или пентаграмму — полносвязанный пятивершинный граф. Подробно см. работы [Караулов 2003а,б,в].

которого является ассоциативный тезаурус (ассоциативная вербальная сеть — АВС)3, моделирующий активный режим работы ЯС, и построенный на основе пар слов-стимулов и слов-реакций <Б^Я>. По условиям эксперимента исходным является предъявляемое испытуемому слово (стимул), т.е. ЯЕ, и предлагается «ответить» на это слово любым спонтанно и первым пришедшим в голову другим словом или словосочетанием. Результатом эксперимента становится соединение двух языковых единиц, которое приобретает новое качество: полученная пара стимул-реакция несет знания о мире, превращается в элементарную единицу знаний о мире (ЕЗМ).

Второй — это когнитивный экспери-мент4 (языковая игра типа «кроссворд»), результатом которого является когнитивный тезаурус и построенный на основе когнем. По условиям этого эксперимента испытуемому предъявляется естественноязыковая конструкция (вербальная формула смысла — ВФС), состоящая из нескольких ЯЕ, и предлагается «ответить» на эту конструкцию языковой единицей — словом-знаком (Зн), отражающим ее смысл. Результатом эксперимента становится более сложная конструкция, состоящая из ВФС и Зн, также несущая знание о мире, и являющаяся его единицей (ЕЗМ).

Модельными сущностями являются: а) языковые картины мира, б) процессы вербализации знаний о реальном мире, в) когнайзер.

Языковые картины мира представляются в форме баз данных ассоциативного и когнитивного экспериментов.

Процессов вербализации знаний о реальном мире два: первый из них (от слова к знанию) квалифицируется как активный режим работы когнайзера — он ориентирован на познание и состоит в развертывании некоторой языковой единицы в единицу знаний о мире; а второй (от знания к

3 См. например работы Ю.Н.Караулова, Ю.А.Со-рокина, Е.Ф.Тарасова, Н.В.Уфимцевой, Г.А.Черка-совой по теме Русский ассоциативный словарь.

4 Более подробно см. статьи Ю.Н.Караулова [Ка-

раулов 2004 а,б, в;], а также [Филиппович 2005].

слову) — как пассивный, ориентированный на мышление5 и состоящий в свертывании единицы знаний о мире в некоторую языковую единицу.

Когнайзер — база знаний, интегрирующая процессы вербализации знаний и базы данных ассоциативного и когнитивного экспериментов в форме процедуры осознавания — принятия решения о выборе вербальных альтернатив представления знаний о реальном мире.

Выводы, которые были сделаны из этих экспериментальных наблюдений и построений таковы [Караулов 2004 б]:

— осознавание является той процедурой, которая преобразует семантические отношения в когнитивные, превращая единицы языка (слово, словосочетание, предложение) в простейшие единицы знания;

— такое преобразование осуществляется в разной форме в зависимости от режима, в каком работает языковое сознание: в активном режиме осознавание происходит путем построения ассоциативной цепочки из стимулов и реакций в АВС, цепочки, из которой формируется пропозиция; в пассивном режиме тот же процесс реализуется в фигуре знания;

— знание, которое извлекается из АВС чаще бывает не очень точным, несколько размытым и неоправданно детализированным;

— тем не менее, между двумя типами знания практически всегда устанавливаются отношения эквивалентности, если только подвергающийся осознаванию знак присутствует в числе стимулов или реакций в АВС.

Взяв за основу сделанные выводы, попробуем сконструировать формальную модель процедуры осознавания в когнайзере для последующей реализации в виде компьютерной программы.

5 Использование категорий «познание» и «мышление» в данном контексте обусловлено их введением в раннее опубликованных статьях. Они являются составными частями «универсального категориального аппарата», связывающего два диалектических единства <часть-целое> и <форма-содержание> [Филиппович 2001].

ФОРМАЛЬНОЕ МОДЕЛИРОВАНИЕ

Первоначально, преследуя только методические цели, уточним (упростим) содержание понятия «осознавание». Сведем процесс осознавания (переход от неосознанного к осознанному = от невербализо-ванного к вербализованному) к безальтернативным и альтернативным вариантам.

Безальтернативные варианты осознавания — это переходы от априори известных ЕЗМ к ЯЕ и обратно.

Альтернативные варианты характеризуются вариативностью, неопределенностью (вероятностью) и неточностью этих переходов. Иначе, имеется множество ЕЗМ и ЯЕ, а также процедура перехода между ними, которая состоит в выборе альтернативных единиц, традиционно разделяемая на две составные части — критериальная оценка альтернатив и принятие решения о предпочтении (выбор альтернатив).

Далее наибольшее внимание уделим формальному описанию и программной (компьютерной) реализации безальтернативных вариантов осознавания, и только наметим возможные подходы к моделированию альтернативного осознавания.

Рассмотрим самую простую и интуитивно понятную модель: представим ассоциативно-вербальную сеть в виде графа, вершинами которого являются слова (в общем случае некоторые языковые единицы — ЯЕ), а дугами выявленные в эксперименте отношения между ними. Все множество вершин графа можно разделить на три типа: слова-стимулы (Б), слова-реакции (Я), слова-стимулы-реакции (БЯ). Отношения между ними устанавливаются экспериментально, если респондент одному слову, называемому словом-стимулом ставит в соответствие другое слово, которое впоследствии рассматривается как слово-реакция. Данное отношение будем называть ассоциативным и обозначать символами «^», «^», «^».

Результатом эксперимента являются следующие подмножества пар слов: {Б, Я}, {Б, БЯ}, {БЯ, Я}, {БЯ, БЯ}. Заметим, что в

процессе эксперимента конкретное отношение может быть установлено разнона-правлено, т.е. одно и тоже слово может оказаться и словом-стимулом и словом реакцией. Кроме этого одно и тоже отношение может быть установлено несколько раз, в этом случае будем называть частоту встречаемости отношения его валентностью и указывать ее численное значение. В первых трех из указанных подмножеств следующие отношения <Б^Я>, <8^8Я>, <8Я^Я>, <Б^Я>, <8^8Я>, <8Я^Я> только одновалентны; в последнем подмножестве отношения могут быть одновалентны и бивалентны Это

означает, что в графовой модели АВС есть следующие типы вершин: а) вершины Б (корневые вершины, корни), имеющие только выходящие дуги, связывающие их с вершинами типа Я и БЯ; б) вершины типа Я (листьевые вершины, листья), имеющие только входящие дуги, связывающие их с вершинами типа Б и БЯ; в) вершины типа БЯ, имеющие как входящие, так и выходящие дуги, связывающие их с вершинами типа Б, Я и БЯ.

В Русском ассоциативном словаре зафиксировано 103211 слов (языковых единиц), в том числе: слов-стимулов {Б}— 160; слов-реакций {Я}— 96587; остальных слов, которые являются и словами-стимулами и словами-реакциями {БЯ} — 6464 [Черкасова 2005].

В графовой модели АВС для двух любых вершин можно установить связи, которые будут представлять собой пути в графе, или цепочки, состоящие из последовательности вершин и дуг. Анализируя возможные цепочки, выделим два типа: однонаправленные — вершины цепочки связаны между собой только одновалентными отношениями <Б^Я>, <Б^БЯ>, <БЯ^Я>, разнонаправленные — вершины связаны всеми возможными одновалентными и бивалентными отношениями.

Особый тип цепочек представляют собой кольца. В цепочках, как первого, так и второго типов могут присутствовать «за-

кольцованные участки» различной длины, под которой будем понимать количество однонаправленных отношений, приводящих к исходной вершине. Единичное кольцо — это замыкание вершины на саму себя. Ниже будут приведены несколько примеров цепочек с закольцованными участками.

Нахождение в АВС цепочек первого и второго типа представляет собой моделирование процедуры осознавания в когнай-

зере, т. е. его функционирование в активном и пассивном режимах. Построим простые графовые модели пропозиций формул смысла нескольких когнем, т. е. смоделируем в АВС конкретные варианты пассивного и активного режимов работы когнайзера.

Пассивный режим работы когнайзера

Начнем с нахождения однонаправленных цепочек. В качестве примера возьмем когнему «Арбалет»:

Знак = Арбалет.

Формула смысла = Старинное оружие в форме лука.

Первоначально определим пропозицию формулы смысла как:

<старинное> | <оружие> | <в форме> | <лука>.

В АВС элементам пропозиции старинное, лука соответствуют только листьевые вершины графа типа Я, а конструкция в форме отсутствует, т.е. для данной формулы смысла мы имеем только одну возможную исходную вершину — оружие. Эта

вершина относится к типу БЯ, так как имеет более восьмидесяти входных дуг, являясь реакцией соответствующего количества слов-стимулов, и почти семьдесят выходных, порождая слова-реакции (см. словарные статьи обратного и прямого РАС).

Оружие (обр.)

ОРУЖИЕ* огнестрельное 93; применять 10; сдать 9; пистолет, пушка 7; пулемет 6; заряжать, стрельба 5; булыжник, кинжал, носить, сдавать, ствол 4; Калашников, слово, шпага 3; автомат, бросать, войска, вооружен, древнее, копье, ликвидировать, орудийный, патрон, ружье, убийство 2; армия, атаковать, атом, атомная бомба, атомный, байки, бандит, битва, боец, болванка, бомба, борьба, бумага, везти, вершина, военный, воин, Вторая мировая война, выбросить, выстрел, град, дубина, защитник, инструмент, клинок, конструктор, личный, лук, наше, нужно, оборона, отнять, отобрать, птица, ракета, ржавое, самоубийство, склад, смертельный, создавать, солдат, спрятать, танк, убивать, убийца, уничтожить, хранение, хранить, цели, цепь, чистить, юмор, ядерный, ядро 1; 81+247

Оружие (пр.)

ОРУЖИЕ: холодное 9; массового поражения, ружье 5; огнестрельное, ядерное 4; война, стреляет, убийства 3; безопасность, мощное, пистолет, смертельное, смерть, старинное, убийцы 2; абсолютное, автомат, армия, Бальзак, винтовка, военное, возмездия, врага, в руках, выстрелило, газовое, грозное, дерево, железо, зонтик, именное, и пушка, кинжал, командира, кровь, любви, массового уничтожения, мести, мое, мортира, МП, на складе, нож, опасно, опасное, орудие, перестройки, перо, пищаль, продавать, пролетариата, прощай, прятать, разоружение, самозащиты, секретное, сильный, слово, сложить, смерти, спортивное, ствол, стрельба, стрелять, твое, холодная, черный 1; 105+67+3+52

Нас будут интересовать только вершины, являющиеся словами-реакциями. Найдем среди них такие, которые означают слова стрельба и орудие. Дуги, связывающие их, имеют валентность равную 1. Эти

Стрельба (пр.)

СТРЕЛЬБА: из лука 24; пистолет 7; оружие 5; из пистолета, лук, мишень, по мишени, ружье 4; война 3; автомат, из автомата, меткая, убийство 2; автоматная, арбалет, винтовка, влет, всле-

вершины также относятся к типу БЯ. У них 21 и 15 входных и 103 и 106 выходных дуг соответственно. Среди них есть такие, которые связывают их с вершиной арбалет, валентности связей равны 1.

пую, в тире, в цель, выстрелы, гул, духарик, жертва, заяц, идиотство, из винтовки, из орудия, из оружия, из пулеметов, индейцы, кровь, кутила, меткость, наугад, огнеметная, огонь, пальба, перекрестная, повсюду, по живым мишеням, по мишеням, пулемет, пули, пуля, револьвер, рельба, сильная, стрелец 1; 103+49+0+36

Орудие (пр.)

ОРУДИЕ: труда 40; убийства 17; убийство 8; пушка, труд 4; кинжал, лопата 2; арбалет, артиллерист, боя, войны, выстрел, для защиты, древнее, дым, железное, захвата, к бою, массового поражения, метательное, мир, молоток, нож, огнестрельное, пистолет, плуг, предмет, предмет деятельности, преступления, производства, пролетариата, пыток, работа, сигарета, смерти, топор

1; 106+36+0+29

Вершина арбалет относится к типу Я, и является в рассматриваемой когнеме знаком. Таким образом, мы установили две цепочки, связывающие выделенный элемент пропозиции со знаком. Длина этих цепочек равна двум отношениям:

<оружие ^1 стрельба ->1 арбалет>;

<оружие ^1 орудие ->1 арбалет>.

Заметим, что в рассматриваемом примере вершина арбалет связана только с двумя вершинами — стрельба и орудие (см. обратный РАС):

Арбалет (обр.)

АРБАЛЕТ орудие, стрельба 1; 2+2

Среди слов-реакций, порожденных словом-стимулом оружие, есть, например,

Длина пути Путь

Оружие

1 оружие —1—> стрельба

2 оружие —2—> пистолет —2—> стрельба

2 оружие —5—> ружье —1—> стрельба

3 оружие —5—> ружье —5—> охота —1—> стрельба

3 оружие —1—> армия —1—> оружие —1—> стрельба

4 оружие —1—> армия —1—> мучение —1—> борьба —1—> стрельба

4 оружие —1—> ствол —1—> пушка —1—> чугун —1—> стрельба

Всего цепочек 141, в том числе: 1 — нет, 2 — 1, 3 — 2, 4 — 15, 5 — 123.

2 оружие —1—> ствол —1—> орудие

3 оружие —5—> ружье —1—> ствол —1—> орудие

3 оружие —1—> перо —1—> топор —1—> орудие

4 оружие —2—> пистолет —1—> железо —3—> лом —1—> орудие

4 оружие —1—> армия —28—> солдат —1—> топор —1—> орудие

пистолет, ружьё, ствол. Для первых двух словом-реакцией является стрельба, а для последнего — орудие. Так мы получаем еще три цепочки, но длиной в три отношения: <оружие -^2 пистолет -^2 стрельба ^1 арбалет>;

<оружие -^5 ружьё ->1 стрельба ->1 арбалет>;

<оружие ^1 ствол ^1 орудие ->1 арбалет>.

Действуя таким образом, найдем все цепочки длиной максимум в 4 отношения от элемента пропозиции оружие до вершин стрельба и орудие, это эквивалентно нахождению цепочек длиной в 5 отношений до вершины арбалет:

В результате нашего дальнейшего поиска непременно будут найдены и более длинные цепочки. Общее их количество будет определяться конкретными отношениями, зафиксированными в ассоциативном эксперименте.

Для заданной длины возможных цепочек, связывающих элемент пропозиции со знаком когнемы в АВС можно выделить подграф (рис. 1) соответствующей размерности, который будем рассматривать как конкретное модельное представление пассивного режима работы когнайзера. Такое представление позволяет определить для последующих рассуждений: а) цепочки и подграфы отдельного элемента пропозиции

— элементарные пропозиционные цепочки и графы; б) размерности цепочек и графов, например, длины и валентности отношений, количество вершин и дуг; в) структурные особенности цепочек, например ко-

личество закольцованных участков, типы и размеры колец.

В рассмотренной нами пропозиции, ее элементами являлись в основном словоформы. Формальное их несовпадение со словами, зафиксированными в АВС, оказало влияние на количество вершин графа, которые были выбраны в качестве начальных при поиске цепочек, а в итоге и на размерность подграфа, моделирующего когнайзер. Анализ слов АВС показывает, что в ней есть слова, которые являются основной формой для пропозиционных элементов и одновременно относятся к типу БЯ, например, старинное — старинный, форме — форма, лука — лук. Сформируем новую пропозицию, применив к ранее выделенным элементам процедуру леммати-зации — переводу слова в основную форму:

<старинный> | <оружие> | <форма> | <лук>.

Рисунок 1. Подграф размерности 4 пропозиционного элемента оружие.

Найдем в графе АВС для каждого из зиционный подграф рассматриваемой ког-

пропозиционных элементов цепочки дли- немы, который будет являться моделью

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ной не более 5, связывающие их с верши- пассивного режима работы когнайзера

ной арбалет. В результате получим пропо- (рис. 2).

Длина пути Путь

Старинный

3 старинный —1—> двор —1—> ружье —1—> стрельба

4 старинный —4—> комод —1—> зеркало —1—> взгляд —1—> стрельба

4

старинный —2—> образ —1—> мысль —1—> стрела —1—> стрельба

Всего цепочек 31, в том числе: 1 — нет, 2 — нет, 3 — нет, 4 — 1, 5 — 30

старинный —1—> двор —1—> ствол —1—> орудие старинный —1—> двор —7—> вор —1—> лом —1—> орудие

старинный —1—> двор —2—> хозяйственный —1—> топор —1—> орудие

Всего цепочек 22, в том числе: 1 — нет, 2 — нет, 3 — нет, 4 — 1, 5 — 21 Форма

форма —1—> спорт —1—> стрельба форма —1—> война —1—> стрельба форма —1—> солдат —2—> ружье —1—> стрельба

3 форма —1—> армия —1—> оружие —1—> стрельба

4 форма —1—> война —1—> убийца —1—> боевик —1—> стрельба

4 форма —2—> страшная —1—> мысль —1—> стрела —1—> стрельба

Всего цепочек 103, в том числе: 1 — нет, 2 — нет, 3 — 2, 4 — 4, 5 — 98

3 форма —1—> солдат —1—> топор —1—> орудие

4 форма —1—> спорт —1—> жлоб —1—> лом —1—> орудие

4 форма —1—> армия —28—> солдат —1—> топор —1—> орудие

Всего цепочек 10, в том числе: 1 — нет, 2 — нет, 3 — нет, 4 — 1, 5 — 9

Лук

2 лук —3—> стрела —1—> стрельба

4 лук —1—> стук —1—> окно —1—> взгляд —1—> стрельба

4 лук —1—> салат —2—> лук —3—> стрела —1—> стрельба

Всего цепочек 21, в том числе: 1 — нет, 2 — нет, 3 — 1, 4 — нет, 5 — 20

3 лук —1—> перо —1—> топор —1—> орудие

3 лук —1—> стук —1—> топор —1—> орудие

4 лук —1—> салат —1—> солдат —1—> топор —1—> орудие

4 лук —1—> стук —1—> молоток —10—> топор —1—> орудие

Всего цепочек 4, в том числе: 1 — нет, 2 — нет, 3 — нет, 4 — 2, 5 — 2

Анализ графа на рис. 2 показывает, что пропозиционный элемент старинный не связан цепочками длиной 3 со знаком ког-немы «Арбалет». Слова старинный и арбалет в АВС связаны между собой цепочками диной >4. Возможно построение графа всех связей пропозиционных элементов форму-

лы смысла и знака когнемы «Арбалет» любой наперед заданной размерности m < M, однако представление его в графической форме (в виде рисунка) может оказаться затруднительным. Для M=4 такой граф будет содержать 362 цепочки, количественные сведения о которых приведены в таблице 1.

4

Рисунок 2. Пассивный пропозиционный граф размерности 3 когнемы «Арбалет»

Таблица 1.

Характеристики размерности пассивного пропозиционного графа

когнемы «Арбалет»

Цепочки Длина цепочки Всего

1 2 3 4 5

старинный...-> стрельба -> арбалет нет нет нет 1 30 31

оружие .-> стрельба -> арбалет нет 1 2 15 123 141

форма.. .-> стрельба -> арбалет нет нет 2 4 98 104

лук.. .-> стрельба -> арбалет нет нет 1 нет 20 21

всего нет 1 5 20 271 297

старинный.. .-> орудие -> арбалет нет нет нет 1 21 22

оружие .-> орудие -> арбалет нет нет 1 2 26 29

форма.. .-> орудие-> арбалет нет нет нет 1 9 10

лук.. .-> орудие -> арбалет нет нет нет 2 2 4

всего нет нет 1 6 58 65

всего нет 1 6 26 329 362

В связи с этим построим и отобразим на рисунке 3 минимальный пассивный пропо-

зиционный граф когнемы «Арбалет», содержащий только кратчайшие цепочки.

<<старинный> | <оружие> | <форма> | <лук>> <арбалет>

Длина пути Путь

4 старинный —1—> двор —1—> ствол —1—> орудие —1—> арбалет

4 старинный —1—> двор —1—> ружье —1—> стрельба —1—> арбалет

2 оружие —1—> стрельба —1—> арбалет

3 форма —1—> спорт —1—> стрельба —1—> арбалет

3 форма —1—> война —1—> стрельба —1—> арбалет

3 лук —3—> стрела —1—> стрельба —1—> арбалет

Рисунок З. Минимальный пассивный пропозиционный граф когнемы «Арбалет

Особенности построения цепочек

Особенности получения пропозиций.

Заметим, что процедура лемматизации была применена нами формально, т.е. при построении новой пропозиции мы заменили отсутствующие в АВС слова на те, которые в ней есть. Обоснование данной замены состоит в том, что она, возможно, несущественно изменила содержание формулы смысла. Большей обоснованности потребо-

вали бы другие формальные замены, которые можно осуществить при получении поисковой пропозиции, например, взаимозамены внутри парадигмы слова, или синонимичного ряда. Приведем примеры форм с этими пропозиционными заменами.

Парадигматические формы (курсивом выделены слова-реакции, а жирным курсивом — слова-стимулы, которые есть в базе данных РАС).

лука [называют] лука [называется] лука

арбалет.

арбалет.

арбалет.

Старинное оружие в форме

Старинным оружием в форме

[название] Старинного оружия в форме

Синонимичные формы.

Ряд 1 [Абрамов, 1994]: Старый, ветхий, древний, многолетний, вековой, многовековой, старинный, давний, старобытный, стародавний, старомодный, устарелый, застарелый, закоснелый, закоренелый, заматерелый, давнишний, допотопный, извечный, исконный, ископаемый, архаический, археологический, престарелый, пожилой, седой, поседелый, ветеран; обветшалый, пришедший в ветхость, отживший, отсталый, затасканный, истасканный, истертый, подержанный, поношенный, потрепанный, полинялый, заскорузлый, зачерствелый.

Ряд 2 [Александрова, 1968]: Старинный, старый, дедовский, прадедовский, стародедовский, древний, вековой, многовековой; старосветский (уст. и книжн.); старозаветный (шутл.); антикварный (о ценной вещи).

Ряд 3 [Абрамов, 1994]: Форма, вид, выкройка, фасон, модель.

Ряд 4 [Александрова, 1968]: Форма, вид; конфигурация (книжн.).

Древнее оружие в форме лука.

Длина пути

4

4

4

4

Путь

древнее —1—> лето —2—> море —1—> война —1—> стрельба

древнее —1—> место —1—> цепь —1—> стрела —1—> стрельба

Всего цепочек 15

древнее —1—> место —1—> взять —1—> лом —1—> орудие

древнее —1—> дело —1—> труд —1—> топор —1—> орудие

Всего цепочек 7 Старинное оружие в виде лука.

Длина пути

3

3

4

4

4

4

Путь

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

вид —1—> море —1—> война —1—> стрельба вид —1—> окно —1—> взгляд —1—> стрельба вид —1—> озеро —1—> зеркало —1—> взгляд —1—> стрельба

вид —1—> анфас —1—> прямой —1—> стрела —1—> стрельба

Всего цепочек 15

вид —1—> анфас —1—> прямой —3—> ствол —1—> орудие вид —1—> море —1—> след —1—> топор —1—> орудие

Всего цепочек 5

Кольцевые элементы цепочек. Среди найденных цепочек при построении подграфа пропозиционного элемента оружие

когнемы «Арбалет» есть 52 цепочки с закольцованными участками, например:

Длина пути Путь

3 оружие —1—> ствол —4—> оружие — 1—> стрельба

4 оружие —5—> ружье —2—> оружие —2—> пистолет —2—> стрельба

4 оружие —2—> пистолет —7—> оружие —1—> ствол —1—> орудие

4 оружие —2—> пистолет —7—> оружие —2—> пистолет—2—> стрельба

4 оружие —2—> пистолет —1—> патрон —2—> оружие —1—> стрельба

4 оружие —5—> ружье —5—> охота —1—> охота —1— > стрельба

4 оружие —2 —> пистолет —6—> автомат —4—> пистолет—2—> стрельба

4 оружие —5—> ружье —2—> выстрел —18—> ружье—1—> стрельба

4 оружие —1—> ствол —1—> гладкий —5—> ствол—1—> орудие

Исследование закольцованных участков цепочек требует особого внимания. Основной причиной этого является наличие в АВС значительного количества вершин модельного графа потенциально являю-

щихся элементами колец. Этими элементами могут быть 6464 вершины типа {БЯ} — слова стимулы-реакции. В качестве примера приведем двух и трех элементные кольца пропозиции когнемы «Арбалет».

Длина пути Путь

2 старинный —1—> вальс —1—> старинный

2 старинный —1—> двор —1—> старинный

2 старинный —10—> замок —2—> старинный

2 старинный —4—> комод —7—> старинный

3 старинный —1—> двор —1—> сквер —1—> старинный

3 старинный —1—> двор —1—> стол —1—> старинный

3 старинный —4—> комод —2—> стол —1—> старинный

3 старинный —1—> двор —1—> двор —1—> старинный

4 старинный —1—> вальс —3—> бал —2—> вальс —1—> старинный

4 старинный —4—> комод —18—> старый —1—> холст —1—> старинный

Всего колец 268, в том числе: 1 — нет, 2 — 4, 3 — 4, 4 — 262 2 оружие —2—> пистолет —7—> оружие

2 оружие —1—> армия —1—> оружие

3 оружие —2—> пистолет —1—> патрон —2—> оружие

3 оружие —5—> ружье —2—> выстрел —1—> оружие

4 оружие —1—> армия —1—> офицер —5—> армия —1—> оружие

4 оружие —1—> ствол —1—> пушка —10—> ядро —1—> оружие

Всего колец 262,, в том числе: 1 — нет, 2 — 5, 3 — 19, 4 — 238

2 форма —1—> армия —2—> форма

2 форма —1—> норма —2—> форма

2 форма —1—> солдат —6—> форма

3 форма —1—> армия —1—> офицер —2—> форма

3 форма —1—> армия —28—> солдат —6—> форма

4 форма —1—> солдат —8—> генерал —3—> армия —2—> форма

4 форма —4—> школа —1—> она —1—> юбка —1—> форма

Всего колец 204, в том числе: 1 — нет, 2 — 3, 3 — 13, 4 — 189

2 лук —1—> салат —2—> лук

2 лук —3—> стрела —7—> лук

3 лук —1—> салат —1—> масло —1—> лук

3 лук —1—> салат —2—> капуста —1—> лук

3 лук —1—> салат —1—> салат —2—> лук

3 лук —3—> стрела —1—> Амур —2—> лук

3 лук —3—> стрела —1—> стрельба —4—> лук

4 лук —3—> стрела —1—> Амур —1—> Амур —2—> лук

4 лук —3—> стрела —1—> Амур —5—> стрела —7—> лук

Особенности проведения ассоциативного эксперимента. При анализе получаемых цепочек, обращают на себя внимание некоторые цепочки и составляющие их стимульно-реактивные пары (звенья), имеющие в своем составе омонимичные формы — замок и замок, полон и полон, стук (настучать, стукач) и стук (звук ударов мо-

Длина пути Путь

3

4 4

4

4

4

4

4

4

4

4

4

4

лотка), перо (стебель, лист лука), перо (средство, инструмент письма) и перо (оперенье стрелы, оконечная часть стрелы); созвучия — двор-ствол, двор-вор, забота-охота, форма-норма, салат-солдат; выражение — жрать охота. Ниже приведены примеры этих цепочек:

старинный —1—> двор —1—> ствол— 1—> орудие старинный —1—> двор —7—> вор—1—> лом —1—> орудие старинный —10—> замок —3—> железный— 3—> лом —1—> орудие старинный —10—> замок —2—> ржавый—1—> лом —1—> орудие старинный —1—> стакан —1—> полон —1—> стрела—1—> стрельба старинный —5—> часы —1—> забота —1—> охота— 1—> стрельба форма —1—> норма— 1—> цель —8—> мишень —5—> стрельба лук —1—> стук —1—> жалоба —1—> спорт —1—> стрельба лук —1—> стук —1—> молоток—10—> топор — 1—> орудие лук —1—> перо—3—> Пушкин —1—> пушка— 1—> стрельба лук —1—> салат—1—> солдат —2—> ружье —1—> стрельба лук —1—> салат —1—> солдат—1—> топор —1—> орудие лук —1—> салат—1—> жрать —1—> охота— 1—> стрельба

Особенности взаимосвязей элементов пропозиции. Фактическим условием возможности построения пассивного пропози-ционного графа какой-либо формулы смысла является отнесение составляющих ее элементов к типу слов-стимулов Б или слов-стимулов-реакций БЯ. Из этого сле-

дует, что возможными становятся взаимосвязи между пропозиционными элементами формулы смысла. Проиллюстрируем это на примере когнемы «Арбалет», т.е. построим цепочки длиной не более 3, связывающие слова ее формулы смысла между собой.

Длина пути

Путь

3 лук —1—> перо —1—> птица —1—> оружие

3 лук —1—> салат —1—> солдат —6—> форма

3 лук —3—> стрела —1—> стрельба —5—> оружие

3 лук —3—> стрела —2—> сердце —1—> форма

2 оружие —1—> армия —2—> форма

2 оружие —1—> зонтик —1—> старинный

2 оружие —1—> стрельба —4—> лук

3 старинный —1—> анекдот —2—> плоский —1—> форма

3 старинный —1—> двор —1—> ружье —2—> оружие

3 старинный —1—> двор —1—> ствол —4—> оружие

3 старинный —5—> часы —4—> пик —1—> форма

2 форма —1—> армия —1—> оружие

3 форма —1—> война —1—> стрельба —4—> лук

3 форма —1—> круглый —41—> стол —1—> старинный

3 форма —1—> печенье —1—> мука —1—> лук

3 форма —1—> солдат —1—> нищий —1—> лук

3 форма —1—> спорт —1—> стрельба —4—> лук

3 форма —2—> страшная —1—> мука —1—> лук

3 форма —4—> школа —1—> двор —1—> старинный

Общее количество таких цепочек оказалось равным 19. При этом не нашлось ни одной цепочки длиной 3, которая бы свя-

Другие примеры.

Приведем несколько примеров пассивных пропозиционных графов размерности

зывала слова старинный и лук. Однако есть 20 цепочек длиной 4 <старинный —...—> лук> и 28 — <лук —. —> старинный>.

3 для когнем: «Ряска», «Раскопки» и «Серп».

Пример 1. Знак = Ряска. Формула смысла = Зеленое одеяло водоемов.

Пропозиция формулы смысла = <зеленый> | <одеяло> | <водоем>.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Длина пути Кратчайшие пути не более 4

3 зеленый —1—> лягушка —7—> болото —1—> ряска

3 зеленый —1—> газ —1—> болото —1—> ряска

3 зеленый —10—> крокодил —3—> болото —1—> ряска

3 зеленый —1—> лягушка —2—> пруд —1—> ряска

4 одеяло —1—> ночь —1—> туман —1—> болото —1—> ряска

4 одеяло —1—> ночь —1—> рассвет —1—> болото —1—> ряска

3 водоем —3—> лягушка —7—> болото —1—> ряска

3 водоем —1—> море —1—> болото —1—> ряска

3 водоем —10—> озеро —2—> болото —1—> ряска

3 водоем —2—> река — 1—> болото — 1—> ряска

3 водоем —6—> вода —1—> болото —1—> ряска

3 водоем —3—> лягушка —2—> пруд —1—> ряска

3 водоем —2—> река —1—> пруд —1—> ряска

3 водоем —1—> речка —1—> пруд —1—> ряска

3 водоем —4—> рыба —1—> пруд —1—> ряска

Всего цепочек 15

Пример 2. Знак = Раскопки. Формула смысла = Повседневная работа археолога. Пропозиция формулы смысла = <повседневный> | <работа> | <археолог>.

Длина пути Кратчайшие пути не более 3

3 повседневный —1—> обед —1—> редкость —1—> раскопки

3 работа —1—> клад —1—> древний —1—> раскопки

Всего цепочек 2

Пример 3. Знак = Серп. Формула смысла = Что держит в руках Мухинская колхозница. Пропозиция формулы смысла = <держать> | <рука> | <Мухина> | <колхозница>.

Длина пути Кратчайшие пути не более 3

3 держать —1—> руль —2—> золотой —1—> серп

3 держать —3—> руки — 1—> нож — 1—> серп

3 рука —1—> удар —1—> молот —32—> серп

3 рука —2—> перстень —14—> золотой —1—> серп

3 рука —2—> голова —1—> коса —1—> серп

3 рука —1—> красота —1—> коса —1—> серп

3 рука —1—> работа —2—> молоток —6—> серп

3 рука —1—> удар —1—> молоток —6—> серп

3 рука —2—> палец —1—> нож —1—> серп

3 рука —2—> река —1—> трава —1—> серп

3 рука —1—> гнев —1—> трава —1—> серп

Активный режим работы когнайзера

Фактической целью рассмотрения однонаправленных цепочек было моделирование перехода от смысла (пропозиции формулы смысла) к знаку. Теперь изменим цель. Попытаемся перейти от знака к смыслу, т. е. покажем на примере, что возможно решение и обратной задачи — для

заданного знака построение такой пропозиции, которая эквивалентна априори известному смыслу (пропозиции формулы смысла).

Ниже на рис. 4 приведен активный про-позиционный граф когнемы «Арбалет», цепочками которого являются:

Длина пути

1

1

3

3

3

3

3

3

4 4

2

3

3

4

3

4

3

4

Путь

арбалет <—1— орудие арбалет <—1— стрельба

Всего цепочек 2, в том числе: 1 — 2 Орудие - лук

орудие —1—> работа —2—> мука —1—> лук

орудие —4—> труд —1—> мука —1—> лук

орудие —1—> выстрел —1—> стрела —7—> лук

орудие —1—> пистолет —2—> стрельба —4—> лук

орудие —4—> пушка —1—> стрельба —4—> лук

орудие —1—> топор —1—> капуста —1—> лук

орудие —1—> выстрел —1—> стрела —1—> Амур —2—> лук

орудие —4—> труд —1—> морковь —1—> капуста —1—> лук

орудие —8—> убийство —1—> пистолет —2—> стрельба —4—> лук

Всего цепочек 89, в том числе: 1 — нет, 2 — нет, 3 — нет, 4 — 6, 5 — 83

Орудие - оружие орудие —1—> пистолет ■

7—> оружие

орудие —1—> выстрел —1—> оружие орудие —1—> пистолет —1—> патрон

2—> оружие

орудие —1—> выстрел —1—> выстрел —1—> оружие орудие —1—> топор —3—> дерево —1—> армия —1—> оружие

орудие —1—> выстрел —4—> пушка -

Всего цепочек 271, в том числе: 1

-10—> ядро —1—> оружие

— нет, 2 — нет, 3 — 4, 4 -

17, 5 — 250

Орудие - старинный

орудие —1—> работа —1—> стол —1—> старинный

орудие —1—> выстрел —3—> последний —1—> вальс —1—> старинный

орудие —1—> работа —1—> творить —1—> холст —1—> старинный

Всего цепочек 109, в том числе: 1 — нет, 2 — нет, 3

нет, 4 — 1, 5 — 108

Орудие - форма орудие —1—> работа

-1—> фигура —1—> форма

орудие —4—> пушка — 1—> солдат —6—> форма

орудие —1—> топор —3—> дерево —1—> армия —2—> форма

орудие —2—> лопата —1—> новая —1—> юбка —1—> форма

4

2

4

4

3

Стрельба - лук 1 стрельба —4—> лук

3 стрельба —4—> мишень —1—> стрела —7—> лук

3 стрельба —7—> пистолет —2—> стрельба —4—> лук

3 стрельба —4—> ружье —1—> стрельба —4—> лук

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3 стрельба —3—> война —1—> стрельба —4—> лук

3 стрельба —4—> мишень —5—> стрельба —4—> лук

3 стрельба —5—> оружие —1—> стрельба —4—> лук

3 стрельба —1—> заяц —1—> капуста —1—> лук

4 стрельба —4—> мишень —1—> стрела —1—> Амур —2—> лук

4 стрельба —4—> ружье —3—> пушка —1—> стрельба —4—> лук

Всего цепочек 61, в том числе: 1 — нет, 2 — 1, 3 — нет, 4 — 7, 5 — 53

Стрельба - оружие

1 стрельба —5—> оружие

2 стрельба —7—> пистолет —7—> оружие

2 стрельба —4—> ружье —2—> оружие

2 стрельба —2—> убийство —2—> оружие

3 стрельба —7—> пистолет —1—> патрон —2—> оружие

3 стрельба —1—> пулемет —1—> патрон —2—> оружие

3 стрельба —4—> мишень —4—> выстрел —1—> оружие

4 стрельба —2—> убийство —1—> тюрьма —1—> армия —1—> оружие

4 стрельба —1—> огонь —1—> дерево —1—> армия —1—> оружие

4 стрельба —4—> ружье —3—> пушка —10—> ядро —1—> оружие

Всего цепочек 238, в том числе: 1 — нет, 2 — 1, 3 — 3, 4 — 27, 5 — 207

Стрельба - старинный 3 стрельба —5—> оружие —1—> зонтик —1—> старинный

3 стрельба —1—> огонь —7—> камин —2—> старинный

4 стрельба —3—> война —1—> окно —2—> двор —1—> старинный

4 стрельба —1—> заяц —1—> снег —1—> двор —1—> старинный

4 стрельба —1—> огонь —1—> уголь —1—> холст —1—> старинный

Всего цепочек 65, в том числе: 1 — нет, 2 — нет, 3 — нет, 4 — 2, 5 — 63

Стрельба - форма 3 стрельба —5—> оружие —1—> армия —2—> форма

3 стрельба —7—> пистолет —1—> милиция —2—> форма

3 стрельба —1—> кровь —3—> сдать —1—> форма

3 стрельба —1—> огонь —1—> сердце —1—> форма

4 стрельба —2—> убийство —1—> тюрьма —1—> армия —2—> форма

4 стрельба —1—> огонь —1—> дерево —1—> армия —2—> форма

4 стрельба —1—> кровь —1—> новая —1—> юбка —1—> форма

Всего цепочек 90, в том числе: 1 — нет, 2 — нет, 3 — нет, 4 — 4, 5 — 83

Рисунок 4. Активный пропозиционный граф размерности 4 когнемы «Арбалет»

ПРОГРАММНАЯ РЕАЛИЗАЦИЯ

Общая постановка задачи программной реализации экспериментального моделирования комплексных принципов устройства и механизмов работы языкового сознания (более узко — процессов осознавания) была сформулирована в следующем виде: для АВС, представленной в форме файла, содержащего множество стимульно-

реактивных пар с указанием их частотности, разработать алгоритм и программное средство определения ассоциативных цепочек, связывающих любые два слова между собой. Существо этой постановки сводится к разработке алгоритма и программы поиска цепочек (путей) в графе, связывающих две его произвольные вершины между собой.

Такая постановка задачи является известной и хорошо освоенной как теоретически, так и практически. Задача состоит в определении эффективной последовательности просмотра (обхода) вершин графа. Описано множество различных алгоритмов ее принципиального решения, а также модификаций, позволяющих учесть многие особенности графов и целей поиска. Наиболее известными подходами являются «поиск в глубину» и «поиск в ширину». В числе самых известных алгоритмов следует назвать: «волновой», Форда-Беллмана,

Флойда, Дейкстры. Данные алгоритмы используются для решения поисковой задачи при различных начальных условиях: например, граф может быть ориентированным или нет, взвешенным или нет, требуется найти кратчайшие или все пути, есть ли в графе циклические участки и т. д.

Реализация алгоритма в виде конкретной программы или программного комплекса связана с дополнительными требованиями и уточнениями. Для рассматриваемого случая таковыми являются:

Во-первых, условия и уточнения связанные с модельными сущностями, которыми являются базы данных ассоциативного и когнитивного экспериментов, лингвистический процессор, когнайзер — сверхболь-

шие размеры баз данных, сложная недетерминированная динамически изменяющаяся структура данных; «полный» лингвистический процессор, включающий морфологическую, синтаксическую, семантическую и прагматическую компоненты, функционирующий как система поддержки принятия решений; интегральная реализация модели когнайзера как «хранилища знаний».

Во-вторых, программный комплекс ориентирован на эксперименты, т.е. должен отвечать требованиям, традиционно предъявляемым к автоматизированным системам научных исследований (АСНИ) — вариативность схемы (технологии) эксперимента, наличие средств управления (задания условий) эксперимента, возможность визуального наблюдения за его ходом и документирования результатов.

В-третьих, экономия вычислительных ресурсов — временных и памяти, т.е. максимально возможное быстродействие и минимально возможные затраты памяти.

Традиционными требованиями к программным реализациям практически любых алгоритмов являются: надежность, переносимость в различные вычислительные среды, документированность, «дружест-

венность» интерфейса с пользователем (наличие объяснительной, обучающей и Ье1р-компонент) и др.

Удовлетворение перечисленных требований или учет их при проектировании возможен только поэтапно, в процессе создания перманентно изменяющихся версий программного комплекса. Для первых (макетных) версий были установлены следующие требования (ограничения):

1. Требования к алгоритму поиска — произвольный, с максимально возможным быстродействием.

2. Требования к пользовательскому интерфейсу — наличие следующих полей для ввода и корректировки параметров поиска: Формула смысла; Знак; Параметры путей

— минимальной длины, фиксированной длины «. », диапазон длин «. »; Область

для замены пропозиционных элементов; Область результата — цепочки в формате .. .«слово» -> «слово»... .

В одной из реализованных макетных версий, названной «Когнайзер» [Сиренко,

2006, 2007] был использован модифицированный алгоритм Дейкстры, предназначенный для поиска кратчайшего пути в графе и исходно имеющий вычислительную сложность 0 (К2), где N - количество вершин графа (в данном случае элементов АВС).

В разрабатываемом алгоритме необходимо было обеспечить поиск всех путей заданного диапазона длин. Это потребовало иной организации ветвления вычислений. Из-за того, что каждая вершина графа размерности N может быть точкой ветвления вычислений на N-1, а таких вершин может быть N-1, сложность алгоритма может вырасти до 0 (М4) - это «худший» теоретический вариант реализации поиска.

В связи с этим было введено ограничение на максимальную длину искомых це-

почек, т.е. было принято решение считать вершины, не достигаемые за 5 шагов, недостижимыми. Среднее количество реакций на стимул в экспериментальной базе данных равно 18.78, при этом множество возможных реакции существенно (приблизительно в 15 раз) больше, чем множество стимулов. Это дало возможность предположить, что значительная часть связей стимул-реакция не имеют продолжения и реакция является листом ассоциативного дерева.

Учитывая, ограниченность количества реакций на стимул, а также то, что пути длиной более 5 не рассматриваются, результирующая сложность разработанного алгоритма составила 0 (к*^), где к — константа, к<<^ и оказалась существенно не отличимой от исходной вычислительной сложности алгоритма Дейкстры.

На рис. 5 приведено изображение главного окна пользовательского интерфейса программы.

Коренной житель страны

Знак

абориген

Параметры путей

С Минимальной длины

С Фиксированной длины 1 т

(* Диапазона длин 3 ІІ

Поиск путей

Слово Элемент ассоциативной сети Использование

Коренной коренной Да

житель житель Да

страна страна Да

Количество найденных путей 3

Коренной->абориген

житель->абориген

страна- >нищий- >сту дент- >абориген

Рисунок 5. Главное окно программы «Когнайзер».

В другой макетной версии [Панченко 2007] был использован «волновой алгоритм», имеющий исходную вычислительную сложность 0 ^+М), где N — количество вершин графа, а М — количество дуг (связей). С учетом того, что количество вершин графа равно N = тн, где т — среднее количество дуг, исходящих из вершины, а н — максимальная длина цепочки, вычислительная сложность поиска цепочки заданной длины составляет 0 (тн +М). Для данной версии программной реализации также было введено 5-ти элементное ограничение на длину искомых цепочек.

На рис. 6 приведено изображение главного окна пользовательского интерфейса этой версии программы. Ее особенностями являются: возможно подключение баз данных двух ассоциативных словарей — РАС и ассоциативного словаря английского языка; учитывается двунаправленность ассоциативных связей; имеются развитые средства документирования; программа имеет клиент-серверную архитектуру и была размещена в сети Интернет по адресу www. associative.ru; стимул может быть задан как пропозиция формулы смысла из последовательности языковых единиц.

Ассоциативная сеть

О программе

< путей (■

1

Стимул Оружие

Реакция арбалет

PL Поиск поиск завершен (31 сек,)

N

поменять

с.

| Предпросмотр | в Excel в Word

| Очистить лог |

[длина п... Путь I I

2 оружие —1—> стрельба — 1—> арбалет

3 оружие —2—> пистолет —2—> стрельба — 1—> арбалет

3 оружие —5—> ружье — 1—> стрельба — 1—> арбалет

3 оружие —1—> ствол — 1—> орудие — 1—> арбалет

4 оружие —5—> ружье — 1—> ствол — 1—> орудие — 1—> арбалет =

4 оружие —1 — > перо — 1 — > топор — 1 — > орудие —1 —> арбалет

4 оружие —1 — > армия — 1—> борьба — 1—> стрельба — 1 - -> арбалет

4 оружие —1 — > ствол — 1 —> война — 1—> стрельба — 1 — > арбалет

4 оружие —1—> стрельба —3—> война — 1—> стрельба - ■1—> арбалет

4 оружие —1 — > кровь —2—> война — 1 — > стрельба —1 — > арбалет

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4 оружие —1—> армия —12—> война — 1—> стрельба —1 - -> арбалет

4 оружие —1—> стрельба —4—> мишень —5—> стрельба —1—> арбалет

4 оружие —1—> кровь — 1—> операция — 1—> стрельба - ■1 —> арбалет

4 оружие —2—> пистолет —7—> оружие — 1—> стрельба —1—> арбалет

4 оружие —5—> ружье —2—> оружие — 1—> стрельба —1 —> арбалет

4 оружие —1—> ствол —4—> оружие — 1—> стрельба — 1- -> арбалет

л _1 —V лпим/ма —1 —V = _i -I

всего найдено путей: 26

Язык

| Русский л

Метод поиска

|Все пути л

Подключено к локальному серверу

Мах длина пути

[7--------------3

Min валентность связи

п---------------3

|Г1 Только пути с прямой и обратной связями

Рисунок 6. Главное окно программы «Ассоциативная сеть»

Заключение

Описанные в статье опыты и созданный для их проведения инструментарий следует рассматривать как первые приготовительные шаги для последующей реализации альтернативных вариантов моделирования осознавания в когнайзере, который в этом случае можно было бы рассматривать как систему принятия решений в условиях неопределенности. Функционирование этой системы состояло бы в преобразовании таких исходных данных, как ЯЕ или ЕЗМ в

форме пропозиции ВФС какой-либо ког-немы, в результирующие — сформированную (сгенерированную) ЕЗМ, или выбранную из некоторого множества конкретную ЯЕ, соответственно.

В основу архитектуры такой модели когнайзера может быть положена традиционная 2-3-х компонентная структура, включающая: Базу лингвистических данных (БЛД) и Лингвистический процессор (ЛП), состоящий из Интерфейса и Решателя.

Отметим особенности и требования, которые следует учесть при моделировании.

1. При моделировании безальтернативного осознавания использовались только частично база данных ассоциативного эксперимента и две компоненты когнем базы данных когнитивного эксперимента. При моделировании альтернативного осознавания должны быть найдены методы учета значений других компонент когнем — способа задания смысла, референтной области и функции; а также частотных (валентных) характеристик стимульно-реактивных пар.

2. Особого внимания заслуживают такие компоненты когнем как формула смысла и референтная область. В отличие от других компонент когнем, которые представлены простыми списками, они имеют более сложную структуру. Так формула смысла в большинстве случаев представлена предложениями различного типа, понимание которых возможно только в определенном виртуальном контексте, или как элемент некоторого гипертекста. Референтная область, представлена в когнеме наименованием одной или нескольких подобластей, отношения между которыми являются иерархическими или сетевыми, в общем случае относятся к типу «многие-ко-многим».

3. БЛД должна включать не только данные ассоциативного и когнитивного экспериментов, но и другие данные, позволяющие «сужать» и «расширять» множества альтернатив ЯЕ и ЕЗМ. К таким данным следует относить сведения о: правилах словообразования и морфемном членении слов, синонимах, антонимах, фразеологизмах, метафорических конструкциях, терминах и др. Эти сведения сосредоточены в различных лексикографических источниках. Такие требования кардинально изменяют представление о БЛД. В случае даже их частичного удовлетворения получается интегрированная лексикографическая (сло-варно-тезаурусная) система.

4. Лингвистический процессор модели когнайзера (его Решатель) реализует две укрупненные функции: поиск (отбор) аль-

тернативных ЕЗМ или ЯЕ и последующий выбор одной из них. Существует множество формальных интерпретаций этих функций в зависимости от цели и предмета поиска. Важнейшими характеристиками при этом являются критерии отбора и выбора альтернатив. Основные особенности реализации поискового ЛП когнайзера видятся: а) в его вариативности, т.е. использовании поликритериальных оценок альтернатив; б) в вероятностном (неточном) оценивании, как самих альтернатив, так и процесса поиска; в) в нечеткости (степени достоверности) критериев поиска и его результатов.

5. Интерфейс ЛП обеспечивает внутреннюю взаимосвязь компонент когнайзера и внешние взаимодействия. Основной особенностью внешних взаимодействий является ориентация на ученого-исследователя языкового сознания. Интерфейс когнайзера по своей форме является визуальным (графическим) образом модели языкового сознания, оснащенным своеобразным «пультом управления». Основными функциями управления процессом моделирования являются: манипулирование ЕЗМ и ЯЕ — создание, изменение, выбор и т.п.; пуск/ приостановка/остановка моделирования; создание и манипулирование БЛД; установка и изменения условий моделирования; визуализация процесса моделирования и его результатов; документирование результатов моделирования и др.

6. Особое значение приобретает нахождение априорных (предварительных и текущих) оценок вычислительной сложности алгоритмов поиска вариантов решений.

Литература:

Абрамов Н. Словарь русских синонимов и сходных по смыслу выражений. М.: Русские словари» 1994.

Александрова З.Е. Словарь синонимов русского языка. Около 9000 синонимических рядов / Под ред. Л.А.Чешко. М.: Советская энциклопедия, 1968.

Русский ассоциативный словарь В 2 т. / Ю.Н. Караулов, Г.А. Черкасова, Н.В.Уфимцева, Ю.А.Сорокин, Е.Ф.Тарасов. М., 2002.

Караулов Ю.Н. Языковое сознание: пассивный и активный режим работы // Межкультур-ная коммуникация и перевод. Материалы межвузовской научной конференции 31 января 2003 г. М.: МОСУ, 2003.

Караулов Ю.Н. Единицы языка и единицы знания // Теория и практика лингвистического анализа текстов СМИ в судебных экспертизах и информационных спорах. Материалы научно-практического семинара. Часть 2. М.: «Га-лерия», 2003.

Караулов Ю.Н. О единицах знания // Полифония образования и англистика в мультикуль-турном мире. Тезисы первой междунар. конф. Ассоциации англоведов и преподавателей английского языка 25-26 ноября 2003 г. М.: МГЛУ, 2003.

Караулов Ю. Н. Основы лингвокультурного тезауруса русского языка // Русское слово в русском мире. Москва-Калуга, 2004.

Караулов Ю.Н. Концептография языковой картины мира. Статья 1: Первый этап «восхождения» к образу мира: от элементарных фигур знания к предметно-референтным областям культуры // Scripta linguisticae applicatae. Проблемы прикладной лингвисти.ки. Вып. 2. Сб. ст. М.: «Азбуковник». 2004. С. 7-17.

Караулов Ю.Н. Концептография языковой картины мира. Статья 2: Референтные области, концепты и концептосферы. (Второй этап «вос-

хождения» — от областей к концептам) // Языковое сознание: теоретические и прикладные аспекты. Сб. ст. М., 2004, С. 69-82

Панченко А. В. Инструментальное средство для аналица ассоциативных сеттей // Интеллектуальные технологии и системы. Сборник учебно-методических работ и статей аспирантов и студентов. Вып. 9. М., 2007.

Сиренко А.В. База данных лингвокультурного тезауруса русского языка // Интеллектуальные технологии и системы. Сборник учебнометодических работ и статей аспирантов и студентов. Вып. 8. М., 2006.

Сиренко А.В. Лингвокультурный тезаурус русского языка // Дипломный проект. Рук. Ю.Н.Филиппович. МГТУ им. Н.Э.Баумана. М,

2007.

Филиппович Ю.Н. Семиотическая концепция интеграции информационных технологий // Scripta linguisticae applicatae. Проблемы прикладной лингвистики -2001. Сб. ст. / Отв. ред. А.И.Новиков. М.: Азбуковник. 2001. С. 311-338.

Филиппович Ю.Н. Эскиз информационной технологии лингвокультурного тезауруса // Язык. Сознание. Культура. Сборник статей. М.-Калуга:, 2005. С. 319-334.

Черкасова Г.А. Опыт использования информационной технологии «Ассоциативный эксперимент» // Язык. Сознание. Культура. М.-Калуга, 2005. С.308-318.

А.Ю. Филиппович АСНИ АССОЦИАТИВНЫХ ЭКСПЕРИМЕНТОВ

Вербальные ассоциации, ассоциативный эксперимент, моделирование, веб-технологии, электронные версии словарей

Статья посвящена Автоматизированной системе научных исследований ассоциативных экспериментов. В ней рассматрены электронные версиям ассоциативных словарей, подсистема анализа ассоциативно-вербальной сети, система проведения интерактивного ассоциативного эксперимента и методика фильтрации «шумов» в электронных ассоциативных экспериментах.

Ассоциативный эксперимент (АЭ) является одним из самых распространенных методов психолингвистики для оценки особенностей восприятия человека и изучения его языкового сознания. Своей популярностью он обязан относительной простоте организации небольшого эксперимента и оценки полученных результатов. Однако для проведения массовых экспериментов и

глубокого анализа ассоциативных полей требуются специальные инструменты подготовки исходных и обработки результирующих данных, среди которых наибольшее применение нашли такие средства автоматизации, как программы для генерации анкет, лингвистические редакторы, базы данных, пакеты статистического анализа и др.

i Надоели баннеры? Вы всегда можете отключить рекламу.