Научная статья на тему 'Первичная идентификация в технологии информационного поиска'

Первичная идентификация в технологии информационного поиска Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
247
153
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
INFORMATIONAL SEARCH / EFFICIENCY OF INFORMATIONAL SEARCH / TRIUNE ESSENCE / INITIAL IDENTIFICATION / A LOCATION IN STRUCTURE OF KNOWLEDGE / NAMES OF CONCEPTS / DICTIONARIES OF SIMPLE AND COMPOUND NAMES / CONSTRUCTION OF STATEMENT / JUDGMENT (ASSOCIATION WITH ESSENCE OF THE REAL WORLD)

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Болотова Л.С., Данчул А.Н., Новиков А.П., Сурхаев М.А., Никишина А.А.

В статье рассмотрена одна из процедур механизма общения субъекта, которая названа первичной идентификацией. При полновесной реализации этой процедуры в программной системе, организующей информационный поиск, можно ожидать высоких показателей эффективности поиска. Однако полновесная реализация первичной идентификации возможна только с применением модели области реального мира, приближенной к модели, названной «гносеологической моделью».Ключевые слова: информационный поиск, эффективность информационного поиска, триединая сущность, первичная идентификация, локация по структуре знаний, имена понятий, словари простых и составных имен, конструкция высказывания, осмысление (ассоциирование с сущностью реального мира).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Болотова Л.С., Данчул А.Н., Новиков А.П., Сурхаев М.А., Никишина А.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Initial identification in technology of informational search

This article is devoted to a problem of creation of the program systems (PS) organizing the information search (IS), and providing high rates of efficiency for the mass user (not the expert in the field of informational technologies). Researches weren’t limited by the review of achievements in practice of creation PS_IS, and also in the corresponding scientific and engineering disciplines. The subject of researches is the process of achievement of mutual understanding in communication between two subjects. Such researches completely correspond to the character of researches in the scientific direction of artificial intellect. It points out the essence which allocates from the process of communication between subjects, and it is explained the concept corresponding to it and it is offered to call «initial identification». Consideration of process of initial identification allowed to reveal the main contradiction in a problem of creation PS_IS. In the process of communication (and respectively in IS) the subject operates with all known set of concepts and uses thus as gained recognition (simple or compound) names of concepts, and the names formed directly in the course of communication. However in a natural language only 83.000 concepts are called by simple unique names (in a word). Compound names called incomparably more concepts, they make only insignificant part of concepts with which the subject operates in communication. Thus, the dominating part of algorithms of II is connected with application of quickly named concepts. It is shown that process of an operational name is feasible only with use of the model of knowledge approached to gnoseological model. And it is also specified that after some time in computer systems emergence of such models of knowledge is possible.For the new technology of IS the organization of access of each concrete tag of a concrete concept to its names in base of names is offered. That makes a basis of the organization of base of simple and compound names. Also other characteristics of the organization of the dictionary at triune essence are provided.Such concept as»construction of sentence» is offered for a broad use in scientific practice interpretation of which corresponds to interpretation of the concept «sense of the sentence» with explanations, which allow to draw sense from sequence of alphanumeric symbols. A great place in this work takes consideration of algorithms of formation and recognition of sentences (that is II). Many situations of II suspension are revealed and described. It is noted that completeness of such situations, and also algorithms of permission of the concrete situations and scenarios of interactive interaction providing finishing II up to the end make the essence of works on formation of the specification on design of PS realizing new technology of IS.In conclusion it is pointed out that the declared subject due to its scale can’t be opened in one article in details (scrupulously) to conform to requirements to the specification on creation of II. It is important that the complete picture of new technology of IS is given in article and feasibility of such technology is shown.

Текст научной работы на тему «Первичная идентификация в технологии информационного поиска»

Памяти Л. С. Болотовой

Болотова Людмила Сергеевна

28 ноября 2015 года не стало выдающегося ученого и одного из самых активных авторов нашего журнала Людмилы Сергеевны Болотовой. Редакция посвящает ее памяти этот материал, предваряющий последнюю публикацию, которую она успела подготовить для нашего журнала.

Л. С. Болотова (ранее Загадская) — профессор, доктор технических наук, профессор кафедры «Вычислительная техника» Московского государственного технического университета радиотехники, электроники и автоматики (МИРЭА) и кафедры «Информационно-коммуникационные технологии» Московского института электроники и математики (МИЭМ) НИУ «Высшая школа экономики» (ВШЭ).

Людмила Сергеевна родилась 9 июля 1938 г. в Москве. В период Великой Отечественной войны была эвакуирована с матерью на Урал. Окончила в 1962 г. Уральский государственный университет им. Горького, механико-математический факультет, в 1970 г. аспирантуру Одесского политехнического института им. Ломоносова. В 1971 г. — в Московском инженерно-физическом институте защитила кандидатскую диссертацию на тему «Ситуационное управление и искусственный интеллект», кандидат технических наук. В 1983 г. — в Военно-инженерной академии им. Жуковского, защитила докторскую диссертацию на тему «Методология и технология принятия решений», доктор технических наук; с 1989 г. — профессор.

Работала: 1962-1965 — Уралмашзавод, программист; 1965-1970 — Одесский технологический институт им. Ломоносова, ассистент кафедры высшей математики; 1971-1974 — Одесский институт инженеров морскогор флота, доцент; 1974-1985 — отделение института экономики АН СССР, г. Одесса, зав. отделом ситуационного управления большими системами; с 1985 — МИРЭА, профессор. С 2008 г. — параллельно с основной работой в МИРЭА — профессор кафедры «Информационно-коммуникационные технологии» Московского института электроники и математики.

Людмила Сергеевна Загадская (в последующем Болотова) была в числе основателей школы ситуационного управления, она первая разработала инструментальную экспертную систему-оболочку, и в 1970-1974 гг. ее идеи были реализованы. Под ее руководством были созданы впервые в стране методология и методы систем ситуационного управления на семантических сетях. На этой основе вначале под ее руководством была прове-

дена работа по оптимизации транспортной системы г. Одесса, управления транспортной системой Черноморского бассейна, была создана и внедрена система диспетчерского управления Одесским морским портом.

В последующем на этой основе под ее руководством и с ее непосредственным участием был создан ряд систем ситуационного управления, первые инструменты автоматических систем принятия решений (СПР) в больших системах, математические и программные средства больших систем на базе новейших ЭВМ СССР для управления операциями отдельных видов Вооруженных Сил Минобороны, диагностики систем космических аппаратов, планирования сеансов связи и управления в НАКУ и в спутниковых информационно-телекоммуникационных системах СССР, диагностики и диспетчерского управления нефтегазопроводами и авиаремонтом СССР (1974-1985) и др. В 1985-2015 гг. Л. С. Болотова основала научную школу по искусственному интеллекту (интеллектуальные системы поддержки принятия решений) в МИРЭА, подготовила около 10 кандидатов технических наук, ввела новый курс «Информационная культура личности» и читала его наряду со стандартными курсами по искусственному интеллекту.

Л. С. Болотова — автор более 300 научных и учебно-методических работ. Она постоянно вела большую научно-общественную работу, а также увлекалась живописью, поэзией, сама сочиняла замечательные стихи. Помимо служения науке Л. С. Болотова всегда занимала активную гражданскую позицию.

Материал подготовили Виолетта Волкова и Эдуард Болотов

ПРИКЛАДНАЯ ИНФОРМАТИКА / JOURNAL OF APPLIED INFORMATICS

_ /Том 10. № 6 (60). 2015 /

Л. С. Болотова, докт. техн. наук, профессор Московского государственного технического университета радиотехники, электроники и автоматики, lubolotova@mail.ru А. Н. Данчул, докт. техн. наук, профессор, МГУУ Правительства Москвы, adan5l@yandex.ru А. П. Новиков, канд. техн. наук, Департамент образования, г. Москва, alpnovikov@yandex.ru М. А. Сурхаев, докт. пед. наук, профессор, Дагестанский государственный педагогический университет,

г. Махачкала, surhaev@mail.ru А. А. Никишина, ООО «Эльстер Метроника», г. Москва, anikishina@gmail.com

Первичная идентификация в технологии информационного поиска

Окончание. Начало в №4 (58) 2015 г.

В статье рассмотрена одна из процедур механизма общения субъекта, которая названа первичной идентификацией. При полновесной реализации этой процедуры в программной системе, организующей информационный поиск, можно ожидать высоких показателей эффективности поиска. Однако полновесная реализация первичной идентификации возможна только с применением модели области реального мира, приближенной к модели, названной «гносеологической моделью».

Ключевые слова: информационный поиск, эффективность информационного поиска, триединая сущность, первичная идентификация, локация по структуре знаний, имена понятий, словари простых и составных имен, конструкция высказывания, осмысление (ассоциирование с сущностью реального мира).

Часть 2

Формирование инициатором темы предложения, соответствующего простейшему факту

Правила построения предложений позволяют формировать и распознавать достаточно сложные конструкции (фрагменты знаний). Простейшей составляющей таких конструкций является простейший факт, который, как уже отмечалось, состоит из центрального в определении понятия (это понятие мы назвали «объект суждений») и одного из понятий его проявлений (мы назвали это понятие «предмет суждений»), связанных между собой. Готовность инициатора темы заявить или изменить тему общения подразумевает, что его механизм логического мышления находится на конкретной метке конкретного понятия своей гносеологической модели, которое является предметом суждений и ассоциируется с конкретным экземпляром сущ-

ности. В то же время конкретное понятие (конкретная метка объекта суждений) находится в конкретном месте гносеологической модели (соответствующем конкретной предметной области) и определено ближайшим окружением, в том числе меткой предмета суждений. Это возможно в том случае, если среди множества меток понятий, определяющих в этой предметной области понятие «объект суждений», метка понятия «предмет суждений» существует. Можно также сказать, что выбор темы — это выбор метки понятия «предмет суждений» в конкретной предметной области, т. е. в ближайшем окружении конкретной метки понятия, принятого объектом суждений. Первичным для субъекта является механизм логического мышления. Механизм формирования предложений и механизм ПИ для субъекта являются вторичными. Поэтому механизм формирования предложений содержит некоторые возможности, которыми обладает механизм логи-

ческого мышления. Это было отмечено еще Л. Н. Толстым: «Язык есть орудие мышления»; «Обращаться с языком кое-как — значит, и мыслить кое-как».

Так как в разных предметных областях гносеологической модели понятие имеет разные определения, а предмет суждений находится в рамках конкретного определения, ПИ должна идентифицировать метку понятия (а не понятие). Здесь отметим, что составные имена конкретного понятия могут идентифицироваться не во всех предметных областях. В конкретный момент времени субъект находится на конкретной стадии познания объекта и предмета суждений, а также на некоторой стадии совершенства гипотезы о путях достижения ПИ (взаимопонимания) с конкретным собеседником. Поэтому для выражения объекта (как и предмета) суждений может быть использована (априори не регламентированная, т. е. любая) часть любого определения понятия гносеологической модели субъекта (инициатора темы).

Рассмотрение процесса формирования инициатором темы предложения, соответствующего простейшему факту, позволяет выявить и зафиксировать несколько утверждений.

• Определившись с объектом и предметом суждений, инициатор темы формирует и сообщает собеседнику некоторое предложение (высказывание). Такое предложение — это последовательность двух имен понятий, каждое из которых может быть простым или составным. Декларируем также, что в сформированном предложении простое имя или часть составного имени не может находиться внутри другого составного имени. Опровержение такой декларации не удается найти в литературной практике.

• Имена объекта и предмета суждений могут существовать как простые, как составные или не существовать. Поэтому инициатор темы проверяет, есть ли в его базе имен для объекта и предмета суждений устоявшиеся в практике общения имена (простые или составные). [ 130 ]

• Для формирования предложения инициатор темы обращается в свою базу имен и читает имена объекта и предмета суждений. Каждое понятие может именоваться еще и именем антонимического характера. Другими словами, в практике формирования предложений по различным мотивам для именования понятия может использоваться имя антонимического характера с отрицанием.

Например, в предложении «Необходимо излагать ясно» имя понятия «ясно» может быть заменено на имя «не витиевато» или имя «не туманно». Применяемые для именования конкретного понятия имена антонимического характера, как правило, без отрицания применяются для именования разных понятий. Таким образом, объект суждений и предмет суждений (как метки понятий гносеологической модели) могут иметь указатели еще и на имена антонимического оттенка.

• Метки одного понятия могут быть не одинаково именованы, поэтому необходима адекватность1 седьмого типа. Адекватность седьмого типа — это двунаправленная связь в цепном списке между метками обособленно каждого конкретного понятия, которые могут быть именованы разными именами. Метки конкретного понятия своим множеством (множеством своих определений) составляют полный образ понятия, ассоциируемого с конкретным экземпляром сущности. Однако они адекватны не в полной мере. В разных предметных областях понятие определено по-разному и даже может быть не одинаково именовано, а это значит, что метки должны находиться в разных списках адекватности пятого типа. Поэтому для фиксации единства меток понятия, ассоциируемых с одним и тем же экземпляром сущности, необходимо ввести адекватность седьмого типа. Здесь отметим, что изучение типовых связей (типовых адекватностей) и внесение их в организацию баз знаний (для фиксации

1 Толкование понятия «адекватность» и дефиниции адекватностей для связей пяти типов см. в [2-5].

Рис. 5. Множество ситуаций, с которыми может столкнуться инициатор темы при выборе имени

для объекта или предмета суждений Fig. 5. A set of situations with which the initiator of a subject can face in the process of choosing name

for an object or a subject of judgments

в явном виде) является актуальным и фундаментальным в решении задачи представления знаний.

Обобщая выявленные и зафиксированные утверждения, можно получить множество ситуаций, с которыми сталкивается инициатор темы при выборе имени объекта или предмета суждений (рис. 5).

При формировании предложения все имена конкретного понятия признаются синонимами (в равной степени рекомендуемыми к применению). А так как применение в предложении имен антонимического характера должно сопровождаться еще и отрицанием, то такие имена должны объединяться в обособленное множество (обособленный список), оставаясь в рамках полного множества синонимов конкретного понятия. Отметим также, что инициатор темы при формировании предложения для выбора имени конкретного понятия использует два двунаправленных цепных списка синонимии. При этом он выбирает имя, применение которого (предположительно) позволит собеседнику наиболее легко выполнить ПИ. Вопросы выбора синонимов для именования понятия в статье не рассматриваются.

Таким образом, инициатор темы при формировании предложения, а конкретно при выборе имени для каждой конкретной метки конкретного понятия, использует базу имен

через персонифицированную структуру каждого конкретного понятия (рис. 6). Указатель на имя конкретного понятия, приписанный к конкретной метке, также содержится в двунаправленном цепном списке указателей имен (синонимов), и только на него (из всего списка указателей на имена) установлен указатель от конкретной метки конкретного понятия. В то же время обратный указатель от этого указателя на имя установлен только на одну из так именованных меток понятия.

Напомним, что одинаково именованные метки понятий объединены в цепной список с двунаправленной связью, что фиксирует адекватность пятого типа. В рамках настоящей статьи существование в триединой сущ-ности2 такой базы имен и так организованного доступа к именам базы авторы статьи оставляют в статусе гипотезы. Тем не менее далее по тексту эта гипотеза принимается базисом.

Прежде чем приступить к рассмотрению процесса формирования предложения инициатором темы остановимся на механизме именования понятий. Как уже отмечалось, в естественном языке множество (83 000) понятий именовано простыми уникальными именами (одним словом). Составными именами именовано несравнимо больше понятий, одна-

2 Толкование понятия «триединая сущность» с некоторой степенью подробности приводится в [8; 11].

Рис. 6. Связи каждой конкретной метки конкретного понятия с его именами в базе имен Fig. 6. Communications of each concrete tag of a concrete concept with its names in base of names

ко и они составляют только незначительную часть понятий гносеологической модели.

Потребность в именовании понятий (словами) возникла с ростом потребности в практически целесообразном общении. На этапах зарождения механизма общения именование того или иного понятия выполнялось простым уникальным именем (одним словом) и ассоциированием его с конкретным экземпляром сущности реального мира. Это могло происходить, когда субъект указывал на экземпляр сущности реального мира и предлагал другому субъекту имя этого экземпляра сущности. При множественном повторении таких действий был сформирован относительно устойчивый словарь, применявшийся в общении группы людей для именования устойчивых в общении понятий. Словарь в дальнейшем подвергался непрерывной интенсивной актуализации уже с применением несколько другого (трехэтапного) механизма именования понятий. И гипотеза описания этого механизма может быть следующей. Каждое понятие априори не имеет ни составного, ни простого имени. Другими словами, инициатор темы или же собеседник, а возможно, и оба субъекта, может не иметь ни простого, ни составного имени для именования конкретного понятия. А механизм именования того или [ 132 ]

иного понятия инициируется в соответствии с устойчивостью применения конкретного понятия в практике общения.

Неизвестное измеримо только через известное. Поэтому непосредственно в процессе общения неименованное понятие именуется некоторой конструкцией (составным именем), извлекаемой из определений понятия в гносеологической модели и отражающей отличие этого понятия от других, уже именованных. И этот процесс может быть назван первым этапом именования понятия (оперативным именованием). Конструкция составного имени может иметь сетевую структуру. При формировании составного имени в основу ложатся простейшие факты из множества определений этого конкретного понятия и из ближайшего окружения этих определений. Сложность конструкции составного имени априори не имеет ограничений в той же мере, как и допустимая сложность конструкции (факта) при формировании предложения. Допустимо при оперативном именовании (с последующим переходом на второй этап именования понятия) формировать имя понятия, не основываясь на простейших фактах из множества определений этого конкретного понятия и из ближайшего окружения этих определений. Такое именование применяет-

ся для малоизученных понятий (для которых в гносеологической модели существует небольшое количество определений).

Составное имя понятия, получаемое при оперативном именовании, всегда авторизовано и может характеризоваться:

• наличием необходимого и достаточного количества отличительных признаков для признания понятия с таким именем уникальным среди ранее именованных понятий;

• отсутствием признака отличия от какого-либо ранее именованного понятия (устойчиво востребованного в общении);

• наличием избыточного количества отличительных признаков, не полностью востребованного при сравнении оперативно именуемого понятия с ранее именованными понятиями;

• наличием признаков, которые не характерны для оперативно именуемого понятия.

Повышение устойчивости в практике общения оперативно именованного понятия ведет к формированию общепризнанного составного имени. Естественно предположить, что для сохранения результатов деятельности субъекта по именованию понятия в процессе повышения устойчивости понятия в общении существует возможность фиксации вновь сформированного составного имени понятия. Можно также признать, что для этой цели существует база составных имен. Другими словами, интенсивное применение в практике общения некоторого понятия под именем, которое априори было сформировано оперативным именованием, переводит имя в статус составного имени понятия (с фиксацией этого имени в базе имен и соответствующего указателя от имени на конкретную метку конкретного понятия), что соответствует второму этапу именования понятия. Здесь отметим, что имена в базе составных имен сохраняются как последовательности алфавитно-цифровых символов. Хранение составных имен с сохранением всех элементов конструкций, соответствующих этим именам, у субъекта отсутствует. Для доказательства рассмотрим два имени: «белый мед-

ведь» и «медведь белый». Двум именам соответствует одна и та же конструкция, однако в общении используется только устоявшееся составное имя «белый медведь».

Длительное интенсивное применение в практике общения понятия, именованного составным именем, подвергается регулярным попыткам уменьшить длину имени и повысить простоту ПИ понятия с этим именем. В результате может быть сформировано новое составное, а иногда и простое, имя. Это приводит к тому, что в базе имен фиксируется новое имя и указатель от этого имени на конкретную метку конкретного понятия. Ранее использованное имя остается в базе имен среди синонимов (указатель от этого имени направлен на все ту же метку конкретного понятия). Указатель же от метки понятия перенаправляется на новое имя. Все это соответствует третьему этапу именования понятия. Отметим также, что именование простым уникальным именем чаще применяется для именования понятий с повышенным уровнем абстракции, к примеру «животное». Именование понятия простым именем часто сопровождается отказом от конкретной предметной области. То есть новое имя понятия содержит указатель на конкретную метку, соответствующую конкретной предметной области, однако при идентификации понятия по этому имени указатель воспринимается как указатель на множество меток конкретного понятия (объединенных двунаправленными связями в список адекватных 5-го типа).

Сгруппируем приведенные в параграфе утверждения.

• Установлено, что перед формированием предложения механизм логического мышления инициатора темы находится на конкретной метке конкретного понятия своей гносеологической модели, которое является предметом суждений и ассоциируется с конкретным экземпляром сущности.

• Инициатору темы необходимо подобрать имя объекта и имя предмета суждений,

каждое из которых может быть простым или составным, а затем последовательно разместить их в новом предложении.

• Используя базу имен и организацию доступа к именам базы, приведенную на рис. 6, инициатор темы для объекта и предмета суждений подбирает существующие синонимы или синонимы антонимического характера или же формирует оперативные имена понятий.

• Кратко поясним ситуацию, когда необходимо сформировать оперативное имя объекта или предмета суждений, т. е. ситуацию, когда имя понятия не найдено в базе составных и простых имен.

• Инициатор темы, сделав один или несколько шагов локации по гносеологической модели, может найти несколько уже именованных понятий. В этом случае для именования нового понятия составным именем может оказаться достаточным использовать имена найденных понятий и связи между этими понятиями, существующие в гносеологической модели.

• Оперативное именование достижимо, если к имени уже именованного понятия можно добавить отличительный признак (ранее не отмечавшееся проявление), по которому будет идентифицироваться новое понятие.

• Столь же достижимо оперативное именование, если у имени уже именованного понятия один отличительный признак (ранее отмеченное проявление) можно изменить или удалить.

• Возможен случай, когда ранее отмеченное проявление (уже именованного понятия) необходимо уточнить, и это позволит сформировать имя оперативно именуемого понятия. В таком случае поведение инициатора темы в текущей беседе будет неоднозначным, однако однозначным будет разрешение возникшей ситуации. Необходимо инициировать актуализацию имени уже именованного понятия.

• При оперативном именовании могут использоваться уже именованные понятия из текущего определения объекта суждений и из ближайшего окружения этого определения. А также и из любого другого определе-

ния понятия, принятого объектом суждений, и соответственно ближайшего окружения этих определений.

• Если инициатор темы сделал много шагов локации по гносеологической модели, прежде чем нашел первое среди уже именованных понятий, то для оперативного именования понятия составным именем может использоваться и используется ассоциирование понятия с экземпляром сущности в реальном мире с последующим размещением понятия, соответствующего экземпляру сущности, в однородно ориентированной модели. Традиционно однородно ориентированная модель для такого случая — это «общее — частное». Востребованность такого подхода при оперативном именовании нацеливает субъекта на формирование универсального классификатора именованных понятий. Хотя поиск универсальной классификации понятий сродни поиску философского камня алхимиками, работы в этом направлении имеют неоценимую значимость в систематизации знаний субъекта и общества. В рамках такой однородно ориентированной модели, используя имена уже именованных понятий, всегда можно сформировать составное имя нового понятия. Отметим также, что утверждение о наличии у каждого субъекта устоявшегося классификатора именованных понятий оставлено в статусе гипотезы.

• Понятия, ассоциируемые с очень похожими экземплярами сущностей, должны быть по-разному именованы. Если при оперативном именовании объекта или предмета суждений установлено, что именовано малоотличимое понятие, тогда инициатор темы может использовать без изменения имя малоотличимого понятия. При этом содержащийся в предложении факт будет несколько изменен, однако продолжит соответствовать целям проводимой инициатором темы беседы.

• Доминируют в общении составные имена простых конструкций, которые сформированы по типовым правилам. Идентификация таких имен выполняется также по типовым

правилам. Поэтому составные имена типовых конструкций не только легко идентифицируются, но и признаются удачными.

• Правила формирования и распознавания составных имен подвергаются непрерывной типизации. Такие типовые правила могут быть выявлены и сформулированы. Мы же только отметим, что при размещении простого имени в составном имени применяются правила грамматики, что позволяет учитывать направление определимости, соответствующее конструкции составного имени.

Конечно же, алгоритмы формирования и соответственно распознавания составных имен при оперативном именовании, а также получившая распространение в практике общения типизация этих алгоритмов нуждаются в более скрупулезных исследованиях. Однако отсутствие скрупулезности в исследованиях по этому вопросу и по некоторым другим вопросам, только упомянутым в статье, станет недопустимым уже при создании новой технологии информационного поиска. В рамках же настоящей статьи важно показать целостную картину новой технологии информационного поиска и реализуемость такой технологии. Поддержка такого отношения к исследованиям отдельных вопросов по теме просматривается в цитатах.

о «Э. Шредингер в своей работе ''Разум и материя'' высказал мысль о том, что даже контурное обсуждение сложных проблем, привлекая внимание многих исследователей, способствует ускорению познания законов природы» [12, с. 6].

о «Даже несовершенная попытка инициировать разработку нового формализма ... не является бессмысленной» [12, с. 43].

ПИ простейшего факта, содержащегося в предложении

В рамках этого параграфа рассмотрим распознавание простейшего факта, т. е. алгоритмы ПИ. Конечно же, алгоритмы ПИ должны быть настраиваемы на общение с каждым

конкретным человеком (пользователем ПС). Другими словами, в алгоритмы ПИ должна быть заложена непрерывная адаптация на меняющуюся терминологию субъекта и многовариантность определений каждого конкретного понятия, используемых субъектом в зависимости от обстоятельств, предшествующих моменту начала общения субъекта с ПС. Таким образом, динамизм ПС_ПИ в том, что каждый пользователь (потенциальный инициатор темы) может иметь свои варианты определений конкретного понятия в гносеологической модели. Алгоритмы же ПИ могут и должны оставаться неизменными при смене пользователя ПС.

ПИ предложения начинается с идентификации слов, для реализации которой традиционно применяется словарь. Так как словарем именуется многогранно толкуемое понятие, зафиксируем некоторые характеристики этого понятия, однозначность которых может соответствовать организации словаря у триединой сущности.

• Учитывая быстродействие современных компьютеров, время на сканирование даже всех слов словаря не способно превысить порог восприятия глазом человека на шаге интерактивного взаимодействия компьютера с человеком. Мы, однако, будем ориентироваться на то, что в общении между субъектами не применяется процедура сканирования словаря (как бы он не был организован).

• Слова в словаре присутствуют в одном экземпляре. А конкретное слово, как цепочка из звеньев, составлено из букв.

• Идентификация слова в словаре выполняется по структуре дерево, каждый узел которой соотносится с буквой, а слова являются результатом последовательного объединения букв при пошаговой локации по этой структуре. Идентификация слова в словаре происходит в момент распознавания последней буквы слова. Вспомним также, что слово может быть составлено из приставки, корня, суффикса и окончания. Корень слова достаточно уникален и может быть соотнесен только с именем конкретного понятия. Остальные части

слова отражают смысловые оттенки, способ-

ствующие выявлению факта, содержащегося в предложении. Древовидная организация идентификации слова позволяет не потерять эти смысловые оттенки, хотя и требует больших объемов памяти для своей реализации.

• От узлов идентификации слов в словаре установлены указатели на простые имена в базе имен.

Конкретное слово является простым именем конкретного понятия и может быть составной частью множества составных имен разных понятий. Указатели на все имена из базы имен, в которых присутствует конкретное слово, должны составлять двунаправленный цепной список, относимый к этому конкретному слову. Указатель в словаре от точки идентификации конкретного слова должен быть направлен на указатель в списке, предусматривающий выход на простое имя понятия. Указатели на составные имена понятий в двунаправленном цепном списке следуют за указателем на простое имя в некотором порядке. Этот порядок формируется в зависимости от частоты применения в общении конкретных составных имен. Возглавляет список составное имя, которое чаще других используется в общении. Организация переходов от точки идентификации слова в словаре к соответствующим именам базы имен приведена на рис. 7.

Для любого предложения первая операция ПИ — это выбор слова для начала идентификации. Начнем идентификацию с первого слова и продолжим в последовательности, содержащейся в предложении. Собственно такой подход соответствует ожиданиям инициатора темы. В отличие от составителя кроссвордов, инициатор темы при формировании предложения стремился обеспечить простоту достижения взаимопонимания (достижения ПИ). И все-таки важно признать, что с первого же слова предложения, используя грамматику, собеседник выполняет выделение в предложении имен объекта и предмета суждений, а также формирует конструкцию составных имен этих понятий. Что, конечно же, способствует

оптимальному выбору слова предложения для [ 136 ]

начала идентификации факта, содержащегося в предложении. Другими словами, с применением грамматики из предложения еще до начала идентификации могут быть выявлены:

a) из последовательности символов и распознаны слова предложения;

b) принадлежность каждого слова к именам объекта или предмета суждений;

c) конструкции составных имен, относимые к объекту и предмету суждений;

d) порядок идентификации слов (последовательность слов в предложении), предложенный инициатором темы, как способствующий упрощению идентификации факта из предложения.

В рамках настоящей статьи алгоритмы пункта (с) не рассматриваются. И следовательно, полученные алгоритмы ПИ своим несовершенством будут отличаться от алгоритмов, применяемых субъектом в практике общения.

В рассматриваемом нами случае идентифицировать необходимо последовательность двух имен. Нам известно, что первое слово предложения относится к одному имени, а последнее слово предложения относится ко второму имени. Согласно пункту (Ь) необходимо выяснить, какие из оставшихся слов предложения относятся к первому имени, а какие ко второму. Другими словами, для успешной идентификации необходимо знать, после какого слова в предложении заканчивается первое имя. Ответ на этот вопрос может быть получен как до начала идентификации первого имени, так и до завершения этой идентификации. В предложении присутствуют имена понятий, относящиеся к разным частям речи, поэтому для соотнесения слов предложения к первому или второму имени можно и нужно использовать условности грамматики. Остановимся на идентификации имени, размещенного первым в предложении.

После идентификации в словаре слов (составляющих конкретное имя понятия) получен выход на один или несколько узлов идентификации слов. Указатель от узла идентификации одного из слов можно использовать для пе-

Гносеологическая модель

Механизм Механизм

оперативного выбора имен из

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

именования базы имен

Механизм формирования последовательности слов в предложении

Двунаправленный цепной список указателей на имена (синонимы) для конкретного понятия

Двунаправленный цепной список указателей на имена (синонимы) антонимического характера для конкретного понятия

База имен

Имя ... Имя

Имя

Имя ... Имя

Имя

Список указателей на имена базы имен, в которых содержится конкретное слово

• • •

Словарь с указателями

от узлов идентификации слов

Рис. 7. Организация доступа к именам базы имен при формировании предложения инициатором темы

и связи для первичной идентификации такого предложения Fig. 7. The organization of access to names of base of names in the process of forming the offer by the initiator of a subject, and communication for initial identification of such offer

рехода к «списку указателей на имена базы имен, в которых содержится конкретное слово». Последовательный просмотр этих имен позволяет установить наличие в базе имен составного имени, которое составлено из тех же слов, что и идентифицируемое имя. Отметим, что мы необоснованно отказались рассматривать случаи, когда из одного и того же набора слов могут быть составлены имена разных понятий (в зависимости от реализуемой для того или иного имени конструкции). Вернуться к исследованию этого вопроса целесообразно на этапе отладки ПС с новой технологией информационного поиска, когда существенно повысится актуальность решения этого вопроса. От составного имени в базе имен предусмотрен выход на конкретную метку конкретного понятия в гносеологической модели.

Возможен случай, когда идентификация второго имени в предложении с такой же легкостью позволит выйти на метку, находящуюся в том же определении конкретного понятия гносеологической модели. Это и соответствует однозначной идентификации простейшего факта предложения. Однако если ориентироваться только на такой случай при создании ПС, то не стоит рассчитывать, что компьютер сможет уверенно выполнять ПИ в интерактивном взаимодействии с массовым пользователем. Остановимся на этом. Собственно, еще до начала распознавания предложения (начала ПИ) могут иметь место следующие ситуации.

• В предложении применено устоявшееся в общении слово. Составных имен, содержащих такое слово, слишком много. В практике общения субъект не выполняет сканирование столь длинных списков, и наличие у субъекта таких списков сомнительно. Возьмем, к примеру, имена понятий «проблема ПИ» и «проблема представления знаний». Эти понятия настолько удалены в гносеологической модели, что связи между ними с трудом могут быть выявлены специалистом. И конечно же, после идентификации метки понятия, именованного «проблема», в конкретном определении гносеологической модели, содержащем оператив-[ 138 ]

ное имя «проблема представления знаний», по связям адекватности 5-го типа понятия «проблема» нет возможности выйти на оперативно именуемое понятие «проблема ПИ».

• Гносеологическая модель инициатора темы содержит понятие-объект и понятие — предмет суждений, а в гносеологической модели ПС нет одного из этих понятий или даже двух.

• В гносеологической модели ПС предмет суждений отсутствует во всех определениях объекта суждений.

• В гносеологических моделях инициатора темы и ПС одним и тем же простым или составным именем именованы два близких понятия, отличительный признак которых отсутствует в имени. Идентификация понятия с таким именем будет выполнена успешно, а идентификация второго понятия из предложения может оказаться невыполнимой.

• В гносеологической модели инициатора темы понятие, принятое объектом или предметом суждений, именовано простым или составным именем, а в гносеологической модели ПС существует такое понятие, однако оно не именовано. В этой ситуации неизвестное имя понятия может быть либо распознано в гносеологической модели как оперативное имя, либо в гносеологической модели будет отсутствовать конструкция такого имени.

• Инициатором темы понятие, принятое объектом или предметом суждений, именовано оперативно. А в гносеологической модели ПС отсутствует конструкция такого составного имени.

В перечисленных случаях ПИ будет приостановлена для привлечения дополнительной информации из протокола предшествовавшей беседы, из сеанса интерактивного взаимодействия, нацеленного именно на получение дополнительной информации, или для инициации устоявшихся алгоритмов нестрогой идентификации.

о Под нестрогой идентификацией будем понимать выход на метку понятия, которое

по своим характеристикам близко идентифицируемому понятию.

Все субъекты в практике общения выполняют ПИ на подсознательном уровне, поэтому с большой долей уверенности можно констатировать, что перечисление случаев, в которых ПИ приостанавливается, а также выявление алгоритмов разрешения таких ситуаций в литературе не встречается.

Каждый из множества сценариев интерактивного взаимодействия, инициируемый после приостановки ПИ, должен быть нацелен на разрешение конкретной ситуации, собственно и инициирующей этот сценарий. Отметим также, что и начало всякой беседы между двумя субъектами инициировано одной или несколькими причинами, которые приводятся в перечне, и подобными им (до настоящего времени не выявленными и не внесенными в перечень). Такие сценарии интерактивного взаимодействия базируются на алгоритмах, обеспечивающих продолжение ПИ в те моменты, когда произошла приостановка. Поэтому сценарии являются неотъемлемой частью алгоритмов ПИ. Выявление полного множества ситуаций, при которых происходит приостановка ПИ, а также разработка алгоритмов разрешения конкретных ситуаций и сценариев интерактивного взаимодействия, обеспечивающих доведение ПИ до конца, и составляют сущность работ по формированию технического задания на проектирование ПС, реализующей новую технологию информационного поиска. Перечень требований к ПС, закладываемых в техническое задание, более широк и многообразен. К примеру, это могут быть следующие требования:

• в ПС должен присутствовать механизм оперативного контроля и выработки решения о допустимости и своевременности привлечения инициатора темы (конкретного пользователя в конкретный момент времени) как помощника в ПИ при ее приостановке;

• при завершении ПИ для подтверждения ее верности, а также при прерывании ПИ ПС должна выполнять следующие действия:

о сообщить человеку об объекте/предмете суждений дополнительные сведения, извлеченные из гносеологической модели и запросить подтверждение, что ПИ выполнена верно;

о если ПИ прервана, то можно обратиться к человеку с просьбой расширить сформированное составное имя понятия или конкретизировать те части составного имени, из-за которых была прервана ПИ;

и т. п.

Алгоритмы такого общения могут быть выявлены и внесены в ПС, невзирая на множество и многообразие ситуаций прерывания ПИ.

• В практике общения встречаются предложения, вырезанные из текста мало знакомой конкретному субъекту области знаний, предложения, в которых нет ни одного знакомого субъекту слова. ПС должна иметь сценарии интерактивного взаимодействия, позволяющие выяснить значение каждого слова предложения. И только затем выполнить ПИ.

• Применение каждым субъектом в практике общения тех или иных алгоритмов формирования высказываний и соответственно ПИ ранжировано. Доминируют в общении простые предложения, которые сформированы по типовым правилам. Поэтому простые предложения мы воспринимаем легко. В ПС необходимо предусмотреть реализацию типизации всех функций и данных, связанных с ПИ.

• Некоторые сведения о каждом конкретном пользователе ПС должны фиксироваться и использоваться алгоритмами ПИ для облегчения ПИ в каждом конкретном сеансе интерактивного взаимодействия. Однако исследования и этого вопроса целесообразно отложить до начала эксплуатации конкретной ПС, реализующей новую технологию информационного поиска.

Заключение

Для оценки результатов исследований, изложенных в статье, вспомним, что интеллектуальное поведение субъекта содержит методы, приемы и алгоритмы, правильность,

целесообразность и оптимальность которых выработана, зафиксирована и подтверждена длительной практикой субъекта, социальной группы людей и человечества в истории его развития. Если создание ПС не базировалось на моделировании интеллектуального поведения субъекта, то созданную в этом случае ПС можно признать не более чем имитирующей интеллектуальное поведение субъекта. Чтобы имитацию интеллектуального поведения, реализуемую ПС, приблизить к действительно интеллектуальному поведению субъекта, необходимо добиться, чтобы все части алгоритма этой ПС были проверены на их существование при рассмотрении «интеллектуального поведения субъекта». В ракурсе соответствия предложенных алгоритмов интеллектуальному поведению субъекта и будем оценивать результаты исследований, изложенных в статье.

В рамках одной статьи заявленная тема из-за своей масштабности не может быть раскрыта столь подробно (скрупулезно), чтобы соответствовать требованиям к техническому заданию на создание ПС. Такая цель и не ставилась. В статье некоторые сформулированные утверждения и сформированные алгоритмы не сопровождаются полновесными доказательствами их присутствия у триединой сущности. Более того, при оценке результатов исследований, изложенных в статье, авторы статьи предлагают ориентироваться на утверждение «Все, что нам удалось увидеть, заметить и выявить, — лишь слабое подобие того, что есть на самом деле». И все-таки...

Почему, собственно, так важно для задачи ПИ приблизить решение к тому, которое выработано длительной практикой субъекта, социальной группы людей и человечества в истории его развития? Можно было бы сослаться на то, что результат творческой деятельности обречен на успех, если основу творчества составляет моделирование существовавшего или существующего. А талант субъекта — это умение видеть предмет моделирования, находящийся у всех на виду

и не замечаемый другими. [ 140 ]

Среди таких предметов моделирования на первое место, конечно же, следует ставить субъекта, его интеллект и интеллектуальное поведение. Однако мы отметим, что самым существенным и неотъемлемым свойством алгоритмов ПИ субъекта является их изменчивость. ПИ не только использует опыт практики общения, но и всякий раз актуализируется. Конкретные алгоритмы ПИ, присутствуя в практике общения и являясь опытом общения, всегда содержат новизну, влияющую на базу имен и словарь. Именно изменчивостью алгоритмы ПИ субъекта принципиально отличаются от алгоритмов, реализуемых в современных системах информационного поиска, косность которых так существенно понижает эффективность информационного поиска массовым пользователем.

По ходу изложения материалов статьи прояснилось, что алгоритмы ПИ субъекта не отличаются простотой. Признавая, что всякое упрощение алгоритмов ПИ существенно понижает эффективность информационного поиска, мы все же соглашаемся с тем, что не все аспекты новой технологии информационного поиска могут быть реализованы уже завтра. А учитывая, что ошибки в оценке ситуации сегодняшнего дня ведут к еще большим сложностям ситуации в будущем, мы предлагаем рассматривать новую технологию информационного поиска ориентиром, к которому необходимо стремиться в работах сегодняшнего дня.

Из множества практических задач, в решении которых невозможно обойтись без ПС_ПИ, отметим только три.

• Контент-анализ, который формирует статистику применения слов в текстах публикаций и поэтому может давать ошибочные данные о частоте публикаций, в которых упоминается понятие, так как возможно, что применяемые в текстах имена понятия не учтены ПС, выполняющей контент-анализ. В особенности это относится к именам оперативного именования.

• Разработка ПС автоматического литературного перевода из одного национального

языка (или диалекта) на другой. В разных национальных языках один и тот же смысловой оттенок может быть отражен разными приемами (орфографическими, грамматическими правилами). Поэтому автоматический литературный перевод должен содержать распознавание смысловых оттенков высказывания (предложения) и их интерпретацию в другом национальном языке с сохранением конструкции высказывания.

• Разработка поисковой системы глобальной сети Интернет. Реализация решения проблем ПИ в рамках поисковой системы глобальной сети Интернет сегодня, бесспорно, является актуальной.

В рамках оценки теоретической значимости результатов исследований, изложенных в настоящей статье, отметим также, что добрая половина сегодняшних программ по лингвистическому анализу текстов имеет в своем основании соображения одного из отцов аналитической философии Людвига Витгенштейна. Его философское воззрение состоит в том, что все доступные нам законы мышления и реальности запечатаны в логике языка. Он утверждает, что никакой другой логики у мысли нет, и мышление целиком совпадает со структурами языка. Тем самым делается ложное утверждение о том, что упрощенное в логике языка отражение логики мышления субъекта первично. Сформулированное в настоящей статье утверждение о том, что семантика предложения содержится в его конструкции, позволяет продуктивно перестроиться и рассматривать логику мышления субъекта (натурфакт), которая не ограничена логикой языка (артефактом).

Подводя итоги, важно повторить, что создание ПС с алгоритмами ПИ возможно только при наличии в компьютерной системе модели знаний, приближенной к гносеологической модели. Кратко поясним это утверждение. Исполнение алгоритмов ПИ в подавляющем числе случаев ориентировано на неименованные понятия и соответственно на применение компьютерной модели области реального мира, приближенной к гносеологической моде-

ли. Конечно же, ни одна компьютерная модель знаний из существующих в настоящее время классов моделей не может содержать неименованных понятий. А для исполнения алгоритмов ПИ в компьютерной модели знаний неименованных понятий должно быть доминирующее количество.

В работе [4] показано, что одна из характеристик гносеологической модели, а именно «адресное представление имен в указателях», при реализации в компьютерной модели знаний позволяет иметь неименованные понятия. Каждая метка каждого понятия в памяти конкретного компьютера имеет логический адрес. При реализации «адресного представления имен в указателях» именно этот адрес может и должен содержаться во всех указателях на эту метку этого понятия. И только конкретному компьютеру известно такое имя. В интерактивном взаимодействии с человеком компьютер использует, естественно, языковое имя понятия, если такое уже назначено конкретной метке конкретного понятия.

В заключение отметим, что мы далеки от намерения предложить панацею. Более того, попытка дать аргументированную информацию, которая как-то ущемит экономические интересы крупных производителей программных систем, немедленно вызовет негативную реакцию, жесткость которой будет адекватна размерам потенциальных убытков. Нет, наша цель иная: мы рассчитываем инициировать сотрудничество по совместной разработке с крупными «игроками» в системе долгосрочных программ создания информационных технологий нового поколения.

Список литературы

1. Соловьев В. Д, Доброе Б. В, Иванов В. В., Лукашевич Н. В. Онтологии и тезаурусы. Учебное пособие. Казань; М., 2006.

2. Данчул А. Н., Новиков А. П. Представление знаний о предметной области на основе гносеологической модели // Информационные технологии. 2009. № 10. С. 44-50.

3. Данчул А. Н., Новиков А. П. Анализ проблемы представления знаний о предметной области //

Автоматизация в промышленности. Материалы 3-й Научной конференции в Институте проблем управления РАН. Июнь 2009 года. Москва. С. 92-112.

4. Новиков А. П. Организация сетевых структур знаний, поддерживающая их редактирование: дисс.... на соиск. уч. ст. канд. техн. наук по специальности 05.13.11. Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей. М.: МГТУ МИРЭА, 2012.

5. Болотова Л. С, Данчул А. Н, Новиков А. П., Никишина А. А. Организация многонаправленно-сти иерархического подъема (спуска) и локация по структуре неоднородных знаний // Прикладная информатика. 2014. № 1 (49). С. 107-113. № 2 (50). С. 18-31.

6. Абдикеев Н. М. Проектирование интеллектуальных систем в экономике. Учебник. М.: Экзамен, 2004.

7. Эндрю А. Искусственный интеллект / пер. с англ. В. Л. Стефанюка; под ред. Д. А. Поспелова. М.: МИР, 1985.

8. Болотова Л. С, Смольянинова В. А., Новиков А. П, Никишина А. А. Практическая значимость результатов исследований в научном направлении «Искусственный интеллект» // Прикладная информатика. 2013. № 4 (46). C. 114-128.

9. Харари Ф. Теория графов / под ред. Г. П. Гаврило-ва. М.: Мир, 1973.

10. Налимов В. В. Вероятностная модель языка. М.: Наука, 1974.

11. Болотова Л. С, Новиков А. П., Никишина А. А. Интеграция результатов исследований научного направления «Искусственный интеллект» // Прикладная информатика. 2013. № 5 (47). С. 125-136.

12. Пивоваров О. Н, Пивоваров И. О, Кудрина Л. И. Природа живых систем. М.: НИА-Природа, РЭ-ФИА, 2002. — 144 с.

References

1. Solov'ev V. D., Dobrov B. V., Ivanov V. V., Lukashev-ich N. V. Ontologii i tezaurusy: Uchebnoe posobie [Ontologies and thesauruses Manual: Tutorial]. Kazan', Moscow, 2006.

2. Danchul A. N., Novikov A. P. Predstavlenie znanii o predmetnoj oblasti na osnove gnoseologiches-koj modeli [Representation of knowledge of subject domain on the basis of gnoseological model]. Infor-macionnye tehnologii — Information Technologies, 2009, no. 10, рр. 44-50.

3. Danchul A. N., Novikov A. P. Analiz problemy pred-stavleniya znanii o predmetnoj oblast [The analysis of a problem of representation of knowledge of sub-

ject domain. Automation in the industry]. Materialy 3-j Nauchnoj konferencii «Avtomatizatsiya v pro-myshlennosti» v Institute problem upravleniya RAN. [Materials of the 3rd Scientific conference «Automation in the industry» at Institute of problems of management of the Russian Academy of Sciences]. Moscow, 2009, pp. 92-112.

4. Novikov A. P. Organizaciya setevykh struktur znanii, podderzhivayushchaya ikh redaktirovanie. Diss. Cand. Techn. Nauk [Organization of network structures of knowledge supporting their editing Diss. cand. tekhn. sci]. Moscow, MGTU MIREA Publ., 2012, p. 176.

5. Bolotova L. S., Danchul A. N., Novikov A. P., Ni-kishina A. A. Organizaciya mnogonapravlennosti ierarhicheskogo pod ema (spuska) i lokaciya po strukture neodnorodnykh znanii [Organization of a multiorientation of hierarchical rise (descent) and a location on structure of non-uniform knowledge]. Prikladnaya Informatika — Journal of Applied Informatics, 2014, no. 1 (49), pp. 107-113 and no. 2 (50), pp. 18-31.

6. Abdikeev N. M. Proektirovanie intellektual'nykh sistem v e'konomike: uchebnik. Rossiiskoi e'kono-micheskoi akademii im. G. V. Plehanova [Design of Intellectual Systems in Economy: tutorial of the Russian economic academy of G. V. Plekhanov]. Moscow, Ekzamen Publ., 2004.

7. Andrew A. Iskusstvennyi intellekt [Artificial intelligence]. Russ. ed.: E'ndryu A. Moscow, MIR Publ., 1985.

8. Bolotova L. S., Smol'yaninova V. A., Novikov A. P., Nikishina A. A. Prakticheskaya znachimost' rezul'tatov issledovanii v nauchnom napravlenii «Iskusstvennyi intellekt» [Prakticheskaya the importance of results of researches in the scientific direction «Artificial intelligence»]. Prikladnaya Informatika — Applied Informatics, 2013, no. 4 (46), pp. 114-128.

9. Harari F. Teoriyagrafov [The theory of counts]. Russ. ed. G. P. Gavrilova. Moscow, Mir Publ., 1973.

10. Nalimov V. V. Veroyatnostnaya model'yazyka [Probabilistic model of language]. Moscow, Nauka Publ., 1974.

11. Bolotova L. S., Novikov A. P., Nikishina A. A. Inte-graciya rezul'tatov issledovanii nauchnogo naprav-leniya «Iskusstvennyi intellekt» [Integration of results of researches of the scientific direction «Artificial intelligence»]. Prikladnaya Informatika — Journal of Applied Informatics, 2013, no. 5 (47), pp. 125-136.

12. Pivovarov O. N., Pivovarov I. O., Kudrina L. I. Priro-da zhivykh sistem. [Nature of livinge systems]. Moscow, NIA-Priroda, REFIA Publ., 2002, p. 144.

L. Bolotova, Moscow State Technical University of Radioengineering, Electronics and Automation, Moscow, Russia, iubobtova@maiLru, A. Danchul, Moscow City university of management of the Moscow Government. Chair of informational technologies in management, Moscow, Russia, adan5i@yandex.ru

A. Novikov, Department of Education of the city of Moscow, Russia, alpnovikov@yandex.ru M. Surkhaev, The Dagestan teacher training university, Makhachkala, Russia, surhaev@mail.ru A. Nikishina, Elster Metronica (Elster Group Company), Moscow, Russia, anikishina@gmail.com

Initial identification in technology of informational search

This article is devoted to a problem of creation of the program systems (PS) organizing the information search (IS), and providing high rates of efficiency for the mass user (not the expert in the field of informational technologies). Researches weren't limited by the review of achievements in practice of creation PS_IS, and also in the corresponding scientific and engineering disciplines. The subject of researches is the process of achievement of mutual understanding in communication between two subjects. Such researches completely correspond to the character of researches in the scientific direction of artificial intellect. It points out the essence which allocates from the process of communication between subjects, and it is explained the concept corresponding to it and it is offered to call «initial identification». Consideration of process of initial identification allowed to reveal the main contradiction in a problem of creation PS_IS. In the process of communication (and respectively in IS) the subject operates with all known set of concepts and uses thus as gained recognition (simple or compound) names of concepts, and the names formed directly in the course of communication. However in a natural language only 83.000 concepts are called by simple unique names (in a word). Compound names called incomparably more concepts, they make only insignificant part of concepts with which the subject operates in communication. Thus, the dominating part of algorithms of II is connected with application of quickly named concepts.

It is shown that process of an operational name is feasible only with use of the model of knowledge approached to gnoseological model. And it is also specified that after some time in computer systems emergence of such models of knowledge is possible.

For the new technology of IS the organization of access of each concrete tag of a concrete concept to its names in base of names is offered. That makes a basis of the organization of base of simple and compound names. Also other characteristics of the organization of the dictionary at triune essence are provided.

Such concept as»construction of sentence» is offered for a broad use in scientific practice interpretation of which corresponds to interpretation of the concept «sense of the sentence» with explanations, which allow to draw sense from sequence of alphanumeric symbols.

A great place in this work takes consideration of algorithms of formation and recognition of sentences (that is II). Many situations of II suspension are revealed and described. It is noted that completeness of such situations, and also algorithms of permission of the concrete situations and scenarios of interactive interaction providing finishing II up to the end make the essence of works on formation of the specification on design of PS realizing new technology of IS.

In conclusion it is pointed out that the declared subject due to its scale can't be opened in one article in details (scrupulously) to conform to requirements to the specification on creation of II. It is important that the complete picture of new technology of IS is given in article and feasibility of such technology is shown.

Keywords: informational search, efficiency of informational search, triune essence, initial identification, a location in structure of knowledge, names of concepts, dictionaries of simple and compound names, construction of statement, judgment (association with essence of the real world).

About authors: L. Bolotova, Dr of Technique, Professor; A. Danchul, Dr of Technique, Professor; A. Novikov, PhD in Technique; M. Surkhaev, Dr of Pedagogical Sciences, Professor; A. Nikishina, Senior Engineer

For citation: Bolotova L., Danchul A., Novikov A., Surkhaev М., Nikishina A. Initial identification in technology of informational search. Prikladnaya Informatika — Journal of Applied Informatics, 2015, vol. 10, no. 6 (60), pp. 129-143 (in Russian).

- [143 ]

Точка зрения Искусственный интеллект

i Надоели баннеры? Вы всегда можете отключить рекламу.